S

Sqft Phi 3 Mini 4k 50 Base Gptq

由 IntelLabs 开发
基于microsoft/Phi-3-mini-4k-instruct的稀疏量化模型,采用Wanda稀疏化和GPTQ-INT4量化技术,稀疏度为50%。
下载量 364
发布时间 : 5/10/2024

模型简介

该模型是一个经过稀疏化和量化处理的基础语言模型,主要用于高效的文本生成和自然语言处理任务。

模型特点

高效稀疏化
采用Wanda稀疏化方法,稀疏度达到50%,显著减少模型参数。
低精度量化
使用GPTQ-INT4量化技术,降低模型存储和计算需求。
硬件适配
专为硬件感知的自动化机器学习优化,适合在资源受限环境中部署。

模型能力

文本生成
自然语言处理

使用案例

高效推理
边缘设备部署
在计算资源有限的边缘设备上运行高效的文本生成任务。
降低计算和存储需求,提高推理速度。
研究应用
模型压缩研究
用于研究稀疏化和量化技术对模型性能的影响。
提供高效的基准模型。
AIbase
智启未来,您的人工智能解决方案智库
简体中文