A

Acip Qwen25 3b

由 MerantixMomentum 开发
ACIP项目提供的Qwen2.5-3B可压缩版本,支持动态调整模型大小并保持性能
下载量 31
发布时间 : 4/15/2025
模型介绍
内容详情
替代品

模型简介

基于Qwen2.5-3B的可压缩模型,通过ACIP技术实现灵活的参数压缩与量化,适用于多语言文本生成任务

模型特点

动态可压缩性
支持通过size_ratio参数实时调整模型压缩比例(0-100%),且压缩操作可逆
量化支持
集成bitsandbytes的4比特量化方案,可进一步降低显存占用
多语言支持
原生支持13种语言的文本生成任务

模型能力

文本生成
模型压缩
量化推理

使用案例

资源受限环境部署
边缘设备部署
通过压缩和量化将大模型部署到显存有限的设备
可降低60%以上显存占用
多语言应用
多语言文本生成
支持13种语言的文本生成与创作