A

Acip Llama1 7b

由 MerantixMomentum 开发
ACIP项目提供的可压缩版本Llama-7B模型,支持动态调整压缩率
下载量 83
发布时间 : 4/15/2025
模型介绍
内容详情
替代品

模型简介

基于jeffwan/llama-7b-hf的可压缩模型,通过ACIP技术实现参数量的灵活调整,可在不同压缩率下保持性能

模型特点

动态压缩
支持通过size_ratio参数实时调整模型压缩率(0.0-1.0范围)
可逆压缩
压缩操作可逆,可多次调整压缩率评估性能
量化支持
支持通过bitsandbytes进行4位量化以进一步节省内存

模型能力

文本生成
模型压缩
量化推理

使用案例

资源优化
边缘设备部署
通过压缩和量化在资源受限设备上部署大模型
内存使用显著下降
多压缩率评估
快速测试不同压缩率下的模型性能
无需重复训练即可获得压缩性能曲线