S

Svdq Int4 Flux.1 Dev

由 mit-han-lab 开发
SVDQuant是一种针对4比特权重和激活的后训练量化技术,能很好地保持视觉保真度。在120亿参数的FLUX.1-dev模型上,相比BF16模型实现了3.6倍的内存压缩。
下载量 60.72k
发布时间 : 11/25/2024
模型介绍
内容详情
替代品

模型简介

基于FLUX.1-dev模型的INT4量化版本,采用SVDQuant技术实现高效4比特权重和激活量化,显著提升推理速度并降低内存占用。

模型特点

高效4比特量化
采用SVDQuant技术实现4比特权重和激活量化,相比BF16模型实现3.6倍内存压缩
优化的推理速度
在16GB显存的笔记本4090 GPU上比16位模型提速8.7倍,比NF4 W4A16基线快3倍
视觉保真度高
在PixArt-∑模型上,其视觉质量显著优于其他W4A4甚至W4A8基线
创新的低秩分解
通过SVD将权重分解为低秩分量和残差,低秩分支以16比特精度运行从而缓解量化难度

模型能力

文本生成图像
高分辨率图像生成
快速推理

使用案例

创意设计
概念艺术生成
根据文本描述快速生成概念艺术图像
高质量视觉输出,适合创意工作流程
教育
教学素材生成
根据教学内容自动生成配套视觉素材
快速创建符合教学需求的图像