G

Gemma 3 4b It Abliterated GGUF

由 ZeroWw 开发
一种创新的量化方案,通过混合精度量化实现更小的模型体积和保持高性能。
下载量 247
发布时间 : 3/22/2025
模型介绍
内容详情
替代品

模型简介

该模型采用自研的混合精度量化方案,输出层和嵌入层使用f16精度,其余部分使用q5_k或q6_k精度,实现了比标准q8_0更小的体积同时保持与纯f16量化相当的性能。

模型特点

混合精度量化
输出层和嵌入层采用f16精度,其余部分使用q5_k或q6_k精度,实现高效量化
体积优化
f16.q6和f16.q5两种量化方案均比标准q8_0量化体积更小
性能保持
量化后性能与纯f16量化持平

模型能力

文本生成

使用案例

自然语言处理
高效文本生成
在保持生成质量的同时减少模型体积
体积比标准q8_0更小,性能与纯f16量化持平