G

Gemma 3 27b It Qat Q4 0 GGUF

由 Mungert 开发
这是一个实验性的重新量化模型,基于Google的Gemma-3-27b-it QAT Q4_0量化模型创建,旨在测试重新量化后的性能表现。
下载量 1,096
发布时间 : 4/7/2025
模型介绍
内容详情
替代品

模型简介

该模型是通过从Google原始的QAT Q4_0量化模型创建imatrix文件,然后使用这个imatrix将模型重新压缩到更低的比特量化级别而得到的。主要用于测试QAT模型重新量化后是否比量化到相同比特级别的bf16模型表现更好。

模型特点

实验性重新量化
通过从QAT Q4_0模型重新量化,测试是否比从bf16量化的模型表现更好。
性能优化
在测试中显示出比标准量化模型更低的困惑度(4.10 vs 4.56)。
代码生成能力
在代码生成任务中表现出更好的技术准确性和代码质量。

模型能力

文本生成
代码生成
语言理解
文本转换

使用案例

代码生成
安全检测代码生成
生成检测网站是否使用量子安全加密的.NET代码
生成的代码在技术准确性、代码质量和安全性相关性方面优于标准量化模型
语言模型评估
困惑度测试
用于评估语言模型的困惑度表现
在测试中显示出比标准量化模型更低的困惑度(4.10 vs 4.56)