G

Google Gemma 3 12b It Qat GGUF

由 bartowski 开发
基于Google QAT(量化感知训练)权重量化的Gemma-3-12b模型,提供多种量化版本以适应不同硬件需求。
下载量 10.78k
发布时间 : 4/18/2025
模型介绍
内容详情
替代品

模型简介

该模型是Google Gemma-3-12b的量化版本,采用量化感知训练技术生成,支持多种量化格式,适用于不同计算资源场景。

模型特点

量化感知训练
基于QAT技术生成,预期在量化后仍保持较高性能。
多量化版本
提供从Q2到Q8的多种量化版本,适应不同硬件和性能需求。
ARM和AVX支持
部分量化版本特别优化支持ARM和AVX CPU架构。
imatrix量化
使用imatrix选项进行量化,数据集来自公开资源。

模型能力

文本生成
对话系统
指令跟随

使用案例

对话系统
智能助手
构建响应自然的对话助手
可根据量化版本不同获得不同质量的响应
内容生成
创意写作
生成故事、诗歌等创意内容