G

Google Gemma 3 1b It Qat GGUF

由 bartowski 开发
基于Google Gemma 3B QAT权重的多种量化版本,适用于本地推理部署
下载量 1,437
发布时间 : 4/19/2025
模型介绍
内容详情
替代品

模型简介

该模型是Google Gemma-3-1B指令调优模型的量化版本集合,使用llama.cpp的imatrix方法进行优化量化,支持多种精度级别以适应不同硬件环境

模型特点

量化感知训练优化
基于Google官方QAT权重,相比传统量化方法具有更好的精度保持
多精度选择
提供从BF16到2bit的20种量化选项,满足不同硬件需求
ARM兼容性
特定量化版本(Q4_0等)支持ARM CPU在线重打包推理
imatrix优化
使用llama.cpp的imatrix功能进行数据感知量化,提升低bit量化质量

模型能力

指令跟随
多轮对话
文本补全
知识问答

使用案例

本地部署应用
个人助手
在本地设备运行个性化AI助手
低延迟响应,保护隐私
教育工具
离线环境下的学习辅导和问答系统
边缘计算
移动端推理
在手机等移动设备上运行AI功能
优化后的量化模型降低硬件要求