G

Google Gemma 3 27b It Qat GGUF

由 bartowski 开发
基于Google Gemma 3 270亿参数指令调优模型的量化版本,采用量化感知训练(QAT)权重生成,支持多种量化级别以适应不同硬件需求。
下载量 14.97k
发布时间 : 4/18/2025
模型介绍
内容详情
替代品

模型简介

该模型是Google Gemma-3-27B指令调优模型的量化版本,特别针对边缘设备和资源受限环境优化,支持ARM和AVX CPU架构。

模型特点

量化感知训练优化
基于Google官方QAT权重生成,Q4_0版本预期表现更优
多量化级别支持
提供从Q2到Q8共20种量化选项,适应不同硬件配置和性能需求
ARM/AVX CPU优化
支持ARM架构和AVX指令集的CPU,实现高效的在线权重重组推理
imatrix量化技术
采用llama.cpp的imatrix选项进行量化,提升模型质量

模型能力

文本生成
指令跟随
对话系统
内容创作

使用案例

对话系统
智能助手
构建响应迅速、理解准确的对话式AI助手
在资源受限设备上实现流畅对话体验
内容生成
创意写作
生成故事、诗歌等创意内容
保持创意性的同时减少硬件资源消耗