G

Gemma 3 27b It Qat Autoawq

由 gaunernst 开发
Gemma 3是Google推出的轻量级前沿开放模型系列,基于与Gemini相同技术构建,支持多模态输入(文本/图像)和文本输出。27B版本通过量化感知训练显著降低内存需求。
下载量 789
发布时间 : 4/6/2025
模型介绍
内容详情
替代品

模型简介

多模态开放权重模型,支持128K上下文窗口和140+语言,适用于问答、摘要、推理等任务,特别优化了资源受限环境的部署能力。

模型特点

量化感知训练
采用QAT技术实现4-bit量化,内存需求显著降低的同时保持接近bfloat16的模型质量
多模态支持
可同时处理文本和图像输入(896x896分辨率),实现跨模态理解与生成
超长上下文
支持128K令牌的输入上下文窗口,适合处理长文档和复杂任务
多语言能力
训练数据涵盖140+种语言,具备跨语言理解和生成能力

模型能力

文本生成
图像内容分析
多语言处理
代码理解与生成
数学推理
文档摘要
视觉问答

使用案例

内容生成
创意写作
生成诗歌、故事等创意文本
示例显示能生成符合主题的连贯诗文
技术文档摘要
自动生成长文档的简明摘要
在128K上下文窗口内有效提取关键信息
视觉理解
图像描述生成
为输入图像生成自然语言描述
在COCOcap基准测试达到116分(27B模型)
文档视觉问答
回答基于扫描文档内容的问题
DocVQA验证集准确率85.6%
教育辅助
数学问题求解
分步解决数学应用题
GSM8K基准8-shot准确率82.6%
编程教学
解释代码片段或生成示例代码
HumanEval基准0-shot通过率48.8%