G

Gemma 3 12b It Qat Q4 0 Unquantized

由 google 开发
Gemma 3是Google基于Gemini技术打造的轻量级开源多模态模型系列,支持文本和图像输入并生成文本输出。12B版本经过指令调优和量化感知训练(QAT),适合资源有限环境部署。
下载量 1,159
发布时间 : 4/8/2025
模型介绍
内容详情
替代品

模型简介

Gemma 3是一个多模态模型,能够处理文本和图像输入并生成文本响应。该模型具有128K的大上下文窗口,支持140多种语言,适用于问答、摘要、推理等多种任务。

模型特点

多模态能力
支持同时处理文本和图像输入,实现跨模态理解与生成
大上下文窗口
128K token的上下文长度,适合处理长文档和复杂任务
量化感知训练
采用QAT技术,可在量化后保持与bfloat16相近的质量,降低内存需求
多语言支持
支持140多种语言,具备全球应用潜力

模型能力

文本生成
图像理解
多语言处理
问答系统
文档摘要
逻辑推理
代码生成

使用案例

内容生成
自动摘要
对长文档或文章生成简洁摘要
在Natural Questions基准上5-shot达到31.4分(12B版本)
创意写作
根据提示生成故事、诗歌等创意内容
知识问答
开放域问答
回答各种领域的知识性问题
在TriviaQA基准上5-shot达到78.2分(12B版本)
教育辅助
数学问题解答
解决数学题目并解释步骤
在GSM8K基准上8-shot达到71.0分(12B版本)