G

Gemma 3 4b It Qat Q4 0 Unquantized

由 google 开发
Gemma 3是Google推出的轻量级开源多模态模型,基于与Gemini相同技术构建,支持文本和图像输入并生成文本输出。
下载量 1,159
发布时间 : 4/8/2025
模型介绍
内容详情
替代品

模型简介

Gemma 3是一个多模态模型,能够处理文本和图像输入并生成文本输出。它拥有128K的大上下文窗口,支持超过140种语言,适用于问答、摘要和推理等多种任务。

模型特点

多模态能力
支持文本和图像输入,能够理解和分析图像内容并生成相关文本输出。
大上下文窗口
拥有128K的大上下文窗口,能够处理更长的输入序列。
多语言支持
支持超过140种语言,适用于全球范围内的多语言任务。
轻量级设计
相对较小的体积使其能够在资源有限的环境中部署,如笔记本电脑、台式机或云基础设施。
量化感知训练
使用量化感知训练(QAT),能够在降低内存需求的同时保持与bfloat16相似的性能。

模型能力

文本生成
图像分析
问答
摘要
推理
代码生成
数学问题解决
多语言处理

使用案例

问答系统
开放域问答
回答用户提出的各种问题,提供准确的信息。
在BoolQ基准测试中,4B模型达到72.3的准确率。
文档处理
文档摘要
自动生成长文档的简洁摘要。
图像理解
图像描述生成
分析图像内容并生成描述性文本。
在COCOcap基准测试中,4B模型得分为102。
教育
数学问题解答
解决各种数学问题并提供详细步骤。
在GSM8K基准测试中,4B模型达到38.4的准确率。