G

Gemma 3 12b Pt

由 google 开发
Gemma是Google推出的轻量级开源多模态模型系列,基于与Gemini相同技术构建,支持文本和图像输入并生成文本输出。
下载量 54.36k
发布时间 : 3/1/2025
模型介绍
内容详情
替代品

模型简介

Gemma 3是多模态模型,能够处理文本和图像输入并生成文本输出,适用于问答、摘要和推理等多种任务。拥有128K大上下文窗口,支持140多种语言。

模型特点

多模态处理能力
能够同时处理文本和图像输入,实现跨模态理解与生成
大上下文窗口
支持128K token的上下文长度,适合处理长文档和复杂任务
多语言支持
支持140多种语言的处理,具备国际化能力
轻量级设计
相对较小的体积使其能在资源有限的环境中部署

模型能力

文本生成
图像理解
问答系统
文档摘要
逻辑推理
代码生成
数学计算
多语言处理

使用案例

内容生成
图像描述生成
根据输入图像生成详细描述
示例中准确描述了蜜蜂在粉色花朵上的场景
文档摘要
对长文档进行自动摘要
问答系统
基于图像的问答
回答关于图像内容的问题
事实性问答
回答基于知识的问题
在TriviaQA基准测试中达到78.2分(12B模型)
教育
数学问题解答
解决数学问题和证明
在GSM8K基准测试中达到71.0分(12B模型)
编程辅助
代码生成和解释
在HumanEval基准测试中达到45.7分(12B模型)