G

Gemma 3 4b It

由 google 开发
Gemma是Google推出的轻量级先进开放模型系列,基于与Gemini相同的研究和技术构建。Gemma 3是多模态模型,能处理文本和图像输入并生成文本输出。
下载量 608.22k
发布时间 : 2/20/2025
模型介绍
内容详情
替代品

模型简介

Gemma 3是多模态模型,支持文本和图像输入,生成文本输出。适用于问答、摘要、推理等多种任务,具有128K大上下文窗口,支持140多种语言。

模型特点

多模态能力
支持同时处理文本和图像输入,生成文本输出。
大上下文窗口
支持128K token的输入上下文窗口,适合处理长文档和复杂任务。
多语言支持
支持超过140种语言,具备强大的多语言处理能力。
轻量级设计
相对较小的体积使其能在资源有限的环境中部署,如笔记本电脑或云基础设施。

模型能力

文本生成
图像理解
多语言处理
问答
摘要
推理

使用案例

内容生成
图像描述生成
根据输入的图像生成详细的文字描述。
能准确描述图像中的物体、场景和细节。
文档摘要
对长文档进行摘要,提取关键信息。
生成简洁且信息完整的摘要。
问答系统
视觉问答
回答关于图像内容的问题。
能准确识别图像中的物体并回答相关问题。
知识问答
回答基于文本知识的问题。
提供准确且信息丰富的答案。