G

Gemma 3 4b It GGUF

由 ggml-org 开发
Gemma 3是谷歌推出的轻量级开源多模态模型,支持文本和图像输入,生成文本输出,具有128K上下文窗口和140+语言支持。
下载量 9,023
发布时间 : 3/12/2025
模型介绍
内容详情
替代品

模型简介

基于Gemini技术构建的开源视觉语言模型,适用于问答、摘要、推理等多模态任务,可在资源有限环境中部署。

模型特点

多模态处理
同时处理文本和图像输入(896x896分辨率),实现跨模态理解
超长上下文
128K token上下文窗口支持处理长文档和复杂任务
多语言能力
训练数据涵盖140+种语言,具备跨语言应用潜力
轻量高效
4B参数规模优化了计算效率,适合边缘设备部署

模型能力

文本生成
图像内容分析
多语言翻译
代码生成
逻辑推理
文档摘要

使用案例

内容创作
营销文案生成
根据产品图像和简要描述自动生成广告文案
提升内容生产效率50%以上
视觉故事创作
基于连续图像生成连贯的叙事文本
教育研究
学术图像解析
从科研图像中提取关键信息并生成描述
多语言学习助手
通过图像关联帮助语言学习者建立词汇联系