G

Gemma 3 1b It Qat Int4 Unquantized

由 google 开发
Gemma是Google推出的轻量级先进开放模型系列,基于与Gemini相同技术构建,支持多模态输入和文本生成。
下载量 507
发布时间 : 4/9/2025
模型介绍
内容详情
替代品

模型简介

Gemma 3是多模态模型,可处理文本和图像输入并生成文本输出,适用于问答、摘要和推理等任务。1B版本经过指令调优和量化感知训练(QAT),适合资源有限环境部署。

模型特点

多模态处理能力
支持文本和图像输入,可执行跨模态任务如视觉问答和图像内容分析
量化感知训练(QAT)
采用QAT技术优化模型,显著降低内存需求同时保持接近bfloat16的质量
大上下文窗口
1B版本支持32K token的输入上下文和8K token的输出生成
轻量级部署
小尺寸设计使其能在笔记本电脑、台式机等资源有限环境中运行

模型能力

文本生成
图像理解
多语言处理
代码生成
数学推理
文档摘要
视觉问答

使用案例

内容生成
自动文档摘要
对长文档进行关键信息提取和浓缩
生成简洁准确的摘要
创意写作辅助
根据提示生成故事、诗歌等创意内容
提供多样化的创意输出
知识问答
开放域问答
回答各类事实性和解释性问题
在TriviaQA基准测试中达到39.8分(5-shot)
视觉问答
分析图像内容并回答相关问题
在VQAv2基准测试中达63.9分(4B版本)
教育辅助
数学问题求解
解决代数、几何等数学问题
在GSM8K基准测试中达38.4分(8-shot)
编程教学
解释代码概念和生成示例代码
在HumanEval基准测试中达36分(0-shot)