G

Gemma 3 4b It Qat Int4 Unquantized

由 google 开发
Gemma 3是Google推出的轻量级多模态开放模型,支持文本和图像输入,生成文本输出。4B版本经过指令调优和量化感知训练,适合资源有限环境部署。
下载量 541
发布时间 : 4/9/2025
模型介绍
内容详情
替代品

模型简介

基于Gemini技术构建的轻量级多模态模型,支持128K上下文窗口和140+种语言,适用于问答、摘要、推理等多种任务。

模型特点

多模态处理能力
支持同时处理文本和图像输入,实现跨模态理解与生成
量化感知训练
采用QAT技术,可在保持质量的同时显著降低内存需求
大上下文窗口
支持128K token的上下文长度,适合处理长文档和复杂任务
多语言支持
训练数据涵盖140+种语言,具备跨语言处理能力

模型能力

文本生成
图像内容分析
多语言处理
逻辑推理
代码理解与生成
数学问题求解
文档摘要

使用案例

内容生成
智能问答系统
基于文本或图像输入生成准确回答
在BoolQ基准测试达到82.4准确率
文档摘要
自动生成长文档的简洁摘要
教育辅助
数学问题求解
解答各类数学题目并展示推理过程
在GSM8K基准测试达到82.6%准确率
编程教学
解释代码逻辑和生成示例代码
在HumanEval基准测试达到48.8%准确率
视觉理解
图像描述生成
为输入图像生成详细文字描述
在COCOcap基准测试得分116
文档信息提取
从扫描文档中提取关键信息
在DocVQA基准测试达到85.6准确率