G

Gemma 3 12b It Qat Compressed Tensors

由 gaunernst 开发
Gemma 3是Google推出的轻量级前沿开放模型家族,基于创建Gemini模型的相同研究与技术构建。该模型是多模态的,可处理文本和图像输入并生成文本输出。
下载量 867
发布时间 : 4/8/2025
模型介绍
内容详情
替代品

模型简介

Gemma 3 12B模型是经过指令调优的版本,采用量化感知训练(QAT)和压缩张量格式,能在显著降低内存需求的同时保持与bfloat16相近的质量。适用于多种文本生成和图像理解任务。

模型特点

多模态能力
可同时处理文本和图像输入,生成文本输出
大上下文窗口
支持128K token的上下文长度
量化感知训练
采用QAT技术,在降低内存需求的同时保持模型质量
多语言支持
支持140多种语言的处理

模型能力

文本生成
图像内容分析
多语言处理
问答系统
文档摘要
逻辑推理

使用案例

内容生成
诗歌创作
根据用户提示生成诗歌
可生成符合主题的创意诗歌
文档摘要
自动生成长文档的简洁摘要
能准确提取关键信息
视觉理解
图像描述
分析图像内容并生成文字描述
能准确识别图像中的主要元素和场景
教育
数学问题解答
解决数学问题和逻辑推理
在GSM8K基准测试中达到82.6分