G

Gemma 3 12b It Qat Int4 GGUF

由 unsloth 开发
Gemma 3是谷歌基于Gemini技术构建的轻量级开放模型系列,12B版本采用量化感知训练(QAT)技术,支持多模态输入和128K上下文窗口。
下载量 1,921
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

Gemma 3是多模态模型,可处理文本和图像输入并生成文本输出,提供预训练和指令调优两种变体。支持140多种语言,适用于问答、摘要和推理等任务。

模型特点

量化感知训练(QAT)
采用QAT技术实现高效量化,在降低内存占用的同时保持与bfloat16相近的模型质量
多模态处理
支持文本和图像输入(896x896分辨率),每张图像编码为256个token
超长上下文
12B模型支持128K token的上下文窗口长度
多语言支持
训练数据涵盖140多种语言,具备强大的跨语言能力

模型能力

文本生成
图像内容分析
多语言处理
代码生成
数学推理
视觉问答

使用案例

内容生成
自动摘要
对长文档生成简洁摘要
在TriviaQA基准测试中达到78.2分(5样本)
创意写作
根据提示生成故事或诗歌
知识问答
开放域问答
回答各类事实性问题
在Natural Questions基准测试中达到31.4分(5样本)
视觉理解
图像描述生成
为图像生成自然语言描述
在COCO字幕基准测试中达到111分
文档分析
解析文档图像中的内容和结构
在DocVQA验证集上达到82.3分