G

Gemma 3 12b It GPTQ 4b 128g

由 ISTA-DASLab 开发
该模型是对google/gemma-3-12b-it进行INT4量化的版本,通过GPTQ算法将参数从16比特降至4比特,显著减少了磁盘空间和GPU内存需求。
下载量 1,175
发布时间 : 4/11/2025
模型介绍
内容详情
替代品

模型简介

基于Gemma-3-12b-it的INT4量化版本,适用于文本生成和多模态任务,保持了原模型大部分性能的同时显著降低资源需求。

模型特点

高效INT4量化
采用GPTQ算法将参数从16比特降至4比特,减少约75%的存储和内存需求。
性能保留
在OpenLLM基准测试中保持了原模型98.42%的性能表现。
多模态支持
支持图像和文本的联合处理,能够理解并描述图像内容。

模型能力

文本生成
图像内容理解
多模态任务处理
对话系统

使用案例

内容生成
图像描述生成
根据输入图像生成详细描述
能准确识别图像中的物体和场景并生成流畅描述
智能助手
多模态对话
结合图像和文本输入进行对话
能理解图像内容并回答相关问题