G

Gemma 3 4b It GPTQ 4b 128g

由 ISTA-DASLab 开发
基于gemma-3-4b-it模型进行INT4量化的版本,显著减少存储和计算资源需求
下载量 502
发布时间 : 4/11/2025
模型介绍
内容详情
替代品

模型简介

通过对gemma-3-4b-it模型的权重进行INT4量化获得,减少约75%的磁盘空间和GPU内存需求,同时保持较好的性能表现。

模型特点

高效量化
采用INT4量化技术,显著降低模型存储和计算资源需求
性能保留
在OpenLLM基准测试中保持96.35%的原始模型性能
视觉语言能力
支持图像和文本的多模态输入与文本输出

模型能力

多模态理解
文本生成
图像描述
对话系统

使用案例

内容生成
图像描述生成
根据输入的图像生成详细的文字描述
能够准确描述图像内容和场景
智能助手
多模态对话
结合图像和文本输入进行自然对话
提供有上下文感知的响应