Q

Qwen2.5 VL 7B Instruct GPTQ Int4

由 hfl 开发
Qwen2.5-VL-7B-Instruct-GPTQ-Int4是基于Qwen2.5-VL-7B-Instruct模型进行非官方GPTQ-Int4量化的版本,支持图文到文本的多模态任务。
下载量 872
发布时间 : 2/24/2025
模型介绍
内容详情
替代品

模型简介

该模型是一个多模态模型,能够处理图像和文本输入,生成相应的文本输出。主要用于图文理解和生成任务。

模型特点

高效量化
采用GPTQ-Int4量化技术,显著减少模型磁盘占用和显存需求,同时保持较高性能。
多模态支持
能够同时处理图像和文本输入,实现图文理解和生成。
高性能
在ChartQA和OCRBench等基准测试中表现优异,接近原始非量化模型性能。
计算效率高
相比AWQ量化版本,GPTQ模型在推理时显存占用更少,速度更快。

模型能力

图像理解
文本生成
图文问答
图表分析
OCR文本识别

使用案例

图文问答
图像描述生成
根据输入图像生成详细的文字描述
能够准确描述图像内容和细节
图表分析
解析图表内容并回答相关问题
在ChartQA测试中获得81.48分
文档处理
OCR增强
识别图像中的文字并进行语义理解
在OCRBench测试中获得845分