Q

Qwen2.5 VL 3B Instruct GPTQ Int3

由 hfl 开发
Qwen2.5-VL-3B-Instruct的GPTQ-Int3量化版本,适用于多模态图像文本处理任务,显存占用更少,推理速度更快。
下载量 60
发布时间 : 3/20/2025
模型介绍
内容详情
替代品

模型简介

这是一个基于Qwen2.5-VL-3B-Instruct模型的GPTQ-Int3量化版本,专注于图像与文本的多模态交互任务,如视觉问答和OCR识别。

模型特点

高效量化
采用GPTQ-Int3量化技术,显著减少模型磁盘占用和显存需求
多模态支持
同时处理图像和文本输入,实现视觉语言交互
性能保留
在量化后仍保持较高的任务性能,如ChartQA和OCRBench
计算效率
相比AWQ量化版本,显存占用更少,推理速度更快

模型能力

图像描述生成
视觉问答
OCR文本识别
多模态交互

使用案例

教育
图表理解
帮助学生理解复杂图表中的数据
在ChartQA测试集上达到76.68分
文档处理
OCR增强
识别并理解扫描文档中的图文内容
在OCRBench上达到742分
内容审核
多模态内容分析
同时分析图像和文本内容进行审核