Q

Qwen2.5 VL 3B Instruct GPTQ Int4

由 hfl 开发
这是Qwen2.5-VL-3B-Instruct模型的GPTQ-Int4量化版本,适用于图像文本到文本的多模态任务,支持中文和英语。
下载量 1,312
发布时间 : 2/24/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于Qwen2.5-VL-3B-Instruct的GPTQ-Int4量化版本,主要用于处理图像和文本的多模态任务,能够生成与图像相关的文本描述或回答相关问题。

模型特点

高效量化
通过GPTQ-Int4量化技术,显著减少模型磁盘占用和显存需求,同时保持较高的性能。
多模态支持
能够同时处理图像和文本输入,生成相关的文本输出。
高性能
在ChartQA和OCRBench等基准测试中表现优异,接近原始模型的性能。

模型能力

图像描述生成
图像问答
多模态文本生成

使用案例

图像理解
图像描述
生成对输入图像的详细描述。
输出示例:这张图片展示了一个中文和英文的标志,内容为“中文LLaMA & Alpaca大模型”和“Chinese LLaMA & Alpaca Large Language Models”。
图像问答
回答与图像内容相关的问题。