Q

Qwen2.5 VL 7B Instruct Quantized.w4a16

由 RedHatAI 开发
Qwen2.5-VL-7B-Instruct的量化版本,支持视觉-文本输入和文本输出,权重量化为INT4,激活量化为FP16。
下载量 605
发布时间 : 2/7/2025
模型介绍
内容详情
替代品

模型简介

这是一个基于Qwen/Qwen2.5-VL-7B-Instruct的量化模型,专为高效推理而优化,适用于多模态任务。

模型特点

高效量化
权重量化为INT4,激活量化为FP16,显著减少模型大小和推理成本
多模态支持
支持视觉和文本输入,能够理解和生成与图像相关的文本内容
vLLM优化
专为vLLM推理引擎优化,支持高效部署

模型能力

视觉问答
图像描述生成
多模态对话
文档理解

使用案例

视觉问答
图像内容理解
回答关于图像内容的自然语言问题
在VQAv2数据集上达到73.90%准确率
文档处理
文档问答
从扫描文档或PDF中提取信息并回答问题
在DocVQA数据集上达到94.13% ANLS分数