Q

Qwen2.5 VL 3B Instruct Quantized.w8a8

由 RedHatAI 开发
Qwen/Qwen2.5-VL-3B-Instruct的量化版本,支持视觉-文本输入和文本输出,权重量化为INT8,激活量化为INT8。
下载量 274
发布时间 : 2/7/2025
模型介绍
内容详情
替代品

模型简介

该模型是Qwen/Qwen2.5-VL-3B-Instruct的量化版本,适用于视觉-语言任务,支持高效的推理部署。

模型特点

高效量化
权重量化为INT8,激活量化为INT8,显著提升推理效率。
多模态支持
支持视觉和文本输入,适用于复杂的多模态任务。
高性能推理
通过vLLM后端实现高效部署,支持单流和多流异步推理。

模型能力

视觉-文本理解
文本生成
多模态推理

使用案例

视觉问答
图片内容描述
根据输入的图片生成描述性文本。
在VQAv2数据集上达到75.55的准确率。
文档理解
文档视觉问答
解析文档图片并回答相关问题。
在DocVQA数据集上达到92.32的ANLS分数。