Q

Qwen2.5 VL 3B Instruct FP8 Dynamic

由 RedHatAI 开发
Qwen2.5-VL-3B-Instruct的FP8量化版本,支持视觉-文本输入和文本输出,优化了推理效率。
下载量 112
发布时间 : 2/6/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于Qwen2.5-VL-3B-Instruct的量化版本,通过FP8权重量化和激活量化优化,支持使用vLLM进行高效推理。适用于多模态理解和生成任务。

模型特点

FP8量化
权重量化和激活量化均为FP8,显著提升推理效率。
多模态支持
支持视觉-文本输入和文本输出,适用于复杂的多模态任务。
高效推理
优化后支持使用vLLM进行高效部署,提升推理速度。

模型能力

视觉问答
图像描述生成
多模态推理
文档理解
图表分析

使用案例

教育
教育内容理解
解析教育材料中的图像和文本内容,辅助学习。
在MMMU验证集上达到45.78%的准确率。
商业
文档分析
自动解析商业文档中的图像和文本信息。
在DocVQA验证集上达到92.40%的ANLS分数。
研究
科学图表理解
解析科学论文中的图表和数据。
在ChartQA测试集上达到80.72%的宽松正确率。