Q

Qwen2.5 VL 7B Instruct Quantized.w8a8

由 RedHatAI 开发
Qwen2.5-VL-7B-Instruct的量化版本,支持视觉-文本输入和文本输出,通过INT8权重量化优化推理效率
下载量 1,992
发布时间 : 2/7/2025
模型介绍
内容详情
替代品

模型简介

基于Qwen2.5-VL-7B-Instruct的量化模型,专为高效视觉-语言任务设计,适用于需要结合图像理解和文本生成的应用场景

模型特点

高效INT8量化
采用W8A8量化方案,在保持模型性能的同时显著提升推理效率
多模态支持
能够同时处理视觉和文本输入,实现图像理解和文本生成的联合任务
vLLM优化
专为vLLM推理引擎优化,支持高效部署和大规模服务

模型能力

视觉问答
图像描述生成
多模态推理
文档理解
图表分析

使用案例

教育
教材内容理解
帮助学生理解教材中的图表和插图内容
在MMMU基准测试上达到52.33%准确率
商业
文档分析
自动解析商业文档中的表格和图表信息
在DocVQA基准测试上达到94.09 ANLS分数