Q

Qwen2.5 VL 72B Instruct FP8 Dynamic

由 parasail-ai 开发
Qwen2.5-VL-72B-Instruct的FP8量化版本,支持视觉-文本输入和文本输出,由Neural Magic优化发布。
下载量 78
发布时间 : 4/18/2025
模型介绍
内容详情
替代品

模型简介

这是一个基于Qwen2.5-VL-72B-Instruct的量化模型,通过FP8权重量化和激活量化优化,适用于多模态任务处理。

模型特点

FP8量化
采用FP8权重量化和激活量化技术,显著减少模型大小和内存占用
多模态支持
能够同时处理视觉和文本输入,执行复杂的多模态任务
高效推理
优化后可在vLLM框架下实现高效推理,支持单流和多流部署

模型能力

视觉问答
图像描述生成
文档理解
多模态推理
文本生成

使用案例

教育
教育内容理解
解析教材中的图表和文字内容
在MMMU评估中达到66.88%准确率
商业
文档分析
自动理解和提取商业文档中的关键信息
在DocVQA评估中达到94.64%准确率
通用AI助手
多模态对话
基于图像和文本输入进行自然对话
在VQAv2评估中保持81.94%准确率