I

INFRL Qwen2.5 VL 72B Preview Ggufs Fully Quantized

由 GeorgyGUF 开发
基于Qwen2.5-VL-72B-Instruct改进的视觉语言模型,在多个视觉推理基准测试中表现优异
下载量 230
发布时间 : 5/14/2025
模型介绍
内容详情
替代品

模型简介

增强视觉推理能力的多模态模型,在数学视觉理解任务上达到开源模型最佳性能

模型特点

卓越的视觉推理能力
在MathVision、MathVista和MathVerse等视觉推理基准测试中表现最佳
强化学习优化
采用基于规则奖励的强化学习方法提升视觉理解能力
多模态理解
能够同时处理视觉和语言信息,进行复杂的跨模态推理

模型能力

视觉问答
数学问题视觉理解
图表分析
跨模态推理

使用案例

教育科技
数学题目视觉解答
解析包含图表和公式的数学题目
在MathVista测试集上达到77.8%准确率
科学研究
科学图表分析
理解并解释科研论文中的复杂图表