S

Skywork R1V2 38B

由 Skywork 开发
天工-R1V2-38B是当前最先进的开源多模态推理模型,在多项基准测试中表现卓越,具备强大的视觉推理与文本理解能力。
下载量 1,778
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

高性能开源视觉语言模型,兼具视觉推理与文本理解能力,在MMMU、OlympiadBench等多项基准测试中领先其他开源模型。

模型特点

多模态推理能力
在MMMU测试中获得73.6%的分数,是目前所有开源模型中的最高成绩
视觉理解卓越
在OlympiadBench上达到62.6%,大幅领先其他开源模型
媲美商业模型
在MathVision、MMMU-Pro和MathVista等测试中表现强劲,性能接近商业闭源模型
开源可访问
完全开源,提供Hugging Face和ModelScope模型库访问

模型能力

多模态推理
视觉问答
图像理解
复杂问题解答
跨模态信息处理

使用案例

教育
数学问题解答
解析包含数学公式和图表的问题并提供解答
在MathVista测试中达到74.0%准确率
科学问题解答
理解科学图表并回答相关问题
在OlympiadBench测试中达到62.6%准确率
研究
多模态研究
用于视觉语言模型的前沿研究