V

Visualthinker R1 Zero

由 turningpoint-ai 开发
首个在仅一个非监督微调的2B模型上复现'顿悟时刻'和响应长度增加的多模态推理模型
下载量 578
发布时间 : 2/28/2025
模型介绍
内容详情
替代品

模型简介

基于Qwen2-VL-2B基础模型,通过强化学习在SAT数据集上训练,提升了视觉中心任务的推理能力

模型特点

顿悟时刻复现
首个在非监督微调的2B模型上成功复现DeepSeek-R1的'顿悟时刻'特征
视觉中心推理
展示了视觉中心任务也能从改进的推理能力中受益
自我反思能力
模型表现出重新思考并纠正错误的涌现能力

模型能力

多模态推理
图像理解
文本生成
视觉中心任务处理

使用案例

视觉推理
物体位置分析
分析图像中物体的相对位置关系
在CVBench上达到59.47%准确率