R

R1 VL 2B

由 jingyiZ00 开发
R1-VL-2B 是通过逐步组相对策略优化(StepGRPO)训练得到的视觉语言推理模型,基于Qwen2-VL-2B-Instruct进行优化。
下载量 272
发布时间 : 3/18/2025
模型介绍
内容详情
替代品

模型简介

R1-VL-2B是一个视觉语言模型,专注于图像文本到文本的任务,能够理解和生成与图像相关的文本内容。

模型特点

逐步组相对策略优化(StepGRPO)
采用StepGRPO训练方法,优化模型在视觉语言任务中的表现。
基于Qwen2-VL-2B-Instruct
以Qwen2-VL-2B-Instruct为基础模型,继承了其强大的视觉语言处理能力。

模型能力

图像理解
文本生成
视觉语言推理

使用案例

视觉问答
图像描述生成
根据输入的图像生成详细的文本描述。
视觉问答
回答与图像内容相关的问题。