3

3B Curr ReFT

由 ZTE-AIM 开发
基于Qwen2.5-VL通过创新性Curr-ReFT方法微调的多模态大语言模型,显著提升了视觉语言理解与推理能力。
下载量 37
发布时间 : 3/25/2025
模型介绍
内容详情
替代品

模型简介

Curr-ReFT是基于Qwen2.5-VL通过课程强化学习和拒绝样本自我优化方法微调的多模态大语言模型,适用于视觉推理、精细图像理解和多模态问题求解等复杂任务。

模型特点

课程强化学习
训练过程分为两个阶段,先通过课程强化学习逐步提升任务复杂度。
拒绝样本自我优化
基于拒绝样本进行自我优化以保持基础能力。
多模态推理能力
具有强大的多模态推理能力,能应对跨领域挑战。

模型能力

视觉语言理解
视觉推理
精细图像理解
多模态问题求解
图文生成

使用案例

视觉推理
图像数字识别
识别图像中的数字并回答相关问题。
高准确性的数字识别和推理能力。
多模态问题求解
复杂问题解答
结合图像和文本信息解答复杂问题。
提供准确且情境感知的回答。