T

TBAC VLR1 3B Preview

由 TencentBAC 开发
由腾讯PCG基础算法中心微调的多模态语言模型,基于Qwen2.5-VL-3B-Instruct优化,在同规模模型中实现多项多模态推理基准的最先进性能
下载量 328
发布时间 : 4/16/2025
模型介绍
内容详情
替代品

模型简介

采用分组相对策略优化(GRPO)技术增强多模态推理能力的视觉语言模型

模型特点

GRPO优化技术
采用分组相对策略优化技术增强多模态推理能力
领先性能
在同规模模型中实现多项多模态推理基准的最先进性能
数学推理能力
在MathVista等数学推理基准上表现优异

模型能力

多模态理解
视觉语言推理
数学问题求解
逻辑推理
图像文本生成

使用案例

教育
数学题目解答
解析包含数学公式和图形的题目
在MathVista基准上达到64.8分
研究
多模态推理研究
用于视觉语言推理任务的研究
在综合评估中达到35.7的平均分