S

STILL 3 1.5B Preview

由 RUC-AIBOX 开发
STILL-3-1.5B-preview是一款采用强化学习技术增强推理能力的慢思考模型,在AIME基准测试中达到39.33%准确率
下载量 2,186
发布时间 : 1/25/2025
模型介绍
内容详情
替代品

模型简介

15亿参数规模的慢思考推理模型,通过强化学习技术提升数学推理能力,特别适合解决复杂数学问题

模型特点

慢思考推理能力
采用强化学习技术增强模型的逐步推理能力
小模型高性能
在15亿参数规模下实现接近大模型的数学推理能力
多基准测试验证
在MATH、AIME、OMNI和LiveAOPS等多个数学基准上表现优异

模型能力

数学问题求解
符号推理
多步数学推导
极坐标转换等数学运算

使用案例

数学教育
数学竞赛题解答
解决AIME等数学竞赛中的复杂问题
AIME基准准确率39.33%
数学概念应用
坐标系转换等数学概念的实际应用
学术研究
小模型推理能力研究
研究强化学习对小模型推理能力的提升效果
相对基线提升37.18%