FastCuRL-1.5B-Preview开源模型 - 免费部署助力高效数学推理任务

Fastcurl 1.5B Preview

由 Nickyang 开发

FastCuRL-1.5B-Preview 是一个慢思考推理模型，采用课程引导迭代延长强化学习方法，在数学推理任务上表现优异。

下载量 779

发布时间 : 3/17/2025

模型简介

该模型基于 DeepSeek-R1-Distill-Qwen-1.5B 进行训练，专注于数学推理任务，在多项数学基准测试中超越同类模型。

课程引导迭代延长强化学习

采用新颖的训练方法，显著提升模型性能

高效训练

仅用50%的训练步数就超越了之前的SOTA模型

数学推理专精

在多项数学基准测试中表现优异

数学问题解答

复杂推理

数学竞赛题求解

教育

数学竞赛训练

帮助学生准备AIME、AMC等数学竞赛

在AIME 2024测试中达到43.1%准确率

数学问题求解

解决各类数学问题

在MATH 500测试中达到88.0%准确率

模型	AIME 2024	MATH 500	AMC 2023	Minerva Math	OlympiadBench	平均
Qwen2.5-Math-7B-Instruct	13.3	79.8	50.6	34.6	40.7	43.8
rStar-Math-7B	26.7	78.4	47.5	-	47.1	-
Eurus-2-7B-PRIME	26.7	79.2	57.8	38.6	42.1	48.9
Qwen2.5-7B-SimpleRL	26.7	82.4	62.5	39.7	43.3	50.9
DeepSeek-R1-Distill-Qwen-1.5B	28.8	82.8	62.9	26.5	43.3	48.9
Still-1.5B	32.5	84.4	66.7	29.0	45.4	51.6
DeepScaleR-1.5B-Preview	43.1	87.8	73.6	30.2	50.0	57.0
FastCuRL-1.5B-Preview	43.1	88.0	74.2	31.6	50.4	57.5