F

Fastcurl 1.5B Preview

由 Nickyang 开发
FastCuRL-1.5B-Preview 是一个慢思考推理模型,采用课程引导迭代延长强化学习方法,在数学推理任务上表现优异。
下载量 779
发布时间 : 3/17/2025

模型简介

该模型基于 DeepSeek-R1-Distill-Qwen-1.5B 进行训练,专注于数学推理任务,在多项数学基准测试中超越同类模型。

模型特点

课程引导迭代延长强化学习
采用新颖的训练方法,显著提升模型性能
高效训练
仅用50%的训练步数就超越了之前的SOTA模型
数学推理专精
在多项数学基准测试中表现优异

模型能力

数学问题解答
复杂推理
数学竞赛题求解

使用案例

教育
数学竞赛训练
帮助学生准备AIME、AMC等数学竞赛
在AIME 2024测试中达到43.1%准确率
数学问题求解
解决各类数学问题
在MATH 500测试中达到88.0%准确率
AIbase
智启未来,您的人工智能解决方案智库
简体中文