L

Light R1 7B DS

由 qihoo360 开发
Light-R1-7B-DS是基于DeepSeek-R1-Distill-Qwen-7B微调的开源7B数学模型,在AIME24和25等数学基准测试中表现优异。
下载量 1,414
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

当前开源的7B数学模型中性能最优的模型,通过仅3K SFT数据微调实现SOTA级表现,特别擅长数学推理任务。

模型特点

高效微调
仅使用3K SFT数据微调即达到SOTA性能,证明数据的高效性
数学推理能力
在AIME24、AIME25和GPQA等数学基准测试中表现优异
数据去污染
通过精确匹配和N-gram匹配进行了严格的数据去污染处理

模型能力

数学问题求解
复杂推理
文本生成

使用案例

教育
数学竞赛题解答
解答AIME等数学竞赛题目
在AIME24测试中达到59.1分
数学教育辅助
帮助学生理解复杂数学概念
研究
数学推理研究
作为数学推理能力研究的基准模型