F

Fathom R1 14B

由 FractalAIResearch 开发
以499美元训练成本实现的14B参数数学推理模型,在16K上下文窗口下达到媲美闭源o4-mini的性能
下载量 2,112
发布时间 : 5/13/2025
模型介绍
内容详情
替代品

模型简介

基于Deepseek-R1-Distilled-Qwen-14B的140亿参数推理模型,通过创新训练方法在16K上下文限制内实现SOTA数学推理能力

模型特点

低成本高效训练
仅花费499美元训练成本即实现媲美闭源o4-mini的性能
16K上下文限制
在严格16K上下文窗口下实现最优性能,避免过长推理链的可靠性问题
迭代课程学习
采用多轮课程学习策略渐进提升模型在不同难度数学题上的表现
推理链压缩
通过RL训练使模型生成更简洁有效的推理步骤

模型能力

高级数学推理
奥数竞赛题求解
复杂问题分步解答
跨领域知识应用

使用案例

教育
奥数竞赛辅导
用于AIME/HMMT等数学竞赛的题目解答与辅导
AIME2025达到52.71% Pass@1准确率
数学教育辅助
帮助学生理解复杂数学概念的分步推理过程
研究
推理模型研究
作为低成本高效推理模型的基准研究对象