M1-3B开源数学推理模型 - 免费部署助力多项数学竞赛测试

M1 3B

由 togethercomputer 开发

M1是一个基于Mamba混合架构的3B参数规模模型，专注于数学推理任务，在多项数学竞赛基准测试中表现优异。

下载量 1,160

发布时间 : 5/2/2025

模型简介

该模型是依据论文《M1: Towards Scalable Test-Time Compute with Mamba Reasoning Models》训练的混合模型，主要用于数学推理和文本生成任务。

高效推理架构

采用Mamba混合架构，实现可扩展的测试时计算效率

数学推理能力

在多项数学竞赛基准测试中超越同类Transformer模型

参数效率

仅3B参数规模即达到或超越更大规模模型的表现

数学问题求解

复杂推理

文本生成

教育

数学竞赛辅助

用于解决各类数学竞赛题目

在AIME、MATH等竞赛数据集上表现优异

数学学习助手

帮助学生理解和解决复杂数学问题

研究

数学推理研究

作为数学推理能力研究的基准模型

模型	AIME 2025	AIME 2024	MATH 500	AMC 2023	OlympiadBench
Qwen2.5 - Math - 7B - Instruct (Transformer)	–	13.3	79.8	50.6	40.7
rStar - Math - 7B (Transformer)	–	26.7	78.4	47.5	47.1
Eurus - 2 - 7B - PRIME (Transformer)	–	26.7	79.2	57.8	42.1
Qwen2.5 - 7B - SimpleRL (Transformer)	–	26.7	82.4	62.5	43.3
DeepSeek - R1 - Distill - Qwen - 1.5B (Transformer)	23.0	28.8	82.8	62.9	43.3
M1 - 3B (Mamba Hybrid Models)	23.5	28.5	84.0	62.8	47.3