M

Mimo 7B Base

由 XiaomiMiMo 开发
小米推出的7B参数规模推理专用语言模型系列,通过优化预训练和后训练策略显著提升数学与代码推理能力
下载量 12.75k
发布时间 : 4/29/2025
模型介绍
内容详情
替代品

模型简介

专为推理任务设计的语言模型系列,包含基础模型、SFT模型和RL训练模型,在数学和代码推理任务上表现优异

模型特点

推理优化预训练
通过数据过滤和合成数据增强预训练数据中的推理模式密度
多token预测
采用MTP作为辅助训练目标,提升模型性能并加速推理
强化学习优化
针对数学和编程题设计专门的RL训练策略,包括难度感知奖励机制
高效推理架构
优化后的推理引擎实现2.29倍训练加速和1.96倍验证加速

模型能力

数学问题求解
编程代码生成
复杂推理任务
多轮对话
知识问答

使用案例

教育
数学题解答
解答高中及以上难度的数学问题
在MATH-500测试集上达到95.8%准确率
编程教学辅助
生成和解释编程代码
在LiveCodeBench测试集上表现优异
科研
科学问题推理
处理需要多步推理的科学问题
在GPQA钻石题测试中表现良好