A

Acemath 72B Instruct

由 nvidia 开发
AceMath 是一系列专为数学推理设计的前沿模型,基于 Qwen 改进,擅长使用思维链(CoT)推理解决英文数学问题。
下载量 3,141
发布时间 : 1/14/2025

模型简介

AceMath 系列模型专注于数学推理任务,包括指令模型和奖励模型,适用于解决复杂的数学问题和评估数学解决方案。

模型特点

强大的数学推理能力
AceMath 模型在多种数学推理基准测试中表现出色,大幅超过同类最佳模型。
专业的奖励模型
AceMath - RM 模型专门用于评估和评分数学解决方案,在推理基准测试中创下新纪录。
多阶段监督微调
采用多阶段监督微调(SFT)过程,先使用通用 SFT 数据,再使用特定数学 SFT 数据。

模型能力

数学问题解决
数学推理
数学解决方案评估
思维链(CoT)推理

使用案例

教育
数学竞赛问题解决
解决复杂的数学竞赛问题,如概率计算、组合数学等。
在数学推理基准测试中表现优异,超越 GPT-4o 和 Claude 3.5 Sonnet。
研究
数学解决方案评估
使用奖励模型对数学解决方案进行评估和评分。
在推理基准测试中创下 rm@8 准确率(8 选最佳)的新纪录。
AIbase
智启未来,您的人工智能解决方案智库
简体中文