math-shepherd-mistral-7b-rl开源模型 - 免费部署，高效求解各类数学问题

首页

Math Shepherd Mistral 7b Rl

由 peiyi9979 开发

基于Math-Shepherd逐步强化学习的数学问题求解模型，在GSM8K和MATH数据集上表现优异

大型语言模型

Transformers

#数学推理强化 #逐步解答生成 #自生成题库优化

下载量 44

发布时间 : 1/3/2024

模型简介

该模型通过逐步强化学习训练，专门用于解决数学问题，能够生成带步骤标记的详细解答

模型特点

逐步强化学习

采用Math-Shepherd方法进行逐步强化学习训练，提高数学推理能力

高通过率

在GSM8K和MATH数据集上分别达到84.1%和33.0%的单次通过率

结构化输出

生成带特殊步骤标记的逐步解答，便于解析和理解推理过程

模型能力

数学问题求解

逐步推理

数值计算

应用题解答

使用案例

教育

数学辅导

帮助学生理解数学问题的解决过程

提供详细的步骤解释

自动评分

评估学生数学解答的正确性

通过逐步分析判断解题过程

研究

数学推理研究

研究大型语言模型的数学推理能力

在标准数据集上提供基准性能

数据集	Pass@1 准确率
GSM8K	84.1
MATH	33.0

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Math Shepherd Mistral 7b Rl

模型简介

模型特点

模型能力

使用案例

🚀 Mistral-7b-MetaMATH

🚀 快速开始

模型信息

准确率指标

输入格式

输出格式

引用信息