R

Rho Math 1b V0.1

由 microsoft 开发
Rho-1是一个专注于数学领域的语言模型,通过选择性语言建模(SLM)方法进行预训练,显著提升了数学问题解决的准确率。
下载量 1,451
发布时间 : 4/11/2024
模型介绍
内容详情
替代品

模型简介

Rho-1基础模型采用选择性语言建模(SLM)进行预训练,仅筛选与目标分布对齐的优质有效标记进行训练,在数学任务上表现出色。

模型特点

选择性语言建模(SLM)
仅筛选与目标分布对齐的优质有效标记进行训练,提高训练效率和模型性能
高效训练
仅需5-10倍训练时间即可达到基线性能,显著减少计算资源消耗
数学专精
在GSM8k和MATH数据集上表现优异,少样本准确率提升超过16%

模型能力

数学问题求解
少样本学习
思维链推理

使用案例

教育
数学问题解答
帮助学生解决各类数学问题
在GSM8k数据集上达到36.2%的少样本准确率
研究
数学推理研究
用于研究语言模型的数学推理能力
在MATH数据集上达到15.6%的少样本准确率