O

Olmo 2 0425 1B SFT

由 allenai 开发
OLMo 2 1B SFT是基于OLMo-2-0425-1B模型的监督微调版本,在Tulu 3数据集上训练,旨在实现多种任务的最先进性能。
下载量 1,759
发布时间 : 4/24/2025
模型介绍
内容详情
替代品

模型简介

这是一个开放语言模型,主要用于英语文本生成任务,基于Apache 2.0许可证发布,适合研究和教育用途。

模型特点

开放语言模型
完全开放源代码、权重和训练数据,推动语言模型科学研究
多任务优化
在Tulu 3数据集上微调,优化了MATH、GSM8K和IFEval等多种任务性能
透明训练
公开所有训练代码、检查点和日志,确保研究可复现性

模型能力

文本生成
对话系统
数学问题解答
事实问答

使用案例

教育
数学问题解答
解答GSM8K和MATH数据集中的数学问题
在GSM8K上达到52.1分,MATH上13.2分
研究
语言模型研究
用于语言模型行为和能力的研究