O

Olmo 7B Instruct

由 allenai 开发
OLMo 7B Instruct是基于Dolma数据集训练的开放语言模型,经过SFT和DPO优化,专为问答任务设计。
下载量 365
发布时间 : 2/23/2024
模型介绍
内容详情
替代品

模型简介

OLMo系列是开放语言模型,旨在推动语言模型科学研究。7B Instruct版本通过微调技术优化了问答性能。

模型特点

开放研究
公开所有训练代码、检查点和模型细节,推动科学研究
优化问答性能
通过SFT和DPO微调技术显著提升问答任务表现
低毒性输出
相比基础模型,毒性输出比例从81.4%降至1.7%

模型能力

英文文本生成
问答系统
指令跟随

使用案例

教育研究
语言模型研究
用于研究语言模型的行为和性能
提供完全透明的训练过程和模型细节
智能助手
问答系统
构建知识问答应用
在TruthfulQA上准确率达到52%