O

Orca Mini 3b

由 pankajmathur 开发
orca_mini_3b是基于OpenLLaMa-3B模型训练的文本生成模型,采用了来自WizardLM、Alpaca和Dolly-V2数据集的指令和输入进行解释性调优,并应用了Orca研究论文中的数据集构建方法。
下载量 4,232
发布时间 : 6/22/2023

模型简介

该模型是一个3B参数的文本生成模型,通过解释性调优方法训练,能够生成高质量的文本响应。它特别适合需要理解复杂指令并生成详细解释的应用场景。

模型特点

解释性调优
采用Orca研究论文中的方法,通过系统指令生成自定义数据集,使模型能够学习思考过程。
多数据集训练
结合了WizardLM、Alpaca和Dolly-V2数据集,提供了丰富的指令和输入样本。
高效训练
使用DeepSpeed和ZeRO阶段3优化,在8块A100 GPU上仅需4小时完成训练。

模型能力

文本生成
指令理解
解释性响应生成

使用案例

教育
教学辅助
生成详细的解释和示例,帮助学生理解复杂概念。
内容创作
文章生成
根据指令生成高质量的文章或段落。
AIbase
智启未来,您的人工智能解决方案智库
简体中文