O

Openelm 3B Instruct

由 apple 开发
OpenELM是一组开源高效语言模型,采用分层参数分配策略提升模型精度,包含2.7亿至30亿参数的预训练及指令调优版本。
下载量 8,716
发布时间 : 4/12/2024
模型介绍
内容详情
替代品

模型简介

OpenELM是由苹果公司推出的开源高效语言模型系列,通过创新的分层参数分配策略优化Transformer层内参数分布,显著提升模型效率。该系列包含多种规模的预训练模型及经过指令微调的版本,适用于各类自然语言处理任务。

模型特点

分层参数分配
在Transformer各层中智能分配参数,相比传统均匀分配显著提升模型效率
完整开源生态
提供从数据准备到训练评估的全套工具链,包括CoreNet训练框架
多规模选择
提供从2.7亿到30亿参数的多种模型规模,满足不同计算需求
指令调优版本
除基础预训练模型外,还发布经过指令微调的版本,优化对话交互能力

模型能力

文本生成
语言理解
问答系统
指令跟随

使用案例

教育研究
学术问答
基于SciQ等科学问答数据集的优异表现,适合教育场景的知识问答应用
在SciQ数据集上达到92.7%准确率
内容生成
创意写作
利用模型的文本生成能力辅助故事创作
示例中展示了'很久很久以前...'的故事开头生成