O

Openelm 450M Instruct

由 apple 开发
OpenELM是一组开源高效语言模型,采用分层缩放策略优化参数分配,包含2.7亿至30亿参数的预训练及指令调优版本。
下载量 114.41k
发布时间 : 4/12/2024
模型介绍
内容详情
替代品

模型简介

OpenELM系列模型通过分层缩放策略提升Transformer模型效率,提供从2.7亿到30亿参数的不同规模版本,适用于多种自然语言处理任务。

模型特点

分层缩放策略
在Transformer各层中智能分配参数,显著提升模型效率
完整开源框架
提供从数据准备到评估的全流程工具链,促进开放研究
多规模选择
提供2.7亿至30亿参数的不同规模模型,适应多样化需求

模型能力

文本生成
指令跟随
零样本学习

使用案例

内容创作
故事续写
根据给定开头自动生成连贯的故事内容
示例中展示了'从前有座山'的续写能力
研究开发
语言模型研究
可作为高效模型架构研究的基线模型
技术报告中包含与其他模型的对比数据