O

Openelm 270M

由 apple 开发
OpenELM是一组开源高效语言模型,采用分层缩放策略在Transformer模型的每一层中高效分配参数,提升准确性。
下载量 4,719
发布时间 : 4/12/2024
模型介绍
内容详情
替代品

模型简介

OpenELM系列模型包括270M、450M、1.1B和3B参数的预训练及指令调优模型,提供完整训练框架和评估流程。

模型特点

分层缩放策略
在Transformer模型的每一层中高效分配参数,提升模型准确性。
完整开源框架
提供从数据准备、训练、微调到评估的完整流程,促进开放研究。
多规模选择
提供270M、450M、1.1B和3B四种参数规模的模型选择。

模型能力

文本生成
指令跟随
零样本学习

使用案例

自然语言处理
问答系统
可用于构建基于知识的问答系统。
在SciQ数据集上达到84.70%准确率
文本补全
根据提示生成连贯的文本内容。