O

Openelm 1 1B

由 apple 开发
OpenELM是由苹果公司推出的高效语言模型系列,采用分层缩放策略优化参数分配,提供270M至3B不同规模的预训练及指令调优模型。
下载量 683
发布时间 : 4/25/2025
模型介绍
内容详情
替代品

模型简介

OpenELM是一个开放的高效语言模型系列,专注于通过分层缩放策略提升模型性能,适用于多种自然语言处理任务。

模型特点

分层缩放策略
在Transformer模型的每一层中智能分配参数,提高模型效率
开放研究框架
提供完整的训练、微调和评估流程,促进开放研究
多规模选择
提供从270M到3B不同参数规模的模型版本

模型能力

文本生成
零样本学习
指令跟随

使用案例

自然语言处理
开放域问答
回答各种领域的自然语言问题
在ARC-c等基准测试中表现良好
文本补全
根据提示生成连贯的文本内容