O

Openelm 1 1B Instruct

由 apple 开发
OpenELM是一组开源高效语言模型,采用分层缩放策略在Transformer模型的每一层中高效分配参数,从而提升模型精度。
下载量 1.5M
发布时间 : 4/12/2024
模型介绍
内容详情
替代品

模型简介

OpenELM系列包含2.7亿、4.5亿、11亿和30亿参数的预训练及指令调优模型,完整开源了训练框架和评估流程。

模型特点

分层缩放策略
在Transformer模型的每一层中高效分配参数,提升模型精度
完整开源框架
提供从数据准备、训练、微调到评估的完整流程
多规模选择
提供从2.7亿到30亿参数的不同规模模型
指令调优版本
提供经过指令优化的模型版本,适合对话和指令跟随任务

模型能力

文本生成
指令理解
问答系统
语言理解

使用案例

教育
智能问答系统
用于教育领域的知识问答和解释
在SciQ数据集上达到90.6%准确率
研究
语言模型研究
作为基础模型供研究人员进行实验和改进
提供完整的训练框架和评估流程