O

Openelm 3B

由 apple 开发
OpenELM是一组开源高效语言模型,采用分层缩放策略优化参数分配,提升模型准确率。包含270M、450M、1.1B和3B四种参数规模,提供预训练和指令调优版本。
下载量 1,436
发布时间 : 4/12/2024
模型介绍
内容详情
替代品

模型简介

开源高效语言模型系列,通过分层参数分配策略实现更优性能,适用于多种自然语言处理任务。

模型特点

分层参数分配
在Transformer各层中智能分配参数,相比传统均匀分配显著提升模型效率
全流程开源
完整公开从数据准备到模型训练、微调和评估的整套框架
多规模选择
提供从2.7亿到30亿参数的不同规模模型,适应多样化应用场景

模型能力

文本生成
零样本学习
指令跟随
语言理解

使用案例

教育
科学问答
基于SciQ等数据集的高准确率科学问题解答
3B模型在SciQ测试集达到92.7%准确率
内容创作
故事生成
根据提示词生成连贯的叙事文本
支持中文提示如'很久很久以前'的故事开头生成