O

Open Llama 13b

由 openlm-research 开发
OpenLLaMA是Meta AI LLaMA大语言模型的开源复现版本,提供30亿、70亿和130亿参数的预训练模型
下载量 1,300
发布时间 : 6/15/2023
模型介绍
内容详情
替代品

模型简介

开源复现的LLaMA大语言模型,基于1万亿token训练,提供多种参数规模的预训练模型,适用于文本生成等自然语言处理任务

模型特点

开源复现
完全复现Meta AI的LLaMA模型,采用宽松的Apache 2.0许可协议
多参数规模
提供30亿、70亿和130亿三种参数规模的模型选择
高质量训练数据
使用RedPajama数据集(1.2万亿token)训练,遵循原始LLaMA预处理步骤
多框架支持
提供适配Hugging Face transformers和EasyLM框架的权重文件

模型能力

文本生成
少样本学习
自然语言理解

使用案例

自然语言处理
问答系统
构建自动问答系统,回答用户提出的各种问题
在多项基准测试中表现与原始LLaMA相当
文本生成
生成连贯、有意义的文本内容
能够生成32个以上的新token