O

Open Llama 3b

由 openlm-research 开发
OpenLLaMA是Meta AI LLaMA大语言模型的开源复现版本,提供3B、7B和13B参数规模的预训练模型
下载量 26.20k
发布时间 : 6/7/2023
模型介绍
内容详情
替代品

模型简介

基于RedPajama数据集训练的开放权重语言模型,完全复现LLaMA架构和训练方法,适用于文本生成和语言理解任务

模型特点

开源复现
完全复现Meta AI的LLaMA模型架构和训练方法,但使用开放数据集和宽松许可证
多规模选择
提供3B、7B和13B三种参数规模的模型版本,适应不同计算需求
高性能训练
使用TPU-v4集群训练,优化训练吞吐量达到每芯片2200+token/秒
完整训练流程
包含从零开始训练的分词器和模型权重,无需依赖原始LLaMA资源

模型能力

文本生成
问答系统
语言理解
少样本学习

使用案例

教育研究
学术问答
回答科学、历史等领域的知识性问题
在多项评估中表现与原始LLaMA相当
内容创作
文本续写
根据给定提示生成连贯的文本内容