G

Gpt Neox 20b

由 EleutherAI 开发
GPT-NeoX-20B是一个拥有200亿参数的开源自回归语言模型,基于GPT-3架构设计,在the Pile数据集上训练而成。
下载量 345.06k
发布时间 : 4/7/2022
模型介绍
内容详情
替代品

模型简介

GPT-NeoX-20B是一个大型英语语言模型,主要用于研究目的,能够生成连贯的文本并学习语言内部表示。

模型特点

大规模参数
拥有200亿参数,提供强大的语言理解和生成能力
开源模型
基于Apache 2.0许可证发布,允许研究和商业用途
GPT-3架构
采用与GPT-3相似的Transformer架构设计
旋转位置嵌入
使用RoPE(Rotary Position Embedding)进行位置编码

模型能力

英语文本生成
语言理解
文本补全
语言特征提取

使用案例

研究
语言模型研究
用于研究大规模语言模型的行为和特性
下游任务特征提取
作为基础模型提取特征用于其他NLP任务
应用开发
文本生成应用
经过微调后可用于开发文本生成类应用