G

Gpt1

由 lgaalves 开发
OpenAI发布的基于Transformer的语言模型,通过大规模语料库预训练而成,具有强大的文本生成能力
下载量 310
发布时间 : 9/25/2023
模型介绍
内容详情
替代品

模型简介

基于Transformer架构的因果语言模型,主要用于文本生成和语言理解任务

模型特点

长距离依赖建模
能够处理长达512个token的序列,有效捕捉长距离依赖关系
迁移学习能力
可通过微调适应多种下游NLP任务
高效预训练
采用字节对编码(BPE)词汇表,包含40,000个合并token

模型能力

文本生成
语言建模
文本分类
问答系统
语义相似度计算

使用案例

自然语言处理
文本生成
生成连贯的文本内容
可生成多种风格的文本
文本分类
对文本进行情感分析或主题分类
在SST-2情感分析数据集上达到91.3%准确率
问答系统
阅读理解
回答基于给定文本的问题
在RACE数据集上达到59.0%准确率