P

Pile T5 Large

由 EleutherAI 开发
Pile-T5 Large 是基于 T5x 库在 The Pile 数据集上训练的编码器-解码器模型,主要用于英语文本到文本生成任务。
下载量 112
发布时间 : 9/1/2023
模型介绍
内容详情
替代品

模型简介

Pile-T5 Large 是一个基于 Transformer 的语言模型,通过掩码语言建模目标训练,适用于英语文本生成和特征提取任务。

模型特点

大规模训练数据
在 825GiB 的 The Pile 数据集上训练,包含多样化的英语文本来源。
编码器-解码器架构
采用 T5 风格的编码器-解码器结构,适合序列到序列任务。
长序列处理能力
支持 512 标记的序列长度,适合处理较长文本。

模型能力

文本生成
特征提取
掩码语言建模

使用案例

研究
语言模型研究
用于研究大规模语言模型的行为和特性。
下游任务特征提取
作为基础模型提取特征用于其他 NLP 任务。