T

T5 Efficient Base Nl48

由 google 开发
T5-Efficient-BASE-NL48 是 Google T5 的变体,采用深度窄型架构,优先增加模型深度以提高下游任务性能。
下载量 14
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于 T5 架构的预训练检查点,采用深度窄型设计策略,在英语文本上预训练,适用于需要微调的英语 NLP 任务。

模型特点

深度窄型架构
优先增加模型深度(48层)而非宽度,相比参数数量相近的其他架构在下游任务中表现更优
高效预训练
在 C4 数据集上进行了 524288 步的跨度的掩码语言建模预训练
灵活微调
作为预训练检查点,可通过微调适应多种英语 NLP 任务

模型能力

文本生成
文本摘要
问答系统
文本分类

使用案例

文本处理
新闻摘要生成
微调后可用于自动生成新闻文章的简洁摘要
开放域问答
通过微调构建能够回答各种问题的问答系统