T

T5 Efficient Small

由 google 开发
T5-Efficient-SMALL是Google原版T5的一个变体,采用深度窄型架构,在参数数量相近的情况下,下游任务性能优于其他架构。
下载量 1,032
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个仅预训练的检查点,基于T5模型架构,采用深度窄型设计,优先增加模型深度以提高效率。适用于英语NLP任务,需微调后使用。

模型特点

深度窄型架构
优先增加模型深度而非宽度,在相同参数数量下提供更好的下游任务性能
高效预训练
在C4数据集上进行了524,288步的预训练,使用跨度的掩码语言建模目标
参数效率
通过优化架构设计,在较小参数规模下仍保持良好性能

模型能力

文本生成
文本摘要
问答系统
文本分类

使用案例

文本处理
摘要生成
对长文本生成简洁摘要
问答系统
基于给定文本回答问题
文本分类
情感分析
对文本进行情感倾向分类