T

T5 Efficient Small El2

由 google 开发
T5-Efficient-SMALL-EL2是Google原版T5的一个变体,采用深度窄型架构,优先增加模型深度以提高下游性能。
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个仅预训练的检查点,基于T5模型架构,采用深度窄型设计策略,适合英语NLP任务。

模型特点

深度窄型架构
优先增加模型深度而非宽度,提高下游任务性能效率
高效预训练
在C4数据集上使用跨度的掩码语言建模目标进行预训练
参数优化
47.93M参数设计,平衡性能与计算资源需求

模型能力

文本生成
文本摘要
问答系统
文本分类(需微调)

使用案例

文本处理
新闻摘要生成
将长篇文章自动摘要为简短内容
开放域问答
回答基于文本内容的自然语言问题
内容生成
文本改写
保持语义不变的情况下重写文本