T

T5 Efficient Tiny Nl2

由 google 开发
T5-Efficient-TINY-NL2是Google原版T5的一个变种,采用深度窄型架构,专注于提高下游任务性能。
下载量 334
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个仅预训练的检查点,采用深度窄型架构,优先增加模型深度以提高效率。适用于英语NLP任务,需要针对具体应用进行微调。

模型特点

深度窄型架构
优先增加模型深度而非宽度,提高下游任务性能效率。
高效预训练
在C4数据集上进行了524288步的预训练,使用跨度的掩码语言建模目标。
轻量级
仅1190万参数,内存占用小,适合资源有限的环境。

模型能力

文本生成
问答
摘要生成
文本分类

使用案例

文本处理
摘要生成
对长文本生成简洁摘要。
问答系统
根据给定文本回答问题。
分类任务
文本分类
对文本进行类别标注。