T

T5 Efficient Small Dm768

由 google 开发
T5-Efficient-SMALL-DM768 是 Google 原始 T5 的一个变体,采用深度窄型架构,优先增加模型深度以提高下游性能。
下载量 49
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个仅预训练的检查点,采用深度窄型策略优化,适用于英语 NLP 任务,需要微调后才能实际使用。

模型特点

深度窄型架构
优先增加模型深度而非宽度,优化下游任务性能。
高效预训练
在 C4 数据集上预训练,使用跨度的掩码语言建模目标。
参数高效
相比同等参数量的其他架构,在性能上更具优势。

模型能力

文本生成
文本摘要
问答系统
文本分类

使用案例

文本处理
文本摘要
生成输入文本的简洁摘要。
问答系统
根据上下文回答问题。
分类任务
文本分类
对文本进行分类。