T

T5 Efficient Large Dm2000

由 google 开发
T5高效大型-DM2000是谷歌T5模型的一个变体,采用深度窄型架构,优先增加模型深度以提高下游任务性能。
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个仅预训练的检查点,基于T5模型架构,采用深度窄型设计,旨在提高模型效率。需要在特定任务上进行微调后才能使用。

模型特点

深度窄型架构
优先增加模型深度而非宽度,相比参数数量相似的模型架构,对下游任务性能更有利
高效预训练
在C4数据集上进行了524288步的预训练,使用基于跨度的掩码语言建模目标
参数效率
通过深度窄型设计,在相同参数规模下提供更好的性能

模型能力

文本生成
文本摘要
问答系统
文本分类

使用案例

自然语言处理
文本摘要
将长文档压缩为简洁摘要
问答系统
基于给定文本回答问题
文本分类
对文本进行分类或标记