T

T5 Efficient Tiny

由 google 开发
T5-Efficient-TINY是谷歌T5模型的深度窄型变体,专注于通过增加模型深度而非宽度来提升下游任务性能。
下载量 8,337
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个仅预训练的T5模型检查点,采用深度窄型架构设计,适用于英语NLP任务的微调。

模型特点

深度窄型架构
优先增加模型深度而非宽度,在相同参数规模下提供更好的下游任务性能
高效预训练
在C4数据集上进行了524,288步的跨度的掩码语言建模预训练
紧凑尺寸
仅15.58M参数,全精度下约62.32MB内存占用,适合资源有限环境

模型能力

文本生成
文本摘要
问答系统
文本分类(需调整)

使用案例

文本处理
新闻摘要生成
将长篇文章自动压缩为简洁摘要
开放域问答
基于给定文本回答用户问题