T

T5 Efficient Large

由 google 开发
T5-Efficient-LARGE是基于谷歌T5的变体,采用深度窄型架构优化下游任务性能,拥有7.377亿参数。
下载量 183
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于T5架构的预训练检查点,优先增加模型深度以提升效率,适用于英语NLP任务,需微调后使用。

模型特点

深度窄型架构
相比参数数量相近的其他架构,优先增加模型深度(24层)以提升下游任务效率
高效预训练
在C4数据集上训练524,288步,采用跨度的掩码语言建模目标
参数优化
全精度需约2.95GB内存,半精度仅需1.47GB,平衡性能与资源消耗

模型能力

文本生成
文本摘要
问答系统
文本分类

使用案例

文本处理
新闻摘要生成
将长篇文章压缩为简洁摘要
开放域问答
基于给定文本回答自然语言问题
内容分类
情感分析
对文本进行正面/负面情感分类