T

T5 Efficient Large Nh32

由 google 开发
T5高效大型-NH32是谷歌T5模型的深度窄型变体,专注于通过增加模型深度提升下游任务性能。
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于T5架构的预训练检查点,采用深度窄型设计策略,优先增加模型深度而非宽度,以提高参数效率。

模型特点

深度窄型架构
采用32层深度设计,相比同等参数规模的传统架构更高效
参数高效
通过优化深度与宽度的比例,在相同参数数量下获得更好的性能
预训练基础
在C4数据集上进行大规模预训练,提供强大的语言理解能力

模型能力

文本生成
文本摘要
问答系统
文本分类
机器翻译

使用案例

文本处理
文档摘要
将长文档自动压缩为简洁摘要
问答系统
基于给定文本回答用户问题
内容生成
文本改写
保持语义不变的情况下重写文本