T

T5 Efficient Tiny Ff12000

由 google 开发
T5-Efficient-TINY-FF12000是Google原始T5的一个变体,采用深度窄型架构,在参数数量相近的模型中表现出更优的下游任务性能。
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个仅预训练的检查点,采用深度窄型策略优先增加模型深度,基于T5模型架构,适用于英语NLP任务。

模型特点

深度窄型架构
优先增加模型深度而非宽度,在相同参数数量下提供更好的下游任务性能
高效预训练
在C4数据集上进行524288步的跨度的掩码语言建模预训练
紧凑模型尺寸
仅61.72M参数,适合资源受限环境部署

模型能力

文本生成
文本摘要
问答系统
文本分类(需微调)

使用案例

文本处理
自动摘要生成
将长文档自动压缩为简洁摘要
问答系统
基于给定文本回答问题