T

T5 Efficient Small Kv32

由 google 开发
T5-Efficient-SMALL-KV32是Google原版T5的一个变体,采用深度窄型架构,专注于提高下游任务性能。
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个仅预训练的检查点,基于T5模型架构,采用深度窄型设计,适合英语NLP任务。

模型特点

深度窄型架构
采用高瘦(深且窄)的设计,相比同等参数量的其他架构,对下游任务性能更有利。
高效预训练
在C4数据集上进行了524288步的预训练,使用跨度的掩码语言建模目标。
参数高效
仅51.08百万参数,相比标准T5模型更轻量。

模型能力

文本生成
文本摘要
问答系统
文本分类(需微调)

使用案例

文本处理
摘要生成
将长文本压缩为简洁的摘要
问答系统
基于给定文本回答问题