T

T5 Efficient Base Ff9000

由 google 开发
T5-Efficient-BASE-FF9000是谷歌原版T5的变体,采用深度窄型架构,在参数规模相似的情况下,下游任务表现更优。
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于T5架构的预训练模型,采用深度窄型设计策略,优先增加模型深度以提高效率。模型在英语C4数据集上预训练,适用于各种英语NLP任务。

模型特点

深度窄型架构
采用高瘦(深且窄)的模型设计,相比基础模型更高效,在参数数量、FLOPs和速度三个关键效率指标上表现优异
高效预训练
在大规模清理版Common Crawl(C4)数据集上进行524288步预训练,使用跨度的掩码语言建模目标
灵活微调
可作为基础模型针对不同下游任务(如摘要生成、问答系统、文本分类等)进行微调

模型能力

文本生成
文本摘要
问答系统
文本分类

使用案例

文本生成
自动摘要
将长文档自动生成简洁摘要
问答系统
开放域问答
基于给定文本回答用户问题
文本分类