T

T5 Xxl Ssm Tqa

由 google 开发
谷歌T5模型用于闭卷问答任务,通过预训练和微调在Trivia QA数据集上实现高性能。
下载量 19
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于T5架构,首先在C4数据集上进行预训练,随后在维基百科上进行显著跨度掩码目标的额外预训练,最后在Trivia QA数据集上进行微调,专门用于闭卷问答任务。

模型特点

多阶段训练
模型经过C4数据集预训练、维基百科显著跨度掩码目标训练和Trivia QA微调三阶段训练。
闭卷问答能力
模型能够在无需外部知识源的情况下直接回答问题。
大规模预训练
基于T5架构的大规模预训练语言模型,具有强大的知识表示能力。

模型能力

闭卷问答
知识检索
文本生成

使用案例

知识问答
事实性问题回答
回答历史、科学等领域的客观事实问题
在Trivia QA测试集上达到61.6%的精确匹配率