T

T5 Large Ssm

由 google 开发
基于T5架构的闭卷问答模型,通过预训练和增量训练实现无需外部知识源的问答能力
下载量 75
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用T5架构,首先在C4数据集上进行预训练,然后在维基百科上进行增量训练,专门用于闭卷问答任务。需要在下游任务上微调后才能使用。

模型特点

闭卷问答能力
无需依赖外部知识源或上下文,直接从模型参数中检索知识回答问题
两阶段训练
先在C4数据集上进行标准去噪预训练,后在维基百科上进行显著片段掩码增量训练
可扩展性
研究表明模型性能随规模提升,与开放域问答系统表现相当

模型能力

知识检索
问答生成
文本理解

使用案例

教育
知识问答系统
构建无需接入外部知识库的智能问答系统
与依赖检索的开放域系统表现相当
研究
知识封装研究
研究语言模型参数中封装的知识量
验证了模型参数能有效存储和检索知识