T

T5 Xxl Ssm

由 google 开发
基于T5架构的闭卷问答模型,通过去噪和显著跨度掩码目标预训练,适用于无需外部知识源的问答任务。
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用T5架构,先在C4数据集上进行去噪预训练,后在维基百科上采用REALM的显著跨度掩码目标进行额外预训练,专门用于闭卷问答场景。

模型特点

双重预训练策略
先在C4数据集上进行去噪预训练,后在维基百科上采用显著跨度掩码目标进行额外预训练,增强知识存储和检索能力。
闭卷问答能力
无需依赖外部知识源,直接从模型参数中检索答案,实现高效问答。
可扩展性
研究表明模型效果随规模提升,性能与开放域问答系统相当。

模型能力

闭卷问答
知识检索
自然语言理解

使用案例

教育
知识问答系统
用于构建无需外部知识库的自动问答系统,直接回答用户问题。
性能与依赖外部知识源的开放域系统相当
研究
语言模型知识存储研究
研究语言模型参数中存储知识的能力和机制。
为后续研究提供基准模型和代码