T

T5 Small Ssm

由 google 开发
谷歌T5模型通过预训练实现闭卷问答功能,无需依赖外部知识源即可回答问题
下载量 88
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于T5架构,先在C4数据集上进行去噪预训练,后在维基百科数据上采用REALM的显著跨度掩码目标进行额外预训练,专门用于闭卷问答场景

模型特点

闭卷问答能力
无需外部知识源即可回答问题,答案完全来自模型内部参数存储的知识
双重预训练策略
先在C4数据集上采用标准去噪目标预训练,后在维基百科上采用REALM的显著跨度掩码目标进行知识密集型预训练
可扩展性
研究表明模型性能随规模提升,大型版本表现可与开放域问答系统媲美

模型能力

闭卷问答
知识检索
文本生成

使用案例

教育
知识问答系统
构建不依赖外部数据库的自动问答系统
可提供与显式检索系统相当的准确率
研究
知识封装研究
研究语言模型参数中能封装多少知识
验证了模型规模与知识存储能力的正相关性