D

Dpr Question Encoder Multiset Base

由 facebook 开发
基于BERT的密集段落检索(DPR)问题编码器,用于开放领域问答研究,在多个QA数据集上训练
下载量 17.51k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是DPR工具集中的问题编码器,用于将自然语言问题编码为低维向量表示,以便在开放领域问答任务中检索相关段落。

模型特点

多数据集训练
在自然问题(NQ)、TriviaQA、网页问题(WQ)和精选TREC(TREC)四个QA数据集上联合训练,具有更强的泛化能力
密集向量表示
将问题和段落编码为低维连续空间中的密集向量,支持高效的相似度计算和检索
与FAISS兼容
生成的向量表示可直接用于FAISS等高效相似度搜索库,实现大规模段落检索

模型能力

问题向量化表示
语义相似度计算
开放领域问答支持

使用案例

问答系统
开放领域问答
构建能够回答任意领域问题的系统,先检索相关段落再生成答案
在NQ数据集上top-100准确率达到86%
知识检索
从大规模文档集合中检索与问题最相关的段落