S

Spar Wiki Bm25 Lexmodel Query Encoder

由 facebook 开发
基于BERT-base架构的密集检索器,在维基百科文章上训练,旨在模仿BM25的行为
下载量 80
发布时间 : 9/21/2022
模型介绍
内容详情
替代品

模型简介

该模型是SPAR论文中提出的词汇模型(Λ)的查询编码器部分,通过与上下文编码器配合使用,可以实现类似稀疏检索器BM25的效果。模型能够学习词汇匹配模式,可与标准密集检索器结合使用以提升检索性能。

模型特点

BM25行为模仿
通过训练模仿传统BM25稀疏检索器的行为,保留词汇匹配优势
与密集检索器互补
可与DPR等密集检索器结合,同时具备词汇和语义匹配能力
BERT-base架构
基于广泛使用的BERT-base架构,便于集成到现有系统中

模型能力

文本嵌入生成
词汇特征提取
文档检索
问答系统支持

使用案例

信息检索
开放域问答
用于构建问答系统,从大规模文档中检索相关答案
结合DPR使用时能同时捕捉词汇和语义匹配信号
文档检索
用于搜索引擎或知识库中的相关文档检索
模仿BM25行为,保留传统检索系统的优势