M

Msmarco MiniLM L12 En De V1

由 cross-encoder 开发
基于MS Marco段落排序任务训练的英德跨语言交叉编码器模型,适用于信息检索场景的段落重排序。
下载量 19.62k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个用于段落重排序的英德跨语言交叉编码器,基于MS Marco段落排序任务训练而成,支持英语和德语的信息检索场景。

模型特点

跨语言支持
支持英语和德语的双语信息检索和段落重排序。
高性能重排序
在TREC-DL19和GermanDPR等基准测试中表现出色,显著优于BM25基线。
高效推理
在V100 GPU上每秒可处理900对(查询,文档),适合大规模检索场景。

模型能力

文本排序
跨语言信息检索
段落重排序

使用案例

信息检索
搜索引擎结果重排序
对BM25等传统检索方法返回的结果进行语义重排序,提升结果相关性。
在TREC-DL19英英检索中NDCG@10达到72.94,显著优于BM25的45.46。
跨语言检索
支持德语查询对英语文档的检索排序,或反之。
在TREC-DL19德英检索中NDCG@10达到66.07。