M

Ms Marco TinyBERT L2 V2

由 cross-encoder 开发
基于MS Marco段落排序任务训练的轻量级交叉编码器,用于信息检索中的查询-段落相关性评分
下载量 247.59k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于信息检索任务,能够对查询和段落的相关性进行评分,适用于搜索引擎结果的重排序场景。基于BERT-Tiny架构优化,在保持较高性能的同时具有极快的推理速度。

模型特点

高效轻量
基于TinyBERT架构,模型体积小且推理速度快(9000文档/秒)
精准排序
在TREC 2019 DL和MS Marco数据集上表现出色,NDCG@10达69.84
即插即用
兼容HuggingFace Transformers和SentenceTransformers库,易于集成

模型能力

查询-段落相关性评分
搜索结果重排序
信息检索

使用案例

搜索引擎优化
搜索结果重排序
对ElasticSearch等检索系统返回的初步结果进行精细化排序
提升搜索结果的相关性排序质量
问答系统
答案段落筛选
从候选答案段落中筛选最相关的结果
提高问答系统的准确率