D

Distilbert Dot Tas B B256 Msmarco

由 sebastian-hofstaetter 开发
基于DistilBert的双编码器点积评分架构,通过平衡主题感知采样在MSMARCO-Passage数据集上训练,适用于密集检索和候选集重排序
下载量 3,188
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个高效的密集段落检索系统,通过知识蒸馏和主题感知采样训练,在信息检索任务中表现出色

模型特点

平衡主题感知采样
采用创新的TAS-B训练方法,优化了训练数据的采样分布
高效训练
单消费级GPU仅需48小时即可完成训练
双重监督机制
结合BERT_CAT配对分数和ColBERT模型提供的批内负样本信号
共享编码架构
查询和段落编码共享相同的BERT层,提高效率并降低内存需求

模型能力

密集段落检索
候选集重排序
语义相似度计算

使用案例

信息检索
搜索引擎结果重排序
对传统检索系统返回的结果进行语义重排序
在MSMARCO-DEV上MRR@10达到0.347
端到端密集检索
直接用于基于向量索引的密集检索系统
在TREC-DL'19上召回率@1K达到0.843