R

Reranker Gte Multilingual Base Msmarco Bce Ep 2

由 skfrost19 开发
基于sentence-transformers库在msmarco数据集上训练的交叉编码器模型,用于文本重排序和语义搜索
下载量 28
发布时间 : 4/6/2025
模型介绍
内容详情
替代品

模型简介

该模型计算文本对的分数,可用于文本重排序和语义搜索任务。它是在199万条训练样本上使用二元交叉熵损失函数训练得到的。

模型特点

高性能重排序
在NanoMSMARCO_R100数据集上达到0.7008的NDCG@10分数,表现优异
大规模训练
使用199万条训练样本进行训练,具有强大的语义理解能力
长文本支持
最大支持8192个标记的序列长度,适合处理长文本

模型能力

文本对评分
语义搜索
搜索结果重排序

使用案例

信息检索
搜索引擎结果重排序
对搜索引擎返回的结果进行重新排序,提升相关性
在MSMARCO数据集上NDCG@10达到0.7008
问答系统
答案相关性排序
对候选答案进行相关性排序,选择最佳答案
在NanoNQ_R100数据集上NDCG@10达到0.6888