P

Polish Reranker Large Ranknet

由 sdadas 开发
这是一个采用RankNet损失函数训练的波兰文本排序模型,训练数据集包含140万条查询和1000万份文档组成的文本对。
下载量 337
发布时间 : 2/3/2024
模型介绍
内容详情
替代品

模型简介

该模型主要用于波兰语文本的排序和重排任务,能够评估查询与文档的相关性并进行排序。

模型特点

高效训练方法
采用RankNet损失函数训练,基于查询和文档对计算损失,而非独立处理查询-文档对
优异性能表现
在波兰信息检索基准测试中表现优于教师模型,尽管参数量仅为教师模型的1/30,推理速度快33倍
多样化训练数据
训练数据包含波兰语MS MARCO训练集、翻译为波兰语的ELI5数据集和波兰语医疗问答集

模型能力

文本相关性评估
查询-文档排序
信息检索结果重排

使用案例

信息检索
搜索引擎结果优化
对搜索引擎返回的结果进行重排,提高最相关结果的排名
在波兰信息检索基准测试中NDCG@10达到62.65
问答系统
问答相关性排序
对问答系统返回的多个答案进行相关性排序