P

Polish Reranker Large Mse

由 sdadas 开发
这是一个采用均方误差(MSE)蒸馏方法训练的波兰语文本排序模型,训练数据集包含140万条查询和1000万份文档组成的文本对。
下载量 17
发布时间 : 2/3/2024
模型介绍
内容详情
替代品

模型简介

该模型是一个波兰语文本排序模型,主要用于信息检索任务,能够对查询和文档的相关性进行排序。

模型特点

MSE蒸馏训练
采用均方误差(MSE)蒸馏方法训练,学生模型通过直接复现教师模型的输出来进行训练。
大规模训练数据
训练数据集包含140万条查询和1000万份文档组成的文本对,涵盖多种领域。
多领域适应性
训练数据包含波兰语MS MARCO训练集、翻译为波兰语的ELI5数据集以及波兰语医疗问答集,适用于多种领域。

模型能力

文本排序
信息检索
查询-文档相关性评分

使用案例

信息检索
搜索引擎结果排序
对搜索引擎返回的结果进行相关性排序,提升用户体验。
问答系统
在问答系统中对候选答案进行排序,选择最相关的答案。
医疗信息检索
医疗问答排序
对医疗相关的查询和文档进行排序,帮助用户获取最相关的医疗信息。