S

Stella Pl Retrieval

由 sdadas 开发
这是一个基于stella_en_1.5B_v5并针对波兰语信息检索任务进一步微调的文本编码器,专门优化波兰语信息检索任务。
下载量 913
发布时间 : 9/28/2024
模型介绍
内容详情
替代品

模型简介

该模型通过多语言知识蒸馏方法适配到波兰语,并使用对比损失进行微调,将文本转换为1024维向量,特别适用于波兰语信息检索任务。

模型特点

波兰语优化
专门针对波兰语信息检索任务进行优化,通过多语言知识蒸馏和对比损失微调。
高效检索
使用1024维向量表示文本,支持高效的信息检索任务。
大规模训练
使用2000万波兰语-英语文本对进行知识蒸馏,140万条查询数据进行微调。

模型能力

文本编码
信息检索
句子相似度计算

使用案例

信息检索
波兰语文档检索
从波兰语文档库中检索相关文档
在波兰信息检索基准测试中达到NDCG@10分数为62.32
语义分析
波兰语语义相似度计算
计算波兰语文本之间的语义相似度