T

Turkish Colbert

由 ytu-ce-cosmos 开发
基于ColBERT架构的土耳其语段落检索模型,在土耳其语翻译版MS MARCO数据集上微调
下载量 1,724
发布时间 : 12/3/2024
模型介绍
内容详情
替代品

模型简介

这是一个基于ColBERT架构的土耳其语段落检索模型,专门用于土耳其语的段落检索任务。模型在土耳其语翻译版MS MARCO数据集的50万组三元数据上进行了微调。

模型特点

土耳其语优化
专门针对土耳其语优化的段落检索模型,基于土耳其语基础BERT模型微调
高效检索
采用ColBERT架构,提供高效的段落检索能力
大小写处理
提供特殊的大小写处理方案,解决土耳其语特有的'I'字符问题

模型能力

土耳其语段落检索
句子相似度计算
文档索引与搜索

使用案例

信息检索
科学文献检索
从科学文献数据库中检索相关信息
在Scifact-tr数据集上达到48.38的R@1召回率
百科知识检索
从百科知识库中检索相关信息
在WikiRAG-TR数据集上达到31.21的R@1召回率