C

Colbert ModernBERT Base Turkish Uncased

由 99eren99 开发
这是一个基于PyLate从ModernBERT-base-Turkish-uncased-mlm微调的土耳其语模型,用于句子相似度计算和文档重排序。
下载量 74
发布时间 : 2/14/2025
模型介绍
内容详情
替代品

模型简介

该模型将句子和段落映射为128维密集向量序列,支持使用MaxSim操作符进行语义文本相似度计算,适用于土耳其语文本检索和重排序任务。

模型特点

长上下文处理
支持长达8192 token的文档处理,适合长文本检索场景
高效检索
利用Voyager HNSW索引实现快速文档检索
多粒度表示
生成128维密集向量序列,保留文本的细粒度语义信息

模型能力

语义文本相似度计算
文档检索
查询-文档匹配
搜索结果重排序

使用案例

信息检索
文档搜索引擎
构建土耳其语文档搜索引擎,提高搜索结果相关性
nDCG和召回率指标提升
问答系统
用于问答系统中答案候选的重排序
提高答案准确率