M

Modernbert Base ColBERT

由 Y-J-Ju 开发
这是一个从answerdotai/ModernBERT-base在MS-MARCO数据集上微调的PyLate模型,用于句子相似度计算和文档检索。
下载量 88
发布时间 : 1/3/2025
模型介绍
内容详情
替代品

模型简介

该模型将句子和段落映射为128维密集向量序列,使用MaxSim算子进行语义文本相似度计算,适用于信息检索和重排序任务。

模型特点

高效检索
利用Voyager HNSW索引实现快速文档检索
多向量表示
生成128维密集向量序列而非单一向量,保留更多语义信息
蒸馏训练
使用蒸馏损失函数进行训练,提升模型性能

模型能力

语义相似度计算
文档检索
查询重排序
特征提取

使用案例

信息检索
文档搜索
在文档集合中检索与查询最相关的文档
在MS-MARCO等标准检索数据集上表现良好
搜索结果重排序
对初步检索结果进行精细化排序
可提升检索系统的准确率和相关性