R

Reason ModernColBERT

由 lightonai 开发
基于ReasonIR数据训练的延迟交互模型,在BRIGHT基准测试中表现出色,超越多个大型模型
下载量 798
发布时间 : 5/22/2025
模型介绍
内容详情
替代品

模型简介

这是一个基于lightonai/GTE-ModernColBERT-v1微调而来的PyLate模型,使用reasonir-hq数据集训练。它将句子和段落映射为128维密集向量序列,可用于语义文本相似性计算。

模型特点

延迟交互机制
采用延迟交互机制,相比密集检索模型在推理密集型检索任务中表现更优
高效性能
在BRIGHT基准测试中超越多个大型模型,包括比其大45倍的模型
多向量表示
将文本映射为128维密集向量序列,而非单一向量表示

模型能力

语义文本相似性计算
信息检索
文档重排序

使用案例

信息检索
专业领域检索
在生物学、地球科学等专业领域进行高效信息检索
在BRIGHT基准测试中多个领域表现优异
技术问答检索
针对Stack Overflow等技术问答平台的内容检索
在Stack Exchange分割测试中表现突出
文档处理
文档重排序
对初步检索结果进行精细化重排序
提供更相关的文档排序