G

GTE ModernColBERT V1

由 lightonai 开发
PyLate是一个基于ColBERT架构的句子相似度模型,采用Alibaba-NLP/gte-modernbert-base作为基础模型,通过蒸馏损失训练,适用于信息检索任务。
下载量 157.96k
发布时间 : 4/30/2025
模型介绍
内容详情
替代品

模型简介

该模型专注于句子相似度计算和信息检索任务,能够高效提取句子特征并进行相似度匹配。

模型特点

高效的句子特征提取
基于ColBERT架构,能够高效提取句子特征,适用于大规模信息检索。
蒸馏训练
采用蒸馏损失训练方法,提升模型性能。
多指标评估
支持多种评估指标,包括准确率、召回率、NDCG等,全面衡量模型性能。

模型能力

句子相似度计算
信息检索
特征提取

使用案例

信息检索
气候相关事实检索
在NanoClimateFEVER数据集上进行气候相关事实检索。
Accuracy@1达到0.36,Accuracy@10达到0.86
百科知识检索
在NanoDBPedia数据集上进行百科知识检索。
Accuracy@1达到0.88,Accuracy@10达到0.98
事实核查
在NanoFEVER数据集上进行事实核查任务。
Accuracy@1达到0.92,Accuracy@10达到1.0
问答系统
金融问答
在NanoFiQA2018数据集上进行金融问答任务。
Accuracy@1达到0.56,Accuracy@10达到0.8
复杂问答
在NanoHotpotQA数据集上进行复杂问答任务。
Accuracy@1达到0.92,Accuracy@10达到1.0