C

Crossencoder Camembert Large Mmarcofr

由 antoinelouis 开发
这是一个法语交叉编码器模型,专门用于语义搜索中的段落重排序任务。
下载量 108
发布时间 : 5/3/2024
模型介绍
内容详情
替代品

模型简介

该模型对问题-段落对执行交叉注意力计算,输出相关性分数,主要用于语义搜索的重新排序阶段。

模型特点

高效重排序
对第一阶段检索系统返回的候选段落进行高效重排序,提升搜索结果质量
跨注意力机制
采用交叉注意力计算问题与段落间的相关性
高质量训练数据
使用包含260万训练三元组的数据集,包含难负例样本

模型能力

文本相关性评分
语义搜索优化
法语文本处理

使用案例

信息检索
搜索引擎结果重排序
对搜索引擎初步检索结果进行重新排序,提升结果相关性
在mMARCO-fr数据集上Recall@500达到97.33
问答系统
从候选答案中选择最相关的段落
Recall@10达到62.61