B

Biencoder Electra Base Mmarcofr

由 antoinelouis 开发
这是一个用于法语的密集单向量双编码器模型,可用于语义搜索。该模型将查询和段落映射到768维密集向量,通过余弦相似度计算相关性。
下载量 31
发布时间 : 5/22/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于ELECTRA架构的法语句子相似度模型,专门用于段落检索任务,能够高效计算查询与段落之间的语义相关性。

模型特点

法语优化
专门针对法语文本进行优化,基于法语ELECTRA模型和mMARCO数据集训练
高效检索
采用单向量双编码器架构,实现高效的语义搜索和段落检索
硬负样本训练
使用从多个密集检索器中挖掘的硬负样本进行训练,提高模型区分能力

模型能力

法语句子嵌入
语义相似度计算
段落检索
信息检索

使用案例

信息检索
文档检索系统
构建法语文档检索系统,根据用户查询返回最相关的文档段落
在mMARCO-fr验证集上Recall@500达到81.6%
问答系统
作为问答系统的检索组件,快速找到与问题相关的候选答案段落