B

Biencoder Distilcamembert Mmarcofr

由 antoinelouis 开发
这是一个用于法语的密集单向量双编码器模型,可用于语义搜索。该模型将查询和段落映射到768维密集向量,通过余弦相似度计算相关性。
下载量 160
发布时间 : 5/22/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于DistilCamemBERT的双编码器模型,专门针对法语信息检索任务优化,能够高效计算查询与段落之间的语义相似度。

模型特点

法语优化
专门针对法语文本优化的语义检索模型
高效检索
采用768维密集向量表示,支持快速余弦相似度计算
难负样本挖掘
训练时使用了12个不同检索器挖掘的难负样本

模型能力

语义相似度计算
段落检索
信息检索

使用案例

信息检索
文档检索系统
构建法语文档检索系统,根据用户查询返回最相关文档
在mMARCO-fr验证集上Recall@500达到87.9
问答系统
作为问答系统的检索组件,从知识库中查找相关段落