B

Biencoder Mminilmv2 L12 Mmarcofr

由 antoinelouis 开发
这是一个用于法语的密集单向量双编码器模型,可用于语义搜索。该模型将查询和段落映射到384维密集向量,通过余弦相似度计算相关性。
下载量 346
发布时间 : 5/22/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个基于mMiniLMv2架构的双编码器模型,专门针对法语文本的语义搜索任务进行优化。它能够将查询和段落编码为384维的密集向量,并通过计算余弦相似度来衡量它们之间的相关性。

模型特点

法语优化
专门针对法语文本进行训练和优化,在法语语义搜索任务上表现优异
高效检索
使用密集向量表示,实现高效的语义相似度计算和段落检索
高质量负样本
训练时使用了从12个不同密集检索器中挖掘的困难负样本,提高了模型区分能力

模型能力

法语文本嵌入
语义相似度计算
段落检索
信息检索

使用案例

信息检索
法语文档检索
在法语文档集合中检索与查询最相关的段落
在mMARCO-fr验证集上达到84.4%的Recall@500
问答系统
构建法语问答系统的检索组件