D

Dpr Question Encoder Fr Qa Camembert

由 AgentPublic 开发
基于CamemBERT的法语DPR模型,专为法语问答任务优化,在PIAF、FQuAD和SQuAD-FR数据集上微调
下载量 229
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个密集段落检索(DPR)的问句编码器,用于法语问答系统,能够将问题编码为高维向量以便检索相关段落。

模型特点

法语优化
专门针对法语问答任务进行优化,在三个主要法语问答数据集上微调
密集检索
采用密集段落检索(DPR)方法,相比传统BM25能捕捉更深层次的语义关系
困难负例训练
训练时使用困难负例策略,提高了模型区分相关与不相关段落的能力

模型能力

法语问题编码
语义相似度计算
段落检索

使用案例

问答系统
法语开放域问答
在法语问答系统中作为检索组件,快速找到可能包含答案的段落
在前20个候选段落中达到86-89%的召回率
文档检索
用于法语文档集合中的相关内容检索