C

Camembert Base Lleqa

由 maastrichtlawtech 开发
基于CamemBERT的法语句子嵌入模型,专门针对法语法律信息检索任务优化,可将文本转换为768维向量空间表示。
下载量 25
发布时间 : 9/28/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于法语法律问答数据集LLeQA微调的句子嵌入模型,适用于法律条款检索、语义相似度计算等任务,能够有效处理法语法律文本。

模型特点

法律领域优化
专门针对法语法律文本进行微调,在比利时法规检索任务中表现优异
高效语义编码
可将任意长度句子/段落编码为固定768维稠密向量,适用于大规模检索
对比学习训练
采用问答-条款对比学习目标,增强模型区分相关法律条款的能力

模型能力

法语句子嵌入
语义相似度计算
法律条款检索
文本特征提取

使用案例

法律信息检索
公民法律问答系统
根据自然语言问题自动检索相关法律条款
在测试集上达到58.27%的R@10召回率
法规条款聚类
对法律条文进行语义聚类分析
文档处理
法律文件相似度比对
计算不同法律文档间的语义相似度