B

Bert Large Portuguese Cased Legal Tsdae Gpl Nli Sts MetaKD V0

由 stjiris 开发
这是一个基于BERTimbau的大型葡萄牙语法律领域句子转换器模型,专门用于处理法律文本的语义相似度任务。
下载量 63
发布时间 : 3/3/2023
模型介绍
内容详情
替代品

模型简介

该模型将句子和段落映射到1024维的密集向量空间,可用于聚类或语义搜索等任务。它是BERTimbau大型模型的法律领域变体,经过TSDAE技术训练,并在NLI和STS任务上进行了微调。

模型特点

法律领域优化
专门针对葡萄牙语法律文本进行优化,在最高法院语义搜索系统中表现优异
元数据知识蒸馏
采用元数据知识蒸馏技术,通过密集向量改进信息检索效果
多阶段训练
先通过TSDAE无监督训练,再进行NLI和STS任务的微调

模型能力

句子嵌入生成
语义相似度计算
法律文本分析
信息检索

使用案例

法律信息检索
最高法院案例搜索
用于构建葡萄牙最高法院的语义搜索系统
相比BM25方法,首条查询结果的发现指标提高了335%
法律文本分析
法律文件相似度分析
计算不同法律文件或判决书之间的语义相似度