B

Bert Large Portuguese Cased Legal Tsdae Gpl Nli Sts V1

由 stjiris 开发
基于BERTimbau大模型的法律领域专用葡萄牙语句子转换器,支持语义相似度计算
下载量 17
发布时间 : 1/5/2023
模型介绍
内容详情
替代品

模型简介

这是一个针对葡萄牙语法律文本优化的句子转换器模型,能将句子映射到1024维向量空间,适用于法律领域的语义搜索、聚类和文本相似度计算任务。

模型特点

法律领域优化
专门针对葡萄牙语法律文本进行训练和优化,包含约3万份法律文书数据
先进训练技术
采用TSDAE(Transformer-based Sequential Denoising Auto-Encoder)技术训练,结合生成式伪标签(GPL)增强
多阶段训练
经过自然语言推理(NLI)和语义文本相似度(STS)多阶段微调
高性能
在多个葡萄牙语STS数据集上表现出色,皮尔逊相关系数达0.77-0.84

模型能力

句子嵌入生成
语义相似度计算
法律文本分析
葡萄牙语处理
文本聚类

使用案例

法律文本处理
法律文书语义搜索
在法律文档库中实现基于语义的搜索功能
在最高法院语义搜索系统中表现优异
判例相似度分析
自动计算不同判例文书之间的语义相似度
通用文本处理
文本聚类
将相似内容的葡萄牙语文档自动分组