R

Robertalex

由 PlanTL-GOB-ES 开发
基于西班牙法律领域语料训练的RoBERTa基础模型,专注于西班牙语法律文本处理
下载量 379
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Transformer架构的西班牙语掩码语言模型,专门针对法律领域文本进行优化,可用于填充掩码任务或作为下游任务的预训练基础

模型特点

法律领域专业化
使用8.9GB西班牙法律领域语料库进行预训练,在法律文本处理方面表现优异
高质量预处理
训练数据经过句子分割、语言检测、异常语句过滤及内容去重等严格预处理流程
多任务适应性
既可直接用于掩码填充任务,也可作为基础模型进行下游任务微调

模型能力

法律文本理解
掩码语言建模
文本特征提取
法律文本分类
法律命名实体识别

使用案例

法律文本处理
法律文本补全
自动补全法律文档中的缺失内容
示例显示能准确预测法律文本中的专业术语
法律问答系统
作为法律问答系统的基础模型
法律文档分类
对法律文档进行自动分类