R

Ruperta Base

由 mrm8488 开发
RuPERTa是基于大型西班牙语语料库训练的无大小写RoBERTa模型,采用RoBERTa改进的预训练方法,适用于多种西班牙语NLP任务。
下载量 39
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

RuPERTa是基于RoBERTa架构的西班牙语预训练语言模型,通过改进训练过程(如更长训练时间、更大批次处理等)优化性能,支持词性标注、命名实体识别等任务。

模型特点

西班牙语优化
基于大型西班牙语语料库训练,专门针对西班牙语NLP任务优化
RoBERTa改进
采用RoBERTa改进的预训练方法,包括更长训练时间、更大批次处理和动态掩码模式
无大小写设计
无大小写版本模型,提升对大小写不敏感文本的处理能力

模型能力

文本填充
词性标注
命名实体识别
西班牙语文本理解

使用案例

自然语言处理
词性标注
对西班牙语文本进行词性标注
F1分数97.39(在特定数据集上)
命名实体识别
识别西班牙语文本中的命名实体(人名、地名、组织名等)
F1分数77.55(在特定数据集上)
文本填充
预测西班牙语句子中的缺失词
示例可见模型页面