R

Roberta Base Bne Capitel Ner Plus

由 PlanTL-GOB-ES 开发
基于RoBERTa架构的西班牙语命名实体识别模型,在BNE语料库上预训练并在CAPITEL数据集上微调,对小写命名实体识别效果更优。
下载量 1,481
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个西班牙语命名实体识别(NER)模型,能够识别文本中的命名实体。基于roberta-base-bne模型微调,是roberta-base-bne-capitel-ner的增强版本。

模型特点

增强的小写实体识别
相比基础版本,对小写命名实体的识别效果更优
大规模预训练
基于570GB清洗过的西班牙语语料库预训练
专业领域微调
在CAPITEL命名实体识别竞赛数据集上进行了针对性微调

模型能力

西班牙语文本命名实体识别
识别多种类型的命名实体

使用案例

文本分析
个人信息提取
从文本中识别人名、地名等个人信息
示例中能准确识别'francisco javier'(人名)和'马德里'(地名)
专业文档处理
处理法律、医疗等专业文档中的命名实体