R

Roberta Base Bne Capitel Ner

由 PlanTL-GOB-ES 开发
基于RoBERTa架构的西班牙语命名实体识别模型,在BNE语料库上预训练并在CAPITEL-NERC数据集上微调
下载量 8,221
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于西班牙语命名实体识别(NER)任务,能够识别文本中的人名、地名等实体

模型特点

大规模预训练
使用570GB经过清洗的西班牙语文本进行预训练
专业领域微调
在CAPITEL-NERC竞赛数据集上专门针对命名实体识别任务进行微调
高性能表现
在CAPITEL-NERC测试集上达到89.60的F1值,优于同类基线模型

模型能力

西班牙语文本处理
命名实体识别
人名识别
地名识别
组织机构名识别

使用案例

信息提取
文档实体提取
从西班牙语文档中自动提取人名、地名等实体信息
准确识别文本中的命名实体
内容分类
基于识别出的实体对文档内容进行分类
提高文档分类的准确性
知识图谱构建
实体关系抽取
作为知识图谱构建的前期处理步骤
为后续关系抽取提供基础