X

Xlm Roberta Base Romanian Ner Ronec

由 EvanD 开发
基于xlm-roberta模型在罗马尼亚语NER数据集RONEC上训练的命名实体识别模型,测试集f1-Macro达到95分。
下载量 283.26k
发布时间 : 1/3/2024
模型介绍
内容详情
替代品

模型简介

该模型是一个序列标注模型,专门用于罗马尼亚语文本中的命名实体识别任务,能够识别文本中的人名、地名等实体。

模型特点

高性能罗马尼亚语NER
在RONEC数据集上测试的f1-Macro达到95分,表现优异。
基于XLM-RoBERTa
使用强大的多语言预训练模型xlm-roberta-base作为基础架构。
实体分组支持
支持通过aggregation_strategy参数对识别出的实体进行分组处理。

模型能力

罗马尼亚语文本中的命名实体识别
识别多种实体类型(如PER、GPE等)
处理连续实体识别

使用案例

信息提取
从文本中提取人名和地名
识别罗马尼亚语文本中的人名、地名等实体信息
准确识别出'Amadeus Wolfgang'为人名,'柏林'为地名
文本分析
文档实体标注
对罗马尼亚语文档进行实体标注,用于后续分析