R

Roberta Ner Multilingual

由 julian-schelb 开发
基于RoBERTa架构的多语言命名实体识别模型,支持20种语言的实体识别任务。
下载量 493
发布时间 : 9/6/2022
模型介绍
内容详情
替代品

模型简介

该模型通过微调XLM-RoBERTa实现多语言命名实体识别,能够识别人物(PER)、组织(ORG)和地点(LOC)三类实体,采用IOB2标注格式。

模型特点

多语言支持
支持20种语言的命名实体识别,包括主要欧洲和亚洲语言。
高精度识别
在WikiANN测试集上整体F1分数达到0.883,人物识别F1分数高达0.912。
基于RoBERTa架构
利用XLM-RoBERTa的强大预训练能力,在多种语言上表现优异。

模型能力

多语言文本处理
命名实体识别
人物识别
组织识别
地点识别

使用案例

信息提取
新闻文章实体提取
从多语言新闻文章中自动识别人物、组织和地点信息
可用于构建知识图谱或增强搜索功能
内容分析
社交媒体内容分析
分析多语言社交媒体内容中的实体提及情况
帮助了解话题相关实体和热点