X

Xlm Roberta Large Masakhaner

由 Davlan 开发
首个针对10种非洲语言的命名实体识别模型,基于XLM-RoBERTa large微调,支持识别日期、地点、组织和人物四类实体。
下载量 104
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对非洲语言优化的命名实体识别(NER)模型,在MasakhaNER数据集上微调,能够处理10种非洲语言的文本实体识别任务。

模型特点

多语言支持
支持10种非洲语言的命名实体识别,填补了非洲语言NLP工具的空白。
最先进性能
在MasakhaNER数据集上实现了当前最优的NER性能,F1分数最高达91.75(豪萨语)。
细粒度实体分类
能识别四类实体(DATE/LOC/ORG/PER)及其起始位置(B-/I-标记)。

模型能力

非洲语言文本处理
命名实体识别
多语言NLP

使用案例

新闻分析
非洲新闻实体提取
从非洲各语言的新闻文章中自动提取人物、组织、地点等关键信息
F1分数70.70-91.75(依语言不同)
跨语言信息处理
多语言文档分析
处理包含多种非洲语言的混合文本中的实体信息