R

Roberta Fa Zwnj Base Ner

由 HooshvareLab 开发
该模型是针对波斯语命名实体识别(NER)任务进行微调的RoBERTa模型,支持识别10种实体类型。
下载量 102
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于RoBERTa架构的波斯语命名实体识别模型,在混合NER数据集上训练,能够识别日期、事件、设施、地点等10类实体。

模型特点

多类型实体识别
支持识别10种不同类型的命名实体,包括日期、事件、设施等。
混合数据集训练
使用ARMAN、PEYMA和WikiANN等多个波斯语NER数据集进行训练。
高准确率
在测试集上整体F1值达到0.955,多数实体类型的F1值超过0.95。

模型能力

波斯语文本处理
命名实体识别
实体分类

使用案例

信息提取
新闻实体提取
从波斯语新闻文本中提取人名、组织名、地点等关键信息。
准确识别2646个人名实体,F1值达0.958
金融文档分析
识别金融文档中的货币、百分比等关键数值信息。
货币识别F1值0.928,百分比识别F1值0.984
知识图谱构建
实体关系抽取
作为知识图谱构建的前置步骤,识别文本中的各类实体。