NER Darija MAR FSBM
N
NER Darija MAR FSBM
由 mohannad-tazi 开发
基于BERT架构的命名实体识别模型,专门用于识别摩洛哥阿拉伯语(Darija)文本中的人名、地点、机构及其他实体。
下载量 15
发布时间 : 12/26/2024
模型简介
该模型是基于DarNERcorp数据集微调的命名实体识别(NER)模型,适用于从社交媒体或新闻文章中提取摩洛哥方言文本中的关键实体信息。
模型特点
摩洛哥方言专用
专门针对摩洛哥阿拉伯语(Darija)优化,能有效识别方言中的命名实体。
多类别实体识别
可识别人名(PER)、地点(LOC)、机构(ORG)及其他实体(MISC)等多种实体类型。
基于BERT架构
采用aubmindlab/bert-base-arabertv02预训练模型,具有强大的语言理解能力。
模型能力
识别摩洛哥方言文本中的命名实体
分类实体类型(人名、地点、机构等)
处理社交媒体和新闻文本
使用案例
社交媒体分析
摩洛哥方言帖文实体提取
从摩洛哥方言的社交媒体帖文和推文中提取关键实体信息
可识别非正式文本中的命名实体
新闻处理
新闻稿件关键实体识别
识别新闻稿件中的关键人物、地点和组织机构
帮助快速理解新闻内容
信息抽取
正式/非正式文本实体提取
从各种形式的摩洛哥方言文本中提取命名实体
支持多种文本格式的信息抽取
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98
智启未来,您的人工智能解决方案智库
简体中文