B

Bert Base Arabic

由 asafaya 开发
预训练的阿拉伯语BERT基础语言模型,支持现代标准阿拉伯语和部分方言
下载量 14.40k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于BERT架构的阿拉伯语预训练语言模型,适用于各种阿拉伯语自然语言处理任务。

模型特点

大规模预训练数据
使用约82亿词的阿拉伯语语料进行训练,包含OSCAR和维基百科数据
方言支持
不仅支持现代标准阿拉伯语,也包含部分阿拉伯语方言内容
TPU优化训练
使用谷歌TPU v3-8进行300万步训练,优化了训练效率

模型能力

文本理解
文本生成
命名实体识别
文本分类

使用案例

社交媒体分析
冒犯性言论识别
用于识别社交媒体中的冒犯性阿拉伯语内容
在SemEval-2020 Task 12中取得良好表现
信息提取
阿拉伯语NER
用于阿拉伯语命名实体识别任务