B

Bert Large Arabic

由 asafaya 开发
针对阿拉伯语的预训练BERT大型语言模型,支持现代标准阿拉伯语和部分方言
下载量 278
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于BERT架构的大型阿拉伯语预训练语言模型,专门针对阿拉伯语文本处理任务进行优化,适用于多种自然语言处理应用。

模型特点

大规模预训练
基于82亿词的阿拉伯语语料训练,包含OSCAR和维基百科数据
方言支持
不仅支持现代标准阿拉伯语,还包含部分阿拉伯语方言内容
优化训练
调整原始BERT训练参数,增加训练步数至300万步

模型能力

文本表示学习
掩码语言建模
阿拉伯语文本理解
命名实体识别

使用案例

社交媒体分析
冒犯言论识别
用于识别阿拉伯语社交媒体中的冒犯性内容
在SemEval-2020任务12中取得良好表现
文本分类
阿拉伯语文本分类
可用于新闻分类、情感分析等任务