B

Bert Base Arabertv02

由 aubmindlab 开发
AraBERT是基于BERT架构的阿拉伯语预训练语言模型,专门针对阿拉伯语理解任务优化。
下载量 666.17k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

AraBERT是为阿拉伯语设计的预训练语言模型,基于BERT架构,在多种阿拉伯语NLP任务上表现出色,包括情感分析、命名实体识别和问答系统。

模型特点

阿拉伯语优化
专门针对阿拉伯语特性进行优化,包括处理阿拉伯语特有的前缀和后缀分词问题
预分段处理
使用Farasa分词器对文本进行预分段处理,提高模型理解能力
大规模训练数据
使用超过200M句子(8.6B词)的阿拉伯语数据进行训练
多版本支持
提供基础版和大型版,以及针对Twitter数据的特别版本

模型能力

阿拉伯语文本理解
情感分析
命名实体识别
问答系统
文本填充

使用案例

情感分析
阿拉伯语评论情感分析
分析阿拉伯语社交媒体评论或产品评论的情感倾向
在多个阿拉伯语情感分析数据集上表现优于mBERT
命名实体识别
阿拉伯语文本实体识别
识别阿拉伯语文本中的人名、地名等实体
在ANERcorp数据集上取得良好效果
问答系统
阿拉伯语阅读理解
回答基于阿拉伯语文章的提问
在Arabic-SQuAD和ARCD数据集上表现良好