B

Bert Base Arabert

由 aubmindlab 开发
AraBERT是基于谷歌BERT架构的阿拉伯语预训练语言模型,专为阿拉伯语自然语言理解任务设计。
下载量 74.71k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

AraBERT是为阿拉伯语优化的BERT模型,支持多种下游NLP任务,包括情感分析、命名实体识别和问答系统。

模型特点

阿拉伯语优化
专门针对阿拉伯语特性进行预训练,包括处理前缀和后缀分离。
Farasa分词
使用Farasa分词器进行预分割,提高阿拉伯语文本处理效果。
多任务支持
支持多种下游NLP任务,包括情感分析、NER和问答系统。
大规模预训练
使用77GB阿拉伯语语料库进行预训练,包含约2.7B词汇。

模型能力

阿拉伯语文本理解
情感分析
命名实体识别
问答系统
文本分类

使用案例

情感分析
阿拉伯社交媒体情感分析
分析阿拉伯语社交媒体帖子的情感倾向
在HARD、ASTD等多个阿拉伯情感分析数据集上表现优异
信息提取
阿拉伯语命名实体识别
从阿拉伯文本中识别人名、地名等实体
在ANERcorp数据集上表现良好
问答系统
阿拉伯语问答
构建阿拉伯语问答系统
在Arabic-SQuAD和ARCD数据集上有竞争力表现