B

Bert Large Arabertv02 Twitter

由 aubmindlab 开发
AraBERTv0.2-Twitter是针对阿拉伯语方言及推文优化的预训练语言模型,基于BERT架构开发,新增表情符号和常见词汇支持。
下载量 312
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型通过在约6000万条阿拉伯语推文上继续预训练而得,专门优化了阿拉伯语方言和社交媒体文本的理解能力。

模型特点

方言优化
专门针对阿拉伯语方言和推文内容进行优化训练
表情符号支持
词汇表中新增了表情符号及常见社交媒体词汇
短文本优化
针对64个token的序列长度进行训练,适合社交媒体短文本

模型能力

阿拉伯语文本理解
社交媒体文本处理
掩码语言预测

使用案例

社交媒体分析
阿拉伯语推文情感分析
分析阿拉伯语推文中的情感倾向
方言文本理解
处理阿拉伯语不同地区的方言文本
语言模型应用
文本补全
预测被掩码的词语或短语
示例:'黎巴嫩的首都是[MASK]'可预测为'贝鲁特'