B

Bert Base Qarib60 1790k

由 ahmedabdelali 开发
QARiB是基于约4.2亿条推文和1.8亿条文本句子训练的阿拉伯语及方言BERT模型,支持多种下游NLP任务。
下载量 16
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门针对阿拉伯语及其方言优化,适用于掩码语言建模和各类自然语言处理任务,在多项阿拉伯语NLP任务中表现优异。

模型特点

大规模阿拉伯语训练数据
基于4.2亿条推文和1.8亿条文本句子训练,覆盖标准阿拉伯语和方言
多领域数据整合
整合Twitter数据、阿拉伯语十亿词库、Abulkhair语料库和OPUS多语料库
方言支持
特别优化了对阿拉伯语方言的处理能力
高性能表现
在五项NLP下游任务中表现优于多语言BERT/AraBERT/ArabicBERT

模型能力

阿拉伯语文本理解
方言识别
情感分析
命名实体识别
冒犯性语言检测

使用案例

社交媒体分析
阿拉伯语推文情感分析
分析阿拉伯语推文的情感倾向
优于其他阿拉伯语BERT模型
方言识别
识别文本中的阿拉伯语方言
高准确率
文本处理
命名实体识别
识别阿拉伯语文本中的人名、地名等实体
冒犯性语言检测
检测阿拉伯语文本中的冒犯性内容