B

Bert Base Qarib

由 ahmedabdelali 开发
QARiB是基于阿拉伯语及方言的大规模预训练BERT模型,训练数据包含4.2亿条推文和1.8亿条文本句子。
下载量 602
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

专门针对阿拉伯语及方言优化的BERT模型,支持掩码语言建模和下游任务微调,在多个阿拉伯语NLP任务中表现优异。

模型特点

方言支持
专门针对阿拉伯语方言优化,在方言识别任务中达到65.21%准确率
大规模训练数据
基于140亿词元的阿拉伯语数据训练,包含推文和正式文本
多任务表现优异
在情感检测、冒犯性语言检测等任务上超越同类阿拉伯语BERT模型

模型能力

阿拉伯语文本理解
方言识别
情感分析
命名实体识别
冒犯性语言检测
掩码语言建模

使用案例

社交媒体分析
阿拉伯语推文情感分析
分析阿拉伯语推文的情感倾向
在情感分析任务上达到93.31%准确率
冒犯性内容检测
识别社交媒体中的冒犯性阿拉伯语内容
准确率达91.94%,优于同类模型
语言研究
阿拉伯方言识别
区分不同地区的阿拉伯语方言变体
65.21%的识别准确率