M

Mbert Ar C19

由 moha 开发
基于150万条COVID-19多方言阿拉伯语推文预训练的mBERT模型,优化了与疫情相关的阿拉伯语推文处理能力。
下载量 22
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是mBERT的多方言阿拉伯语版本,专门针对COVID-19相关内容进行了预训练,在处理疫情相关的阿拉伯语文本时表现更优。

模型特点

多方言支持
专门针对阿拉伯语多方言进行优化,能有效处理不同地区的阿拉伯语变体
疫情领域优化
使用150万条COVID-19相关推文进行预训练,在疫情相关任务上表现优异
多任务能力
可同时处理假新闻检测、仇恨言论识别、内容分类等多种任务

模型能力

阿拉伯语文本分类
假新闻检测
仇恨言论识别
疫情相关内容分析

使用案例

社交媒体监测
疫情假新闻检测
识别社交媒体上关于COVID-19的虚假信息
F1分数0.7739(优于基准模型)
仇恨言论监测
检测疫情相关讨论中的仇恨言论
F1分数0.8649(优于基准模型)
公共卫生
治疗方法讨论分析
分类讨论COVID-19治疗方法的推文
F1分数0.9176(优于基准模型)