R

Russian Toxicity Classifier

由 s-nlp 开发
基于对话式Rubert微调的俄语毒性评论分类模型,能够准确识别俄语文本中的毒性内容。
下载量 17.93k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个基于Bert架构的分类器,专门用于识别俄语文本中的毒性评论。它通过合并两个俄语毒性评论数据集进行训练,具有较高的分类准确率。

模型特点

高准确率
在测试集上获得了0.97的准确率,毒性评论的F1分数达到0.93。
多源数据训练
合并了来自2ch.hk和ok.ru的两个俄语毒性评论数据集,提高了模型的泛化能力。
基于对话式Rubert
基于DeepPavlov/rubert-base-cased-conversational微调,特别适合处理对话式文本。

模型能力

俄语文本分类
毒性内容检测
评论内容分析

使用案例

内容审核
社交媒体评论过滤
自动识别并过滤社交媒体平台上的毒性评论
准确率高达97%,可有效减少平台上的不当内容
论坛内容管理
帮助论坛管理员识别并处理毒性言论
F1分数0.93,能准确标记需要人工审核的评论