R

Roberta Toxicity Classifier

由 s-nlp 开发
基于RoBERTa-large微调的毒性评论分类模型,在Jigsaw竞赛数据集上训练,用于识别英文文本中的毒性内容。
下载量 80.61k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于对英文评论进行毒性分类,能够有效识别文本中的有害内容。基于200万条样本训练,在测试集上表现优异。

模型特点

高性能分类
在Jigsaw竞赛测试集上达到AUC-ROC 0.98和F1分数0.76的优秀表现
大规模训练数据
整合了Jigsaw三届竞赛约200万条英文样本进行训练
基于RoBERTa优化
采用鲁棒优化的RoBERTa-large预训练模型进行微调

模型能力

文本毒性分类
有害内容检测
自然语言处理

使用案例

内容审核
社交媒体评论过滤
自动识别并过滤社交媒体平台上的有害评论
有效减少平台上的毒性内容
在线社区管理
帮助论坛和社区管理员快速识别不当言论
提高社区内容质量
学术研究
语言毒性研究
用于研究网络语言中的毒性特征和模式