B

Bert Base Uncased Hatexplain

由 Hate-speech-CNERG 开发
HateXplain是一个用于检测仇恨言论、冒犯性内容和正常内容的文本分类模型,基于Gab和Twitter数据训练,并引入人工标注依据提升性能。
下载量 3,831
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专注于社交媒体文本的三分类任务(仇恨言论/冒犯性内容/正常内容),通过可解释性增强的标注数据提高检测准确性。

模型特点

多类别分类
同时识别仇恨言论、冒犯性内容和正常内容三类文本
可解释性增强
训练数据包含人工标注依据,提高模型决策的可解释性
跨平台数据
整合Gab和Twitter两大社交平台数据,增强泛化能力

模型能力

文本分类
仇恨言论检测
内容安全过滤

使用案例

内容审核
社交媒体内容过滤
自动识别并标记平台上的仇恨言论和冒犯性内容
减少人工审核工作量,提高有害内容识别效率
学术研究
仇恨言论模式分析
用于研究网络仇恨言论的语言特征和传播规律