R

Russian Inappropriate Messages

由 apanc 开发
用于检测俄语中不含污秽词汇但可能损害发言者声誉的不当内容
下载量 4,039
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型作为毒性过滤后的额外层,专门检测俄语中形式委婉但内容不当的消息。基于敏感话题分类,可识别为暴力开脱、侮辱宗教感情等潜在有害表述。

模型特点

细粒度不当性检测
专注于非毒性但可能损害声誉的表述,如为犯罪行为开脱或侮辱宗教感情等
敏感话题关联
与特定敏感话题(如宗教、犯罪等)强关联的不当内容检测
多阶段过滤
设计为毒性检测后的补充过滤层,形成多阶段内容审核流程

模型能力

俄语文本分类
不当内容识别
敏感话题关联分析

使用案例

内容审核
社交媒体过滤
在基础毒性过滤后追加不当内容检测
可减少89%的不当内容漏检(测试集准确率)
企业声誉保护
检测可能损害企业形象的员工/用户发言
识别非显性但具有潜在风险的表述
学术研究
语言行为分析
研究俄语中不当表述的语言特征