D

Deberta V3 Large Mlm Reddit Gab

由 MilaNLProc 开发
该模型是MilaNLP团队为SemEval-2023任务10(可解释在线性别歧视检测)训练的领域适配模型,基于DeBERTa-v3-large进行Reddit和Gab语料的领域适应训练
下载量 436
发布时间 : 2/28/2023
模型介绍
内容详情
替代品

模型简介

通过集成领域适应与正则化预训练的语言模型,专门用于稳健的性别歧视内容检测任务

模型特点

领域适应训练
使用Reddit和Gab平台的特定领域语料进行MLM训练,增强对网络性别歧视内容的识别能力
集成正则化
采用正则化技术缓解词汇过拟合问题,生成更保守可靠的预测结果
争议样本识别
模型能识别标注存在争议的边界案例,反映仇恨言论标注的主观性挑战

模型能力

性别歧视文本分类
仇恨言论检测
社交媒体文本分析

使用案例

内容审核
社交媒体性别歧视内容过滤
自动识别Reddit等平台含有性别歧视倾向的帖子
在SemEval-2023任务10中验证有效
学术研究
仇恨言论分析
研究网络性别歧视言论的语言特征和传播模式
论文中提供了误判案例分析