K

Kcelectra Base Bad Sentence Classifier

由 JminJ 开发
基于ELECTRA架构的韩语文本分类模型,用于判断评论和聊天内容是否包含敏感信息
下载量 46
发布时间 : 4/7/2022
模型介绍
内容详情
替代品

模型简介

该模型通过微调ELECTRA模型实现,专门用于检测韩语文本中的不良内容(如敏感信息、仇恨言论等)。模型基于公开数据集训练,但训练数据因版权问题未公开。

模型特点

多数据集融合训练
整合Korean Unsmile和Korean HateSpeech两个数据集,并重新标记为二分类形式
特定敏感词处理
对包含特定韩语敏感词(如'~노'、'좆'等)的语句进行特殊标记处理
多模型对比
使用三种不同的韩语ELECTRA模型进行训练和性能比较

模型能力

韩语文本分类
敏感内容检测
仇恨言论识别

使用案例

内容审核
社交媒体评论过滤
自动识别并过滤社交媒体上的不良评论
准确率达88.49%(基于kcElectra_base模型)
聊天内容监控
实时监控聊天应用中的不当言论