T

Tiroberta Abusiveness Detection

由 fgaim 开发
基于TiRoBERTa微调的提格里尼亚语侮辱性内容检测模型,在13,717条YouTube评论数据集上训练
下载量 210
发布时间 : 5/18/2023
模型介绍
内容详情
替代品

模型简介

专为提格里尼亚语设计的侮辱性语言检测模型,支持吉兹字母和拉丁转写文本,适用于低资源语言环境下的内容审核研究

模型特点

双文字脚本支持
同时处理吉兹字母和拉丁转写的提格里尼亚语文本,适应真实场景
多任务学习框架
可扩展支持侮辱性检测、情感分析和主题分类三项任务
低资源优化
专为提格里尼亚语等低资源语言设计的预训练架构
文化敏感标注
由母语者标注确保文化语境准确性

模型能力

提格里尼亚语文本分类
侮辱性内容识别
多任务学习支持
双文字脚本处理

使用案例

内容审核
社交媒体评论过滤
自动检测提格里尼亚语YouTube评论中的侮辱性内容
准确率86.7%,可减少人工审核工作量
学术研究
低资源NLP研究
作为提格里尼亚语NLP任务的基线模型
提供13k+标注数据集的基准性能