bert-spanish-toxicity开源模型 - 精准识别西班牙语文本中的毒性内容

Bert Spanish Toxicity

由 bgonzalezbustamante 开发

基于BETO（西班牙语BERT基础模型）微调的毒性检测模型，用于识别西班牙语文本中的毒性内容。

下载量 85

发布时间 : 11/4/2024

模型简介

该模型专门用于西班牙语文本的毒性分类，能够区分非毒性（NONTOXIC）和毒性（TOXIC）内容，主要应用于社交媒体内容审核和在线互动分析。

西班牙语专用

基于专为西班牙语优化的BERT模型（BETO）微调，针对西班牙语毒性内容检测效果优异。

抗议事件数据训练

使用拉丁美洲抗议事件中的真实社交媒体数据训练，特别适合分析高冲突场景下的毒性语言。

黄金标准数据集

训练数据来自精心标注的黄金标准数据集，包含约500万条数据点。

西班牙语文本分类

毒性内容检测

社交媒体内容分析

内容审核

社交媒体毒性评论过滤

自动识别并过滤西班牙语社交媒体中的毒性评论

准确率83.5%，F1分数84.9%

社会研究

抗议事件语言分析

分析抗议事件中社交媒体互动的毒性水平

特别适用于阿根廷、智利等西班牙语国家的抗议事件分析

属性	详情
模型类型	用于西班牙语毒性分类的微调BERT模型
基础模型	dccuchile/bert-base-spanish-wwm-cased
训练数据集	bgonzalezbustamante/toxicity-protests-ES
二氧化碳排放量	1.2345
许可证	MIT
语言	西班牙语
任务类型	文本分类
库名称	transformers