M

Minilm L12 H384 Uncased Nvidia Aegis AI Safety

由 AC 开发
基于microsoft/MiniLM-L12-H384-uncased微调的多标签文本分类器,用于AI内容安全检测
下载量 14.56k
发布时间 : 6/23/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于MiniLM架构的文本分类器,专门用于检测14类不安全内容,包括暴力、仇恨言论、隐私泄露等。适用于内容审核、AI安全等场景。

模型特点

多标签分类
可同时检测文本中多种不安全内容类型
高准确率
在测试集上达到95.15%的准确率
低漏报率
针对AI安全场景优化,重点关注召回率指标

模型能力

文本内容安全检测
多标签分类
有害内容识别

使用案例

内容审核
社交媒体内容过滤
自动检测用户生成内容中的有害信息
可识别14类不安全内容
AI聊天安全
检测AI生成回复中的不安全内容
降低有害内容输出风险