D

Duoguard 0.5B

由 DuoGuard 开发
DuoGuard-0.5B 是一个多语言、仅解码器的基于大语言模型的分类器,专门设计用于跨12个不同子类别的安全内容审核。
下载量 235
发布时间 : 2/7/2025
模型介绍
内容详情
替代品

模型简介

该模型用于对输入文本序列的安全性进行分类,支持多语言内容审核,能够检测12个不同子类别的潜在不安全或不允许内容。

模型特点

多语言支持
专门微调用于英语、法语、德语和西班牙语的安全内容审核,同时保留基础模型对29种语言的支持能力。
细粒度分类
能够检测12个不同子类别的潜在不安全内容,提供多标签概率分布。
二元审核
可以通过取12个子类别概率的最大值与阈值比较,生成简化的'安全'/'不安全'标签。

模型能力

多语言文本分类
内容安全审核
多标签分类
二元分类

使用案例

内容审核
社交媒体内容审核
自动检测社交媒体平台上的不安全或不允许内容
能够识别12个不同子类别的潜在风险内容
聊天机器人安全防护
为聊天机器人提供安全防护,防止生成不安全内容
实时检测并过滤不安全响应