S

Shieldgemma 2b

由 google 开发
ShieldGemma是基于Gemma 2构建的一系列安全内容审核模型,针对四类危害内容(色情、危险内容、仇恨和骚扰)。
下载量 3,107
发布时间 : 7/16/2024
模型介绍
内容详情
替代品

模型简介

ShieldGemma是仅解码器的大型语言模型,支持英文,开放权重,提供3种规模:2B、9B和27B参数,用于安全内容审核。

模型特点

多危害类型审核
针对色情、危险内容、仇恨和骚扰四类危害内容进行审核
多规模选择
提供2B、9B和27B三种参数规模的模型选择
灵活应用
支持仅提示内容分类和提示-响应内容分类两种应用模式

模型能力

文本分类
内容安全审核
危害内容检测

使用案例

内容安全
用户输入过滤
检测用户输入是否包含危害内容
识别并过滤危险、仇恨、骚扰等不当内容
模型输出过滤
检测AI生成内容是否违反安全策略
确保AI输出符合安全规范