S

Shieldgemma 9b

由 google 开发
ShieldGemma是基于Gemma 2构建的安全内容审核模型系列,针对四种危害类别(色情内容、危险内容、仇恨言论和骚扰)进行内容审核。
下载量 507
发布时间 : 7/16/2024
模型介绍
内容详情
替代品

模型简介

ShieldGemma是仅解码器的文本到文本大语言模型,提供英语版本并开放权重,用于安全内容审核。

模型特点

多危害类别审核
针对色情内容、危险内容、仇恨言论和骚扰四种危害类别进行内容审核。
基于Gemma 2构建
基于Gemma 2模型构建,继承了其强大的文本理解和生成能力。
开放权重
模型权重开放,支持用户自定义和进一步微调。
多规模选择
提供2B、9B和27B三种参数规模的模型,适应不同计算需求。

模型能力

文本内容审核
危害内容识别
策略合规性检查
生成式AI安全评估

使用案例

内容安全
用户输入过滤
检测用户输入是否包含违规内容,防止不当内容进入系统。
高准确率识别危险内容、仇恨言论等
AI输出审核
审核AI生成内容的安全性,确保输出符合安全策略。
有效防止AI生成有害内容
社区管理
在线社区内容审核
自动审核用户生成内容,减少人工审核工作量。
提高审核效率,降低违规内容传播风险