S

Shieldgemma 27b

由 google 开发
ShieldGemma是基于Gemma 2构建的一系列安全内容审核模型,针对四种危害类别(性暴露内容、危险内容、仇恨言论和骚扰)进行内容审核。
下载量 65
发布时间 : 7/16/2024

模型简介

ShieldGemma是仅解码器的大型语言模型,支持英语,开放权重,用于安全内容审核。

模型特点

多危害类别审核
针对四种危害类别(性暴露内容、危险内容、仇恨言论和骚扰)进行内容审核。
开放权重
模型权重开放,支持自定义部署和使用。
高性能
在多个基准测试中表现优于同类开源模型。
灵活部署
支持单GPU和多GPU部署,提供多种使用方式。

模型能力

文本分类
内容安全审核
生成式AI内容过滤

使用案例

内容审核
用户输入过滤
审核用户输入内容是否符合安全策略。
识别并过滤违反安全策略的用户输入。
模型输出过滤
审核AI生成内容是否符合安全策略。
识别并过滤违反安全策略的AI生成内容。
社交媒体
仇恨言论检测
检测社交媒体中的仇恨言论内容。
有效识别基于种族、性别等受保护属性的仇恨言论。
AIbase
智启未来,您的人工智能解决方案智库
简体中文