L

Llamaguard 7b

由 meta-llama 开发
基于Llama 2的7B参数安全审查模型,用于内容安全分类
下载量 590.11k
发布时间 : 12/5/2023
模型介绍
内容详情
替代品

模型简介

Llama-Guard是一个安全审查模型,专门用于对输入提示和输出响应进行分类,以识别和过滤不安全或违规内容。

模型特点

安全审查
能够对输入提示和输出响应进行分类,识别不安全或违规内容。
多类别分类
支持多种安全分类,包括暴力与仇恨言论、成人内容、非法武器等。
高性能
在多项基准测试中优于OpenAI审核API、Azure内容安全和PerspectiveAPI。

模型能力

提示分类
响应分类
内容安全审查

使用案例

内容审核
社交媒体内容审核
用于自动检测和过滤社交媒体平台上的违规内容。
高效识别暴力、仇恨言论等不安全内容。
聊天机器人安全审查
用于确保聊天机器人的输出内容符合安全标准。
减少不当内容的生成和传播。