L

Llama Guard 3 1B

由 meta-llama 开发
Llama Guard 3-1B是基于Llama-3.2-1B预训练模型微调的内容安全分类模型,用于对LLM输入和响应中的内容进行安全分类。
下载量 73.88k
发布时间 : 9/20/2024
模型介绍
内容详情
替代品

模型简介

该模型用于识别和分类大语言模型(LLM)输入(提示)和输出(响应)中的不安全内容,生成文本指示内容是否安全及违反的类别。

模型特点

内容安全审核
可识别LLM对话中的不安全内容并分类违规类型
双模式检测
支持对用户输入(提示)和AI响应同时进行安全评估
标准化分类法
对齐MLCommons危害分类标准,提供统一的内容安全评估框架
移动端优化
提供修剪量化版本,适合移动设备部署

模型能力

文本内容安全分类
多轮对话审核
违规内容识别
安全风险评估

使用案例

AI安全
LLM输入过滤
在用户输入进入LLM前进行安全筛查
阻止恶意或不当提示进入系统
AI响应审核
对LLM生成内容进行安全评估
防止AI生成有害或不适当响应
合规监控
内容合规检查
确保AI对话符合平台内容政策
降低法律和声誉风险