M

Meta Llama Guard 2 8B

由 meta-llama 开发
基于80亿参数Llama 3的安全防护模型,用于对LLM输入和响应进行安全分类
下载量 12.85k
发布时间 : 4/17/2024
模型介绍
内容详情
替代品

模型简介

Llama Guard 2是基于Llama 3的安全防护模型,可用于对LLM输入(提示分类)和LLM响应(响应分类)中的内容进行分类,识别潜在危害内容。

模型特点

安全分类
可对LLM输入和响应进行安全分类,识别潜在危害内容
多类别检测
基于MLCommons危害分类标准,可检测11种不同类别的危害内容
概率评分
通过分析第一个标记的概率生成分类器分数,可设置阈值进行二元决策

模型能力

文本分类
内容安全检测
危害内容识别

使用案例

内容安全
LLM输入过滤
检测用户输入中是否包含有害内容
防止有害内容进入LLM处理流程
LLM响应过滤
检测LLM生成的响应中是否包含有害内容
确保LLM输出符合安全标准
合规监控
合规性检查
确保LLM交互符合法律法规和平台政策
降低法律和声誉风险