L

Llama Guard 4 12B

由 meta-llama 开发
Llama Guard 4 是一个原生多模态安全分类器,拥有120亿参数,联合训练于文本和多重图像,用于大语言模型输入和输出的内容安全评估。
下载量 16.52k
发布时间 : 4/23/2025

模型简介

基于Llama 4 Scout预训练模型剪枝后的密集架构,针对内容安全分类进行微调,可生成文本输出以指示内容安全性,若不安全则列出违规类别。

模型特点

多模态安全审查
融合文本和图像审查能力,支持单分类器实现多模态安全评估。
MLCommons标准对齐
基于MLCommons危害分类体系训练,新增'代码解释器滥用'类别。
多图像输入支持
新增支持2-5张图像/样本的多图像训练和评估能力。
高效架构
通过剪枝方法将MoE架构转为密集架构,单GPU可运行。

模型能力

文本安全分类
图像安全分类
多模态内容审查
违规类别识别

使用案例

内容审核
社交媒体内容过滤
自动识别并过滤社交媒体平台上的有害内容。
降低安全违规率,匹配或超越前代模型性能。
AI聊天机器人安全防护
评估大语言模型输入和输出的安全性。
输入过滤较输出过滤更能降低安全违规率。
企业安全
企业内部通讯审查
监控企业内部通讯中的不当内容。
AIbase
智启未来,您的人工智能解决方案智库
简体中文