L

Llama Guard 3 11B Vision

由 SinclairSchneider 开发
基于Llama-3.2-11B的多模态内容安全分类模型,支持检测有害的文本/图像输入及响应
下载量 1,725
发布时间 : 9/26/2024

模型简介

针对内容安全分类微调的预训练模型,可保护LLM的输入和输出安全,特别支持图像推理和多模态检测

模型特点

多模态内容检测
可同时分析文本和图像内容,识别有害的多模态提示
明确违规分类
输出具体违反的13类安全政策(基于MLCommons分类法)
灵活策略配置
支持自定义安全类别或排除默认类别
端到端保护
覆盖LLM全流程(输入提示分类+输出响应分类)

模型能力

文本内容安全分析
图像内容安全分析
多模态提示检测
违规类别识别
自定义安全策略

使用案例

内容审核
社交媒体审核
检测用户上传的图文内容是否包含暴力、仇恨言论等违规内容
自动标记需人工复核的高风险内容
AI聊天防护
拦截用户向LLM发送的有害多模态提示(如暴力图像+诱导性文本)
阻止模型生成危险响应
企业安全
内部通讯监控
扫描企业通讯工具中的敏感图文信息
符合行业合规要求
AIbase
智启未来,您的人工智能解决方案智库
简体中文