P

Pangolin Guard Base

由 dcarpintero 开发
基于ModernBERT的轻量级模型,专注于识别恶意提示注入攻击,提供AI安全防护。
下载量 83
发布时间 : 3/15/2025
模型介绍
内容详情
替代品

模型简介

潘高林防护是一个针对大语言模型(LLM)应用中的提示注入和越狱等安全挑战设计的防护模型。它能够识别恶意提示,防止敏感数据泄露或行为偏离预期。

模型特点

轻量级设计
基于ModernBERT的轻量级架构,适合自托管和低成本部署。
开源可用
完全开源,不同于部分未完全开源的现有防护模型。
上下文窗口优化
相比LlamaGuard等仅支持512词元的模型,提供更优的上下文处理能力。
多场景防护
能够识别多种类型的提示注入攻击,包括直接和间接提示注入。

模型能力

恶意提示检测
提示注入攻击防御
AI安全防护
文本分类

使用案例

AI安全
AI代理防护
为AI代理提供提示注入攻击的防御机制,防止恶意用户操纵AI行为。
有效识别并阻止恶意提示,保护AI代理安全运行。
对话界面安全
应用于对话界面,检测并过滤可能引发越狱或数据泄露的恶意输入。
提升对话系统的安全性,减少敏感信息泄露风险。