prompt - saturation - attack - detector开源模型 - 免费检测饱和型越狱攻击

首页

Prompt Saturation Attack Detector

由 GuardrailsAI 开发

用于检测饱和型越狱攻击的小型BERT模型，不适用于独立防御其他类型的越狱攻击。

文本分类

Transformers

英语#饱和攻击检测 #BERT微调 #安全防护

下载量 4,762

发布时间 : 11/7/2024

模型简介

该模型是一个基于BERT架构的小型预过滤器，专门设计用于检测部分饱和攻击，是防御机器学习系统滥用方案中的一个组成部分。

模型特点

专注饱和攻击检测

专门针对饱和型越狱攻击设计，具有针对性检测能力

轻量级模型

基于bert-tiny架构，计算资源需求低

安全防护组件

作为完整安全防护方案中的预过滤组件

模型能力

越狱攻击检测

文本分类

安全威胁识别

使用案例

AI安全防护

大语言模型安全防护

作为大语言模型系统的前置安全过滤器

可识别特定类型的越狱攻击尝试

AI系统安全审计

用于检测系统是否遭受饱和攻击

提供初步攻击检测结果

属性	详情
开发者	Guardrails AI, Joseph Catrambone
资助方	Guardrails AI
模型类型	Transformer, BERT
适用语言（NLP）	英语
许可证	限制性许可证
微调基础模型	bert-tiny

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Prompt Saturation Attack Detector

模型简介

模型特点

模型能力

使用案例

🚀 越狱检测小模型

🚀 快速开始

✨ 主要特性

📚 详细文档

模型详情

模型来源

适用范围

不适用场景