提示注入检测
Llama Prompt Guard 2 86M
其他
Llama Prompt Guard 2 是 Meta 推出的提示攻击检测模型系列,包含 86M 参数升级版和 22M 轻量版,用于检测大语言模型应用中的提示注入和越狱攻击。
文本分类
Transformers
支持多种语言
L
meta-llama
16.24k
30
Mdeberta V3 Base Prompt Injection
MIT
基于microsoft/mdeberta-v3-base微调的提示注入检测模型,整合多个数据集训练,用于识别恶意提示注入攻击。
文本分类
Transformers
M
proventra
136
1
Prompt Injection Defender Large V0 Onnx
TestSavantAI模型是一组经过微调的分类器,专门设计用于防御针对大型语言模型(LLM)的提示注入和越狱攻击。
文本分类
Transformers
英语
P
testsavantai
3,225
1
Prompt Injection Defender Large V0
TestSavantAI模型是一组专为防御大型语言模型(LLM)提示注入和越狱攻击而设计的分类器,微型版基于BERT-tiny架构,平衡安全性与计算效率。
文本分类
Transformers
英语
P
testsavantai
23
2
Fmops Distilbert Prompt Injection Onnx
Apache-2.0
这是 fmops/distilbert-prompt-injection 模型的 ONNX 格式转换版本,用于检测提示注入攻击。
大型语言模型
Transformers
英语
F
protectai
23
0
Deberta V3 Base Prompt Injection
Apache-2.0
基于DeBERTa-v3微调的提示注入检测模型,用于识别恶意提示输入
文本分类
Transformers
英语
D
protectai
35.13k
78
Deberta V3 Base Injection Onnx
MIT
这是deepset/deberta-v3-base-injection模型转换为ONNX格式的版本,用于检测提示注入攻击。
文本分类
Transformers
英语
D
protectai
30
2
Jailbreak Classifier
Apache-2.0
基于bert-base-uncased微调的文本分类模型,用于检测用户提示中的越狱尝试
文本分类
Transformers
英语
J
jackhhao
7,619
20