LLM安全防护
Prompt Injection Defender Large V0 Onnx
TestSavantAI模型是一组经过微调的分类器,专门设计用于防御针对大型语言模型(LLM)的提示注入和越狱攻击。
文本分类
Transformers
英语
P
testsavantai
3,225
1
Prompt Injection Defender Large V0
TestSavantAI模型是一组专为防御大型语言模型(LLM)提示注入和越狱攻击而设计的分类器,微型版基于BERT-tiny架构,平衡安全性与计算效率。
文本分类
Transformers
英语
P
testsavantai
23
2
Gentelshield V1
GenTel-Shield是一个专注于检测和防御提示词注入攻击的模型,能够有效区分恶意样本与良性样本。
大型语言模型
Transformers
G
GenTelLab
35
2
Prompt Guard 86M
PromptGuard是一个用于检测和防护LLM提示攻击的文本分类模型,能够识别恶意提示注入和越狱尝试。
文本分类
Transformers
英语
P
meta-llama
33.88k
250
Deberta V3 Base Prompt Injection V2
Apache-2.0
基于DeBERTa-v3-base微调的提示词注入检测模型,用于识别可能操纵语言模型的恶意提示词
文本分类
Transformers
英语
D
protectai
229.97k
50
Llamaguard 7b
基于70亿参数Llama 2的安全防护模型,用于对LLM输入输出内容进行安全分类
大型语言模型
Transformers
英语
L
llamas-community
151
13
Scamllm
基于RoBERTa微调的恶意提示检测模型,可识别诱导生成钓鱼网站/邮件的恶意提示
文本分类
Transformers
S
phishbot
294
7
Deberta V3 Base Prompt Injection
Apache-2.0
基于DeBERTa-v3微调的提示注入检测模型,用于识别恶意提示输入
文本分类
Transformers
英语
D
protectai
35.13k
78
Deberta V3 Base Injection Onnx
MIT
这是deepset/deberta-v3-base-injection模型转换为ONNX格式的版本,用于检测提示注入攻击。
文本分类
Transformers
英语
D
protectai
30
2