Secgpt 7B
模型简介
模型特点
模型能力
使用案例
🚀 🌐 SecGPT:全球首个网络安全开源大模型
SecGPT 是由云起无垠于 2023 年推出的开源大模型,专为网络安全场景打造。它融合自然语言理解、代码生成、安全知识推理等核心能力,能有效提升安全防护效率与效果,已在多个关键安全任务场景落地应用。
🚀 快速开始
SecGPT 支持通过 vLLM 高性能推理框架部署,适合“低延迟、高并发、大吞吐量”的安全模型服务场景。以下是环境准备与服务启动步骤:
# 创建 Python 环境(建议 Python 3.10+)
conda create -n secgpt-vllm python=3.10 -y
conda activate secgpt-vllm
# 安装 vLLM(需具备 PyTorch + CUDA)
pip install --upgrade pip
pip install vllm
# 启动server 服务
CUDA_VISIBLE_DEVICES= xxx(GPU index) \
vllm serve ./secgpt \
--tokenizer ./secgpt \
--tensor-parallel-size 4 \
--max-model-len 32768 \
--gpu-memory-utilization 0.9 \
--dtype bfloat16 \
# 示例请求
curl http://localhost:8000/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "secgpt",
"messages": [{"role": "user", "content": "什么是 XSS 攻击?"}],
"temperature": 0.7
}'
✨ 主要特性
核心能力融合
SecGPT 融合了自然语言理解、代码生成、安全知识推理等核心能力,可应用于多个关键安全任务场景,如漏洞分析、日志与流量溯源、异常检测、攻防推理、命令解析和安全知识问答等。
持续升级迭代
- 2025 年 4 月,SecGPT V2.0 发布,全面升级安全理解与任务执行能力。
- 2024 年 3 月,轻量化版本 SecGPT - Mini 正式开源,可在 CPU 上高效运行。
- 2023 年 12 月,SecGPT 正式发布,成为全球首个开源网络安全大模型。
强大的基座能力
基于 Qwen2.5 - Instruct 系列与 DeepSeek - R1 系列模型,结合自建安全任务集与安全知识库,在 8 台 A100 GPU 集群上持续训练一周以上,完成大规模预训练 + 指令微调 + 强化学习,显著提升了模型在安全场景中的理解、推理与响应能力。
大规模高质量安全语料库
构建了超大规模、结构完备的网络安全语料库,总量超过 5TB、共计 106,721 个原始文件,其中超 40% 内容为人工精选与结构化处理。私有数据部分整合了具备 70 + 字段 / 14 类结构标签体系的安全数据资源,构建出数百亿 Tokens 级的高质量语料,为模型深度推理能力提供支撑。
评测表现优异
- 构建了一套覆盖安全证书问答、安全通识、编程能力、知识理解与推理能力的综合评估体系,采用 CISSP、CS - EVAL、CEVAL、GSM8K、BBH 等标准化数据集进行评测。
- 在与原始模型 SecGPT - mini 和基础模型 Qwen2.5 - Instruct 的对比中,训练后的模型在所有指标上均有大幅跃升,在安全类数据集上表现更优。
安全能力提升
- 知识覆盖更全面:引入涵盖 14 类安全知识领域的结构化语料。
- 答案生成更精准:通过多轮对话控制与语义优化技术,提升问答对齐率与上下文记忆稳定性。
- 推理能力更突出:具备多段知识联结与复合逻辑推演能力,能完成复杂任务。
📦 安装指南
SecGPT 支持通过 vLLM 高性能推理框架部署,安装步骤如下:
# 创建 Python 环境(建议 Python 3.10+)
conda create -n secgpt-vllm python=3.10 -y
conda activate secgpt-vllm
# 安装 vLLM(需具备 PyTorch + CUDA)
pip install --upgrade pip
pip install vllm
💻 使用示例
基础用法
# 示例代码保持不变
# 这里可根据实际情况补充代码示例,当前文档未明确基础用法代码,可结合上下文推测可能是调用模型进行安全问答等操作
高级用法
# 高级场景说明 - 可根据模型的高级功能,如复杂安全任务处理、多轮对话等进行说明
# 这里可根据实际情况补充代码示例,当前文档未明确高级用法代码
📚 详细文档
开源资源
- 模型源码与文档:https://github.com/Clouditera/secgpt
- 数据集下载地址:https://huggingface.co/datasets/clouditera/security-paper-datasets
模型评测
评测数据集
评测集名称 | 简要说明 | 参考链接 |
---|---|---|
CISSP | 权威信息安全认证体系,考察模型在安全管理、访问控制、风险治理等领域的专业知识覆盖度与答题准确率,适用于评估模型在通用信息安全领域的掌握程度。 | ISC² 官方网站 认证考试指南 |
CS - Eval | 面向网络安全任务的大模型能力综合评测集,覆盖 11 个网络安全主类、42 个子类,共计 4369 道题目,包含选择题、判断题、知识抽取等题型,兼顾知识性与实战性,用于评估模型的安全通识与任务执行能力。 | [ModelScope 数据集](https://modelscope.cn/datasets/cseval/cs - eval/) 论文介绍 (arXiv) |
C - Eval | 中文能力评估。由上海交通大学、清华大学和爱丁堡大学的研究人员在 2023 年 5 月联合推出。包含 13948 个多项选择题,涵盖了 52 个不同的学科和四个难度级别。 | 论文链接 (arXiv) CSDN 实践介绍 |
GSM8K | 解决数学问题的能力。Google 开发的一个数学问题求解数据集,包含大约 8,000 个高中到大学水平的数学问题。 | [GSM8K](https://github.com/openai/grade - school - math) [GitHub](https://github.com/openai/grade - school - math) |
BBH | 复杂语言理解能力。由 Google、斯坦福等研究人员开发的数据集,包含大量复杂语言理解任务的集合,可能包含需要深度推理、常识运用或复杂认知技能的任务。 | 论文链接 (arXiv) |
评测结果
评测维度 | 具体内容 |
---|---|
纵向评测对比 | 与原始模型 SecGPT - mini 对比,训练后的模型在 CISSP、CS - EVAL、CEVAL、GSM8K、BBH 等指标上均大幅跃升。 |
横向评测对比 | 相较于基础模型 Qwen2.5 - Instruct,SecGPT 在所有评测指标上均有超越,在安全类数据集上表现更优。 |
安全能力提升表现
渗透测试场景能力
SecGPT 能模拟渗透攻击流程,具备关键工具命令分析、Payload 构造、利用链生成等能力。
日志分析和流量分析能力
在安全日志与网络流量场景下,SecGPT 能自动识别异常事件、构建攻击链图谱、抽取关键 IOC,辅助完成事件溯源与告警分类。
逆向分析能力
基于对反汇编、API 调用序列、加壳行为等低层数据的理解,SecGPT 能辅助完成恶意样本的静态分析、特征提取与家族归类。
代码审计能力
import java.util.*;
import java.util.stream.Collectors;
public class AverageCalculator {
public static double calculateAverage(Object input, boolean strict) {
if (strict) {
System.out.println("Running in STRICT mode");
@SuppressWarnings("unchecked")
List<Number> numbers = (List<Number>) input;
double total = 0;
for (Number num : numbers) {
total += num.doubleValue();
}
return total / numbers.size();
} else {
System.out.println("Running in SAFE mode");
List<Double> parsed = parseInputSafe(input);
double total = parsed.stream().mapToDouble(Double::doubleValue).sum();
return total / parsed.size();
}
}
public static List<Double> parseInputSafe(Object input) {
List<Double> result = new ArrayList<>();
if (input instanceof String) {
String s = (String) input;
if (!s.matches("\\d+")) {
throw new IllegalArgumentException("String must contain only digits.");
}
for (char c : s.toCharArray()) {
result.add(Double.parseDouble(String.valueOf(c)));
}
} else if (input instanceof List<?>) {
for (Object obj : (List<?>) input) {
try {
result.add(Double.parseDouble(obj.toString()));
} catch (NumberFormatException e) {
throw new IllegalArgumentException("Invalid element in list: " + obj);
}
}
} else {
throw new IllegalArgumentException("Unsupported input type: " + input.getClass());
}
return result;
}
public static void main(String[] args) {
List<TestCase> testCases = Arrays.asList(
new TestCase("12345", false),
new TestCase("12345", true),
new TestCase(Arrays.asList(1, 2, "3", "4"), false),
new TestCase(Arrays.asList(1, 2, 3, "four"), false),
new TestCase(Arrays.asList(1, 2, 3, "four"), true)
);
for (int i = 0; i < testCases.size(); i++) {
TestCase tc = testCases.get(i);
System.out.println("\n--- Test Case " + (i + 1) + " | strict=" + tc.strict + " ---");
try {
double avg = calculateAverage(tc.input, tc.strict);
System.out.println("✅ Average: " + avg);
} catch (Exception e) {
System.out.println("❌ Error: " + e.getMessage());
}
}
}
static class TestCase {
Object input;
boolean strict;
TestCase(Object input, boolean strict) {
this.input = input;
this.strict = strict;
}
}
}
工具使用
SecGPT 在工具使用方面也有相应表现,相关示例可参考文档中的图片。
🔧 技术细节
模型训练
基于 Qwen2.5 - Instruct 系列与 DeepSeek - R1 系列模型,结合自建安全任务集与安全知识库,在 8 台 A100 GPU 集群上持续训练一周以上,完成大规模预训练 + 指令微调 + 强化学习。
训练指标分析
- 训练与验证损失:二者均平稳下降,模型在训练集与验证集上持续收敛,无过拟合迹象。
- 学习率曲线:采用 Warmup + 衰减策略,提升早期训练稳定性与收敛速度。
- 梯度范数:整体波动平稳,未出现梯度爆炸或消失,训练过程健康稳定。
- 评估表现:eval/runtime 与 eval/samples_per_second 波动范围小,系统资源使用高效,推理吞吐量稳定。
📄 许可证
本项目采用 apache - 2.0 许可证。
📮 联系我们

📬 若您对模型有任何疑问或合作意向,欢迎通过 GitHub 参与贡献或联系云起无垠团队。
⭐ Star History
⚠️ 免责声明
⚠️ 重要提示
- 本项目为研究与交流目的所构建,输出内容可能受限于模型训练数据的覆盖范围。
- 用户在使用模型过程中,应自行判断其输出的正确性与适用性。
- 若您计划将本模型用于“公开发布或商业化部署”,请务必明确承担相关法律和合规责任。
- 本项目的开发者对因使用本模型(包括但不限于模型本身、训练数据、输出内容)所可能产生的任何直接或间接损害概不负责。



