SecGPT-7B开源大模型 - 免费部署，为网络安全场景提供多能力支持

首页

Secgpt 7B

由 clouditera 开发

全球首个网络安全开源大模型，专为网络安全场景打造，融合自然语言理解、代码生成、安全知识推理等核心能力。

大型语言模型

Safetensors

中文开源协议:Apache-2.0 #网络安全大模型 #漏洞分析推理 #高并发安全服务

下载量 155

发布时间 : 4/14/2025

模型简介

SecGPT 是由云起无垠推出的开源大模型，旨在提升安全防护效率与效果，已在多个关键安全任务场景落地应用。

模型特点

核心能力融合

融合自然语言理解、代码生成、安全知识推理等核心能力，适用于多种安全任务场景。

持续升级迭代

定期发布新版本，如 SecGPT V2.0 和轻量化版本 SecGPT - Mini，不断提升模型能力。

强大的基座能力

基于高质量基座模型，结合自建安全任务集与知识库，通过大规模训练提升性能。

大规模高质量安全语料库

构建超大规模、结构完备的网络安全语料库，为模型深度推理能力提供支撑。

模型能力

自然语言理解

代码生成

安全知识推理

漏洞分析

日志与流量溯源

异常检测

攻防推理

命令解析

安全知识问答

使用案例

渗透测试

模拟渗透攻击流程

具备关键工具命令分析、Payload 构造、利用链生成等能力。

日志分析和流量分析

自动识别异常事件

能自动识别异常事件、构建攻击链图谱、抽取关键 IOC，辅助完成事件溯源与告警分类。

逆向分析

恶意样本分析

基于对反汇编、API 调用序列、加壳行为等低层数据的理解，辅助完成恶意样本的静态分析、特征提取与家族归类。

代码审计

代码漏洞检测

能辅助完成代码审计，识别潜在的安全漏洞。

🚀 🌐 SecGPT：全球首个网络安全开源大模型

SecGPT 是由云起无垠于 2023 年推出的开源大模型，专为网络安全场景打造。它融合自然语言理解、代码生成、安全知识推理等核心能力，能有效提升安全防护效率与效果，已在多个关键安全任务场景落地应用。

🚀 快速开始

SecGPT 支持通过 vLLM 高性能推理框架部署，适合“低延迟、高并发、大吞吐量”的安全模型服务场景。以下是环境准备与服务启动步骤：

# 创建 Python 环境（建议 Python 3.10+）
conda create -n secgpt-vllm python=3.10 -y
conda activate secgpt-vllm

# 安装 vLLM（需具备 PyTorch + CUDA）
pip install --upgrade pip
pip install vllm

# 启动server 服务
CUDA_VISIBLE_DEVICES= xxx(GPU index) \
vllm serve ./secgpt \
  --tokenizer ./secgpt \
  --tensor-parallel-size 4 \
  --max-model-len 32768 \
  --gpu-memory-utilization 0.9 \
  --dtype bfloat16 \
  
# 示例请求
curl http://localhost:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "secgpt",
    "messages": [{"role": "user", "content": "什么是 XSS 攻击？"}],
    "temperature": 0.7
  }'

✨ 主要特性

核心能力融合

SecGPT 融合了自然语言理解、代码生成、安全知识推理等核心能力，可应用于多个关键安全任务场景，如漏洞分析、日志与流量溯源、异常检测、攻防推理、命令解析和安全知识问答等。

持续升级迭代

2025 年 4 月，SecGPT V2.0 发布，全面升级安全理解与任务执行能力。
2024 年 3 月，轻量化版本 SecGPT - Mini 正式开源，可在 CPU 上高效运行。
2023 年 12 月，SecGPT 正式发布，成为全球首个开源网络安全大模型。

强大的基座能力

基于 Qwen2.5 - Instruct 系列与 DeepSeek - R1 系列模型，结合自建安全任务集与安全知识库，在 8 台 A100 GPU 集群上持续训练一周以上，完成大规模预训练 + 指令微调 + 强化学习，显著提升了模型在安全场景中的理解、推理与响应能力。

大规模高质量安全语料库

构建了超大规模、结构完备的网络安全语料库，总量超过 5TB、共计 106,721 个原始文件，其中超 40% 内容为人工精选与结构化处理。私有数据部分整合了具备 70 + 字段 / 14 类结构标签体系的安全数据资源，构建出数百亿 Tokens 级的高质量语料，为模型深度推理能力提供支撑。

评测表现优异

构建了一套覆盖安全证书问答、安全通识、编程能力、知识理解与推理能力的综合评估体系，采用 CISSP、CS - EVAL、CEVAL、GSM8K、BBH 等标准化数据集进行评测。
在与原始模型 SecGPT - mini 和基础模型 Qwen2.5 - Instruct 的对比中，训练后的模型在所有指标上均有大幅跃升，在安全类数据集上表现更优。

安全能力提升

知识覆盖更全面：引入涵盖 14 类安全知识领域的结构化语料。
答案生成更精准：通过多轮对话控制与语义优化技术，提升问答对齐率与上下文记忆稳定性。
推理能力更突出：具备多段知识联结与复合逻辑推演能力，能完成复杂任务。

📦 安装指南

SecGPT 支持通过 vLLM 高性能推理框架部署，安装步骤如下：

# 创建 Python 环境（建议 Python 3.10+）
conda create -n secgpt-vllm python=3.10 -y
conda activate secgpt-vllm

# 安装 vLLM（需具备 PyTorch + CUDA）
pip install --upgrade pip
pip install vllm

💻 使用示例

基础用法

# 示例代码保持不变
# 这里可根据实际情况补充代码示例，当前文档未明确基础用法代码，可结合上下文推测可能是调用模型进行安全问答等操作

高级用法

# 高级场景说明 - 可根据模型的高级功能，如复杂安全任务处理、多轮对话等进行说明
# 这里可根据实际情况补充代码示例，当前文档未明确高级用法代码

📚 详细文档

开源资源

模型源码与文档：https://github.com/Clouditera/secgpt
数据集下载地址：https://huggingface.co/datasets/clouditera/security-paper-datasets

模型评测

评测数据集

评测集名称	简要说明	参考链接
CISSP	权威信息安全认证体系，考察模型在安全管理、访问控制、风险治理等领域的专业知识覆盖度与答题准确率，适用于评估模型在通用信息安全领域的掌握程度。	ISC² 官方网站认证考试指南
CS - Eval	面向网络安全任务的大模型能力综合评测集，覆盖 11 个网络安全主类、42 个子类，共计 4369 道题目，包含选择题、判断题、知识抽取等题型，兼顾知识性与实战性，用于评估模型的安全通识与任务执行能力。	[ModelScope 数据集](https://modelscope.cn/datasets/cseval/cs - eval/) 论文介绍 (arXiv)
C - Eval	中文能力评估。由上海交通大学、清华大学和爱丁堡大学的研究人员在 2023 年 5 月联合推出。包含 13948 个多项选择题，涵盖了 52 个不同的学科和四个难度级别。	论文链接 (arXiv) CSDN 实践介绍
GSM8K	解决数学问题的能力。Google 开发的一个数学问题求解数据集，包含大约 8,000 个高中到大学水平的数学问题。	[GSM8K](https://github.com/openai/grade - school - math) [GitHub](https://github.com/openai/grade - school - math)
BBH	复杂语言理解能力。由 Google、斯坦福等研究人员开发的数据集，包含大量复杂语言理解任务的集合，可能包含需要深度推理、常识运用或复杂认知技能的任务。	论文链接 (arXiv)

评测结果

评测维度	具体内容
纵向评测对比	与原始模型 SecGPT - mini 对比，训练后的模型在 CISSP、CS - EVAL、CEVAL、GSM8K、BBH 等指标上均大幅跃升。
横向评测对比	相较于基础模型 Qwen2.5 - Instruct，SecGPT 在所有评测指标上均有超越，在安全类数据集上表现更优。

安全能力提升表现

渗透测试场景能力

SecGPT 能模拟渗透攻击流程，具备关键工具命令分析、Payload 构造、利用链生成等能力。

日志分析和流量分析能力

在安全日志与网络流量场景下，SecGPT 能自动识别异常事件、构建攻击链图谱、抽取关键 IOC，辅助完成事件溯源与告警分类。

逆向分析能力

基于对反汇编、API 调用序列、加壳行为等低层数据的理解，SecGPT 能辅助完成恶意样本的静态分析、特征提取与家族归类。

代码审计能力

import java.util.*;
import java.util.stream.Collectors;

public class AverageCalculator {

    public static double calculateAverage(Object input, boolean strict) {
        if (strict) {
            System.out.println("Running in STRICT mode");

           
            @SuppressWarnings("unchecked")
            List<Number> numbers = (List<Number>) input;
            double total = 0;
            for (Number num : numbers) {
                total += num.doubleValue();
            }
            return total / numbers.size();
        } else {
            System.out.println("Running in SAFE mode");

            List<Double> parsed = parseInputSafe(input);
            double total = parsed.stream().mapToDouble(Double::doubleValue).sum();
            return total / parsed.size();
        }
    }

   
    public static List<Double> parseInputSafe(Object input) {
        List<Double> result = new ArrayList<>();

        if (input instanceof String) {
            String s = (String) input;
            if (!s.matches("\\d+")) {
                throw new IllegalArgumentException("String must contain only digits.");
            }
            for (char c : s.toCharArray()) {
                result.add(Double.parseDouble(String.valueOf(c)));
            }
        } else if (input instanceof List<?>) {
            for (Object obj : (List<?>) input) {
                try {
                    result.add(Double.parseDouble(obj.toString()));
                } catch (NumberFormatException e) {
                    throw new IllegalArgumentException("Invalid element in list: " + obj);
                }
            }
        } else {
            throw new IllegalArgumentException("Unsupported input type: " + input.getClass());
        }

        return result;
    }

   
    public static void main(String[] args) {
        List<TestCase> testCases = Arrays.asList(
            new TestCase("12345", false),
            new TestCase("12345", true),           
            new TestCase(Arrays.asList(1, 2, "3", "4"), false),
            new TestCase(Arrays.asList(1, 2, 3, "four"), false),
            new TestCase(Arrays.asList(1, 2, 3, "four"), true)   
        );

        for (int i = 0; i < testCases.size(); i++) {
            TestCase tc = testCases.get(i);
            System.out.println("\n--- Test Case " + (i + 1) + " | strict=" + tc.strict + " ---");
            try {
                double avg = calculateAverage(tc.input, tc.strict);
                System.out.println("✅ Average: " + avg);
            } catch (Exception e) {
                System.out.println("❌ Error: " + e.getMessage());
            }
        }
    }

   
    static class TestCase {
        Object input;
        boolean strict;

        TestCase(Object input, boolean strict) {
            this.input = input;
            this.strict = strict;
        }
    }
}

工具使用

SecGPT 在工具使用方面也有相应表现，相关示例可参考文档中的图片。

🔧 技术细节

模型训练

基于 Qwen2.5 - Instruct 系列与 DeepSeek - R1 系列模型，结合自建安全任务集与安全知识库，在 8 台 A100 GPU 集群上持续训练一周以上，完成大规模预训练 + 指令微调 + 强化学习。

训练指标分析

训练与验证损失：二者均平稳下降，模型在训练集与验证集上持续收敛，无过拟合迹象。
学习率曲线：采用 Warmup + 衰减策略，提升早期训练稳定性与收敛速度。
梯度范数：整体波动平稳，未出现梯度爆炸或消失，训练过程健康稳定。
评估表现：eval/runtime 与 eval/samples_per_second 波动范围小，系统资源使用高效，推理吞吐量稳定。

📄 许可证

本项目采用 apache - 2.0 许可证。

📮 联系我们

SecGPT 是面向网络安全领域的大模型开源项目，欢迎全球的安全研究者、工程师、爱好者共同参与建设与优化： - 🧠 提出使用建议或功能需求 - 🐞 反馈问题并提交 Issue - 💻 贡献代码与安全任务数据集 - 📢 参与使用经验交流与最佳实践分享

📬 若您对模型有任何疑问或合作意向，欢迎通过 GitHub 参与贡献或联系云起无垠团队。

⭐ Star History

⚠️ 免责声明

⚠️ 重要提示

本项目为研究与交流目的所构建，输出内容可能受限于模型训练数据的覆盖范围。

用户在使用模型过程中，应自行判断其输出的正确性与适用性。

若您计划将本模型用于“公开发布或商业化部署”，请务必明确承担相关法律和合规责任。

本项目的开发者对因使用本模型（包括但不限于模型本身、训练数据、输出内容）所可能产生的任何直接或间接损害概不负责。