WhiteRabbitNeo-2.5-Qwen-2.5-Coder-7B开源代码生成模型

首页

Whiterabbitneo 2.5 Qwen 2.5 Coder 7B

由 WhiteRabbitNeo 开发

基于Qwen2.5-Coder-7B微调的网络安全领域代码生成模型，专注于攻防安全场景

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #网络安全代码生成 #攻防对抗专用 #多协议漏洞检测

下载量 385

发布时间 : 9/28/2024

模型简介

该模型是WhiteRabbitNeo系列模型之一，专门用于网络安全领域的代码生成任务，能够生成可直接用于生产环境的安全相关代码

模型特点

网络安全专用

专门针对网络安全攻防场景优化，能识别和生成安全相关代码

生产级代码

生成的代码可直接投入生产环境使用

ChatML格式支持

采用ChatML提示格式进行交互

使用限制

包含严格的WhiteRabbitNeo扩展使用条款，禁止用于非法或有害用途

模型能力

代码生成

网络安全分析

漏洞检测代码编写

安全工具开发

使用案例

网络安全

端口扫描工具开发

生成检测常见开放端口(HTTP,FTP,SSH等)的扫描代码

可直接部署的端口扫描脚本

漏洞检测

生成检测已知软件漏洞的代码

基于NVD数据库的漏洞检测工具

安全配置检查

生成检查Web服务器安全配置的代码

自动化安全配置审计工具

🚀 WhiteRabbitNeo-2.5-Qwen-2.5-Coder-7B

WhiteRabbitNeo 是一个可用于攻防网络安全的模型系列。目前，我们的模型以公开预览的形式发布，旨在展示其能力并评估此类人工智能对社会的影响。

🚀 快速开始

我们的最新模型已在我们的 Web 应用程序和 Kindo.ai 上上线！点击链接访问：https://www.whiterabbitneo.com/

加入我们的 Discord 服务器：https://discord.gg/8Ynkrcbk92 （12 月 29 日更新，现为永久加入链接）

✨ 主要特性

多功能性：可用于攻防网络安全领域。
公开预览：以公开预览形式发布，便于评估社会影响。

📦 安装指南

暂未提供安装步骤相关内容。

💻 使用示例

基础用法

ChatML 提示格式使用示例如下：

import torch, json
from transformers import AutoModelForCausalLM, AutoTokenizer

model_path = "WhiteRabbitNeo/WhiteRabbitNeo-2.5-Qwen-2.5-Coder-7B"
output_file_path = "/home/user/conversations.jsonl"

model = AutoModelForCausalLM.from_pretrained(
    model_path,
    torch_dtype=torch.float16,
    device_map="auto",
    load_in_4bit=False,
    trust_remote_code=False,
)

tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)

def generate_text(instruction):
    tokens = tokenizer.encode(instruction)
    tokens = torch.LongTensor(tokens).unsqueeze(0)
    tokens = tokens.to("cuda")

    instance = {
        "input_ids": tokens,
        "top_p": 1.0,
        "temperature": 0.75,
        "generate_len": 2048,
        "top_k": 50,
    }

    length = len(tokens[0])
    with torch.no_grad():
        rest = model.generate(
            input_ids=tokens,
            max_length=length + instance["generate_len"],
            use_cache=True,
            do_sample=True,
            top_p=instance["top_p"],
            temperature=instance["temperature"],
            top_k=instance["top_k"],
            num_return_sequences=1,
            pad_token_id=tokenizer.eos_token_id,
        )
    output = rest[0][length:]
    string = tokenizer.decode(output, skip_special_tokens=True)
    return f"{string}"

conversation = f"""<|im_start|>system\nYou are an AI that code. Please answer with code, and make sure to format with codeblocks using ```python and ```.<|im_end|>\n<|im_start|>user\n"""

while True:
    user_input = input("You: ")
    llm_prompt = f"{conversation}{user_input}<|im_end|>\n<|im_start|>assistant\nSure! Let me provide a complete and a thorough answer to your question, with functional and production ready code.\n"
    answer = generate_text(llm_prompt)
    print(answer)
    conversation = f"{llm_prompt}{answer}<|im_end|>\n<|im_start|>user\n"

高级用法

如果运行时遇到任何拒绝情况，请按以下方式进行生成：

llm_prompt = f"{conversation}{user_input}<|im_end|>\n<|im_start|>assistant\nSure! Let me provide a complete and a thorough answer to your question, with functional and production ready code.\n"

示例代码也已更新。

📚 详细文档

涵盖主题

开放端口：识别开放端口至关重要，因为它们可能是攻击者的入口点。常见要检查的端口包括 HTTP（80、443）、FTP（21）、SSH（22）和 SMB（445）。
过时软件或服务：运行过时软件或服务的系统通常容易受到攻击。这包括 Web 服务器、数据库服务器和任何第三方软件。
默认凭据：许多系统和服务安装时使用默认的用户名和密码，这些都是众所周知的，很容易被利用。
配置错误：配置不正确的服务、权限和安全设置可能会引入漏洞。
注入漏洞：SQL 注入、命令注入和跨站脚本（XSS）是 Web 应用程序中常见的问题。
未加密服务：不使用加密的服务（如 HTTP 而不是 HTTPS）可能会暴露敏感数据。
已知软件漏洞：使用国家漏洞数据库（NVD）等数据库或 Nessus 或 OpenVAS 等工具检查软件中的已知漏洞。
跨站请求伪造（CSRF）：这是指从 Web 应用程序信任的用户传输未经授权的命令。
不安全的直接对象引用：当应用程序根据用户提供的输入直接访问对象时会发生这种情况。
Web 服务器/应用程序中的安全配置错误：这包括不安全的 HTTP 标头或透露过多信息的详细错误消息等问题。
身份验证和会话管理漏洞：这可能允许攻击者破解密码、密钥或会话令牌，或利用其他实现漏洞来冒充其他用户的身份。
敏感数据暴露：包括暴露敏感数据的漏洞，如信用卡号、健康记录或个人信息。
API 漏洞：在现代 Web 应用程序中，API 经常被使用，并且可能存在不安全的端点或数据泄漏等漏洞。
拒绝服务（DoS）漏洞：识别易受 DoS 攻击的服务，这些攻击可能使资源无法供合法用户使用。
缓冲区溢出：在较旧的软件中常见，这些漏洞可能允许攻击者使系统崩溃或执行任意代码。

使用条款

当您访问并使用此人工智能（AI）模型时，您作为用户承认并同意，您独自对使用该模型及其结果负责。您特此同意赔偿、辩护并使此 AI 模型的创建者、开发者以及任何关联人员或实体免受因您使用该 AI 模型而直接或间接产生的任何和所有索赔、责任、损害、损失、成本、费用、费用（包括合理的律师费和诉讼费）。

此 AI 模型按“原样”和“按可用”的状态提供，不提供任何形式的明示或暗示保证，包括但不限于适销性、特定用途适用性和不侵权的保证。创建者不保证该 AI 模型将满足您的要求或在不间断、安全或无错误的基础上可用。

您使用该 AI 模型需自行承担风险和判断，并且您将独自对因使用该 AI 模型而导致的计算机系统损坏或数据丢失负责。

本免责声明构成您与该 AI 模型创建者之间关于您使用该模型的协议的一部分，取代您与创建者之间之前关于您使用此 AI 模型的任何协议。

🔧 技术细节

暂未提供相关技术细节。

📄 许可证

Apache-2.0 + WhiteRabbitNeo 扩展版本

WhiteRabbitNeo 对 Apache - 2.0 许可证的扩展：使用限制

您同意不以以下方式使用该模型或该模型的衍生产品：

以任何违反适用的国家或国际法律或法规，或侵犯任何第三方合法权益的方式；
以任何方式用于军事用途；
以任何方式用于剥削、伤害或试图剥削或伤害未成年人；
为伤害他人的目的生成或传播可验证的虚假信息和/或内容；
生成或传播符合适用监管要求的不适当内容；
在未经适当授权或不合理使用的情况下生成或传播个人可识别信息；
诽谤、诋毁或以其他方式骚扰他人；
用于对个人的合法权利产生不利影响或以其他方式创建或修改具有约束力、可执行义务的全自动决策；
用于旨在或实际上基于在线或离线社会行为或已知或预测的个人或个性特征对个人或群体进行歧视或伤害的任何用途；
为了实质性扭曲特定人群基于其年龄、社会、身体或精神特征的行为，从而对该人群中的个人或他人造成或可能造成身体或心理伤害，而利用该特定人群的任何脆弱性；
用于旨在或实际上基于受法律保护的特征或类别对个人或群体进行歧视的任何用途。

模型信息

属性	详情
模型类型	WhiteRabbitNeo 系列模型
基础模型	Qwen/Qwen2.5 - Coder - 7B
语言	英语
任务类型	文本生成
库名称	transformers
标签	code、qwen - coder、finetune