DomURLs_BERT开源模型 - 免费部署，精准检测分类可疑恶意域名网址

首页

Domurls BERT

由 amahdaouy 开发

DomURLs_BERT是一个基于BERT架构的预训练编码器，专门用于检测和分类可疑/恶意的域名与网址。

文本分类

Transformers

其他#恶意网址检测 #多语言域名分类 #网络安全预训练

下载量 725

发布时间 : 8/5/2024

模型简介

该模型通过掩码语言建模目标，在包含多语言网址、域名及域名生成算法（DGA）的大规模语料库上进行预训练，适用于网络安全领域的恶意域名与网址检测分类任务。

模型特点

多语言支持

模型在包含多语言网址和域名的语料库上预训练，能够处理不同语言的域名和网址。

恶意域名检测

专门针对钓鱼攻击、恶意软件、DGA和DNS隧道等网络安全威胁设计的检测能力。

基于BERT架构

利用BERT强大的上下文理解能力，有效捕捉域名和网址中的潜在威胁特征。

模型能力

恶意域名检测

网址分类

钓鱼攻击识别

DGA域名检测

DNS隧道检测

使用案例

网络安全

钓鱼网站检测

识别伪装成合法网站的钓鱼网址

在评估中超越现有基于字符的深度学习模型

恶意软件域名检测

检测用于传播恶意软件的域名

在多项任务上表现优于网络安全专用BERT模型

威胁情报

DGA域名识别

检测由域名生成算法生成的恶意域名

🚀 DomURLs_BERT 模型

DomURLs_BERT 是一个基于 BERT 预训练的编码器，适用于检测和分类可疑/恶意域名与 URL。它在大规模多语言的 URL、域名和域名生成算法（DGA）数据集上，通过掩码语言模型（MLM）目标进行预训练。

🚀 快速开始

使用以下代码开始使用该模型：

# 此处应补充实际的代码示例

✨ 主要特性

基于 BERT 架构，能够有效检测和分类可疑/恶意域名与 URL。
在多语言的 URL、域名和 DGA 数据集上进行预训练，具有更广泛的适用性。
在多个二分类和多分类任务中，表现优于基于字符的深度学习模型和专注于网络安全的 BERT 模型。

📚 详细文档

模型详情

模型描述

这是一个 🤗 transformers 模型的卡片，已发布到模型中心。该模型卡片是自动生成的。

属性	详情
模型类型	基于 BERT 的编码器
语言（网络安全领域）	所有

模型来源

仓库地址：https://github.com/AbdelkaderMH/DomURLs_BERT
论文地址：[https://arxiv.org/pdf/2409.09143]

引用信息

@article{domurlsbert2024,
  title={{DomURLs\_BERT}: Pre-trained BERT-based Model for Malicious Domains and URLs Detection and Classification},
  author={Abdelkader {El Mahdaouy} and Salima Lamsiyah and Meryem {Janati Idrissi} and Hamza Alami and Zakaria Yartaoui and Ismail Berrada},
  journal={arXiv preprint arXiv:2409.09143},
      year={2024},
      eprint={2409.09143},
      archivePrefix={arXiv},
      primaryClass={cs.CR},
      url={https://arxiv.org/abs/2409.09143}, 
}