SecRoBERTa开源预训练语言模型 - 专为网络安全领域任务优化

首页

Secroberta

由 jackaduma 开发

SecRoBERTa是基于网络安全文本训练的预训练语言模型，专为网络安全领域任务优化。

大型语言模型

Transformers

英语开源协议:Apache-2.0 #网络安全文本预训练 #威胁情报分析 #安全事件提取

下载量 16.75k

发布时间 : 3/2/2022

模型简介

SecRoBERTa是一个基于RoBERTa架构的预训练语言模型，专门针对网络安全领域的文本进行训练。它通过使用网络安全相关的语料库（如APTnotes、Stucco-Data等）和自定义词表(secvocab)，提升了在网络安全领域的下游任务表现，如命名实体识别、文本分类、语义理解等。

模型特点

网络安全领域优化

使用网络安全领域的特定语料库进行训练，提升在相关任务上的表现。

自定义词表

使用专为网络安全文本设计的自定义词表(secvocab)，提高文本匹配和处理效率。

多源训练数据

整合了APTnotes、Stucco-Data、CASIE和SemEval-2018任务8等多个网络安全数据源。

模型能力

命名实体识别

文本分类

语义理解

问答系统

掩码填充

使用案例

网络安全分析

网络安全报告分析

从网络安全报告中提取关键信息，如攻击类型、受影响系统和时间等。

相比通用模型，能更准确地识别网络安全相关术语和概念。

威胁情报处理

处理和分析威胁情报数据，识别潜在的安全威胁和攻击模式。

提高威胁情报处理的准确性和效率。

安全事件检测

安全事件识别

从文本中识别和分类安全事件，如数据泄露、恶意软件攻击等。

相比通用模型，能更准确地识别和分类安全事件。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Secroberta

模型简介

模型特点

模型能力

使用案例

🚀 SecRoBERTa

🚀 快速开始

✨ 主要特性

📄 许可证