物联网入侵检测的优化:XGBoost和优化后的顺序神经网络的比较分析
物联网入侵检测的优化:XGBoost和优化后的顺序神经网络的比较分析

蓬勃发展的物联网 (IoT) 产生海量敏感数据,对强大的网络安全措施提出了迫切需求。机器学习 (ML) 和深度学习 (DL) 技术为基于异常的入侵检测提供了一种有前景的方法,可以识别表明潜在威胁的异常网络行为。然而,现有方法往往难以有效应对现代网络攻击日益复杂和变化的特性,尤其是在预处理优化和超参数调整方面。
本研究通过提出一种利用增强型 XGBoost 和优化型顺序神经网络 (OSNN) 的新型入侵检测系统 (IDS) 来解决这些局限性。该方法包含几个比传统方法的关键改进:
- 严格的数据预处理:本研究强调全面的数据预处理,包括归一化、类别不平衡处理(例如,欠采样)、类别变量编码和特征提取。这确保了后续模型训练的最佳数据准备。
- XGBoost 的超参数优化:通过网格搜索对 XGBoost 模型进行严格的超参数调整,以最大限度地提高检测精度,尤其是在细微的入侵模式方面。
- 优化的顺序神经网络架构:开发并优化了自定义的 OSNN 架构。仔细调整了超参数,例如滤波器大小、内核大小、池化方法、密集层大小、学习率和激活函数 (ReLU、GeLU、LeakyReLU)。策略性地实施 Dropout 层以增强泛化能力并降低计算成本。OSNN 模型的架构旨在有效提取各种攻击的独特特征。
- 鲁棒性措施:采用 5 折交叉验证和 L2 正则化来减轻过拟合并增强模型的泛化能力,解决数据集类别不平衡可能造成的偏差。
所提出的 IDS 使用三个公开可用的基准数据集进行了严格评估:NSL-KDD、UNSW-NB15 和 CICIDS2017。优化的 XGBoost 模型在 NSL-KDD 数据集上表现出色,实现了 99.93% 的准确率、99.84% 的 F1 分数、99.86% 的 Matthews 相关系数 (MCC) 和极低的误报率 (FPR) 0.0004。OSNN 模型也表现出色,在 NSL-KDD 上实现了 99.0% 的准确率和 1.00 AUC,在 UNSW-NB15 上实现了 96.80% 的准确率和 0.0777 的损失,在 CICIDS2017 上实现了 99.53% 的准确率和 0.0236 的损失。这些结果突出了所提出的方法在准确识别各种数据集中的各种入侵类型的有效性。
与现有研究的比较分析表明,二元和多类分类精度都有显著提高,超过了文献中报道的其他 ML/DL 模型的性能。这种优越的性能归因于增强的预处理技术、优化的模型架构以及鲁棒的正则化和交叉验证方法的结合。
虽然这项研究在物联网入侵检测方面取得了重大进展,但也存在局限性。深度学习模型的计算成本虽然已降至最低,但对于资源受限的物联网设备来说仍然是一个需要考虑的问题。此外,复杂的深度学习模型的可解释性可能具有挑战性,这可能会阻碍人们对其决策的信任和信心。未来的研究可以侧重于通过模型压缩技术和开发更易解释的 AI 方法来解决这些局限性。
总之,这项研究通过提出一种显著提高入侵检测精度和鲁棒性的新型 IDS,为物联网安全领域做出了宝贵贡献。所提出的方法结合了优化的 ML 和 DL 技术,为保护日益互联的物联网环境提供了一种有前景的解决方案。
所用数据集:
- NSL-KDD: https://data.mendeley.com/datasets/t5bffpjd28/1 和 https://www.kaggle.com/datasets/hassan06/nslkdd (CC0 1.0)
- UNSW-NB15: https://www.kaggle.com/datasets/dhoogla/unswnb15 (CC BY-NC-SA 4.0)
- CICIDS2017: https://www.kaggle.com/datasets/chethuhn/network-intrusion-dataset (CC0)
Read the English version (阅读英文版)
免责声明:本文内容来自互联网公开信息,请仔细甄别,如有侵权请联系我们删除。