论文总字数:30801字
摘 要
本文针对基于深度学习的异常算法的实现方式、性能和影响性能的因素展开研究。研究工具为Matlab,入侵检测数据集为KDD 1999。在降维性能的研究上上使用PCA与深度学习RBM网络降维进行比较,比较标准为重构误差值。在分类性能上与朴素贝叶斯作比较,并探究了网络深度、RBM迭代次数、隐藏单元数量等因素对深度学习异常检测算法性能的影响。发现网络深度和BP算法的预训练迭代次数对分类器的性能成正相关。
最后,通过仿真分析验证了所采用的算法的性能。由仿真的数值结果分析可知,由于样本中不同类别的访问样例的分布不平衡,在五分类时,对小样本的识别误差较大;在二分类的情况下,由于样本的分布相对平衡,取得了比较好的异常检测效果。
关键词:深度学习,入侵检测系统,异常检测,降维,重构误差,检测率
Research On Anomaly Detection Algorithm
Based On Deep Learning
Abstract
In this paper, we study on the realization way, performance and the factors which affecting the detection rate of the anomaly detection algorithm. The research tool is Matlab. The Intrusion detection data set is KDD 1999. In the research of dimension reduction, the dimension of PCA is compared with the RBM, and the evaluation is the reconstruction error. The detection rate of Deep Learing is Compared with that of naive Bayes Classifier.The effect of deep learning, RBM number and number of hidden units on the performance of the anomaly detection algorithm is studied. It is found that the number of pre-training iterations of BP algorithm and network depth is positively related to the performance of the classifier.
Finally, the performance of the algorithm is verified by simulation analysis.The numerical simulation results show that, because of the uneven distribution of the samples in different classes of access sample, in five categories, small sample recognition error is large; in binary classification, due to the relative balance of the distribution of the sample ,the detection effect get better.
KEY WORDS: deep learning, IDS, Anomaly Detection, Reduce the Dimensionality, Reconstruction error, Detection rate
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1 引言 1
1.2 入侵检测技术的发展 1
1.2.1 早期的入侵检测模型的建立——IDES 1
1.2.2 从基于主机到基于网络的变革——NSM 2
1.2.3 现代IDS技术的发展 2
1.3 入侵检测算法的分类 3
1.3.1 统计方法(Statistical approach) 3
1.3.2 基于规则的方法(Rule based approach) 3
1.3.3 专家系统方法(Expert System approach) 3
1.3.4 模式识别方法(Pattern recognition approach) 3
1.3.5 人工神经网络方法(Artificial neural network approach) 3
1.4 人工神经网络与深度学习 4
1.5 本课题研究的途径与意义 5
第二章 数据预处理 6
2.1 引言 6
2.2 KDD 1999数据集介绍 6
2.2.1 数据集包含的攻击类型 6
2.2.2 数据集采集的数据 6
2.2.3 训练数据集与测试数据集的分布 7
2.3 数据集预处理技术 8
2.3.1 符号数值化 9
2.3.2 数值归一化 10
2.3.3 特征初筛与抽取 10
2.4 本章小结 11
第三章 降维算法 12
3.1 引言 12
3.2 经典降维算法——PCA 12
3.3 用于降维的深度学习算法——RBM 13
3.4 降维算法的重构比较与分析 14
3.5 本章小结 17
第四章 分类算法 18
4.1 引言 18
4.2 基于统计的算法—朴素贝叶斯 18
4.3 逻辑回归的拓展—softmax分类器 19
4.4 本章小结 20
第五章 算法性能分析与优化 21
5.1 引言 21
5.2 深度学习算法基础性能 21
5.2.1 算法检测率分析 21
5.2.2 算法稳定性分析 22
5.3 探究影响深度学习算法性能的变量 23
5.3.1 BP微调算法的迭代次数与算法性能的关系 23
5.3.2 RBM算法的迭代次数与算法性能的关系 23
5.3.3 深度学习网络深度与算法性能的关系 24
5.3.4 隐藏层单元数对分类性能的影响 25
5.4 算法性能优化方案 25
5.5 本章小结 26
第六章 总结 27
致谢 28
参考文献(References) 29
附录 31
第一章 绪论
1.1 引言
当今时代,随着计算机科技和交互网络的发展,无论是普通民众还是政府机构对计算机网络系统的依赖性都在增加。互联网这个名词从之前的新颖神奇的变得不可或缺,如今的我们已经很难想象如果网络忽然消失,生活会变成什么样,wifi已经渐渐地变得像阳光和空气一样,无影无形却不可或缺。也正是由于以互联网为代表的计算机网络的快速发展,许多安全问题也随之而来。大到对于大型服务器拒绝服务攻击,小到利用入侵窃取QQ密码。发生在计算机网络上的入侵攻击每时每刻都在发生,攻击者们不用露面就能伤人于千里之外,而被攻击者往往很难得到有效地帮助。因此,保护计算机网络以免遭入侵和攻击变得非常重要。因为一次很小的入侵就可能导致巨大损失同时也让网络的伦理性变得不可靠。为此,入侵检测这项技术秉承守护计算机网络系统安全的使命应运而生。
入侵检测(Intrusion Detection)技术,顾名思义,就是检验和发觉系统是否遭受入侵的技术。入侵检测技术可以大致分为特征检测(Signature-based detection)和异常检测(Anomaly detection)。异常检测可以检测主机的活动,观察和计算当前系统是否处于异常状态(即遭受攻击状态),而特征检测则是通过提取主机当前的特征,匹配某种攻击模式,从而识别攻击类型。
剩余内容已隐藏,请支付后下载全文,论文总字数:30801字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;