1. 研究目的与意义
研究背景:科技的迅速发展给人们的生活带来了极大的便利,但是也出现相应的危害,恶意流量开始侵入人们的日常,对人们使用网络时造成了很大的困扰,所以如何快速准确的发现恶意流量成为当前研究的重点。本课题针对这一问题展开研究,力图设计基于svm与co-training的恶意流量检测方法与实现,在充分利用当前机器学习领域的最新研究成果基础上,为恶意流量识别问题提供新的思路和解决方案。
研究目的:传统的恶意流量检测方法包括:基于协议特征、基于流特征等以及基于机器学习的检测方法,其中,机器学习方法尤其是svm方法具备所需样本量少、泛化能力高等优势,因此在流量识别、文本分类等方面存在较大的优势,svm方法(支持向量机,supportvectormachine)是vapnik等研究人员在研究统计学习时基于线性分类器的另一种设计。它的主要内容是通过一个非线性映射把样本空间映射到一个高维乃至无穷维的特征空间中,使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题,这使得它相对其他方法具备更强的泛化能力和准确性。但其不足在于仍然属于监督学习类型的分类方法,需要提供一定数量人工标记的训练样本,而这对于流量识别而言意味着了大量的开销。因此,为了减少训练样本方面的开销,本文的提出引入半监督方法——co-trainning算法来降低svm对标记样本数量的需求,co-trining算法又叫协同训练或协同学习,它的的主要思路是将是监督学习与无监督学习相结合,在少量的标注样本基础上通过充分利用大量未标注样本所蕴含的信息,从而获得具备较强准确性的分类器,其在减少有标签数据量要求方面有着突出的优势。因此,半监督模型可以有效减少对训练数据标记的需求量。通过引入co-trainning方法,本课题拟提出一种基于svm与co-training的恶意流量检测方法,该方法将svm与co-training结合,能够减少有标签的数据使用,并能有效地提高分类模型的准确度。
研究意义:通过引入co-trainning方法,将原先的svm方法与co-training结合,既能够减少有标签数据的使用量,降低大量的人工标记成本,又能够保留svm方法的优势,因此对相对传统的svm方法,本课题提出的恶意流量识别方法能够在减少恶意流量检测模型训练开销的同时提高模型检测的识别能力,因此在开销、准确性等方面具有较大优势,能够为帮助人们快速准确检测恶意流量提供有力的支撑。
2. 研究内容和预期目标
研究内容:
1、分析以kdd99数据集数据的结构特点,并对数据集做归一化处理;
2、学习理解co-training等半监督学习方法以及svm分类理论以及实现方法;
3. 研究的方法与步骤
研究方法:
1、根据任务书了解本次课题的研究方向与研究的目的;
2、从图书馆与网络查询资料理解基本svm与co-training的技术概念与方法;
4. 参考文献
[1] 鲜永菊;入侵检测[j];西安电子科技大学出版社;2009.
[2] 肖云,王选宏;支持向量机理论及其在网络安全中的应用[j];西安电子科技大学出版社;2011.
[3] 胡良谋,曹克强,徐浩军,董新民;支持向量机故障诊断及控制技术[j];国防工业出版社;2011.
5. 计划与进度安排
1、2022.1 ---- 2022.2 查阅资料,了解课题背景, 撰写开题报告
2、2022.2 ---- 2022.3 根据课题要求,进行需求分析,熟悉开发工具
3、2022.3 ---- 2022.3 根据分析结果,对系统进行概要设计
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。