GIDS: 基于GAN的车载网络入侵检测系统
摘要
车辆中的控制器区域网络(CAN)总线是一种有效的标准总线,能够实现所有电子控制单元(ECU)之间的通信。然而,由于CAN总线缺乏安全特性,不足以保护自身。为了有效地检测出可疑的网络连接,我们迫切需要入侵检测系统(IDS)。与传统的互联网入侵检测系统不同,汽车网络的已知攻击特征很少。此外,车辆识别系统需要很高的准确性,因为任何误报错误都会严重影响驾驶员的安全。为了解决这一问题,我们提出了一种新的车载网络IDS模型,GIDS(GAN based Intrusion Detection System,基于GAN的入侵检测系统)采用深度学习模型生成对抗网络。GIDS可以只使用正常数据学习检测未知攻击。实验结果表明,GIDS对四种未知攻击具有较高的检测精度。
关键词 生成对抗网络 入侵检测系统 控制器区域网络 车载安全
1 介绍
汽车技术的进步给驾驶员的生活带来了极大的方便。然而,随着V2X技术能够与车辆以及外部的一切(如车辆、基础设施)进行交互,车辆ECU的安全威胁也越来越高。因此,我们需要开发一个安全系统来减轻车辆的各种风险。特别是,车内网络需要入侵检测系统(IDS)来保护车内所有ECU和相关设备免受新出现的威胁。
Controller Area Network(CAN)是车载网络总线系统的一个标准,为ECU之间提供了有效的通信。CAN总线是一种可靠、经济的车载网络串行总线。但是,由于它使用的是不需要认证的广播通信,攻击者可以很容易地访问CAN总线,这会造成严重的风险。例如,对手可以通过众多外部接口之一的漏洞在CAN总线中注入恶意数据包。此外,许多拥有信息娱乐服务通信模块的现代汽车也可能通过无线Over-The-Air(OTA)更新模块受到攻击。这些攻击不仅会导致车辆出现严重故障,还会威胁到司机的安全。
IDS是当今检测和响应已知及未知攻击的最佳方法,因为它可以连续监控车载系统并实时检测ECU生成的可疑网络事件。最近,有一些关于IDS检测针对车辆的攻击的研究。例如Song等人提出了一种基于CAN数据[1]时间间隔分析的检测模型,Lee等人提出了一种通过监控CAN数据[2]请求和响应的时间间隔来检测入侵的方法。
尽管这些模型是轻量级和高效的,但它们也有一些局限性。当车内环境发生变化时,模型就需要进行大量的更新。另外,由于构建检测系统时反映了特定的攻击,所以检测目标可能是有限的。如果IDS被泄露给攻击者,攻击者可以操纵并避免检测。针对这些问题,我们提出了GIDS (Generative Adversarial Nets based Intrusion Detection System,基于生成对抗网络的入侵检测系统),该系统具有可扩展性、有效性和安全性。
- 可扩展性:即使车内环境发生变化,GIDS也保持一致的检测方法。它只需要一个训练过程。
- 有效性:因为GIDS只需要正常数据进行训练,所以它可以检测入侵,而不局限于特定类型的攻击。因此,GIDS很可能检测到IDS实现过程中未使用的未知攻击。
- 安全性:GIDS是一种具有黑盒特性的深度学习模型。因此,攻击者很难操纵检测系统的内部结构。
1.1 论文结构
我们在sect;1中介绍了车内网络和车内网络的IDS。本文的其余部分组织如下。sect;2介绍了最近的研究。我们在sect;3中介绍了我们的IDS、gid。在sect;4中,我们描述了实验结果并讨论了实验结果。最后在sect;5中对本文进行了总结。
2 相关工作
车载系统异常检测的早期研究是Hoppe等人[3]引入的。他提出了三种可用于异常检测的特征,包括识别增加的循环CAN消息频率、观察低级别通信特征和识别明显的误用消息id。Muuml;ter等人提出了一种基于熵[4]的异常检测方法。Marchetti等分析并识别了CAN[5]序列中的异常。该模型具有内存和计算占用小的特点。SALMAN等人提出了一种基于软件的轻量级IDS和两种基于消息周期时间分析和消息[6]合理性分析的异常算法。它有助于车内网络入侵检测系统领域的更先进的研究。
各个领域的许多安全研究都采用了深度学习的方法。例如,张等人提出了一种深度学习方法,通过使用专门设计的CNN来检测Web攻击[7]。该方法基于对HTTP请求包的分析,只需要对其进行一些预处理,而繁琐的特征提取是由CNN自己完成的。近年来,生成对抗网络(GAN)不仅被用于图像生成,还被用于异常检测等其他研究。Schlegl等人提出了AnoGAN,它是一种深度卷积生成对抗网络,用来学习多种正常解剖变异。该模型表明,该方法能够正确识别异常图像,如含有视网膜液的图像[8]。
虽然已经发表了各种使用GAN的研究,但大多数研究只集中在图像数据的识别上。GAN对于诸如IDS这样的安全性能起到很大作用。然而,很少有研究探索GAN在其他领域的安全性。我们开发了一种基于GAN的车辆安全入侵检测系统,并在车载网络数据集CAN数据上展示出高性能。
3 GIDS:基于GAN的入侵检测模型
3.1 转换CAN数据为图像
CAN总线支持ECU与ECU之间的通信。在CAN总线中,由周期性使用的CAN消息组成的传输非常频繁。车载ECU每秒向CAN总线产生约2000个CAN数据。由电子控制单元产生的大量实时CAN数据必须能够被处理。如果CAN数据的所有位都直接用于图像转换,转换后的图像可能会非常复杂。在这种情况下,GIDS可能需要很长时间来检测,不适合实时检测。
CAN数据中的CAN ID显示重复的模式,我们只从CAN数据中提取CAN标识的模式进行训练,如图1。此外,我们通过用一个One-Hot编码将提取的CAN标识转换成简单的图像。该方法可以减少实时所需的检测时间,提高IDS的性能。
图1:CAN总线框架的结构
图2显示了使用One-Hot编码对CAN ID编码的过程。首先,因为CAN标识是十六进制的,所以CAN ID的每个元素,如“0x2a0”中的“2”,都是以16位的二进制形式表示的。之后,CAN标识的每个元素的二进制形式被编码成One-Hot编码。One-Hot编码使一位为1,其余位为0。例如,如果CAN ID“0x2a0”中的元素“2”,则一个One-Hot编码仅由第二位1和其余所有位0组成。最后,以16*3矩阵形式表示一个像“0x2a0”这样的3位CAN ID。例如,如果CAN ID为“0x2a0”,它由3个One-Hot编码组成,如[0100...000], [0..0100000]和[0..1000000]。我们将该矩阵命名为“CAN图像”。
图2:One-Hot编码过程
图3:GIDS的训练过程
在本研究中,我们提出了基于GAN的车载网络入侵检测模型。我们把这个模型命名为GIDS。GAN是深度学习模型之一。GAN是通过对抗而生成模型的新框架,其中我们同时训练两个模型:捕获数据分布的生成模型G和检测训练数据样本而不是G生成的样本的判别模型D[9]。
图4:One-Hot编码过程
GAN通常用于生成与真实图像相似的假图像。我们针对这个事实,并利用这个事实设计了我们的IDS。GIDS用下面的过程训练了两个鉴别模型,第一个鉴别器和第二个鉴别器,如图3所示。
- 已知攻击训练:第一个鉴别器接收从实际车辆中提取的正常CAN图像和异常CAN图像。由于第一个鉴别器在训练过程中使用攻击数据,因此可以检测到的攻击类型很可能仅限于用于训练的攻击。
- 未知攻击训练:生成器G和第二个鉴别器通过对抗过程同时训练。生成器通过使用随机噪声生成假图像。第二鉴别器接收正常的CAN图像和生成器生成的假图像,并估计接收到的图像是真实CAN图像的概率。也就是说,第二个鉴别器鉴别输入图像是真实的CAN图像还是由发生器产生的假图像。发生器和第二个鉴别器相互竞争并提高它们的性能。在GIDS模型中,第二个鉴别器最终赢得了生成器,因此第二个鉴别器甚至可以检测到与真实can图像相似的假图像。
如图4所示,GIDS通过以下步骤检测车内网络的攻击。
- 实时CAN数据使用One-Hot编码,并转换成CAN图像。
- 第一个鉴别器接收CAN图像并输出一个介于0和1之间的值。
- 如果输出低于阈值,则当前数据被判断为异常。(因为第一个鉴别器是针对已知攻击进行训练的,所以在这个过程中不太可能检测到未知攻击。)
- 如果输出高于阈值,则第二鉴别器接收相应的CAN图像。与步骤2和步骤3一样,第二鉴别器接收CAN图像并输出一个介于0和1之间的值。
- 如果输出低于阈值,则当前数据被判断为异常。(因为第二鉴别器仅用正常数据训练,所以要检测的攻击数据不受限制。也就是说,甚至有可能检测到未知的攻击。)
我们的目标是确保仅使用正常数据检测未知攻击的高准确性。然而,如果我们仅使用只用正常数据训练的第二鉴别器,则检测精度可能低于使用攻击数据训练的第一鉴别器时的检测精度。因此,我们将第一鉴别器和第二鉴别器结合起来,能够检测已知攻击和未知攻击。
3.2 神经网络的设计
在本章中,我们描述了GIDS模型中鉴别器和生成器的两种模型结构。我们测量了由卷积神经网络(CNN)和深度神经网络(DNN)组成的鉴别器和生成器的四种组合的检测性能。选择检测性能最好的算法组合作为GIDS神经网络。
- 设计鉴别器
鉴别器由三层组成的深度神经网络组成,如图5(b)所示。鉴别器将输入数据的维数减少到0到1之间的一个输出。
图5:GIDS的结构
图6:DoS、FUZZY和RPM/GEAR攻击示例
图5展示了鉴别器对64维CAN ID降维的过程。每层的激活函数为ReLU函数,最后一层的激活函数为sigmoid函数。最后,鉴别器的输出用于区分车载网络中的正常状态和异常状态。
- 设计生成器
生成器由五层组成的反卷积神经网络组成,如5(a)所示。生成器将随机噪声数据的维度扩展到与鉴别器的输入数据大小相同的一个图像。也就是说,生成器生成一个类似于从CAN ID转换而来的真实CAN图像的假图像。每层激活函数使用ReLU,最后一层激活函数使用Tanh。生成器和鉴别器通过反向传播来计算成本,从而减少实际答案和模型输出之间的误差。
4 实验和结果
4.1 实验环境
在实验中,我们使用两个标准:检测率和准确率。检测率定义为检测到的异常数据占总异常数据的比例。准确率被定义为包括正常和异常在内的数据被正确分类的比例。我们在下面的实验环境中测试了GIDS模型。
- CPU: Intel(R) Xeon(R) CPU E5-1650 v4 @ 3.60GHz
- RAM: 32.0GB
- GPU: NVIDIA GeForce GTX 1080
4.2 攻击
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[595990],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料