一、文献综述
1、引言
某种程度上战场环境中的声音信号是其目标和特定事件的体现,随着现代化战争和装备技术的发展,低信噪比的危险声音目标和事件识别成为研究的热点。远距离的枪炮声、飞机声、脚步声、机车声等声目标能量小、隐蔽性高、往往淹没于噪声和干扰声中,使用常规的声探测方法无法实现远距离的辨识。为提高战场声音目标识别技术,从仿生听觉技术原理出发[1],接着再研究目标的发声机理并找出相关算法就显得较为可靠。生物听觉系统的神经注意机制能够在复杂系统或是嘈杂环境中准确分辨声源并获取事件信息。本项课题基于生物听觉原理,开展基于听觉仿生的目标声音识别算法研究,为新型侦听装置的研制奠定基础。该课题的研究有利于军队作战能力的提高,也对国防事业和智能交通管制有了一定的帮助作用。
2、目前的研究现状
仿生,就是依照生物的生理结构,分析优缺点找到适合实际应用的部分,加以建模、研究。算法的核心就是辨识模型,我们可以根据生物听觉对声音事件的认知模型进行辨识。因此研究基于听觉仿生的目标声音识别算法主要分为以下两个步骤进行:第一步,分析生物听觉系统的生理结构,分析并研究生物听觉识别声音的数学模型;第二步,分析比较常用的识别方法,根据已有的识别模型,找到可以用于战场这一复杂情况的具体算法进行研究。达到在复杂系统或是嘈杂环境中准确分辨声源并获取事件信息的目的。
2.1听觉仿生模型
随着声音信号处理技术的深入研究,结果发现与蝙蝠等动物相比,人的听觉系统在听音辨物方面具有独特的优越性,它能够准确地提取目标声音特征并精准地识别声音的方向、类别和内容,且人的听觉系统是与生俱来的,可以不断学习完善的,有着很强的指导意义。在战场这一低信噪比的环境下,各种毫无用处的噪声干扰着我们对目标声音的识别,因此基于人耳听觉仿生的目标声音识别算法日益受到重视。目前国外已有很多学者提出了不同的听觉模型如 Carney, L.H.建立了基于听觉神经纤维响应的计算模型。该模型包括脉冲响应中的频率滑动和双频抑制[2],Abbas P J[3]建立了基于听觉原理的正常编码和响度恢复模型等等,但他们有共同点,就是在一些生理结构上模仿人的听觉功能,通过模仿学习人耳处理声信号的方法,来进行实际应用。因此应先研究人耳生理结构及人耳对声信号处理过程。
人耳的生理结构由外耳、中耳、内耳及听觉中枢神经系统四部分构成,对于外来声波,首先由外耳对其进行收集和放大,经由耳道传输至耳膜;然后经过中耳的阻抗匹配后传到至内耳的耳蜗,并通过耳蜗基模处产生震荡来激发与毛细胞相连的传出神经末梢产生脉冲;最后通过听觉神经系统将信号传输至大脑产生听觉。其中声波主要通过下面的方式产生听觉:首先外界的声波振动鼓膜;其次鼓膜的运动又传递给中耳的听小骨,听小骨带动卵形窗运动,并引起耳蜗外淋巴液和内淋巴液的振动:再次这种振动通过刺激耳蜗内的毛细胞而令其兴奋;然后,将这种兴奋信号转换为神经冲动信号;最后由听神经传到大脑皮层的听觉中枢,形成听觉。
基于人耳的结构和传声方式,目前已有三种常用的听觉系统的数学模型用以分析处理声信号:分别是基底膜数学模型、内毛细胞数学模型和耳蜗基底膜数学模型。张文娟[4]对耳蜗基底膜数学模型和内毛细胞数学模型进行了采用伽玛通滤波器组的matlab的仿真实验,其中内毛细胞数学模型主要解决的是能量转换问题,耳蜗基底膜数学模型主要是解决了声信号的滤波和频率分解。下图一为耳蜗基底膜的matlab模型图:
