1. 研究目的与意义
竞争说话者的干扰是语音通信过程中一种常见的干扰情况。人类的听觉系统可以在多个讲话者的环境中区分和跟踪自己感兴趣的语音信号,并分辨出自己所需要的声音,这种分辨能力是人体内部语音理解机理所特有的一种感知能力,也就是人类的语音分离的能力,称为“鸡尾酒会效应”。在语音和听觉信号处理领域中,如何从多个说话者的混叠语音信号中分离出各个语音源信号或提取出人们感兴趣的耳标语音,来模仿人类的语音分离能力,成为一个重要的研究问题。这也是稳健(robust)语音信号处理中的一个重要研究方向,对语音识别、语音增强等都有着非常积极的促进意义。目前的混叠语音分离大多是建立在无噪环境中的混叠情形下,主要以盲源分离和计算声场景分析两类方法为主,前者是根据信号的统计特性从几个观测信号中恢复出未知的独立源成分;后者则是利用人耳的听觉感知要素从混叠语音中分离出感兴趣的目标语音。通常为了研究方便,这些算法都不考虑环境噪卢的影响。然而,在实际语音通信中,不可避免会受到周围环境噪声的影响,因此寻找有效的带噪混叠语音分离方法具有非常重要的理论价值和实际意义。带噪混叠语音包含了多个说话者和环境噪声,其分离较为困难。目前,一些学者正致力于带噪盲源分离算法的研究,但总体研究成果不多;而噪声环境中的感知要素检测困难使计算声场景分析方法受到一定的局限性。国内外现有的关于带噪混叠语音分离的研究成果非常少。
独立分量分析(independent component analysis,ica),是在研究盲源分离过程中出
现的一种新兴的盲分离技术,自其出现便成为信号处理、数值分析、统计及神经网络等
2. 研究内容和预期目标
本课题研究内容是将混叠的语音信号进行分离。
(1)总体方案的设计
(2)系统原理图设计
3. 研究的方法与步骤
本论文主要结合ica技术,将语音去噪作为一个预处理过程,对带噪声的混叠语音盲分离进行了研究,初步提出了两种有效的解决方案进行。最后方案根据实验的综合情况考虑进行选择:
·方案一:基于小波变换和ica的带噪混叠语音盲分离
小波变换是一种具有多分辨率分析特点的时频分析方法,用它可以较好的进行信号去噪。在该方案中,我们首先采用小波变换对各个带噪混叠语音进行消噪处理,然后用ica算法对消噪后的混叠语音进行分离,最后根据分离信号的特点,进一步提出对其进行矢量归一和再消噪处理,最终得到各个语音源信号的估计。计算机仿真结果取得了很好的分离效果。
4. 参考文献
[1]赵力,语音信号处理,机械工业出版社,2003
[2]韩纪庆,语音信号处理,清华大学出版社,2005
[3]王炳锡,语音编码,西安电子科技大学出版社,2002
5. 计划与进度安排
第一阶段:2022年1月5日-2022年3月1日
有针对性的学习课题相关资料,学习相关学科的基础知识,学习实验所需软硬件的相关知识
第二阶段:2022年3月21日-2022年4月25日,
