基于相位变换加权的可控响应功率声源定位算法研究开题报告

 2021-08-08 21:23:13

1. 研究目的与意义

在高度发达的信息社会中,语音信号为计算机、自动化系统等提供了一种有效的、良好的人机交互手段。

声源定位技术不但可以为用户提供语音源的位置信息,而且它对基于麦克风阵列的语音增强技术具有重要作用。可控波束形成算法具有抗混响能力强的优点,因此是目前最流行的声源定位算法之一,但是算法的抗噪声能力仍然有待提高。

声源定位技术在基于麦克风阵列的语音信号处理中处于核心地位。声源定位技术不但可以提供位置信息,而且它对基于麦克风阵列的语音增强技术(波束形成方法和盲源分离方法)具有重要的作用。声源位置的估计对于基于波束形成的麦克风阵列语音增强技术非常重要,只有正确估计目标说话人的位置,麦克风阵列的波束才能准确地指向目标声源,取得好的增强效果。此外,利用声源定位技术,还可以改善基本的盲源分离技术在声音混迭的环境的性能,解决语音信号的重构问题,显著改善恢复的语音信号的质量。所以提高声源定位的性能,对于提高基于麦克风阵列的语音信号处理的性能具有非常重要的意义。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 国内外研究现状分析

SRP-PHAT 算法自提出来以后,出现了许多算法用于减少SRP-PHAT 的计算量,然而这些算法同时也降低了SRP-PHAT 的定位性能。2004 年,Mungamuru 和Aarabi 提出了一种加权SRP-PHAT 算法,用于大孔径麦克风阵。2006 年,Zhang Cha 和Florencio等人提出了与波束形成相结合的最大似然声源定位(ML-SSL)。这两种方法都提高了定位性能,然而都需要利用静音帧的数据估计噪声功率谱,使得不适用于噪声变换较快的环境,从而限制了它们的应用场合。

在国内,到目前为止还没有自主产权的产品。因此,研究我国自主的基于相位变换加权的可控响应功率声源定位算法和技术具有重要的意义。我国一些企业、研究所和高校做了大量的相关工作,但是目前对声源定位的研究才算刚刚起步。

3. 研究的基本内容与计划

研究内容

(1)信号的采集和预处理,包括分帧、加窗、静音检测等。

(2)估计每个频率点的信噪比,然后自适应地选择信噪比较大的频率点用于计算可控响应功率。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

本论文研究了SRP-PHAT 这种定位性能更好,对环境的鲁棒性更强的定位算法,SRP-PHAT 可以看作是GCC-PHAT 算法从两个阵元的情况到多个阵元情况的推广,它结合SRP 与PHAT 权的优点,使得它具有比基于时延估计定位算法更好的定位性能。

本课题对学生所学知识和技能的要求更高,需要熟练掌握信号处理和分析的方法,比如傅里叶变换、窗函数等。以及熟练掌握利用快速傅里叶变换计算互相关函数的方法、熟练掌握概率论和数理统计、熟练掌握利用计算机分析数据的方法,并运用Matlab语言。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付