基于时延估计的定位算法研究开题报告

 2021-08-08 21:23:11

1. 研究目的与意义

研究目的: 在各种电子设备高度智能化的今天,如何实现声源定位已经成为语音通信技术领域尤为重要的问题。

在视频会议中,可以通过声源定位技术控制摄像头,使其自动转向说话的对象,可是当处在的环境的存在噪声和其他干扰的时候,简单的语音识别系统就满足不了实际的需求,此时就需要声源定位系统来确定具体的位置。

研究意义: 在噪声小,无混响的条件下,单一的麦克风即可以实现对声源信号的识别并采集到高质量的信号,可是在噪声大,有混响的状况下,单一的麦克风就解决不了这种问题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 国内外研究现状分析

20世纪80年代以来,就已经开始把麦克风阵列应用于语音信号处理,1987年silverman将麦克风阵列引入到语音识别系统,1992年又将阵列信号处理用于移动环境下的语音获取,接着又应用于识别说话人。

1995年flanagan在混响环境下用麦克风阵列来获取声音信号。

1996年silverman和brandstein开始将其应用在声源定位中,用于确定和实时跟踪信号位置。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的基本内容与计划

研究内容:简要介绍了三种声源定位算法,即基于最大输出功率的可控波束形成声源定位法、基于高分辨率频谱估计的声源定位法和基于时延估计的声源定位法,并归纳了三种算法的优缺点。

推导并分析了广义互相关时延估计法,为增强gcc-phat算法对噪声和混响的鲁棒性,在此基础上提出了基于频率选择的改进gcc-phat(generalized cross correlation using phase transform)时延估计法。

在运用广义互相关算法估计麦克接收信号间的时延差的基础上,介绍了三种确定声源位置的方法,包括角度距离法、线性插值法和球形插值法,最终选择了球形插值法实现定位。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

设计了一个可实现的定位系统,给出了实现流程图。

在matlab 环境下模拟室内环境,构建麦克风和声源几何模型;对麦克风接收信号进行分帧处理和静音检测;采用本文的改进gcc-phat算法估计时延差,然后采用球形插值法估计声源位置。

仿真实验结果显示,该系统在中强度的混响和噪声条件下有较好的定位性能。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版