基于声能量衰减模型和TDOA相结合的分布式麦克风阵列位置标定方法外文翻译资料

 2022-12-17 14:59:22

英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料


基于声能量衰减模型和TDOA相结合的分布式麦克风阵列位置标定方法

摘要

分布式麦克风阵列的几何结构和尺寸通常是不规则的,在许多应用中需要估计。提出了一种基于声能量衰减模型和到达时间差相结合的分布式麦克风阵列位置标定方法。该方法利用声能量衰减模型估计麦克风与声源之间的粗距离,然后利用到达时间差在粗距离附近的一定范围内搜索精确距离。最后,利用最小均方误差估计方法确定了麦克风的位置。该方法定位精度高,标定性能稳定,计算复杂度低。仿真结果在理论上验证了该方法的有效性。

1. 引言

麦克风阵列由多个麦克风组成。将麦克风采集到的所有声音信号进行联合处理,不仅可以有效地抑制噪声和混响,而且可以对声源进行跟踪定位。因此,麦克风阵列在语音增强和声源定位(SSL)等诸多应用中发挥着重要作用[1-5]。

近年来,通常配备Wi-Fi、蓝牙和音频接口的便携式设备在日常生活中越来越受欢迎,如笔记本电脑、智能手机等。有了这些便携设备,就可以很容易地建立分布式自组织麦克风阵列。与传统的常规麦克风阵列不同,分布式麦克风阵列(DMA)的几何形状和大小是任意的,每个麦克风都可以由自己的处理器控制,并且能够单独收集和处理数据。

DMA的几何和尺寸信息通常是未知的,但在语音增强和声源定位等许多应用中都是非常有用和必要的,其中几何信息是必不可少的,因此麦克风位置标定一直是DMA语音处理中的一个热点问题。然而,在许多情况下,由于户外地形的限制,直接存储器存取的几何或尺寸信息很难或不可能获得,而且由于直接存储器存取中通常有许多麦克风,因此测量过程往往是费力和费时的。例如,在军事环境中,直升机将麦克风阵列空投到未知环境进行监视。在这种情况下,数组的位置随时间而变化,不可能手动获取几何信息。此外,对于麦克风太多或可快速部署的阵列,通常没有足够的时间来精确测量阵列的位置。针对上述问题,本文提出了一种组合方法来解决大型分布式麦克风阵列在室外环境下的标定问题。

基于DMA的信号处理是Aarabi在2001年首次考虑的。基于空间观测函数和最大似然法(ML),他实现了DMA的标定,并提出了一种基于时延的声源定位方法[6,7]。

到达时间差(TDOA)方法被广泛应用于DMA校准问题中,用于估计麦克风与源之间的距离[8-13]。2010年,Valente等考虑了定位误差的各向异性分布,采用传统的基于TDOA的方法对源位置进行估计;然后将观测结果融合在一起,估计阵列的位置和一个麦克风相对于其他[9]的位置。但是DMA的尺寸可能较大,直接应用基于TDOA的标定方法会导致两个问题:一是不再满足空间采样定理,由于有限的声波长会产生空间混叠;二是需要大量的数据进行TDOA估计,以保证位置测量的准确性,这将导致沉重的计算负担。基于能量的标定方法虽然计算量小,但短时信号能量具有一定的随机性,难以获得准确的标定结果。

在估算距离时,许多学者采用ML法对麦克风阵列进行标定[14,8,15]。2005年,Raykar等提出了一种基于飞行时差(TDOF)[8]的DMA标定方法,采用最大似然和非线性最小二乘(LS)技术,Chen等结合能量优化准则和最大似然(ML)方法来估计麦克风和扬声器的位置[15]。解通常是非线性代价函数的最小值。

近年来,一个名为多维标度的方法(MDS)广泛采用传声器阵列校准问题,尤其是在基于ML。MDS方法可以被视为简单的替代传统非线性优化方法,因为他们不需要最初的解决方案,不需要迭代,和不受局部最小值;或者可以把它们看作是为这种非线性优化提供初始估计的一种方法。该算法要求输入麦克风之间的距离,但有时许多麦克风是不可用的。为了解决这一问题,Birchfield和Subramanya提出了一种基点经典多维标度(BCMDS)方法,该方法仅利用麦克风与一小组基点[16]之间的距离来计算麦克风的位置。Amar等人还对缺失测量[17]时的MDS方法进行了扩展。虽然这两种方法消除了对麦克风之间距离的依赖,但是当无法获得距离时,MDS方法的使用仍然是有限的。为了得到自动的距离,在2008年,McCowan等人估计一个麦克风阵列的几何位置在散射噪声环境中通过拟合测量噪声相干函数理论模型的散射噪声场[18],但它只适用与相对较小的数组[19]。2014年,Taghizadeh等人通过相干平均和为DMA校准[20]创建直方图,提高了模型在漫反射场中的鲁棒性和性能。然而,只有当噪声函数符合理论模型时,该方法才有效。

针对上述问题,提出了一种基于声能量衰减模型(AEDM)和TDOA相结合的麦克风位置标定方法。该方法首先利用AEDM估计声源与标定麦克风之间的粗距离(即需要标定位置的麦克风),然后根据粗距离结果,在相对较小的范围内确定精确距离。最后,采用最小均方误差估计方法对每个麦克风的位置进行估计。仿真结果表明,该方法具有较低的计算复杂度。

本文组织如下:第2节和第3节分别介绍了基于信号能量和TDOA模型的测距方法。第四部分提出了一种组合麦克风位置标定方法。仿真和结果讨论见第5节,部分结论见第6节。

2. 基于信号能量的测距方法

声源发出球面波,接收到的声信号能量与声源与接收机之间的距离有关,即,在远离声源d处,接收到的信号能量S为式(1)。

其中S0为声源处的信号能量。Sheng和胡阐明了声源接收到的信号能量与声源到接收机[21]距离的平方成反比,并据此建立了AEDM。假设在一个自由空间中有一个声源和一些麦克风,并且只考虑一个平坦的区域。声源与用于位置校准的麦克风的坐标为s(xs;y)和国会议员(xp;yp)分别。在声传播中,假设信号不受其他物体反射的影响,声信号与背景噪声不相关,因此麦克风接收到的声信号能量为式(2)。

其中Ss (t)是信号能量获得1 m远离声源, Sp (t)是信号能量测量的校准麦克风, gp是校准麦克风增益,ep (t)是背景噪音的能量收集的校准麦克风,和dp之间的欧几里得距离声源和校准麦克风,即能量。(3)

根据声能衰减模型,将式(2)转化为式(4)

从而得到声源与标定麦克风之间的距离。

由于声源处的声信号能量和距离声源1 m处的声信号能量无法直接获得,通常需要将参考麦克风置于已知位置。设参考麦克风的位置为 ,接收到的信号能量和背景噪声能量分别为 和,参考麦克风增益为。根据式(4),参考麦克风与声源的距离为式(5)。

计算Eq的比值,由(4)(5)得到式(6)

如果校准两个麦克风增益,即 , 由式(3)计算,则只要预估两个麦克风的背景噪声能量,就可以确定声源与校准麦克风的距离,即式(7)

3.基于TDOA的测距方法

基于TDOA的测距方法是先计算两个麦克风接收到的信号到达时的时间差,然后将时间差转换为距离差。常用的计算TDOA的方法有互相关法、广义互相关法、自适应滤波法等。

设e1(t)和e2(t)分别表示两个麦克风接收到的两个信号,即式(8)

其中和分别为声信号s(t)从声源传播到两个麦克风时的衰减因子,和分别为传播时间,和分别为两个麦克风接收到的背景噪声。通常假设背景噪声为零均值平稳噪声,与声音信号不相关,不同麦克风的背景噪声互不相关。在分布式麦克风阵列中,当两个麦克风的距离足够大时,该假设是合理的。

则e1(t)和e2(t)的互相关函数可以表示为式(9)

其中E[]为数学期望算子。当 , R12 (s)取最大值。也就是说,两个信号之间的延迟时间即TDOA为式(10)。

将TDOA乘以声速c,两个麦克风的声源相对距离差如式(11)所示

如果已知基准麦克风位置,则根据基准麦克风与声源之间的距离dr,则标定麦克风与声源之间的距离可计算为式(12)

在表示校准参考麦克风和麦克风之间的到达时延(TDOA)。

4. 一种基于AEDM与TDOA相结合的麦克风位置标定方法

提出的DMA位置标定方法是将基于能量的测距方法与基于TDOA的测距方法相结合,估计标定麦克风与声源之间的距离,采用最小均方误差估计方法确定标定麦克风的位置。该方案需要三个不同频段的声源和一个已知位置的参考麦克风。此外,DMA位置校准的参考麦克风和麦克风应该同步,在处理前使用[22]中的方法。由于该方法适用于室外环境,考虑了风的影响,下面的大部分方程都是在自由场中推导的。

根据几何知识,若已知第j个声源的位置为 和声源与标定麦克风的距离,麦克风的位置必须在以为中心,为半径。因此,确定三个圆至少需要三个已知位置的声源,三个圆的交点为麦克风位置。

该方案旨在同时获得三个声源信号。此外,为了保证估计精度,声源最好具有稳定的特性。考虑到一个白噪声在两个不同的时间是不相关的,使用白噪声作为源信号。将白噪声分别通过三个不同通带的滤波器,产生三个不同频段的信号(BPF1、BPF2、BPF3)作为三个声源信号。三个声源同时发射信号;虽然麦克风接收到的是混合信号,但是通过相应的带通滤波器可以很容易地将三个信号分离出来,如图1所示。这样就可以同时采集和处理三种声音信号,使高速估计麦克风位置成为可能。

估算麦克风位置的过程如图2所示。具体而言,图2(a)为有效信号检测过程,图2(b)为麦克风位置估计过程。

对于每一帧,接收到的信号能量Ep作为式(13),先检测是否为噪声帧。

其中ep(m)为标定麦克风接收信号第k帧的第m个采样点,Ms;k为信号序列中第k帧的起始位置,L为帧长。

在噪声帧中,估计背景噪声能量,更新信号活动检测阈值,即

式中,Ep;i为标定麦克风第i帧的接收能量,Emin;k为第k帧之前的K0帧中帧能量的最小值。gamma;是一个常数用于平滑最低能量值和满足0le;gamma;le;1;beta;是一个常数满足0le;beta;le;1,表示噪声帧的门槛,ep是校准麦克风噪声估计;用同样的方法估计了基准麦克风的噪声er。当一个帧被标定和参考麦克风同时确定为有源帧时,用它来估计麦克风的位置。

在有源信号帧中,估计麦克风的位置。图2(b)中Er和Ep分别为基准麦克风和标定麦克风(位置未知)接收到的信号能量。在麦克风的位置估计阶段,参考麦克风接收到的信号和校准麦克风分别通过三个带通滤波器,以及分离信号在相应的频带是用来估计粗校准麦克风和每个声源之间的距离,基于信号能量纠正了背景噪声能量,式(7).第j个声源与标定麦克风的粗距离为式(15)。

标定麦克风的粗位置(xc;由粗距离估计的yc)为下式的解

由前两个方程分别减去第三个方程,将式(16)转化为式(17)

它可以表示为AX = b

利用最小二乘(LS)估计可得到标定麦克风 的坐标

其中e and 是矩阵的换位运算符和逆运算符。

设风速为v,风速在第j声源与标定麦克风传输方向上的投影为

其中() and ()表示校准麦克风和第j声源的坐标。

那么从第j个声源到标定麦克风的实际传输速度 为 。从第j声源到参考麦克风 的传输速度也可以用同样的方法计算。然后采用基于TDOA的测距方法,求出一定范围内的精确距离。以声源j为例,估计粗距离为 ,相应的粗延迟时间为 ,。搜索靠近的范围内的精确距离,到对应的时间为 ,因此精确延时时间的搜索范围为。如果参考麦克风与第j个声源之间的距离为,则它们之间的时延表示为。根据式(10),基准麦克风与校准麦克风之间的准确延时为式(21)。

其中 和 分别表示从声源到参考麦克风和校准麦克风的传输时间。

因此,声源与标定麦克风的精确距离可以计算如下:

其中和分别为声源到校准和参考麦克风传输方向的风速投影, 和 为参考麦克风位置已知。

在估计标定麦克风与三个声源之间的三个距离后,利用式(16)-(18)中的方法可以得到麦克风的位置。

如果方程不存在解,可以采用一种简单的处理方法,即,仍然使用上一帧计算的答案作为当前的交点,假设在估计麦克风位置的过程中,麦克风和声源的位置是固定的。此外,在此假设下,为了减小波动的影响,提高距离估计的精度,可以对粗距离的估计结果进行平滑处理。设距离为,平滑后的结果为,则

其中是通过Eq计算的旧的结果(22)。初始值为零,平滑系数alpha;,满足0 lt;alpha;lt; 1。

与基于TDOA的测距方法相比,该方法大大降低了计算复杂度。具体来说,当使用传统的基于TDOA的测距方法时,在f Hz采样率下,需要进行 个乘法和2Lf(Lf-1) 个加法运算,计算数据与长度L的互相关函数。然后计算互相关系函数,在小范围点 内搜索最大值 (其中 是搜索到标定声源的精确距离时的距离范围),因此只需要约 个乘法和 个加法运算。该方法的计算复杂度可降低到基于TDOA的测距方法的 。由于L比 大得多,所以比值通常小于0.05。

图1 麦克风位置估计声源示意图

图2 麦克风位置估计过程原理图

5. 仿真和结果讨论

为了验证该方法的有效性,利用Matlab进行了仿真。工作区为50m * 50m,四个顶点的坐标分别为(0,0)m、(0,50)m、(50,0)m和(50,50)m;三个声源的坐标分别为(0,0)m、(0,5)m和(5,0)m,参考麦克风位于(5,5)m;有八个位置未知的麦克风和他们的增益已经校准。声源、参考麦克风和位置未知麦克风的分布如图3所示。

三个带通滤波器均为8阶巴特沃思滤波

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[20382],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版