声源定位计算机仿真与分析_第1页
声源定位计算机仿真与分析_第2页
声源定位计算机仿真与分析_第3页
声源定位计算机仿真与分析_第4页
声源定位计算机仿真与分析_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、声源定位计算机仿真与分析 摘要 确定一个声源在空间中的位置是一项有广阔应用前景的有趣研究,将来可以广泛 的应用于社会生产、生活的各个方面。 声源定位是通过测量物体发出的声音对物体定位,与使用声纳、雷达、无线通讯 的定位方法不同,前者信源是普通的声音,是宽带信号,而后者信源是窄带信号。根 据声音信号特点,人们提出了不同的声源定位算法,但由于信号质量、噪声和混响的 存在,使得现有声源定位算法的定位精度较低。此外,已有的声源定位方法的运算量 较大,难以实时处理。为解决这些问题,本文系统地研究了基于传声器阵列的声源定 位方法,主要做了以下一些工作: 首先对传声器阵列及其研究现状进行了总体概述,讨论了基

2、于传声器阵列的声源 定位所面临的问题,重点分析了传声器阵列信号处理的特殊性和混响的产生原因及影 响,总结归纳并比较了各种基于传声器阵列声源定位方法的优缺点。重点分析了基于 时延估计(ITD)和强度差异(IID)的声源定位方法。 作者开发了一种基于 Matlab 软件的声源定位系统,结合时延估计和强度差异算法, 进行了系统的声源定位仿真,给出了仿真结果,并提出了改进方案。仿真实验证明所 设计的声源定位系统可用,并可以为进一步的声源定位研究提供平台支持。 关键词:传声器阵列;声源定位;ITD;IID;Matlab TO SIMULATE AND ANALYZE THE SOUND SOURCE L

3、OCALIZATION BY COMPUTER ABSTRACT Localization of sound source is an interesting course of study which will be widely applied in our future life. Sound source localization is realized by processing sound signals,differing from the localization method with sonar,radar or wireless communication in the

4、type of signals.Sound is a wide-band signal,while the later are narrow-band signals.Many sound source localization algorithms are proposed aiming at the characteristic of sound signals.However,signals quality,background noise and room reverberations in enclosure greatly degrade the effectiveness of

5、acoustic source localization.For solve these question,some work are accomplished in this paper. Foremost,the microphone array is generally described,and some issues of sound source localization based on microphone array are discussed.The particularities of signal processing based on microphone array

6、 and the cause and influence of reverberation are analyzed.Some main methods of sound source localization are compared.A sound source localization method based on the interaural time difference(ITD) and interaural intensity difference(IID) is analyzed with emphasis. A sound source localization syste

7、m based on the Matlab was produced.Finally,based on the ITD and IID,some experiment is conducted on the system,and the experimental result is presented.The results showed that further study on sound source localization can be made on the sound source localization system. Key words: Microphone Array;

8、 Sound Source Localization; ITD; IID; Matlab 目 录 第一章 绪论 1.1 声源定位的关键技术及国内外研究现状.1 1.2 基于传声器阵列的定位方法简述.2 1.3 基于传声器阵列的声源定位系统的模型与难点 .3 1.4 声源定位系统的结构 .4 1.4.1 硬件结构.4 1.4.2 软件结构. 5 1.5 本论文的主要工作和内容安排.5 第二章 几种定位方法的介绍 2.1 声音信号分析.6 2.2 声源定位原理.6 2.2.1 仿人双耳的声源定位原理.7 2.2.2 基于到达时间差的声源定位原理.7 2.2.3 基于声压幅比的定位方法.7 2.3

9、声源定位方法的分类和比较.9 2.3.1 基于最大输出功率的可控波束形成定位方法.9 2.3.2 基于高分辨率谱估计技术的定位方法.9 2.3.3 基于时延估计的定位方法.10 2.3.4 定位方法比较.10 第三章 基于时延(ITD)的方位估计 3.1 传声器和声源的几何模型.11 3.1.1 双传声器几何模型与分析.11 3.1.2 传声器阵列几何模型与分析.13 3.2 几何定位方法.13 3.2.1 数据采集方法.14 3.2.2 声音信号的处理.14 3.2.2.1 声源到传声器间距离差的计算.14 3.2.2.2 声源位置的计算与仿真.15 3.3 程序测试与误差分析.17 第四章

10、 基于强度差异(IID)的方位估计 4.1 方法概述与分析.19 4.2 声源方位估计的实现.21 4.2.1 数据的采集.21 4.2.2 声压幅比的计算方法.22 4.2.3 声源位置的计算与仿真.23 4.3 程序测试与误差分析.24 第五章 总结.27 参考文献.28 致谢.29 附录 附录 A.30 附录 B.32 第一章 绪论 1.1 声源定位的关键技术及国内外研究现状 利用目标发出的声音信号来确定目标的方位,是声音探测系统测定目标位置的关 键技术,系统以被动方式测出目标声音的参数,利用声程差等信息来确定目标方向和 距离。声源定位的基本原理是将传声器在空间布置成有一定几何形状的阵列

11、,以接收 目标声音信号的声场信息。通过检测或计算出各传声器所测信号的参数来确定目标的 方位和距离。 20 世纪 80 年代以来,传感器阵列信号处理技术得到迅猛的发展,并在雷达、声纳 及通信中得到广泛的应用。这种阵列信号处理的思想后来应用到语音信号处理中。在 1985 年 Flanagan 将传声器阵列引入到大型会议的语音增强应用中,开发出多种实际产 品。之后,Silverman 和 Brandstein 将其应用于语音识别和声源定位中。进入 90 年代以 来,基于传声器阵列的语音处理算法正逐渐成为一新的研究热点。基于传声器阵列的 产品能够广泛利用于具有复杂背景的语音通信环境,例如会场、多媒体教

12、室、车载免 提电话和助听器等。目前国外从事传声器阵列相关研究的机构主要有:Intel、宝利通、 东芝等。但是国内并没有类似的具有自主知识产权的产品,所以对于该技术的研究具 有较为领先的意义。 出现较早,并且在实际中应用的传感器阵列的信号处理方法是波束形成法1,在这 种方法中,基阵的输出是各个阵元输出的简单的加权求和,通过调整权系数可以在希 望的方向上形成波束,而对其余的方向产生较小的响应。然后对整个观测空间做波束 扫描即可确定信号的方位。但是,基阵的分辨率受瑞利准则的限制,是这种方法自身 无法解决的问题。 针对常规波束形成信号处理中存在的分辨率问题,许多研究工作者进行了大量的 理论研究工作,以

13、期改善基阵的分辨率,最终形成了各种高分辨算法。如最大嫡谱法、 信号子空间法、特征结构法和最小方差法等。与常规波束形成法相比,这些高分辨算 法都有效地改善了基阵的分辨率,但这些方法都有一个共同的缺点,即无法解决相干 源问题。 为了解决相干源情况下的高分辨问题,研究人员又寻找了其它的方法和技术,出 现了最大似然估计法、递增阶数多参数估计法、信号参数估计旋转不变技术、空间平 滑技术、子空间拟合类算法等,这些算法获取了较佳的性能,但是计算量相对庞大。 基于传声器阵列的参数估计法除了上述这些技术之外,还有一种常用方法就是时 延估计法2,3。 所谓时间延迟,是指阵列中不同接收器所接收到的声源信号之间由于信

14、号传输距 离不同而引起的时间差。时间延迟估计是指利用参数估计和信号处理的理论和方法, 对上述时间延迟进行估计和测定,并由此进一步确定其它有关参数,例如信源目标的 距离、方位、运动方向和速度等。 时延估计的理论和技术是由水声目标定位及信号处理发展脱颖而出的。现代声纳 的研究始于 20 世纪初,到第二次世界大战时,各种声纳装置己经被广泛地用于水中兵 器。自 20 世纪五十年代以来,随着信息论、信号检测理论和计算机技术的飞速发展, 以及各个应用领域对时延估计的需求,时延估计理论得到了迅速的发展。 进入上个世纪九十年代以来,除了对以往的方法进行扩展和深入研究以外,又发 展了基于人工神经网络的时延估计方

15、法,基于谱相关理论的时延估计方法和各种自适 应时延估计方法等。 近几年,在时频分析工具的发展下,为了更准确的分析非平稳信号,又出现了基 于短时傅立叶变换的时延估计、基于小波变换的时延估计间等方法。使得时延估计的 精确度以及声源定位的性能都有较大提高。 1.2 基于传声器阵列的定位方法简述 在无噪声、无混响的情况下,距离声源很近的高性能、高方向性的单传声器可以 获得高质量的声源信号。但是,这要求声源和传声器之间的位置相对固定,如果声源 位置改变,就必须人为地移动传声器。若声源在传声器的选择方向之外,则会引入大 量的噪声,导致拾取信号的质量下降。而且,当传声器距离声源很远,或者存在一定 程度的混响

16、及干扰的情况下,也会使拾取信号的质量严重下降。为了解决单传声器系 统的这些局限性,人们提出了用传声器阵列进行声音处理的方法。 传声器阵列是指由一定的几何结构排列而成的若干个传声器组成的阵列。相对于 单个传声器而言具有更多优势,它能以电子瞄准的方式从所需要的声源方向提供高质 量的声音信号,同时抑制其他的声音和环境噪声,具有很强的空间选择性,无须移动 传声器就可对声源信号自动监测、定位和跟踪,如果算法设计精简得当,则系统可实 现高速的实时跟踪定位。 传声器阵列的声音信号处理与传统的阵列信号处理主要有以下几种不同: (1)传统的阵列信号处理技术处理的信号一般为平稳或准平稳信号,相关函数可 以通过时间

17、相关来准确获得,而传声器阵列要处理的信号通常为短时平稳的声音信号, 用时间平均来求得准确的相关函数比较困难。 (2)传统的阵列信号处理一般采用远场模型,而传声器阵列信号处理要根据不同 的情况选择远场模型还是使用近场模型。近场模型和远场模型最主要的区别在于是否 考虑传声器阵列各阵元因接收信号幅度衰减的不同所带来的影响,对于远场模型,信 源到各阵元的距离差与整个传播距离相比非常小,可忽略不计,对于近场模型,信源 到各阵元的距离差与整个传播距离相比较大,必须考虑各阵元接收信号的幅度差。 (3)在传统的阵列信号处理中,噪声一般为高斯噪声(包括白、色噪声),与信源 无关,在传声器阵列信号处理中噪声既有高

18、斯噪声,也有非高斯噪声,这些噪声可能 和信源无关,也可能相关。 由于上述阵列信号处理间的区别,给传声器阵列信号处理带来了极大的挑战。声 波在传播过程中要发生幅度衰减,其幅度衰减因子与传播距离成正比,信源到传声器 阵列各阵元的距离是不同的,因此声波波前到达各阵元时,幅度也是不同的。 另外,当声音信号在传播时,由于反射、衍射等原因,使到达传声器的声音信号 的路径除了直达路径外还存在着多条其它路径,从而产生接收信号的幅度衰减、音质 变差等不利影响,这种现象称为混响(Reverberation)。混响效应的存在产生了很多不 利影响,如所获取的声音质量下降、声源定位的精度严重降低等。 1.3 基于传声器

19、阵列的声源定位系统的模型与难点 为了说明基于传声器阵列的声源定位系统的模型与难点,图 1.1 详细描绘了一个传 声器阵列声源定位应用的实际情况。由图 1.1 可知,传声器阵列系统定位声源的精度受 多方面因素的影响。第一是噪声和反射的噪声;第二是声源的多重反射(即混响) ;第 三是声源与传声器的相对位置。 图 1.1 传声器阵列声源定位系统描述 假定声音传播满足线性波动方程,且周围环境在一段时间内不变,则从声源到传 声器之间可看成线性时不变系统。可设声源信号为 s (n),第 i 个传声器接收到的信号 为 xi (n),若噪声为高斯白噪声,则 xi (n)=hi (n)*si (n)+ i(n)

20、 (1.1) 其中 hi (n)是周围环境的脉冲冲激响应,i(n)是高斯白噪声。 一个高精度声源定位系统所面临的难点主要有: (1)由于声音的反射,传声器不仅收到声音信号的直接到达部分,还收到反射部 分。而声音的反射会导致互相关函数或者波束的尖峰扩展,使得难以确定最大值,从 而加大了定位的误差。 (2)定位系统不仅受到噪声的干扰,而且由于噪声的反射,会产生相关噪声。这 样各传声器间噪声的互相关函数就不等于零,从而增大了定位的难度。 (3)传声器位置的摆放。对于一个定位系统而言,传声器的数量越多,传声器的 相对位置越多样化,提供的空间信息量越大,从而具有较高的定位精度。而在实际系 统中,传声器的

21、摆放位置比较固定,数量也比较少。因此难点就是在尽量少的传声器 和固定摆放位置条件下,提供高的定位精度。 1.4 声源定位系统的结构 一个完整的声源定位系统由硬件部分和软件部分构成。具体结构如下所述。 1.4.1 硬件结构 完整的声源定位系统的硬件结构如图 1.2 所示:由一定数目按特定位置摆放的传声 器阵列,信号预处理系统,同步数据采集系统和数据处理系统组成。 图 1.2 声源定位系统硬件结构框图 在系统工作时,声音信号经传声器转换为电信号,然后经信号预处理系统处理后 把信号调整到数据采集系统的输入信号电压范围,再经过采集系统采集后传输到数据 处理系统,由数据处理系统中的软件系统处理后可得出声

22、源的位置。 1.4.2 软件结构 声源定位系统的软件结构框图如图 1.3 所示。 图 1.3 声源定位系统的软件结构框图 由硬件系统同步采集得到声音信号后,经过去噪,增强等预处理,计算出每个传 声器对的声音到达时间差值或者声压幅度比值,最后通过声源定位程序得到声源估计 位置。 1.5 本论文的主要工作和内容安排 实现一个可仿真的声源定位系统是本论文的目的。在算法研究比较充分的基础上, 设计系统结构,实现声源定位。本文对传声器阵列声源定位系统进行了系统的研究, 主要工作如下: (1)介绍了几种声源定位方法,总结归纳了各种基于传声器阵列的定位方法的优 缺点。 (2)重点研究了时延估计方法,讨论了各

23、种时延估计方法的优缺点。归纳比较了 各种基于时延的方位估计方法。 (3)设计并实现了可仿真的声源定位系统。详细介绍了系统结构,给出了实验结 果,详细分析了各种影响因素对系统定位精度的影响,并给出了改进方案。 本论文的各章主要内容安排如下: 第一章,介绍了系统的应用背景和研究现状,讨论了系统的模型与难点,给出了 声源定位系统的结构。 第二章,分析了声源定位原理和几种声源定位方法。 第三章,给出了基于时间差(ITD)的声源定位设计,详细介绍了传声器的选择与 布局、算法的实现过程及软件系统的设计和实现过程,并对存在的问题进行讨论。 第四章,给出了基于声压差(IID)的声源定位设计,详细介绍了算法的改

24、动及软 件系统的设计和实现过程,并对存在的问题进行讨论。 第五章,总结了本论文所完成的工作,分析了其中的长处和不足,并提出了对后 续研究工作的建议。 第二章 几种定位方法的介绍 2.1 声音信号分析 声源体发生振动会引起四周空气振荡,那种振荡方式就是声波。声波借助空气向 四面八方传播。在开阔空间的空气中那种传播方式像逐渐被吹大的肥皂泡,是一种球 形的阵面波。 除了空气,水、金属、木头等也都能够传递声波,它们都是声波的良好介质。在 真空状态中声波就不能传播了。声音在不同的介质中的传播速度不同。声音的速度受 温度影响,温度越高,速度越快。在 15时,声音在空气中的传播速度为 340m/s,25时为

25、 346m/s。它和温度的关系可以用以下公式来表示: C =331.45 +0.61T(m/s) (2.1) 在使用时,如果温度变化不大,则可认为声速是基本不变的。声波传输距离首先 和大气的吸收性有关,其次是温度、湿度、气压等。 2.2 声源定位原理 根据不同的应用要求,有以下三种声源定位原理。 2.2.1 仿人双耳的声源定位原理 人是我们最熟悉的一个声源定位系统,人的两只耳朵是这个系统的主角。由于耳 廓具有非常特殊的形状,声音经过耳廓的处理后,大脑只需要根据两只耳朵所接收到 的声音强度就能大致定位某一个声源的方位。然而要模拟制作出耳廓这样具有特殊结 构的传感器是比较困难的。Handzel,A

26、.A 等把人的头部用球的模型来近似4,在球相对 的两极各安装一个传声器,给出了两耳功能的解析方程能够有效的定位声音的方向。 2.2.2 基于到达时间差的声源定位原理 人对声源的定位主要用到了声音幅度这个物理量,而机器却可以精确的测量声音 的相位。由于声波在空气中以一定速度传播,到达设置于不同位置的传声器的相位不 同,根据这些传声器对同一声音采集时的相位差别,我们可以计算出同一声音到达每 对传声器的时间差值(又叫时延值) 。图 2.1 是到达时间差 t 的示意图。 如果我们得到了某个声源发出的声音到达一对传声器的时延值,则这个声源就处 于以这对传声器所处的位置为焦点,到达时延所对应的声音传输距离

27、为参数的双曲面 上。使用多对传声器得到多个时延值,也就得到了多个双曲面,声源位置就处于这些 双曲面的相交点。合适的安排传声器的位置,可以使得双曲面的交点只有一个,这点 就是我们要的声源位置。大多数声源定位是基于时延的方法,提高对时延估计的准确 程度是这种方法的关键,而要得到准确的时延估计必须要确保有高效的信号采集能力。 图 2.1 到达时间差 t 的示意图 2.2.3 基于声压幅比的定位方法 与上述基于时间差的方法不同,这种方法利用不同传声器接收到的来自同一个声 源的声音信号在强度上的差异实现声源定位。为此,引入声压幅度比的概念,根据由 声压在传声器处产生的电压输出与对应声源到传声器的距离两者

28、之间存在的关系导出 一个用于声源定位的约束条件。由这个约束条件可确定出三维空间中的一个球面。每 个传声器可导出一个这样的约束条件,由这些约束条件可确定出声源的位置。它们既 可以单独使用,也可以和由基于时间差的方法导出的约束条件一起使用。 为简单起见,首先考虑二维平面上的声源定位问题。图 2.2 为根据声压幅度比定位 平面上一个声源的示意图。假设四个传声器被等间距地排列在 X 轴上,其坐标分别为 (-3a,0),(-a,0),(a,0)和(3a,0)。若声源位于 S(x,y)点处,则声源到四个传声器的距离 分别可表示为: (2.2) (2.3) (2.4) (2.5) 图 2.2 平面上基于声压

29、幅度比声源定位示意图 假设第 i 个传声器上接收到的声压幅度为 e i(t),其值可以由各传声器的实测值得 到,经过推理可以得到: (2.6) (2.7) 这样,把式(2.2) 、 (2.3) 、 (2.4) 、(2.5)代入式(2.6)、(2.7),可得到以 x,y 为变量 的二元二次方程组。求解上述方程组即可得出声源位置的候补解组。再根据对声源的 先验知识(在很多情况下,声源的大致方位是已知的),可以确定出声源的最终位置。而 对于三维空间中的定位,只需要使用不在同一个平面中的四个传声器,便可以唯一的 确定出声源在三维空间中的位置。 2.3 声源定位方法的分类和比较 基于传声器阵列的声源定位

30、问题,就是通过对所接收阵列信号的分析处理来估计 出声源的空间位置信息,如波达方向(Direction of Arrival,简称 DoA)或者二维平面坐 标及三维空间坐标等。 基于传声器阵列的声源定位方法大体上可分为三类: (1)基于最大输出功率的可控波束形成方法。该方法对传声器阵列接收到的声音 信号进行滤波、加权求和,然后直接控制传声器指向使波束有最大输出功率的方向; (2)基于高分辨率谱估计的定位方法。该方法利用求解传声器信号间的相关矩阵 来定出方向角; (3)基于时延估计(Time Delay Estimation,TDE)的声源定位方法。该方法首先 求出声音到达不同位置传声器的时间差,

31、再利用这些时间差求得声音到达不同位置传 声器的距离差,最后用几何知识或搜索的方法确定声源位置。 2.3.1 基于最大输出功率的可控波束形成定位方法 波束形成的基本思想是将各阵元采集到的信号进行加权求和形成波束,进而通过 搜索声源位置来引导波束,修改权值使传声器阵列的输出信号功率达到最大,波束输 出功率最大的点就是声源的位置。在文献5中介绍了该方法的理论基础,文献6将该方 法应用于多声源的定位。 传统的波束形成器的权值取决于各阵元上信号的相位延迟,而相位又与时延和声 源到达延迟有关,故又称为时延求和波束形成器。而现代的波束形成器则突破了上述 局限,在进行时间校正的同时还对信号进行滤波,称为滤波求

32、和波束形成器7。 2.3.2 基于高分辨率谱估计技术的定位方法 该方法来源于一些现代高分辨率谱估计技术,该类声源定位技术是利用接收信号 相关矩阵的空间谱,求解传声器间的相关矩阵来确定方向角。高分辨率谱估计的定位 技术包括现代高分辨率谱估计技术:自回归模型(AR)、最小方差谱估计(MV)和特征值分 解方法(如 MUSIC 算法)。 在实际中,基于高分辨率谱估计定位技术的空间谱的相关矩阵是未知的,必须从 观测信号中来估计,需要在一定时间间隔内把所有信号平均来得到,同时要求接收信 号处于声源、噪声、估计参数固定不变的环境和有足够多的信号平均值。即便满足这 些条件,该算法也不如传统的波束形成方法对声源

33、和传声器模型误差的鲁棒性好。目 前定位问题所涉及算法都是研究远场的线性阵列情况。AR 模型和某些特征值分析的方 法就限定在远场且具有相同特性的线性阵列,但 MV 和 MUSIC 算法己经延伸到一般阵 列的几何结构和近场8。 2.3.3 基于时延估计的定位方法 基于时延估计(Time Delay Estimation,TDE)的声源定位方法在导航系统、声纳系 统等领域都有广泛的应用。该方法首先估计出声源到达传声器阵列的各阵元的相对时 间差,再利用时间差算出声源到达各阵元的距离差,最后用搜索或几何算法确定声源 位置,较适合于单个声源的定位。由于每对传声器时延唯一对应一个双曲面,因此多个 传声器对就

34、可以确定多个双曲面。基于此原理产生出许多定位方法,各有自己的优缺 点。 基于时延估计的声源定位包括 2 个步骤:(1)先进行时延估计,并从中获得传声器阵 列中相应阵元对之间的声音到达时延(Time Delay of Arrival,TDoA)。TDE 的方法很多, 常用的有广义互相关(Generalized Cross Correlation,GCC)函数法9、最小均方(Least Mean Square,LMS)自适应滤波法10和互功率谱相位(Cross-power Spectrum Phase,CSP)法9三种。(2)利用时延估计进行方位估计,主要的方法有角度距离定位法、 球形插值(Sph

35、erical Interpolation,SI)法11、线性插值(Linear Interpolation,LI)法 12,13和目标函数空间搜索定位法8。 2.3.4 定位方法比较 在这三种定位方法中,基于最大输出功率的可控波束形成技术是出现较早且已在 实际中应用的一种定位方法,较多的用于雷达、声呐以及移动通信的信号处理中。可 控波束形成技术本质上是一种最大似然估计,它需要声源和环境噪声的先验知识。而 实际使用中,这种先验知识往往很难获得。 基于高分辨率谱估计的定位方法是通过时间平均来估计信号之间的相关矩阵,需 要信号是平稳过程,估计参数固定不变,而声音信号是一个短时平稳过程,往往不能 满足

36、这个条件。该定位方法的效果和稳定性不如可控波束形成法,但每次迭代的计算 复杂度不像可控波束形成那么苛刻。此外还须假定理想的信号源和相同特性的传声器 等,在实际环境中不可能做到这点。 基于时延估计的定位方法在运算量上远远小于可控波束和谱估计法,可以考虑在 实际中实时实现。但是该方法也有不足之处。其一,估计时延和估计方位分成两阶段 来完成,因此在定位阶段用的参数已经是对过去时间的估计,这在某种意义上只是对 声源位置的次最优估计;其二,时延定位的方法比较适合于单声源的定位,而对多声 源的定位就束手无策;其三,在有较强反射和噪声的情况下,往往很难获得精确的时 延,从而导致第二步的定位产生很大的误差。

37、虽然如此,但由于时延估计定位方法的运算量比较低,而且在适当改进后,在一 定的噪声和反射下有比较好的定位精度,因此适合于在实际中实时应用。 本论文将重点研究基于时延估计和声压幅比14的声源定位方法,这两种方法在模 型的建立与仿真的实现上有很多相似,在第三章和第四章中将分两部分详细讨论这两 种方法。 第三章 基于时延(ITD)的方位估计 本章详细讨论了如何根据估计的时延值来确定声源的方位并进行仿真,定位的方 法为几何定位法,首先分析了传声器和声源的几何模型,然后根据几何方法,实现定 位算法以及对样本数据的采集,最后通过编写 Matlab 程序对算法进行仿真。 3.1 传声器和声源的几何模型 在建立

38、传声器和声源的几何模型的过程中,首先建立双传声器几何模型,然后建 立传声器阵列几何模型,并做出详细的分析。 3.1.1 双传声器几何模型与分析 在本模型中,声源和传声器的坐标位置如图 3.1 所示 图 3.1 声源和传声器的坐标位置 假设第i对传声器m1和m2连线的中点为原点,它们的连线为X轴,声源到这两个传声器 间的时间差是 。用矢量和表示这两个传声器的位置,用矢量 表示声源的位置, 则声源S应该满足矢量方程 (3.1) 其中c为声速。由双曲面的定义可得,满足该方程的S必落在双曲面上。 在图中所示的声源是极坐标形式,将声源坐标和传声器坐标转化为直角 坐标形式,可得 (3.2) (3.3) (

39、3.4) 将式(3.2)、(3.3)、(3.4)代入式(3.1),两边平方可得 (3.5) 当声源离传声器比较远时(即r变得很大时, 趋近于零),式(3.5)可以近似为 (3.6) 所以当已知传声器间的时延和传声器间的距离时,可以近似求得图3.1中的角。也 就是说,当声源离传声器比较远时,可以用以为方向角的圆锥面来近似代替声源可能 的位置。此近似如下图3.2。 图3.2 声源的双曲面和锥面近似图 因此只要求得时延(时间差) ,就能近似求得声源相对于两传声器连线中点的方 向角。 3.1.2 传声器阵列几何模型与分析 在声源定位的研究过程中,双传声器只能确定声源在以一定角度为顶角的双曲面 上,不能

40、确定声源的具体位置。所以,想要探测出声源的位置,必须摆放两组甚至多 组传声器,从而组成传声器阵列。同时,定位的准确程度也取决于传声器的数量,在 经过一定位置的摆放后,传声器的数量越多定位的精度也就越高。图 3.3 就是一种由四 个传声器组成的典型传声器摆放方法。 图3.3 四个传声器的定位摆放示意图 可见,定位系统的成功与否与传声器的摆放有很大关系,传声器的数量会影响定 位的精确程度。 3.2 几何定位方法 本文使用七个传声器组成的传声器阵列来实现声源定位的仿真,传声器的分布如 图3.4所示。其中,假定声源S的坐标为(x0,y0,z0),传声器m2摆放在原点位置,其 坐标为(0,0,0) ;m

41、1和m3摆放在X轴上,坐标为(-a,0,0)和(a,0,0) ;m4和 m5摆放在Y轴上,坐标为(0,a,0)和(0,-a,0) ;m6和m7摆放在Z轴上,坐标为 (0,0,-a)和(0,0,a) ,声源S到各传声器的距离分别为 d1,d2,d3,d4,d5,d6,d7(图中只标示了d1,d2,d3) 。可见,七个传声器覆盖了 整个三维空间,等距的分布在原点、X轴、Y轴和Z轴上,这样的布局方式,一方面严 密而一致,可以充分的接收声源信号;另一方面呈几何对称关系的各传声器的摆放, 减少了很大部分的运算量,更高效的实现了对各个量之间的关系求解过程。 图3.4 七个传声器的定位摆放示意图 3.2.1

42、 数据采集方法 将七个传声器m1,m3,m4,m5,m6,m7放置于以m2为原点的三维直角坐标系 中,两两分布在X,Y,Z轴上,与原点m2的距离为a,a可以根据实际需要取值。声源 发出的声音信号以不同的时间传达至各传声器,由于声速c一定,所以根据传声器阵列 所获得的时间差可以计算出声源至各传声器的距离差。将采集得到的数据以数组的形 式保存,继而进行下一步的运算与分析。 但是,由于本文只涉及到用计算机实现定位仿真,所以必须预先假定声源坐标, 通过对假定坐标的运算得到声源S到各传声器间的距离差,此距离差将作为“已知的测 量值”进行接下来的定位仿真,其过程举例如下: 传声器至原点的间距a=20,声源

43、S坐标x0=50,y0=-200,z0=-60,即S=(50,- 200,-60)。 3.2.2 声音信号的处理 对声音信号的处理过程分为三个环节,首先通过几何方法计算声源到各传声器间 的距离差,然后通过已得的距离差对声源位置进行计算,最后通过Matlab编程实现声 源定位的仿真。 3.2.2.1 声源到传声器间距离差的计算 根据两点间距离公式,声源S到m1的距离可表示为 d1= (3.7) 同理,声源S到m2的距离可表示为 d2= (3.8) 所以得声源到m1和m2的距离差 d12= (3.9) 在Matlab程序编写时,可以使用cumsum函数实现d12的运算。以此类推,可以得到 声源S到

44、各传声器的距离差d23,d24,d52,d13,d62,d27。 但是,由于声源发出的声波在传播过程中受到外界环境中噪音、混音等多方面因 素影响,所以声源到个传声器的实际距离差与计算值之间有一定程度上的偏差。为了 解决这个问题,在d23,d24,d52,d13,d62,d27的计算值的基础上加上一个量“b”, b的值为一个标准差为k的数乘以一百个随机正态分布样本,可以用randn函数实现这一 过程。 3.2.2.2 声源位置的计算与仿真 通过运算得到的声源S至各传声器间的距离差可以确定声源S的坐标。 首先,将d12,d23,d52,d24这四个距离差表达式联立 (3.10) (3.11) (3

45、.12) (3.13) 可得 x=(-d242d23-d522d23-d52d232+2d23d122+d24d232+2d12d232-d242d12-d522d12 - d24d122+d52d122)-4(d24-d52+d12-d23)a (3.14) y=(-d242d23+d522d23-2d24d52+d52d232-d52d242+d24d232+d242d12- d522d12+d24d122+d52d122)-4(d24-d52+d12-d23)a (3.15) z=RootOf(4a2d123d52-4a2d242d122-4a2d123d24-4d242d122d522

46、+2d243d123+ d244d122-2d523d123+2d524d242+d524d232+d124d522+d522d234+d242d234+2_Z2, label=_L3)/ /2(d24-d52+d12-d23)a (3.16) 由于之前给x,y,z分别加上了一个k与一百个随机正态分布样本的乘积“b” ,所 以得到的x,y,z的值均为十行十列的矩阵,将这三个矩阵中的元素求平均值,得到 x,y,z,即估计出的声源S的位置。求平均值的仿真过程可以通过reshape和mean函数 实现。 由(3.14) , (3.15) , (3.16)可见,以声源S到X轴上的m1,m3和到Y轴上的

47、 m4,m5分别为距离差的方程组,得到的结果中,x,y的表达式均很简单明了,可以直 接编写Matlab程序,而z的表达式冗长复杂,对编写程序造成很大的困难。并且,经仿 真后得到的定位效果不佳,尤其当a的取值很小,z0的取值很大时,z0的估计值和实际 值误差很大,例如取a=20,k=0.1,x0=100,y0=200,z0=7600时,声源的估计坐标与实 际如图3.5所示,其中红色“+”为声源S的实际位置,绿色“*”为声源S的估计位置。 图3.5 声源估计坐标与实际坐标相差偏大 由于表达式(3.10) , (3.11) , (3.12) , (3.13)中所选取的传声器 m1,m2,m3,m4,

48、m5分别分布在X轴和Y轴上,所以在仿真实现过程中,x0和y0的 估计值较为准确,z0的估计值偏差很大,所以要做适当的改进。 将d52,d24,d62,d27这四个距离差表达式联立 (3.17) (3.18) (3.19) (3.20) 可得 x=RootOf(-4a2d273d52+2d27d243d522+4a2d24d273+2d274d24d62-2d524d27d24 - 2d273d62d242+8a2d27d62d242-2d623d27d242-2d623d24d272+8a2d622d24d52,label =L9)/ /2(- d27+d62-d52+d24)a (3.21)

49、 y=(-d242d62-d272d24+d27d242+2d52d242-d27d522-d272d52+2d522d24 + d62d522-d622d52-d24d622)/ /4(-d27+d62-d52+d24)a (3.22) z=(d242d62-d272d24+d27d242+d27d522+d272d52+d62d522-d622d52-2d272d62 - 2d622d27+d24d622)/ /4(-d27+d62-d52+d24)a (3.23) 此时,y与z的表达式一目了然,而x的表达式很冗长,其原理与以上一步相同。取 z的表达式(3.23)与(3.14),(3.15

50、)联立,得到的x,y,z的表达式均很简明。同时,由于 这三个表达式中的传声器覆盖了X,Y,Z三个坐标轴,即整个空间,所以得到的声源S 的估计坐标与实际坐标之间的误差很小,同样取 a=20,k=0.1,x0=100,y0=200,z0=7600,在仿真时两点几乎重合,仿真效果很理想。 如图3.6所示,声源S的实际位置与估计位置基本重合。 图3.6 声源S的实际位置与估计位置基本重合 3.3 程序测试与误差分析 经过对算法的多方面改善和合理的Matlab编程,仿真结果较为理想,能够直观的 观察到声源S的实际坐标与估计坐标基本吻合,达到了预期目标。测试过程如下: 采用的传声器摆放如图3.4所示。假定

51、传声器间距a=20,传声器m2在原点。随机产 生100个点,时延根据声源位置和距离差方差的不同分八种情况测试。 (1)声源在(50,200,5) ,距离差d的标准差k=0.1 (2)声源在(50,200,5) ,距离差d的标准差k=0.4 (3)声源在(700,200,5) ,距离差d的标准差k=0.1 (4)声源在(700,200,5) ,距离差d的标准差k=0.4 (5)声源在(-50,200,850) ,距离差d的标准差k=0.3 (6)声源在(-50,200,850) ,距离差d的标准差k=0.7 (7)声源在(700,-450,80) ,距离差d的标准差k=0.3 (8)声源在(70

52、0,-450,80) ,距离差d的标准差k=0.7 测试结果如表3.1所示 表表3.1 基于时延基于时延(ITD)(ITD)算法的测试结果算法的测试结果 估计声源位置和实际声源位置的偏差估计声源位置的标准差 mx-x0 my-y0 mz-z0kx ky kz 1 0.0202 0.0281 0.02030.9964 2.7950 0.9964 2 -0.4470 -0.9609 -0.26335.5216 10.2615 4.1356 4 6.6090 3.9920 5.059835.7284 20.1047 14.0354 5 2.6563 9.1424 5.38235.1587 46.96

53、91 33.5770 6 15.1982 31.8215 14.9926 16.0987 99.6033 69.8814 7 17.7979 -5.2140 0.549783.0877 33.0364 7.4006 8 -8.0194 13.5277 -6.3588177.3602 71.2193 16.6520 由表3.1的结果可以看出,随着x0,y0,z0取值的变大,估计的声源位置和实际声 源位置的偏差会有不同程度的增加,而估计声源位置的标准差的增加量较大,但在可 接受范围内,仿真效果很理想。 即便如此,在仿真过程中仍存在一些不容忽视的问题。例如,当假定的声源坐标 中有两个坐标的数值相等时

54、,仿真图中只出现“+” ,而没有“*” ,如图3.7即为当x0=- 200,y0=-200,z=-60时的仿真结果。图中只显示出了声源的实际值,而我们所要仿真 的估计值却没有得到。 图3.7 只显示了声源S的实际值而没有仿真出估计值 之所以会出现这种结果是因为在算法的实现过程中某些表达式的分母部分出现了 值为零的情况。例如,当选取x0=-200,y0=-200,z=-60为假定声源S坐标时,表达式 (3.14)的分母部分为 -4(d24-d52+d12-d23)a (3.24) 其中,d24=d23,d12=d52,所以表达式的值为零。在使用Matlab进行仿真时,由 于此时(3.24)的值无

55、法计算,所以不能得到相应的声源S的估计坐标,无法实现仿真。 第四章 基于强度差异(IID)的方位估计 4.1 方法概述与分析 与上述基于时间差的方法不同,这种方法利用不同传声器接收到的来自同一个声 源的声音信号在强度上的差异实现声源定位。为此,引入声压幅度比的概念,根据由 声压在传声器处产生的电压输出与对应声源到传声器的距离两者之间存在的关系导出 一个用于声源定位的约束条件。每个传声器可导出一个这样的约束条件,由这些约束 条件可确定出声源的位置。它们既可以单独使用,也可以和由基于时间差的方法导出 的约束条件一起使用。 为简单起见,首先考虑二维平面上的声源定位问题。如图4.1所示,假设四个传声

56、器被等间距地排列在X轴上,其坐标分别为(-3a,0)、(-a,0)、(a,0)和(3a,0)。若声 源位于S(x,y)点处,则声源到四个传声器的距离分别可表为: (4.1) (4.2) (4.3) (4.4) 由关于声波的相关知识可知,声源在第i个传声器处产生的声压由下式给出, (4.5) 其中,为声源在基准距离 处产生的声压,为声源简谐震动的角频率,, 为 声速,而。 根据传声器的特性,在第i个传声器处,由上述声压所产生的电压输出为: (4.6) 其中,为由第i个传声器的传递特性确定的参量, 为声波在第i个传声器处的入射角。 如果四个传声器的传递特性完全相同(用H表示),则对其中任意两个接收

57、信号和 而言,除幅度不同和存在一个固定的时间延迟之外,其波形是相同的。 图4.1 平面上基于声压幅度比声源定位示意图 下面,导出与声源定位有关的几个参量。为此,以和之比,有 (4.7) 由式(4.5)和(4.6),知, (4.8) 这样, (4.9) 类似的,在和之间,也存在相似的关系, (4.10) 将上述(4.9)、(4.10)两式中左边的项称为电压幅度比(亦称声压幅度比,以下 简称声压幅比)。其值可由各传声器的实测值得到。 4.2 声源方位估计的实现 实际的声源定位是在三维空间内进行的,因此,有必要将上述在二维情况下得到 的结果扩展到三维。二维到三维的扩展是简单的。事实上,只要增加一组传

58、声器,并 相应地构造一组声压幅比参量,得到类似于(4.9)和(4.10)所示的约束方程,然后 通过求解所得到的约束方程组即可获得声源的实际定位。 4.2.1 数据的采集 将六个传声器m1,m3,m4,m5,m6放置于以m2为原点的三维直角坐标系中,两 两分布在X,Y,Z轴上,其坐标分别为m1(a,0,0),m2(-2a,0,0), m3(0,3a,0),m4(0,-4a,0),m5(0,0,3a),m6(0,0,-4a),a可以根 据实际需要取值,如图4.2所示。声源发出的声音信号以不同的强度传达至各传声器, 根据传声器阵列所获得的声音强度差异可以计算出声源至各传声器的距离。将采集得 到的数据

59、以数组的形式保存,继而进行下一步的运算与分析。 图4.2 六个传声器的定位摆放示意图 与上一章相同,由于本文只涉及到用计算机实现定位仿真,所以必须预先假定声 源坐标,通过对假定坐标的运算得到声源S到各传声器间的声压幅比,此比值将作为 “已知的测量值”进行接下来的定位仿真。 4.2.2 声压幅比的计算方法 假设声源的坐标S(x0,y0,z0)为已知量, S到传声器 m1,m2,m3,m4,m5,m6的距离分别为r1,r2,r3,r4,r5,r6,第i个传声器上接收 到的声压幅为,其值可以由各传声器的实测值得到,经过3.1.2小节的推理可以得 到: (4.11) (4.12) (4.13) (4.

60、14) (4.15) 而r1,r2,r3,r4,r5,r6的值可以由两点间的距离公式求出,所以可以很容易的计 算出e21,e43,e31,e65,e51的实际值。将此实际值作为已知量从而去仿真出声源S的位 置并得到S的估计坐标正是本文的目的所在。 在编写Matlab程序时,可以通过cumsum函数和简单的赋值语句实现以上的过程。 4.2.3 声源位置的计算与仿真 由于声源发出的声波在传播过程中受到外界环境中噪音、混音等多方面因素影响, 而传声器所接收到的声压幅度同时还会受到空间中的物体、空气阻力等其他条件的干 扰,所以传声器接收到的声压幅度与真实值会存在一定的偏差,并且其差值受外界因 素影响的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论