基于麦克风阵列的语音增强方法_第1页
基于麦克风阵列的语音增强方法_第2页
基于麦克风阵列的语音增强方法_第3页
基于麦克风阵列的语音增强方法_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于麦克风阵列的语音增强方法 概述:在日常生活和工作中,语音通信是人与人之间互相传递信息沟通不可缺少的方式。在语音通信中, 语音信号不可避免地会受到来自周围环境和传输媒介的外部噪声、通信设备的内部噪声及其他讲话者的干 扰。这些干扰共同作用,最终使听者获得的是被噪声污染过的带噪声语音,严重影响了双方之间的交流。 应用阵列信号处理技术的麦克风阵列能够充分利用语音信号的空时信息,具有灵活的波束控制、较高的空 间分辨率、高的信号增益与较强的抗干扰能力等特点,逐渐成为强噪声环境中语音增强的研究热点。本文 将介绍各种麦克风阵列语音增强方法,并总结各个方法的优劣。最终得出更好的、能够去噪的基于麦克风 阵列的

2、语音增强方法。1麦克风阵列麦克风阵列是将两个麦克风的信号耦合为一个信号。在频率响应中也可以根据时域中波束形成与空间滤波 器相仿的应用,分析出接收到语音信号音源的方向以及其变化。采用该技术,能利用两个麦克风接收到声 波的相位之间的差异对声波进行过滤,能最大限度将环境背景声音滤掉,只剩下需要的声波。对于在嘈杂 的环境下使用采用了这种配置的设备,在嘈杂的环境下能使听者听起来很清晰,没杂音。2基于麦克风阵列的语音增强方法2.1基于自适应波束形成器的麦克风阵列语音增强自适应波束形成是现在广泛使用的一类麦克风阵列语音增强方法。最早出现的自适应波束形成算法,其基 本思想是在某方向有用信号的增益一定的前提下,

3、使阵列输出信号的功率最小。在线性约束最小方差自适 应波束形成器的基础上,1982年Griffiths 和Jim提出了广义旁瓣消除器成为了许多算法的基本框架。广义旁瓣消除器(GSC的工作原理是带噪声的语音信号同时通过自适应通道和非自适应通道,自适应 通道中的阻塞矩阵将有用信号滤除后产生仅包含多通道噪声参考信号,自适应滤波器根据这个参考信号得 到噪声估计,最后由这个被估计的噪声抵消非自适应通道中的噪声分量,从而得到有用的纯净语音信号。麦克风阵列的自适应算法通过迭代运算获取波束形成的最优权矢量时,噪声模型的估计是一个非常关键的因素。它的好坏直接影响着系统波束形成的性能。系统地分析了最小均方(LMS)

4、自适应语音增强算法,并针对阻塞矩阵在估计噪声时存在的缺陷,在该算法的基础上提出了一种利用最小值控制递归平均(MCRA)来估计噪声的方法。将此方法应用于波束形成,MCRA估计出的噪声使LMS自适应语音增强的效果更好和抗噪性更强。2.2基于固定波束形成的麦克风阵列语音增强固定波束形成技术是最简单最成熟的一种波束形成技术。1985年美国学者Flanagan提出采用延时-相加波束形成方法进行麦克风阵列语音增强,该方法通过对各路麦克风接收到的信号添加合适的延时补偿, 使得各路输出信号在某一方向上保持同步,并在该方向的入射信号获得最大增益。此方法易于实现,但要 想获取较高的噪声抑制能力则需要增加麦克风数目

5、,然而对非相干噪声没有抑制能力,环境适应性差,因 此实际中很少单独使用。后来出现的微分麦克风阵列、超方向麦克风阵列和固定频率波束形成技术也属于 固定波束形成。采用可调波束形成器的GSC麦克风阵列语言增强算法,其实质在GSC结构中的固定波束形成器前 端引入各通道可调时延补偿,构造可调波束形成器进行声源方位估计,从而在目标声源方位获取阶段即可 利用阵列的空间增益来提高方位估计性能。延迟求和波束形成器主要目的是增强主瓣方向目标信号,而抑 制其他方向的噪声信号。囲2 采用可调適柬形成器前GSC结构图!2 Sinicluni of Fidjti5t?iljlc- bramforitTkrrGSt可调波束

6、形成器结构如图2所示,它利用阵列形成不同波束角度时GSC的输出能量作为代价函数来 估计波束对准声源时各通道语音的时延补偿值,以实现目标语音信号方向的定位其基本思想是:假定目 标信号入射角为a,利用不同的a求岀对应的通道补偿时延值t对各通道接收的语音信号进行时延补偿,然后通过传统GSC算法得到各自对应的增强语音,并比较不同a对应的输岀信号能量,最大能量对应的a即为实际目标信号方向,相应的t即为目标语音到达相邻麦克风的时延补偿值。表1给岀了2种比较算法的语音增强结果从表中可以看出,在3种不同噪声、不同SNR下,该算法的消噪性能均优于传统的 GSC算法。« I 2沖却注百瞎强结呆民續T-n

7、bu Insfln oT qh常wh宦 by !lrfR希陽诸音法2a 2225L 曹 Iia 4917, 32師J>4屜3410, 9(32ft 26IE 2218, 072& kIL 9514 012A 73G糾7.4投射II盍声ia os22. 493(1 7514. 120, 002& 35IL 65熄63韻取T2.3基于后置滤波的麦克风阵列语音增强1988年Zelinski将维纳滤波器应用在麦克风阵列延时一相加波束形成的输出端,进一步提高了语音信号的降噪效果,提岀了基于后置滤波的麦克风阵列语音增强方法(图2)。基于后置滤波的方法在对非相干噪声抑制方面,不仅具有良

8、好的效果,还能够在一定程度上适应时变的声学环境。它的基本原理是:假设各 麦克风接收到的目标信号相同,接收到的噪声信号独立同分布,信号和噪声不相关,根据噪声特性,依据 某一准则实时更新滤波器权系数,对所接收到数据进行滤波,从而达到语音增强的目的。时延倍计图2结合后置滤波的固定波束形成器后置滤波方法存在以下不足:首先,算法的性能受到时延误差的影响,使增强后的语音信号有一定失真; 其次,该方法对方向性的强干扰抑制效果不佳。后置滤波方法极少单独使用,常与其他方法联合使用。2.4基于子空间的麦克风阵列语音增强子空间方法的基本思想是计算岀信号的自相关矩阵或协方差矩阵,然后对其进行奇异值分解,将带噪声语 音

9、信号划分为有用信号子空间和噪声子空间,利用有用信号子空间对信号进行重构,从而得到增强后的信 号。由Asano等提出的基于相干子空间的麦克风阵列语音增强方法是一种典型的子空间方法。该方法首先 将语音信号划分到不同频带,然后在每个频带再利用空间信息,进行子空间处理。2.5基于近场波束形成的麦克风阵列语音增强当声源位于麦克风阵列近场(即阵列的入射波是球面波)情况下,声波的波前弯曲率不能被忽略,如果仍 然把入射声波作为平面波考虑,采用常规的波束形成方法来拾取语音信号,那么麦克风阵列系统输出效果 会很不理想。解决这个问题最直接的方法就是根据声源位置和近场声学的特性,对入射声波进行近场补偿,但是这种方法需

10、要已知声源位置,这在实际应用中难以满足。由于近场声学的复杂性,目前有关近场波束 形成麦克风阵列语音增强方法的研究相对较少。2.6基于相干性滤波器和广义旁瓣抵消器组合的麦克风小阵列语音增强算法在语音段和非语音段采用不同的平滑系数分另燧行噪声谱估计,可以加快跟踪噪声谱的变化,并能保证较 小的目标语音畸变;而对于采用的NLMS算法,在语音段和非语音段采用不同的步长对滤波器权系数进行更 新,可以最大限度避免在长语音段对噪声信号跟踪失效的问题。本语音增强算法结构如图1所示。从图中可以看岀,算法主要分为两部分:相干性滤波器和广义旁瓣抵消器,主要思想是利用基于 VAD的迭代相干性滤波器作为广义旁瓣抵消器的前

11、置预处理滤波器,用以抑制包 括混响和非相关性噪声信号在内的干扰,然后使用基于变步长NLMS的广义旁瓣抵消器抑制残留的噪声信号。珥丨堇-F相干料淀波剤的乂旁ft!凰消;法结喝用3方法特点与对比自适应波束:自适应如果噪声源的数目比麦克风数目少,自适应波束法能得到很好的性能。但是随着干扰 数目的增加和混响的增强,自适应滤波器的降噪性能会逐渐降低。固定波束:该类麦克风阵列语音增强方法实现简单且有韧性,但需要较多麦克风才能得到较好的噪声抑制能 力。因此,实际中很少单独使用后置滤波:与自适应波束形成麦克风阵列语音增强方法相比,后置滤波方法在对非相干噪声抑制方面,具有明显的优势。但算法的性能受到时延误差的影

12、响,使增强后的语音信号有一定失真。该方法对方向性的强 干扰抑制效果不佳。后置滤波方法极少单独使用,常与其他方法联合使用。子空间基于子空间的麦克风阵列语音增强方法虽然降噪性受噪声场是否相关影响较小,在相干和非相干 噪声场中均有一定的消噪效果,但是由于计算量较大,实现实时处理具有一定困难。近场波束:这种方法需要已知声源位置,这在实际应用中难以满足。由于近场声学的复杂性,目前有关近 场波束形成麦克风阵列语音增强方法的研究相对较少。相干性滤波器和广义旁瓣抵消器组合:通过模拟和实际试验,可以看岀这个组合算法明显优于单独使用小 阵列波束形成算法和相干性滤波器算法。4总结鉴于实际声学环境下噪声类型和噪声场的复杂性,许多学者将性能互补的方法相结合,以改善其中任何一种语音增强方法的噪声抑制能力。在实际应用中应根据具体的使用环境的噪声特性,设计合适的麦克风 阵列结构,选择最佳的算法及其具体的实现形式。5参考文献1 采用可调波束形成器的 GSC麦克风阵列语音增强方法 _李芳兰(第34卷第12期电子与信息学报2012年 2月)2 基于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论