语音信号处理第7讲_第1页
语音信号处理第7讲_第2页
语音信号处理第7讲_第3页
语音信号处理第7讲_第4页
语音信号处理第7讲_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、6.1 概述6.2 语音特性、人耳感知特性及噪声特性6.3 滤波器法6.4 相关特征法6.5 非线性处理法6.6 减谱法6.7 Weiner滤波法语音增强:指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。(即:从含噪语音中提取尽可能纯净的原始语音)意义:日常生活中,经常遇到在噪声干扰下进行语音通信的问题军事通信中,指挥员的作战命令和战斗员的战情汇报窃听技术中需要语音增强语音识别技术需要语音增强原因:在实际生活中,语音信号无时无地不受各种噪声干扰。如人们正常的生活环境是一个声级为60dB的噪声环境。语音特性:语音信号是一种非平稳的随机信号,

2、考虑到人类发声过程中的变化速度具有一定的限度,且远小于语音信号的变化速度,具有短时平稳性,采用加窗分帧,用平稳随机过程来分析语音信号任何语音都分元音和辅音两种因素,根据发音机理不同,辅音又分清辅音和浊辅音。从时域波形上可以看出浊音(包括元音)具有明显的准周期性和较强的振幅,其周期所对应的频率就是基音频率;清辅音的波形类似与白噪声并具有较弱的振幅。语音增强利用浊音具有明显的周期性来区别和抑制非语音噪声,而清辅音和宽带噪声就很难区别分人耳感知特性:(1)人耳对于声波频率高低的感觉与实际频率的高低不呈线性关系,而近似为对数关系(2)人耳对声强的感觉很灵敏且有很大的动态范围,对频率的分辨能力受声强的影

3、响,过强或过弱的声音都会导致对频率的分辨力降低(3)人耳对语音信号的幅度谱较为敏感,对相位不敏感(4)语音增强的最终度量是人耳的主观感觉可以利用人耳特性减少运算代价噪声特性:p定义:是扣除被测信号真实值后的各种测量值,可能来自外界环境、物理系统、操作人员等。广义将噪声称为干扰p噪声的分类(可根据产生原因和噪声性质分类) 产生原因:产生于物理系统外部,并以声、光、电、机械等方式作用于物理系统,称为外部噪声;物理系统内部产生的噪声称为内部噪声,例如量子噪声等 按性质分为:脉冲噪声(爆炸、碰撞和放电)和连续噪声;周期性噪声(如交流电的干扰)和非周期噪声;按统计特性分为:平稳噪声(如白噪声)和非平稳噪

4、声(如色噪声);按噪声和信号相关的性质分为加性噪声和乘性噪声注:语音信号研究的噪声是声音的一种,具有声波的一切特性,称为声噪声噪声的度量声压、声强和声功率:声压级声强级声功率级声压和声压级表征声音在物理上的强弱,是对噪声的客观评价,不能表征人对声音的主观感觉。噪声度量的另一个参数就是信噪比SNR,考量的是输入信号的SNR和输出信号的SNR变化0020lg20pPLPPaP1220020lg10IILIW mI120020lg10WWLWWW噪声特性:p冲激噪声:放电、打火、爆炸都会引起冲激噪声,它的波形类似于冲激函数的窄脉冲。 消除方法:(1)对带噪声语音信号的幅度求均值,将该均值作为判断阈值

5、,凡是超过该阈值的判断为冲激噪声,在时域中将其滤除;(2)当冲激脉冲不太密集时,可以通过某些点内插的方法避开或平滑掉冲激点,从重建的语音信号中消除冲激噪声p周期噪声:最常见的有电动机、风扇之类周期运转的机械所发出的周期噪声,50Hz交流电源也是周期噪声。 消除方法:在频谱图上表现为离散的窄谱,可以采用陷波器方法予以滤除p宽带噪声:说话时同时伴随着呼吸引起的噪声,随机噪声源产生的噪声,以及量化噪声等都可视为宽带噪声,近似为高斯噪声或白噪声。 消除方法:宽带噪声的显著特点是噪声频谱遍布语音信号的频谱中,消除比较困难,一般采用非线性处理方法噪声特性:p语音干扰:干扰语音信号和待传语音信号同时在一个信

6、道中传输所造成的语音干扰称为语音干扰。 消除方法:利用语音和干扰语音的基音不同,采用梳状滤波器提取基音和各次谐波,再恢复出有用语音信号。p传输噪声:传输系统的电路噪声与背景噪声不同,在时间域里是语音和噪声的卷积。 消除方法:采用同态处理,把非加性噪声变换为加性噪声处理。纯净语音干扰语音背景噪声信道传输噪声语音增强处理增强语音常用的语音增强技术有滤波法、自相关抗噪法、非线性处理法、减谱法和维纳滤波法等陷波器法:消除周期噪声较为简便有效的方法基本思路和要求:陷波器的幅频曲线的凹处对应于周 期噪声的基频和各次谐波(关键是通过合理设计使这 些频率处的陷波宽度足够窄)陷波器:传递函数为所有 (N为整数)

7、的频率将被滤除掉由于数字滤波器的极零点接近时,信号频谱变化较为缓慢,而在陷波频率处急剧衰减,可引入反馈:当 时,分母在零点附件处有抵消作用,梳齿带宽变得越窄,通带较为平坦,陷波效果越好。( )1 ()1 Tjjj TH zzzeH ee uuuuuu rNfT1( )1rrzH zbz1b 数字陷波器模拟框图自适应滤波器:有效地在未知环境中跟踪实变的输入信号,使输出信号达到最优,其基本原理框图如下 与 无关,而与未知噪声 信号 相关自适应滤波器的实质在于实现带躁信号中的噪声估计,并用原始信号中去除估计噪声,达到语音增强的目的 是估计 而得到的误差,根据最小均方准则,当为最小的误差 也就是降噪后

8、的基本型自适应滤波器( )r t( )s t( )n t( )s t( )y t2( )( )Ey tr t( ) t( )s t对称自适应去相关的改进型自适应滤波器:在一些实际应用中,参考输入 中还可能含有低电平的信号分量,会对消原始输入中的语音信号成分,导致输出信号中原始语音信号的损失 对 有影响,且与未知噪声信号 相关,导致输出原始信号损失自适应噪声对消器( )r t( )s t( )n t( )r t原始信号通过传递函数J(z)的信道泄露到参考输入中为解决这一问题,提出了对称自适应去相关(SAD)算法用时延的改进型自适应滤波器:解决要求与噪声相关的参考噪声输入的要求(该要求实现较困难,

9、如白噪声,相关性较弱) 提出将噪声延迟一个周期T,使得参考信号 与其延迟相关性大,而 与其延迟相关性小,基于自适应滤 波器思想对纯净信号估计用时延的改进型自适应滤波器( )()()r ts tTn tT( )s t( )n t自相关处理抗噪法语音增强技术:利用语音信号本身相关,而语音与噪声,噪声之间互不相关的性质,对带噪语音信号处理,得到与不带噪语音信号相同的自相关帧序列设带噪语音信号为: 自相关函数为:( )( )( )y ts tn t1( )( ) () ( )1( )( )()()( )1( ) ()( ) ()( ) ()( ) ()( )1( ) () ( )( )tytttsRy

10、 t y tt dtTs tn ts tn tt dtTs t s tn t s ts t n tn t n tt dtTs t s tt dtRT 互不相关,积分结果近似为零将自相关系数作为识别系统的特征,达到抗噪目的自相关处理抗噪法语音增强技术:自相关处理会产生二次谐波,具体操作时,并非直接用带噪语音信号的相关系数作为识别特征,而是采用帧信号平方的自相关系数作为识别特征流程:带噪语音 信号开放后延迟一个周期,求自相关系数,通过相关峰分析确定波形周期 ,然后进行切波和续波,由此输出不再产生二次谐波pTpT利用复数帧段主分量特征的降噪方法:鉴于来自环境的噪声具有帧间相关性小,能量分布频率范围广

11、且数值小,在语音信号主分量特征中对应的贡献率交小的特点,可以利用复数帧段主分量特征来提高噪声环境下的抗噪性优点:既能起到降低噪声的作用,又能很好地解决输入特征参数矢量的维数增加导致的参数估计误差及计算量增大问题 设有N个D维样本111212122212,DDDDDDrrrrrrRrrrLLMMOML12,1,2,TiiiiDYyyyiNLL111,NndNijnijijniinjjdniijjysrsyyyyyNNs s,1,2,iiRiDAL求 的特征值及对应特征向量主分量基向量,又称本征向量特征值又称为本征值,表示去相关处理后各主分量特征的功率大小及对特征矢量的贡献大小,值小的贡献小。按大

12、小排列后,选择前P个主分量作为有效主分量组成新的低噪声特征矢量,达到降低噪声的目的同态滤波法:对于加性噪声的语音增强,通常采用线性滤波法,而对于非线性噪声(如乘积或卷积噪声),一般采用同态滤波的方式利用倒谱值规整(CMN)降噪声技术,清除带非加性噪声的语音信号的倒谱的噪声成分,从而获得增强语音的倒谱同态滤波法原理框图同态滤波法:倒谱值规整(CMN)降噪声技术原理:设对于第t帧语音,带噪语音的倒谱是 ,纯净语音的倒谱 ,噪声的倒谱 ,去噪后增强语音的倒谱 则设 为整个带噪语音输入语句(共N帧)的倒谱平均值,由于每一帧噪声的倒谱相同,则有利用CMN法处理得到的增强语音的倒谱为 中不再包含噪声的倒谱

13、,而是包含纯净语音倒谱的平均值( )snCt( )sC t( )nC t( )sC t( )( )( )snsnCtC tC t( )snCt11( )( )( )NsnsntCtC tC tN11( )( )( )( )( )NssnsnsstC tCtCtC tC tN( )sC t基本原理:减谱法是处理带宽噪声较为传统和有效的方法,基本思想是:在假定加性噪声与短时平稳的语音信号相互独立的条件下,从带噪语音的功率谱中减去噪声功率谱,从而得到较为纯净的语音频谱有语音信号与加性噪声的相互独立得从发声前的“寂静段”估计噪声功率谱,从而获得纯净语音功率谱 完整的描述:( )( )( ) ()()(

14、)jjjy ts tn tFTY eS eN euuuuuuuu r 222()()()jjjysnY eS eN ePPP synPPP ,0,ynynsynPPPPPPP基本原理:用带噪语音信号的相位谱代替估计后语音信号的相位谱来恢复降噪后的语音信号但实际处理中的效果不是很理想,因为语音的能量往往集中在某些频段内,在这些频段的幅度相对较高,而噪声的能量统计服从正态分布,噪声帧功率谱会随机变化,且相差较大。为此,改进的减谱法被提出。2当2,和1/2被改进为k,和1/k,k0,可以得到更普遍的减谱法的形式,称为功率谱修正处理改进的减谱法被减项加权值处理:在幅度较高的时帧处减去 更好的突出语音谱

15、,抑制纯音噪声,改善降噪性能;在语音谱中保留少量的宽带噪声,在听觉上起到一定的掩蔽纯噪声的作用,故改进后的减谱法公式为有语音信号与加性噪声的相互独立得其中,实验表明:a在辅音帧中取3,在元音帧中取45,b取0.010.5可以取得较好的降噪及抑制纯音噪声的效果缺陷:需粗略地辨别语音帧是辅音帧还是元音帧,以确定a的取值1,1ab ,ynynsnynPaPPaPPbPPaP ,1naPa具有输入幅值谱自适应的减谱法:前面考虑的噪声为平稳噪声,所以对于整个语音段,噪声功率以及权系数a,b一般取相同的值,面对非平稳噪声,会出现减除过度或过少的情况,使得有的区段消除不够或过多导致 失真处理:在整个区域用语

16、音以外的当前输入帧功率 ,对噪声功率进行逐帧次更新让权值a和输入语音功率相适应, 211222111221222ttttCYCCa tYCYCY sP 2tX 2221(1), 01tttNNX具有输入幅值谱自适应的减谱法:对噪声功率进行逐帧逐次更新时,噪声功率估计采用语音段开始的前几帧来估计,同时,采用带噪语音处理前后能量比来确定语音段与寂静段 (帧长为N)是第t帧处理后的值, 为处理前的值。寂静段:处理前后的平均能量变化较大, 较大;语音段: 较小( )ts i21211( )( )1( )NtiNtiyiND ts iN( )ty i( )D t( )D t原理:采用最小均方准则,Weiner滤波器实现对语音信号的估计,即对于带噪语音信号 ,确定滤波器的冲激响应 ,使得带噪语音信号经过该滤波器的输出 能够满足如下最小均方差条件步骤:(1)假设信号和噪声为短时平稳随机过程,对其Weiner-Hopf积分方程(2)两边取傅里叶变换由于信号与噪声相互独立,所以( )s t+-( )( )()syyyRh a Ra da( )( )( )y ts tn t( )h t2( )( )E s ts t( )( )( )( )( )( )( )( )( )( )( )( )( )( )( )sysyyyy

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论