第14章-语音增强_第1页
第14章-语音增强_第2页
第14章-语音增强_第3页
第14章-语音增强_第4页
第14章-语音增强_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第14章语音增强§14.1概述§14.2语音特性、人耳感知特性及噪声特性§14.3滤波法语音增强技术§14.4利用相关特性的语音增强技术§14.5非线性处理法语音增强技术§14.6减谱法语音增强技术§14.7利用Weiner滤波法的语音增强技术§14.1概述

语音增强是指语音质量的改善或提高。因为实际语音都是在有噪声和干扰的情况下产生的,所以语音增强的目的就是去掉语音信号中的噪声和干扰。语音增强技术有广泛的应用,如作为语音编码和语音识别的预处理,消除语音中的混响,从录音中恢复出高质量的语音。应用于研究的语音数据大都在无噪环境下采集的。•1)实际环境存在各种各样的干扰噪声,最常见的是背景噪声,噪声干扰下的语音,其特征参数发生了很大的扭曲,噪声干扰下的语音识别率大大降低、合成语音质量急剧恶化等。•2)语音增强的目的:从带噪语音中提取尽可能纯净的原始语音,从主观度量上讲,就是改善语音质量、消除背景噪声,从客观度量讲,即提高语音可懂度。•3)针对不同的噪声,采用不同的语音增强方法,因噪声种类繁多,不可能有通用的语音增强方案。§14.1语音特性、人耳感知特性及噪声特性•1语音特性:前已述及,这里简单回顾A、是时变的、非平稳、非遍历的随机过程,短时相对平稳;B、分浊音和清音,前者表现出周期性,在频域有共振峰,能量大都集中在较低频段内;后者类于白噪声,无明显的时域和频域特性。C、可用统计分析特性描述。2.人耳感知特性目前,用于语音增强的语音感知方面的一些结论:A、幅度谱对感知起决定性影响,相位谱对不敏感;B、人耳对频率高低的感受近似与该频率的对数成正比;C、人耳有掩蔽效应,即强信号对弱信号起抑制作用。人耳有掩蔽效应:即指一个声音的存在会影响对另一个较弱声音的听觉,另外,当一个声音突然停止时,人耳约在150ms内对其它弱音听不清楚,甚至听不见。因此提高语音的SNR,就可在语音与噪声共存时,感觉不到噪声的存在。D、共振峰对语音感知非常重要,特别是第二共振峰比第一共振峰更为重要,因此对语音信号进行一定的高通滤波不会对可懂度产生影响。E、人耳在多人的说话环境中,能分辨出所需声音。3.噪声特性:

(a)加性噪声(1)冲激噪声:例如打火、放电都会引起冲激噪声。它的时域波形是类似于冲激函数的窄脉冲。消除冲激噪声的方法通常有两种:对带噪语音信号的幅度求均值,将该均值作为阈值,超过该阈值则判断为噪声,在时域滤除;当冲激脉冲不太密的时候,也可以通过内插的方法避开或平滑掉冲激点,从而在重建语音时去掉冲激噪声。(2)周期噪声:例如发动机产生的干扰、市电干扰都是周期性的干扰。在频谱上表现为离散的窄谱,通常可以采用陷波器方法进行消除。(3)宽带噪声:例如说话时同时伴随着呼吸引起的噪声,随机噪声源产生的噪声,以及量化噪声等。应用中常近似为高斯噪声或白噪声。噪声频谱遍布于语音信号频谱中,消除比较困难,一般需要采用非线性处理方法,减谱法,Weiner滤波法。(4)语音干扰:干扰语音信号和待传语音信号同时在一个信道中传输所造成的干扰(如在通信中串话引起的)。区别它们的方法是利用基音差别。可以用梳状滤波器提取基音和各次谐波,再恢复出有用的信号。(b)非加性噪声传输噪声:传输系统的电路噪声。与背景噪声不同,它在时域中是语音和噪声的卷积。处理这种噪声可以用同态处理的方法,把非加性噪声变换为加性噪声来处理。干扰语音背景噪声纯净语音+信道传输噪声语音增强增强语音§14.3滤波法语音增强技术1陷波器法对于周期噪声采用陷波器是比较简便和有效的方法,设计的陷波器的幅频曲线的凹处对应于周期噪声的基频和各次谐波,并使这些频率处的限波宽度足够窄。带噪语音DFTIDFT频谱整形器增强语音2自适应滤波器自适应滤波器能有效地在未知环境中跟踪时变的输入信号。使输出信号达到最优,所以可以用来构成自适应的噪声消除器。+自适应滤波器r(t)-+r’(t)s’(t)y(t)=s(t)+n(t)s(t)为语音信号,n(t)为未知噪声信号,y(t)为带噪语音信号,r(t)为参考噪声输入,与语音信号无关,与噪声有关。该滤波器的实质是实现带噪信号中的噪声估计,并用原始信号y(t)减去估计值r’(t),达到语音增强的目的。§14.4利用相关特性的语音增强技术1自相关处理抗噪法语音增强技术该方法利用语音信号本身相关,而语音与噪声、噪声与噪声可认为互不相关的性质,对带噪语音信号做自相关处理,可以得到与不带噪语音信号同样的自相关序列。即带噪语音的自相关函数近似等于纯净语音信号的自相关函数。将自相关系数作为识别系统的特征,可以达到抗噪声的目的。开方器移动Tp自相关系数确定Tp一周期波形切除相关波形连接输出带噪语音信号自相关处理抗噪法的流程2利用复数帧段主分量特征的降噪方法来自环境的噪声具有帧间相关性小,能量分布频率范围广且数值较小,在语音信号主分量特征中对应于贡献率较小的分量的特点。因此可以利用复数帧段主分量特征提高抗噪性。复数帧段特征是采用相继的复数帧组成的特征参数矢量作为语音识别输入特征量,由于噪声成分具有帧间相关性小的特征,所以利用复数帧段特征量等于相应的减弱了噪声的影响。为了进一步降噪,可以求取复数帧段参数特征的主分量特征,由于噪声对应于较小的分量,所以贡献率较大的主分量作为语音识别特征,而舍弃较小的分量,这样既可以降低噪声,也可以解决输入特征矢量维数增加时,计算量增大的问题。主分量是N个D维样本的自相关矩阵的本征向量,每一个本征向量对应一个本征值,本征值小的重要性也小,小本征值部分往往对应噪声,所以可以从特征量中去除小本征值对应的主分量,达到降低噪声的影响。§14.5非线性处理法语音增强技术1中心削波法对于噪声频谱遍布于语音信号频谱中的宽带噪声,如果噪声振幅比大部分的语音信号振幅低,则削去低幅度成分也就削去了宽带噪声。所以我们可以在频域中采取中心限幅的方法,高幅度的频谱可以通过而低幅成分不允许通过,从而实现噪声抑制。2同态滤波法对于乘性或卷积性噪声可以采用同态滤波的方法。带噪语音FFTln[]IFFT音调提取FFT频谱分析合成输出复倒谱串脉冲同态滤波法原理框图同态滤波可以用于识别系统的预处理。卷积信号经过同态滤波器后由卷积运算变成了相应的复倒谱求和运算,这样可以分离出乘性噪声。再由复倒谱提取音调参数,经过频谱分析获取降噪处理之后的共振峰,最后合成为降噪后的语音信号。§14.6减谱法语音增强技术

减谱法是假定加性噪声与短时平稳的语音信号相互独立的条件下,从带噪语音的功率谱中减去噪声功率谱,从而得到较为纯净的语音频谱。减谱法假定语音信号短时平稳,所以需要对输入语音加窗后处理。y(t)=s(t)+n(t)FFT|•|2

Pn(ω)

+-(•)1/2

相位恢复Ψ(ω)IFFTs(t)Py(ω)=Ps(ω)+Pn(ω)设s(t)为纯净语音信号,n(t)为噪声信号,y(t)为带噪信号,有y(t)=s(t)+n(t)其傅立叶变换为Y(ω)=S(ω)+N(ω)假定语音信号与加性噪声独立,则有|Y(ω)|2=|S(ω)|2+|N(ω)|2即功率谱的关系为:Py(ω)=Ps(ω)+Pn(ω)Ps(ω)=Py(ω)-Pn(ω)噪声功率谱Pn(ω)可以通过发声前的静音段的功率谱来估计。带噪语音功率谱和噪声功率谱相减就可以认为是纯净语音功率谱。由于在傅立叶变换后只考虑了功率谱,没有考虑相位的变化,所以在傅立叶反变换时,还要考虑相位的变化,即Ψ(ω)。§14.7利用Weiner滤波法的语音增强技术该方法是在最小均方准则下用Weiner滤波器实现对语音信号的估计,即对于带噪语音信号,确定滤波器的冲激响应,使带噪语音信号经过该滤波器的输出能够满足均方误差最小。设s(t)为纯净语音信号,n(t)为噪声信号,y(t)为带噪信号,有y(t)=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论