基于语音增强的噪声功率谱改进算法_第1页
基于语音增强的噪声功率谱改进算法_第2页
基于语音增强的噪声功率谱改进算法_第3页
基于语音增强的噪声功率谱改进算法_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于语音增强的噪声功率谱改进算法

1不同增强方法的对比随着计算机通信技术的快速发展,语音处理技术的重要性日益突出。它已广泛应用于网络、通信、智能设备和工业控制领域,是现代工业发展的必要基础技术。基于语音短时谱估计的方法具有适用信噪比范围大、方法简单、易于实时处理等优点,尽管研究比较早,但仍有很强的生命力,已成为应用最广泛的语音增强方法。基于语音短时谱估计的增强方法种类繁多,如谱减法、维纳滤波法、最小均方误差法等。传统的基于语音短时谱估计的方法均不同程度存在着残留噪声大的问题。Ephriam和Malah提出的方法可以有效地抑制残留噪声。OlivierCappé在文献中分析了上述方法能有效抑制残留噪声,是因为在计算增益函数时引入了先验信噪比,并采用了“直接判决”法对先验信噪比进行估计。Scalart和IsraelCohen对Ephriam和Malah提出的方法进行了改进。在上述方法中,需要估计当前帧的噪声功率谱,常常只通过计算无声期间的统计平均来估计噪声。但是仅仅依靠无声段来估计噪声,这样的估计过程显然是不够全面的。另外,虽然上述的方法能有效地抑制变化范围不大或是稳定的噪声,但是对实际中的变化范围很广的噪声效果不是很理想。首先描述了维纳滤波语音增强算法的基本思想,然后对先验信噪比和后验信噪比的计算进行了简单推导,最后提出了一种改进的算法。通过计算机仿真实验,将提出的算法与最常见的谱减法进行了比较。实验结果表明该改进算法有效地提高了增强效果,更好的抑制了噪声,提高了语音质量。2噪声信号的估计先验信噪比是语音增强算法中非常重要的参数。通过Ephraim和Malah提出的“直接判决”估计来计算先验信噪比的方法是最有效的和最容易计算的。对于第k帧带噪语音信号:其中sk(t)为第k帧纯净语音信号,nk(t)为第k帧加性噪声信号,假设sk(t)和nk(t)都是短时平稳随机信号,且二者互不相关。对上式进行傅里叶变换,得到:根据文献,得到对纯净语音信号频谱的估计:式中Yk(ω)和分别表示第k帧带噪语音和纯净语音傅里叶变换的估计,G(ξk,γk)表示谱增益函数,其中ξk,γk分别表示先验信噪比和后验信噪比。的相位谱用的相位谱来近似代替,最后由反傅里叶变换得到降噪以后的语音信号的时域表示:由此,可以看出,在维纳滤波算法中,关键是对G(ξ,γ)的求解。基于最小均方误差的判别方法,维纳滤波的谱增益函数为:根据“直接判决”的方法计算先验信噪比和后验信噪比:式中为第k-1帧纯净语音信号的功率谱估计,|Yk(ω)|2为第k帧带噪语音信号的功率谱,为对第k帧的噪声功率谱估计。3改进的噪声功率谱在基于先验信噪比估计的维纳滤波语音增强算法中,需要估计当前帧的噪声功率谱,经典的算法常常只通过计算无声期间的统计平均来估计噪声功率谱,这是假设噪声的功率谱在发声前和发声期间基本没有变化前提下的,这样的估计和假设显然是不够全面的。另外,经典的算法能有效地抑制变化范围不大或是稳定的噪声,但是对实际中的变化范围很广的噪声效果不是很好。为了解决上述问题,在基于先验信噪比估计的维纳滤波算法基础上,提出了一种改进的算法。本算法对传统的估计噪声功率谱的方法做出了改进,首先在计算无声段信号统计平均得到初始噪声功率谱的基础上,通过平滑处理初始噪声功率谱和带噪语音功率谱得到新的噪声功率谱,弥补了经典算法中仅依靠无声段估计噪声功率谱的不足。其次,通过计算带噪语音功率谱与噪声功率谱的比值,更新噪声功率谱,一定程度上改善了经典算法仅适用于稳定或变化不大的噪声的不足。首先,对带噪语音进行端点检测确定语音起始帧,并通过无声期间统计平均的噪声方差作为噪声功率谱的初值。式中表示噪声功率谱的初值,S表示第S帧为语音起始帧,L表示帧长。其次,从起始帧开始,判断当前帧为语音信号还是噪声信号,更新对噪声功率谱的估计,以便通过式(6)计算先验信噪比和后验信噪比。若是噪声信号,则通过对与当前帧的功率谱做平滑处理,更新对噪声功率谱的估计。其中|Nk(ω)|2new表示通过平滑处理后对当前帧的噪声功率谱估计。β为噪声平滑因子。|Yk|2为第k帧带噪语音信号的功率谱。如果是语音信号,通过计算各个频率点带噪语音功率谱与噪声功率谱的比值再次调整噪声功率谱,依次处理当前帧的每个点,更新对噪声功率谱的估计:上式中的|Nki(ω)|2,|Yki(ω)|2分别表示第k帧第i个频率点的噪声谱功率谱和带噪语音信号的功率谱。通过这样的调整,在一定程度上滤除了变化较大的噪声。依据改进的算法,具体的实施步骤为:(1)对分帧后的信号进行端点检测,得到语音信号的起止点NIS;通过无声期间统计平均的噪声方差来估计噪声的功率谱;(2)从语音信号起始帧NIS开始,判断当前帧为语音信号还是噪声信号。若是噪声信号,通过式(8)对与当前帧的功率谱做平滑处理,更新对噪声功率谱的估计|Nk(ω)|2new;若是语音信号,进行下一步计算;(4)根据式(6)计算当前帧的先验信噪比SNRprio和后验信噪比SNRpost;(5)根据式(5)得到当前帧的G(ξk,γk);(7)对进行IDFT变换,并取其实部作为滤波后的语音信号;(8)通过对滤波后的语音信号进行连续帧之间的重叠相加,得到重构的纯净语音信号。4信噪比lr对输出语音质量的评价采用客观评价结合主观评价的方法。客观评价方法中,信噪比和分帧信噪比都属于时域客观测度,这类测度仅适用于波形编码系统。因此,本文采用的客观评价方法为坂仓距离(Itakura-SaitoDistortion,ISD)测度和LLR。主观评价采用平均意见得分(MeanOpinionScore,MOS)法。4.1语音失真实验实验中首先使用NTT语音库中的语音样本进行客观评价实验,比较了加噪语音,通过谱减法增强后的语音,通过MMSE法增强后的语音和通过本文提出的算法增强后的语音与纯净语音的坂仓距离和对数似然比测度(Log-LikelihoodRatio,LLR)。实验结果见表1和表2。语音失真越小,坂仓距离和对数似然比测度的数值越小。从表1和表2的几种算法增强后语音对比中可以看出:传统的语音增强方法与本文提出的算法都能有效抑制残留噪声。但是与传统方法相比,本文提出的方法效果更加明显,语音失真也较小。4.2语音信号的平均意见得分为了确定客观性能评估,进行了主观评价。语音信号为数字0~9以及实验室普通话四川方言语音库中的6个句子,分别经过加噪、谱减法增强、MMSE法增强和本文提出的算法增强。在MOS测试中选用20位试听者,要求试听者根据自己的认可度从1~5给出每种测试语音的印象得分,从而得到4种语音信号的平均意见得分。实验结果如表3所示。由于残留的“音乐噪声”对主观测听影响较大,残留噪声越大,MOS得分越低。从表3所示的MOS测试结果中可以看出,相对与传统的谱减法和MMSE法,本文算法的MOS有了较大提高。5带噪语音的matlab仿真实验本文首先介绍了基于先验信噪比估计的维纳滤波语音增强方法,并在此基础上提出了一种改进的算法。该算法首先通过计算无声段的统计平均得到初始噪声功率谱;其次,计算语音段间带噪语音功率谱,并平滑处理初始噪声功率谱和带噪语音功率谱,更新了噪声功率谱;最后,考虑了某频率点处噪声急剧增大的情况,通过计算带噪语音功率谱与噪声功率谱的比值,自适应地调整噪声功率谱,弥补了经典算法中仅依靠无声段估计噪声功率谱的不足,并在一定程度上改善了经典算法仅适用于稳定或变化不大的噪声的不足。在仿真实验中,采用客观评价结合主观评价的方法对算法性能加以了验证。实验结果表明,该算法能有效地减少语音畸变,提高语音可懂度。(3)通过式(9)依次更新当前

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论