版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、频域内的卡尔曼滤波语音增强算法文章编号:10028684(2011)100055046响响0j语音技术频域内的卡尔曼滤波语音增强算法?实用技术?亓贺,张雪英,武奕峰(太原理工大学信息工程学院,山西太原030024)【摘要】提出了在频域内实现的卡尔曼滤波算法,该算法利用语音和噪声幅度谱的时变特性,先对语音幅度谱进行初步修正,提取较为准确的lpc系数,然后在每一频率点下对语音幅度用卡尔曼滤波进行递推估计,最终得到效果更好的增强语音.实验结果表明,本文算法有效地提高了增强语音的snr,尤其是在高信噪比的情况下,效果更加明显.【关键词】卡尔曼滤波;语音增强;频域;高信噪比【中图分类号】tn912.3【
2、文献标识码】aspeechenhancementalgorithmusingkalmanfilterinfrequencydomainqihe,zhangxueying,wuyifong(collegeofinformationengineering,taiyuanuniversityoftechnology,taiyuan030024,china)【abstractanewkalmanfiltermethodinthefrequencydomainwhichrecursivelyestimatesthemagnitudespectrumforeachfrequencyusingthetime
3、-varyingcharacteristicsofthespeechandthenoiseispresented,andtogetthemoreaccuratelpccoefficients,themagnitudespectrumofthespeechispreliminarilymodified.experimentalresultsshowthattheproposedalgorithmeffectivelyimprovessnroftheenhancedspeech,especiallyinthecaseofhighsignal-to-noiseratio(snr),thealgori
4、thmismuchbetterthanthetime-domainkalmanfilter.【keywords】kalmanfilter;speechenhancement;frequencydomain;highsnr1引言实际生活中的语音不可避免地受到周围环境和传输媒介等噪声的污染,导致语音质量下降,使语音处理系统性能急剧恶化n.因此,有效地减少噪声以获得高质量的语音成为国内外语音信号处理的重要研究课题.语音增强是一种解决噪声污染的预处理技术,目的就是从带噪语音信号中尽可能地提取出纯净的原始语音信号.截至目前,语音增强的研究已经取得许多成果,如s.boll等提出的谱减算法】,norbert
5、wiener提出的维纳滤波算法等方法,但与以上几种方法相比,卡尔曼滤波能够处理非平稳信号,更符合语音的特性,并且结合了语音的生成模型,利用语音的线性预测系数构成状态转移矩阵,增强后的语音噪声更小,自然度更高.1987年,paliwal等人首次将卡尔曼滤波运用到语音增强中;1989年,j.d.gibson等又将卡尔曼滤波的语音增强扩展到有色噪声环境中嘲;1999年,zentongob等人提出了改进的卡尔曼滤波语音增强算法;2001年,m.gabrea提出了自适应的卡尔曼滤波语音增强算法等,但以上算法及以后的一些改进算法均是在时域内完成的,时域内的语音和噪声之间存在着较强的时域耦合,使其难以实现有
6、效的信噪分离,并且考虑到频域内含有比时域内更丰富的语音信息如幅度,相位等,因此笔者在频域内对带噪语音进行卡尔曼滤波,将语音和噪声首先运用短时傅里叶变换转换到频域内,使信号和噪声尽可能多地分离,再对信号每帧中各个频率点下幅度值用卡尔曼滤波进行递推估计,以达到更好的去噪效果,进而改善语音质量.实验结果表明,本文方法有效地消除了噪声,在很大程度上提高了信噪比.2基于时域的卡尔曼滤波算法f9语音能被描述成一个被白噪声驱动,全极点线性芈【基金项目】国家自然科学基金项目(61072087);山西省自然科学基金项目(20011033)堕妻揍型生篁堂篁塑国系统输出的自递归过程.假设纯净语音信号序列(n)是由p
7、阶ar模型产生,即(n)=.x(ni)+(n)(i)i:j式中,p是模型阶次;(n)是过程噪声,均值为0,方差为的高斯白噪声;.(l,2,p)是模型的第i阶参数.假设被加性噪声污染的带噪语音的数学模型为y(n)=(n)+(n)(2)式中,(n)是与语音信号不相关的背景噪声,称为测量噪声.卡尔曼滤波方法利用状态方程和测量方程来描述随机系统,使得该滤波方法能够适用于非平稳条件,把语音模型转化成状态空间的形式x(n)=ax(n1)+gw(n)(3)y(n)=hx(n)+-,(n)(4)式中,a为线性预测系数构成的状态转移矩阵;x(n)是n时刻的系统状态,可表示为(n)=i(np+1),(np+2),
8、(n)1;=g一=0,0,0,l】.;(n)是n时刻的测量值;h是测量系统的参数;.,(n)表示过程噪声.基于语音生成模型的卡尔曼状态空间方程建立以后,依据基本的卡尔曼滤波算法可得出卡尔曼滤波和预测方程(nin1)=ax(nllni)(5)p(nlni)=ap(nlln一1)al+6gg(6)(n)=p(凡ln一1)h(肿(nln一1)h+6.)(7)(i):(i一1)+k()f()一h(i一1)(8)p(nln)=jk(n)hp(nln一1)(9)式中,(nln1)表示在n一1时刻对n时刻状态的预测值;(nln)是在n时刻结合此时的观测值y(n)对真实状态的估计;和6分别表示过程噪声和测量噪
9、声的方差;k(n)是卡尔曼增益;p(nln1)表示预测误差协方差矩阵;pfnjn)表示估计误差协方差矩阵.假设初始条件x(010)=0,p(010)=0,通过上述的5个迭代公式,可以得到带噪语音信号y(n)在n时刻巨堕鲢羹捌】生蔓堑鲞蔓!q塑的最佳估计值(n)为x(17,)=h(nln)(10)3改进的卡尔曼滤波算法上述传统的卡尔曼滤波是在时域内对每一帧语音信号的各个采样点进行递归估计,时域虽然简单直观,但对于语音这样复杂的信号而言,一些特性要在频域中才能体现出来,并且无论从发声器官的共振角度,还是从听觉器官的频率角度而言,频谱都是表征语音特征的基本参数,而且由于语音信号与噪声之问存在着较强的
10、时域耦合性,使得时域内的语音信号和噪声很难实现有效的信噪分离.因此,笔者在频域内用卡尔曼滤波对语音的幅度谱进行递推估计.语音信号本质上是非平稳信号,然而由于发声器官的运动存在惯性,语音信号可以假设为短时平稳的,因此可以对带噪语音信号进行短时傅里叶变换,即一2巫ly(n,)=y(z)w(n-i)e(11)1=一式中,代表带噪信号短时傅里叶变换的离散频率;w(n)为窗函数,通过(n)对带噪语音信号进行加窗分帧处理,不同的窗函数可以得到不同的变化结果;n代表窗函数的长度.将带噪语音信号的短时傅里叶变换表示为极点形式l,(n,)=ly(n,k)exp(j/y(n,)(12)式中,iy,)i,y(n,)
11、分别代表语音y(n)短时傅里叶变换的幅度和相位,同样对纯净语音信号(n)及噪声(n)进行短时傅里叶变换处理,从而得到i,l,)和fn,0由于人耳对相位的不敏感性,因此对于信号的相位不作处理,直接用到增强后的语音中.笔者主要对语音的幅度值进行递归估计,即利用卡尔曼滤波对带噪语音信号短时傅里叶变换的幅度谱进行处理.此时,公式(5)(9)在频域内可变为(ninl,)=a(k)x(n一1inl,后)(13)p(nln一1,)=a()p(n一1in一1,k)a(k1+2gg(14)(n,)=p(nln一1,)h(nin一1,k)h+l(15)x(nin,k)=(nln一1,k)+(n,k)?广ally(
12、n,k)ih(nln一1,)l(16)lp(nln,k)=【i-k(n,k)hlp(nln一1,k)(17)由此,则可以得到滤波后的幅度谱lz(n,)l,从而得到短时频域增强的信号z(n,k)=iz(n,k)lexp(jy(n,k)(18)再对z(n,k1进行短时傅里叶逆变换从而得到滤波后增强的语音信号.需要注意,对带噪语音的幅度谱进行卡尔曼滤波时,时域里成立的条件在短时频域内不一定成立.因此,讨论在短时频域内对带噪语音幅度谱进行卡尔曼滤波的可能性.首先,时域里的加性噪声在短时频域内可能不是加性噪声,因此假设加性噪声在短时傅里叶变换内仍然成立,将式(2)做短时傅里叶变换,并写成极点形式ly(,
13、)引:j(n,)+j(n,)iej【n纠(19)从几何角度可以看到,如果满足以下两个条件,噪声在短时频域内仍可看成加性噪声,即(n,k)(n,)或者ix(n,k)ilv(n,k)i.由于纯净语音和噪声是不相关的,第一个条件很难满足.而对于第二个条件,其与瞬时信噪比lx(凡,k)l/iv(n,k)l关系密切.对于信噪比较高的频率段,加性噪声假设条件基本可以满足.因此,可以推测本文算法可能对高信噪比的信号滤波的效果更为明显,这一结论在后面的仿真实验中将得到验证.其次,由于噪声的存在,对带噪信号的短时幅度谱进行线性系数预测时存在着很大的偏差,而在卡尔曼滤波中参数估计的精度直接影响语音增强的效果.针对
14、这一不足,在进行语音模型参数预测前先对带噪语音进行预处理u,即对信号短时傅里叶变换的幅度谱进行修正,使线性预测系数的估计更加准确,增强卡尔曼滤波效果.本文采用的方法是基于短时对数谱的最小均方误差估计(minimummeansquareerrorlog-spectralamplitudeestimate,logmmsest?sa)算法对幅度谱进行修正.笔者提出的基于短时傅里叶变换的卡尔曼滤波算法的流程图如图1所示.6可啼响0u语音技术堡兰tft!:_logmmse-stsas卜r相位f增强i修正4仿真实验分析根据上述分析,对此改进算法和传统的基于时域的卡尔曼滤波算法进行性能评测,并进行对比.在实
15、验中,语音取自于863语音库,采用的纯净语音资料(英语男声短句thebirchcanoeslidonthesmoothdlanks.)来自于usa.utdallas大学语音库,噪声资料来源于noise一92数据库的高斯白噪声.语音和噪声分别经过8khz采样,16bit量化,选取的窗函数是汉明窗,帧长为256,帧间重叠为50%,语音ar模型的阶数p取10.首先对加入5db高斯白噪声的带噪语音分别采用传统的时域卡尔曼滤波算法和本文改进的算法进行处理,增强效果如图2所示.采样点/10(a)纯净语音采样点/l04(b)带噪语音采样104(c)传统的时域卡尔曼滤波语音采样点/104(d)本文改进的卡尔曼
16、滤波语音图2本文改进算法与传统卡尔曼滤波算法的语音波形对比图从波形图上可以清楚看出,与传统的时域卡尔曼滤波相比,本文改进算法滤除了更多噪声,波形上更接近于纯净语音信号,增强后的语音效果更佳.其次,实验中在纯净语音中分别加入高斯白噪声,对全局信噪比为一5,0,5,10和15db的带噪语音!查丝垒篁堑鲞蔓塑匡语音技术6可响0信号进行实验.为了对增强后的语音质量进行更加客观的评价,本文对增强后的语音信号进行定量分析,采用信噪比(signaltonoiseratio,snr)和语音感知质量评价(perceptualevaluationofspeechquality.pesq)对增强语音质量进行评价,实
17、验结果如表1所示.表1传统卡尔曼滤波方法与本文改进方法性能比较表1列出了一5,0,5,10和15db的带噪语音分别采用时域卡尔曼滤波和本文改进算法后的增强语音的信噪比和pesq值.从表中可以看出,在各信噪比下,基于短时傅里叶变换的卡尔曼滤波算法的增强效果无论从信噪比还是pesq值上均优于传统的卡尔曼滤波方法,通过主观测听,本文改进算法后的音乐噪声得到了抑制,听觉上比较清晰.同时,在相同的信噪比下,信噪比越高的带噪语音采用本文算法比传统算法的效果越好.因此,基于短时傅里叶变换的卡尔曼滤波算法更适用于高信噪比的情况,这也进一步印证了前面的推测.5结束语将传统的基于时域的卡尔曼滤波算法引入到短时频域
18、内,主要研究了在频域内的卡尔曼滤波语音增强算法.实验结果表明,与时域的卡尔曼滤波算法相比,本文算法能够有效地去除带噪语音中的加性高斯白噪声,而且采用了基于短时对数谱算法修正后的语音来估计语音模型参数,提高了参数的准确度,避免了因模型参数估计误差而需要循环迭代运算,使得在提高增强语音质量的同时,降低了卡尔曼滤波算法的计算量.参考文献llj张雪英.数字语音处理及matlab仿真fm】.北京:电子业出版社,2010.【2isrevenfb.suppressionofacousticnoiseinspeechusingspectralsubtractionj.ieeetransactionsonaco
19、usticsspeechandsignalprocessing,1979.27(2):匿查婴!生篁鲞蓥】q塑1l3一l2u.3】wienern.theextrapolation,interpolation,andsmoothingofstationarytimeserieswithengineeringapplicationsm.newyork:wiley,1949.【4paliwalk,basua.aspeechenhancementmethodbasedonkalmanfilteringc】/proc.acoustics,speech,andsignalprocessing,ieeeint
20、ernationalconferenceonicassp87.s.1.:ieeepress,1987(12):177180.【5jkoob,gibsonjd,graysd.fiheringofcolorednoiseforspeechenhancementandcodingj.ieeetransactionsonsignal1989,39(8):17321742.【6】zentong,kahchyet,tanbtg.kalmanfitteringspeechenhancementmethodbasedonavoicedunvoicedspeechmodelj.ieeetransactionsonspeechandaudio,1999,7(5):510524.【7lgabream.adaptivekalmanfilteringbasedspeechenhancementalgorithmc/proc.electricalandcomputeren
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024简单个人房屋租赁合同书
- 2025个人房屋租赁合同样书
- 标准二手写字楼买卖合同6篇
- 精准医疗的基石实时超声科案例分析
- 视频编辑初级教程制作专业影音作品
- 课题申报参考:可行能力视角下进城农民农村集体经济组织权益的保障机制重构研究
- 2024年AB胶项目资金需求报告
- 科技产品在小红书的营销策略研究
- 二零二五年度工业厂房租赁安全风险评估与管理合同3篇
- 二零二五年度电子商务平台交易催收保密合同2篇
- 图像识别领域自适应技术-洞察分析
- 个体户店铺租赁合同
- 礼盒业务销售方案
- 二十届三中全会精神学习试题及答案(100题)
- 小学五年级英语阅读理解(带答案)
- 仁爱版初中英语单词(按字母顺序排版)
- (正式版)YS∕T 5040-2024 有色金属矿山工程项目可行性研究报告编制标准
- 小学一年级拼音天天练
- 新概念英语第二册考评试卷含答案(第49-56课)
- 【奥运会奖牌榜预测建模实证探析12000字(论文)】
- 保安部工作计划
评论
0/150
提交评论