第四章小波变换_第1页
第四章小波变换_第2页
第四章小波变换_第3页
第四章小波变换_第4页
第四章小波变换_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.语音增强算法研究 p584.1 小波理论 4.1.1小波变换的定义4.1. 2 小波去噪原理 .4.2 小波包变换语音增强方法4.2.1 小波包变换语音增强方法原理4 2. 2 Bark 尺度小波包分解4.2.3闽值函数4.2.4 实验仿真4.3 小波包变换和听觉掩蔽效应的语音增强方法4.3. 1小波包变换和听觉掩蔽效应的语音增强方法原理4.3. 2实验仿真 第四章 小波包语音增强算法小波(Wavelets分析的起源可以追溯到20世纪初,在20世纪80年代后期开 始形成一个新兴的数学分支。 小波变换是调和分析这一数学领域半个世纪以来的 工作结晶, 是傅里叶变换发展史上的里程碑式的进展, 近些

2、年来成为国外众多学 者共同关注的热点。 它在傅里叶变换的基础上发展而来, 但又有极大不同。 传统 的信号处理方法是建立在傅立叶变换的基础上, 而傅立叶分析使用的是一种全局 的变换,要么完全在时域, 要么完全在频域, 因此无法表达信号的时频局域性质, 而这种性质恰恰是非平稳信号 (如语音信号 )最根本和最关键的性质。小波分析是 建立在泛函分析、 傅立叶分析、样条分析及调和分析基础上的新的分析处理工具 它又称为多分辨分析, 在时域和频域同时具有良好配局部化特性, 常被誉为信号 分析的“数学显微镜” 。小波变换在时频两域都具有表征信号局部特征的能力, 它克服了短时傅立叶变换固定分辨率的缺点, 在信号

3、的高频部分, 可以获得较好 的时间分辨率, 在信号的低频部分可以获得较高的频率分辨率, 这就使指小波变 换具有对信号的自适应性。 它能有效地从信号中提取信息, 通过伸缩和平移等运 算功能对信号进行多尺度细化分析。 小波分析是目前国际上公认的信号信息获取 与处班领域的高新技术, 是信号处理的前沿课题, 其中小波去噪也是小波分析的 主要应用之一,对语音增强的研究不可避免的要利用小波这一有效工具。小波包变换理论是 20世纪 80年代中后期逐渐成熟并发展起来的, 由于可同 时进行时域和频域分析, 具有时频局部化和变分辨特征, 而且小波函数的选取也 很灵活,因此在语音增强中得到了广泛的应用。 这就使得小

4、波包变换在信号处理方面有许多独到的优点,特别适用于像信号处理,图象处理,量子场论,地震探 测,话音识别与增强,雷达,机器视觉以及数字电视等科技领域31-354.1小波理论4.1.1小波变换的定义“Fl其中,甲(5-1)为给定的一个基本函数,式中 a,b均为常数,且a>0。给定平方可积的信号x(t,义为:工I®" 冋,则日门的小波变换(wavelet transform,WT) 定(吶=十卜(心=) 'f/(5-23 Y Af式中,a, b和t均是连续变量。因此此式又称为连续小波变换(CWT)o信号皆(f)(a,b)是a和b的函数,b是时移,a是尺度因子。十&#

5、39; 丿 又称为基本小波,或母小波。W亦U数,称之为小波基函数,或简称小波基。母小波可以是实函数,也可以是复函数。的小波变换是母小波经移位和伸缩所产生的一组函丸是实信号,也是实信号,则忆(")也是实函数,反之,为复函数。在(5-1)式中,时移b的作用是确定对兀(0作伸缩。析的时间位置,也即时间中心。尺度因子a的作用是把基本小波習")£¥,当 a>1时,a越大,则 Z丿的时域支撑范围(即川)变成时域宽度)较之川)变得越大;反之,当a<1时,a越小,则越窄。这样,a和b联合起来确定了对兀(')这样,(5-2)式的小波变换可以理解为用一组

6、分析宽度不断变化的基函数对 兀()作分析,这一变化正好适应了对信号分析时在不同频率范围需要不同的1石分析的中心位置及分析的时间宽度。分辨率这一基本要求。(5-2)式中的因子始终能和母函数是为了保证在不同的尺度a时,肖有蓍相同的能量,即:(5-3)0,则dt=adt',这样,上式右边的积分即等于的傅里叶变换为里叶变换的性质:。令X(Q),肖的傅里叶变换为的傅里叶变换为:ft-b(5=4)(5-4)由Parseval定理,(5-2)式可重新表达为:(5 5)昭;(mr工(昭皐此式即为小波变换的频域表达式36。5.1.2小波去噪原理假设观察信号(5 5)”是噪声序列。假定M(f是零均值且服从

7、式中,"(')是纯净语音信号,高斯分布的随机序列,对(5-5)式两边做小波变换,根据小波变换的性质,有(5-6)闪2)=附7;(依)+炉7;(仏耐即两个信号和的小波变换等于各个信号小波变换的和。再令u (t)是零均值、独r立同分布的平稳随机信号,记然:山M。显(5=6)是"的协方差矩阵。0是小波变换矩阵,对于正交小波变换,它是正交阵。分别令 x和s是对应令s(t)和u(t)的向量,向量X, S和U分别是x(t) , s(t)和u(t)的小波变换,即:xn, S二必,U二呼甘(5-7)由于X =S+U令P是U的协方差矩阵,由于:£0二耐必 = "7

8、?町二 0所以:P 二 euU =(5-8)(5-9)因为W是正交阵,且0";/,所以 P "/由此,可得到一个重要的结论:平稳白噪声的正交小波变换仍然是平稳的白噪声。由此结论可知,对于加法性噪声模型,经正交小波变换后,最大程度地去 除了 *(r)(5-10)X(r)是含有噪声的语音信号,的高斯白噪声。St是没有叠加噪声的语音信号,其中,N是方差为X")进行N层离散小波包分解,得到一组小波包分解系数由两部分组成:一部分是S对应的小波包系数,记为对信号,另一部分是的相关性,其能量将集中在少数的小波系数上,这些系数即是信号经小波变换后在各个尺度下的模极大值。 但是,噪

9、声经正交小波变换后仍然 是白噪声,因此,其小波系数仍然是不相关的,它们将分布在各个尺度下的所有 时间轴上。这一结论即为抑制噪声提供了理论依据,即在小波变换的各个尺度下 保留那些模极大值点,而将其他点置零,或是最大程度地减小,然后利用处理后 的小波系数做小波反变换,即可达到抑制噪声的目的。5.2小波包变换语音增强方法 521小波包变换语音增强方法原理在小波变换中,由于多分辨分析只是对低频部分作进一步分解,高频部分则 不再分解。小波包分析能将频带进行多层次划分,对多分辨分析没有细分的高频 部分进一步分解,并能够根据被分析信号的特征,自适应地选择相应频带,使之 与信号频谱相匹配,从而提高了时一频分辨

10、率 37。假设带噪语音信号可以表示为:N()对应的小波包系数,记为"几N对于每一个小波包分解系数,选择一个当T的阈值,并对系数进行阈值量化,得出估计小波系数人A,使得尽量小。5.2.2 Bark尺度小波包分解Barkhausen等学者依据人耳的掩蔽效应的实验结果,提出了频率群的概念。即将基底膜分解为许多的小段,每一小段称为一个频率群。在20-16000HZ范围内共有24个频率群。同一频率群的声音在大脑中是叠加在一起进行评价的,具 有一致的心理声学特征。按频率由低到高,将频率群顺序编号,将编号定义为 32新的频率单位Bark。若记Bark域的频率变量为z,赫兹(Hertz)域频率变量为

11、/,则有:(5-11)*2_0.53/ + 1960Bark域的频率描述充分反映了人耳的听觉特性,因此在语音处理方面得到 了大量应用。根据小波包的函数空间正交剖分理论,可以构造与人耳Bark域频解,使每个子带的中心频率相差减至 致,也不会导致较大的计算量。因此,所示,共68个子频带38-41。率描述相似的小波包分解结构,称之为“ Bark尺度小波包分解”。常规方法是模 拟人耳的24个频率群,对于8kHz采样的语音信号,选取1至17个频率群,得 到的每个子带的中心频率相差 IBark。试验证实,如果对 Bark域进行进一步分 1 / 4 Bark,对语音的描述会更加细本论文采用的小波包分解树结构

12、如图5-1to,P)ft*)fl.l)«C|IXDIJ/I1U|M)().»)(1.61 iinHI14.31士叫 C5.1)421 低 3J图N1 Kuk尺度小注包分解示令国Fig.5-1 principle diugriim uf Bitrk-eule wjvdlt:! pack说 decurtipusitiim523阈值函数在小波阈值去噪理论中42-44,阈值函数的选取和阈值的确定是两个最基 本的问题。目前存在的阈值函数主要是硬阈值函数和软阈值函数。但由于硬阈值 函数整体不连续,直接导致了会在去噪后的信号中出现突变的震荡点,当噪声水平较高时,这种现象尤为明显。软阈值函

13、数虽然整体连续性好, 但是由于当小波 系数较大时,处理过的系数与原系数之间总存在恒定的偏差,这将直接影响重构信号与真实信号的逼近程度,给重构信号带来不可避免的误差。考虑到软、硬阈 值函数存在的缺陷,人们提出了各种基于这两种基本阈值函数的改进的阈值函数。在去噪过程中起到了决定性的作用。如果 兄太小,那么,施加小波阈值几阈值以后的小波系数中将包含过多的噪声分量,达不到去噪的目的;反之,如果>太大,那么将去除一部分信号的分量,从而使由小波系数重将后的信号产生 过大的失真。因此,在实际工作中,估计阈值的大小尤为关键。常用的估计阀值I几的阀值函数为硬阈值函数45和软阈值函数46:(5-12)(5-

14、13)但是,由于硬阈值函数整体不连续,直接导致了会在去噪后的信号中出现突 变的震荡点,当噪声水平较高时尤为明显。软阈值函数虽然整体连续性好,但是 由于当小波系数较大时,处理过的系数与原系数之间总存在恒定的偏差,这将直 接影响重构信号与真实信号的逼近程度。文献36提出了一种改进的阀值函数能够有效减少失真,其阀值函数:炉呼,> 久空 n (匕 J 屮V 乂(5-14)一种改进的阀值函数公式为:(5-15)小波包变换语音增强方法原理图:純冷涪冷图5-2小股也菱嶽语咅曽强育去原理闺Fig.5-2 piinciplc diagriim of wavelet packet小波包变换的语音增强算法的具

15、体步骤为: /分帧。步骤1:对带噪语音 步骤2:采用5阶Daubechies小波进行Bark尺度小波包分解,得到每一级的小 波包分解系数5。步骤3:用小波系数在各尺度下绝对值的中值估算噪声方差 。丿。(5T6;medlan W.丄)0.6745步骤4:利用通用阀值 図计算每一级的节点阀值,并对该节点的小波包分解 系数进行采用公式(5-15)的处理,更新小波包系数。(5-17)无呷二 5 V21n?V步骤5:进行小波包重建,重叠相加恢复原始数据帧长度的增强语音。524实验仿真用MATLA对Bark尺度小波包变换语音增强方法进行实验仿真1. 实验所用数据:语音取自863语音库,噪声为NOISEX.

16、 92数据库的高斯白噪声和火车噪声, 语音信号的采样率为8kHz,帧长K为256个采样点,帧叠为50%2. 仿真所选标准:波形图,语谱图。3. 仿真结果如下:0.2-0朋喻卩眦瞅洲I艸艸4快删川刪1恤卅恤伽卅淌-0.2-020- *j0225X 10*0.51152(b)带噪语咅(SdBfl噪声)(采样点数)2.5X 10°0.51152(c)小波包变换讲音増强方法(來样点数)图5-3波形图比较Fig.5-3 wavck)mi comparison- 4r.J* 二-2000 - -2000-1152帶噪语fl-fOdBl l 曲)能0.52000-氏屋宰;二七7=苛-哥 二孑

17、9;T' . S 亠苦T 丄;,4000-I g 二 士A r 孟:二 1 r .F 3:一 x 二上00 511.522.5"卜te包变换i卄咅堀强方法強硏咅Us图5-4语谱a图比较Fig,5-4 spcclTogram comparison5.3小波包变换和听觉掩蔽效应的语音增强方法 531小波包变换和听觉掩蔽效应的语音增强方法原理小波包变换理论是20世纪80年代中后期逐渐成熟并发展起来的,由于可同 时进行时域和频域分析,具有时频局部化和变分辨特征,而且小波函数的选取也 很灵活,因此在语音增强中得到了广泛的应用。 但是,增强后不可避免地伴有一 定程度的音乐噪声,影响了增强

18、效果。掩蔽效应通过模拟人耳的感知,能够掩蔽 同时进入听觉系统的较小噪声信号。优点是可以有效地抑制音乐噪声,缺点是性 能受限于对背景噪声功率谱估计的准确性, 且计算量较大,运行速度较慢。为了 抑制音乐噪声和提高运算速度,本文提出一种基于小波包变换和听觉掩蔽效应的 语音增强算法,同时具备了小波包变换和掩蔽效应两种方法的优点。仿真结果表明,该算法在信噪比和听觉舒适度上都取得了较好的效果。小波包变换和听觉掩蔽效应的语音增强方法原理图 :感知滤波器的作用是在信号频谱失真最小的情况下使残差噪声的频谱能量小于掩蔽阈值。感知滤波器应满足:/(e) *73厂 < T(co)<l(5-lS)其中,Na

19、)为背景噪声功率谱密度,厂(")为噪声掩蔽阈值。的具体形式为:(5-19)&仙厂)基于小波包变换和听觉掩蔽效应的语音增强算法的步骤为 步骤1:对带噪语音信号用小波包分解的方法进行去噪处理,得到增强后的语音A信号1,并进行分帧得到S 2。步骤2:用Johnston掩蔽模型计算掩蔽阀值T。A6步骤3:使增强语音和掩蔽阀值T经过感知滤波器日(1°)A进行滤波,得到S 2(5-20)步骤4:经过帧重叠相加得到增强语音S。A八 St(69)- Hd532实验仿真用MATLAB对小波包变换和听觉掩蔽效应的语音增强方法进行实验仿真1. 实验所用数据: 语音取自863语音库,噪声为

20、NOISEX. 92数据库的高斯白噪声和火车噪声, 语音信号的采样率为8kHz,帧长K为256个采样点,帧叠为50%2. 仿真所选标准:波形图,语谱图,信噪比,PESQ值,坂仓距离。3. 仿真结果如下:首先,在纯净语音中加入5dB高斯白噪声作为带噪语音,采用基于小波包变换 和听觉掩蔽效应的语音增强算法(本文算法),比较传统的小波包变换增强算 法,增强后仿真结果如下:621C,1 ; 1 1 1| - -J_ 'II ,| RL i0- -hIl-0.20.511,5但应始出音(采样点数)2.54X 100,2-0|r I42 =Ih I 严卄叮J; II M仆0.2-0,201, 1J

21、 ' II1*计M卩11L1'-T0.511.52帯噪倍育(射B白嗥用)(采样点敌0.511.52(C)小玻包变换悟音増®方法爲样山数)2.5X 10*2.5X 10*0.2 rI0 - ,-02I00.511.522.5(小波包变换利摊蔽效应需咅增强力法采样点教)乂 ifFig 5-6 wavcfbnii comparisonis(a)Jv kt H C t/s)0心NHJ 妍®2000-4000 二00.511.52(b),ir噪讲咅(d目白噪声)t対、2.52000- N ;天严 . y"I-> - _ -KF 笔4000100.511

22、.52©小波包斐换语音増强方決(Vs)2000-伍Rd W JBL400010gw -10.511 522.5(日)小波包斐换和掩蔽效应沿汗增强方法 t/s)图5-7语谱图®比较Fig.57 ipecirogram comparison4. 结果分析音。曰。图5-6和图5-7分别为增强后的波形图和语谱图。其中,(a)为纯净语音; (b)为添加5dB白噪声后的带噪语音;(C)为采用小波包变换语音增强方法后的增 强语音。(d)为采用小波包变换和掩蔽效应语音增强方法后的增强语音。从时域 波形图及频域语谱图的比较结果可以发现, 带噪语音采用本文算法增强后,增强 语音和原始语音在波形

23、图和语谱图上非常接近,噪声得到了明显的抑制,增强效果明显优于传统小波包变换的增强算法。其次,采用在纯净语音中分别加入高斯白噪声,全局信噪比为OdB,5dB,10dB的带噪语音作为测试对象。比较小波包变换和听觉掩蔽效应的语音增强方法和传 统小波包变换的增强算法,增强后语音质量性能的评估采用信噪比 SNF和语音质 量感知评估PESQ PESQ是 ITU-T的P.862标准,用来评价增强后语音的试听效 果。PESQ寻分在4.5到-0.5之间,得分越高表示语音质量越好。实验结果如表 5-1 示:3fZ5-r1.5* -=小波包变换和听愛掩蔽效应语音増强方沈 h 小波包变换语音1ft强方法2345678

24、910输入佶哋比(dBK白噪声图5-8感知:1昏音质量评价(.白噪声)比较Fig.5-K 卩ESQ(while noise) cumprtriMn从实验结果可以看出,在各种信噪比下采用小波包变换和听觉掩蔽效应的语 音增强方法比传统小波包方法,在信噪比和P ESQh都有很大提高,并且在信噪比较小的情况下,增强效果更加明显。通过主观听测表明:采用传统小波包方法增强后伴有明显的音乐噪声,而采用该方法增强后音乐噪声得到了明显地抑制, 取得了较好的增强效果。養5-1信嗥比比较 labile 5-1 compare the SN R唏声种蹇输入信噪比UlB)小波包变换方決WB)小波包变换和掩蔽效应方迦曲口

25、噪川04.229358 4»219.f)26KW12,509412.91745.4子空间和小波包变换的语音增强方法541子空间与小波包变换的语音增强方法原理子空间与小波包变换的语音增强方法原理图为IK1逆变换佔讣噪 声特征 值图5-9子空间与小波包埜换的语音增强方法理图Fig.5-9 Prmciph di;igr4m of subspace 肋(J wEivki packel子空间与小波包变换的语音增强方法具体步骤为:步骤1:带噪语音进行KL,变换,得到子空间域中的带噪语音的特征向量U和特征值"步骤2:采用最小值跟踪算法更新带噪语音特征值Ay,得到估计噪声特征值入。步骤3:

26、采用小波包变换方法更新带噪语音特征值Ar得到八。步骤4:带噪语音特征值AAf减去噪声特征值,得到纯净语音特征值估计值S,可以得到时域约束估计器(TDC)增益G步骤5:由KL逆变换可得最优估计器彳-% - V式可得纯净语音的估计5.4.2实验仿真用MATLA对子空间与小波包变换的语音增强方法进行实验仿真1.实验所用数据: 语音取自863语音库,噪声为NOISEX. 92数据库的高斯白噪声和火车噪声, 语音信号的采样率为8kHz,帧长K为256个采样点,帧叠为50%2.仿真所选标准:波形图,语谱图,信噪比,PESQ值,GUI语音增强性能测试界面03.仿真结果如下:首先在纯净语音中加入SdB高斯白噪

27、声作为带噪语音,采用子空间与小波包变 换的语音增强方法得到增强后仿真结果如下:0.2-£-0.2-0-0.2-_ -0.2-0.2-II-01.511.5a)K始诰音(采ff点救),T-b' N,2.5 X 1(?0-0.2 L00.2 =0*511.52(b)带噪讥汗(5dB估哋币(采样贞数)Z5X 10*0.511522)小波包变换S音増强方法t采样点数)2.54X 1002 = =00152.59)子空问和小波包变换的谄rt-増强"法采样点数斗ffl 5-10波形图比较Fig-5-lO waveform coinparisim2000>_ -40002000-4000 L上二七0.5152.50.5(a)ffi 始 1 啓 t/s2.5WHIP 峰 雷 E l (5dBA 噪声 Hf9-=2000-:-一 =4000-0,51,S2.520004000何小液包变换诰音增强方袪t/5T0.51.522,5(l)r-空间和小波包变换的i普宵增强方法t/s图5=11语讲®图比较FigJ-l 1 spectrogram com parisonK 5-2信嗥比比较table 5-2 Coinpaie l lie SNR输人信噪比何日)(151015小波也变换方法6J411畑3()12”£

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论