版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.语音增强算法研究 p584.1 小波理论 4.1.1小波变换的定义 4.1. 2小波去噪原理 .4.2 小波包变换语音增强方法4.2.1 小波包变换语音增强方法原理4 2. 2 Bark 尺度小波包分解 4.2.3闽值函数 4.2.4 实验仿真4.3 小波包变换和听觉掩蔽效应的语音增强方法4.3. 1 小波包变换和听觉掩蔽效应的语音增强方法原理4.3. 2实验仿真 第四章 小波包语音增强算法小波(Wavelets分析的起源可以追溯到20世纪初,在20世纪80年代后期开 始形成一个新兴的数学分支。 小波变换是调和分析这一数学领域半个世纪以来的 工作结晶, 是傅里叶变换发展史上的里程碑式的进展,
2、 近些年来成为国外众多学 者共同关注的热点。 它在傅里叶变换的基础上发展而来, 但又有极大不同。 传统 的信号处理方法是建立在傅立叶变换的基础上, 而傅立叶分析使用的是一种全局 的变换,要么完全在时域, 要么完全在频域, 因此无法表达信号的时频局域性质, 而这种性质恰恰是非平稳信号 (如语音信号 )最根本和最关键的性质。小波分析是 建立在泛函分析、 傅立叶分析、样条分析及调和分析基础上的新的分析处理工具 它又称为多分辨分析, 在时域和频域同时具有良好配局部化特性, 常被誉为信号 分析的“数学显微镜” 。小波变换在时频两域都具有表征信号局部特征的能力, 它克服了短时傅立叶变换固定分辨率的缺点,
3、在信号的高频部分, 可以获得较好 的时间分辨率, 在信号的低频部分可以获得较高的频率分辨率, 这就使指小波变 换具有对信号的自适应性。 它能有效地从信号中提取信息, 通过伸缩和平移等运 算功能对信号进行多尺度细化分析。 小波分析是目前国际上公认的信号信息获取 与处班领域的高新技术, 是信号处理的前沿课题, 其中小波去噪也是小波分析的 主要应用之一,对语音增强的研究不可避免的要利用小波这一有效工具。小波包变换理论是 20世纪 80年代中后期逐渐成熟并发展起来的, 由于可同 时进行时域和频域分析, 具有时频局部化和变分辨特征, 而且小波函数的选取也 很灵活,因此在语音增强中得到了广泛的应用。 这就
4、使得小波包变换在信号处理 方面有许多独到的优点,特别适用于像信号处理,图象处理,量子场论,地震探 测,话音识别与增强,雷达,机器视觉以及数字电视等科技领域 31-354.1小波理论4.1.1小波变换的定义(5-1)其中,": 为给定的一个基本函数,式中 a, b均为常数,且a>0。给定平方可积的信号 x(t ,-,贝U '的小波变换(wavelet transform,WT) 定义为:也(以)=(52)式中,a, b和t均是连续变量因此此式又称为连续小波变换(CWT信号的小波变换(a , b)是a和b的函数,b是时移,a是尺度因子又称为基本小波,或母小波。厂"
5、是母小波经移位和伸缩所产生的一组函 数,称之为小波基函数,或简称小波基。母小波可以是实函数,也可以是复函数之,川)7小为复函数也是实信号也是实函数,反在(5-1)式中,时移b的作用是确定对析的时间位置,也即时间中心的时域支撑范围(即尺度因子a的作用是把基本小波。丿的宽度%(的日屮dt(5-3)t-b,贝U dt=adt',这样,上式右边的积分即等于II屮时域宽度)较之 川) 变得越大;反之,当a<1时,a越小,则越窄。这样,a和b联合起来确定了对“'!分析的中心位置及分析的时间宽度这样,(5-2)式的小波变换可以理解为用一组分析宽度不断变化的基函数对作分析,这一变化正好适
6、应了对信号分析时在不同频率范围需要不同的1分辨率这一基本要求。(5-2)式中的因子丫"是为了保证在不同的尺度a时, 肖"始终能和母函数妙有蓍相同的能量,即:x的傅里叶变换为'(°),申的傅里叶变换为以°),由傅里叶变换的性质:必的傅里叶变换为:(5-4)(54)(5-5)化上(°)=妬)严由Parseval定理,(5-2)式可重新表达为:炉7;(“)=4(0),%(0)>ya f+QC2/r此式即为小波变换的频域表达式365.1.2小波去噪原理假设观察信号x(t)= $(r)+i/(f)(5-5)式中,人门是纯净语音信号,是噪声序
7、列。假定是零均值且服从高斯分布的随机序列,对(5-5)式两边做小波变换,根据小波变换的性质,有:WT 仏/>) = WT (#)+ WTt (a.b)(5-6)即两个信号和的小波变换等于各个信号小波变换的和。再令u (t)是零均值、独立同分布的平稳随机信号,记然:E 仙 = Q是"的协方差矩阵。(5-6)令"是小波变换矩阵,对于正交小波变换,它是正交阵。分别令 x和s是对应 s(t)和u(t)的向量,向量X, S和U分别是x(t) , s(t)和u(t)的小波变换,即: XWx. S =胎,U Wu(5-7)由于X =S+U令P是U的协方差矩阵,由于EU = EJ
8、165;u = WEu = 0所以:P= euUt = eWuutWt二 WQW1(5-8)(5-9)因为W是正交阵,且由此,可得到一个重要的结论:平稳白噪声的正交小波变换仍然是平稳的白 噪声。由此结论可知,对于加法性噪声模型,经正交小波变换后,最大程度地去 除了的相关性,其能量将集中在少数的小波系数上,这些系数即是信号经 小波变换后在各个尺度下的模极大值。 但是,噪声'经正交小波变换后仍然 是白噪声,因此,其小波系数仍然是不相关的,它们将分布在各个尺度下的所有 时间轴上。这一结论即为抑制噪声提供了理论依据,即在小波变换的各个尺度下 保留那些模极大值点,而将其他点置零,或是最大程度地减
9、小,然后利用处理后 的小波系数做小波反变换,即可达到抑制噪声的目的。5.2小波包变换语音增强方法 521小波包变换语音增强方法原理在小波变换中,由于多分辨分析只是对低频部分作进一步分解,高频部分则 不再分解。小波包分析能将频带进行多层次划分,对多分辨分析没有细分的高频 部分进一步分解,并能够根据被分析信号的特征,自适应地选择相应频带,使之 与信号频谱相匹配,从而提高了时一频分辨率 37。(5-10)假设带噪语音信号可以表示为:其中' '是含有噪声的语音信号, f是没有叠加噪声的语音信号, '是方差为c的高斯白噪声。对信号'W 进行n层离散小波包分解,得到一组小波
10、包分解系数", 由两部分组成:一部分是 '门对应的小波包系数,记为" ,另一部分是N(f)对应的小波包系数,记为对于每一个小波包分解系数,选择一个当的阈值*,并对系数进行阈值量化,得出估计小波系数厂,使得5.2.2 Bark尺度小波包分解Barkhausen等学者依据人耳的掩蔽效应的实验结果,提出了频率群的概念。即将基底膜分解为许多的小段,每一小段称为一个频率群。在20-16000HZ范围内共有24个频率群。同一频率群的声音在大脑中是叠加在一起进行评价的,具 有一致的心理声学特征。按频率由低到咼,将频率群顺序编号,将编号定义为 32新的频率单位Bark。若记Bark
11、域的频率变量为z,赫兹(Hertz)域频率变量为',则有:(5-11)Bark域的频率描述充分反映了人耳的听觉特性,因此在语音处理方面得到了大量应用。根据小波包的函数空间正交剖分理论,可以构造与人耳Bark域频率描述相似的小波包分解结构,称之为“ Bark尺度小波包分解”。常规方法是模拟人耳的24个频率群,对于8kHz采样的语音信号,选取1至17个频率群,得到的每个子带的中心频率相差 IBark。试验证实,如果对 Bark域进行进一步分解,使每个子带的中心频率相差减至 致,也不会导致较大的计算量。因此,所示,共68个子频带38-41。I '丨Ml.,对语音的描述会更加细 本论文
12、采用的小波包分解树结构如图5-1"(i;nC2.3)関呻 (3.5F 関屈1咼(4.3)恢 T) 4. S忸郭(4 WK 1111214,113 询斗 1!rs.BH5.ijiC5joi5.il rs,ia> cs.n)悒轲图5-1 bark尺度小艘包分解示惡图5.2.3阈值函数在小波阈值去噪理论中42-44,阈值函数的选取和阈值的确定是两个最基 本的问题。目前存在的阈值函数主要是硬阈值函数和软阈值函数。但由于硬阈值 函数整体不连续,直接导致了会在去噪后的信号中出现突变的震荡点,当噪声水平较高时,这种现象尤为明显。软阈值函数虽然整体连续性好, 但是由于当小波 系数较大时,处理过
13、的系数与原系数之间总存在恒定的偏差,这将直接影响重构信号与真实信号的逼近程度,给重构信号带来不可避免的误差。考虑到软、硬阈 值函数存在的缺陷,人们提出了各种基于这两种基本阈值函数的改进的阈值函 数。小波阈值丄在去噪过程中起到了决定性的作用。如果太小,那么,施加阈值以后的小波系数中将包含过多的噪声分量,达不到去噪的目的;反之,如果丄太大,那么将去除一部分信号的分量,从而使由小波系数重将后的信号产生 过大的失真。因此,在实际工作中,估计阈值的大小尤为关键。常用的估计阀值-的阀值函数为硬阈值函数45和软阈值函数46:(5-12)(5-13)但是,由于硬阈值函数整体不连续,直接导致了会在去噪后的信号中
14、出现突 变的震荡点,当噪声水平较高时尤为明显。软阈值函数虽然整体连续性好,但是 由于当小波系数较大时,处理过的系数与原系数之间总存在恒定的偏差, 这将直 接影响重构信号与真实信号的逼近程度。文献36提出了一种改进的阀值函数能够有效减少失真,其阀值函数:(5-14)sgn(炉口 )一种改进的阀值函数公式为(5-15)纯净语音S小波包变换语靑增强方济原理图Hig.5-2 principle diagram of wavelet packet小波包变换语音增强方法原理图带噪语音小波包变换的语音增强算法的具体步骤为:步骤1:对带噪语音''1 ';分帧。步骤2:采用5阶Daube
15、chies小波进行Bark尺度小波包分解,得到每一级的小W波包分解系数 。步骤3:用小波系数在各尺度下绝对值的中值估算噪声方差median W t )rr =(5T6)'0.6745步骤4:利用通用阀值Z '-计算每一级的节点阀值,并对该节点的小波包分解 系数进行采用公式(5-15)的处理,更新小波包系数。=(5-17)步骤5:进行小波包重建,重叠相加恢复原始数据帧长度的增强语音。524实验仿真用MATLAB寸Bark尺度小波包变换语音增强方法进行实验仿真:1. 实验所用数据:语音取自863语音库,噪声为NOISEX. 92数据库的高斯白噪声和火车噪声, 语音信号的采样率为8k
16、Hz,帧长K为256个采样点,帧叠为50%2. 仿真所选标准:波形图,语谱图。3. 仿真结果如下:0.2ihjL|i|U|L.JJ| IIJ.Jjl1一® 0'卜I训糾伸州神I训小-Hj!:.1'-,捫.1 巾钏屮'皿:|制ULi山-0.2-nTVln'J|训|"帅-00.511.522,5(b)带噪语音(5dBfl噪声(采样点数、0.200.511.522.5200040000(时原始语音t/s00.511.522.52000400000.511.522,5©小波包变换语音増强方法(采样点数x w4图5-3波形图比较Fig.5-3
17、 wavcfbmi comparison0卩)带噪语音(10dBd噪声)t/802000400000.511.522.59)小波包变换语咅增强方法埔强语音t/s图44语谱图图比较Fig.5-4 spectrogratn comparison5.3小波包变换和听觉掩蔽效应的语音增强方法 531小波包变换和听觉掩蔽效应的语音增强方法原理小波包变换理论是20世纪80年代中后期逐渐成熟并发展起来的,由于可同 时进行时域和频域分析,具有时频局部化和变分辨特征,而且小波函数的选取也 很灵活,因此在语音增强中得到了广泛的应用。 但是,增强后不可避免地伴有一 定程度的音乐噪声,影响了增强效果。掩蔽效应通过模拟
18、人耳的感知,能够掩蔽 同时进入听觉系统的较小噪声信号。优点是可以有效地抑制音乐噪声,缺点是性 能受限于对背景噪声功率谱估计的准确性, 且计算量较大,运行速度较慢。为了 抑制音乐噪声和提高运算速度,本文提出一种基于小波包变换和听觉掩蔽效应的语音增强算法,同时具备了小波包变换和掩蔽效应两种方法的优点。仿真结果表明,该算法在信噪比和听觉舒适度上都取得了较好的效果。小波包变换和听觉掩蔽效应的语音增强方法原理图 :图5-5小波包变换和听觉掩蔽败应的语晋増强方沬原理團Fig.5-5 principle diagram of wavelet packet and hearing masking effect
19、感知滤波器的作用是在信号频谱失真最小的情况下使残差噪声的频谱能量 小于掩蔽阈值。感知滤波器 戸'应满足:|/(训冷< T(o)H(co) <1(5-18)其中,上r为背景噪声功率谱密度,八二为噪声掩蔽阈值。")1的具体形式为:H(ry)| = min(l,r(fu)/|(ty)|2)(5T9)基于小波包变换和听觉掩蔽效应的语音增强算法的步骤为:步骤1:对带噪语音信号用小波包分解的方法进行去噪处理,得到增强后的语音AA信号A,并进行分帧得到、0步骤2:用Johnston掩蔽模型计算掩蔽阀值T。步骤3:使增强语音、和掩蔽阀值T经过感知滤波器"'进行滤
20、波,得到'AAS.() = S2(o)Ho)(5-20)步骤4:经过帧重叠相加得到增强语音 * o532实验仿真用MATLAB寸小波包变换和听觉掩蔽效应的语音增强方法进行实验仿真:1. 实验所用数据:语音取自863语音库,噪声为NOISEX. 92数据库的高斯白噪声和火车噪声,语音信号的采样率为8kHz,帧长K为256个采样点,帧叠为50%2. 仿真所选标准:波形图,语谱图,信噪比,PESQfi,坂仓距离。3. 仿真结果如下:首先,在纯净语音中加入5dB高斯白噪声作为带噪语音,采用基于小波包变换 和听觉掩蔽效应的语音增强算法(本文算法),比较传统的小波包变换增强算 法,增强后仿真结果如
21、下:0.2-A JIIL-d卜-卜討! iNhLb hL ih iLkhMIL JNh亠u一i严IWH卩 理训竹“删L|i ' j0.200,511.522.5原始语音(采样点数)x 1Q40.2-III1,3皿uiJiiihi.11“.ii.n翌0-1 -in Ir叫X M11 |,i|l-0.2-一00.511.522.5带噪语咅佢加白噪声)采样点数)0.2-11 JIJ一0呱|'1机|训丿1 'J 1 'l r,-i,l:l.卜4ilW血z z , b±1卄叫砒II州出片州"TtlHl蔓 111Ml删F|wI Wfill-0.200.5
22、11.522.52)小波包变换语育增强方法(來样点数)0,2=0-. 'IDl |i|i'jkl l " J hl' 1”+Mry .ITn |lr-0.200,511.522.5(日)小波包变换利掩蔽效应语音增强方法(采样点数)x 1Q4图5-6波形图比较Fig.5-6 waveform comparison原始语音(t/s)000,511.522.52000400Q(b)带 噪 语 音(5dB白噪声)<t/s)00,511.5225©小波包变换语音增强方法(t/s)20004000竄 2000400000.511.522.5(d)小波包变换
23、和掩蔽效应说音增强方法(西、0图5-?语谱图图比较Fig.5-7 spectrogram comparison4. 结果分析图5-6和图5-7分别为增强后的波形图和语谱图。其中,(a)为纯净语音; (b)为添加5dB白噪声后的带噪语音;(c)为采用小波包变换语音增强方法后的增 强语音。(d)为采用小波包变换和掩蔽效应语音增强方法后的增强语音。从时域 波形图及频域语谱图的比较结果可以发现,带噪语音采用本文算法增强后,增强语音和原始语音在波形图和语谱图上非常接近,噪声得到了明显的抑制,增强效果明显优于传统小波包变换的增强算法。其次,采用在纯净语音中分别加入高斯白噪声, 全局信噪比为OdB,5dB,
24、10dB 的带噪语音作为测试对象。比较小波包变换和听觉掩蔽效应的语音增强方法和传 统小波包变换的增强算法,增强后语音质量性能的评估采用信噪比 SNR和语音质 量感知评估PESQ PESQ是 ITU-T的P.862标准,用来评价增强后语音的试听效 果。PESQ#分在4.5到-0.5之间,得分越高表示语音质量越好。实验结果如表 5-1 示:- L3 5 2 & 1Z1迴OS山d壬皐一匸0.5小波包变换和听觉掩蔽效应语昔增强方袪1| 小波包变换语音增强H法0012345678910输入悟噪比(dB)(d噪声图5-8感知语音质量评价(白噪声)比较Fig.5-8 PESQ(white noise
25、) comparison从实验结果可以看出,在各种信噪比下采用小波包变换和听觉掩蔽效应的语音增强方法比传统小波包方法,在信噪比和PESQ上都有很大提高,并且在信噪比较小的情况下,增强效果更加明显。通过主观听测表明:采用传统小波包方法增强后伴有明显的音乐噪声,而采用该方法增强后音乐噪声得到了明显地抑制, 取得了较好的增强效果。表5T信噪比比校Table 5-1 coTnpare the SNR噪声种娄输入信噪比(曲)小波包变换方法(dB)小波包变换和掩蔽效应方法白噪声04.22936 24K658.48219.62681012,509412.91745.4子空间和小波包变换的语音增强方法541子
26、空间与小波包变换的语音增强方法原理子空间与小波包变换的语音增强方法原理图为带噪语音YKL 变 换Ay估计噪声粘征值A,小波包变换带噪语怖征值减去噪卅特:征值纯净语音KL逆变换图5-9空间与小波包变换的语音增强方法原理图Fig. 5-9 principle diagram of subspace and wavlct packet子空间与小波包变换的语音增强方法具体步骤为:步骤1:带噪语音进行KL,变换,得到子空间域中的带噪语音的特征向量U和特征值八。步骤2:采用最小值跟踪算法更新带噪语音特征值八,得到估计噪声特征值2J 0步骤3:采用小波包变换方法更新带噪语音特征值八得到。步骤4:带噪语音特征
27、值八减去噪声特征值' ,得到纯净语音特征值估计值:'、,可以得到时域约束估计器(TDC)增益GH S = H 7步骤5:由KL逆变换可得最优估计器。由-式可得纯净语A音的估计'0542实验仿真用MATLAB寸子空间与小波包变换的语音增强方法进行实验仿真:1. 实验所用数据:语音取自863语音库,噪声为NOISEX. 92数据库的高斯白噪声和火车噪声, 语音信号的采样率为8kHz,帧长K为256个采样点,帧叠为50%2. 仿真所选标准:波形图,语谱图,信噪比,PESQfi, GUI语音增强性能测试界面。3. 仿真结果如下:首先在纯净语音中加入SdB高斯白噪声作为带噪语音,
28、采用子空间与小波包变 换的语音增强方法得到增强后仿真结果如下:0.20-0.200.511.522.5(c)小波包变换语音增强方法(采样点数)x w4图5-10波形图比较Fig.5-10 waveform comparison(a)> 始语 h Vs004000200_Ni 2000400000.511.522.5(b)带噪语音(5dBS噪声)t/E020004000Q0.511522.5何小波包变换语音增强方法t/s000.511522.5(d子空间和小波包变换的语音览强方法t/s20004000图5-11语谱图图比较Fig,511 spectrogram comparison输入信噪比gB)051015小波包变换方浓6,24119.623011819616.0786子空间和小波包变换的方法8.719511.843916.054218.1103表5-2信噪比比较Tab
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025重庆市商品房买卖合同正式
- 2025烟叶种植收购合同
- 2025关于保险合同纠纷管辖的问题
- 2025农村土地承包租用合同书
- 商品房购买合同补充协议
- 加油站承包项目合作合同
- 亲人间借款合同范例
- 提供家具合同范例
- 场地租货合同范例
- 检验销售合同范例
- 国开(甘肃)2024年春《地域文化(专)》形考任务1-4终考答案
- 人力资源管理智慧树知到期末考试答案章节答案2024年湖南大学
- 西方音乐史智慧树知到期末考试答案章节答案2024年四川音乐学院
- 水处理药剂采购投标方案
- 2023年机动车检测站质量手册(依据2023年版评审准则和补充要求编制)
- 妇科手术快速康复治疗
- MOOC 数据新闻可视化-江西财经大学 中国大学慕课答案
- MOOC 美在民间-南京农业大学 中国大学慕课答案
- 期末竞赛试卷(试题)-2023-2024学年六年级下册数学人教版
- MOOC 电子技术实验-北京科技大学 中国大学慕课答案
- 苏州职业大学单招职业技能测试参考试题库(含答案)
评论
0/150
提交评论