基于小波分析的语音信号去噪处理的研究_第1页
基于小波分析的语音信号去噪处理的研究_第2页
基于小波分析的语音信号去噪处理的研究_第3页
基于小波分析的语音信号去噪处理的研究_第4页
基于小波分析的语音信号去噪处理的研究_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 单位代码: 005 分 类 号: TN 延安大学西安创新学院 本科毕业论文(设计)题 目: 基于小波分析的语音信号去噪 技术研究 专 业: 电子信息工程 姓 名: 王 明 学 号: 1043132034 指导教师: 黄 同 职 称: 讲 师 毕业时间: 二一四年六月 基于小波分析的语音信号去噪技术研究摘要:本论文利用小波在语音信号去噪方面的良好应用,首先对小波信号进行分析,并用傅立叶变换与小波变换进行比较,发现他们的相同点与不同点,对小波基分析,发现小波基的选取对去噪效果没有太大的影响;后对阈值法分析,发现阈值法具有计算量小、去噪效果好的特点,并且在阈值法中,阈值的选取直接关系到去噪效果的优

2、劣。本论文重点使用小波阈值法,针对不同的阈值函数、阈值处理方法及小波函数做出了选取;针对阈值法中高频信号失真的缺点,我们对小尺度上的小波系数做谱减法预处理;之后以一个小阈值去除剩余噪声,大尺度上仍然利用阈值法处理。经过仿真实验表明,这种处理方法较传统的小波阈值法,保留了更多有用信号,减小了去噪后语音信号的失真。关键词:小波分析;阈值去噪;谱减法。Research on speech signal de-noise based on the wavelet analysisAbstract:This thesis takes advantage of the wavelet in speech

3、signal denoising of good application. For one thing, we analyze the wavelet signal ,comparing the Fu Liye transform with wavelet transform to find their same and different points.On wavelet basis analysis,we found that the selection of wavelet base has not enough influence on denoising effect. After

4、 we make an analysis on the threshold value method, founding the threshold method has small computation and good de-noising effect characteristics. And in the threshold method, the selection of threshold value is directly related to the denoising effect;This thesis focuses on the use of wavelet thre

5、sholding method, according to the different threshold function and threshold processing method and wavelet function to make a choice; Aiming at the shortcoming of the high frequency signal distortion in threshold method, we do to small scale wavelet coefficients of spectral subtraction pretreatment

6、and then to a small threshold to remove residual noise, large scale still using the method of threshold processing. After the simulation experiment indicated that, this method compare to the traditional wavelet threshold method retaining more of the useful signal and reducing the noise after the spe

7、ech signal distortion.Keywords: Wavelet analysis;Threshold de-noising; Spectral subtraction.目 录1引言12小波分析22.1傅立叶变换22.2小波变换32.3 傅立叶变换与小波变换的比较53小波去噪基本理论63.1 信号和噪声在小波域的传播特性63.2 小波基的选取63.3 小波阈值去噪及通用阈值法(sqtwolog 原理)83.4小波阈值处理方法94基于小波分析的语音信号去噪104.1 语音信号特性与噪声特性104.1.1 语音信号特性104.1.2 语谱图114.1.3 噪声特性124.2 语音去噪

8、效果评价134.3 小波阈值法语音去噪仿真实验144.3.1 不同小波基的比较144.3.2 不同阈值处理方法的比较154.3.3 不同阈值选取方法的比较164.3.4 小波阈值法总结174.4 小波阈值法与谱减法相结合的语音去噪174.4.1 小波阈值法的缺点和谱减法的介绍174.4.2 利用谱减法进行预处理后的小波阈值去噪205结论23参考文献24致 谢25附 录26延安大学西安创新学院本科毕业论文(设计)1引言语音信号处理是信息高速公路、多媒体技术、办公自动化、现代通信及智能系统等新兴领域应用的核心技术之一,它主要包括语音通信、合成、识别和增强(去噪)等方面。在各种语音处理系统的实际应用

9、中,由于噪声的存在会使语音处理系统的性能恶化,语音增强是解决噪声污染的一种有效方法,它的一个主要目标是从带有噪声的语音信号中提取尽可能纯净的原始语音信号。然而,由于干扰通常都是随机的,因而从带有噪声的语音中提取完全纯净的语音信号几乎是不可能的,这样,语音增强的主要目的是改进语音质量,消除环境噪声,也就是从带噪语音信号中滤除噪声,提高语音信号的信噪比1。在许多情况下,我们所关心的语音信号常常会被其它信号所污染,即在我们所关心的语音信号中掺杂着噪音,干扰了我们的听辨。这对我们听出语音信号中夹带的有效信息带来了很大困难,在不少领域里影响人们的工作效果2,例如:公安领域:公安干警往往会窃听犯罪嫌疑人的

10、对话。由于周围环境的影响、所用设备的限制和犯罪嫌疑人讲话的清晰程度,使得入录的语音信号或多或少会受到噪音的干扰。这对听清楚犯罪嫌疑人话中的意思,知道他们的意图带来了很大的困难。如果我们能去除语音信号中的背景噪音,提高语音信号的信噪比,就能使公安干警听出犯罪嫌疑人讲话的意思。这将对防止刑事案件的发生或加快破案进程起到积极的作用。新闻领域:对记者来讲,野外采访是常有的事,然而由于采访地点周围环境的影响,如风声、汽车喇叭声、建筑工地的打桩声等等,他所采访到的录音往往会被周围的噪音所污染,影响了采访效果。这时也需要对采访录音进行降噪处理,以便让听众能够更清楚地听到记者和被采访者之间的对话。语音识别领域

11、:当今语音识别是一个非常热门的话题,有许多人在研究,市场上己经出现了不少产品,例如IBM的语音识别系统Viavoices但是它们有一个共同的弱点,就是识别率并不是很高,其中一个主要原因是噪音对提取语音信号中特征值的影响。所以先对输入的语音信号进行适当的降噪处理是非常有必要的,处理效果的好坏直接影响到语音识别系统的识别率。在现实生活中,语音信号降噪处理的意义很大,它能帮助我们解决很多问题。找到有效的语音降噪方法将对不少领域里的工作产生积极的影响。小波分析在语音信号去噪方面的应用:对于语音信号去噪的研究是语音信号处理中一个永恒的话题。小波分析是一种多尺度的信号分析方法,是分析非平稳信号的有力分析工

12、具,它克服了短时傅立叶变换固定分辨率的弱点,即可以分析信号的概貌,也可以分析信号的细节,已经在语音处理、图象处理、地震信号分析、数据压缩等方面获得了广泛地应用。现今,人们已经开始将小波变换理论应用到语音去噪上来,有不少人正在对此进行研究,也提出了一些新的算法,并取得了一些成果。小波分析在信号滤波中的应用:在传统的基于傅立叶变换的信号处理方法中,要是信号和噪声的频带重叠部分尽可能小,这样就可以在频域通过时不变方法将信号同噪声区分开。而当他们的频谱重叠时,这种方法就无能为力了,基于小波变换的非线性滤波方法是完全不同的,在小波变换域,可通过对小波系数进行削切、缩小幅度等非线性处理,以达到滤除噪声的目

13、的。采用这种方法滤波可以在一定程度上避免一般低通滤波器滤波时造成的信号突变部分变模糊,然而与传统的低通滤波器相似,小波滤波也会造成一定的信号细节丢失。基于此,针对小波阈值法对语音信号高频部分造成损伤较大的缺点,采用小波阈值法与谱减法相结合的方法,保留了高频信号,使得去噪效果得到改善3。2小波分析2.1傅立叶变换傅立叶变换(Fourier transform,FT)由下式定义:正变换: (2.1)逆变换: (2.2)对于确定信号和平稳随机信号,傅立叶变换是信号分析和信号处理技术的理论基础,有着非凡的意义,起到巨大的作用。傅立叶变换把时间域与频率域联系起来,具有明确的物理含义,通过来研究,许多在时

14、域内难以看清的问题,在频域中往往表现的非常清楚。但正是由于傅立叶变换的域变换特性,与彼此之间是整体刻画,不能够反映各自在局部区域上的特征,因此不能用于局部分析。 简言之,傅立叶变换能提取出函数在整个频率轴上的频率信息,却不能反映信号在局部时间范围内的特征。对于变频信号,如音乐、地震、回波信号灯,此时所关心的恰恰是信号在局部时间范围内的信号特征对非平稳信号用傅立叶变换进行分析,不能提供完全的信息,也即通过傅立叶变换,可以知道信号所含有的频率信息,但无法知道这些频率信息究竟出现在哪些时间段上。可见,若要提取局部时间短的频率信息,傅立叶变换已经不再实用。2.2小波变换小波变换的概念是1984年法国地

15、球物理学家J.Morlet在分析地球物理勘探资料时提出来的。小波变换的数学基础是傅立叶变换,其后理论物理学家A.Gr ossman采用平移和伸缩不变性建立了小波变换理论体系。1985年,法国数学家Y.Meyer第一个构造出具有一定衰减性的光滑小波。1988年,比利时数学家,I.Daubechies证明紧支撑正交标准小波基的存在性并成功造出了它,使得离散小波分析成为可能4。1989年,S.Mallat提出了多分辨分析概念,统一了在此之前各种小波构造方法,特别提出了二进离散小波快速算法,使得小波走向实用性。小波分析是一种窗口面积固定但其形状可以改变,时间窗和频率窗都可改变的时频局域化分析方法,即在

16、低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,所以称为数学显微镜。正是这种特性,小波变换具有对信号的自适应性。小波变换具有以下的特点和作用:(1)具有多分辨率的特点,可以由粗到细逐步观察信号;(2)我们可以把小波变换看成用基本频率特性为的带通滤波在不同尺度a下对信号做滤波。由于傅立叶变换的尺度特性,如果的傅立叶变换是,则的傅立叶变换是,因此这组滤波器具有品质因数恒定即相对带宽(带宽与中心频率之比)恒定的特点。(3)适当的选择基本小波,使在时域上为有限支撑,在频上也比较集中,便可以是小波变换在时频两域都具有表征信号局部特征的能力,这样就有利于检

17、测信号的瞬态或奇异点。小波分析基本理论:小波(Wavelet),即小区域的波,是一种特殊的长度有限(紧支集)或快速衰减,且均值为零的波5,如图2.1所示。图2.1 DB4小波函数小波函数的确切定义为:设为一平方可积函数,即,若其傅立叶变换满足条件: (2.3)则称为一个基本小波或小波母函数。称式 (2.4)为小波函数的可容性条件。 由小波定义,我们可以知其两个特点:(1)一是小,即在时域都具有紧支集或近似紧支集;(2)二是正负交替的波动性,也即直流分量为零。将小波母函数进行伸缩和平移,就可以得到函数 (2.5)我们称为依赖于参数,的小波基函数。它们是由同一母函数经伸缩和平移后得到的一组函数序列

18、。小波变换的含义:把一组称为基本小波的函数做位移后,在不同尺度下与待分析信号做内积: (2.6)若满足容许条件,则存在逆变换: (2.7)2.3 傅立叶变换与小波变换的比较(1)傅立叶变换的实质是把能量有限的信号分解到以为正交基德空间上去;小波变换的实质是把能量有限的信号分解到有小波基函数所构成的空间上去。(2)傅立叶变换用到的基函数只有,具有唯一性;小波分析所用到的小波函数则不是唯一的。小波函数的选用是小波分析中一个难点问题也是分析研究的一个热点问题,目前往往是通过不断的实验将不同的分析结果进行对照来分析选取小波函数。一个重要的经验是根据待分析信号和小波函数的相似性选取,而且要考虑小波的小时

19、矩、正则性、支撑长度等参数。(3)在频域中,傅立叶变换具有较好的局部化能力,特别是对于那些频率成分比较简单的确定信号,傅立叶变换很容易把信号表示成各频率成为叠加的形式,但在时域,傅立叶变换没有局部化能力,无法从信号的傅立叶变换中看出在任一点附近的形态。因此,小波变换在对瞬态信号分析中拥有更大的优势。(4)在小波变换中,尺度a越大相当于傅立叶变换中的值越大。(5)在短时傅立叶变换中,变换系数主要依赖于信号在时间窗内的情况,一旦时间窗函数确定,则分辨率也就固定了。而在小波变换中,变换系数虽然也是依赖于信号在时间场窗的情况,但是时间宽度是随尺度的变化而变化的,所以小波变化具有时间局部化分析能力。因此

20、,小波变换也可以看成是信号局部奇异性分析的有效工具。(6)若用信号通过滤波器来解释,小波变换与短时傅立叶变换不同之处在于:对短时傅立叶变换来说,带通滤波器的带宽与中心频率无关;相反,小波变换带通滤波器的带宽则正比于中心频率,即:,C为常数。亦即滤波器有一个恒定的相对带宽,称之为等Q结构。我们希望在对低频信号分析时,频率分辨率高,在对高频信号分析时,频率分辨率低,等Q结构恰适应了这种要求。(7)从框架结构角度来说傅立叶变换是一种非冗余的正交紧框架,而小波变换却可以实现冗余的正交非紧框架。这种特点,对于某些场合是很有用的6。3 小波去噪基本理论3.1 信号和噪声在小波域的传播特性信号的奇异性或非正

21、则性结构往往包含了它的本质信息。例如,图像亮度的不连续性表示其中含有边缘;在心电图或雷达信号中,令人感兴趣的信息包含在信号的峰变处。可以证明,信号的局部正则性可由其小波变换幅值随尺度参数的衰减特性来刻画,奇异性和边缘可以通过确定小波变换在细尺度下的局部模极大值来刻画。原始信号在尖锐变化点的每个尺度上都产生极大值点,也就是说,局部模极大值点描述了信号和图像的边缘,而噪声能量却集中在小尺度上,其小波系数的幅度值随着尺度的增加迅速衰减。即信号和噪声在多尺度空间上具有不同的特性,数学上称它们有不同的Lipschitz指数。设 n 是一非负整数,如果存在两个常数A和此多项式,使得对任意的,均有,则称在点

22、为 Lipschitz 指数a。Lipschitz指数越大,函数越光滑。对于白噪声,可以证明它是一个处处奇异的随机分布,具有负的Lipschitz指数,其小波变换系数随着尺度的增大而减小;信号的Lipschitz通常为正,其小波变换系数随着尺度的增大而增大。3.2 小波基的选取与标准的傅立叶变换相比,小波分析中所用到的小波函数不具有唯一性,即小波函数具有多样性。小波分析在工程应用中,一个十分重要的问题就是小波基的选取问题,虽然根据不同的标准,小波函数具有不同的类型,这些标准通常是以下几点:(1) 支撑长度:,的支撑区间,是当时间或频率趋于无穷大时,从,一个有限值收敛到0的长度。支撑长度越长,一

23、般需要耗费更多的计算时间,而且产生更多高幅值的小波系数。(2) 对称性:具有对称性的小波,在图像处理中可以很有效的避免相位畸变,因为该小波对应的滤波器具有线性相位特性。(3) 消失矩:和的消失矩阶数,对于数据压缩和特征提取是非常有用的,消失矩越大,就有更多的小波系数为零。但在一般情况下,消失矩越高,支撑长度越长,必须做折中处理。(4) 正则性:正则性好的小波,能在信号或图像的重构中获得较好的平滑效果,减小量化或涉入误差的影响。但在一般情况下,正则性越好,支撑长度越长,计算时间也就越大,也必须有所权衡。(5) 相似性:选择和信号波形相似的小波,这对于压缩和消噪是有参考价值的。不同的小波基对信号的

24、描述是不同的,希望所选取的小波基能同时具有下列性质:(1)对称性或反对称性;(2)较短的支撑;(3)正交性;(4)较高的消失矩。然而,Daubichies已经证明,Haar小波是紧支正交小波基中唯一具有对称性(反对称性)的小波基,并且较短的支撑和较高的消失矩是一对矛盾。所以,为了得到小波基的对称性,就要放弃小波基的一些其他性质,或保持小波基的紧支性、正交性就只能得到近似的对称性。DBN小波和symN小波是工程实践中应用最为广泛的、最具价值的小波,仿真也表明这两种小波具有很好的去噪性能。N是小波的阶数,即消失矩为N,支撑区间为2N-1,symN是一种近似对称的小波,是对DBN的一种改进。在本文中

25、,使用sym4小波。(a) DB4 (b) sym4图3.1 小波函数3.3 小波阈值去噪及通用阈值法(sqtwolog 原理)假设观测数据 (3.1)是由语音信号和加性噪声组成,在理想情况下,为与信号不相关的正态白噪声,对上式所观测的数据去噪,Donoho提出了两个前提条件:(1)光滑性:在大概率上,至少和有同样的光滑度;(2)适应性:最小方差估计。由(3.1)式可推出,当 N无穷时,下式几乎以接近于1的概率成立: (3.2)其中C1 为一常数。这在小波域中意味着: (3.3)成立,式中i为位置,j为尺度,表示真是信号在尺度j上的第i个小波系数。对于条件(2),可以理解为对求最小值,这等于求

26、的最小值。Donoho证明,此时、 必须满足: (3.4)当小波变换为正交小波变换时,r=1。由(3.4)可知 (3.5)由式(3-5)可知,对于任何取,将满足式(3-4),这相当于认为当时由噪声所产生,因此,可取阀值。为噪声标准差,通常不可能精确得到,Donoho提出用下式来估计: (3.6)估计标准差时使用第一层分解得到的高频系数CD1,是因为它是最精细的分解系数,主要是噪声系数。3.4小波阈值处理方法小波阈值处理方法有硬阈值法和软阈值法。硬阈值法11: (3.7)图3.2 硬阈值法软阈值法: (3.8)图3.3 软阈值法以上介绍的硬阈值法和软阈值法其本质区别在于选取的阈值函数不同,体现了

27、对小波系数的不同处理策略。硬阈值法直接将高于阈值的小波系数保留不做任何变化,而软阈值法将高于阈值的小波系数减去阈值做收缩处理。Bruce和Gao证明了硬阈值法往往有较大的方差而软阈值法往往有较大的偏差,基于此,Gao HongYe提出了一种半软阈值(semisoft shrinkage)法,即: (3.9)其中,,分别为上阈值和下阈值。可以看出。当时,可以转化为硬阈值,时可以转化为软阈值,它是硬阈值和软阈值的一种折中形式,不但保留了较大的系数,而且具有连续性。然而在该方法中,需要确定两个阈值,增加了算法的复杂度。随后,Gao HongYe又提出了用Garrote函数作为阈值函数,并证明了各种阈

28、值方法得到的去噪结果是渐进相等的。其形式如下: (3.10)在实际应用中,应根据需要选择合适的处理方式。4基于小波分析的语音信号去噪4.1 语音信号特性与噪声特性4.1.1 语音信号特性由于语音的生成过程与发音器宫的运动过程密切相关,而且人类发音系统在产生不同语音时的生理结构并不相同,因此使得产生的语音信号是一种非平稳的随机过程(信号)。但由于人类发生器官变化速度具有一定的限度而且远小于语音信号的变化速度,可以认为人的声带、声道等特征在一定的时间内(10-30ms)基本不变,因此假定语音信号是短时平稳的,即语音信号的某些物理特性和频谱特性在10-30ms的时间段内近似是不变的,具有相对的稳定性

29、,这样可以运用分析平稳随机过程的方法来分析和处理语音信号。在语音增强中就是利用了语音信号短时谱的平稳性。语音信号基本上可以分为清音和浊音两大类。清音和浊音在特性上有明显的区别,清音没有明显的时域和频域特性,看上去类似于白噪声,并具有较弱的振幅;而浊音在时域上有明显的周期性和较强的振幅,其能量大部分集中在低频段内,而且在频谱上表现出共振峰结构。在语音增强中可以利用浊音所具有的明显的周期性来区别和抑制非语音噪声,而清音由于类似于白噪声的特性,使其与宽带平稳噪声很难区分。由于语音信号是一种非平稳、非遍历的随机过程,因此长时间时域统计特性对语音信号没有多大的意义,而短时谱的统计特性对语音信号和语音增强

30、有着十分重要的作用。语音信号短时谱幅度统计特性的时变性,使得语音信号的分析帧在趋于无穷大时,根据中心极限定理,其短时谱的统计特性服从高斯(Gauss)分布,而在实际应用时只能在有限帧长下进行处理,因此,在有限帧时这种高斯分布的统计特性是一种近似的描述,这样就可以作为分析宽带噪声污染的带噪语音信号增强应用时的前提和假设7。4.1.2 语谱图语音的时域分析和频域分析是语音信号分析的两种重要方法。显然这两种单独的分析方法均有局限性:时域分析对语音信号的特性没有直观的了解;而频域分析出的特性中又没有语音信号随时间变化的关系。因此,人们致力于研究语音的视频分析特性,把和时序相关的傅立叶分析的显示图形称为

31、语谱图(Spectrogram)。语谱图是一种三维图形,它是表示语音频谱随时间变化的图形,纵轴为频率横轴为时间,任一给定频率成分在给定的时刻的强弱用相应点的灰度或色调浓淡来表示。图4.1 纯净语音信号从图4.2中我们可以清晰的看到语音信号每一时刻的频率成分及其大小。图4.2 纯净语音信号语谱图4.1.3 噪声特性根据与输入语音信号的关系,噪声可以分为加性噪声和非加性噪声两类。加性噪声通常分为周期性噪声,脉冲噪声,宽带噪声和同声道其他语音的干扰等;非加性噪声主要是残响及传送网络的电路噪声等。非加性噪声往往可以通过某种变换,如同态变换转换为加性噪声,因此,在这里主要分析加性噪声的干扰8。(1)周期

32、性噪声周期性噪声主要来源于发动机等周期性运转的机械,如常见的电动机、风扇之类周期运转的机械所发出的噪声即为周期性噪声;电气干扰也会引起周期性噪声,如50Hz交流电源哼哼声也是周期性噪声。在频谱图上它们表现为离散的窄谱,实际中受到多种因素的影响,通常这些窄谱都是时变的,位置也不固定。因此必须采用自适应滤波的方法才能有效地区分这些噪声分量。(2)脉冲噪声脉冲噪声来源于爆炸、撞击、打火、放电及突发性干扰等。其特性是时间上的宽度很窄,它的时域波形是类似于脉冲函数的窄脉冲,因此将这种噪声称为脉冲噪声。消除脉冲噪声通常可以在时域内进行,通常有两种方法:对带噪语音信号的幅度求均值,将该均值作为判断阈值,凡是

33、超过该阈值的信号均判别为脉冲噪声,然后在时域内对该信号进行适当的衰减,就可完全消除噪声分量;当冲击脉冲不太密集时,可以通过某些点内插的方法避开或者平滑掉冲击点,通过这种在时域上对脉冲噪声平滑后,从而能在重建语音信号中去掉脉冲噪声。(3)宽带噪声宽带噪声来源很多,热噪声、说话时同时伴随着呼吸气流引起的噪声以及各种随机噪声源、量化噪声都可以视为宽带噪声。对于平稳的宽带噪声,在应用中常近似为Gauss噪声或白噪声。其显著特点是在时域上或频域上宽带噪声与语音信号基本上重叠,噪声频谱遍布于语音信号频谱之中,导致消除这种噪声比较困难,谱减法是处理宽带噪声最通用和有效的方法。(4)同声道语音干扰在实际生活中

34、经常会有多个人同时说话的情况,此时不需要的干扰语音和待传语音信号同时在一个信道中传输所造成的语音干扰称为同声道语音干扰。由于一般情况下两种语音的基音不同,也不成整数倍,因此区分有用语音和干扰语音的基本方法是利用它们的基语差别。人的双耳效应和人类语音中包含的每个人都独有的“声纹”特征,这种人体内部语音理解机理的感知能力,使得人耳可以根据需要分辨出其中某人的声音,这种能力称为“鸡尾酒会效应”。在实际环境中,背景噪声可以看作加性噪声,如风扇的声音、汽车引擎、周围人说话声等等。加性噪声是对背景噪声一种比较贴切的表述。麦克风等声音采集设备在正常工作的范围内可以近似看成是一个线性系统,即产生信号的幅度和声

35、强成正比。从能量角度看背景噪声和语音的声强是相加关系。因此两者对麦克风共同作用所形成的含噪语音的信号等于各自形成的信号之和。当然严格说来,背景噪声和语音不可避免存在非线性作用,但其不是含噪语音的主要成分。由于背景噪声的广泛存在性,因此针对这类噪声的研究成为语音去噪的重点。4.2 语音去噪效果评价语音去噪效果不是仅仅是信号处理的问题,而且涉及到了语音学、语言学等诸多领域,简单的说,从评价主体来区分,我们可以从主客观两方面来评价语音去噪后的效果。从客观来讲,我们可以用通用的去噪评价标准信噪比(SNR),均方根误差(RSME)来衡量。信噪比定义为: (4.1)其中为信号,为噪声。均方根误差定义为:

36、(4.2)其中是去噪后信号。主观评价方法以人为主体在某种预设原则的基础上对语音的质量作出主观的等级意见或者作出某种比较结果,它反映听评者对语音质量好坏的主观印象。不同的主观评价方法对语音质量考察的侧重点不同,常见的主观评价方法有平均意见分数(Mean Opinion Score, MOS)方法、判断韵字测试(Diagnostic Rhyme Test, DRT)方法、失真平均意见分(Degradation Mean Opion Score,DMOS)、判断满意度测试(Diagnostic Acceptability Measure, DAM)方法和汉语清晰度测试。主观评价的优点在于直接、易于理

37、解,真实反映语音质量的实际情况。然而,主观评价不但对听评条件、听评流程有严格要求,为了避免个别听评者的感知偏差,还需要对大量的听评者的评价结果做统计,因此主观评价费时费力,成本高,灵活性差,重复性不好,难以应用于实时性场合。语音去噪应该从主客观两方面来评价,本文为了避免单方面评价标准的片面性,亦用客观指标和主观试听来衡量去噪结果。4.3 小波阈值法语音去噪仿真实验介绍了各种经典的小波阈值去噪算法,现对录制的语音信号“德州学院,你好”进行算法的仿真分析,了解各种算法的优缺点,仿真程序见附录中1小波阈值法去噪。对于8k采样的语音信号来说,进行5层分解,最大尺度下无混叠的信号频带为0-125Hz,语

38、音信号主要频率成分集中在大约60-3400Hz范围内,125Hz以下有用信号已经很少,所以在所用的小波分解中,我们采用5层分解。4.3.1 不同小波基的比较 (a) sym4(b) DB4(c) coif4图4.3 不同小波基去噪效果比较表4.1 不同小波基比较小波基DB4sym4coif2信噪比dB23.55423.36523.435有以上的分析仿真可知选取不同的小波基处理,去噪效果没有明显差别,其对信噪比都有很大程度的改善,而symN是DBN的改进,具有近似的对称性,并且考虑到消失矩与支撑长度的折中选择问题,选择sym4小波,其支撑长度为7且具有四阶消失矩,故后续的小波分析都是使用sym4

39、小波9。4.3.2 不同阈值处理方法的比较我们用sym4小波对语音信号进行5层分解,利用3.4节中提到的不同的阈值处理方法,即式(3.7)硬阈值法、(3.8)软阈值法、(3.9)半软阈值法,仿真结果如下:(a) 软阈值法(b) 硬阈值法图4.4 硬阈值法与软阈值法在半软阈值处理中,t1取 ,t2取0.8t1。图4.5半软阈值法表4.2 不同阈值处理方法比较阈值处理方式硬阈值软阈值半软阈值信噪比dB23.36520.14422.737由上的仿真结果可以清晰的看出,软阈值法有较大偏差,半软阈值法是一种折中选择,然而就去噪效果而言,硬阈值法与软阈值法相当,试听发现带噪信号经过软阈值处理后声音变小,能

40、量损失,硬阈值法存在的在阈值处不连续的问题并未在试听中造成影响。因此,选择硬阈值处理方式10。4.3.3 不同阈值选取方法的比较表4.3 四种阈值方法对比所用方法通用阈值法无偏风险阈值启发式阈值极大极小阈值信噪比dB23.36512.84514.59321.108 从表4.3可以看出通用阈值法去噪效果最佳,原始带噪信号信噪比为9.4204dB,可以看到信噪比得到了很大改善;无偏风险阈值去噪效果不理想,信噪比仅得到了几dB的改善。对去噪后的信号试听发现,通用阈值法失真最大,无偏风险阈值与启发式阈值相似,极大极小阈值是一种折中的选择。不论哪种阈值选取方法,去噪后的试听效果都不是很理想,声音发闷,高

41、频信号明显的丢失,尤以通用阈值法为最严重11。4.3.4 小波阈值法总结对于语音信号来说,硬阈值的不连续性并未对去噪结果产生影响,而软阈值法能量损失较大,故选择硬阈值处理;不同小波对语音信号去噪没有本质的区别,其去噪效果普遍较好;通用阈值法去噪效果要强于其他方法,然而其对语音的损伤也最为严重。经过大量的仿真研究,发现小波阈值法,尤其是同有阈值法有着很好的去噪效果,然而对语音去噪效果的评价要从主客观两方面来进行,尽管通用阈值法去噪效果好,但是对语音本身损伤也很大,还不具有实用价值,因此,若能保留阈值法中被损伤的高频信号而又能很好的去除噪声,将大大提高小波在语音信号去噪中的应用价值12。4.4 小

42、波阈值法与谱减法相结合的语音去噪4.4.1 小波阈值法的缺点和谱减法的介绍我们从去噪后语音信号频谱图及小波重构系数来分析小波阈值法的缺点。图4.6 小波阈值去噪后频谱图从图4.6与图4.2的对比中,我们可以清晰的看到,小波阈值去噪后,信号的频率成分损失严重,尤其是高频部分,这就是为什么小波阈值去噪后试听效果发闷的原因。(a) CD1(b) CD2图4.7原信号小尺度上高频系数(a) CD1(b) CD2图4.8 带噪信号小尺度上高频系数经过对带噪信号小波分解后发现,噪声主要集中于小尺度下,若在小尺度下用阈值法处理,淹没在噪声下的高频信号完全丢失,不论采用什么阈值处理方法,在去噪和保留有用信号的

43、问题上,始终是一对矛盾。基于此,我们希望在小尺度下,能够想办法尽量保留有用的高频信号,以此来减小去噪后信号失真。谱减法:在语音去噪各种算法当中,谱减法具有非常重要的影响,该方法认为语音信号的短时谱幅度(STSA)对语音感知起主导作用,而相位对语音的感知并不重要,故可将估计的对象放在短时谱的幅度上。谱减法通过从带噪语音的STSA中直接减去噪声的平均谱幅度来得到纯净语音的STSA,实现起来简单13。改进的谱减法:针对传统谱减法的缺点,很多学者提出了各种各样的改进形式,然而改进的谱减法也很难去除偶然的高噪音。因此,我们采用一种根据短时能量和短时平均过零率判断是否有偶然的噪音过高的方法,由此设定合适的

44、参数来去除偶然的高噪音。短时能量和短时平均过零率是语音信号最基本的短时参数。短时能量定义为: (4.3)是第n帧加窗语音信号。短时平均过零率表示一帧语音信号波形穿越横轴(零电平)的次数,对于离散语音信号,如果相邻的取样值符号改变则称为过零,过零率就是样本改变符号的次数。短时平均过零率定义为: (4.4)Sgn是符号函数,即: (4.5)清音类似于白噪声,其短时能量比较小,但是短时平均过零率很高;浊音短时能量大但是短时平均过零率低;无声短噪音的短时能量最低而过零率居中。基于此设: (4.6) (4.7) (4.8)其中,为门限值。根据FF来判断浊音和清音中是否含有剩余白噪声,无声段中是否含有剩余

45、白噪声,然后设定合适的参数来降低噪声。(a) 带噪语音信号(b) 改进谱减法去噪后语音信号图4.9 带噪音信号与去噪信号比较由仿真可以看出利用短时能量和短时平均过零率的改进型谱减法能有效的去除噪声,然而其在对无语音段做了过多的衰减来提高信噪比,经过试听表明,在语音段,残留噪声依旧明显14。4.4.2 利用谱减法进行预处理后的小波阈值去噪我们考虑结合谱减法,利用改进的谱减法对小尺度下的小波分解信号进行预处理,对于处理后的信号用一个较小的阈值去除剩余噪声,大尺度下因为噪声已经很小,所以直接用阈值法处理,最后利用处理后的小波系数恢复信号,得到去噪后结果。我们对最低的两个尺度进行谱减法预处理得到的仿真

46、结果,仿真程序见附录中2阈值法与谱减法相结合后的小波去噪。(a) CD1(b) CD2图4.10 小波阈值处理后高频系数(a) CD1(b) CD2图4.11 谱减法预处理(a) 带噪语音信号(b) 小波阈值去噪(c) 小波谱减阈值去噪图4.12 去噪结果比较表4.4 去噪效果比较信号类型源信号小波阀值法去噪小波谱减法去噪信噪比dB9.410523.52123.564经过图 4.10、图 4.11 以及图 4.6 图 4.13对比可以看出,结合谱减法后,有用的高频信号得到了更多保留,减小了信号失真,尽管信噪比变化很小,但是经过试听后发现,去噪后的语音明显要清晰,比小波阈值法具有更好的效果。图4

47、.13 小波谱减法频谱图5结论小波分析由于在时频域都具有较强的分析能力,小波去噪作为小波分析的一个重要组成部分,在近些年来也取得了很大进展。本论文针对小波变换的基本性质和去噪性能进行对比后选用阈值法。对小波阈值法在语音去噪中的小波母函数选取、阈值处理方法(软阈值法、硬阈值法及半软阈值法)的选取及阈值函数的选取这三个主要问题进行了研究,比较了他们各自的优缺点,最后决定采用 sym4小波5层分解硬阈值法进行小波阈值去噪处理。验证时,发现阈值的选取要么过小去除不了噪声,要么过大连有用信号一并去除造成失真,尤其在小尺度下小波系数主要是噪声,有用的高频信号在小尺度下很大一部分淹没在噪声下,若用阈值处理,

48、则高频信号损失严重,造成语音去噪后信号的失真,声音听起来发闷的缺点。针对此,我们将谱减法引入到小波阈值法当中,即并利用谱减法对小尺度下小波系数进行预处理,之后用一个较小的阈值去除剩余噪声,保留更多的高频信号,在大尺度下依然用传统的阈值法进行处理,最后重构信号。仿真表明这种方法较传统的小波阈值法而言,减小了信号的失真,提高了去噪后语音的清晰度。参考文献1应和民基于小波变换的语音信号降噪研究J哈尔滨工程大学2007:232郝明远基于小波变换的语音增强研究J吉林大学2005:253潘泉,张磊,孟晋丽,张洪才小波滤波方法及应用M清华大学出版社20054王芳小波分析在信号去噪中的应用研究D西华大学学位论文2009 5文莉,刘正士,葛运见小波去噪的几种方法J合肥工业大学学报20026吴勇.基于小波的信号去噪方法研究D武汉理工学位论文,20077韩纪庆,张磊,郑铁然语音信号处理M清华大学出版社20048洪晓芬基于谱减法的改进语音增强方法J计算机工程与设计2007289韩纪庆,张磊,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论