共振稀疏分解_第1页
共振稀疏分解_第2页
共振稀疏分解_第3页
共振稀疏分解_第4页
共振稀疏分解_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、共振稀疏分解:一种新的可稀疏信号的分析方法0. 摘要生命和物质过程会产生大量信号,这些信号不但是不稳定的,而且是持续震荡信号和瞬态冲击信号的混合,并且这两种信号是很难线性分解的,例如声音、医疗和地理信号。因此,本文描述了一种基于信号共振的非线性信号分析方法,而这种方法不基于傅里叶变换和小波变换产生的频谱和幅值。这种方法将信号分解成一个高共振分量和一个低共振分量高共振分量由多个同时发生的持续震荡信号组成,低共振分量由多个没有具体现状和持续时间的瞬态冲击信号组成。本文所阐述的共振稀疏分解算法使用的方法有信号稀疏表示、形态分量分析和品质因子可调小波换。1. 前言频域分析法和滤波是信号处理的基础。然而

2、,频域分析法和时频分析法并不适用于所有信号,事实上只适用于持续震荡或周期信号。那些主要由奇异点限定的分段光滑信号多数使用时域和小波变换描述、分析和处理。例如,图像扫描,眼部运动记录,潜能诱发反应,神经尖刺训练等。然而,许多生命和物质过程产生信号不只是不稳定的,而且是持续震荡信号和瞬态冲击信号的混合,例如声音、医疗(脑电图和心电图等)和地理(海浪高度数据等)信号。这些信号既含有稳态震荡部分又含有瞬态冲击部分。脑电波包含有节奏振荡(alpha和beta波等),也包含人为测量和无节奏脑行为所产生的瞬态冲击。海浪高度数据测量的是已经流动了几百英里(100s)的海量的重叠高度,但是天气因素将中断这种震荡

3、行为。当然,通过生命和物质系统测量的信号通常包含持续震荡信号和瞬态冲击信号,而这两种信号是很难线性分解的。为了改进复杂非平稳信号的描述、分析和处理,我们阐述了一种新的基于共振的非线性信号分析方法,而这种方法不基于傅里叶变换和小波变换产生的频谱和幅值。这种方法将信号分解成一个高共振分量和一个低共振分量。其中,高共振分量由多个同时发生的持续震荡信号合成,另一方面,低共振分量由多个没有具体现状和持续时间的瞬态冲击信号合成。这篇论文的部分内容已经出版在两个早期的会议论文中84,85。图1. 单脉冲共振属性是由品质因子Q量化的,而品质因子是中心频率与频带宽度的比值。脉冲1和脉冲3在持续时间上看是一个单振

4、荡,是低共振脉冲。脉冲2和脉冲4具有多次震荡,属于高共振分量。低品质因子小波变换(例如经典的二阶小波变换)能有效描述脉冲1和脉冲3,高品质因子小波变换能有效描述脉冲2和脉冲4。图a为时域信号,图b为频谱。2. 信号共振图1用图例说明了信号共振的概念。事实上,脉冲1和脉冲3都包含了一个单振荡正弦信号。我们把这两种信号称为低共振信号是因为他们没有持续震荡。观察这两个脉冲的时域图我们发现,时域脉冲波形并不能有限体现共振程度。很明显,一个低共振脉冲既有可能是一个高频信号(脉冲1),也有可能是一个低频信号(脉冲3)。低共振脉冲不限于单边频带。因此,不能通过频率滤波的方式从一个信号中提取出低共振分量。我们

5、把脉冲2和脉冲4定义成高共振分量是因为他们具有持续震荡特性。两个脉冲都包含5个振荡的由哑铃函数相乘而成的正弦波(特别的,如布莱克曼窗口),如上面所说,这两个脉冲的时域波形具有相同的共振属性。同样的,一个高共振脉冲既有可能是一个高频信号(脉冲2),也有可能是一个低频信号(脉冲4),高共振分量也不能通过频率滤波的方式从一个信号中提取出来。2.1. 共振稀疏分解正如我们所描述的,共振稀疏分解应该能够近似低分解图1中的脉冲1和脉冲2,尽管这两个信号在时域上是迭加在一起的。为了阐明共振稀疏分解算法(后面会详尽阐述)的效果,我们将这种方法应用图2的人工合成信号上。这个人工信号含有3种频率和两级共振的六个脉

6、冲。目标是将信号的高低共振分量分离开。通过这种算法的得到的高低共振分量如图2a所示。这种算法也得到一个残余信号,从而允许随机噪声的存在。这个测试信号等同于三个信号的和:高共振分量、低共振分量和残余信号。(残余信号的幅值可以通过分解算法中的参数控制。)图2. 共振稀疏分解和频率滤波时域波形图。(a)测试信号被稀疏表示成高低共振分量。高共振信号分量使用高品质因子RADWT变换得到。同样,低共振信号分量使用低品质因子RADWT变换得到。(b)使用LTI时间离散滤波器将测试信号分解成低、中和高频分量。(a)共振稀疏分解时域波形图(b)频率滤波时域波形图。观察发现,线性时不变(LTI)滤波器不能实现图2

7、a所示的信号分解,这是因为存在于高共振分量的三个频率同样也存在于地共振分量中。高低共振分量中的脉冲的不同点不是他们的频率而是他们持续振荡的程度。当然,LTI滤波器能将测试信号分解成低、中和高频部分。使用低通、带通和高通LTI滤波器,我们能够实现测试信号的基于频率的分解,从而获得不同的频率分量,正如图2b中所示。2.2. 共振稀疏分解必然是非线性的这里所提到的共振稀疏分级不能通过线性滤波实现,如图3所示。图3中的每一行表示一个信号分解成高低共振分量的理想情况。前六个信号是低共振信号,所以低共振分量是信号本身(高共振分量是零)。最后一个信号是高共振信号,所以高共振分量是信号本身(低共振分量是零)。

8、正如图3所示,高低共振分量都不满足叠加性。图3最左下方的信号是上面6个低共振信号的和。如果信号的共振分量是信号的线性函数,那么图3最右下方的高共振分量应该是上面6个高共振分量的和。但是这不是事实,因此经过分析,所提出的共振稀疏分级方法必然不是信号的线性函数。2.3. 共振稀疏分解能否恰当定义?很显然,一个信号在分解成高低共振分量时也有可能定义不当。如果我们将图3. 共振稀疏分解一定是非线性的:最左下方信号是上面各信号的和;然而,这个信号的低共振分量不是上面各低共振分量的和。同理,高共振分量也不满足叠加原理。图1中的脉冲1和脉冲3(大约包括1次振荡)定义成低共振分量,将脉冲2和脉冲4(大约包括5

9、次振荡)定义成高共振分量,然后我们如何定义一个含有3次振荡的信号呢?同样,如果一个信号包含几个这样的不能确定共振特性的脉冲,那么高低共振分量该如何定义呢?起初并不清楚如何定义一类信号的共振属性,无论这类信号是否能够分解成高低共振分量。相反,频率滤波可以直截了当的定义:一个低通滤波器可以通过(阻止)低于(高于)某一设定频率值的正弦振荡信号。频率响应函数和滤波器的线性度决定了滤波器的输入输出特性。因此,好像共振稀疏分解的概念是不清楚的,不准确的,不明确的。然而,通过把这种方法表述成一个恰当选择的优化问题的解决办法,就可以很好地定义这种分解方法。(图2a所示的共振稀疏分解方法是通过下面提到的成本函数

10、(1)的数值最小化得到的。)也就是说,一个信号的共振分量取决于具体的成本函数,而且通过改变成本函数中定义的参数可以精确低调整分解结果。因此,我们所提到的共振稀疏分解是信号的非线性函数,并通过迭代最优化算法得到。相反的,频率滤波可以使用卷积或求和写成闭合形式。共振稀疏分解必然是非线性的和数字化的,然而频率分解是线性的和解析化的。2.4. 品质因子和恒品质因子基函数当定义一类信号的共振属性可能存在问题时,单个脉冲的共振属性可以通过品质因子量化,而品质因子等于中心频率与带宽的比值;这个数值在滤波器设计、控制和动态系统物理学中广泛使用。一个脉冲的品质因子反映了它的共振属性,如图1所示。脉冲的震荡次数越

11、多,品质因子越高。图1所示的前两个脉冲以同样的频率(两个采样点间隔0.04个周期)振荡,但是第二个脉冲振荡时间更长,因此具有更高的品质因子(高出4倍)。图1所示的后两个脉冲均以每两个采样点间隔0.04周期的频率震荡,分别具有与前两个脉冲相同的品质因子。观察发现一个脉冲的品质因子实际上等于脉冲的振荡次数。下面所描述的计算高低共振分量的方法是基于使用恰当设定的基函数来有效地表示这两个信号分量。为了有效的表示高共振信号分量,我们要求设定的基函数完美包含全部高共振(高品质因子)函数;这样一个基函数是通过转换和时间定标一个高品质因子脉冲得到的。基函数中的高共振函数拥有相同的品质因子。同样的,为了有效的表

12、示低共振信号分量,我们要求设定的这个基函数完美包含全部低共振(低品质因子)函数;同理,这样一个基函数是通过转换和时间定标一个低品质因子脉冲得到的。因此,我们需要两个恒品质因子基函数一个以高品质因子为特征,另一个以低品质因子为特征。通过转换和时间定标一个单脉冲得到的基函数广泛存在于小波基函数中,而小波基函数产生的脉冲称作小波。最广为人知和广泛使用的恒品质因子基函数是二阶小波基函数21,具有一个很低的品质因子。当然,二阶离散小波变换的有效性取决于它能够对分段光滑信号也就是低共振信号提供相关稀疏表示的能力。二阶小波变换之所以很少应用在振荡(高共振)信号如语音上是因为它布恩那个为这些信号提供有效的系数

13、表示。对于高品质因子恒Q变换的需求可能有些问题;确实,语音信号通常使用恒带宽变换(例如,MPEG 2/4 AAC 多媒体解码器使用MDCT在128和1024频带之间转换)来分析和处理。尽管恒带宽分析能够使用FFT以高计算效率实现,尽管它适用于众多音频编码器的关键组件,但是它无法提供共振稀疏分解所需要的恒品质因子分析。许多年来,恒品质因子频率分析一直是声学和信号处理领域研究的兴趣所在。这种兴趣中的一部分是受到生物学人类性格和其他哺乳动物听觉系统的广泛研究的启发;并且树立了耳蜗具有近恒品质因子特性的理念。具体说来,耳蜗可以建模成一些高度重叠的带通滤波器的集合,而这个带通滤波器的频率必须高于某一物种

14、特定频率才能拥有恒品质因子。(人类的耳蜗在500Hz以上接近恒品质因子,在500Hz以下趋近恒带宽)目前已经建立几个参数模型用于这些听觉滤波器组,包括Gammatone和Gammachirp滤波器组,而这些滤波器在设计时保证了与心里声学测量的相容性。3. 方法3.1. 过完备有理膨胀小波变换对可逆恒品质因子离散变换的追踪研究自然走向了基于有理膨胀因子4,5,59的离散小波变换和基于有理采样因子9,10,62,106的完整重构滤波器组。然而,基于有理采样因子的关键采样滤波器组受到了严格限制,而且用于二阶滤波器的设计方法不能使用。由于设计难题的存在,目前针对有理膨胀问题提出的解决方案很少。高品质因

15、子恒Q小波变换用于高共振信号稀疏表示,受到这种小波变换需求的推动,我们最近提出了一种新的有理膨胀小波便换,这种变换完全离散化,易于求逆,减少能量损耗,变换过后几乎没有改变,并且允许使用者调整品质因子。这种新的小波变换方法作为广泛使用的二阶小波变换可用于高品质因子分析,或者同样用于作为低品质因子分析。当这种变换没能严格采样时,实施这种变换可能产生一定的冗余(例如,e.g., 3-times overcomplete, depending on para-meters)。此外,逆分析滤波器组是正分析滤波器组的镜像,所以这种变换是自可逆的(这种变换使用一种窄窗而不是规范正交基),这将使信号的稀疏表示

16、容易实现。文献6中引入过完备有理膨胀小波变换(RADWT)是基于图4中所示的滤波器组。当选定图4中的整数p, q和s,并使这个滤波器组过完备后,我们在文献6中提供了一系列用于多等级滤波器组的滤波器,这个多等级滤波器组具有完美重构特性,良好的时频定位性和高规律性。小波变换的品质因子当FB在它的低通分支上迭代时获得,并由参数p,q和s决定。RADWT不是基于整数膨胀,而是基于处于1和2之间的有理数膨胀(q/p)。设定膨胀因子接近1,s>1,将得到一个带有高品质因子分解/合成函数的小波变换。设定s=1,将得到一个带有低品质因子如二阶DWT的小波变换。不同的频率分解以及相关的小波在图5中分两种情

17、况阐明:低品质因子和高品质因子变换。3.2. 信号的稀疏分解我们把高共振信号定义成那些可以用高品质因子恒Q变换(高品质因子变换)有效稀疏表示的信号,例如图5b中恰当选择参数p,q和s的RADWT。因此,高共振分量的定义与具体的恒Q变换有关。类似地,我们把低共振信号定义成那些可以用低品质因子恒Q变换(低品质因子变换)有效稀疏表示的信号,例如经典二阶DWT或者图5a所示的RADWT。观察发现,一个高共振信号不能用低品质因子变换有效表示,同样,低共振信号也不能用高品质因子变换有效表示。因此,基于高低品质因子变换的一个信号的有效稀疏表示可以作为实现共振稀疏分解得一种方法。几篇已经发表的文献阐述几种将信

18、号非线性分解成不同特性定义的分量的方法。例如,参考文献2,3,101,102提出了基于Meyer思想的分解方法,这种方法将一个图像分解成振荡和有界变量分量。基于稀疏表示的非线性信号分解得整体框架已经在几篇文献33,36,51,94,95中得到阐述。为了使“形态分量分析”这个方法获得成功,各自的变换必须具有低的相关性(一个变换的分解/合成函数图4.用于实现过完备有理膨胀小波变换的分解和合成滤波器组。当假定滤波器组的迭代位于它的无限低通分支时,膨胀系数是q/p,冗余是(s(1-p/q)-1 。图5.过完备有理膨胀小波变换(RADWT):频率响应和小波。(a)低品质因子RADWT,其中p=2,q=3

19、,s=1。这个小波近似于墨西哥草帽函数。(b)高品质因子RADWT,其中p=5,q=6,s=2。膨胀系数是1.2,与二阶小波相比,更接近1。(a)和(b)中的RADWT有同样的冗余:它们都是3倍过完备。必须与另一个变换的分解/合成函数具有低的相关性),高品质因子和低品质因子变换必须满足式(2)所设的条件。给定一个观测信号x=x1+x2,其中x,x1,x2RN,MCA的目标是估计或者确定x1和x2。假定x1和x2可以被基(或框架)S1和S2稀疏表示,则当目标函数最小化时,通过W1和W2可获得x1和x2的估计值,而后,使用MCA估计和。MCA处理某些图像问题的有效性已经有了很好的体现,尤其是使用S

20、1和S2 33,37,35,95进行曲波变换,二维DCT和2维小波变换。文献27表明,这种方法的一个变种能够有效分离心电图信号中的心室和心房分量,两个个分量的表示方法也适用于心室和心房所具有的特性。对于共振稀疏分解,我们提出使用低品质因子和高品质因子RADWT 时应用S1和S2。然后,通过最小化式(1) 获得和,并将其用于提取高低共振分量。例如,图2所示的共振稀疏分解在1=2=0.2条件下最小化式(1)得到的,其中S1和S2是图5所示的两个RADWT。MCA更通用的形式允许对式(1)中的x1和x2进行稀疏测量,而这两个参数彼此是不同的。此外,可以在目标函数中使用先验信息来进一步对分量分离进行改

21、进28。而且,数值保真项不需要是一个l2范数,除了l1范数其他的稀疏优先系数也可以使用。本文使用1范数是因为当时凸函数时,它能有助于稀疏性。3.2.1. 凸性和1范数如(1)中将共振稀疏分解问题转化成凸最优化问题方便了共振分量的计算。这里,我们在式(1)中使用1范数是因为它能使目标函数凸化。尽管在式(1)中当0<p<1的p范数比1范数更能提高稀疏性,但是目标函数将不再是凸的,解决方法也将因此更难获得我们通常只能找到一种局部最优解决方法,这将取决于使用的优化算法和初始路径。3.2.2. 相关性和RADWT为了使形态分量分析能够成功将信号x分解成x1和x2,S1和S2具有低相关性是很重

22、要的。也就是说,变换S1的合成函数与变换S2的合成函数应该有最低的相关性。尽管某些两两相关性可能为0(S1的某些列与S2的某些列可能是正交的),但是全部列都正交是不可能的。当用两个以小波为特征的小波变换实现MCA时,的平移和膨胀对于所有的平移和膨胀有一个小内积是必要的。将最大内积定为,其中是小波的品质因子。在下面的论述中,我们假设。为了估计这些内积,考虑一个简单的例子:小波是具有如下给定的傅里叶变换的理想带通函数,如图6所示。带通函数(为了方便,图6只显示了单边频带)被归一化成具有单位能量,在这种情况下,内积可以被定义成如下的频域形式,最大内积可以写成内积由下面等式详细给出。最大值在处取得,其

23、最大值为等式2表明最大内积的取值取决于两个小波变换的内积。若希望MCA取得成功,必须充分小于1。如果Q2只是略小于Q1,那么那个小波变换之间的最大内积将接近1,而且MCA的结果可能较差(也就是分量与X接近)。换句话说,如果Q1=1,Q2=5, 那么=0.5,。进一步增加Q2,图6. 对于可靠的共振分解,低品质因子小波和高品质因子小波之间的内积对于所有的膨胀和变换来说应当足够小。最大内积简化计算的两个条件是:小波是理想的带通函数,在频域中表达内积。则进一步降低。因此,为了确保使用以高低品质因子RADWT为原理的MCA进行共振稀疏分解的可靠性和准确性,选择RADWT时应确保他们的相干性最小化;也就

24、是说,高品质因子的变换的品质因子应该比低品质因子变换的品质因子足够大。然而,如果品质因子太高,它可能无法与高共振分量的振荡属性所匹配,高品质因子的变换可能无法提供有效的表示,因此降低的分解质量。选择两个品质因子目的是:()概略反应两个分量的特性;(ii)最小化。因此通过分析,这两个品质因子的选择某种程度上取决于信号本身:对于文献6中所描述的RADWT,我们没有给出一个计算的公式。然而,他能够通过数值的方法计算出来。表1列出了的几个具体例子。正如表1中所显示的那样,增加高品质因子可以降低数值。分裂增广拉格朗日收缩算法(SALSA)所提出的共振稀疏分解的框架要求目标函数(1)最小化。尽管函数是个凸

25、函数,求其最小值也是困难的,原因有:(i)1范数不可微(ii)最大变量数(如果这两种变换均是3次过完备,那么未知数的数量是信号X长度的6倍)。表1 低品质因子RADWT和高品质因子RADWT的相关性。其中,低品质因子RADWT的参数为:p1=2,q1=3,s1=1,(Q=1);高品质因子的参数p2,q2,s2,以及Q2如下表所示。由于在最近的信号处理方法(包括压缩传感【29】)的公式中稀疏促进目标函数如式(1)的重要性,已经有几种算法用于最小化这种类型的目标函数。一个早期的重要算法是文献【22,40】开发的迭代软阈值算法(ISTA)(这个算法在优化类文献中出现的更早,如文献【18】中提到的)。

26、然而ISTA对于某些难题收敛较慢,所以人们又提出了一些快速算法,例如【7,8,17,32,39,42,105】。文献【18】将最近在信号处理中出现的求凸函数最小值的方法,包括有条件最小值问题,进行了概述。FISTA7具有二阶收敛速度,而ISTA只具有线性收敛速度。然而,两种算法的复杂程度相似。我们也已经发现SALSA算法对于共振稀疏分解特别有效(通常对于MCA也是如此),这是因为它能解决一系列2范数正交问题,这些问题对于MCA来说也是容易解决的 (假设两个变换是紧致集)。文献【41,1】中提出的分裂增广拉格朗日收缩算法(SALSA)基于下列最小化问题则u=w上式可以通过交替分裂增广拉格朗日算法

27、进行最小化:其中,k是迭代序数,是人为指定的标量参数。每次迭代要求解决二维正交取逆问题,这个问题是大规模问题经常遇到的挑战。然而,对于共振稀疏分解来说,相关的l2(二维)问题能够容易解决,方法如下所示。为了将SALSA应用于MCA问题(1),定义(5)至(7)式给出了迭代算法:其中k为迭代序数。参数需要人工选择,文献【41】中给出了细节。在下面的MCA实验中,我们使用=0.5。注意到式(8)是一个l2(二维)问题,因此式(8)的最小化过程能够直接表示成下式:利用(因为RADWT是一个紧致集)和矩阵可逆引理,我们能够得出而且,发现式(9)是一个1范数正交去噪问题,因此,式(9)的最小化通过软阈值

28、求得。所以,对于MCA问题(1),SALSA是如下形式:其中是阈值为T的软阈值规则函数,为了说明ISTA和SALSA的收敛性,我们对每个算法进行100次迭代,来求取式(1)中的的最小值,其中x是图2a所示的测试信号,两个变换是图5a和b所示的RADWT。使用ISTA和SALSA算法计算目标函数(1)所达到的衰减速度如图7所示。对算法SALSA进行100次迭代所取得的信号分解如图2a所示。对算法ISTA进行100次迭代获得的信号分解(没有图示)要差一些,原因是ISTA达到收敛的迭代次数多于。图.前100次迭代内目标函数的衰减情况:SALSA收敛比ISTA快。4. 例子:共振选择非线性带通滤波在多

29、共振分量信号的研究中,有时候研究人员对信号频率成分的分析很感兴趣:例如,脑电图信号节律的提取,语音信号的正弦模型和海浪高度数据的频谱分析。我们发现脑电图信号节律的提取能够通过传统的8-12Hz带通LTI滤波器采用通用和简便的方法实现的候对信号频率成分的分析是令人甘心去。然而,正如8-12Hz频带的振荡信号一样,脑电波信号中的瞬态冲击中的一部分被认为是节律,能够在滤波信号中表示自己。因此,即使非节律出现在脑电波中感兴趣中的部分,滤波信号也能表示振荡。-为了阐述共振稀疏的应用,我们阐述了这种方法可以提供一种缓解这种现象的可能性,称为在一个带通滤波信号的频率f处振荡的出现,此时被滤波的信号在这个频率

30、处没有持续振荡,如图8和图9所示。图8a显示了一个离散测试信号,这个信号含有一个频率0.1循环/采样点的正弦脉冲和一个二项瞬态冲击。图8b所示的两个带通滤波器分别调到0.07和0.08循环/采样点。使用这两个滤波器过滤测试信号能够获得图8c和d所示的输出信号。观察发现,滤波器1产生的输出信号在频率0.07循环/采样点处具有振荡特点,然而测试信号在这个频率处没有持续振荡。当然,这种现象是LTI滤波器的一种基本事实,然而这可能让人无法理解文献【108】中所提到的带通滤波信号,甚至使人错误理解成测试信号在此频率处还有比实际更强的振荡信号。通过对信号进行整体频率分析,我们能够理解图8所示的带通滤波器,

31、然而我们希望对适合应用频率分析的部分信号进行分析,也就是说对含有持续振荡部图8. LTI带通滤波器。这个测试信号含有一个频率0.1循环/采样点的正弦脉冲和一个二项瞬态冲击。图(b)中的带通滤波1和2分别被调整到频率为0.07和0.10循环/秒。图(c)和(d)为两个带通滤波器过滤测试信号后得到的输出信号。图(c)所示的带通滤波器1的输出包含由于测试信号中的瞬态冲击产生的振荡。而且,图(c)中的短暂振荡的频率为0.07,虽然测试信号(a)在此频率不含有持续振荡。分的部分信号进行频率分析。共振稀疏分解方法提供了一个机会实现基于可选择共振频率的滤波。具体说来,我们可以将共振稀疏分解应用于测试信号,而

32、后使用传统LTI带通滤波器过滤高共振分量。将共振分解应用于图8a所示的测试信号将得到图9a和b所示的高低共振分量。使用图8b中的两个带通滤波器过滤图9a中的高共振分量,输出图9c和d所示的信号。观察发现,与图8c相比,滤波器1的输出中的振荡更弱一些。输出信号接近为零说明在频率0.07循环/采样点处测试信号不包含持续振荡成分。同样的,与图8d相比,图9d中的滤波器2的输出所维持的正弦脉冲更准确些。图9 共振稀疏分解和带通滤波。当共振分析方法应用到图8a所示的测试信号时,输出的是图a和b的高低共振分量。如图8b所示的使用两个带通滤波器滤波通过过滤高共振分量(a)后获得的输出信号在图c和d中显示。与

33、图8c相比,图c的瞬态振荡已经得到了明显的削弱。这个例子表明共振分解在克服频率选择线性滤波的局限性方面所具有的潜力。通过将信号分解成高低共振分量(这需要非线性处理),然后施以传统LTI频率选择滤波,我们能够根据感兴趣信号的瞬态特点,使用传统带通滤波器来削减边缘振荡效应,我们也能取得对于瞬态不敏感的非线性带通滤波。此外,这种方法使用一个正类模型来分解瞬态和振荡特性对于瞬态的形状来说不需要模板;分解只是基于高低品质因子变换的稀疏性。观察发现图9所示的共振分解并不完美;这主要是因为瞬态冲击本事不是基于低品质因子的。图9的共振分解是使用图5所示的高低品质因子RADWTs获得的。从表1中得出,。可通过在

34、高品质因子RADWT中使用更高品质因子或者在式(1)中使用一种更激进的稀疏促进正则矩阵来改善共振稀疏分解的结果。5. 例子:一个语音信号的共振稀疏分解为了进一步阐述共振稀疏分解如何能够有效帮助非稳态信号的分析,考虑图10所示的语音信号。图10显示了一个150毫秒的语音信号片段(由一个成年男子说出),信号中可以见到一个元辅音瞬态冲击。高低共振分量通过最小化式(1)获得,如图10b和c所示。高共振分量包含语音信号中的持续振荡部分,低共振分量包含一系列伴随声带振动产生的喉音的孤立脉冲。因此,尽管图10a中的原始信号大部分是振荡的,但是它不是一个我们定义中的纯的高共振信号:这个信号的共振分解将产生一个

35、不可忽略的低共振分量。通过使用高、低品质因子的RADWT变换实现分解,其中高品质因子RADWT的参数为:p=8,q=9,s=3,分解级数为38;低品质因子RADWT的参数为:p=2,q=3,s=1, 分解级数为12(如图5a所示)。从表1可以得出,观察发现,无论是图10的低共振分量还是高共振分量都是以某一频带为中心。的确,高共振分量包含低频和高频振荡;低共振分量包含一系列脉冲,因此有一个宽频带。原始语音信号的频谱和共振分量使用中部50ms(50ms-100ms)语音波形计算得到,表明每个共振分量的能量被广泛分布在各个频率之中,而且他们的频谱彼此重叠。图10所示的低共振分量模拟了源滤波器模型的激

36、励信号,这个源滤波器基于LPC或者倒频谱80。然而,共振稀疏分解不适用这种源滤波器模型,不需要估计基音周期,也不要求基音在几个音节内近似常数。这种分解不依赖任何语音模型,无论是隐式还是显式;唯一的模型是高低品质因子变换的共振分量的稀疏性。因此,正如一个源滤波器模型一样,共振稀疏分解没有建立一个产生式模型,也没有受到基音周期快速变化的不利影响,然而,其他方法对此却非常敏感。我们也观察发现,高共振分量比原始语音信号更服从正弦曲线模型【73】。正弦曲线模型,作为一种把语音信号表示成时变正弦曲线的和的一种方法,对于语音编码和处理(基音缩放,声音变形等)是非常有用的。然而,脉冲无法由正弦曲线的和有效的表

37、示,所以脉冲的存在降低了正弦模型的有效性。由于高共振分量与脉冲和瞬态冲击大体上无关,所以正弦模型被期望有效用于高共振分量。图10 语音信号(Im)分解成高低共振分量。高共振分量(b)包含语音信号中的持续振荡成分,低共振分量(c)包含非振荡瞬态成分。(剩余成分没有表示)图11 图10所示的语音信号和提取出的高低共振分量的频谱。这个频谱是使用宽为50ms即从0.05至0.10s的语音部分计算得到的。每个共振分量的能量广泛分布在各个频率和他们的重叠部分之中。(a)原始信号(b)高共振分量(c)低共振分量表2AR模型预测误差的比较。这个表列出了,其中是原始信号的预测误差(),是高共振分量的的预测误差,

38、如图10所示。P代表模型的顺序,每种方法通过matlab函数名字进行区分。为了初步量化高共振分量的压缩性和可预见性,并与原始语音信号对比,我们对两个信号应用AR模型,并使用表2中列出的方法和模型。每种情况下,都会预期误差(标准偏差),并用和代表原始信号的高共振分量的预期误差。我们发现明显少于。表2列出了对应每种方法和模型序数的比率。例如,使用模型序数为p=6的burg AR方法,高共振分量的预测误差是原始信号预测误差的14.7%。表2中的数值表明比原始信号具有更高的可预见性,至少是AR模型在应用于预测时是这样。图12显示了使用参数为p=6的Burg方法估计的功率谱密度;高共振分量的共振峰更加清

39、晰,正如图10信号波形所预料的那样。因此,高共振分量可能有利于共振峰的追踪,并且具有优良的瞬时分辨率。图12 使用模型序数为p=6的burg方法的AR谱估计,应用对象为图10的语音信号和高共振分量。图12中的更明显的峰值表明高共振分量能够加强语音共振峰和相对空间,而相对空间是元音的特征。同时,低共振分量能够加强和声,而和声是说话人音高的特征。既然如此,把高共振分量进行编码可以建立一种更加有效地语音编码。考虑到语音信号既含有说话者本身的特点也含有所需传达的信息,所以一直以来都认为who和what通过语音系统沿着独立的传感路径传递到大脑皮层【64】。与此相似,共振稀疏分解可以实现传递路径的分离。语

40、音分析的基本工具是光谱分析。根据泊松等原理,“时频分析有益于语言交流的各个方面【77】。然而,人们在寻找光谱替代品的过程中建立了多种可适应性非线性时频分配方法,并且这些方法都改善了分辨率特性【16,,4,47,48,88】。对于某些信号(多分量AM/FM信号,或者更普通的高共振信号),这些强大的TF(变换)技术揭示了时域波形本身无法观察到的时变频率特性。然而,对于其他信号,感兴趣的信息更容易通过时域波形确定(例如,一个神经尖刺序列的内部脉冲间隔,或者更普通的低共振信号)。对于同时含有高低共振分量的信号来说,现存的视频分析技术可以更有效地应用于高共振分量而不是原始信号。6. 进一步讨论参数选择。

41、目标函数(1)的最小化取决于参数1和2,通过改变这些参数,可以调整稀疏分解的结果。1和2的相对值影响两个分量的能量:例如,固定1,增加2将降低的能量并增加的能量。的值也影响残差的能量:同时增加1和2的值将降低两个分量的能量,并增加残差的能量。本文中的例子通过观察产生的分量来人工选择参数,这样做将影响1和2之间的平衡。正如文献【15】中所描述的,参数的自动选择可以通过超参估计程序实现。对于将图像分解成质地和结构分量,参考文献【3】在两个分量不相关的假设下描述了一种参数选择的方法。在本领域采用相似的方法可能会有用。两个恒Q变换的Q值选择也影响最终的结果。为了获得非振荡分量的稀疏表示,使用Q=1作为

42、低Q变换(如二元小波变换)的Q值看起来是合理的。高品质因子的Q值设置取决于讨论中提到的信号的振荡行为。然而,分解结果对于Q值和的敏感程度看起来并不一样。此外,参数和Qi可以根据适当的性能测量优化进行选择,正如文献【103】中的例子所阐述的那样。为什么不是二范数penalty?如果二范数被用于式(1)中的惩罚项,那么,使用,并最小化W1和W2可以由下面的封闭式给出,然后估计分量由下式给出:图13 恒带宽和恒Q分解可能具有相似频率支持的分析函数。也就是说,都是x的简单放缩。尽管目标函数(16)允许封闭形式的最小化,但它不能形成任何分解。多于两个的共振分量。同样的方法可以用于不止两个共振分量,虽然我

43、们这里没有阐述。主要的问题是使用更多的变换通常会削减变换之间的不相关性,这将降低获得不同分量的可能性。然而,如果具有足够高品质因子的恒Q变换被用于定义第三个共振分量,那么不相关性不会改变,MCA的性能也不会削弱。具体说来,Q3应该足够大,以保证假设理想的带通小波(2)能够用于计算Q3的最小值。使用恒Q和恒带宽变换的MCA。对于使用稀疏信号表示来实现振荡和瞬态信号的分离来说,利用短时傅里叶变换(或相似的恒带宽变换,如MDCT)和小波变换(具有低品质因子,如二元小波变换)。这种方法在文献【23,24,75,96】中得到了阐述,并具有非常优异的分解结果。然而,通过参数的设置(如窗口长度等),恒带宽分

44、解和恒Q分解可能具有相似频率支持的分析函数,如图13所示。(在0.1和0.2之间的带通有很大的重叠,如图所示。)在这种情况下,由于两个变换的分析函数的最大内积接近整数,所以这两个变换将具有高相关性,这将降低可分解性,并与所分析的信号的具体形式有关。另一方面,正如上面所提到的,两个恒Q变换具有明显不同的品质因子时将具有低相关性,这是因为两个分解的分析函数不具有相似的频率支持。同样,连个具有明显不同的带宽的恒带宽变换也将具有低相关性,因此也适合基于MCA的分解。这要求分别为两个恒带宽变换设置长短不同的窗口。这种方法在文献【25,38,57】中进行了阐述。7. 相关工作和概念相关的分解方法:将一个给

45、定信号分解成振荡和非振荡成分的问题已经的得到了大量的关注,尤其是语音信号处理问题;然而,以前的不基于共振的方法与本文阐述的方法是不同的。对语音和音乐声音所建的模型通常包含三个分量:一个近似正弦分量(振荡分量),一个瞬态分量和一个随机分量。对于语音处理(间距或时间缩放,变形,强化,除混响,编码,语音综合和其他声音)来说,将三个在心理声学上很重要的分量分别建模通常是有用的。早期在声音分解方面的研究工作使用确定+随机模型【87】、正弦+噪声模型【86】、或者谐波+噪音模型【66】。随后的研究工作使用正弦+瞬态+噪音模型【67,68,100】,其中瞬态(确定的,非振荡的)分量是引进的。相关的工作考虑了

46、一个定期+不定期模型【19,107】和间距同步模型【34,78】。从某种意义上说,下面这些多分量模型详细阐述和强化了正弦语音模型【73,80】。尽管这些方法将信号分解成振荡和非振荡和残余分量,正如本文所提到的方法,但是他们估算和提取振荡分量时使用恒带宽变换俄日不是恒品质因子变换,因此他们不是基于共振的信号分解方法。最新的将信号分解成振荡和瞬态分量的方法是基于稀疏信号表示【24,25,38,75】,正如本方法所描述的。然而,这些方法依然不是基于共振而是使用恒带宽变换。二元小波变换(低品质因子)和改进离散余弦变换(MDCT)在文献【24,75】中得到了使用,然而过完备复数调制重叠变换字典在文献【25】中得到了使用。注意到MDCT和MCLT是恒带宽而不是恒品质因子变换。文献【38】中描述了一种贝叶斯方法,并针对音调分量使用长窗口MDCT基,针对瞬态分量使用短窗口MDCT基。按照这些原则,文献【96】中讨论了用于语音加强的MDCT和小波变换的使用。参考文献【23】建立了一种新算法:分子匹配追踪算法。文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论