版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章第三章 语音信号的特征分析语音信号的特征分析本章内容包括了教材第本章内容包括了教材第35章的相关内容章的相关内容v语音信号的数字化语音信号的数字化v语音信号的短时分析与短时处理的概念语音信号的短时分析与短时处理的概念 v语音信号的时域特征分析语音信号的时域特征分析v语音信号的频率特征分析语音信号的频率特征分析v语音信号的同态解卷与倒谱分析语音信号的同态解卷与倒谱分析v端点检测与基频估计端点检测与基频估计学习目标学习目标:能够熟练运用教材:能够熟练运用教材/工具软件包提供的有关语音特工具软件包提供的有关语音特征分析的程序,实现对实际语音信号的时域、频域分析,在此征分析的程序,实现对实际语音
2、信号的时域、频域分析,在此基础上完成连续语音信号的端点检测和基音频率估计。基础上完成连续语音信号的端点检测和基音频率估计。23.1 语音信号的数字化语音信号的数字化通过电脑或者其它数字录音设备采集的语音信号都已经经过数字化了,一般不需要用户再进行数字化处理。尽管如此,有必要简单了解一下语音信号的数字化过程与原理。声音信号的数字化声音信号的数字化模拟语音信号在时间与幅度上的二重连续性模拟语音信号在时间与幅度上的二重连续性v时间上离散化: 每秒钟需要采集多少个声音样本, 也就是采样频率(fs)是多少,v幅度上离散化: 每个声音样本的位数(bit per sample,bps) 应该是多少,也就是量
3、化精度。3语音信号的采样频率语音信号的采样频率v奈奎斯特采样定理:fs 2 fmaxv窄带语音信号: fs =8000Hz电话语音(固网电话通信频带为300-3400Hz)可以基本保持语义,不影响人对语音的感知质量不是很好,有时候会有变音v宽带语音信号:fs =16000Hz一般对语音质量要求较高的场合再提高采样频率也不会对语音质量有太多贡献4量化精度量化精度v量化所用比特越大,声音质量越好v声音质量也跟量化算法有关,比如同样用8bit量化,非均匀量化(-律或A-律)就比均匀量化好很多v固网电话语音量化就是用的非均匀量化质量采样频率(kHz)样本精度(bit/s)单道声/立体声数据率(kB/s
4、)(未压缩)频率范围电话88单道声8 3003400 HzAM11.0258单道声11.0205000 HzFM22.05016立体声88.2 507000 HzCD44.116立体声176.42020000 HzDAT4816立体声192.02020000 Hz声音的质量与数据率(采样频率和量化精度)的关系声音的质量与数据率(采样频率和量化精度)的关系5预滤波预滤波v预滤波的目的防止混叠干扰抑制50Hz的电源干扰v带通滤波器,其上下截止频率分别为fH和fL 。电话语音编码:fH=3400Hz, fL=60100Hz, fs=8KHz.语音识别系统:用于电话用户时要求技术指标与语音编 码器相同
5、,如果对于更高的要求场合,则 fH=4500Hz或8000Hz, fL=60Hz,fs=10KHz或20KHz6v语音分析是语音信号处理的前提和基础; 分析的目的是提取需要的信息,获取特征表示参数;v短时分析语音是一个时变信号语音的短时平稳特性,在1030ms时间段内相对平稳3.2 语音信号的短时分析语音信号的短时分析7帧和加窗的概念帧和加窗的概念v短时分析将语音流分为一段一段来处理,每一段称为一“帧”;v帧长:1030ms;帧移:01倍帧长,帧与帧之间的平滑过渡;v语音识别中常用的帧长为2030ms,帧移为10ms805010015020025000.81 rectangu
6、larhamminghanningbartlett几种常见的窗函数的波形几种常见的窗函数的波形Matlab中可通过中可通过help window命令来查看怎么产生不同的窗命令来查看怎么产生不同的窗为了减小语音帧的截断效应,需要特殊的加窗处理为了减小语音帧的截断效应,需要特殊的加窗处理( )( ) ( )wxnx n w n10, 1)(Nnnw( )0.540.46cos(2), 011nw nnNN10),12cos(1 (5 . 0)(NnNnnw矩形窗哈明窗(Hamming)汉宁窗(Hanning)9窗的选择决定短时语音分析结果的好坏窗的选择决定短时语音分析结果的好坏v窗的长度,无论什么
7、窗,长度窗的长度,无论什么窗,长度N起决定性的作用起决定性的作用N选得太大,不能保证每一帧的语音的平稳特性N太小,不能保证信号的统计特性,容易产生统计噪声对于频域分析而言,窗长N还直接决定了信号频谱的分辨率对于语音信号,通常帧长应选择为一个语音帧包含有至少2个基音周期为好。人的语音的基音周期值是变化的,从女性小孩的2ms到老年男子的14ms(即基音频率为500Hz至70Hz),所以N的选择是比较困难的。通常折衷的选择N为2030ms。若采用频率为10KHz,则相当于每帧的长度(即窗口序列的长度)约为200300点为宜。若采样频率为8KHz,相当于160240点v窗的形状,不同窗的频率特性是不一
8、样的,这在短时频域分窗的形状,不同窗的频率特性是不一样的,这在短时频域分析时尤为重要析时尤为重要窗口的形状和长度对分析影响很大,不同的分析方法对窗口的形状和长度对分析影响很大,不同的分析方法对窗函数的要求不尽一样。窗函数的要求不尽一样。10几种不同的窗函数波形与频谱的比较几种不同的窗函数波形与频谱的比较10203040506000.81SamplesAmplitudeTime domain00.8-100-80-60-40-2002040Normalized Frequency ( rad/sample)Magnitude (dB)Frequency dom
9、ain10203040506000.81SamplesAmplitudeTime domain00.8-150-100-50050Normalized Frequency ( rad/sample)Magnitude (dB)Frequency domain10203040506000.81SamplesAmplitudeTime domain00.8-20-10010203040Normalized Frequency ( rad/sample)Magnitude (dB)Frequency domain矩形窗矩形窗哈明
10、窗哈明窗汉宁窗汉宁窗11窗函数频谱的主瓣与旁瓣窗函数频谱的主瓣与旁瓣v主瓣主瓣宽度控制频谱分析的频率分辨率,主瓣越窄,频率分辨率越高v矩形窗的主瓣宽度 = fs/Nvhamming窗的主瓣宽度 约为 2fs/Nv旁瓣旁瓣的高度决定了对临近频率成分的干扰抑制能力,高度越低,抑制干扰能力越强 v矩形窗: 主瓣高度 - 第一个旁瓣高度 13dBvhamming窗: 主瓣高度 - 第一个旁瓣高度 40dB旁瓣高度跟窗长N 无关12窗函数及其比较窗函数及其比较三种窗函数都有低通特性,通过分析三种窗的频率响应幅度特性可以发现: 矩形窗的主瓣宽度最小分辨率最高,旁瓣高度最高,会导致泄漏现象; 哈明窗的主瓣最
11、宽,分辨率低(可以通过适当提高窗长解决),旁瓣高度最低,可以有效的克服泄漏现象,具有更平滑的低通特性,应用更广泛。13 短时能量短时能量 短时平均幅度短时平均幅度 短时平均过零率短时平均过零率 短时自相关函数短时自相关函数 端点检测和基音估计端点检测和基音估计3.3 语音信号的时域特征分析语音信号的时域特征分析143.3.1 短时能量短时能量v语音信号x(n)的短时能量(假定加长度为N的窗)可以表示为v若加的是矩形窗 则1212)()()(NnnmwNnnmnmxnmwmxE22211 ( ) () ( ) () ( )1,01( )0,nnnmm N nm N nEx m w nmx m w
12、 nmx mnNw nothers 12)(NnnmnmxE15语音信号及其取不同窗长时的短时能量语音信号及其取不同窗长时的短时能量短时平均能量的主要用途短时平均能量的主要用途可以从语音中区别出浊音来,因为浊音时短时平均能量的值要比清音时短时平均能量的值大很多;可以用来区别声母和韵母的分界、无声和有声的分界等163.3.2 短时平均幅度短时平均幅度v语音信号x(n)的短时平均幅度(假定加长度为N的矩形窗)可以表示为1| )(|NnnmnmxE173.3.3 短时过零率短时过零率v过零就是指信号通过零值。过零率(zero-crossing rate)就是每秒内信号值通过零值的次数。v对于离散时间
13、序列,过零则是指序列取样值改变符号,过零率则是每秒内信号样本改变符号的次数。对于语音信号,则是指在一帧语音中语音信号波形穿过横轴(零电平)的次数。可以用相邻两个取样改变符号的次数来计算。v短时过零率短时过零率01|sgn( )sgn(1)|2wwZxnxn短时过零率可以看作信号频率的简单度量0, 10, 1)sgn(xxx18短时过零率在语音分析中的应用短时过零率在语音分析中的应用v发浊音时,声带振动,声门激励以此音调频率为基频来使声道共振;尽管有若干个共振峰,但其能量的分布集中在低于3KHz的频率范围内v发清音时声带不振动,声道某部分阻塞产生类白噪声激励,通过声道后其能量集中在比浊音时更高的
14、频率范围内v浊音时能量集中于较低频率段内,具有较低的过零率,而清音时能量集中于较高频率段内,具有较高的过零率。19 直方图的分布形状与高斯分布很吻合,而且浊音时的短时平均过零率的均值为14过零/10ms,清音时短时过零率的均值为47过零/10ms。 浊音和清音有一个交叠区域,此时很难分清是浊音还是清音。尽管如此,平均过零率仍可以粗略的判断清音和浊音。 浊音和清音情况下典型的平均过零率的直方图浊音和清音情况下典型的平均过零率的直方图 清音清音 浊音浊音 0 10 20 30 40 50 60 70 80 每每 10ms 内的过零数内的过零数 过零率概率分布过零率概率分布 20v作为短时过零率的一
15、个改进参数,语音分析时更常作为短时过零率的一个改进参数,语音分析时更常用的是短时过电平率用的是短时过电平率(level-crossing rate)。短时过电平率在区分清音和静音时很有用短时过电平率在区分清音和静音时很有用21短时过零率短时过电平率利用过零率与过电平率区分清、浊音和静音利用过零率与过电平率区分清、浊音和静音22清清(U)、浊、浊(V)、无声、无声(S)的平均幅度的平均幅度(M)和过零率和过零率(Z)的条件概率密度函数的条件概率密度函数浊音的短时平均幅度最大,无声的短时平均幅度最小。浊音的短时平均幅度最大,无声的短时平均幅度最小。清音的短时过零率最大,无声居中,浊音的短时过零率最
16、小清音的短时过零率最大,无声居中,浊音的短时过零率最小23实用算法一:语音端点检测实用算法一:语音端点检测v在许多语音处理技术中需要判断一段输入信号中哪些是语音段,哪些是无声段(只有背景噪声)在语音识别中正确判断所要识别语音的起点、终点对于提高识别率很重要。在数字移动通信中,在较长的无声段应降低移动终端发射功率以节约电源的消耗。v对于已经判定为语音段的部分,尚需决定其清音或浊音。这些问题可以概括为无声/有声判决以及更细致的S/U/V判决。v能够实现这些判决的依据在于不同性质的语音的各种短时参数具有不同的概率密度函数以及相邻的若干帧语音应具有一致的语音特性,它们不会在 S、U、V之间跳来跳去。2
17、4v基于能量和过零率的语音端点检测方法基于能量和过零率的语音端点检测方法两级判两级判决法及程序实现决法及程序实现25采用双门限比较法的两级判决法,具体如下采用双门限比较法的两级判决法,具体如下v第一级判决:1.先根据语音短时能量的轮廓选取一个较高的门限T1,进行一次粗判:语音起止点位于该门限与短时能量包络交点所对应的时间间隔之外(即AB段之外)。 2.根据背景噪声的平均能量确定一个较低的门限T2,并从A点往左、从B点往右搜索,分别找到短时能量包络与门限T2相交的两个点C和D,于是CD段就是用双门限方法根据短时能量所判定的语音段。 26v第二级判决:1.以短时平均过零率为标准,从C点往左和从D点
18、往右搜索,找到短时平均过零率低于某个门限T3的两点E和F,这便是语音段的起止点。门限T3是由背景噪声的平均过零率所确定的。2.注意:门限T2,T3都是由背景噪声特性确定的,因此,在进行起止点判决前,T1,T2,T3,三个门限值的确定还应当通过多次实验。27v基于基于MATLAB程序实现能量与过零率的端点检测程序实现能量与过零率的端点检测算法步骤算法步骤:(1)语音信号x(n)进行分帧处理。(2)得到语音的短时帧能量。(3)计算每一帧语音的过零率,得到短时帧过零率。(4)考察语音的平均能量设置一个较高的门限T1,用以确定语音开始,然后根据背景噪声的平均能量确定一个稍低的门限T2,用以确定第一级语
19、音结束点。第二级判决同样根据背景噪声平均过零率ZN,设置一个门限T3,判断语音前端清音和后端尾音。28语音端点检测的其它算法语音端点检测的其它算法v另一种判断的方法是如果能够求出S、U、V三种情况下短时平均幅度M和短时过零率Z的条件联合概率密度函数P(M,Z/S), P(M,Z/U), P(M,Z/V),那么就可以采用统计学中的最大似然算法,根据一帧信号的M和Z值来判断它的S/U/V。就是计算后验概率: P(X/M,Z)=P(M,Z/X)P(X)/P(M,Z) 其中,X=S或U或V。后验概率最大者即作为判决结果。v事实上,仅依靠M和Z两个参数还是不够的,通常要选择更多的参数,如相关函数等。29
20、3.3.4 短时自相关函数短时自相关函数v自相关函数(自相关函数(auto-correlation function)( )( ) ()mR kx m x mk10( )( )()( )()1,1N kmwwwwnnRkxn xnkxn xnkkNN 设 为一段加窗语音信号,非零区间为n=0N-1, 的自相关函数称为语音信号的短时自相关函数( )( ) ()wx nx m w m n( )wxn1、自相关函数是偶函数2、在k=0处取得最大值,且值为短时能量3、若x(m)是周期的,则Rm(k)也是周期的,其周期与x(m)相同4、可用于基音周期估计和线性预测分析;30浊音的短时自相关函数 清音的短
21、时自相关函数 31浊音和清音的短时自相关函数有如下几个特点:浊音和清音的短时自相关函数有如下几个特点:1)短时自相关函数可以很明显的反映出浊音信号的周期性;2)清音的短时自相关函数没有周期性,随着k的增大迅速减 小,也不具有明显突出的峰值,其性质类似于噪声;3)不同的窗对短时自相关函数结果有一定的影响。不同矩形窗长时的短时自相关函数不同矩形窗长时的短时自相关函数3210( )( ) ()( ) ()NmwwwwnnRkxn xnkxn xnk因为求和上限是因为求和上限是N-1,与,与k无关,故当无关,故当k增加时,值不下降增加时,值不下降 。修正的短时自相关函数修正的短时自相关函数 设 为另一
22、段加窗语音信号,非零区间为n=0N-1+K, K为k的最大值, 的修正的短时自相关函数可以写为 ( )( ) ()wxnx m w m n( )wxn 对于矩形窗,上式又可以写为10( )() ()NmnRkx mn x mnk33( )( ) ()wx nx m w m n() wx n k n1n N1N () w m n1 Nk 1 Nk n n( ) x m()w mn1nNK () wxnk 1N 1NKk k( )dn34不同矩形窗长时修正的短时自相关函数不同矩形窗长时修正的短时自相关函数35v基音周期估值在语音信号处理应用中具有十分重要的作用。这里介绍基于短时自相关法的基音周期估
23、值。v语音的浊音信号具有准周期性,其自相关函数在基音周期的整数倍处取最大值。计算两相邻最大峰值间的距离,就可以估计出基音周期。v第一最大峰值点的位置有时不能与基音周期相吻合。原因:窗长度的选取 窗口过长或过短都会导致不一致。通常认为窗长至少应大于两个基音周期,语音信号中最长的基音周期约为20ms,因此在基音周期估计时窗长应选的大于40ms。声道特性的影响 声道的共振峰特性造成对基音频率的干扰。v为了突出反映基音周期的信息,同时压缩其他无关信息,减小运算量,自相关计算之前需要对语音信号进行适当预处理。预处理的两种方法方法一:先对语音信号进行60900Hz的带通滤波器滤波,再进行自相关计算。方法二
24、:先对语音信号进行中心削波处理,再进行自相关计算。v最后还要对估值进行平滑后处理实用算法二:基音周期估计实用算法二:基音周期估计36v中心削波中心削波 削波函数为v三电平削波三电平削波 在中心削波法的基础上, 采用三电平削波函数()( )0()()LLLLLLxxxxf xxxxxxxx 1( )01LLLLxxf xxxxxx f(x) x xL -xL O -1 1 经削波后的取样值仅有+1,0,-1三种情况。这种信号的短时自相关函数的计算是不需要乘法运算的,这就大大节省了计算时间。37削波前后语音信号对比图削波前后语音信号对比图38削波前后修正自相关对比图削波前后修正自相关对比图 削波后
25、的序列用短时自相关函数估计基音周期,在基音周期处削波后的序列用短时自相关函数估计基音周期,在基音周期处峰值更加尖锐,可减少倍频或半频错误。峰值更加尖锐,可减少倍频或半频错误。 39基音周期估值的后处理基音周期估值的后处理 v基音频率轨迹基音频率轨迹“野点野点” 在提取基音时,提取的基音频率轨迹与真实的轨迹大部分段落吻合,但在一些局部段落和区域中有一个或几个基音频率估计值偏离,甚至远离正常轨迹,通常是偏离到正常值的2倍或1/2处,即实际基音频率的倍频或分频处v“野点野点”的去除的去除 中值滤波平滑处理、线性平滑、动态规划平滑处理。 40v中值平滑处理中值平滑处理 基本原理:设x(n)为输入信号,
26、y(n)为中值滤波器的输出,采用一滑动窗,则n0处的输出值y(n0)就是将窗的中心移到n0处时窗内输入样点的中值。即在n0点的左右各取L个样点。连同被平滑点共同构成一组信号采样值(共(2L+1)个样值),然后将这(2L+1)个样值按大小次序排成一队,取此队列中的中间者作为平滑器的输出。L值一般取为1或2,即中值平滑的“窗口”一般包括3至5个样值,称为3点或5点中值平滑。v线性平滑处理线性平滑处理 用滑动窗进行线性滤波处理v组合平滑处理组合平滑处理( )() ( )LmLy nx nm w mLLmmw1)(41423.4 语音信号的频域特征分析语音信号的频域特征分析v语音信号的主要特征表现在频
27、率特性上v语音信号的频率特性是通过傅里叶变换的频谱来获得v短时傅里叶变换(short-time Fourier transform (STFT)幅度谱: 对数幅度谱(dB)相位谱:mmjjnwemnwmxeX)()()(,| )(|,jnweX)(,mjnweX| )(|log20,10jnweX人耳的听觉对语音信号的相位不敏感,因此,很多时候我们人耳的听觉对语音信号的相位不敏感,因此,很多时候我们仅仅关注信号的短时幅度谱仅仅关注信号的短时幅度谱43 短时频域分析中,窗函数的选择对语音的频谱有很短时频域分析中,窗函数的选择对语音的频谱有很大的影响大的影响根据卷积定理:根据卷积定理:)()()(
28、)()()(jjjwweWeXeXnwnxnx44比较同一帧语音加矩形窗和哈明窗的对数幅度谱比较同一帧语音加矩形窗和哈明窗的对数幅度谱矩形窗:矩形窗:基频更尖锐(分基频更尖锐(分辨率高);辨率高);谱噪声大(旁瓣谱噪声大(旁瓣泄漏大)泄漏大)哈明窗:哈明窗:频谱更光滑(旁频谱更光滑(旁瓣泄漏小),瓣泄漏小),语音短时频谱分语音短时频谱分析中常用哈明窗析中常用哈明窗45比较不同窗长语音加哈明窗的对数幅度谱比较不同窗长语音加哈明窗的对数幅度谱窗长短:失去基频与谐波成分,频谱包络更明显窗长短:失去基频与谐波成分,频谱包络更明显窗长长:基频与谐波成分明显(频率分辨率高)窗长长:基频与谐波成分明显(频率
29、分辨率高)46浊音短时谱的特点:浊音短时谱的特点: 基频与谐波成分明显基频与谐波成分明显 频谱包络具有明显的凸起点,称为频谱包络具有明显的凸起点,称为“共振峰共振峰”(formant)47清音短时谱的特点:清音短时谱的特点: 类似随机噪声类似随机噪声 频谱包络较平坦,一般高频成分略大频谱包络较平坦,一般高频成分略大48语谱图是语音分析的一个重要工具语谱图是语音分析的一个重要工具v横轴表示时间横轴表示时间v纵轴表示频率纵轴表示频率v每一个时间每一个时间-频率坐标上的点频率坐标上的点S(t, f)表示表示t时刻、时刻、f频率成分的能量或幅度,频率成分的能量或幅度,其大小通过点的灰度(黑白语谱图)或
30、颜色(彩色语谱图)来区分其大小通过点的灰度(黑白语谱图)或颜色(彩色语谱图)来区分语谱图(语谱图(spectrogram)49v分析的窗长短分析的窗长短v时域分辨率高、频域分辨率低时域分辨率高、频域分辨率低v语谱图特征为有明显的粗的横杠(与共振峰相对应)语谱图特征为有明显的粗的横杠(与共振峰相对应)宽带语谱图(宽带语谱图(wide-band spectrogram)50v分析的窗长长分析的窗长长(512点点)v时域分辨率低时域分辨率低 、频域分辨率高、频域分辨率高v语谱图特征为有明显的细的条纹(对应基频与谐波成分)语谱图特征为有明显的细的条纹(对应基频与谐波成分)窄带语谱图(窄带语谱图(nar
31、row-band spectrogram)51同态分析的基本原理同态分析的基本原理3.5 语音信号的同态解卷与倒谱分析语音信号的同态解卷与倒谱分析52卷积同态信号处理系统卷积同态信号处理系统 同态系统可以分解为两个特征系统(即特征系统和逆特同态系统可以分解为两个特征系统(即特征系统和逆特征系统)(指取决于信号的组合规则)和一个线性系统征系统)(指取决于信号的组合规则)和一个线性系统(仅取决于处理要求)(仅取决于处理要求))(H)()()( )()()(nvneHnynvnenx)(H1*)( )( DLD)( )( )( )(nynynxnx53语音信号的同态解卷语音信号的同态解卷v根据语音信
32、号的产生模型,语音信号S(z)是一个线性时不变因果稳定系统V(z)受到信号E(z)激励后所产生的输出。v在时域中,语音信号s(n)是该系统的单位脉冲响应v(n)和激励信号e(n)的卷积。v在语音信号数字处理所涉及的各个领域中,根据s(n)来求得v(n)和e(n)具有非常重要的意义。v由卷积信号求得参与卷积的各个信号的过程称为解解卷过程卷过程。54v解卷算法可以分为两大类解卷算法可以分为两大类:第一类是首先为线性系统第一类是首先为线性系统V(z)建立一个模型,然后对模型建立一个模型,然后对模型参数按照某种最佳准则进行估计,这种方法称为参数按照某种最佳准则进行估计,这种方法称为参数解参数解卷卷方法
33、。采用的模型可以分为全极点模型(方法。采用的模型可以分为全极点模型(AR模型)和模型)和零极点模型(零极点模型(ARMA模型),如果采用最小均方误差准模型),如果采用最小均方误差准则对则对AR模型进行估计,就得到模型进行估计,就得到线性预测编码线性预测编码(LPC)算法。算法。第二类算法称为第二类算法称为非参数解卷非参数解卷。同态信号处理完成解卷任。同态信号处理完成解卷任务就是其中最重要的一种。务就是其中最重要的一种。v对信号进行分析得出它的倒谱参数的过程称为同态对信号进行分析得出它的倒谱参数的过程称为同态处理。处理。v对于语音通信、语音合成或语音识别等语音处理来对于语音通信、语音合成或语音识
34、别等语音处理来说,倒谱参数所含的信息比其他参数多,也就是语说,倒谱参数所含的信息比其他参数多,也就是语音质量好,识别准确率高。音质量好,识别准确率高。55语音同态解卷的特征系统与逆特征系统语音同态解卷的特征系统与逆特征系统*D1( ) ln( ) ( )ZZ)( (z) (z) )(nxXXnx1*)(D)( )(exp )(1ZZ)( (z) (z) )( nyYYny12-1-11212( )( )( )( ) ( )( )( )( )ln( )ln( )ln( )( )( )Z ( )Z ( )( )( )( )( )( )x ne nv nX zZ x nE z V zX zX zE
35、zV zXzXzX zXzXzx nx ne nv n输入信号:Z变换:对数运算:逆Z变换56语音信号的复倒谱语音信号的复倒谱(Complex Cepstrum)deeXeXFnxeXeXenxnxFeXnjjjjjNNnnjj)(21)()( )(ln)()()()(121征系统求得复倒谱的另一个特)( ),( nynx 分别是x(n), y(n)的复倒谱,复倒谱所处的离散时域称为复倒谱域。同态解卷的特征系统将离散时域的卷积运算转换为复倒谱域的加运算,而逆特征系统则为其逆运算立叶变换来代替。变换都可以利用正负傅都包含单位圆,正反的收敛域问题中,绝大多数数字信号处理运算。而逆特征系统则为其逆谱
36、域中加运算,的卷积运算转换为复倒特征系统将离散时域中域。的离散时域称为复倒谱的复倒谱。复倒谱所处是同样。的复倒谱,其英文为是ZZYZYZXZXnynyCepstrumComplexnxnx)(),(),(),()()( )()( 求复倒谱的另一个特征系统:求复倒谱的另一个特征系统:57语音信号的倒谱语音信号的倒谱(Cepstrum)。谱称为倒频谱,简称为倒求得倒谱的特征系统CepstrumncdeeCeCFnceXeCenxnxFeXnjjjjjNNnnjj)()(21)()()(ln)()()()(121复倒谱经过正逆两个特征系统变换后,序列可以还原为复倒谱经过正逆两个特征系统变换后,序列可
37、以还原为本身。但是倒谱经过正逆两个特征系统变换后,序列不本身。但是倒谱经过正逆两个特征系统变换后,序列不可以还原为本身。可以还原为本身。58语音信号倒谱和复倒谱的性质语音信号倒谱和复倒谱的性质v根据语音信号产生的模型,在z域中语音信号S(z)等于激励信号E(z)和声道传输函数V(z)的乘积,即S(z)=E(z)V(z)。经过同态系统后可以得到:v对声门激励信号。发清音时,声门激励是能量较小、频谱均匀分布的白噪声,其对应的倒谱也是一个噪声序列;发浊音时,声门激励是以基调周期为周期的周期脉冲序列,其对应的倒谱也是一个周期的序列,并且倒谱的周期等于信号的周期v对声道冲激响应v(n) 或者h(n), 其倒谱是一个快速收敛的信号。)( )( )( nvnens59050100150200250300-0.4-0.6hamming windowed voiced speech frametime samplesamplitude05010015020025
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全新光伏发电项目开发合同(2024版)3篇
- 2024年度某航空公司机票代理销售合同2篇
- 二零二四年度合作合同:共同研发新能源汽车的动力系统
- 基于二零二四年度的绿色能源项目开发合同2篇
- 2024年度技术服务与合作开发合同
- 二手家电产品买卖合同样式2024
- 2024年度二手房门窗采购与安装合同
- 2024年度环保设备生产销售合同标的及质量保证条款3篇
- 2024年度城市供水工程合同:某市区供水设施建设2篇
- 2024年度智慧城市项目合作与实施合同3篇
- 七夕节课件教学课件
- 第一单元 少年有梦 单元思考与行动 教案-2024-2025学年统编版道德与法治七年级上册
- 2024北京市租房合同自行成交版下载
- 庆祝第75个国庆节共筑中国梦大国华诞繁盛共享课件
- 2024年江西省高考化学试卷(真题+答案)
- 人教版小学语文一年级单元测试题-全册
- 2024-2030年中国PQQ行业市场发展分析及前景趋势与投资研究报告
- 2024年新青岛版四年级上册科学全册知识点六三制
- 2024年人教版八年级数学(上册)期末试卷及答案(各版本)
- 注册消防工程师案例分析真题(完整)
- 实验室经费管理制度
评论
0/150
提交评论