工学chpart频域分析PPT课件_第1页
工学chpart频域分析PPT课件_第2页
工学chpart频域分析PPT课件_第3页
工学chpart频域分析PPT课件_第4页
工学chpart频域分析PPT课件_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、()( ) ( ) ()( , )jj mnnmX ex m eFT x m w n mX n短时(加窗)傅立叶变换的定义Short Time Fourier Transform-STFT()()()nxmx m w nm一、定义一、定义两种解释:两种解释:1)n固定固定 FT2) 固定固定 Linear Filter第1页/共57页x(m)x(m)w(n-m)w(n-m)w(m)w(m)m mm mn n 透过位于透过位于n n处的窗口所观察到的语音短段的傅立处的窗口所观察到的语音短段的傅立叶变换。叶变换。n n取不同值时,窗取不同值时,窗w(n-m)w(n-m)沿时间轴滑到不沿时间轴滑到不

2、同位置,取出不同的语音段,故同位置,取出不同的语音段,故 不仅是不仅是 的函数,还是时间的函数,还是时间n n的函数。的函数。()jnXe第2页/共57页短时幅度谱的计算过程第3页/共57页短时幅度谱得出的参数第4页/共57页二、移动窗形状对二、移动窗形状对 的影响的影响()jnXe元音元音a的短时幅度谱(的短时幅度谱(n=512)rectangular windowrectangular windowhamming windowhamming window第5页/共57页 从短时频谱图中可知:(1 1)快速变化,由激)快速变化,由激励信号引起的;(励信号引起的;(2 2)慢速变化,声道滤波器

3、的)慢速变化,声道滤波器的共振峰特性引起的(共振峰特性引起的(3 3)采用汉明窗得到的短时)采用汉明窗得到的短时频谱较矩形窗平滑,因而在语音分析中汉明窗用频谱较矩形窗平滑,因而在语音分析中汉明窗用得较普遍。得较普遍。hamming windowhamming window第6页/共57页Vowel /a:/( (a)50ms 包含包含6个周期,基音周期频率为个周期,基音周期频率为120Hz。(b) 30ms rectangular window (c) 15ms rectangular(d)30ms hamming window (e) 15ms hamming第7页/共57页( (a)50m

4、s 包含包含10个周期,基音周期频率为个周期,基音周期频率为200Hz。(b) 30ms rectangular window (c) 15ms rectangular(d)30ms hamming window (e) 15ms hammingVowel /a:/第8页/共57页汉明窗矩形窗语音的短时对数幅度谱语音的短时对数幅度谱ln()jnX eln()jnX e第9页/共57页矩形窗汉明窗ln()jnX eln()jnX e第10页/共57页三、窗宽对三、窗宽对 的影响的影响()jnX e 窗宽为窗宽为6464点(点(10kHz10kHz)元音)元音aa的短时频谱图的短时频谱图短窗的频率

5、分辨率下降,频谱图中丢失了关于语音短窗的频率分辨率下降,频谱图中丢失了关于语音基音周期的信息,只保留慢变化。基音周期的信息,只保留慢变化。矩形窗矩形窗汉明窗汉明窗第11页/共57页语谱图语谱图(Spectrogram) 语音的时域分析和频域分析是语音分析的两种重语音的时域分析和频域分析是语音分析的两种重要的方法,但是这两种方法均有局限性:时域分析对要的方法,但是这两种方法均有局限性:时域分析对语音信号的频率特性没有直观的了解;而频域特性中语音信号的频率特性没有直观的了解;而频域特性中又没有语音信号随时间的变化关系。因此人们致力于又没有语音信号随时间的变化关系。因此人们致力于研究将时域分析和频域

6、相结合,将时间依赖于傅立叶研究将时域分析和频域相结合,将时间依赖于傅立叶分析的显示图形称作为语谱图,横坐标为时间,纵坐分析的显示图形称作为语谱图,横坐标为时间,纵坐标为频率,谱的色调的浓淡表示声音的强弱。它综合标为频率,谱的色调的浓淡表示声音的强弱。它综合了频谱图和时域波形的优点,明显得展示了语音频谱了频谱图和时域波形的优点,明显得展示了语音频谱随时间的变化情况。随时间的变化情况。第12页/共57页Band-pass filter1Band-pass filter2Band-pass filterNSpeechtimefrequencyThe two-dimensional function

7、2( ,)X nis called the spectrogram.第13页/共57页Every salt breeze comes form the seaWide bandnarrowband第14页/共57页Matlab 命令:specgram Wideband spectrogram:给出共振峰频率 Narrowband spectrogram:基音周期及其谐波 specgram computes the windowed discrete-specgram computes the windowed discrete-time Fourier transform of a signa

8、l using a time Fourier transform of a signal using a sliding window. The spectrogram is the sliding window. The spectrogram is the magnitude of this function.magnitude of this function.第15页/共57页第16页/共57页第17页/共57页01020304050607001002003004005006000102030405060700100200300400500600N=1024 hamming windo

9、w 幅度谱 第18页/共57页010203040506070020040060080010001200010203040506070020040060080010001200N=2048 hamming window 幅度谱 第19页/共57页 欢迎使用微软中国研究院中文语音合成系统欢迎使用微软中国研究院中文语音合成系统的时域波形和语谱图的时域波形和语谱图第20页/共57页第21页/共57页短时谱的卷积形式短时谱的卷积形式()1()()()21()()2jjj njnj njjXeX eeW eeW eX ed ()()()nxmx m w nm语音信号语音信号x(m)x(m)的频谱的频谱()

10、()jjmmXex m e ()()jjmmWeWm e 窗函数窗函数w(m)w(m)的频谱的频谱窗函数窗函数w(n-m)w(n-m)的频谱的频谱()jnjeWe第22页/共57页“毕业毕业”第23页/共57页短时傅立叶变换的性质1( )()2(0)jjnnx nXeedw一、由 得出()j nnXe( )x n当当n=mn=m时,且时,且1( )()( ) ()2jj mnnx mXeedx m w nm(0)0w第24页/共57页绝对值滤波器h(n)( )x nnM| ( )|x n()()()()( ) *( )nmmMx m w nmx m h nmx nh nx(m)x(m)w(n-

11、m)w(n-m)m mn nx xn n(m)(m)第25页/共57页二二. .短时谱的卷积形式短时谱的卷积形式()1()()()21()()2jjj njnj njjXeX eeW eeW eX ed ()()()nxmx m w nm语音信号语音信号x(m)x(m)的频谱的频谱()()jjmmXex m e ()()jjmmWeWm e 窗函数窗函数w(m)w(m)的频谱的频谱窗函数窗函数w(n-m)w(n-m)的频谱的频谱()jnjeWe第26页/共57页()1()()()2jj njjnXeeW eX ed 用用代替代替 为了使 能够与 具有相同的性质,则要求 是一个冲激函数 。窗长N

12、越长, 的主瓣越狭窄尖锐,则 越逼近于 。但窗长N太大,窗选信号不满足语音的短时平稳特性, 不能正确反映短时语音的频谱了。为此,必须要合理选择窗长N。()jnXe()jXe()jW e()jW e()jnX e()jnX e( )jXe( ) 第27页/共57页()()1()()()21( )()21( )()()2jj njjnj njjjXeeW eX edeX edX edX e 第28页/共57页三三. .短时功率谱和短时谱的关系短时功率谱和短时谱的关系*2()()() |()|jjjjnnnnS eX eX eX e四四. .短时功率谱和短时自相关函数的关系短时功率谱和短时自相关函数

13、的关系1(1)()( )Njj knnkNSeR k e第29页/共57页 男声男声“深圳深圳 广州广州 珠海珠海”的短时功率谱统的短时功率谱统计。在采样频率为计。在采样频率为22050Hz22050Hz的情况下,取的情况下,取20ms20ms作作为一帧,帧长为为一帧,帧长为441441点,一共统计了点,一共统计了180180帧。帧。短时功率谱短时功率谱原始原始语音语音第30页/共57页(2). (2). 利用短时功率谱的统计进行有声和无声的检测利用短时功率谱的统计进行有声和无声的检测 含噪语音信号的短时功率谱统计,含噪语音信号的短时功率谱统计,对每一帧输入对每一帧输入信号,通过与预先设定的一

14、系列门限值比较来判断信号,通过与预先设定的一系列门限值比较来判断该帧是信号帧还是噪声帧。该帧是信号帧还是噪声帧。第31页/共57页短时傅立叶变换的线性滤波实现()j nnXe一、 的另一种解释的另一种解释当将当将 看成一个参变量,看成一个参变量, 就只是就只是n n的函数。的函数。 ()jnXe()() ()( )*( )jjmjnnmXew nm x m ex n ew n w(n)()jnXej ne短时频谱的线性滤波表示短时频谱的线性滤波表示( )x n第32页/共57页()()()jnnnXeajb( ) ( )cos ()nmax mm w nm( ) ( )sin ()nmbx m

15、m w nm w(n)( )nacosn w(n)sinn( )nb短时频谱的线性滤波实现短时频谱的线性滤波实现( )x n第33页/共57页 w(n)()jnXej ne()()kjX e ()jX e( )kjnx n e( )x n( )x n()()()()kkjjjnX eX eW e w(n)w(n)是窄带低通滤波器是窄带低通滤波器k假设 将将x(n)x(n)的频谱向左搬移的频谱向左搬移了了 ,或等效将,或等效将 频率上频率上的频谱搬移到了零频率处。的频谱搬移到了零频率处。因此为使输出端有:因此为使输出端有:k()()kkjjnXeX ew(n)w(n)是窄带低通滤波器是窄带低通滤

16、波器k第34页/共57页k()jX e()jW e()()kjX e ()()kkjjnXeX e第35页/共57页()()() ()() ()()()( ( )*( )jjmnmjnmmjnjmjwmjnmXew nm x m ew mx nm eex nm w m ex nw n ee令令mnm 令令mm()jnXej ne( )x n( )jnw n e2.2.实数运算实现短时谱的线性滤波表示实数运算实现短时谱的线性滤波表示窄带带通滤波器窄带带通滤波器( )jnw n e()()jW e ( )w n()jW e第36页/共57页k()jX e()()kjW e ()kjX e()jW

17、e()()kkjjnXeX e第37页/共57页( )nacosn sinn( )nb( )x m()cosw mm()sinw mm( )na( )nbcosn 实数运算实现短时谱的线性滤波表示实数运算实现短时谱的线性滤波表示2222|()|( )( )( )( )jnnnnnX eabab第38页/共57页短时傅立叶变换的取样()jnXe时域取样时域取样 n n频域取样频域取样一、时域取样一、时域取样 n n(线性滤波实现线性滤波实现) w(m)()jnXej me( )x m带宽为带宽为B B带宽也为带宽也为B B取样频率取样频率22stfRBN 由窗的主瓣宽度来决定。矩形窗为由窗的主瓣

18、宽度来决定。矩形窗为1 1,汉明窗为,汉明窗为2 2。第39页/共57页二、频域取样二、频域取样 (2 )()()jjnnXeXe()()jjmnnmXexme 每帧每帧 中语音信号个数为窗长中语音信号个数为窗长N N( )nx m2,0,1,1()()kjjnnk kLLNLXeXe( )nx m第40页/共57页三、时域和频域的总取样三、时域和频域的总取样 2stfSRR LLN当当LN时时2sSRkf 的取样率和的取样率和 的取样率之比:的取样率之比: ()jnXe( )x m2sSRf(过取样比过取样比)第41页/共57页语音的短时合成技术()( )kjnXex m 离散短时傅立叶反变

19、换离散短时傅立叶反变换22,0,1,12()()()( ) ()( , )kkjkjjNnnnk kNNkmjNmX eX eX ex m w n m eX n k 离散短时傅立叶变换离散短时傅立叶变换 离散短时傅立叶反变换离散短时傅立叶反变换1( )()2(0)jjnnx nXeedw22101( )()(0)NjkjknNNnky nXeeNw在什么条件下由在什么条件下由y(n)y(n)x(n)x(n)第42页/共57页一、滤波器组相加法一、滤波器组相加法()jnXej ne( )x n( )jnw n e窄带带通滤波器窄带带通滤波器k假设()()kkjjnXeX e第43页/共57页0(

20、)jnXe0jne( )x n0( )jnw n e1()jnXe1jne1( )jnw n e1()NjnXe1Njne1( )Njnw n e0( )h n1( )h n1( )Nhn用带通滤波器组进行短时傅立叶分析用带通滤波器组进行短时傅立叶分析N N个中心频率处于个中心频率处于 的滤波器组成的滤波器组成的滤波器组的滤波器组2,(0,1,1)k kNN第44页/共57页221100221021()0210210(0) ( )()()( ) ()( )()( )*( )( )* ( )( )(kkNNjkjknjjnNNnnkkNjmkjknNNkmNjk n mNmkNjknNkNjkn

21、NkNwy nXeeXeex m w nm eex mw nm ex nw n ex nw ney nx n )210()NjknNkreNnrN( )()(0) ( )rw nnrNwn第45页/共57页1.时域条件( )()(0) ( )rw nnrNwn若N Nw wN,=N, =N, 只要w(rN)=0, r=,-2,-1,1,2,w(rN)=0, r=,-2,-1,1,2,()rnrN( )w mN N2N2NN Nw w-1-1N-1N-1( )w m第46页/共57页0()jnXe0jne( )x n0( )jnw n e1()jnXe1jne1( )jnw n e1()NjnX

22、e1Njne1( )Njnw n e0( )h n1( )h n1( )Nhn0jne1jne1Njne(0) ( )Nwy n221100(0) ( )()()kkNNjkjknjjnNNnnkkNwy nXeeXee2.频域条件第47页/共57页( )x n0( )jnw n e1( )jnw n e1( )Njnw n e0( )h n1( )h n1( )Nhn(0) ( )Nwy n0( )y n1( )y n1( )Nyn( )h n( )x n(0) ( )Nwy n10( )( )Nkkh nhn11()00()()()(0)kNNjjjkkkH eHeW eNw (0) (

23、)( )* ( )( )(0) ( )Nwy nx nh nh nNwn第48页/共57页11()00()()()(0)kNNjjjkkkH eHeW eNw 2N4N6N2(1)NN0 0()jwW e(0)Nw第49页/共57页2,0,1,1()()kjjk kNNW eW e 由于由于 是宽度为是宽度为N N的有限时宽序列,而的有限时宽序列,而 的频率取样在的频率取样在 为为N N个。个。( )w n()jW e0 22101( )()kNjknjNkw nW eeN根据根据 的周期性,故:的周期性,故:()jW e()kjW e()()kjW e 1()01(0)()kNjkwW eN

24、1()0()()(0)( )(0) ( )kNjjkH eW eNwh nNwn ( )( )* ( )( )*(0) ( )(0) ( )y nx nh nx nNwnNwx n第50页/共57页二、叠接相加法(二、叠接相加法(Overlap-Add Method)2,0,1,1()()kjjnnk kLLNLXeXe( )nx mIFTIFT()nxm如果窗移为如果窗移为R,R,也就是也就是0, 1, 2,nrRr 可以相继恢复出各个窗口内的各可以相继恢复出各个窗口内的各N N个取样值个取样值第51页/共57页1.1.临界带特征矢量的意义二、语音的短时谱的临界带特征矢量 符合人耳的听觉特征的频率分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论