语音信号处理课件-第04章短时傅里叶分析_第1页
语音信号处理课件-第04章短时傅里叶分析_第2页
语音信号处理课件-第04章短时傅里叶分析_第3页
语音信号处理课件-第04章短时傅里叶分析_第4页
语音信号处理课件-第04章短时傅里叶分析_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章短时傅立叶分析14.1短时傅立叶变换--概述24.2.1短时傅立叶变换--定义定义:短时傅立叶变换也叫短时谱(加窗的方式)短时谱的特点:1)时变性:既是角频率ω的函数又是时间n的函数2)周期性:是关于ω的周期函数,周期为2π短时傅立叶变换主要用于语音分析合成系统,由其逆变换可以精确地恢复语音波形;3短时傅里叶变换是窗选语音信号的标准傅里叶变换。下标n区别于标准的傅里叶变换。w(n-m)是窗口函数序列。不同的窗口函数序列,将得到不同的傅里叶变换的结果。短时傅里叶变换有两个自变量:n和ω,所以它既是关于时间n的离散函数,又是关于角频率ω的连续函数。与离散傅里叶变换和连续傅里叶变换的关系一样,若令ω=2πk/N,则得离散的短时傅里叶变换,它实际上是在频域的取样。4.2.1短时傅立叶变换--定义4这两个公式都有两种解释:①当n固定不变时,它们是序列w(n-m)x(m)(-∞<m<∞)的标准傅里叶变换或标准的离散傅里叶变换。此时与标准傅里叶变换具有相同的性质,而Xn(k)与标准的离散傅里叶变换具有相同的特性。②当ω或k固定时,和Xn(k)看做是时间n的函数。它们是信号序列和窗口函数序列的卷积,此时窗口的作用相当于一个滤波器。

4.2.1短时傅立叶变换--定义54.2.2短时傅立叶变换--标准傅里叶变换的解释短时傅里叶变换可写为

当n取不同值时窗w(n-m)沿着x(m)序列滑动,所以w(n-m)是一个“滑动的”窗口。由于窗口是有限长度的,满足绝对可和条件,所以这个变换是存在的。与序列的傅里叶变换相同,短时傅里叶变换随着ω作周期变化,周期为2π。64.2.2短时傅立叶变换--标准傅里叶变换的解释74.2.2短时傅立叶变换--标准傅里叶变换的解释根据功率谱定义,可以写出短时功率谱与短时傅里叶变换之间的关系

式中*表示复共轭运算。同时功率谱是短时自相关函数

的傅里叶变换。下面将短时傅里叶变换写为另一种形式。设信号序列和窗口序列的标准傅里叶变换为

均存在。当n取固定值时,w(n-m)的傅里叶变换为

84.2.2短时傅立叶变换--标准傅里叶变换的解释根据傅里叶变换的频域卷积定理,有将改为-,得9用波形乘以窗函数,不仅为了在窗口边缘两端不引起急剧变化,使波形缓慢降为零,而且还相当于对信号谱与窗函数的傅里叶变换进行卷积。为此窗函数应具有如下特性:

①频率分辨率高,即主瓣狭窄、尖锐;(矩形窗)②通过卷积,在其他频率成分产生的频谱泄漏少,即旁瓣衰减大。(海明窗)这两个要求实际上相互矛盾,不能同时满足。窗口宽度N、取样周期T和频率分辨率Δf之间存在下列关系Δf=1/NT可见:窗口宽度↑→频率分辨率↑时间分辨率↓窗口宽度↓→频率分辨率↓时间分辨率↑,因而二者是矛盾的。4.2.2短时傅立叶变换--标准傅里叶变换的解释104.2.2短时傅立叶变换--标准傅里叶变换的解释第一个零点位置为2π/N,显然它与窗口宽度成反比。矩形窗,虽然频率分辨率很高,但由于第一旁瓣的衰减只有13.2dB,所以不适合用于频谱成分动态范围很宽的语音分析中。海明窗在频率范围中的分辨率较高,而且由于旁瓣的衰减大于42dB,具有频谱泄漏少的优点,频谱中高频分量弱、波动小,因而得到较平滑的谱。汉宁窗是高次旁瓣低,第一旁瓣衰减只有30dB。直角窗11频率分辨率Δf、取样周期T、加窗宽度N三者关系:窗形状对短时傅立叶变换的影响 -矩形窗——主瓣窄,衰减慢; -汉明窗——主瓣宽,衰减快;

-海明窗——主瓣窄,衰减快;窗宽对短时频谱的影响-窗宽长——频率分辨率高,能看到频谱快变化;-窗宽短——频率分辨率低,看不到频谱的快变化;4.2.2短时傅立叶变换--标准傅里叶变换的解释12对语音波形乘以海明窗,压缩了接近窗两端的部分波形,等效于用作分析的区间缩短40%左右,因此,频率分辨率下降40%左右。所以,即使在基音周期性明显的浊音频谱分析中,乘以合适的窗函数,也能抑制基音周期与分析区间的相对相位关系的变动影响,从而得到稳定的频谱。因为乘以窗函数将导致分帧区间缩短,所以为跟踪随时间变化的频谱,要求一部分区间重复移动。4.2.2短时傅立叶变换--标准傅里叶变换的解释134.2.2短时傅立叶变换--标准傅里叶变换的解释14其中图(a)是海明窗的窗选信号,图(b)是其对数功率谱;图(c)是矩形窗下的窗选信号,图(d)是其对数功率谱。从图(a)可以明显看出时间波形的周期性,此周期性同样在图(b)中表现出来。图中基频及其谐波在频谱中表现为等频率间隔的窄峰。图(b)中的频谱大约在300~400Hz附近有较强的第一共振峰,而约在2000Hz附近有一个对应于第二、三共振峰的宽峰。此外,还能在3800Hz附近看到第四个共振峰。最后,由于声门脉冲谱的高频衰减特性,频谱在高频部分表现出下降的趋势。给出了N=500时(取样率10kHz,窗持续时间50ms)时直角窗及海明窗下浊音语音的频谱。4.2.2短时傅立叶变换--标准傅里叶变换的解释15给出了N=500时(取样率10kHz,窗持续时间50ms)时直角窗及海明窗下浊音语音的频谱。4.2.2短时傅立叶变换--标准傅里叶变换的解释将图(b)和图(d)比较可看出它们在基音谐波、共振峰结构以及频谱粗略形状上的相似性,同样也能看到其频谱之间的差别。最明显的是图(d)中基音谐波尖锐度增加,这主要是由于矩形窗频率分辨率较高。另一差别是矩形窗较高的旁瓣产生了一个类似于噪声的频谱。这是由于相邻谐波的旁瓣在谐波间隔内的相互作用(有时加强有时抵消),因而在谐波间产生了随机变化。这种相邻谐波间不希望有的“泄漏”抵消了其主瓣较窄的优点。因此在语音频谱分析中极少采用矩形窗。16图4-3给出了N=50的比较结果(取样率与图4-2中相同,因而窗口持续时间为5ms)。由于窗口很短,因而时间序列(图(a)和(c))及信号频谱(图(b)和(d))均不能反映信号的周期性。与图4-2相反,图4-3只大约在400、1400及2200Hz频率上有少量较宽的峰值。它们与窗内语音段的前三个共振峰相对应。比较图4-3(b)及(d)的频谱后,再次表明矩形窗可以得到较高的频率分辨率。

4.2.2短时傅立叶变换--标准傅里叶变换的解释给出了N=50时(取样率10kHz,窗持续时间5ms)时直角窗及海明窗下浊音语音的频谱。17结论:窗口宽度与短时傅里叶变换特性之间的关系用窄窗可得到好的时间分辨率用宽窗可以得到好的频率分辨率。但由于采用窗的目的是要限制分析的时间以使其中波形的特性没有显著变化,因而要折衷考虑。

4.2.2短时傅立叶变换--标准傅里叶变换的解释18w(n)----------一个滤波器的单位函数响应

-----该滤波器的输出x(n)------滤波器的输入过程:调制+滤波4.2.3短时傅立叶变换--滤波器的解释一图4-4短时傅里叶变换滤波器解释的第一种形式(a)复数运算194.2.3短时傅立叶变换--滤波器的解释一用线性滤波实现短时傅立叶变换的第一种形式204.2.3短时傅立叶变换--滤波器的解释一图4-4短时傅里叶变换滤波器解释的第一种形式

(b)只有实数运算21

w(n)w(n)是窄带低通滤波器假设

将x(n)的频谱向左搬移了,或等效将频率上的频谱搬移到了零频率处。因此为使输出端有:w(n)是窄带低通滤波器4.2.3短时傅立叶变换--滤波器的解释一224.2.3短时傅立叶变换--滤波器的解释一23令2.复数运算实现短时谱的线性滤波表示窄带带通滤波器4.2.3短时傅立叶变换--滤波器的解释二24实数运算实现短时谱的线性滤波表示4.2.3短时傅立叶变换--滤波器的解释二

+++-3.实数运算实现短时谱的线性滤波表示25

为窄带低通滤波器。第一种形式为低通滤波器;由于第二种形式中的滤波器单位函数响应为,所以它为带通滤波器。4.2.3短时傅立叶变换--滤波器的解释26如果将w(n)的滤波运算除外,短时傅里叶变换实际上是对信号的幅度调制。第一种形式是在输入端进行调制,x(n)乘以相当于将x(n)的频谱从ω移到零频处;而w(n)(直角窗或海明窗等)为窄带低通滤波器。后一种形式是在输出端进行调制,此时先对信号进行带通滤波,滤波器的单位函数响应为w(n),而调制后输出的是中心频率为ω的短时谱。4.2.3短时傅立叶变换--滤波器的解释27恢复出x(n)的过程称为短时傅里叶反变换,是由短时谱合成语音信号的问题由于是n和ω的二维函数,因而必须对在所涉及的两个变量,即时域及频域内进行取样,取样率的选取应保证不产生混叠失真,从而能够恢复原始语音信号x(n)。4.3短时傅立叶变换的取样率28当ω为固定值时,是一个单位函数响应为w(n)的低通滤波器的输出。设低通滤波器的带宽为BHz,则具有与窗相同的带宽。根据取样定理,的取样率至少为2B才不致混叠。低通滤波器的带宽由w(n)的傅里叶变换的第一个零点位置ω01决定,因而B值取决于窗的形状与长度。

4.3短时傅立叶变换的取样率---时间取样率29正弦序列的表达式为幅值A、初相φ的含义与模拟正弦信号相同正弦序列的数字角频率Ω0的含义与一般模拟信号模拟角频率ω0的概念不同。离散信号数字角频Ω0=ω0T,模拟角频率ω0的单位是rad/s,数字角频Ω0的单位为rad/s·s=rad。Ω0表示相邻两个样值间弧度的变化量。4.3短时傅立叶变换的取样率---时间取样率30以直角窗和海明窗为例,其第一个零点位置分别为2π/N和4π/N数字角频率与模拟频率F之间的关系为ω=2πFT=2πF/fs(其中T是信号取样周期,fs是取样率),因而用模拟频率表示的的带宽为4.3短时傅立叶变换的取样率---时间取样率2231每帧中语音信号个数为窗长N4.3短时傅立叶变换的取样率---时间取样率324.3短时傅立叶变换的取样率---总取样率334.3短时傅立叶变换的取样率---总取样率344.4语音信号的短时综合--滤波器组求和法离散短时傅立叶变换离散短时傅立叶反变换354.4.1滤波器组相加法窄带带通滤波器假设4.4语音信号的短时综合--滤波器组求和法36用带通滤波器组进行短时傅立叶分析N个中心频率处于的滤波器组成的滤波器组4.4语音信号的短时综合--滤波器组求和法372.频域条件4.4语音信号的短时综合--滤波器组求和法384.4语音信号的短时综合--快速傅里叶变换求和法394.4语音信号的短时综合--快速傅里叶变换求和法404.4语音信号的短时综合--快速傅里叶变换求和法41语音的时域分析和频域分析是语音分析的两种重要方法。这两种方法均有局限性:时域分析对语音信号的频率特性没有直观的了解;频域特性中又没有语音信号随时间的变化关系。时间依赖于傅里叶分析的显示图形称为语谱图。语谱图中显示了大量的与语音的语句特性有关的信息,它综合了频谱图和时域波形的优点,明显地显示出语音频谱随时间的变化情况。4.5语谱图42语谱图实际上是一种动态的频谱。语谱图的纵轴为频率,横轴为时间。任一给定频率成分在给定时刻的强弱用点的黑白度来表示,频谱值大则记录得浓黑一些,反之则浅淡一些。用语谱图分析语音又称为语谱分析,记

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论