数字语音处理-第四章_第1页
数字语音处理-第四章_第2页
数字语音处理-第四章_第3页
数字语音处理-第四章_第4页
数字语音处理-第四章_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章语音信号的短时时域分析

4.1概述14.2傅里叶变换的解释

4.3滤波器的解释34.4短时谱的时域及频域采样率44.5短时综合的滤波器组相加法524.1概述语音信号可被看作是短时平稳信号,其某一帧的短时傅里叶变换定义式如下:(4.1)式中w(n-m)是窗函数。在式中,短时傅里叶变换有两个变量,它们是离散时间n及连续频率ω若令,则得离散的短时傅里叶变换如下:

(4.2)它实际上就是的频率的取样。4.1概述可以看出:(1)当n固定时,它们就是序列

(-∞≤m≤+∞)

的傅里叶变换或离散傅里叶变换。(2)

当或k固定时,它们是一个卷积,这相当于滤波器的运算。因此,语音信号的短时频域分析可以解释为傅里叶变换或滤波器。下面分别讨论这两种情况。4.1概述4.2

傅里叶变换的解释

1.求x(n)将式(4.1)写作(4.3)时变傅里叶变换是时间标号n的函数,当n变化时,窗w(n-m)沿着x(m)滑动。傅里叶逆变换公式为:

(4.4)令m=n,则

(4.5)可以看出,只有当w(0)≠0时,x(n)才能从求出。

此外,由功率谱定义,可以写出短时功率谱与短时傅里叶变换的关系:

(4.6)功率谱是自相关函数

(4.7)的傅里叶变换。窗函数的作用

1.选出x(m)序列中被分析部分;

2.它的形状对时变傅里叶变换特性也有重要作用。如果被看成是w(n-m)x(m)序列的标准傅里叶变换,同时假设x(m)及w(m)的标准傅里叶变换存在,为:(4.8)(4.9)当n固定时,序列w(n-m)的傅里叶变换为:

(4.10)根据卷积定理,有:

(4.11)写成卷积积分形式:

(4.12)将θ改换为-θ后,可以写成:

(4.13)可见,为了使能够充分地表现的特性,要求对于来说,必须是一个冲激脉冲。

窗函数和窗宽对短时傅里叶谱的影响:由于矩形窗有较高的旁瓣,在语音频谱分析中,很少采用。实验表明,窗的主瓣宽度与窗宽度N成反比,选择窗宽时应根据应用需要,折衷考虑,要得到好的时间分辨率要求用窄窗,而要得到好的频率分辨率要求用宽窗。

4.3

滤波器的解释(ω给定)

1.短时傅里叶变换的滤波器实现形式一由式(4.1)可得

(4.14)如果把w(n)看作为一个滤波器的单位取样响应,则短时傅里叶变换就是该滤波器的输出,为滤波器的输入。

用实数来运算的方法:

(4.15)(4.16)

结论:经调制后,其付里叶变换为,这说明调制使的频谱在频率轴上向左移动了,线性滤波器输出端的频谱等于乘积,故为了使输出频谱准确等于,应当是一个冲激。即要求线性滤波器近似为一个窄带低通滤波器。2.短时傅里叶变换的滤波器实现形式二令:

(4.16)令(4.17)则有

(4.18)可以画出短时傅里叶变换的滤波器解释的另一种形式如图(4.3)所示,也分为复数运算和实数运算两种。

同样要求线性滤波器近似为一个中心频率为ω的窄带带通滤波器。

4.4短时谱的时域及频域取样率

短时傅里叶变换同时是时间n以及角频率ω的函数。由来恢复x(n),首先遇到的就是时域取样率和频域取样率的问题。1.时域取样率(ω为固定值)

若将w(n)的傅里叶变换记为,对于大多数窗函数来说,具有低通滤波器的特性,若它的带宽为BHz,则具有与窗相同的带宽。低通滤波器的带宽是由第一个零点位置决定的。因为是-1的傅里叶变换,因而B的取值决定于窗口序列的长度N和形状。若使用哈明窗,的近似带宽为

(4.20)

2、频率取样率(n为固定值)

此时,是以2π为周期的ω的连续函数,用下述一组频率值来取样:

(4.21)

设w(n)为有限时宽N,的短时付里叶反变换x(m)w(n-m)也应当是宽度为N有限时宽的。现在在频域内L个角频率上对进行取样,根据这些取样所恢复出的时间信号应该是x(m)w(n-m)进行周期延拓的结果,延拓周期等于L。为使恢复的时域信号不产生混叠,要求,故频域最小取样数为窗宽SRf=N。

3、总取样率的总抽样率(SR)等于

(4.22)在大多数实际窗中,B可以表示为FS/N的倍数

(4.23)其中,C是比例常数,

x(n)的抽样频率即为

(4.24)SR/FS即为与一般取样频率相比而得到的“过速率采样比”。

欠速率采样:

x(n)的短时谱所要求的取样率比起一般波形表示来说,要增加到2~4倍。但有时在时域或频域用低于理论上最小值的取样率,而x(n)仍能从混叠的短时变换中准确地恢复。欠速率采样在短时谱估计,基音及共振峰分析,数字语谱图以及声码器中得到应用。4.5短时综合的滤波器组相加法

可表示为(4.25)(4.26)若定义则(4.27)(4.28)式(4.28)的图形解释

定义

(4.29)

可得

(4.30)

可见,是一个冲激响应为的带通滤波器的输出。复数带通滤波器的频率响应为

上式用图4.7(b)表示,中心频率为,带宽为,假定所有通道都使用了相同的窗函数,即

(4.31)(4.32)

考虑整个带通滤波器组时,其中每个带通滤波器具有相同的输入,其输出相加在一起,如图4.8所示,输出为y(n),输入为x(n),整个系统的复合频率响应为

(4.33)

如果在频率域上正确抽样(N≥L,L为窗宽),可以证明对于所有ω都满足

(4.34)

上式证明如下:

的傅里叶反变换是窗函数,如果在频率上以N个均匀间隔抽样,抽样形式的离散傅里叶反变换为

(4.35)

如果w(n)的宽度等于L个抽样,则

w(n)=0,n<0,n≥L(4.36)

在式(4.35)中取n=0,得到

(4.37)

从式(4.27)及式(4.34)可以推出复合系统的冲激响应为:(4.38)

这时的复合输出为

(4.39)

于是,用滤波器组相加法恢复的信号可以表示为:

(4.40)

上面已讨论到,当w(n)具有有限宽度L时,x(n)完全能从时间及频率域抽样后的时变傅里叶变换准确地恢复。下面还能证明,如果在频域内是频带受限的,则

x(n)也能准确从中恢复。

前面已指出,在有限宽度窗的情况下,为避免时间混叠,必须至少在L个均匀分布的频率上取值,其中L为窗的宽度。宽度为L的窗的带宽一般在矩形窗)至哈明窗)之间,而分析频率为,这时所得的带通滤波器在频率上叠接。4.5.2短时综合的滤波器组相加法的MATLAB程序实现

程序filterbank1.m对应于图4.6中的(b)图,先调制后滤波,实现流程图见图4.10。图4.6中的(b)图图4.10filterbank1的流程图YN读入语音数据分帧,不足补零,共N帧加哈宁窗滤波i=1~65取k=1帧数据用调制i=1~65用调制i=1~65k=k+1输出

k≥N?

程序filterbank2.m对应于图4.6中的(a)图,先滤波后调制,实现流程图见图4.12,程序运行结果见图4.13。图4.6中的(a)图图4.12filterbank2的流程图YN读入语音数据分帧,不足补零,共N帧各通道滤波i=1~65取k=1帧数据并分别送入1~65通道的输入端

各通道用调制i=1~65各通道用调制i=1~65k=k+1输出

k≥N?

(4.41)式中r为一整数,0≤i≤N-1,上式的反变换为

(4.42)又(4.43)因而

(4.44)假设在时域上利用周期为R的取样对取样得4.5.3短时综合的叠接相加法原理及MATLAB程序实现

将式(4.42)代入式(4.44)中,可得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论