时域分析部分_第1页
时域分析部分_第2页
时域分析部分_第3页
时域分析部分_第4页
时域分析部分_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、图1-1 发音器官示意图图图1-2 1-2 简化的声道示意图简化的声道示意图 声波是一种机械振功,它必须借助介质质点的振动而传播。要描述发音系统中空气的振功,必须借助质量守恒、动量守恒及能量守恒以及热力学、流体力学的基本定律,建立一组偏微分方程,但是这种方程的表述和求解是及其困难的。严格的声学理论声学理论必须考虑以下各种影响,见图1-2; (1 1)声道形状的时变性质;)声道形状的时变性质; (2 2)由于声道壁的热传导和粘滞摩擦导致的损耗;)由于声道壁的热传导和粘滞摩擦导致的损耗; (3)声音在嘴唇处的辐射; (4 4)声道壁的柔度;)声道壁的柔度; (5)鼻腔的耦合, (6 6)声道中的声

2、激励。)声道中的声激励。( )( ) ( )H ZV Z R Z( )( )( )( )H ZG ZV ZR Z 这时,浊音信号就可以看作是由 一个准周期性的6脉冲串激励一个离散线性系统H(Z)而产生的输出了。 图1-3是语音信号的产生模型:图图1-3 1-3 语音信号产生的模型语音信号产生的模型 长期研究证实,发不同性质的音时,激励的情况是不同的,大致可以分为两大类:(1)发浊音时,此时气流在通过紧绷的声带时,冲激声带产生振动,使声门处形成准周期的脉冲串,并用它去激励声道。声带紧绷的程度不同时,振动频率也就不同。该频率就是音调频率,其倒数就是音调周期。不同人的音调周期是不同的,男子大,女子小

3、;老人大,小孩低。(2)发清音时,此时声带松弛而不振动,气流通过声门直接进入声道。1、语音信号的特点 (1)频谱分量主要集中在3003400HZ,可用带通滤波器滤除,然后按8K采样率对语音信号进行采样,从而得到数字语音信号。 (2)短时平稳性短时平稳性,语音信号的特征是随时间变换的,只有在以小段时间间隔内中,语音信号才保持相对稳定的特征,时间一般选为1030ms。因此语音信号的分析和处理采用分段处理,其中每小段称为“帧”,最重要的语音信号“短时特征”和“短时参数”包括语音的“短时能量”、“短时过零率”、“短时相关函数”、“短时频谱”等。 (3)语音信号的最基本组成单位是音素。音素可以分为“清音

4、”和“浊音”两大类。如果将不含语音只包括环境噪声的情况称为“无声”,那么音素可以分为“清音清音”、“浊音浊音”和和“无声无声”三大类。在短时分析的基础上可以分析语音段清浊音的分布情况,如果是浊音段可以测定它的一些其他重要参数,比如基音周期和共振峰等等。3、加窗分帧技术 由于语音信号具有短时平稳特性,所以对语音信号采用短时分析,信号流的处理采用分段或分帧来实现。一般每帧的时间是1030ms,分帧可以采用连续分段的方法,但一般采用交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性。前一帧和后一帧的非交叠部分称为帧移。帧移与帧长的比值一般取00.5。图3-1为帧长、帧移的概念和重叠相加的示意

5、图。图图3-1 分帧示意图分帧示意图 分帧是用可移动的有限长度窗口进行加权的方法来实现,就是对语音信号进行加窗处理,图3-2是各种常见窗函数的时域对比图,窗口有多种形状如海明窗(Hamming)、布拉克曼窗(Blackman-Harris)、海宁窗(Hanning)、三角窗(triang)、矩形窗(rectwin)等。w(n)10.80.60.40.20矩形窗三角窗布拉克曼窗海宁窗海明窗(N1) / 2N1n图图3-2 3-2 各种常见窗函数的时域图各种常见窗函数的时域图10203040506000.20.40.60.81SamplesAmplitudeTime domain00.20.40.

6、60.8-100-50050Normalized Frequency ( rad/sample)Magnitude (dB)Frequency domain绿色表示矩形窗,红色表示绿色表示矩形窗,红色表示海明窗。海明窗。图图3-3 3-3 矩形窗与海明窗图形对比矩形窗与海明窗图形对比1,010,nNhn矩形窗的时域表达式为:海明窗的时域表达式为: 0.54 0.46cos 2 /1 , 010,NnNh n 时域分析法是最早的信号分析法,也是应用范围最广的方法。各种电信号可以记录为时域波形,比如脑电图、心电图,自然现象也可以记录为时域波形。图3-4是汉语“我到黑龙江”的时域波形图,横坐标是时间

7、,纵坐标是幅值。010002000300040005000600070008000900010000-0.3-0.2-0.100.10.20.30.4龙龙黑黑我我江江到到图图3-4 3-4 汉语汉语“我到黑龙江我到黑龙江”的时域波形图的时域波形图4 4、语音信号的时域分析、语音信号的时域分析仔细观察波形,可以看出:仔细观察波形,可以看出:(1)语音有些部分有较大的振幅,这对应浊音的波形,有些部分振幅较小,这对应于清音部分的波形。(2)此波形与该句的音素相对应,可以大致确定此句的起始点和终结点,每个音素的起始点和终结点;由此可以确定整句话的持续时间和每音素的持续时间(端点检测技术)。(3)此波形

8、如有横轴坐标,则可以大致确定此波形的哪部分过零(即波形与横坐标轴的交点)的数目多,哪部分过零点数目少。相同时间间隔内的过零点,就是过零率。过零率高的是清音,过零率低的是浊音。时域分析的特点:时域分析的特点:(1)表示的语音信号比较直观,清晰易懂;(2)实现起来比较简单、运算量少;(3)用时域进行语音信号处理,可以得到语音信号的一些重要特性;(4)分析语音信号的时域波形,可以采用较为通用的设备,如示波器、存储示波器等,使用方法较为简单。2nmEx mw nm 21nm n Nx m w nm 22xnwn2hnwnnmMxmwnm En和Mn都反映信号强度,但其特性有所不同。短时能量反映了语音能

9、量随着时间变化的规律,其主要用途是: (1)可以区分清音段与浊音段,因为浊音段的短时平均能量比清音的大得多。 (2)可以区分有声与无声,无语音信号的噪声能量很小,而语音信号的能量显著的增大到某一个数值,由此可以区分语音信号的开始点或终止点。6、短时过零率分析 过零就是信号通过零值,对于连续语音信号,可以考察其时域波形通过时间轴的情况。而对于离散时间信号,如果相邻的取样值改变符号则称为过零,由此可以计算过零率。过零率就是样本改变符号的次数。单位时间内的过零率称为平均过零率。 由于语音信号具有短时平稳性,则可以计算其短时平均过零率,定义为: sgnsgn1nmZx mx mw nm sgnsgn1

10、*x mx mw n 1,0sgn1,0 x nx nx n其中,sgn.是符号函数,即W(n)是窗函数,这里采用汉明窗。语音波形语音波形过零率过零率图图3-6 3-6 汉语汉语“我到黑龙江我到黑龙江”的过零率分布图的过零率分布图语音波形短时能量过零率 将短时能量和过零率结合起来可以可以区分语音信号的开始点或终止点,对语音信号进行端点检测,检测结果见图3-7。图图3-7 3-7 语音端点检测的结果语音端点检测的结果50010001500200025003000-101声音波形1020304050607080900123短时能量1020304050607080900102030过零率 )( mk

11、mxmxkR NNmNkmxmxNkR 121lim PkRkR mnmknwkmxmnwmxkR因为因为 nnRkRk所以所以 nnmR kRkx m x m k w n m w n m k knwnwnhk mnhkmxmxkRmkn)()(knxnx)(nhk)(kRn上式表明,序列上式表明,序列经过一个冲激响应为经过一个冲激响应为的数字滤波器滤波即得到短时自相关函数的数字滤波器滤波即得到短时自相关函数 浊音和清音的短时自相关函数有如下几个特点:浊音和清音的短时自相关函数有如下几个特点:1)短时自相关函数可以很明显的反映出浊音信号)短时自相关函数可以很明显的反映出浊音信号的周期性。的周期

12、性。2)清音的短时自相关函数没有周期性,也不具有)清音的短时自相关函数没有周期性,也不具有明显突出的峰值,其性质类似于噪声。明显突出的峰值,其性质类似于噪声。3)不同的窗对短时自相关函数结果有一定的影响。)不同的窗对短时自相关函数结果有一定的影响。不同矩形窗长时的短时自相关函数不同矩形窗长时的短时自相关函数部分语句部分语句 for i=1:nfor i=1:n E(i E(i)=0;)=0;短时能量初始化短时能量初始化 M(iM(i)=0;)=0;短时平均幅度的初始化短时平均幅度的初始化 Z(iZ(i)=0;)=0;短时过零率的初始化短时过零率的初始化 n1,n2n1,n2的确定,实现帧移的确定,实现帧移 s=S(n1:n2);s=S(n1:n2); s=s. s=s.* *hamming(Winsizhamming(Winsiz);); 短时能量的程序;短时能量的程序;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论