第4章 语音信号的时域处理技术教材_第1页
第4章 语音信号的时域处理技术教材_第2页
第4章 语音信号的时域处理技术教材_第3页
第4章 语音信号的时域处理技术教材_第4页
第4章 语音信号的时域处理技术教材_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第第4 4章章 语音信号的时域处理技术语音信号的时域处理技术4.1 4.1 语音信号的短时处理方法语音信号的短时处理方法 4.2 4.2 短时能量和短时平均幅度短时能量和短时平均幅度4.3 4.3 短时平均过零率短时平均过零率4.4 4.4 短时自相关函数短时自相关函数4.5 4.5 短时时域处理技术应用举例短时时域处理技术应用举例4.6 4.6 中值滤波在语音短时处理中的应用中值滤波在语音短时处理中的应用 A/D of some common audio signals Frequency Frequency scopescopeSampling Sampling frequencyfre

2、quencyQuantizatQuantization bitsion bitsTelephoneTelephone200-3400200-34008 khz8 khz8 bits8 bitsWide bandWide band50-700050-700016 khz16 khz16 bits16 bitsBroadcastBroadcastinging20-15khz20-15khz37.8 khz37.8 khz16 bits16 bitsCDCD20-20khz20-20khz44.1 khz44.1 khz16 bits16 bits短时化加窗分帧处理短时化加窗分帧处理 Windowi

3、ng (frame) 第第n n帧帧第第n+1n+1帧帧第第n+2n+2帧帧 帧长帧长N N帧移帧移M M()() ()nxmx m w nmIn short-term, non-stationary-stationaryIn short-term, non-stationary-stationaryNon-linear-linear (10ms-20ms)Non-linear-linear (10ms-20ms)NM050100150200250300350400450-1-0.8-0.6-0.4-0.200.20.40.60.81x(mx(m) )n nw(n-mw(n-m) )x xn

4、n(m(m) )n n的位置可位于窗的中央的位置可位于窗的中央或起点或终点。或起点或终点。x(mx(m) )w(n-mw(n-m) )m mm mn nw(mw(m) )x xn n(m(m) )otherwiseNnNnnwotherwiseNnNnnwotherwiseNnnw100)12cos(46. 054. 0)(100)12cos(5 . 05 . 0)(0101)(汉宁窗汉宁窗 hanning汉明窗汉明窗 hamming矩形窗矩形窗(rectangular)Window shapes矩形窗矩形窗汉宁窗汉宁窗汉明窗汉明窗布莱克曼窗布莱克曼窗过渡带宽和阻带最小衰减过渡带宽和阻带最小衰

5、减Long window: frequency resolutionLong window: frequency resolution(fsfs/N/N) time resolutiontime resolutionShort window: frequency resolutionShort window: frequency resolution time resolution time resolution 基音频率为基音频率为200Hz200Hz,采样频率为,采样频率为8kHz, 8kHz, 窗长:窗长: 80008000 (1/200)(1/200) 7=2567=256 经过处理,

6、语音信号就已经被分割成一帧一经过处理,语音信号就已经被分割成一帧一帧的加过窗函数的短时信号,然后再把每一个短帧的加过窗函数的短时信号,然后再把每一个短时语音帧看成平稳的随机信号,利用数字信号处时语音帧看成平稳的随机信号,利用数字信号处理技术来提取语音特征参数。在进行处理时,按理技术来提取语音特征参数。在进行处理时,按帧从数据区中取出数据,处理完后再取下一帧。帧从数据区中取出数据,处理完后再取下一帧。最后得到由每一帧参数组成的语音特征参数的时最后得到由每一帧参数组成的语音特征参数的时间序列。间序列。x0(m)0N-1x1(m)MM+N-1y0(m)0N-1y1(m)MM+N-14.2 4.2 短

7、时能量和短时平均幅度短时能量和短时平均幅度一、短时能量一、短时能量二、短时平均幅度二、短时平均幅度1. 1. 能量分析的依据能量分析的依据:是基于语音信号幅度随时间:是基于语音信号幅度随时间变化。清音段幅度小,其能量集中于高频段;浊变化。清音段幅度小,其能量集中于高频段;浊音段幅度较大,其能量集中于低频段。音段幅度较大,其能量集中于低频段。2.2.短时能量函数短时能量函数一、短时能量一、短时能量()()()nxmx m w nm22()()()nnmmExmxm h nm 平方平方滤波器滤波器h(n)( )x nnE 滑动数据滑动数据窗窗h(n-m)平方和平方和( )x nnEnE2( )(

8、)h nwn2( )xn 短时能量短时能量 反映语音振幅随时间缓变的反映语音振幅随时间缓变的规律,受窗函数及其窗宽的影响。规律,受窗函数及其窗宽的影响。N=51N=51N=101N=101N=201N=201N=401N=401矩形窗矩形窗汉明窗汉明窗 矩形窗比汉明窗具有显著的平滑效果;随着窗的矩形窗比汉明窗具有显著的平滑效果;随着窗的宽度的增加,平滑效果越来越显著;清音和浊音之间宽度的增加,平滑效果越来越显著;清音和浊音之间的区别和分界点。的区别和分界点。nE窗宽的选择窗宽的选择 使使 能及时地跟踪语音能量的缓慢时变规律能及时地跟踪语音能量的缓慢时变规律 对语音振幅在一个基音周期时间内的瞬时

9、快变对语音振幅在一个基音周期时间内的瞬时快变化有显著平滑作用化有显著平滑作用 窗宽时间为窗宽时间为101020ms20msnE 短时能量函数一个主要的问题是短时能量函数一个主要的问题是E En n对信号电平对信号电平值过于敏感。由于需要计算信号样值的平方和,在值过于敏感。由于需要计算信号样值的平方和,在实际应用中(如定点设备)很容易溢出。因此,一实际应用中(如定点设备)很容易溢出。因此,一般用平均幅度函数般用平均幅度函数M Mn n来代替来代替E En n。但这时,清音和浊。但这时,清音和浊音、有声和无声的音、有声和无声的M Mn n不如短时能量不如短时能量E En n明显。明显。存在的问题存

10、在的问题1. 1. 平均幅度分析的依据平均幅度分析的依据:清音段幅度小;浊音段:清音段幅度小;浊音段幅度较大。幅度较大。2.2.短时平均幅度短时平均幅度二、短时平均幅度二、短时平均幅度()()()()nmmMx m w nmx m h nm绝对值绝对值滤波器滤波器h(n)( )x nnM 滑动数据滑动数据窗窗h(n-m)绝对值求和绝对值求和( )x nnM( ) |( )|h nw n| ( )|x n 男声男声“深圳深圳 广州广州 珠海珠海”的短时幅度统的短时幅度统计。在采样频率为计。在采样频率为22050Hz22050Hz的情况下,取的情况下,取20ms20ms作作为一帧,帧长为为一帧,帧

11、长为441441点,一共统计了点,一共统计了180180帧。帧。短时平均幅度短时平均幅度原始原始语音语音N=51N=51N=101N=101N=201N=201N=401N=401矩形窗矩形窗汉明窗汉明窗 矩形窗比汉明窗具有显著的平滑效果;随着窗的矩形窗比汉明窗具有显著的平滑效果;随着窗的宽度的增加,平滑效果越来越显著;清音和浊音之间宽度的增加,平滑效果越来越显著;清音和浊音之间的区别和分界点。的区别和分界点。三三.短时平均幅度函数和能量函数的作用短时平均幅度函数和能量函数的作用(1)(1)区分清区分清/ /浊音:浊音: E En n、M Mn n大,对应浊音;大,对应浊音; E En n、M

12、 Mn n小,对应清音。小,对应清音。(2)(2)在信噪比高的情况下,能进行有声在信噪比高的情况下,能进行有声/ /无声判决无声判决 无声时,背景噪声的无声时,背景噪声的E En n、M Mn n小;小; 有声时,有声时,E En n、M Mn n显著增大。判决时可设置一个门显著增大。判决时可设置一个门限。限。(3)(3)大致能定出浊音变为清音的时刻,或反之。大致能定出浊音变为清音的时刻,或反之。静音检测(静音检测(VADVAD)和舒适噪声)和舒适噪声(CNG)(CNG)的生成的生成VAD: Voice Activity DetectionVAD: Voice Activity Detecti

13、onCNG: Comfort Noise Generator CNG: Comfort Noise Generator 测试表明,人在正常谈话时,有测试表明,人在正常谈话时,有5050左右是静左右是静音。音。VADVAD是用来检测输入的信号是实际语音还是背是用来检测输入的信号是实际语音还是背景噪声,若检测是实际语音信号进行固定编码;如景噪声,若检测是实际语音信号进行固定编码;如果是背景噪声,则采用更低的速率进行编码。果是背景噪声,则采用更低的速率进行编码。CNGCNG针对接收端,重构背景噪声。针对接收端,重构背景噪声。VADVAD可通过能量检测可通过能量检测来实现。来实现。h(n)无限冲激响应

14、滤波器无限冲激响应滤波器0( )00manh nn11( )| | |1H zzaaz211( )( )nnnnEaExnMaMx n 按按x(n)的取样点逐点进行计算的取样点逐点进行计算E En n和和M Mn n ,然后再,然后再以帧频率(以帧频率(50100Hz/2010ms)抽取)抽取E En n和和M Mn n 。绝对值绝对值滤波器滤波器h(n)( )x nnM| ( )|x n4.2 4.2 短时平均过零率短时平均过零率1.1.过零率定义过零率定义2.2.语音信号的短时平均过零率分析语音信号的短时平均过零率分析3.3.短时平均过零率的作用短时平均过零率的作用1.1.过零率定义:信号

15、跨越横轴的情况。过零率定义:信号跨越横轴的情况。 对于连续信号,观察语音时域波形通过横轴的对于连续信号,观察语音时域波形通过横轴的情况;情况; 对于离散信号,相邻的采样值具有不同的代数对于离散信号,相邻的采样值具有不同的代数符号,也就是样点改变符号的次数。符号,也就是样点改变符号的次数。t tn n zero cross rate 对于语音信号,是宽带非平稳信号,应考察其对于语音信号,是宽带非平稳信号,应考察其短时平均过零率。短时平均过零率。(1)1sgn( ) sgn(1)21sgn ( ) sgn (1)()21sgn ( ) sgn (1)2nnnmmnm nNZx mx mNx mx

16、mw nmNx mx mN sgnsgn.为符号函数为符号函数sgn(sgn(x x( (n n)=1 )=1 x x( (n n) ) 0 0 sgn(sgn(x x( (n n)= -1 )= -1 x x( (n n)0)0 sgn(sgn(x x( (n n)=0 )=0 x x( (n n) )= =0 0 选用矩形窗函数选用矩形窗函数x(mx(m) )w(n-mw(n-m) )m mn nn-(N-1)n-(N-1)11sgn ( ) sgn (1)sgn () sgn (1)2nnZZx nx nx n Nx n NN 当相零两个取样值符合相同时,不产生过零,而当相零两个取样值符

17、合相同时,不产生过零,而当相反时,当相反时, 2 2,因此求和后除,因此求和后除以以2N2N得到平均过零率。得到平均过零率。 sgn ( ) sgn (1)x nx nF Fs s=10kHz, N=150,M=50,=10kHz, N=150,M=50,每输入每输入100100个样个样点计算一次平均过零率。点计算一次平均过零率。3 3、短时平均过零的作用、短时平均过零的作用(1 1)区分清)区分清/ /浊音:浊音: 浊音平均过零率低,集中在低频端;浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。清音平均过零率高,集中在高频端。(2 2)从背景噪声中找出是否有语音,以及从背景

18、噪声中找出是否有语音,以及语音的起点。语音的起点。050100150200250300350400450-1-0.8-0.6-0.4-0.200.20.40.60.81 女声汉语拼音女声汉语拼音a a的一帧信号(在采样频的一帧信号(在采样频率为率为22050Hz22050Hz的情况下,取的情况下,取20ms20ms作为一帧),作为一帧),短时过零率为短时过零率为4646。 男声汉语拼音男声汉语拼音s s的一帧信号(在采样频的一帧信号(在采样频率为率为22050Hz22050Hz的情况下,取的情况下,取20ms20ms作为一帧),作为一帧),短时过零率为短时过零率为183183。05010015

19、0200250300350400450-0.4-0.3-0.2-0.100.10.20.3 在实际应用中,短时平均过零率容易受到在实际应用中,短时平均过零率容易受到A/DA/D转换是的直流偏移、转换是的直流偏移、50Hz50Hz交流电源的干扰交流电源的干扰以及噪声的影响。以及噪声的影响。 减少这些干扰可以有两种方法:一种是采减少这些干扰可以有两种方法:一种是采用带通滤波器消除信号中的直流和用带通滤波器消除信号中的直流和50Hz50Hz低频分低频分量;量;Bandpass filte HBandpass filte Hb bwH Hb b(e(ejwjw) )x(n)x(n)y(n)y(n) 另

20、一种是用过门限率来修改过零率,减另一种是用过门限率来修改过零率,减少随机噪声的影响。少随机噪声的影响。 过门限率反映了穿过正负门限的次数,如过门限率反映了穿过正负门限的次数,如果存在随机噪声,只要信号没有超过果存在随机噪声,只要信号没有超过-T,T-T,T的范围,就没有有过零率产生。的范围,就没有有过零率产生。T-T4.4 短时自相关函数短时自相关函数1.1.相关分析的依据:相关分析的依据: 用于确定两个信号在时域内的相似性。常用的用于确定两个信号在时域内的相似性。常用的物理量为物理量为自相关函数自相关函数和和互相关函数互相关函数。当两个信号。当两个信号的互相关函数大时,则说明一个信号可能是另

21、一的互相关函数大时,则说明一个信号可能是另一个信号的时间滞后或提前;当互相关函数为个信号的时间滞后或提前;当互相关函数为0 0时,时,则两个信号完全不同。则两个信号完全不同。 自相关函数用于研究信号本身,如波形的同步自相关函数用于研究信号本身,如波形的同步性和周期性。性和周期性。 主信号主信号s+n0s+n0,为有用信号,为有用信号s s(来自信号源)和一(来自信号源)和一个与它不相关的噪声信号的混合而成。个与它不相关的噪声信号的混合而成。 n1n1为另外拾取的噪声参考信号,与为另外拾取的噪声参考信号,与n0n0相关相关。主输入信号主输入信号x=s+n0 + x=s+n0 + 输出输出ss参考

22、输入参考输入n1n1自适应自适应滤波器滤波器+ +nn- -利用信号的相关性达到消除噪声的目的利用信号的相关性达到消除噪声的目的利用信号的相关性进行声源定位利用信号的相关性进行声源定位1212( )( )( )RE s n sn*1212( )( )( )jRSSed2222122312232()2 ()dcrc1223()arcsin22cd5m5m8m8m麦克风麦克风声源声源r r1223和和分别为两两麦克风间的时间延迟。分别为两两麦克风间的时间延迟。 信号信号s(ns(n) )与其滞后信号与其滞后信号s(n-ms(n-m) )的互相关函数在的互相关函数在n=mn=m处取得最大处取得最大值

23、。值。12( )()()s ns n ms n2( )()sns nmMultiple sound source tracking systemMultiple sound source tracking system利用互相关进行水管网络泄漏检测利用互相关进行水管网络泄漏检测水听器水听器水听器水听器放大滤波放大滤波数据采集数据采集计算互相关计算互相关 得到漏水声达得到漏水声达到两个传声器的到两个传声器的传播时间差,再传播时间差,再进行位置判别。进行位置判别。流体水管流体水管2.2.短时自相关函数的定义短时自相关函数的定义( )( )() ( ) () () ()nnnmmR kx m x m

24、kx m w nmx mk w nm kx(mx(m) )w(n-mw(n-m) )m mn nn-(N-1)n-(N-1)()nXm10( )( )()NknnnmR kx m x mk (1)(1)说明当时域信号为周期信号时,自相关函数说明当时域信号为周期信号时,自相关函数也是周期性函数,两者具有同样的周期。也是周期性函数,两者具有同样的周期。(2)R(2)Rn n(k)(k)为偶函数,为偶函数, R Rn n(k)(k)R Rn n( (k)k)(3)R(3)Rn n(0)(0)最大,最大, R Rn n(0)(0) |R |Rn n(k(k)|, R)|, Rn n(0)=E(0)=E

25、n n, ,对于对于确定信号,确定信号, R Rn n(0)(0)是信号能量;对于随机信号或是信号能量;对于随机信号或周期信号,周期信号, R Rn n(0)(0)是平均功率。是平均功率。0100020003000400050006000-1-0.500.510100020003000400050006000-3000-2000-10000100020003000正弦波周期信号正弦波周期信号 正弦波周期信号的自相关函数波形正弦波周期信号的自相关函数波形0100020003000400050006000-3000-2000-10000100020003000 正弦波周期信号和其自相关函数叠加正弦

26、波周期信号和其自相关函数叠加运算量运算量 窗宽为窗宽为N,N,选取语音段需要选取语音段需要N N次乘法,对每个次乘法,对每个k k值计算乘积需要值计算乘积需要N-kN-k次乘法,设次乘法,设k k的取值为的取值为0 0K K,则给定则给定n n计算计算 的总乘法次数为:的总乘法次数为:( )nR k0()KkMNNk例如例如N=401,K=250, N=401,K=250, 则则M=69677M=696771010( )( )() ( ) () () ()NknnnmNkmR kx m x mkx m w nmx mk w nm k 3.减少计算量的方法减少计算量的方法FFT10( )( )(

27、)( )*()NknnnnnmR kx m x mkx mxm ( )nx mFFT( )nX k()nxm*( )nX kFFT*( )( )nnX k X kIFFT( )()nnx mxm( )()( )()nnnnx mxmx mxm极限情况:极限情况:当当k=0k=0,线性卷积的长度为,线性卷积的长度为2N-1,2N-1,循环卷积循环卷积的长度为的长度为N,N,因此要满足上式,须将因此要满足上式,须将 和和 扩扩展为展为2N2N点。点。( )nx m()nxm4.短时自相关函数的另一种计算方法短时自相关函数的另一种计算方法( ) ()() ()() () ()()nmkmRkx m

28、w nmx mk w nmkx m x mkhnm延迟延迟k k( )x m( )nR k( )kh m()() ()kh nmw nm w nmk20( )00m kkamh mm2( )(1)( ) ()knnR ka R ka x m x m k 5 5、短时自相关函数的作用、短时自相关函数的作用1.1.区分清区分清/ /浊音浊音 浊音语音的自相关函数具有一定的周期性。浊音语音的自相关函数具有一定的周期性。 清音语音的自相关函数不具有周期性,类似噪声,清音语音的自相关函数不具有周期性,类似噪声,有点如语音信号本身。有点如语音信号本身。2.2.估计浊音语音信号的周期,即估计基音周期。估计浊

29、音语音信号的周期,即估计基音周期。 女声汉语拼音女声汉语拼音a a的一帧信号(在采样频率为的一帧信号(在采样频率为22050Hz22050Hz的情况下,取的情况下,取20ms20ms作为一帧),自相关作为一帧),自相关波形图。说明波形图。说明浊音的自相关函数具有一定的周期浊音的自相关函数具有一定的周期性。性。050100150200250300350400450-1-0.500.51050100150200250300350400450-100-50050100原始语音信号原始语音信号自相关函数波形自相关函数波形050100150200250300350400450500-60-40-2002

30、0406080 原始语音信号和其自相关函数波形原始语音信号和其自相关函数波形 Auto-correlation peaks050100150200250300350400450-0.4-0.200.20.4050100150200250300350400450-2-10123 男声汉语拼音男声汉语拼音s s的一帧信号(在采样频率为的一帧信号(在采样频率为22050Hz的情况下,取的情况下,取20ms作为一帧),自相关作为一帧),自相关波形图。波形图。原始语音信号原始语音信号自相关函数波形自相关函数波形 男声汉语拼音男声汉语拼音s s的一帧信号(在采样频率为的一帧信号(在采样频率为22050Hz

31、的情况下,取的情况下,取10ms作为一帧),自相作为一帧),自相关波形图。关波形图。原始语音信号原始语音信号修改坐标的自相关函数波形修改坐标的自相关函数波形 用用MATLABMATLAB的函数的函数randnrandn,产生一帧高斯白,产生一帧高斯白噪声,其自相关函数图。说明清音是噪声激励噪声,其自相关函数图。说明清音是噪声激励的正确性。的正确性。白噪声信号白噪声信号修改坐标的自相关函数波形修改坐标的自相关函数波形浊音浊音 矩形窗矩形窗清音清音 矩形窗矩形窗浊音浊音 汉明窗汉明窗清音清音 汉明窗汉明窗N=401N=201N=125窗形和窗长对窗形和窗长对 的影响的影响( )nR k6.对浊音短

32、时自相关函数的修正对浊音短时自相关函数的修正10( )( ) ()NnmR kx m x mk任何任何k值的短时自相关函数使用了值的短时自相关函数使用了N个积个积1010( ) ( ) () () ()( ) ()NknmNkmR kx m w nmx mk w nmkx m x mk 矩形窗矩形窗通过增加通过增加窗的长度窗的长度0N-10N-1+K0N-1K7.短时平均幅度差函数(短时平均幅度差函数(AMDF) 短时自相关函数是语音信号时域分析的短时自相关函数是语音信号时域分析的重要参量,但由于乘法运算所需要的时间长。重要参量,但由于乘法运算所需要的时间长。为了避免乘法,一个简单的方法就是利

33、用差为了避免乘法,一个简单的方法就是利用差值,为此常常采用另一种与自相关函数有类值,为此常常采用另一种与自相关函数有类似作用的参量,短时平均幅度差函数。似作用的参量,短时平均幅度差函数。 短时平均幅度差函数能够代替自相关函数短时平均幅度差函数能够代替自相关函数的原理是:如果信号是完全的周期信号(设周的原理是:如果信号是完全的周期信号(设周期为期为N Np p), ,则相距为周期的整数倍的样点上的则相距为周期的整数倍的样点上的幅值相等,差值为零:幅值相等,差值为零:d(n)=x(n)-x(n-k)=0d(n)=x(n)-x(n-k)=0KkkmxmxkFkNmnnn0| )()(|)(10 对于

34、周期性的对于周期性的x(n)x(n),F Fn n(k)(k)也呈周期性,也呈周期性,与与R Rn n(k(k) )相反的是在相反的是在R Rn n(k(k) )谷点时,对应谷点时,对应F Fn n(k)(k)是峰值。是峰值。0200400600800100012001400160018002000-1-0.500.51020040060080010001200140016001800200005001000150020002500周期为(周期为(629点)的正弦波点)的正弦波正弦波的平均幅度差函数波形正弦波的平均幅度差函数波形020040060080010001200140016001800

35、2000-3000-2000-10000100020003000020040060080010001200140016001800200005001000150020002500正弦波的自相关函数正弦波的自相关函数正弦波的平均幅度差函数正弦波的平均幅度差函数050100150200250300350400450-100-50050100050100150200250300350400450050100150200250300一帧浊音的的短时自相关函数一帧浊音的的短时自相关函数短时平均幅度差函数短时平均幅度差函数050100150200250300350400450-2-101230501001

36、5020025030035040045001020304050一帧清音的短时自相关函数一帧清音的短时自相关函数短时平均幅度差函数短时平均幅度差函数 浊音是一个准周期信号,在一帧语音内基音浊音是一个准周期信号,在一帧语音内基音周期近似恒定,因此,短时平均幅度差函数在周期近似恒定,因此,短时平均幅度差函数在浊浊音语音的基音周期上出现极小值,而在清音语音音语音的基音周期上出现极小值,而在清音语音中没有明显的极小值。中没有明显的极小值。短时平均幅度差函数和自相关函数的关系是:短时平均幅度差函数和自相关函数的关系是:0 . 16 . 0)()() 0()(2)(5 . 0kkRRkkFnnn 由于计算由

37、于计算AMDFAMDF函数只需要加、减和取绝对值函数只需要加、减和取绝对值运算,用硬件实现(定点运算,用硬件实现(定点DSPDSP系统)时,运算量较系统)时,运算量较之短时自相关函数大大下降,同时,之短时自相关函数大大下降,同时,AMDFAMDF函数在函数在基音周期的谷点比自相关函数的峰值更加尖锐,基音周期的谷点比自相关函数的峰值更加尖锐,错判率现对较少,稳健性更高。错判率现对较少,稳健性更高。4.5 短时时域处理技术应用举例短时时域处理技术应用举例1.语音段起止端点判别(起始点和终止点)语音段起止端点判别(起始点和终止点) 需解决的问题:需解决的问题:区分语音和噪声区分语音和噪声 采用的手段

38、:采用的手段:短时能量和短时平均过零率短时能量和短时平均过零率EnZnL L1 1L L2 2L L3 3C C A AB BD DE EF FL L1 1:ABAB段对应语音,语音的起止点在段对应语音,语音的起止点在ABAB之外。之外。L L2 2(背景噪声的平均能量)(背景噪声的平均能量):CDCD段对应语音段对应语音。L L3 3(背景噪声的平均过零率的(背景噪声的平均过零率的3 3至至5 5倍)倍): E: E对应对应语音的起点,语音的起点,F F对应语音的终点。对应语音的终点。2.2.基音周期的估计基音周期的估计 声道的共振峰特性对基音周期的估计造成干扰,声道的共振峰特性对基音周期的

39、估计造成干扰,这是因为语音信号包含丰富的谐波分量。基音频率的这是因为语音信号包含丰富的谐波分量。基音频率的范围分布在范围分布在5050450Hz450Hz左右。同时,第一共振峰通常左右。同时,第一共振峰通常在在2002001000Hz1000Hz的范围内,这样可能导致语音的谐波的范围内,这样可能导致语音的谐波分量高于基频分量,对基音周期的估计造成错误。分量高于基频分量,对基音周期的估计造成错误。 采用中心削波法:采用中心削波法: ( )( )( )( )( )0| ( )|x nTx nTy nx nTx nTx nT KkkmymykRkNmnnn0)()()(10Center-clippi

40、ng techniquey(n)y(n)T T-T-TT T-T-T 对中心削波后的信号求解短时自相关函数。为对中心削波后的信号求解短时自相关函数。为了简化运算量,改为三电平削波函数。了简化运算量,改为三电平削波函数。削波函数削波函数x(nx(n) )1-1y(n)y(n)x(nx(n) )T T-T-T050100150200250300350400450500-0.500.5050100150200250300350400450500-0.200.205010015020025030035040045050000.10.2用用 Hilbert envelop Hilbert envelop

41、 求解语音基音周期求解语音基音周期speechspeechExcitationExcitatione(ne(n) )HilbertHilbertenvelopenvelop 22( )( )( )hEh ne ne n4.6 中值滤波在语音短时时域中值滤波在语音短时时域处理中的应用处理中的应用1.语音基音周期轨迹语音基音周期轨迹 语音的基音周期随时间的变换规律语音的基音周期随时间的变换规律帧数帧数基音周期基音周期帧数帧数基音周期基音周期 无论采用哪一种基音检测算法都可能产生基音无论采用哪一种基音检测算法都可能产生基音检测错误,使求得的基音周期轨迹中有一个或几个检测错误,使求得的基音周期轨迹中有一个或几个基音周期估值偏离了正常轨迹,这种偏离点称为野基音周期估值偏离了正常轨迹,这种偏离点称为野点。点。 为了去除这些野点,可以采用各种平滑算法,其为了去除这些野点,可以采用各种平滑算法,其中最常用的是中值平滑算法和线性平滑算法。中最常用的是中值平滑算法和线性平滑算法。2.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论