![第2章语音信号常见特征提取_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-4/29/ecb135af-d9b4-46ad-a6e7-76175dc35d55/ecb135af-d9b4-46ad-a6e7-76175dc35d551.gif)
![第2章语音信号常见特征提取_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-4/29/ecb135af-d9b4-46ad-a6e7-76175dc35d55/ecb135af-d9b4-46ad-a6e7-76175dc35d552.gif)
![第2章语音信号常见特征提取_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-4/29/ecb135af-d9b4-46ad-a6e7-76175dc35d55/ecb135af-d9b4-46ad-a6e7-76175dc35d553.gif)
![第2章语音信号常见特征提取_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-4/29/ecb135af-d9b4-46ad-a6e7-76175dc35d55/ecb135af-d9b4-46ad-a6e7-76175dc35d554.gif)
![第2章语音信号常见特征提取_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-4/29/ecb135af-d9b4-46ad-a6e7-76175dc35d55/ecb135af-d9b4-46ad-a6e7-76175dc35d555.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第2 2章语音信号常见特征提取章语音信号常见特征提取1 1 第第2 2章语音信号常见特征提取章语音信号常见特征提取2 2 2.1 2.1 短时能量和平均幅度分析短时能量和平均幅度分析 原理:语音信号能量随时间有相当大的变化,特别是清音段 的能量一般比浊音段的小得多。 定义: 1、短时能量分析、短时能量分析 mm n nhnxmnhmxmnwmxE)()()()()()( 222 )()( 2 nwnh 第第2 2章语音信号常见特征提取章语音信号常见特征提取3 3 决定短时能量特性有两个条件:不同的窗口的形状决定短时能量特性有两个条件:不同的窗口的形状 和长度和长度。 矩形窗: 01nN w
2、n 1 ( )= 0其它 1 (1) 2 0 sin(2) () sin(2) N j Tj nTj T N n N T W eee T 第一个零点: 01 1 ss ffNNT 窗口形状: q窗长对分辨率的影响 窗长越长,频率分辨率越高,而时间分辨率越低 第第2 2章语音信号常见特征提取章语音信号常见特征提取4 4 海明窗: 0.540.46cos(2(1)01 ( ) 0 n NnN w n 其它 第一个零点: 01 22 ss ffNNT 矩形窗谱平滑性能好,但损失高频成分,波形细节 丢失,海明窗与之相反。 第第2 2章语音信号常见特征提取章语音信号常见特征提取5 5 N=51的直角窗的
3、直角窗 和海明窗的对数和海明窗的对数 幅频特性。海明幅频特性。海明 窗的第一个零值窗的第一个零值 频率位置比直角频率位置比直角 窗要大窗要大1倍左右,倍左右, 同时其带外衰减同时其带外衰减 也比直角窗大得也比直角窗大得 多。多。 第第2 2章语音信号常见特征提取章语音信号常见特征提取6 6 这里窗长的选择对于反映语音信号的幅度变化起着决定的作 用。如果很大,它等效于很窄的低通滤波器,此时随时间的 变化很小,不能反映语音信号的幅度变化,信号的变化细节 就看不出来;反之,窗长太小时,滤波器的通带变宽,随时 间有急剧的变化,不能得到平滑的能量函数。 窗口的长度: 标准:一帧内含有标准:一帧内含有17
4、个基音周期,个基音周期,10kHz取样下,取样下,N 取取100200点。点。 第第2 2章语音信号常见特征提取章语音信号常见特征提取7 7 Example Speech x(n): /What she said/ 第第2 2章语音信号常见特征提取章语音信号常见特征提取8 8 Short time energy of words “Do you like it Do you like it” 0123456 x 10 4 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 x 10 -3 05001000150020002500 -0.15 -0.1 -0.05 0 0.05 0.1
5、0.15 0.2 Time :ms Amplititude Waveform of wav file 第第2 2章语音信号常见特征提取章语音信号常见特征提取9 9 2、短时平均幅度分析、短时平均幅度分析 定义: 框图: 优点: 1、对高电平信号不如En敏感; 2、计算方法简单。 缺点:浊音和清音的区分不如En明显。 m n mnwmxM)()( 第第2 2章语音信号常见特征提取章语音信号常见特征提取1010 短时平均能量和短时平均幅度的主要用途:短时平均能量和短时平均幅度的主要用途: 可以区分清音段与浊音段:En值大的对应于浊音 段,而En值小的对应于清音段。En值的变化,可 大致判定浊音变为
6、清音或清音变为浊音的时刻。 可以用来区分声母与韵母的分界,无声与有声的 分界,连字(指字之间无间隙)的分界等。 作为一种超音段信息,用于语音识别中。 第第2 2章语音信号常见特征提取章语音信号常见特征提取1111 2.2 2.2 短时过零分析短时过零分析 定义:过零就是信号通过零值。 连续语音信号,考察其时域波形通过时间轴的情况; 离散时间信号,相邻的取样值改变符号则称为过零。 语音信号序列是宽带信号, 则不能简单用上面的 公式。 第第2 2章语音信号常见特征提取章语音信号常见特征提取1212 语音信号短时过零分析语音信号短时过零分析 定义: )()1(sgn)(sgn )()1(sgn)(s
7、gn nwmxmx mnwmxmxZ ww m n 0)(1 0)(1 )(sgn nx nx nx 其它 10 0 2/1 )( NnN nw 其中: 框图: 第第2 2章语音信号常见特征提取章语音信号常见特征提取1313 第第2 2章语音信号常见特征提取章语音信号常见特征提取1414 短时门限过零率 门限 3 门限 2 门限 1 门限 1 门限 2 门限 3 时间 )() 1(sgn)(sgn ) 1(sgn)(sgn mnwTmxTmx TmxTmxZ m n 第第2 2章语音信号常见特征提取章语音信号常见特征提取1515 短时过零分析的意义:短时过零分析的意义: 可以区分清音与浊音:浊
8、音时具有较低的平均过零数, 而清音时具有较高的平均过零数。 利用它可以从背景噪声中找出语音信号,可用于判断寂 静无语音和有语音的起点和终点位置。 在背景噪声较小时用平均能量识别较为有效,而在背景 噪声较大时用平均过零数识别较为有效。 第第2 2章语音信号常见特征提取章语音信号常见特征提取1616 无声:S 清音:U 浊音:V 浊音的短时平均幅度最大,过零率 最低 清音短时平均幅度居中,过零率最 高 无声的短时平均幅度最低,过零率 居中 第第2 2章语音信号常见特征提取章语音信号常见特征提取1717 2.3 2.3 短时相关分析短时相关分析 互相关可测定两个信号间的时间滞后或从杂音 中检测信号;
9、 自相关用于研究信号本身,如信号波形的同步 性、周期性等 。 第第2 2章语音信号常见特征提取章语音信号常见特征提取1818 q自相关函数 确定性离散信号 m kmsmskR)()()( 随机信号或周期性信号 N Nm N kmxmx N kR)()( 12 1 lim)( 第第2 2章语音信号常见特征提取章语音信号常见特征提取1919 q自相关函数的性质 1偶函数:)()(kRkR 2 k=0时函数取最大值,对于确定性信号其值 为能量。对于随机信号,其值为该信号的平均 功率。 3 如果原序列是周期为T的周期信号,那么自相 关函数也是周期为T的周期函数。 4 等于确定性信号的能量或随机性信号的
10、 平均功率。 (0)R 第第2 2章语音信号常见特征提取章语音信号常见特征提取2020 1 )()( )()()()()( kNn nm ww m n kmxmx kmnwkmxmnwmxkR 短时自相关函数:短时自相关函数: k是最大延时点数。 由于自相关函数是偶函数,所以上式可写成: ( )()( ) () () () nn m R kRkx m x mkw nm w nmk 第第2 2章语音信号常见特征提取章语音信号常见特征提取2121 如果定义: ( )( ) () k h nw n w nk 则上式可写为: ( ) ( ) ()() ( ) ()( ) nk m k R kx m x
11、 mk h nm x n x nkh n 所以,短时自相关函数可看作序列 通过单位样值响应为 的数字滤波器的输出。 ( ) ()x n x nk ( ) k h n 意义:可用自相关函数求意义:可用自相关函数求 基音周期;在进行语音信基音周期;在进行语音信 号的线性预测分析时,也号的线性预测分析时,也 要用到自相关函数。要用到自相关函数。 第第2 2章语音信号常见特征提取章语音信号常见特征提取2222 短时自相关分析在语音识别中可有下面两个方面的应用: 用来区分清音和浊音,因为浊音信号是准周期性的,对浊 音语音可以用自相关函数求出语音波形序列的基音周期; 另外在进行语音信号的线性预测分析时,也
12、要用到短时自 相关函数。 第第2 2章语音信号常见特征提取章语音信号常见特征提取2323 N=401时对时对8kHz取取 样的语音计算得到样的语音计算得到 的图,计算滞后的图,计算滞后k 大于大于0而小于而小于250时时 的自相关值。前两的自相关值。前两 种情况是对浊音语种情况是对浊音语 音段,第三种情况音段,第三种情况 是对清音语音段。是对清音语音段。 63/8000=7.78m s 51/8000=6.38ms 第第2 2章语音信号常见特征提取章语音信号常见特征提取2424 修正的短时自相关函数:修正的短时自相关函数: 由于基音周期的范围很宽,所以应使窗宽匹配于预期的基音 周期。长基音周期
13、用窄的窗,将得不到预期的基音周期;而 短基音周期用宽的窗,自相关函数将对许多个基音周期作平 均计算,这是不必要的。为此可采用自适应于基音周期的窗 口长度法,可用“修正的短时自相关函数”来代替短时自相 关函数。 m n kmnwkmxmnwmxkR)()()()()( 21 或 m n kmwkmnxmwmnxkR)()()()()( 21 第第2 2章语音信号常见特征提取章语音信号常见特征提取2525 其他, 0 10, 1 )( 1 Nm mw 其他, 0 10, 1 )( 2 kNm mw 矩形窗时: 1 0 )0()()()( N m n KkkmnxmnxkR 这里K是最大的延迟点数。
14、 第第2 2章语音信号常见特征提取章语音信号常见特征提取2626 修正的自相关函数 加矩形 窗 第第2 2章语音信号常见特征提取章语音信号常见特征提取2727 2.4 短时平均幅度差函数短时平均幅度差函数 定义如下: 如果信号是周期的,周期为N,则相距为周期的整数倍的样点上的幅 值是相等的。 ( )( )(),0, 2d nx nx nk kNN 实际语音信号 不为零,但值很小,这些极小置出 现在整数倍周期位置上。 ( )d n 1 12 0 ( )( )()() Nk n m F ks(n+m)w ms nmk w mk 第第2 2章语音信号常见特征提取章语音信号常见特征提取2828 N=4
15、01时对时对8kHz取取 样的语音计算得到样的语音计算得到 的图,计算滞后的图,计算滞后k 大于大于0而小于而小于250时时 的短时平均幅度差的短时平均幅度差 值。前两种情况是值。前两种情况是 对浊音语音段,第对浊音语音段,第 三种情况是对清音三种情况是对清音 语音段。语音段。 63/8000=7.78m s 51/8000=6.38ms 第第2 2章语音信号常见特征提取章语音信号常见特征提取2929 2/1 )()0()( 2 )(kRRk R kF nnn 短时自相关函数和短时平均幅度差函数的关系: 短时平均幅度差计算加、减法和和取绝对值的运算,与自 相关函数的相加与相乘的运算相比,其运算
16、量大大减小, 尤其在硬件实现语音信号分析时有很大好处。为此, AMDF已被用在许多实时语音处理系统中。 第第2 2章语音信号常见特征提取章语音信号常见特征提取3030 2.5 2.5 短时傅里叶变换短时傅里叶变换 m jwmjw n emnwmxeX)()()( 1. 短时傅里叶变换的定义:短时傅里叶变换的定义: n 短时傅里叶变换有两个自变量:短时傅里叶变换有两个自变量: 和和 ; 所以它既是关于时间所以它既是关于时间 的离散函数,又是关于角的离散函数,又是关于角 频频 率的连续函数。率的连续函数。 n 第第2 2章语音信号常见特征提取章语音信号常见特征提取3131 令令 ,则得离散的短时傅
17、里叶,则得离散的短时傅里叶 变换变换 : 两个公式都有两种解释:两个公式都有两种解释:当当n固定不变时,固定不变时, 它们是序列它们是序列w(n-m)x(m)的标准傅里叶变换或标准的的标准傅里叶变换或标准的 离散傅里叶变换。此时离散傅里叶变换。此时 与标准傅里叶与标准傅里叶 变换具有相同的性质,而变换具有相同的性质,而 与标准与标准 的离散傅里叶变换具有相同的特性。的离散傅里叶变换具有相同的特性。当当w或或k固定固定 时,时, 和和 看作是时间看作是时间n的函数。的函数。 它们是信号序列和窗口函数序列的卷积,此时窗口的它们是信号序列和窗口函数序列的卷积,此时窗口的 作用相当于一个滤波器。作用相
18、当于一个滤波器。 Nkw2 )( jw n eX )(kX n )( jw n eX )(kX n 22 ()( )( ) ()(01) kkm jj NN nn m XeXkx m w nm ekN 第第2 2章语音信号常见特征提取章语音信号常见特征提取3232 2. 标准傅里叶的解释标准傅里叶的解释 此时,短时傅里叶变换为:此时,短时傅里叶变换为: m jwmjw n emnwmxeX)()()( 第第2 2章语音信号常见特征提取章语音信号常见特征提取3333 根据功率谱的定义,短时功率谱和短时傅里叶变换之间的 关系为: *2 ()()()() jjjj nnnn S eXeXeXe 短时
19、功率谱是短时自相关函数的傅里叶变换: ( )() ( ) () () n m R kw nm x m w nkm x mk 第第2 2章语音信号常见特征提取章语音信号常见特征提取3434 短时傅里叶变换为另一种形式:短时傅里叶变换为另一种形式: 可得到可得到 第第2 2章语音信号常见特征提取章语音信号常见特征提取3535 窗口序列的作用窗口序列的作用 窗函数应具有如下特性:窗函数应具有如下特性: 频率分辨率高,即主瓣狭窄、尖锐;频率分辨率高,即主瓣狭窄、尖锐; 通过卷积,在其他频率成分产生的频谱泄漏少通过卷积,在其他频率成分产生的频谱泄漏少 ,即旁瓣衰减大。,即旁瓣衰减大。 这两个要求实际上相
20、互矛盾,不能同时满足。这两个要求实际上相互矛盾,不能同时满足。 主瓣宽度与窗口宽度成反比。主瓣宽度与窗口宽度成反比。 () j W e 第第2 2章语音信号常见特征提取章语音信号常见特征提取3636 1 ss TfNf采样周期、窗口长度 和频率分辨率之间存在如下关系: 1 s f NT 可见,采样周期一定时,可见,采样周期一定时, 随窗口宽度随窗口宽度 的增加而减小,的增加而减小, 即频率分辨率相应得到提高,但同时时间分辨率降低;如果即频率分辨率相应得到提高,但同时时间分辨率降低;如果 窗口取短,频率分辨率下降,而时间分辨率提高,因而二者窗口取短,频率分辨率下降,而时间分辨率提高,因而二者 是
21、矛盾的。是矛盾的。 f N 第第2 2章语音信号常见特征提取章语音信号常见特征提取3737 N500时海明窗与直角窗的浊音谱分析 第第2 2章语音信号常见特征提取章语音信号常见特征提取3838 N50时海明窗与直角窗的浊音谱分析 第第2 2章语音信号常见特征提取章语音信号常见特征提取3939 短时傅里叶变换的滤波器解释:短时傅里叶变换的滤波器解释: () () ( ) ()()( )( ) n jjj mj nnnn m Xex m ew nmXeeajb 令令 mnm 令:令: 则:则: 则得:则得: 第第2 2章语音信号常见特征提取章语音信号常见特征提取4040 第第2 2章语音信号常见特
22、征提取章语音信号常见特征提取4141 端点检测: 端点检测是指从包含语音的一段信号中确定出语音的开始和终止点。 有效的端点检测不仅能使处理时间减到最小,而且能去除无声段的噪声 干扰,从而使识别系统具有良好的识别性能。 一个较好的端点检测算法应该能够满足: 门限值可以对背景噪声的变化有一定的适应; 能够将短时冲激噪声和超过门限值的信号纳入无声段而不是有声段; 对于爆破音的寂静段,应将其纳入语音的范围而不是无声段; 应该尽量避免在检测中丢失鼻韵和弱摩擦音等与噪声特性相似、短 时参数较少的语音; 第第2 2章语音信号常见特征提取章语音信号常见特征提取4242 端点检测方法分类: 基于阀值的方法: 提
23、取每一帧语音信号的声学特征,然后把这些特征的幅值与设 定的阀值进行比较,从而对每一语音帧进行分类; 模式识别的方法: 需要估计语音和噪声信号的模型参数,检测过程和识别过程 类似。 由于基于阀值的方法具有简单、快速的优点,从而被广泛研究和使 用,但在噪声环境下该方法检测效果会变得很差。 基于模式识别的方法具有准确性好、稳健性较强的特点,但缺点是 此类方法的复杂度高,运算量大,很难应用到实时语音编码系统中。 第第2 2章语音信号常见特征提取章语音信号常见特征提取4343 传统的端点检测算法 1. 基于能量的端点检测 语音和噪音的主要区别在它们的能量上,语音段的能量比噪音 段的大,语音段的能量是噪音
24、段能量叠加语音声波能量的和。传统端点 检测算法认为,如果环境噪声和系统环境噪声比较小,能够保证系统的 信噪比较高,那么只要计算输入信号的短时能量或短时平均幅度就能把 语音段和噪声背景区分开。 实际中信噪比较低。 第第2 2章语音信号常见特征提取章语音信号常见特征提取4444 2、低频能量 基本原理:语音中的浊音信号具有能量集中在低频部分的 特征,根据这一特点,改进短时能量阀值可以得到低频 能量,判断浊音信号,效果较好。 第第2 2章语音信号常见特征提取章语音信号常见特征提取4545 低频能量的判别公式为: ( ) lcl E n 1 2 0 1 ( )10log10( ) N ll i E n
25、x i N 其中 cl 表示预先设定的低频能量阀值,这个阀值可以 通过估算背景噪声的低频能量来预先设定或者由一段较长时 间的无声片断计算得来。 阀值的比较仅在低频段进行,显著降低了高频部分噪声能量的干 扰,在信噪比较差的情况下,低频能量法仍然能够较为准确的判 断浊音信号。 第第2 2章语音信号常见特征提取章语音信号常见特征提取4646 3.双门限前端检测法 利用短时过零率来检测清音,用短时能量来检测浊音利用短时过零率来检测清音,用短时能量来检测浊音 。 双门限法是考虑到语音开始以后总会出现能量较大的浊音,双门限法是考虑到语音开始以后总会出现能量较大的浊音, 设一个较高的门限用以确定语音已开始,
26、再取一比稍低的门限,用设一个较高的门限用以确定语音已开始,再取一比稍低的门限,用 以确定真正的起止点及结束点。判断清音与无话的差别,是采用另以确定真正的起止点及结束点。判断清音与无话的差别,是采用另 一个较低的门限,求越过该门限的一个较低的门限,求越过该门限的“过零率过零率”。只要取得合适,通。只要取得合适,通 常背景噪声的低门限过零率将明显低于语音的低门限过零率值。这常背景噪声的低门限过零率将明显低于语音的低门限过零率值。这 种方法普遍地用于有话、无话鉴别或词语前端检测。种方法普遍地用于有话、无话鉴别或词语前端检测。 第第2 2章语音信号常见特征提取章语音信号常见特征提取4747 3.基于噪
27、声动态检测的语音端点检测算法 预处理提取语音 计算语音信号短时能量 和带门限短时过零率 计算门限值 输入语音 背景噪声 有效语音 第第2 2章语音信号常见特征提取章语音信号常见特征提取4848 仿真实验及结果分析 图图1 “1 “制约制约”在零噪声时的在零噪声时的 检测结果检测结果 图图2 “2 “”在加入少量噪声时在加入少量噪声时 的检测结果的检测结果 图图3“3“”在噪声加大时在噪声加大时 的检测结果的检测结果 图图4 “4 “”在噪声进一步加大时在噪声进一步加大时 的检测结果的检测结果 第第2 2章语音信号常见特征提取章语音信号常见特征提取4949 4. 基于小波变换的语音端点检测算法
28、依据:小波系数可以反映语音信号在各个子带内沿时间轴的能量分布, 通过处理又可以捕捉到语音段的边界,因此可以利用小波变换来对语音 信号进行端点检测,以达到区分语音段和非语音段的目的。 第第2 2章语音信号常见特征提取章语音信号常见特征提取5050 步骤:步骤: 1) 先将语音信号分成由先将语音信号分成由1024个采样点组成的帧;个采样点组成的帧; 2) 对每帧进行对每帧进行10层小波分解;层小波分解; 3) 计算所选两个子带计算所选两个子带(子带子带4和子带和子带5)的小波系数;的小波系数; 4) 计算两个子带的互相关系数;计算两个子带的互相关系数; 5) 通过帧间平滑连接所有互相关系数成为一个
29、和原信号长度相通过帧间平滑连接所有互相关系数成为一个和原信号长度相 同的序列;同的序列; 6) 计算序列前计算序列前220个点个点(20ms)的最大值,把此最大值作为阈值;的最大值,把此最大值作为阈值; 7) 比较序列中各个点的值。若小于阈值,则记为静音;若大于比较序列中各个点的值。若小于阈值,则记为静音;若大于 阈值,则记为语音;阈值,则记为语音; 8) 按照上述过程对语音信号进行标记,再滤掉个别误判点,完按照上述过程对语音信号进行标记,再滤掉个别误判点,完 成语音信号的端点检测。成语音信号的端点检测。 第第2 2章语音信号常见特征提取章语音信号常见特征提取5151 5. 基于循环神经网络的
30、语音端点检测算法基于循环神经网络的语音端点检测算法 原理:选用一个三层的原理:选用一个三层的RNN,且隐层的输出全,且隐层的输出全 部反馈到输入层。输入的采样语音信号被分成三种模式:浊音部反馈到输入层。输入的采样语音信号被分成三种模式:浊音 (U)、清音()、清音(V)、和背景噪声()、和背景噪声(N)。选用的)。选用的RNN神经网络神经网络 输出层有三个节点,对应输出的三种模式。输出层有三个节点,对应输出的三种模式。 第第2 2章语音信号常见特征提取章语音信号常见特征提取5252 循环神经网络的结构 第第2 2章语音信号常见特征提取章语音信号常见特征提取5353 3)仿真实验与结果分析)仿真
31、实验与结果分析 针对白噪声和汽车噪声环境对数字针对白噪声和汽车噪声环境对数字09的语音数据的语音数据 进行实验,用来做测试的语音文件每组进行实验,用来做测试的语音文件每组50个,包括男生和个,包括男生和 女生发音,含有汽车噪声的语音信号平均信噪比女生发音,含有汽车噪声的语音信号平均信噪比10dB和和 5dB,分别模拟汽车中速和高速行驶环境下的录音。,分别模拟汽车中速和高速行驶环境下的录音。 第第2 2章语音信号常见特征提取章语音信号常见特征提取5454 实验室背景下基于能量和过零率的端点检测结果 第第2 2章语音信号常见特征提取章语音信号常见特征提取5555 信噪比15dB时基于能量和过零率的
32、检测结果 第第2 2章语音信号常见特征提取章语音信号常见特征提取5656 信噪比15dB时基于小波变换的端点检测结果 第第2 2章语音信号常见特征提取章语音信号常见特征提取5757 信噪比5dB时基于小波变换的端点检测结果 第第2 2章语音信号常见特征提取章语音信号常见特征提取5858 信噪比5dB时基于循环神经网络小波变换的端点检测结果 第第2 2章语音信号常见特征提取章语音信号常见特征提取5959 ()p A S ()p B N ( )p A ()p A S ()p B N ( )p A ()p A S ()p B N ( )p A 方法方法测度测度 白噪声白噪声/dB汽车噪声汽车噪声/d
33、B 0515510 Energy 0.620.750.800.720.78 0.530.610.780.590.69 0.590.720.780.680.75 Wavelet 0.850.900.990.870.90 0.700.820.980.770.80 0.810.880.990.840.87 RNN 0.900.951.000.910.92 0.750.880.980.820.85 0.860.920.990.880.92 噪声情况下各种语音端点检测方法比较 第第2 2章语音信号常见特征提取章语音信号常见特征提取6060 基于能量和过零率的端点检测方法在实验室环境下可以获得较好 的端点
34、检测结果,随着信噪比的降低该方法检测的准确率将随之下降, 基于小波变换和基于循环神经网络的端点检测方法对于噪声具有一定的 鲁棒性,但是随着噪声的明显增大,小波变换的方法得到的检测结果仍 然有所下降,与之相比基于循环神经网络的方法的鲁棒性要优于基于小 波变换的方法,具有很大的优越性和实用性。 结果分析:结果分析: 第第2 2章语音信号常见特征提取章语音信号常见特征提取6161 2.6 2.6 语音信号的倒谱分析语音信号的倒谱分析 求语音倒谱特征参数,通过同态处理来实现。求语音倒谱特征参数,通过同态处理来实现。 同态处理(同态滤波):解卷,将卷积关系变为求和处理。同态处理(同态滤波):解卷,将卷积
35、关系变为求和处理。 将语音信号的声门激励和声道响应分离开。将语音信号的声门激励和声道响应分离开。 第第2 2章语音信号常见特征提取章语音信号常见特征提取6262 同态信号处理的基本原理同态信号处理的基本原理 信号分类:加性信号、乘积性信号、卷积性信号等。 同态信号处理目的:将非线性问题转化为线性问题来 处理。 同态信号处理分类:乘积同态处理和卷积同态处理两 种。 第第2 2章语音信号常见特征提取章语音信号常见特征提取6363 D* L(.) D*-1 x(n) y(n) x(n) y(n) q特征系统 D* q反特征系统 D*-1:它是特征系统的反运算 X(z) Z(.) log(.) Z-1
36、(.) x(n) X(z) x(n) Z(.) exp(.) Z-1(.) y(n) Y(z) y(n) Y(z) 卷积同态系统: 第第2 2章语音信号常见特征提取章语音信号常见特征提取6464 X(z) Z(.) log(.) Z-1(.) x(n) X(z) x(n) q特征系统 D* 12 12 1212 11 1212 ( )( )*( ) ( )( )( )( ) ln( )ln( )ln( )( )( )( ) ( )( )( )( )( )( ) x nx nx n Z x nX zXz Xz X zXzXzXzXzX z ZX zZXzXzx nx nx n 第第2 2章语音信
37、号常见特征提取章语音信号常见特征提取6565 Z(.) exp(.) Z-1(.) y(n) Y(z) y(n) Y(z) 反特征系统 D*-1: 12 1212 12 1 1212 ( )( )( ) ( )( )( )( )( )( ) exp ( )( )( )( ) ( ) ( )( )( )*( ) y ny ny n Z y nY zZ y ny nY zY z Y zY zY z Y z y nZY z Y zy ny n 第第2 2章语音信号常见特征提取章语音信号常见特征提取6666 复倒谱和倒谱 是一个时域序列,我们是一个时域序列,我们 称是称是x(n)的的“复倒频复倒频 谱
38、谱”,简称为,简称为“复倒谱复倒谱”,有时也称作对数复倒谱。,有时也称作对数复倒谱。 所处的离散时域,称之为所处的离散时域,称之为“复倒谱域复倒谱域”。这样,特征系统。这样,特征系统D* 将离散时域中的卷积运算转换为复倒谱域中的加性运算。进将离散时域中的卷积运算转换为复倒谱域中的加性运算。进 行同态信号处理后,即可完成解卷的任务。若时域中行同态信号处理后,即可完成解卷的任务。若时域中 有有 , 则 复 倒 谱 域, 则 复 倒 谱 域 中中 。假设。假设 位于复倒谱域中不同的间隔内并且互不交替,那么适当地设位于复倒谱域中不同的间隔内并且互不交替,那么适当地设 计线性系统,便可将计线性系统,便可
39、将x1(n)或或x2(n)分离出来。分离出来。 )( nx )( nx ) ( ) ( nynx、 )()()( 21 nxnxnx )()( 21 nxnx、)()() ( 21 nxnxnx 第第2 2章语音信号常见特征提取章语音信号常见特征提取6767 q特征系统 D* 1 ( )() ( ( ) ) () ln() j jj j F x nX x nFX e e X eX e 1 () ( ) ()exp () ( ) () j jj j Y eF y n Y eY e y nFY e () j X e 只考虑的实部: arg() ()() ()ln ()ln()arg () j jj
40、jX e jjjj X eX ee X eX eX ejX e q反特征系统D*-1 1 c( )ln() j nFX e c(n)是序列是序列x(n)对数幅度谱的傅里叶逆变换,对数幅度谱的傅里叶逆变换,c(n)称为称为“倒倒 频谱频谱”或简称为或简称为“倒谱倒谱”,有时也称,有时也称“对数倒频谱对数倒频谱”。 第第2 2章语音信号常见特征提取章语音信号常见特征提取6868 复倒谱和倒谱的特点和关系: 1.复倒谱要进行复对数运算,倒谱只进行实对数运算。 2.倒谱情况下,一个序列经过正反两个特征系统以后不能还 原成自身,因为丢失相位信息。 121212 12 3.( )( )( )( )( )(
41、 )*( ) ( )( )( )( )( ) c nc nx nx nx nx nx n c nc nc nc nx n 若和分别是和的倒谱,且, 则,是的倒谱。 4.已知一个实序列的复倒谱,可以求其倒谱。 5.已知倒谱,可以求复倒谱。 第第2 2章语音信号常见特征提取章语音信号常见特征提取6969 语音信号的复倒谱语音信号的复倒谱 语音信号可看作是声门激励信号和声道冲激响 应序列的卷积。 1 声门激励信号 发浊音时,声门激励是以基音周期为周期的冲激发浊音时,声门激励是以基音周期为周期的冲激 序列:序列: 0 ( )() M rp r x nanrN 第第2 2章语音信号常见特征提取章语音信号
42、常见特征提取7070 得到复倒谱:得到复倒谱: ( )x nz对进行 变换: 0 1 0 00 1 0 1 ( )( ) 1 1() p pp p M rN n r nr NMN M M N r r X zx n za z aa azz aa aa z 0 1 rr aaa式中 对上式取对数并按泰勒级数展开: 1 0 1 0 11 ( )ln( )lnln1() ln() p p M N r r k M N k r rk X zX zaa z a az k p N r za 第第2 2章语音信号常见特征提取章语音信号常见特征提取7171 z逆 变换: 0 11 ( )ln( ) () k M
43、r p rk a x nannkN k 或: 0 1 1 ( )ln( ) () 1 kp k M k kr r x nanBnkN Ba k 一个周期冲激的有限长度序列,其一个周期冲激的有限长度序列,其 复倒谱也是一个周期冲激序列,而复倒谱也是一个周期冲激序列,而 且长度不变,只是序列变为无限长且长度不变,只是序列变为无限长 度序列。同时其振幅随着度序列。同时其振幅随着k值的增值的增 大而衰减。大而衰减。 第第2 2章语音信号常见特征提取章语音信号常见特征提取7272 2 2 声道冲激响应序列声道冲激响应序列 如果用最严格如果用最严格(也是最普遍的也是最普遍的)极零模型来描述声道冲激响应,极零模型来描述声道
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 苏教版二年级下册数学口算练习题
- 视频会议系统合同范本
- 网络布线及设备采购合同范本
- 安全协议书范本及员工责任书
- 沪科版数学九年级上册22.3《相似三角形的性质》听评课记录1
- 二零二五年度校园消毒防疫应急预案合同
- 北师大版历史七年级上册第19课《北方的民族汇聚》听课评课记录
- 2025年子女抚养权变更法律援助与协议书模板
- 2025年度医疗事故快速调解专项协议
- 二零二五年度仓储物流租赁合同电子版模板即点即用
- T∕CMATB 9002-2021 儿童肉类制品通用要求
- 工序劳务分包管理课件
- 暖通空调(陆亚俊编)课件
- 工艺评审报告
- 中国滑雪运动安全规范
- 毕业论文-基于51单片机的智能LED照明灯的设计
- 酒厂食品召回制度
- DG-TJ 08-2343-2020 大型物流建筑消防设计标准
- 中职数学基础模块上册第一章《集合》单元检测试习题及参考答案
- 化学鲁科版必修一期末复习98页PPT课件
- 《农产品质量安全检测》PPT课件
评论
0/150
提交评论