基于动静态特征参数的语音信号识别_第1页
基于动静态特征参数的语音信号识别_第2页
基于动静态特征参数的语音信号识别_第3页
基于动静态特征参数的语音信号识别_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于动静态特征参数的语音信号识别

1抗噪性能分析mfc是目前语言识别中最常用的特征参数。这是基于人耳听力特性的特征参数。与其他特征参数相比,它反映了更好的性能,并能在无噪声的情况下获得较高的识别率。但是,随着环境噪声的恶化或者识别词汇量的增大,这种参数的识别性能急剧下降,说明这种特征不适合强噪声环境和大词汇量识别。近年来,小波变换被广泛应用于数据压缩和编码。在语音识别中,小波变换没有成为主流的方法,是因为小波系数不能直接作为特征参数参与识别。本文在MFCC特征参数的基础上引入小波技术,分析了一种抗噪性强的特征参数。由于小波变换的局部化性质,它可以使语音信号在很小的分析帧长下仍具有较好的频谱分辨率,这一点应用在语音识别系统的特征提取中,可以增强对辅音区的识别.因此,以这种特征参数作为隐马尔可夫识别网络的输入,得出了较好的识别结果。2mfcc的参数基于声道全极点模型的LPC倒谱系数(LPCC)在语音识别中具有广泛的应用,但它对噪声特别敏感。人耳能够从嘈杂的背景噪声中听到语音信号,这是因为人耳基底膜对外来信号会产生调节作用,对不同的频率,在相应的临界带宽内的信号会引起基底膜上不同位置的振动。由此可用带通滤波器组来模仿人耳听觉。以往研究表明,基于符合人耳听觉的MeI频率尺度提取出的倒谱系数MFCC比LPCC具有更好的识别性能。许多实验表明,大部分情况下,MFCC优于其他倒谱系数,是一种鲁棒性较好的参数,能够有效地提高系统的性能,因此成为目前最为流行的语音特征参数。MFCC参数计算的要点是将线性功率谱转换成Mel频率下的功率谱,在计算之前需要在语音的频谱范围内设置若干个带通滤波器Hm(n),m=0,…,M-1;n=0,…,N/2。M为滤波器个数,N为一帧语音信号的点数。每个滤波器具有三角形特性,其中心频率为fm,它们在Mel频率轴上是均匀分布的。在线性频率上,当m较小时相邻的fm间隔很小,随着m的增加相邻的fm间隔逐渐拉开。Mel三角滤波器的分布图如图1所示。MFCC参数提取的过程见图1,其中Mel滤波器组的作用是利用人耳听觉特性对语音信号的幅度平方谱进行平滑。对数操作的用途:压缩语音谱的动态范围;考虑乘性噪声,将频域中的乘性成分转换成加性成分。离散余弦变化主要用来对不同频段的频谱成份进行解相关处理,使得各维向量之间相互独立。3新特征参数dwptmfcc提取原理3.1mfcc参数的提取现代小波变换被称为数学的显微镜,它通过有限个基函数在尺度-频率域上对信号进行分析,在控制分辨率的同时,保留了时域信息,因此在时变信号的处理上受到了极大关注。并且小波变换在各分析频段的恒Q(品质因数)特性与人耳听觉对信号的加工特点相一致,这一良好的特性为利用小波变换提取语音特征参数奠定了基础。小波变换中的多分辨分析其最终目的是力求构造一个在频率上高度逼近L2(R)空间的正交小波基,这些频率和分辨率不同的正交小波基相当于带宽各异的带通滤波器。小波包分析就是在多分辨分析的基础上,对高频信号部分进一步分解,根据被分析信号的特性,从而提取感兴趣频带的信息,为信号提供了一种更为精细的分析方法。MFCC参数提取过程是把信号的频谱通过一系列的带通滤波器,求得每个滤波器输出的对数能量,再进行DCT变换得到的。从滤波器的角度看,小波包分析就是信号通过一系列不同频带范围的带通滤波器,从而获得信号在各频带内的信息。MEL滤波器组与小波包分析的作用在某种意义上可以互换,一种很自然的想法就是用小波包分析来代替FFT与MEL滤波器组,然后再进行DCT变换,从而得到一组语音特征参数DWPTMFCC(DiscreteWaveletPacketTransformMel-FrequencyCepstralCoefficient)。该参数的提取计算过程如图2所示。图4是小波包变换的频带划分技术示意图,其中s0为原始信号,其Nyquist截止频率为fHz。在小波包中任意选取一组可组成L2(R)的正交基,对信号进行分解,可以根据信号的频带分布特点,灵活地选择分解方式。例如,若选择分解到AAA3、DAA3、DA2和D1时,可得到与小波的多分辨率分析一致的结果,分别得到频带[0ue0a8f8]、[f8ue0a8f4]、[f4ue0a8f2]、[f2ue0a8f]上的信息;而当进行完全三层分解时,则可分别得到频带[0ue0a8f8]、[f8ue0a8f4]、[f4ue0a83f8]、[3f8ue0a8f2]、[f2ue0a85f8]、[5f8ue0a83f4]、[3f4ue0a87f8]、[7f8ue0a8f]上的信息。对语音信号的采样频率为11025Hz,即最高语音频率约为5500Hz,根据临界带的划分与Mel滤波器组在频带上的分布,选取24个小波包分析节点频带进行6层小波包分解。小波包分解树中节点及其频带的选取如表1所示。3.2实验结果及分析DWPTMFCC的提取计算过程如下:(1)对输入的语音信号进行预处理。预加重:用以提升高频部分,使信号的频谱变得平坦。预加重通常使用一阶数字滤波器实现,即式中,μ的典型值为0.94。分帧、加窗:这里的分帧是为了提高特征参数提取的精度,而不是为了满足平稳假设的条件。端点检测(短时能量与过零率):去除静音段,提取有用帧,减少计算量。(2)对各帧信号进行小波包分解,得到各子带系数WPXkue0a8m,其中WPXkue0a8m为第k个子带的第m个小波系数。本文选择dB1小波进行小波包分解。(3)计算所选节点频带内信号的对数能量:其中:k为子带序号;Nk为第k个子带中小波包分解系数的个数;K所选频带的数目,在本文的实验中,K=24。(4)将上述Sk经DCT得到新的特征参数WPDC。其中P是DWPTMFCC的维数。3.3阶dwptmfcc差分参数标准的DWPTMFCC参数只反映了语音参数的静态特性,而人耳对语音的动态特征更为敏感,通常用差分倒谱参数来描述这种动态特性,差分参数采用式(5)来计算。其中c和d都表示一帧语音参数,k为常数,通常取2,此时差分参数就称为当前帧的前两帧和后两帧的线性组合。由式(5)计算得到的差分参数为一阶DWPTMFCC差分参数,用同样的公式对一阶差分参数进行计算,就可以得到二阶DWPTMFCC差分参数。在实际的使用时,通常将WPMFCC参数和它的各阶差分参数合并为一个矢量,作为一帧语音信号的特征参数。4试验结果与分析4.1新参数与mfcc特征参数的比较实验中,对同样的语音”开始”提取DWPTMFWC参数,图中的坐标轴分别表示MFCC参数的阶数、语音分析的帧数和对应的MFCC参数值。通过与MFCC参数比较发现,新参数反映的形状更加接近,特征更加相似,在4,5,6,7,8,9,10等阶都有很好的相似性,而MFCC特征参数虽然也有不少的相似点,但是相对而言变化差异较大。另外,小波处理的参数分布更稀疏,这是由于小波包分析在多分辨分析的基础上,对高频信号部分进一步分解,但加大了算法复杂度。通过特征提取,训练,到识别,发现基于DWPTMFCC特征参数的语音识别系统更能反映人耳的听觉特性,对系统的识别率比基于MFCC参数的识别率要高。4.2实验结果与分析实验操作系统为WindowsXP,仿真平台采用Matlab7.1软件,声音录入设备使用Windows自带的录音机。语音信号的采样频率为11.025kHz,帧长N=256点,帧移M=128点。由于每个词的语音波形文件长度各不相同,所以为了处理方便,将提取的特征参数进行时间归一化处理,即每个单词的每一次发音最后得到统一的12维的语音特征矢量序列,作为HMM网络的输入。实验系统以非特定人,孤立词语音为识别对象。系统的词表为10词,每词采集48次发音,共16人,每人发音3次,其中9人的发音作为训练集,其余7人的发音作为测试集。语音的添加噪音为高斯白噪声,信噪比从clean到15dB四种情况。表2是仿真实验结果。从表2可以看出:(1)在相对安静的环境下,MFCC和DWPTMFCC的识别率比较接近,看整个结果,对于表2中的每个识别率,WPMFCC特征较MFCC特征都有更优的结果;(2)从右到左看结果,随信噪比变小,MFCC特征的识别率有较大的下降,尤其是在低信噪比情况下,因此,DWPTMFCC特征较MFCC特征有更强的鲁棒性;在有一定噪声干扰的环境下,DWPTMFCC的识别率高于MFCC,说明用小波包提取的特征参数具有一定的抗噪声能力;(3)从计算量上来讲,用小波包分析代替了FFT变换与MEL滤波器组的设计,因此新的参数的计算量与MFCC相当。在此选取新参数与MFCC都是12维的参数,因此最终两者的存储量是相同的。实验表明,DWPTMFCC特征较MFCC特征有更强的噪声鲁

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论