行车噪声环境下基于人耳频率选择特性的声学特征提取方法_第1页
行车噪声环境下基于人耳频率选择特性的声学特征提取方法_第2页
行车噪声环境下基于人耳频率选择特性的声学特征提取方法_第3页
行车噪声环境下基于人耳频率选择特性的声学特征提取方法_第4页
行车噪声环境下基于人耳频率选择特性的声学特征提取方法_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、行车噪声环境下基于人耳频率选择特性的声学特征提取方法行车噪声环境下基于人耳频率选择特性的声学特征提取方法引言声学事件检测AustiEventDetetin,AED就是检测当前环境中发生的特定目的声学事件,然后把检测出的声学事件转换为人类或者智能设备可以理解的信号,为人类或者智能设备的决策提供信息。在声学事件检测研究中,研究者们做出了大量的奉献。目前研究主要聚焦在提取合适检测任务要求的声学特征表示和声学事件的分类算法方面。在声学特征方面,研究者们尝试了各种声学特征,如:梅尔倒谱系数el-frequenyepstraleffiients,F1、线性预测倒谱系数Linearpreditinepstr

2、aleffiients,LP2、基频Pith3、频谱质心Spetralentrid4等。在声学事件的分类方法中,研究者们也尝试了各种不同的方法,包括基于支持向量机SupprtVetrahine,SV方法、隐马尔科夫模型Hiddenarkvdel,H方法、人工神经网络ArtifiialNeuralNetrk,ANN方法等。近几年来,SV方法5和H方法6成为最主流的声学事件分类方法。在本文的研究工作中,将会尝试在行车噪声环境下,检测车辆周边发生的各种目的声学事件。由于行车中的声学环境较为复杂,当车辆行驶速度较快或者路况较差等情况存在时,噪声频谱污染就较为严重,传统的声学特征,例如:F在中高频局部的

3、滤波器分布较为稀疏且处此滤波环境下,而中高频局部噪声较强时,目的声学事件的检出率即会显著下降。对强噪问题,研究者们通常采用降噪形式来增强目的声音信号的方法,如:高斯模型假设下的维纳滤波增强算法7、基于听觉掩蔽效应的增强算法8、谱减法9等。综合评析可知,基于高斯模型的滤波方法计算复杂度较高;基于听觉掩蔽效应的语音增强算法那么不能充分地模拟人耳对于声音的感知;而在降噪中普遍使用的谱减法却存在音乐噪声的问题,导致降噪后声音信号的频谱破坏较为严重,使得提取出的特征不能很好地刻画声音信号的目的声学事件的频谱特性。耳蜗是人类接收和处理外界声音信号的主要器官,在提取可辨性的声音特征,以及对背景噪声的鲁棒性方

4、面均表现出高强的才能。耳蜗生理学研究成果说明,耳蜗的这种才能主要来自于以下几个方面:基底膜的频率分析功能、外毛细胞/覆膜本文由论文联盟.Ll.搜集整理的主动选择性增益功能等10。其中,基底膜的主要功能是将接收到的声音信号分解为各个频率上的振动峰值,并将相应的振动传递给外毛细胞和内毛细胞;外毛细胞/覆膜那么主要根据接收到的振动对特定频率处的能量进展选择性增益,影响相应位置处的内毛细胞发放强度。针对传统声学事件检测方法存在的问题以及人耳中耳蜗的听觉感知特性,本文提出了一种模拟人耳听觉感知的基于共振峰的el滤波器组的加权算法,通过模拟人耳的听觉感知特性,加强了el滤波器组对中高频的分辨才能,并采用加

5、权后的el滤波器组提取FFFrant-F,FF系数。实验证明,FF对噪声有更好的鲁棒性,并且在目的声学事件信号较弱时,也不会增加误识率。1共振峰的提取声音信号的倒谱可以通过先对信号做傅里叶变换、取模,得到信号的频谱密度,然后求频谱密度的对数,最后求反傅里叶变换得到。根据参数模型功率谱估计的思想,可以将声音信号看作一个输入序列鼓励一个全极点的系统而产生的输出,系统的传递函数为:1其中,为常数,为实数,为模型的阶数。由于频率响应反映了被分析信号的频谱包络,因此用来代替频谱密度,对求对数后,做傅里叶反变换求出的LP倒谱系数,也被认为包含了信号频谱的包络信息,因此将其看作是对原始信号短时倒谱的一种近似

6、。的冲击响应为。欲求的倒谱,根据同态分析法,因为是最小相位的,所以一定可以展开成级数的形式,即的逆变换是存在的,可得:.2因此,只要计算出线性预测系数,就可以求出倒谱,通过对倒谱进展搜索,找到每一个共振峰所在的频率,记为,其中表示共振峰的个数。2el滤波器组的加权2.1模拟频率选择性增益功能人耳的选择性增益功能对人耳耳蜗的听觉感知至关重要,人耳的选择性增益机制主要包括:频率相关的增益区间和增益函数。考虑到人耳覆膜的行波振动范围有限,因此其频率增益区间仅局限于中心频率附近11;增益函数在频域的对数尺度上近似于高斯函数,在共振峰频率处的增益幅度最大,而在共振峰频率两侧的增益幅度迅速衰减。这即导致共

7、振处的频率振幅能量在急剧增加的同时,两侧的频率振幅能量急剧降低,表现出人耳的频率选择性增益功能。下面给出一种方法把LP谱估计法提取出的共振峰的信息应用到el滤波器组中,从而弥补el滤波器组在中高频分辨率缺乏的问题。考虑到在频率的对数尺度上,耳蜗的频率增益曲线类似于高斯密度函数,在共振峰处,耳蜗的频率增益最大,而在共振峰所在频率的两侧,耳蜗的增益幅度迅速衰减,根据以上分析,设计了如下函数来模拟耳蜗基底膜与覆膜之间的频率选择增益函数:3其中,表示第个子带的频率中心,表示第个子带的宽度,表示el滤波器组中包含的el子带的个数;表示检测到的第个共振峰的频率,表示第个共振峰的振幅在个共振峰的振幅总和中所

8、占的振幅能量的比例,该比例用来表示第个共振峰的强弱;是一个指示性函数,假如共振峰的频率在以为中心,以为宽度的第个el子带中,那么返回1,否那么返回0。2.2el滤波器组的加权通过对每一帧中共振峰所处的el子带对应的el滤波器系数进展加权,突出共振峰所在的el子带的频率,从而模拟人耳覆膜的频率选择映射,由此即弥补了el滤波器组在中高频分辨率较低的缺乏,同时也增强了传统F对噪声的鲁棒性。这符合人耳的听觉感知机理,如在众多嘈杂的背景环境噪声中,要想别人听清楚自己说话,必须进步声音的分贝,掩盖其他背景声音。根据el滤波器组中每一个el子带在对数频率中的分布范围,对目的声学事件鸣笛的每一帧数据在对数频域

9、上进展划分,通过对分帧后的每一帧数据利用LP倒谱估计的方法来提取其中的共振峰信息。图1中虚线为加权前的滤波器组系数,实线即为加权后的滤波器组系数;通过观察可以看出:第7、9、11、13、14、16个el滤波器明显得到了增强,解决了传统的el滤波器的中高频分辨率低的问题。图1加权前后的滤波器组Fig.1FilterbankfEightsbefreandafter3基于加权后的el滤波器组的FF特征提取首先对采集的声音信号进展预加重、分症加窗等预处理,然后对每一帧的数据使用LP倒谱法提取共振峰的信息,接下来根据提取的共振峰信息以及el频域子带的划分确定当前数据帧的每一个el滤波器的加权系数,从而获

10、得加权后的el滤波器组,此后对每个滤波器的输出进展指数压缩,再对经过指数压缩的能量谱进展离散余弦变换,并经过升半正弦倒谱提升,最终得到FF特征。4实验结果与分析根据本文提出的加权el滤波器组进展车载系统的鸣笛声学事件的检出实验。在实验中,搭载声学事件检测系统的车辆分别在不同的速度和不同的路况下对测试数据进展采集,测试数据中长鸣笛每一个长鸣笛时长大于1.5秒,包括100个,短鸣笛每一个短鸣笛时长小于1秒,包括为100个,笛语由不同的长、短鸣笛序列组成25个。基线系统使用的特征是传统的F,而实验系统使用的是加权后的el滤波器组提取的特征,详细的实验结果如表1所示。通过分析表1可以获知,与传统的F特

11、征相比,加权后的FF特征有着更高的召回率和更低的误识率,因此FF更适应于行车噪声环境下的声学事件检测。表1加权前后的检测系统性能比照Tab.1parisnfdetetinsystesperfranefeightsbefreandafterAE指标长鸣笛短鸣笛笛语基线系统实验系统基线系统实验系统基线系统实验系统R召回率75%86%72%80%63%75%D误识率5.7%5.9%9.7%9.7%31.3%31.5%响应时间s125s139s125s139s150s169s加权前后的F特征鲁棒性比照结果那么如图2所示。通过图2可以看出,随着车内噪声的不断加强,传统的F的准确率明显下降,而本文提出的FF却只有少许下降,说明了FF对噪声有较强鲁棒性。图2加权前后的F特征鲁棒性比照Fig.2parisnfFsrbustnessfeightsbefr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论