版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精选优质文档-倾情为你奉上综合实验报告自相关法及其变种学 院 电子与信息学院 专 业 信息与信号处理 学生姓名 学生学号 提交日期 2013年7月10日 一、实验目标1.1 了解语音基音周期估计方法,掌握自相关法估计基音周期的原理,分析其变种。二、实验基础知识2.1 基音与基音周期估计人在发音时,根据声带是否震动可以将语音信号分为清音跟浊音两种。浊音又称有声语言,携带者语言中大部分的能量,浊音在时域上呈现出明显的周期性;而清音类似于白噪声,没有明显的周期性。发浊音时,气流通过声门使声带产生张弛震荡式振动,产生准周期的激励脉冲串。这种声带振动的频率称为基音频率,相应的周期就成为基音周期。基音周期
2、的估计称谓基音检测,基音检测的最终目的是为了找出和声带振动频率完全一致或尽可能相吻合的轨迹曲线。基因周期作为语音信号处理中描述激励源的重要参数之一,在语音合成、语音压缩编码、语音识别和说话人确认等领域都有着广泛而重要的问题,尤其对汉语更是如此。汉语是一种有调语言,而基因周期的变化称为声调,声调对于汉语语音的理解极为重要。因为在汉语的相互交谈中,不但要凭借不同的元音、辅音来辨别这些字词的意义,还需要从不同的声调来区别它,也就是说声调具有辨义作用;另外,汉语中存在着多音字现象,同一个字的不同的语气或不同的词义下具有不同的声调。因此准确可靠地进行基音检测对汉语语音信号的处理显得尤为重要。2.2 基音
3、周期估计的现有方法到目前为止,基音检测的方法大致上可以分为三类:1)时域估计法,直接由语音波形来估计基音周期,常见的有:自相关法、并行处理法、平均幅度差法、数据减少法等;2)变换法,它是一种将语音信号变换到频域或者时域来估计基音周期的方法,首先利用同态分析方法将声道的影响消除,得到属于激励部分的信息,然后求取基音周期,最常用的就是倒谱法,这种方法的缺点就是算法比较复杂,但是基音估计的效果却很好;3)混合法,先提取信号声道模型参数,然后利用它对信号进行滤波,得到音源序列,最后再利用自相关法或者平均幅度差法求得基因音周期。三、实验原理3.1 自相关函数能量有限的语音信号x(n)的短时自相关函数定义
4、为:此公式表示一个信号和延迟m点后该信号本身的相似性。如果信号x(n)具有周期性,那么它的自相关函数也具有周期性,而且周期与信号x(n)的周期性相同。自相关函数提供了一种获取周期信号周期的方法。在周期信号周期的整数倍上,它的自相关函数可以达到最大值,因此可以不考虑起始时间,而从自相关函数的第一个最大值的位置估计出信号的基音周期,这使自相关函数成为信号基音周期估计的一种工具。3.2 短时自相关函数法语音信号是非稳态信号它的特征是随时间变化的,但在一个很短的时间段内可以认为具有相对稳定的特征即 短时平稳性。因此语音具有短时自相关性。这个时间段约5ms-50ms。为其统计特性和频谱特性都是对短时段而
5、言的。这使得要对语音信号作数字处理必须先按短时段对语音信号分帧。这样每一帧信号都具有短时平稳性从而进行短时相关分析。能量有限的语音信号s(n)的短时自相关函数定义为:一般要求一帧至少包含2个以上的周期。而且相邻帧之间要有足够的重叠。3.3 自相关方法变种3.3.1 中心削波由于语音信号与声道特性影响有关,有的情况下即使窗长已选得足够长,第一最大峰值点与基音仍不一致,这就是声道特性的共振峰特性造成的“干扰”。实际上影响从自相关函数中正确提取基音周期的最主要的因素就是声道响应部分。当基音的周期性和共振峰的周期性混叠在一起时,被检测出来的峰值就会偏离原来峰值的真实位置。另外,某些浊音中,第一共振峰频
6、率可能会等于或低于基音频率。此时,如果其幅度很高,它就可能在自相关函数中产生一个峰值,而该峰值又可以同基音频率的峰值相比拟,从而给基音检测带来误差。为了提高基音周期检测的可靠性,采用中心削波法对原始信号进行预处理。 其中削波电平 CL 一般取最大信号幅度的 60%70%。图1给出了中心削波处理后的结果。中心削波后,再用自相关检测出基音频率,错判为倍频或分频的情况就可以大大减少了。中心削波法实质上是对信号做非线性处理,它消除语音信号的低幅值部分,而保留高振幅的峰值,从而能有利于信号的基音周期估计。图1 中心削波处理经过中心削波后的信号,削去了大部分与声道响应有关的波动,只保留了超过削波电平的部分
7、。对中心削波后的语音信号计算自相关函数,这样在基音周期位置呈现大而尖的峰值,而其余的次要峰值幅度都很小。3.3.2 三电平削波由自相关函数表达式可知,自相关需要大量的乘法运算,算法的运行效率低。结合自相关函数法和中心削波法对信号做基音周期估计,并在不影响基音周期估计准确性的前提下,用两个信号的互相关序列代替自相关序列而避免了大量的乘法运算,有效地提高了算法的运行效率。 图2 显示的是经过三电平削波后的信号。经过三电平削波后的信号原始输入的语音信号图2 经过三电平削波后的信号显然 x(n)只有-1,0,1 三种可能的取值。自相关中的乘法运算都变成了加减运算,使得算法的效率得到大幅度的提高。3.3
8、.3 基于时域自相关平方函数第一峰值点的位置非常重要,峰值越尖锐则确定的位置就越准确。求短时自相关函数的平方:它们周期一致,但平方后在峰值处波形尖锐尤为明显。图3示为某女性发元音a的波形/短时自相关函数及短时自相关平方函数波形.图3 某女性发元音a的波形/短时自相关函数及短时自相关平方函数波形 3.4 短时能量分析语音信号x(n)的某帧信号的短时平均能量En的定义为:式中,w(n)为窗函数,N为窗长,h(n)= w2(n),则有 由上式表明,短时平均能量En相当于将语音信号的平方通过一个单位冲激响应为h(n)的线性滤波器的输出。实验统计发现,语音中浊音段的短时平均能量远远大于清音段的短时平均能
9、量。因此,短时平均能量的计算给出了区分清音段与浊音段的依据,即En(浊)>En(清)。根据E由高到低的跳变可定出浊音变为清音语音的时刻,E由低向高的跳变可定出清音变为浊音语音的时刻,又由于只有浊音才有基音周期,清音的基音周期为零,这样就可判别出清、浊音。图4 男声“确定”的语音波形及其局部短时能量四、结果与分析检测流程如下:我们先通过Matlab实现,然后再通过C+实现。图5 基于自相关函数的基因周期检测流程实验采用一段男声读“播放”两个字的声音wav文件,其为16KHz采样率,16bit量化。整段语音长656.7ms,节点共10508个。图6 男声读“播放”两个字的声音文件4.1 滤波将滤波器低端截止频率设为60Hz,这是因为可以抑制50Hz电源工频的干扰;高端截止频率设为900Hz既可除去大部分共振峰影响,又可以当基音最高频率为450Hz时仍能保留其一二次谐波。图7 经过滤波器后的语音信号4.2 不同帧长窗口长度至少要大于基音周期的两倍。一般,基频最低50Hz,故周期最长为20ms,再根据采样率确定帧长。图8 截取不同帧长的语音信号4.3 清浊音区分这里我们通过计算短时能量来区分清浊音,结果如图9所示。图9 清、浊音短时能量图4.4 平滑 去除野点。图10 平滑后的结果五、总结通过本次课程实验设计,我们从中学习了语音信号处理的一些基本知识,了解了基音周期的相关概念和现
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024品牌招商代理服务协议模板版B版
- 2024年幼儿园教职工劳动协议模板版B版
- 2024年企业信息化系统集成实施与运维合同
- 2024年可再生能源开发合同
- 2024年度健身会所承包运营合同样本版
- 湖南省2023-2024学年高二物理上学期第二次联考试题含解析
- 2024年度农业设备租赁协议样本版
- 2024年实验技术服务协议样本版B版
- 2024年城市供水与排水合同
- 2024年厂房转让及维修责任合同
- 质性研究课件
- 二年级上册美术教案及教学反思-4.12 小泥人和泥面具丨岭南版
- 叉车日检保养目视化看板指引
- 广东省地图模板课件
- 三年级科学上册课件-第一单元1 测量长度冀人版(共24张PPT)
- 年哈尔滨工业大学C语言期末考试试题及答案
- 燃气质量检测制度审批稿
- 专题2-近代的屈辱、抗争和探索
- 企业内部控制审计工作底稿编制指南
- 极品素材3d小白人素材完整版
- 学校反恐防暴应急演练记录
评论
0/150
提交评论