信号与系统三级项目-基于matlab语音信号采集与分析_第1页
信号与系统三级项目-基于matlab语音信号采集与分析_第2页
信号与系统三级项目-基于matlab语音信号采集与分析_第3页
信号与系统三级项目-基于matlab语音信号采集与分析_第4页
信号与系统三级项目-基于matlab语音信号采集与分析_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信号与系统三级项目姓名:班级:电子信息工程2班课程名称:信号与系统指导教师:闫盛楠2017年6月男声:实现了对语音信号进行频谱分析。2.4分析男声和女生的差别2.4.1男声和女声的差别在生活中我们感觉男生的声音雄浑低沉,女生的声音尖细清脆。男、女声在频率方面存在很大的差别:一是男、女声的基音频率有差别,男声的基音频率大致在100—200HZ之间,而女声的基音频率则在200—350HZ之间;二是男声低频成份比较多,女声高频成份比较多。2.4.2定性地辨别男女声根据2.4.1的第二点我们可以通过考虑观察男女频谱函数中地频率成分进行判断。在我们的常识中,女生的声音比较尖,音调比较高,频率当然会高一点,男生的频率会低一些。由2.3中男声和女声的频域波形图,我们可以辨别出男声女声频谱中的细微不同:男声的低频部分的幅值较高,高频部分的偏低;而女声恰好相反,高频部分的幅值较高而低频部分的偏低。实现了定性的辨别男女声。通过观察语音信号的频谱图是可以辨别男女声的这种方法的缺点是:需要将两幅图进行比较并且人的主观判断会造成较高的错误率。。2.4.3定量地辨别男女声我们知道,一个波形可以由无数正弦波和余弦波叠加而成,有如下公式:可将以上公式变换为:那么,当n=0时我们可以得到一个特殊的波形,称为基波。声音也是一种波,也由无数正弦波和余弦波叠加而成,那么在声音信号中n=0的波就是该声音信号的基波,由此我们引出了基音的概念:基音,一般的声音都是由发音体发出的一系列频率、振幅各不相同的振动复合而成的。这些振动中有一个频率最低的振动,由它发出的音就是基音,其余为泛音。发音体整体振动产生的音(振动长度越大,频率越小),叫做基音,决定音高;发音体部分振动产生的音,叫做泛音,决定音色。女生的基音偏高而男生的基音偏低,因此,我们考虑利用基音频率进行男声女声的辨别。通过大量查阅网上的资料以及对多人声音的测试,我们决定将250Hz定为男女声音的分界点,基音频率小于250Hz的为男声,基音频率大于250的为女声。通过测试,这种方法准确度较高,但对于声音偏低沉的女声和声音比较高的男声仍然会出现识别错误的现象。实现提取基音频率并辨别男女声的代码如下:%======基音频率提取======[~,index]=max(t);timewin=floor(0.015*fs);xwin=t(index-timewin:index+timewin);[y,~]=xcov(xwin);ylen=length(y);halflen=(ylen+1)/2+30;yy=y(halflen:ylen);[~,maxindex]=max(yy);fmax=fs/(maxindex+30);disp([file,'基音频率为',num2str(fmax),'Hz'])%======通过基因频率判断男女声======iffmax<250;disp([file,'是男声文件']);elsedisp([file,'是女声文件']);end;sound(t,fs);通过这种方式的测试出来的结果:女声的音频文件:E:\REC003.mp3基音频率为327.4725HzE:\REC003.mp3是女声文件女声的音频文件:E:\REC005.mp3基音频率为134.4538HzE:\REC005.mp3是男声文件通过以上两种方法,实现了分析男声和女生的差别。2.5验证抽样定理抽样定理的内容如下:一个频谱受限的信号f(t),如果频谱只占据-ωm~ωm

的范围,则信号f(t)可以用等间隔的抽样值惟一地表示。而抽样间隔必须不大于1/2𝑓𝑚(其中ωm=2π𝑓𝑚),或者说,最低抽样频率为2𝑓𝑚。由于人的声音频率为300Hz—3400Hz,根据奈奎斯特采样定理可知,采样频率必须要大于等于2倍的3400Hz,即6800Hz,向上取至8kHz,这是一个既可以保证信号抽样准确和恢复基本正确,又不会造成抽样太多,数据量过大的采样频率。要实现音频数据的降采样有多种方法,通过上网查询,我们采用了函数downsample(),它能够较好地模拟直接降采样的过程,降采样后的变化也更容易发现。首先通过降采样函数downsample降采样处理,参数分别为原信号y和降采样率的倍数。利用函数downsample()进行降采样后,矩阵的长度会大大变短,而在我们以后的频谱分析中,为了方便比较,我们需要相同长度的数据,所以就采用了interp()函数对降采样后的数据进行了插值处理,保证了信号的长度,然后采用了之前画出时域和频域图像部分以及男女声判别部分的代码,画出降采样的后数据的时域、频域图像和基音频率。我们在录制声音时选用的fs为48000Hz,对其进行6倍的降采样就是8000Hz。根据抽样定理,如果降采样倍数小于6,声音信号就是可以恢复的,如果降采样的倍数大于6,那么声音信号就会产生失真。我们将原信号、降6倍信号、降20倍信号的频谱图放在一起进行了对比,发现在频域图的主要频谱的部分,降6倍的与原信号的波形几乎没有差别,而降20倍的波形已经有了较为明显的失真。原信号采样率48000Hz降6倍采样采样率8000Hz降20倍采样采样率2400Hz

实现了对抽样定理的验证。Ⅲ总结与心得3.1总结本次三级项目我们主要进行了语音信号的采集,并对采集的语音信号进行时域和频域波形显示及仿真,然后对采集的语音信号进行降采样处理和男女声的区分。我们使用的是在Matlab中编写程序进行采样和波形显示以及降采样处理,对于男女声区分我们使用了两种方法:频谱观察法与基音频率法。通过多组音频信号的测试我们认为基音频率法的准确率和客观性比较高。在基音频率法中,我们发现男声的基频主要集中在小于250Hz这个范围内,女声基频主要集中在大于250Hz这个范围内。这个基频范围是我们根据一些样本得出的,样本数量较少,使得判别存在一定误差。声音信号的主要频率范围为200Hz~3400Hz,根据抽样定理可得,采样频率应不小于8000Hz。3.2心得本次三级项目中我们组分工明确,组内成员互帮互助,最终全部实现了该次项目的全部内容。在项目实施的过程中,我们也遇到了许多问题,比如不知道Matlab的函数究竟怎么使用,不知道基音频率怎么提取等,这些问题在之后的讨论与查阅资料中逐渐解决。通过本次项目,我们再次学习了信号与系统相关知识,对语音学也有了较为简单的理解,加深了对抽样定理的理解,我们收获到了许多。参考

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论