音频的采集及分析处理_第1页
音频的采集及分析处理_第2页
音频的采集及分析处理_第3页
音频的采集及分析处理_第4页
音频的采集及分析处理_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、语音的采集及分析处理Sound acquisition and analysis02013435 赵斌指导教师 胡建中课程:机械工程测试与控制技术时间:2016年5月19日School of mechanical engineering SEU摘要:本项目是对信号采集、分析与处理相关知识的一次应用,通过录音软件获得三个实验者的声音,并运用MATLAB软件对采集的语音信号进行分析处理。此次项目研究主要分三个部分:首先是语音信号的采集,利用录音软件录取三个实验者的声音。其次是对录取的语音信号进行格式的转换,统一转换为MP3格式。最后是利用MATLAB对语音信号进行时域和频域分析与处理。项目最终研究

2、结果成功将采集的人声区分,并通过改变采样频率对声音做了处理,使其相较与源语音发生了较大变化。关键词:语音采集,时域分析,频域分析,MATLAB1、 语音采集1.1 题目Computer can convert analog signals to digital signals by sampling the voice or the video. The sentence of "mechanical engineering measurement and control technology" must be read by more than 3 people and

3、be recorded under the condition of different environmental noise using microphone and sound card in computer.First, the recorded voice is converted into a data file ASCII text with the help of professional software, then spectrum analysis is processed and the figure in time domain and frequency doma

4、in is drawn.Recording software, such as: 蓝光影音MP3录音机Matlab program of reading MP3 files: mp3readwriteDiscussion:1) Understand the sampling frequency and its effect on quality for the APE, MP3 and WMA audio format file.2) How to set the sampling frequency(采样频率)? what is the appropr

5、iate sampling length(采样长度)?3) According to your analysis, how to distinguish speech sound of different people?4) What measures can be taken to make your speech sound identified difficultly by others?1.2 原始信号采集与处理通过手机自带录音功能,录取三位实验者的“机械工程测试与控制系统”语句,得到三个语音文件zb.m4a,hdh.m4a,lxy.m4a。2、语音信号的分析处理2

6、.1 语音格式转换通过参考函数mp3write,将m4a格式转换为mp3格式。在读取语音文件时,注意到MATLAB R2014版本函数库中有读取语音函数audioread,该函数支持mp3格式语音的读取,所以在程序中没有使用提供的函数mp3read。转换完成保存。2.2 时域与频域的分析处理对获取的信号绘制时域波形,并通过FFT绘制频域波形。图(1) 实验者zb语音的时域波形和幅频谱图图(2) 实验者hdh语音的时域波形和幅频谱图图(3) 实验者lxy语音的时域波形和幅频谱图3、讨论3.1采样频率的影响采样时在模数转换过程中以一定规律,如时间间隔,对连续时间信号进行取值的过程。其数学描述就是用

7、间隔为Ts的周期单位脉冲序列g(t)去乘以模拟信号x(t)。g(t)可写为 ( )由函数性质可知 ( ) 说明经时域采样后,各采样点的信号幅值为,其中Ts为采样间隔,为采样频率。3.2采样频率的设置及采样长度的确定通过MATLAB中函数获得录取语音的采样频率为48000Hz。通过查阅资料知道人声音的频率一般是204000Hz,当Fs=48000Hz时,满足采样定理,所以这样设置采样频率合理。根据图(1)(2)(3)可以看出,这样设置采样频率获得的图像时全保真的。采样长度取决于录音的时间长短,但不易过短,过短不能完整体现整个语音长度的特征,过长会增加运算量,增加计算机负担。3.3区分不同的声音不

8、同的实验者,其说话声音的响度和音调不同,反应到时域上就是信号幅值的不同,反应到频域上就是特征频率在频谱图上的分布不同。三个实验者均为男生,录制环境为图书馆,通过图(1)(2)(3)可以看出,不同实验者时域图的区别即为振幅的差异,频域图的区别为声音特征频率的分布不同,三个实验者语音的特征频率分布大致集中在250Hz左右。理论上,区分不同人声的主要靠特征频率的不同,但实验对象均为男生,音调比较接近,在频谱图上看不出太大区别,但每个人的音调是不能改编的,所以用频率特征区分不同人声比较准确。虽然三个实验者的时域波形有较大差异,但只要改变讲话者的说话轻重,就能改变时域波形,所以时域特征不能用来区分不同的

9、声音。3.4 让声音没有区分度的方法利用改变采样频率的处理方法,可使源语音的特征频率改变。如图图(4)Fs=48000Hz时的时域图和频域图图(5)Fs=60000Hz时的时域图和频域图图(6)Fs=60000Hz时的时域图和频域图通过对比图(4)(5)(6)中的频域图,可以看出随着采样频率的增大(减小),对应语音的特征频率也增大(减小),即语音的音调改变。利用MATLAB中的函数sound可明显的听出语音音调的变化。致 谢感谢胡建中老师在测试系统学习方面给我的教导和帮助,在我做项目的过程中为我答疑解惑,解决难题,使我能够顺利完成项目内容。参考文献:1.贾平民,张洪亭主编. 测试技术(第二版)

10、. 北京:高等教育出版社. 2012. 31-692. Dan Ellis,demo_mp3readwriteEB/OL. 2009.附录:matlab程序代码x,fs=audioread('zb.m4a');mp3write(x,fs,'zb.mp3')x,fs=audioread('zb.mp3'); %read mp3 format file Fs=48000; % sampling frequencyL=length(x); t=(0:L-1)/Fs;subplot(211);plot(t,x);title('zb.mp3 waveform of time domain');xlabel('time/s');ylabel('amplitude'); Y = fft(x,L)*2;f = Fs/L*(0:1:L-1);A = abs(Y); %amplitudeP = angle(Y); %phasesu

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论