![matlab 语音 延时与混响_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-11/22/0b79af7c-8442-444c-a022-013821a9ceb7/0b79af7c-8442-444c-a022-013821a9ceb71.gif)
![matlab 语音 延时与混响_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-11/22/0b79af7c-8442-444c-a022-013821a9ceb7/0b79af7c-8442-444c-a022-013821a9ceb72.gif)
![matlab 语音 延时与混响_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-11/22/0b79af7c-8442-444c-a022-013821a9ceb7/0b79af7c-8442-444c-a022-013821a9ceb73.gif)
![matlab 语音 延时与混响_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-11/22/0b79af7c-8442-444c-a022-013821a9ceb7/0b79af7c-8442-444c-a022-013821a9ceb74.gif)
![matlab 语音 延时与混响_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-11/22/0b79af7c-8442-444c-a022-013821a9ceb7/0b79af7c-8442-444c-a022-013821a9ceb75.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、武汉理工大学信息处理课群综合训练与设计报告书目 录摘 要2Abstract31 引言42 课程设计题目描述和要求52.1设计内容52.2设计要求53 课程设计报告内容63.1 总体设计63.2 详细设计过程73.2.1混响73.2.2延时83.2.3离散傅立叶变换93.2.4滤波器设计104.设计的步骤及代码编写164.1从Windows读取1s的语音信号164.2采样后语音信号的时域波形和频谱164.3对采样后的信号延时和混响174.4单回声滤波器184.5无限个回声滤波器194.6全通结构的混响器214.6多重回声滤波器22结果与体会24参考资料25摘 要数字信号处理(Digital Si
2、gnal Processing)技术,从20世纪60年代以来,随着计算机科学和信息科学发展,数字处理技术应运而生并得以快速发展。 语言是人们进行信息沟通的主要方式之一,它具有直接、自然、方便等优点。语音则是语言的物理层表达方式。语音处理主要是对语音进行机器处理,以达到传输、自动识别、机器理解等目的。进行了语音处理过程的滤波、采样、傅立叶变换和谱包络提取的算法实现研究,讨论了在算法的DSP实现方法, Matlab 语言是一种广泛应用于工程计算及数值分析领域的新型高级语言, Matlab 功能强大、简单易学、编程效率高。特别是Matlab 还具有信号分析工具箱, 不需具备很强的编程能力, 就可以很
3、方便地进行信号分析、处理和设计。关键词:语音信号处理 数字信号处理 Matlab 滤波器 频谱分析AbstractDigital Signal Processing (Digital Signal Processing) technology from the 1960s,along with the development of computer science and information science, digital processing techniques have emerged and to rapid development. Language is the commun
4、ication of people to one of the main, it has a direct, natural, and easy. Voice is the language of the physical layer of expression. Voice processing machines mainly for voice processing, in order to achieve transmission, automatic recognition, machine understanding of other purposes. For voice proc
5、essing filtering, sampling, Fourier transform and spectral envelope extraction algorithm research, discusses the implementation of DSP algorithms.Matlab language is a widely used engineering calculation and numerical analysis of the field of new high-level language, Matlab powerful, easy to learn, p
6、rogramming and high efficiency. Matlab also has a particular signal analysis toolbox, need not have strong programming skills, you can easily carry out signal analysis, processing and design.Keyword: peech signal processing; DSP; spectral analysis; filter 1 引言数字信号处理主要是研究用数字或符号序列表示和处理信号。处理的目的可以是削弱信号中
7、的多余内容,滤除混杂的噪声和干扰,或者是将信号变换为容易分析和识别的形式,便于估计和选择它的特征参数。声音信号是一维连续信号,而计算机只能处理离散信号。为了从离散信号还原连续信号,根据采样定理,可以确定采样频率的最小值。wav文件是一种数字声音文件格式,本课程设计基于Matlab分析了wav声音文件频谱与声音的关系。通过采集个人的一段声音进行频谱分析等处理,然后设计数字滤波器处理这个原始声音的wav文件,并比较滤波以后输出声音信号与原声音信号的异同。基于MATLAB 的语音信号特技处理, 其实质是针对于不同的滤波器性能的分析与比较。对于滤波器的设计可以使用MATLAB 中自带的工具, 也可以通
8、过编程或直接利用MATLAB中的函数库来实现。2 课程设计题目描述和要求2.1设计内容(1)利用Windows下的录音机或其他软件,录制一段自己的语音信号,时间控制在1s左右,并对录制的信号进行采样。(2)语音信号的频谱分析,画出采样后语音信号的时域波形和频谱图。(3)将信号加入延时和混响,再分析其频谱,并与原始信号频谱进行比较。(4)设计几种特殊类型的滤波器:单回声滤波器,多重回声滤波器,无限个回声滤波器,全通结构的混响器,并画出滤波器的频域响应。(5)用自己设计的滤波器对采集的语音信号进行滤波。(6)分析得到信号的频谱,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的
9、变化。(7)回放语音信号。2.2设计要求(1)熟悉离散信号和系统的时域特性。(2)熟悉语音信号的特点。(3)掌握数字信号处理的基本概念,基本理论和基本方法。(4)掌握序列快速傅里叶变换方法。(5)学会MATLAB的使用,掌握MATLAB的程序设计方法。(6)掌握MATLAB设计各种数字滤波器的方法和对信号进行滤波的方法。3 课程设计报告内容3.1 总体设计 整体的流程图如3.1所示利用Windows下的录音机或其他软件,录制一段自己的语音信号,时间控制在1s左右,并对录制的信号进行采样语音信号的频谱分析,画出采样后语音信号的时域波形和频谱图将信号加入延时和混响,再分析其频谱,并与原始信号频谱进
10、行比较设计几种特殊类型的滤波器:无限个回声滤波器,全通结构的混响器,并画出滤波器的频域响应。用自己设计的滤波器对采集的语音信号进行滤波分析得到信号的频谱,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化回放语音信图3.1 整体流程图3.2 详细设计过程3.2.1混响人工混响是指人为对原始声音信号进行处理,使其具有更好的音质效果, 在音乐、广播、电视和电影制作中广泛应用. 以往, 混响处理是采用人工方法或模拟技术, 效果不够理想. 近年来, 随着数字信号处理技术的发展, 一些原本只有通过建筑声学才能解决的声学效果问题可以利用电声学知识以数字信号处理的手段来实现.在一个声
11、学环境下, 一个声源除了直接到达人耳外, 还有一部分要通过人体周围的障碍物反射到人耳, 直达声和反射声叠加在一起就形成了混响。混响的脉冲响应如图3.2 所示, 其中直达信号是声源不经过任何障碍物直接到达人耳的那部分, 其传播路径较短, 所以能量损失少, 幅度很强; 早期反射由一次或几次反射的声音信号所组成, 此时声音的谱线离散, 能量由于声音与反射面的碰撞有所减少; 后期反射由更多的多次反射的声音信号组成,声音经过不断的多次反射, 能量呈指数递减, 同时反射声密度增加, 使得谱线密集, 近似连续。图3.2 系统脉冲响应数字混响器就是对原始朴素的声音信号进行处理, 使其产生一定混响效果的数字信号
12、处理系统, 这样的系统其脉冲响应从理论上讲应该类似或逼近图3.2所示的形式。混响的常见参数有以下几种:(1)混响时间:能逼真的模拟自然混响的数码混响器上都有一套复杂的程序,其上虽然有很多技术参数可调,然而对这些技术参数的调整都不会比原有的效果更为自然,尤其是混响时间。(2)高频滚降:此项参数用于模拟自然混响当中,空气对高频的吸收效应,以产生较为自然的混响效果。一般高频混降的可调范围为0.11.0。此值较高时,混响效果也较接近自然混响;此值较低时,混响效果则较清澈。(3)扩散度:此项参数可调整混响声阵密度的增长速度,其可调范围为010,其值较高时,混响效果比较丰厚、温暖;其值较低时,混响效果则较
13、空旷、冷僻。(4)预延时:自然混响声阵的建立都会延迟一段时间,预延时即为模拟次效应而设置。(5)声阵密度:此项参数可调整声阵的密度,其值较高时,混响效果较为温暖,但有明显的声染色;其值较低时,混响效果较深邃,切声染色也较弱。(6)频率调制:这是一项技术性的参数,因为电子混响的声阵密度比自然混响稀疏,为了使混响的声音比较平滑、连贯,需要对混响声阵列的延时时间进行调制。此项技术可以有效的消除延时声阵列的段裂声,可以增加混响声的柔和感。(7)调治深度:指上述调频电路的调治深度。3.2.2延时延时就是将音源延迟一段时间后,再欲播放的效果处理。依其延迟时间的不同,可分别产生合唱、镶边、回音等效果。当延迟
14、时间在335ms之间时人耳感觉不到滞后音的存在,并且他与原音源叠加后,会因其相位干涉而产生"梳状滤波"效应,这就是镶边效果。如果延迟时间在50ms以上时,其延迟音就清晰可辨,此时的处理效果才是回音。回音处理一般都是用于产生简单的混响效果。延时、合唱、镶边、回音等效果的可调参数都差不多,具体有以下几项:延时时间(Dly),即主延时电路的延时时间调整。反馈增益(FB Gain),即延时反馈的增益控制。反馈高频比(Hi Ratio),即反馈回路上的高频衰减控制。调制频率(Freq),指主延时的调频周期。调制深度(Depth),指上述调频电路的调制深度。高频增益(HF),指高频均衡
15、控制。预延时(Ini Dly),指主延时电路预延时时间调整。均衡频率(EQ F),这里的频率均衡用于音色调整,此为均衡的中点频率选择。由于延时产生的效果都比较复杂多变,如果不是效果处理专家,建议使用设备提供的预置参数,因为这些预置参数给出的处理效果一般都比较好。3.2.3离散傅立叶变换在MATLAB的信号处理工具箱中函数FFT和IFFT用于快速傅立叶变换和逆变换。下面介绍这些函数。函数FFT用于序列快速傅立叶变换。函数的一种调用格式为 y=fft(x)其中,x是序列,y是序列的FFT,x可以为一向量或矩阵,若x
16、为一向量,y是x的FFT。且和x相同长度。若x为一矩阵,则y是对矩阵的每一列向量进行FFT。如果x长度是2的幂次方,函数fft执行高速基2FFT算法;否则fft执行一种混合基的离散傅立叶变换算法,计算速度较慢。函数FFT的另一种调用格式为 y=fft(x,N)式中,x,y意义同前,N为正整数。函数执行N点的FFT。若x为向量且长度小于N,则函数将x补零至长度N。若向量x的长度大于N,则函数截短x使之长度为N。若x 为矩阵,按相同方法对x进行处理。经函数fft求得的序列y一般是复序列,通常要求其幅值和
17、相位。MATLAB提供求复数的幅值和相位函数:abs,angle,这些函数一般和FFT同时使用。3.2.4滤波器设计单回声滤波器的系统函数:H(z)=1+a*z-m <1将其写成差分方程为:y(n)=x(n)+a*x(n-m)这样我们就能理解为什么称其为单回声滤波器了。滤波器的输出为输入和一个输入延时的叠加,而输入的延时就可以看作回声。单回声滤波器的幅频曲线、相频曲线和单位脉冲响应分别如图3.3、图3.4和图3.5所示:图3.3 单回声滤波器幅频曲线图3.4 单回声滤波器相频曲线图3.5 单回声滤波器脉冲响应无限回声滤波器的系统函数:H(z)= z-m/ a*z-m <1之所以称其
18、为无限回声滤波器了?同单回声滤波器一样,同样系统函数写为差分方程,结果为:y(n)=x(n)+a*y(n-m)=x(n)+a*x(n-m)+a2*y(n-2*m)=从差分方程可以看出,系统的输入为输出及其一系列延时的叠加,且延时后信号的系数的绝对值逐渐减小,这就可以理解什么是无限回声滤波器了。无限回声滤波器的幅频响应、相频响应和单位脉冲响应如图3.6、图3.7和图3.8所示:图3.7 无限回声滤波器幅频曲线图3.8 无限回声滤波器相频曲线图3.9 无限回声滤波器脉冲响应多重回声滤波器器:多重回声滤波器只需要在单回声滤波器做适当修改就可以了,这里不做过多讨论。全通结果的混响器的系统函数为:H(z
19、)=(a+z-m)/(1+a*z-m) <1之所以称其为全通滤波器了,我们可以来看其幅频响应如图3.10所示。这样我们就可以理解为什么是全通了,其幅频响应总是为1。同时,该滤波器的相频响应和单位冲击响应如图3.11和图3.12所示。图3.10 全通滤波器幅频曲线图3.11 全通滤波器相频曲线图3.12 全通滤波器脉冲响应对信号进行时域滤波用到函数filter,函数filter的调用格式为:y=filter(b,a,x)该格式采用数字滤波器对数据进行滤波,既可以用于IIR滤波器,也可以用于FIR滤波器。其中向量b和a分别表示系统函数的分子、分母多项式的系数,若a1,此时表示FIR滤波器,否
20、则就是IIR滤波器。该函数是利用给出的向量b和a,对x中的数据进行滤波,结果放如向量y中。4.设计的步骤及代码编写4.1从Windows读取1s的语音信号读取wav文件的函数是wavread,其调用格式如下:x,fs,bits=wavread(filepath)该函数用于读取语音,采样值放在向量x中,fs表示采样频率(Hz),bits表示采样位数。4.2采样后语音信号的时域波形和频谱对采样后信号进行频谱分析的具体代码如下:close allclear all x,fs,bits=wavread('e:matlabworkDSP.wav');x=x(:,1);plot(x)tit
21、le(the wave of time domain)figurey=fft(x);plot(abs(y)title(the wave of frequency domain)结果如图4.1所示:图4.1 原始信号时域和频域波形图4.3对采样后的信号延时和混响对采样后的信号进行延时和混响的程序如下所示:n=200;%n用来调节延时大小x1=zeros(n,1);x;x2=x;zeros(n,1);x3=x1+x2;figureplot(x3)title('wave of time domain after delay')y1=fft(x3);figureplot(abs(y1)
22、title('wave of frequency domain after delay')程序运行结果如图4.2所示:图4.2 延时和混响波形4.4单回声滤波器用单回声滤波器对信号进行滤波并对滤波后的时域波形和频谱分析的程序如下:close allclear allx,fs,bits=wavread('e:matlabworkDSP.wav');x=x(:,1);m=10000;%用来调整回声与原来声音的间隔a=0.6;%用来调整回声的强度b=1;zeros(m,1);a;a=1;y2=filter(b,a,x);plot(y2)title('wave
23、of time domain through single echo filter')figurey3=fft(y2);plot(abs(y3)title('wave of frequence domain through single echo filter')sound(y2,fs,bits)程序运行结果如图4.3所示:图4.3 单回声滤波器波形回放的音频有明显的回声。分析经过单回声滤波器的音频信号可以看出幅值的变化不是很大,但是原始信号无幅值的点出现了幅值,这也是产生的回声的原因。分析频谱图可以看出,幅值有较大的提升。4.5无限个回声滤波器用无限回声滤波器进行滤波
24、的程序如下所示:clear allx,fs,bits=wavread('e:matlabworkDSP.wav');x=x(:,1);p=200; %用来调整回声间隔a=0.6; %用来调整回声音量b=zeros(p,1);1;a=1;zeros(p-1,1);-a;y3=filter(b,a,x);plot(y3)title('wave of time domain infinite single echo filter')figurey4=fft(y3);plot(abs(y4)title('wave of frequence domain thro
25、ugh infinite echo filter')sound(y3,fs,bits)程序运行结果如图4.4所示:图4.4 无限回声滤波器波形分析经过无限回声滤波器的信号可以发现,在时间域上,幅值线更密集且幅值增大,在频域上,幅值减小,但谱线更密集。为了更清楚的现实无限回声滤波器的效果,我们可以调整参数p(为了能清晰分辨出回声,这里将p设为20000),并将原始信号延长,看经过滤波器的效果。x,fs,bits=wavread('e:matlabworkDSP.wav');x=x(:,1);p=20000;a=0.6;b=zeros(p,1);1;a=1;zeros(p-
26、1,1);-a;x=x;zeros(200000,1);y5=filter(b,a,x);plot(y5)sound(y5,fs,bits)经过无限回声滤波器后的时域波形如图4.5所示:图4.5 无限回声滤波器时域波形可以看出,语音信号在时域上一直重复且幅值越来越小,这符合无限回声滤波器的特性。回放的音频信号也是无限重复,且音量越来越小,给人无限重复的感觉。设想如果>1,且将原始音频信号无限延迟(通过在原始信号后面补零实现),那回声会越来越大,直到声音失真。4.6全通结构的混响器全通结构的混响器其程序如下所示:clear allx,fs,bits=wavread('e:matla
27、bworkDSP.wav');x=x(:,1);p=200;a=0.6;b=a;zeros(p,1);1;a=1;zeros(p,1);-a;y6=filter(b,a,x);plot(y6)title('time wave through full-pass filter')figurey7=fft(y6);plot(abs(y6)title('frequence wave through full-pass filter')sound(y6,fs,bits)程序运行结果如图4.6所示:图4.6 全通滤波器波形分析经过滤波器的信号发现,其时间域幅值有所增加,幅值线变得密集,但波形基本不变。频谱线的幅值变大,但谱线变得稀疏。4.6多重回声滤波器多重回声滤波器其程序如下:clear allx,fs,bits=wavread('e:matlabworkDSP.wav');x=x(:,1);p=20000;b=1;zeros(p,1);-0.55;a=1;zeros(p,1);-0.5;y6=filter(b,a,x);plot(y6)title('time wave through mult echo filter')fi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全网络数据挖掘与分析技术实践考核试卷
- 电子商务平台用户体验管理与提升
- 生物科技与农业融合发展-作物保护新策略
- 现代办公环境下的财务信息安全管理
- 2025-2030年回转窑用耐磨耐火砖行业跨境出海战略研究报告
- 2025-2030年地道小吃市集企业制定与实施新质生产力战略研究报告
- 2025-2030年可食用级婴儿手口湿巾行业跨境出海战略研究报告
- 2025-2030年商务休闲女士双肩包行业跨境出海战略研究报告
- 2025-2030年抗疲劳保健食品企业制定与实施新质生产力战略研究报告
- 电商APP的界面设计与用户体验研究
- 《预制高强混凝土风电塔筒生产技术规程》文本附编制说明
- C语言程序设计 教案
- 2025新译林版英语七年级下单词表
- 海洋工程设备保温保冷方案
- 主干光缆、支线光缆线路中断应急预案
- 跨学科主题学习的思考与策略
- 文艺演出排练指导服务合同
- 医院消防安全培训课件(完美版)
- 行政法-9行政确认
- 人教版(2024新版)一年级上册数学第一单元《数学游戏》单元整体教学设计
- 防洪防汛安全知识教育课件
评论
0/150
提交评论