版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验二语音信号的频域处理一、实验目的、要求(1)掌握语音信号频域分析方法(2) 了解语音信号频域的特点(3) 了解谱减法作为频域语音增强的原理与编程实现(4) 了解谱减法的缺点,并分析产生该缺点的原因二、实验原理语音虽然是一个时变、非平稳的随机过程。但在短时间内可近似看作是平稳的。因此如果能从带噪语音的短时谱中估计出“纯净”语音的短时谱,即可达到语音增强的目的。由于噪声也是随机过程,因此这种估计只能建立在统计模型基础上。利用人耳感知对语音频谱分量的相位不敏感的特性,这类语音增强算法主要针对短时谱的幅度估计。短时话幅度估计概述设一帧加窗后的带噪语音为y(n)=s(n)d(n)OnN1(2.1)其
2、中s(n)为纯净语音,d(n)假设为平稳加性高斯噪声。将y(n)在一组基七(n)上展开,使展对系数为各不相关的随机变量。设y(n)的相关函数为Ry(n,m),由KL展开得知(n)满足(2.2)N1(K)k(n)-Ry(n,m):(m)m=0则y(n)的展开式为LN(2.3)y(n)=£Yk*kn)K=0N1Yk="y(n)kn)n=0如果y(n)的相关长度小于帧长N,则久(n)的近似函数为(2.4)巾1'2nnk)Q(n)=-j=exp.jJ2nINJ可见y(n)的展开过程实际上相当于离散博里叶交换,其展开系数(为傅里叶变换系数。由y(n)=s(n)+d(n),则有
3、:Yk=Sk+Nk。其中K=|Yk|expj"、Sk=|Sk|expj外、Nk分别为y(n)、s(n)及d(n)的傅里叶交换系数。由于假设噪声是高斯分布的,其傅里叶系数Nk相当于多个高斯样本的加权和,故可认为仍然为高斯分布。其均值为0,方差可通过无语音时对噪声的分析而获得。语音增强的任务就是利用已知的噪声功率谱信息,从K中估计出&。由于人耳对相位不敏感,故只需估计出18k|,然后借用带噪语音的相位,进行傅里叶逆变换就可得到增强的语音。基于短时谱幅度估计的方法的原理图如图2.1所示。图2.1短时谱估计原理图噪声特性在短时谱幅(STSA)估计基础上,人们提出了许多语音增强算法。基
4、本思想是利用输入带噪语音短时谱幅来估计清洁语音短时谱幅,结合带噪语音相位信息,得到增强信号。运用短时傅里叶变换(STFT)和重叠相加是短时谱估计技术中最常用的方法。输入信号y(n)的短时谱幅|Y(k)|与一个修正因子相乘,得到增强信号谱幅度|S(k)|(通常修正因子与噪声信号d(n)谱幅估计密切相关);或将含噪语音谱幅减去噪声谱幅估计,得到增强信号谱幅,这些方法统称为相减类型算法(subtractivetypealgorithms)0噪声谱幅估计可以通过有声、无声检测获取。一般认为噪声与信号不相关,增强信号谱幅|S(k)|是清洁语音信号s(n)的谱幅估计。通常假设人耳对含噪语音相位产生的畸变不
5、敏感,所以进行IDFT恢复成时域信号时,含噪语音的相位一般不作处理。、使用仪器、材料微机(带声卡)、耳机,话筒。四、实验步骤(1) 分析含噪语音信号的频谱(幅度谱和相位谱)(2) 获取噪声信号频谱(幅度谱)(3) 对含噪语音信号进行分帧并进行加窗处理(4) 将含噪语音信号谱和噪声谱作为输入,进行谱减法(5) 回复增强语音信号帧.(6) 对比输入信号与增强信号波形,分析算法对其产生的影响五、实验过程原始记录(数据,图表,计算)假设y(n)为含噪语音离散时间序列,由清洁语音信号s(n)和非相关加性噪声信号d(n)组成。y(n)可表示为y(n)=s(n)+d(n)(2.5)将输入信号按帧处理,前后帧
6、之间重叠(一般为50%),对每帧含噪语音进行加窗处理,然后进行FFT变换,变换到频率域。含噪语音的能量谱可以表示为(2.6)(2.7)|Y(k)|2M|S(k)|2+|D(k)|2其中Y(k)为N2小nY(k)=£y(n)eN=|Y(k)|e"k)n=0其中中(k)为含噪语音Y(k)的相位。由于没法直接得到含噪语音中噪声能量谱|D(k)|2,一般将无声阶段的数帧噪声信号进行能量谱加权平均得到噪声能量谱估计|D(k)|2o假设噪声与语音信号不相关,语音能量谱估计为(2.8)|S(k)|2=|Y(k)|2-|D>(k)|2其中清洁语音能量谱估计利。出丁咪严耳匕里崎伯W,咪
7、W日十晚严目匕里崎切仔仕左并,工1(3.4)臼目匕口现负值,为了避免能量谱出现负值,将这些负值设为零,这一处理称为半波整流(half-waverectification)0通过半波整流,清洁语音能量谱估计|S(k)|2可表示为|S(k)|2=;|S(k)|0当|S(k)|20当|S(k)|,0(2.9)结合含噪语音相位信息,通过逆离散傅里叶变换(IDFT)得到时域清洁语音信号的估计信号?(n)S(n)=IDFT(|S(k)|ej9k)其中增强语音信号频谱S(k)也可以通过时变滤波器G(k)重建S(k)=G(k)Y(k)式中时变滤波器(或称为增益函数)G(k)可表示为出(62、。.5(1-ct-
8、'',)|Y(k)|2G(k)=,(P严|Y(k)|2如果|8(k)|2:,1|Y(k)|2-:>":1(2.10)(2.11)(2.12)否则六:实验结果,及分析规一化幅度值0-0.5-100511522.53T5X10*样本数(个)1归一化幅度值050-06(a)原始含噪语音2.5335样本数(个)-100.511.52(b)谱相减增强语音1规一化幅度值0.50-0.5-100511,522533.5x104样本数(个)归-化幅度值05-05(c)原始含噪语音-100.511.522.5(d)谱相减增强语音335样本数f个)图2.2谱减法结果分析实验结果:图
9、2.2中(a),(c)为不同信噪比输入含噪语音信号,图2.2中(b),(d)为对应增强语音信号。当信噪比较低时,降噪效果较差。并且引入音乐噪声。算法缺陷分析:(1)不可避免的引入音乐噪声。要有效地滤除含噪语音中的噪声,需要准确地估计含噪语音中噪声的频谱。噪声谱估计越准确,增强信号谱中音乐噪声越小。然而,由于不能直接得到噪声谱,在绝大多数谱相减算法中,通过加权平均无声阶段噪声谱得到噪声谱估计,这种噪声谱估计与含噪语音中的瞬时噪声谱存在差异,噪声平稳性越差,差异越大,由于这种差异的存在,谱相减不可避免地引入音乐噪声。(2)半波、全波整流式(3.4)中负能量值的产生是由于噪声谱估计发生了错误。这些负
10、值用半波整流(被设定为0)或全波整流(被设定为绝对值),这样处理并没有纠正这种错误,可能导致时域信号更进一步的失真。(3)用含噪语音的相位作为增强语音的相位在生成增强时域信号时,含噪语音的相位并没有作任何修改。这是基于这样一个事实,相位的失真对语音质量下降造成的影响不大。当信噪比比较高(>5dB)时,相位失真确实对语音质量的影响不大,然而,当信噪比较低时(<0dB)这种由于相位失真造成的语音质量下降是可以感觉得到的。七、实验参考程序代码谱相减原程序代码hanning=zeros(1,256);speech=zeros(1,32000);语音信号处理实验2noise.wav'
11、);%噪声;语音信号处理实验2speech.wav');%纯语音;hanning=zeros(1,256);noise=dd(10000:45000);speech=sp(25000:60000);e2=noise+speech;szeros=zeros(1,32000);soutput1=zeros(1,32000);j=sqrt(-1);a=3,b=0.01;Snoise=zeros(1,256);phase=zeros(1,256);forn=1:256hanning(n)=(1/2)*(1-cos(2*pi)*(n-1)/255);end%togetnoisespectralN
12、oise=zeros(1,256);Noise1=zeros(1,256);fori=1:3Noise1(1:256)=abs(fft(e2(1+i*256:256*(i+1).*hanning');Noise=Noise+Noise1/3;end%spectralsubtractionalgrithmfori=1:245%第i帧snoise=e2(i-1)*128+1:(i-1)*128+256).*hanning'phase=angle(fft(snoise);%togetnoisysignalspectralphaseSnoise=abs(fft(snoise);%tog
13、etnoisysignalspectralamplitudeforn=1:256if(Snoise(n)A2-Noise(n)A2)<0%thepowerofenhancedspeechmustbepositiveSout0(n)=0.1*Snoise(n);elseSout0(n)=(Snoise(n)A2-(Noise(n)*1.5)A2)A0.5;%powertypespectralsubtractionendS0(n)=Sout0(n)*(cos(phase(n)+j*sin(phase(n);%togetenhancedspeechspectralamplitudeendsou
14、t0=ifft(S0);szeros(i-1)*128+1):(i-1)*128+256)=real(sout0);soutput1=soutput1+szeros;szeros=zeros(1,32000);end%thefollowingisforSNRcalculationsp_energe=zeros(1,256);sn_energe=zeros(1,256);SN=zeros(1,256);in_SNR1=zeros(1,125);out_SNR1=zeros(1,125);snoise=zeros(1,256);fori=1:240snoise=speech(i-1)*128+1:
15、(i-1)*128+256).*hanning'%第i帧清洁语音存放到snoiseSN=noise(i-1)*128+1:(i-1)*128+256).*hanning"%第i帧清洁语音存放到SN%in_SNR1(i)sp_energe(i)=snoise(1:256)'*snoise(1:256);%第i帧清洁语音snoise的能量存放到sp_energe(i)sn_energe(i)=SN(1:256)'*SN(1:256);%第i帧皂声SN的能量存放到sn_energe(i)in_SNR1(i)=10*log10(sp_energe(i)/sn_energe(i);%第i帧含噪语音信号输入信噪比in_SNR1(i)SN=soutput1(i-1)*128+1:(i-1)*128+256).*hanning;%第i帧输出信号存放SNsn_energe1(i)=SN(1:256)*SN(1:256),;%第i帧输出信号SN能量out_SNR1(i)=10*lo
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《NOIP图的基础算法》课件
- 价值观培训班
- 农药采购合同模板
- 白血病捐款班会
- 仁爱版英语初二八年级上册全册教案
- 2024年度航空公司机队更新与租赁合同3篇
- 仁爱版英语七年级上册教案设计
- 2024年度房产购房合同(标的:杭州市江干区套别墅)3篇
- 治疗性沟通实践报告
- 《新风培训》课件
- 妊娠期高血压疾病的护理课件
- 小区物业消防安全职责与日常检查
- 施工现场危险源辨识及风险评价表
- 烟草专卖许可证新办申请表(国)
- 玩转计算机网络-计算机网络原理智慧树知到课后章节答案2023年下青岛大学
- 安全隐患排查台账(附排查表)
- 核安全工程师-核安全综合知识-辐射防护基础-辐射防护剂量限值
- 音乐治疗学基础理论
- 小学二年级期中家长会课件
- 第六届大学生化学实验技能竞赛初赛笔试试题
- 质量通病防治施工措施及质量通病防治措施
评论
0/150
提交评论