北京科技大学信分析与处理_第1页
北京科技大学信分析与处理_第2页
免费预览已结束,剩余22页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、M和f技桶信号分析与处理基于MATLAB语音信号处理姓名:学号:学院:专业:一、背景介绍11背景近年来,语音识别已经成为一个非常活跃的研究领域。在不远的将来,语音识别技术有可能作为一种非常重要的人机交互手段,辅助甚至取代传统的键盘,鼠标等输入设备,在个人计算机上进行文字录入和操作控制。在智能家电、工业现场控制等其他应用场合,语音识别技术则会有更广阔的发展前景。1.2语音产生的过程语音信号是一种典型的非平稳信号。对于非平稳信号,它是非周期的,频谱随时间连续变化,因此由傅里叶变换得到的频谱无法获知其在各个时刻的频谱特性。如果利用加窗的方法从语音流中取出其中一段,再进行傅里叶变换,就可以得到该语音的

2、短时谱。语音信号的基本组成单位是音素。音素可分为“浊音"和“清音"两大类。浊音的短时谱有两个特点:第一,有明显的周期性起伏结构,这是因为浊音的激励源为周期脉冲气流;第二,频谱中明显的有凸出点,即“共振峰”,它们的出现频率与声道的谐振频相对应。清音的短时谱则没有这两个特点,它十分类似于一段随机噪声的频谱。语音信号具有时变特性,但在一个短时间范围内(一般认为在1030ms内),其特性基本保持不变,即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。任何语音信号的分析和处理必须建立“短时分析”,将语音分段来分析其特征参数,其中每一段称为一“帧”,帧长一般去为1

3、030ms。这样,对于整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。短时能量分析用途:第一,可以区分清音段和浊音段,因为浊音时的短时平均能量值比清音时大得多;第二,可以区分声母和韵母的分界,无声与有声的分界、连字的分界等。1.3语音识别简介总的来说,语音识别的过程是一个模式识别匹配的过程。在这个过程中,首先要根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而在识别过程中要根据语音识别的整体模型,将输入的语音信号的特征与已经存在的语音模板进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入的语音相匹配的模板

4、。然后,根据此模板号的定义,通过查表就可以给出计算机的识别结果。图1-1所示为语音识别的基本结构。语音値号图IX语音识别系统的基本结构与常规模式识别系统一样,语音识别系统包含特征提取、模式匹配、参考模式库三个基本单兀。但是,由于语音识别系统所处理的信息是结构非常复杂、内容极其丰富的人类语音信号。因此,它的结构比通常的模式识别系统要复杂得多。语音识别系统的设计要考虑服务对象、词表大小、工作环境、发音方式、任务性质等许多因素,不同的应用需要采用不同的方法实现,才能达到理想的效果。以这些因素为依据,可以将语音识别系统分为不同的类别:(1) 按发音方式;(2) 按服务对象;(3) 按词汇表的大小;目前

5、代表连续语音识别技术最高水平的语音识别系统是非特定人无限词汇的连续语音识别系统。二、信号来源随着现代科学技术的迅猛发展,信息资源变得越来越重要。通信或信息交换已经成为人类社会存在的必要条件,同时也成为了未来战场胜负的决定因素。语言是人类区别于动物所特有的功能,而语音则是语言的声学表现,是人类传递信息最重要、最有效、最方便的交换信息形式语音降噪技术发展也很多年,主要分为去除平稳噪声的单麦克风降噪,以及抑制方向性噪声的双麦克风降噪。总体而言,以feature形式存在居多,难以从根本上提高语音质量。回音消除技术严格说来,应该属于音频信号处理。不过其中的残余回声抑制,属于语音信号处理。可以看成是语音降

6、噪技术的一种扩展,跟单麦克和双麦克方式都有一定的联系。这个目前在VOIP技术中已经应用广泛,可提高余地已经不大。语音识别技术目前的技术框架主要基于模式识别,对数据的匹配性要求很高,对方言,口音,以及口语的处理能力还存在很大的瓶颈。对于标准口音,还是可以处理的,不过也需要用户不低的配合度。本作业研究的目的就是要提高识别系统在噪声环境下的识别性能,即系统在噪声环境中使用时,仍具有较高的识别分辨率,它能够对不同种类、不同水平的噪声具有相对稳定的性能。本作业实现了一个模拟在噪音下的语音经过降噪处理的语音跟自己要说的话的语音进行对比。该系统属于小词汇量、非特定人、孤立词语音识别范畴,考虑到实际使用存在的

7、环境噪声,因此如何提高噪声环境下的识别效果也是本大作业探讨的一个方面。用手机采样,在风中说出“我们将在风中说话,然后用MATLAB软件进行语音信号处理,这就是我的任务。”然后用软件生成wav格式文件,其命名为'whb.wav'。三、分析与处理的目标31分析方法公元1807年,法国热学工程师J.B.J.傅里叶在热传导问题的研究中提出任意函数的三角级数表示法(即傅里叶级数),他的思想总结在1822年发表的论文热的解析理论中。从此之后,傅里叶变换称为信号处理领域中应用最为广泛的一种分析方法。在数字信号处理领域,信号分析的经典方法有时域分析与频域分析法。时域分析又成波形分析,是用信号的

8、幅值随时间变化之图形或表达式来分析,可以得到信号任一时刻的瞬时值或最大值、最小值、均值、均方根等;也可以通过信号的时域分解,研究其稳定分量与波动分量;对信号的相关分析,可以研究信号本身或相互间的相似程度;研究信号的幅值的分布状态,可以了解信号幅值取值的概率及概率分布情况,此又称为幅值域分析。在传统的信号处理中,人们分析和处理信号的最常用也是最直接的方法是傅里叶变换。傅里叶变换及其反变换建立了信号时域与频域之间变换的桥梁。时域和频域构成了观察信号的两种方式,基于傅里叶变换的信号频域表示及其能量的频域分布揭示了信号的频域特征。但是,傅里叶变换是一个整体变换,在整体上将信号分解为不同频率分量,对信号

9、的表征要么完全在时域,要么完全在频域,作为频域表征的功率谱不能告诉我们某种频率分量出现在什么时间及其变化情况。然而在实际应用场合中,我们遇到的大多数信号都是非平稳的,其统计量是一个时变函数,对信号进行单一时域或频域分析远远不能满足实际处理的需要,这时最希望得到的是信号频谱随时间的变化情况。为了分析和处理非平稳信号,人们对傅里叶变换进行了推广乃至根本性的革命,提出并发展了一系列的信号处理方法,短时傅里叶变换和小波变换就是其中两种重要的方法。3.2常见的几种变换方法3.2.1傅里叶变换傅里叶变换是由傅里叶级数推出来的,傅里叶级数如下所示:x(t)=+工(acosnWct+bsinnwt)0.n0n

10、0n=1其中,®=2兀f=2兀/To一-2ToJ2x(t)cosn®t.dtTo_"丿0022To._j2x(t)smn®t.dt%-002傅里叶正变换:X(=F!x(t)=jx(t)e-j®tdt傅里叶反变换:00傅里叶变换性质有:线性性质;时移性质;频移性质;翻转性质;共轭性质;尺度变换性质;对偶性质;微分性质;积分性质等;3.2.2拉普拉斯变换将函数f(t)乘以一个衰减指数函数使得函数函数收敛,满足绝对可积条件,则可以进行傅里叶变换:f(t)e-9+j®)tdt=Fb+j®Ff(t)ebt=卜f(t)e-bte-j&#

11、174;tdt=卜gg令s=b+j®F(s)=Jgf(t)e-stdt=Lf(t)g1f(t)=Jb+jgF(s)estds=L-iF(s)J厶bjg拉普拉斯变换性质:线性定理;延迟定理;衰减定理;3.2.3短时傅里叶变换基于短时傅里叶变换的非平稳信号的时频分析由非平稳信号的时域波形和频谱图我们可以从整体上对信号有一个了解,并确定信号的频率主要集中在一个相应的范围,但我们无法了解信号的局部信息,应用短时傅里叶变换提供了从时域到时频域的变换,能够做出时频分布图形(二维或三维),从而能够在时频平面上表示出信号中各个分量的时间关联谱特性,在每个时刻指示出信号任一瞬时频率附近的能量聚集情况。

12、在处理语音信号等非平稳随机信号时,简单的频域表示法存在严重不足,因为他们只能表示某一特定时刻信号频谱的分布情况。针对这种非平稳随机信号,我们采用时频域表示法,将一维时域或频域映射到时间和频域的二维信号。短时傅里叶变换公式:X(t,f)=I+*x(t)e(tt')e-2jtdtg其中w(t)是窗函数。3.2.4小波变换信号分析的主要目的是寻找一种简单有效的信号变换方法,使信号所包含的重要信息能显现出来。小波分析属于信号时频分析的一种,在小波分析出现之前,傅里叶变换一直是信号处理领域应用最广泛、效果最好的一种分析手段。傅里叶变换是时域到频域互相转化的工具,从物理意义上讲,傅里叶变换的实质是

13、把f(t)这个波形分解成不同频率的正弦波的叠加和。这样我们可以把对原函数f(t)的研宄转化为对其权系数,即傅里叶f(w)变换的研究。正是傅里叶变换的这种重要的物理意义,决定了傅里叶变换在信号分析和信号处理中的独特地位。傅里叶变换用在两个方向上都无限延伸的正弦曲线波作为正交基函数,把周期函数展开成傅里叶级数,把非周期函数展成傅里叶积分,利用傅里叶变换对函数作频谱分析,反映了整个信号的时间谱特性,较好地揭示了平稳信号的特征。从数学角度来看,傅里叶变换时通过一个基函数的整数膨胀而生成任意一个周期平方可积函数。通过傅里叶变换,在时域中连续变化的信号可转化为频域中的信号,因此傅里叶变换反映的是整个信号在

14、全部时间下的整体频域特征,但不能反映信号的局部特征。傅里叶变换有如下不足:(1) 当我们将一个信号变换到频域的时候,其时间上的信息就失去了。当观察一个信号的傅里叶变换,我们不可能知道特定的事件何时发生;(2) 为了从模拟信号中提取频谱信息,需要取无限的时间量,使用过去的和将来的信号信息只是为了计算单个频率的频谱;(3) 因为一个信号的频率与它的周期长度成反比。对于高频谱的信息,时间间隔要相对较小以给出比较好的精度,而对于低频谱的信息,时间间隔要相对较宽以给出完全的信息,亦即需要一个灵活可变的时间一一频率窗,使在高“中心频率”时自动变窄,而在低“中心频率”时自动变宽,傅里叶变换无法达到这种要求,

15、它只能作全局分析,而且只对平稳信号的分析有用。但是在实际应用中,常常有些非平稳信号,如音乐、语音信号等他们的频域特性都随着时间的变化而改变,这时傅里叶变换明显表现出了其中的不足。Gabor注意到了这些不足,于1946年提出了短时傅里叶变换(Short-TimeFourierTransform,STFT)的分析方法。短时傅里叶变换虽然在一定程度上克服了标准傅里叶变换不具有局部分析能力的缺陷,但它也存在着自身不可克服的缺陷,即当窗函数确定后,矩形窗口的形状就确定了t,w只能改变窗口在相平面上的位置,而不能改变窗口的形状。因此短时傅里叶变换本质上是具有单一分辨率的分析,若要改变分辨率,则必须重新选择

16、窗函数因此,短时傅里叶变换比较适合用来分析平稳信号,不适合分析非平稳信号,在信号波形变化剧烈的时刻,主频是高频,要求有较高的时间分辨率。而波形变化比较平缓的时刻,主频是低频,则要求有较高的频率分辨率,短时傅里叶变换不能兼顾两者。小波变换时一种新的变换分析方法,它继承和发展了短时傅里叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的时间一频率,是进行信号时频分析和处理的理想工具。他的主要特点是通过变换能够充分突出问题某些方面的特征,因此,小波变换在许多领域都得到了成功的应用,特别是小波变换的离散数字算法已被广泛用于许多问题的变换研究中。从此,小波变换越来越引起人

17、们的重视,其应用领域越来越广泛,如:信号处理、图像处理、模式识别、语音识别等。小波变换公式:1t_bt_bWT(b,a)=广*()dt=<x(t),屮()xjaaaa屮(t)二丄屮a,bx.atb(),a,beR,a丰0a四、算法步骤4.1语音信号的采集把语音信号保存为.wav文件,长度小于30秒,并对语音信号进行采样;录制的软件可以使用Windows自带的录音机,也可以使用其他专业的录音软件,录制时需配备录音设备(如麦克风),为了方便比较,需要在安静、无噪音、干扰小的环境录制。4.2语音信号的读入与打开在MATLAB中,x,fs,bits=wavread(blip',NlN2)

18、用于读取语音,采样值放在向量y中,fs表示采样频率(Hz),bits表示采样位数,N1N2表示读取N1点到N2点的值。Sound(y)用于对声音的回放。向量y表示了一个信号,即一个复杂的“函数表达式”,也可以说像处理一个信号的表达式一样处理这个声音信号。下面是语音信号在MATLAB中的语言程序,它实现了语音的读入与打开,并绘制了语音信号的波形频谱图。x,fs,bits=wavread('whb.wav')sound(x,fs,bits)X=fft(x,4096)magX=abs(X)angX=angle(X)subplot(221)plot(x)title('原始信号波

19、形')subplot(222);plot(x);title('原始信号频谱');subplot(223);plot(magX);title('原始信号幅值');subplot(224);plot(angX);title('原始信号相位');程序运行可以听到声音,得到的结果如图4-1所示。原始信寻频谱原始信号波形原始信号幅值原始信号相位.14.3语音信号的分析用MATLAB绘制出语音信号的时域波形图、原始语音信号的频率响应和原始语音的FFT频谱图。clearfs=22050;%语音信号米样频率为22050x,fs,bits=wavread(

20、'whb.wav');sound(x,fs,bits);X=x(:,1);n=length(X);%对信号做length(X)点傅里叶变换%播放语音信号y1=fft(X,n);f=fs*(0:(n/2-1)/n;figure(1);plot(x);title('原始语音信号时域图');%做原始语音信号的时域波形图xlabel('时I、可');ylabel('幅值');figure(2);freqz(X)%绘制原始语音信号的频率响应图title('频率响应图');figure(3);plot(f,abs(y1(1:(

21、n/2);title('原始语音信号频谱');xlabel('时I、可');运行结果如图4-2所示:原始语音信号时域图2345-时间.8O.E4o.O.9-090.-0.4E心-0.-U.8J-ni一窥皋响囱图0.30.40.50.S0.70.8.0.91NormalizedFrequency(xnrad/sample)一了一一一OooooOO55O1-J.2_|I0.5OX10.10.20.30.40.50.60.70.80.9NormalizedFrequency(xnrad/sample)1u(saa6-g)aswLId01800%对信号做length(X

22、)点傅里叶变换%产生一与x长度一致的随机信号加入正弦噪音%做原始语音信号的时域图形4.4含噪音语音信号的合成在MATLAB软件平台下,给原始的语音信号叠加上噪音,噪音类型如下:(1) 单频噪色(正弦干扰);(2) 高斯随机噪声。绘制加噪音后的语音信号时域和频谱图,在视觉上与原始信号图形对比,也可以通过Windows播放软件从听觉上进行对比,分析并体会含噪音语音信号频谱和时域波形的改变。运行程序如下:fs=22050;%语音信号采样频率为22050x,fs,bits=wavread('whb.wav');%读取语音信号的数据,赋给变量x%sound(x,fs,bits);%t=0

23、:1/22050:(size)X=x(:,1)n=length(X);y1=fft(x,n);f=fs*(0:(n/2-1)/n;x1=rand(1,length(X)'x2=x1+X;%t=0:(size(X)-1);%Au=0.3;%d=Au*sin(6*pi*5000*t)'%x2=X+d;sound(x2,fs,bits);figure(1)subplot(2,1,1)plot(x)title('原始信号时域图')subplot(2,1,2)plot(x2)title('加高斯噪声后语音信号时域图')xlabel('时I、可

24、9;);ylabel('幅度');y2=fft(x2,n);figure(2)subplot(2,1,1)plot(abs(y1)title('原始语音信号频谱');xlabel('Hz');ylabel('幅度');subplot(2,1,2)plot(abs(y2);title('加噪语音信号频谱');xlabel('频率');ylabel('幅度');程序运行可以听到声音,得到的结果如图4-3所示:原始信号时域團时间x10'20004.5滤波器的设计双线性变换法设计了巴

25、特沃斯低通滤波器对加噪音语音信号进行滤波,对加入高斯随机噪声和正弦噪声的语音信号进行滤波。用双线性变换设计了巴特沃斯数字低通IIR滤波器对两加噪语音信号进行滤波,并绘制了巴特沃斯低通滤波器的幅度图和两加噪语音信号滤波前后的时域图和频谱图。程序运行如下:x,fs,bits=wavread('whb.wav');sound(x,fs,bits);x2=rand(1,length(x)'%产生一与长度一致的随机信号y=x+x2;%加入正选噪声%t=0:(size(x)-1);%Au=0.3;%d=Au*sin(x)-1'%y=x+d;wp=0.1*pi;ws=0.4*

26、pi;Rp=1;Rs=15;Fs=22050;Ts=1/Fs;wp1=2/Ts*tan(wp/2);%将模拟指标转换成数字指标ws1=2/Ts*tan(ws/2);N,Wn=buttord(wp1,ws1,Rp,Rs,'s');%选择滤波器的最小阶数Z,P,K=buttap(N);%仓【J建butterworth模拟滤波器Bap,Aap=zp2tf(Z,P,K);b,a=lp2lp(Bap,Aap,Wn);bz,az=bilinear(b,a,Fs);%用双线性变换法实现模拟滤波器到数字滤波器的转换H,W=freqz(bz,az);figure(1)plot(W*Fs/(2*p

27、i),abs(H);gridf1=filter(bz,az,y);figure(2)subplot(2,1,1)plot(y);title('滤波前的时域波形');subplot(2,1,2)plot(f1);title('滤波前的时域波形');sound(fl);F0=fft(f1,1024);f=fs*(0:511)/1024;figure(3)y2=fft(y,1024);subplot(2,1,1);plot(f,abs(y2(1:512);title('滤波前的频谱');xlabel('频率');ylabel('

28、幅值');F1=plot(f,abs(F0(1:512);title('滤波后的频谱');xlabel('频率');ylabel('幅值');%绘制频率响应曲线%绘制滤波前的时域图%画出滤波后的时域图%画出滤波前的频谱图%画出滤波后的频谱图程序运行可以播放滤波前的语音信号,对比滤波前的语音效果,得到的结果如图所示:1.4滤浪前的时域波形滤浪前的时域波形210xW-1滤浪前的频谱2.520WU.546小波变换短时傅里叶变换加的窗函数是固定的,这个窗函数形状的选择和窗的长度选择目前很难达到完美,只能由经验取折中。小波变换采用多分辨分析,窗函数

29、是变化的,是非均匀得划分时频空间。它使信号能在一组正交基上进行分解,为非平稳信号的分析提供了比传统观念更加吻合的新途径。小波分析的时域和频域的局部变换特性,与语音信号“短时平稳”的特点正好吻合。傅里叶变换是研究函数奇异性的主要工具,其方法是研究函数在傅里叶变换的衰减以推断函数是否具有奇异性和大小。但是傅里叶变换缺乏空间局部特性,它只能确定一个函数奇异性的整体性质,而难以确定奇异点在空间的位置及分布情况。小波变换具有空间局部化性质,因此,利用小波变换来分析信号的奇异性及奇异性的位置是比较有效的。小波变换较传统的傅里叶变换在语音信号处理上的优势不必赘述,小波变换在语音信号处理中得到广泛应用和优良表

30、现,小波分析同时具有理论深刻和应用广泛的双重意义。近年来,小波变换在信号处理领域。各种传统的语音增强算法与小波变换结合,以便取得更加好的语音增强效果。对于语音算法的效果来说,小波函数的选取至关重要。影响小波性能的因素有两个一个是小波函数的支撑范围;另一个是小波函数的消失矩。小波函数的支撑范围越大,小波在时域内的伸缩性就越好。小波函数的消失矩越高,则在小波函数中低于消失矩的低频信号成分都会变为0,那么反映在小波变换中的就有信号的高频成分,这有利于突出信号的高频成分及信号中的突变点。对加入噪声的语音信号进行小波分解,估计噪声方差,得到去噪后的语音信号。程序运行如下:clearall;%在噪声环境下

31、语音信号的增强sound=wavread('whb.wav');cound=length(sound);noise=0.05*randn(1,cound);y=sound+noise;%用小波函数'db6'对信号进行3层分析C,L=wavedec(y,3,'db6');%估计尺度1的噪声标准偏差sigma=wnoisest(C,L,1);alpha=2;%获取消噪过程中的阈值thr=wbmpen(C,L,sigma,alpha);keepapp=1;%对信号消噪yd=wdencmp('gbl',C,L,'db6',

32、3,thr,'s',keepapp);subplot(1,2,1);plot(sound);title('原始语音信号');sunplot(1,2,2);plot(yd);title('去噪后的语音信号');程序运行可以播放滤波前的语音信号,对比滤波前的语音效果,得到的结果如图所示:原始语音信号去噪后的语音信号47小波变换在语音信号压缩上的应用应用一维小波分析之所以能对信号进行压缩,是因为一个比较规则的信号是由一个数据量很小的低频系数和几个高层的系数组成的。这里对低频系数的选择有一个要求,即需要在一个合适的分解层上选取低频系数。利用函数wdenc

33、mp进行语音信号的压缩,程序运行如下:clearall;%语音信号的读入sound=wavread('whb.wav');%用小波函数haar对信号进行5层分解C,L=wavedec(sound,5,'haar');%获取信号压缩信号的阈值thr,nkeep=ddencmp('cmp','wv',sound);%对信号进行压缩cp=wdencmp('gbl',C,L,'haar',5,thr,'s',1);subplot(1,2,1);plot(sound);title('原始语音信号');subplot(1,2,2);plot(cp);title('压缩后的语音信号');程序运行可以得到的结果如图所示:原始语音信号压缩后的语音信号五、结果分析与评价通过上述分析可知,傅里叶变换缺乏空间局部特性,它只能确定一个函

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论