




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、. 语音信号分析与处理系统设计精品语音信号分析与处理系统设计摘要语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及
2、信号的可视化,使人机交互更加便捷。信号处理是matlab重要应用的领域之一。本设计针对现在大部分语音处理软件内容繁多、操作不便等问题,采用matlab7.0综合运用gui界面设计、各种函数调用等来实现语音信号的变频、变幅、傅里叶变换及滤波,程序界面简练,操作简便,具有一定的实际应用意义。最后,本文对语音信号处理的进一步发展方向提出了自己的看法。关键字:matlab;语音信号;傅里叶变换;信号处理;目 录1 绪论11.1课题背景及意义11.2国内外研究现状11. 3本课题的研究内容和方法21.3.1 研究内容21.3.2 运行环境21.3.3 开发环境22 语音信号处理的总体方案32.1 系统基
3、本概述32.2 系统基本要求32.3 系统框架及实现32.4系统初步流程图43 语音信号处理基本知识63.1语音的录入与打开63.2采样位数和采样频率63.3时域信号的fft分析63.4数字滤波器设计原理73.5倒谱的概念74 语音信号处理实例分析84.1图形用户界面设计84.2信号的采集84.3语音信号的处理设计84.3.1 语音信号的提取84.3.2 语音信号的调整104.3.2.1 语音信号的频率调整104.3.2.2语音信号的振幅调整114.3.3 语音信号的傅里叶变换124.3.4 语音信号的滤波134.3.4.1 语音信号的低通滤波134.3.4.2 语音信号的高通滤波154.3.
4、4.3 语音信号的带通滤波154.3.4.4 语音信号的带阻滤波164.4 语音信号的输出175 总结18参考文献19致 谢201 绪论语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段。随着社会文化的进步和科学技术的发展,人类开始进入了信息化时代,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储、和获取语音信息,这对于促进社会的发展具有十分重要的意义,因此,语音信号处理正越来越受到人们的关注和广泛的研究。1.1课题背景及意义语音信号处理是一门比较实用的电子工程的专业课程,语音是人类获取信息的重要来源和利用信息的重要手段。通过语言相互传递信息是人类最重要的基本功能之
5、一。语言是人类特有的功能,它是创造和记载几千年人类文明史的根本手段,没有语言就没有今天的人类文明。语音是语言的声学表现,是相互传递信息的最重要的手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。1.2国内外研究现状20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换(fft)等是语音信号数字处理的理论和技术基础。随着信息科学技术的飞速发展,语音信号处理取得了重大的进展:进入70年代之后,提出了用于语音信号的信息压缩和
6、特征提取的线性预测技术(lpc),并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法;80年代初一种新的基于聚类分析的高效数据压缩技术矢量量化(vq)应用于语音信号处理中;而用隐马尔可夫模型(hmm)描述语音信号过程的产生是80年代语音信号处理技术的重大发展,目前hmm已构成了现代语音识别研究的重要基石。近年来人工神经网络(ann)的研究取得了迅速发展,语音信号处理的各项课题是促进其发展的重要动力之一,同时,它的许多成果也体现在有关语音信号处理的各项技术之中。1.3本课题的研究内容和方法1.3.1 研究内容本论
7、文主要介绍的是的语音信号的简单处理。本论文针对以上问题,运用数字信号学基本原理实现语音信号的处理,在matlab7.0环境下综合运用信号提取,幅频变换以及傅里叶变换、滤波等技术来进行语音信号处理。我所做的工作就是在matlab7.0软件上编写一个处理语音信号的程序,能对语音信号进行采集,并对其进行各种处理,达到简单的语音信号处理的目的。1.3.2 运行环境运行环境主要介绍了硬件环境和软件环境。硬件环境: 处理器:inter pentium 166 mx 或更高 内存:512mb或更高 硬盘空间:40gb或更高 显卡:svga显示适配器软件环境:操作系统:window 98/me/2000/xp
8、1.3.3 开发环境 开发环境主要介绍了本系统采用的操作系统、开发语言。(1) 操作系统:windows xp(2) 开发环境:matlab 7.02 语音信号处理的总体方案2.1 系统基本概述图形用户界面(graphical user interface,简称 gui,又称图形用户接口)是指采用图形方式显示的计算机操作用户界面。与早期计算机使用的命令行界面相比,图形界面对于用户来说在视觉上更易于接受。gui的广泛应用是当今计算机发展的重大成就之一,他极大地方便了非专业用户的使用人们从此不再需要死记硬背大量的命令,取而代之的是可以通过窗口、菜单、按键等方式来方便地进行操作。2.2 系统基本要求
9、本文是用matlab对含噪的的语音信号同时在时域和频域进行滤波处理和分析,在matlab应用软件下设计一个简单易用的图形用户界面(gui),来解决一般应用条件下的各种语音信号的处理。2.3 系统框架及实现1) 语音信号的采集 使用电脑的声卡设备采集一段语音信号,并将其保存在电脑中。2) 语音信号的处理语音信号的处理主要包括信号的提取、信号的调整、信号的变换和滤波等。.语音信号的时域分析语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信
10、号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法,直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数等。 提取:通过图形用户界面上的菜单功能按键采集电脑设备上的一段音频信号,完成音频信号的频率,幅度等信息的提取,并得到该语音信号的波形图。 调整:在设计的用户图形界面下对输入的音频信号进行各种变化,如变化幅度、改变频率等操作,以实现对语音信号的调整。.语音信号的频域分析信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理
11、问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更深入地说明信号的各项红物理现象。由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源激励的线性系统的输出。输出频谱是声道系统频率响应与激励源频谱的乘积。声道系统的频率响应及激励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随机信号的表示,但不能直接用于语音信号。由于语音信号可以认为在短时间内,近似不变,因而可以采用短时分析法。 变换:在用户图形界面下对采集的语音信号进行fourier等变换,并画出变换前后的频谱图和变换后的倒谱图。 滤波:滤除语音信号中的噪音部分,可采用低通滤波、高通滤波、带通
12、滤波和帯阻滤波,并比较各种滤波后的效果。3)语音信号的效果显示 通过用户图形界面的输出功能,将处理后的信号的语音进行播放,试听处理后的效果。2.4系统初步流程图图2.1列出了整个语音信号处理系统的工作流程:信号采集信息提取信号调整信号滤波信号变换效果显示图2.1 语音信号处理系统的工作流程其中信号调整包括信号的幅度和频率的任意倍数变化。如下图2.2图2.2 信号调整信号调整幅度调整频率调整信号的滤波采用了四种滤波方式,来观察各种滤波性能的优缺点:信号滤波切比雪夫i型低通滤波椭圆数字带通滤波切比雪夫型带阻滤波切比雪夫型高通滤波图2.3 语音信号滤波的方式在以上三图中,可以看到整个语音信号处理系统
13、的流程大概分为三步,首先要读入待处理的语音信号,然后进行语音信号的处理,包括信息的提取、幅度和频率的变换以及语音信号的傅里叶变换、滤波等;滤波又包括低通滤波、高通滤波、带通滤波和带阻滤波等方式。最后对处理过的语音信号进行处理后的效果显示。以上是本系统的工作流程,本文将从语音信号的采集开始做详细介绍。3 语音信号处理基本知识3.1语音的录入与打开在matlab中,y,fs,bits=wavread(blip,n1 n2);用于读取语音,采样值放在向量y中,fs表示采样频率(hz),bits表示采样位数。n1 n2表示读取从n1点到n2点的值(若只有一个n的点则表示读取前n点的采样值)。 soun
14、d(x,fs,bits); 用于对声音的回放。向量y则就代表了一个信号(也即一个复杂的“函数表达式”)也就是说可以像处理一个信号表达式一样处理这个声音信号。3.2采样位数和采样频率采样位数即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。采样位数和采样率对于音频接口来说是最为重要的两个指标,也是选择音频接口的两个重要标准。无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增加了6db。采样位数越多则
15、捕捉到的信号越精确。对于采样率来说你可以想象它类似于一个照相机,44.1khz意味着音频流进入计算机时计算机每秒会对其拍照达441000次。显然采样率越高,计算机摄取的图片越多,对于原始音频的还原也越加精确。3.3时域信号的fft分析fft即为快速傅氏变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。在matlab的信号处理工具箱中函数fft和ifft用于快速傅立叶变换和逆变换。函数fft用于序列快速傅立叶变换,其调用格式为y=fft(x),其中,x是序列,y是序列的fft,x可以为一向量或矩阵,若x为一向量,y是x的fft且和x
16、相同长度;若x为一矩阵,则y是对矩阵的每一列向量进行fft。如果x长度是2的幂次方,函数fft执行高速基2fft算法,否则fft执行一种混合基的离散傅立叶变换算法,计算速度较慢。函数fft的另一种调用格式为y=fft(x,n),式中,x,y意义同前,n为正整数。函数执行n点的fft,若x为向量且长度小于n,则函数将x补零至长度n;若向量x的长度大于n,则函数截短x使之长度为n;若x 为矩阵,按相同方法对x进行处理。3.4数字滤波器设计原理数字滤波器的作用是利用离散时间系统的特性对输入信号波形(或频谱)进行加工处理,或者说利用数字方法按预定的要求对信号进行变换。数字滤波器可以理解为是一个计算程序
17、或算法,将代表输入信号的数字时间序列转化为代表输出信号的数字时间序列,并在转化过程中,使信号按预定的形式变化。数字滤波器有多种分类,根据数字滤波器冲激响应的时域特征,可将数字滤波器分为两种,即无限长冲激响应(iir)滤波器和有限长冲激响应(fir)滤波器。从性能上来说,iir滤波器传输函数的极点可位于单位圆内的任何地方,因此可用较低的阶数获得高的选择性,所用的存贮单元少,所以经济而效率高。但是这个高效率是以相位的非线性为代价的。选择性越好,则相位非线性越严重。相反,fir滤波器却可以得到严格的线性相位,然而由于fir滤波器传输函数的极点固定在原点,所以只能用较高的阶数达到高的选择性;对于同样的
18、滤波器设计指标,fir滤波器所要求的阶数可以比iir滤波器高510倍,结果,成本较高,信号延时也较大;如果按相同的选择性和相同的线性要求来说,则iir滤波器就必须加全通网络进行相位较正,同样要大增加滤波器的节数和复杂性。整体来看,iir滤波器达到同样效果阶数少,延迟小,但是有稳定性问题,非线性相位;fir滤波器没有稳定性问题,线性相位,但阶数多,延迟大。3.5倒谱的概念l 定义:倒谱定义为信号短时振幅谱的对数傅里叶反变换。l 特点:具有可近似地分离并能提取出频谱包络信息和细微结构信息的特点l 用途: 提取声道特征信息:提取频谱包络特征,以此作为描述音韵的特征参 数而应用于语音识别。 提取音源信
19、息:提取基音特征,以此作为描述音韵特征的辅助参数而应用于语音识别。 求法:a:短时信号;b:短时频谱;c:对数频谱; d:倒谱系数;e:对数频谱包络; f:基本周期4 语音信号处理实例分析4.1图形用户界面设计在matlab主窗口中,选择file菜单中的new菜单项,再选择其中的gui命令,就会显示图形用户界面的设计模板。matlab为gui设计一共准备了4种模板,分别是blank gui(默认) 、gui with uicontrols(带控件对象的gui模板) 、gui with axes and menu(带坐标轴与菜单的gui模板)与modal question dialog(带模式问
20、话对话框的gui模板)。设计语音信号处理系统的用户图形操作界面(gui)soundprocess,其中菜单主要包括file、process和output三大主要部分,其中file菜单包括输入(input)、保存(save)和退出(quit)等功能;process菜单主要包括提取(extract)、调整(extract)、变换(transform)和滤波(filter)菜单,其中调整(extract)包括幅度调整(range)和频率调整(frequency),滤波(filter)菜单包含低通滤波(lowpassfilter)、高通滤波(highpassfilter)、带通滤波(bandpassf
21、ilter)和帯阻滤波(bandstopfilter)等功能菜单。4.2信号的采集该系统是以一段简短的的语音信号做为分析样本,通过计算机系统将一段“主人,信息收到了”的语音信号保存到到计算机中,并且保存格式为“*.wav”。4.3语音信号的处理设计4.3.1 语音信号的提取在matlab中使用wavread函数,可得出信号的采样频率为22500,并且声音是单声道的。利用sound函数可以清晰的听到“主人,信息收到了”的语音。采集数据并画出波形图。其中声音的采样频率fs=22050hz,y为采样 数据,nbits表示量化阶数。部分程序如下: fn=input( enter wav filenam
22、e:,s); %获取一个*.wav的文件x,fs,nb=wavread(fn);ms2=floor(fs*0.002);ms10=floor(fs*0.01);ms20=floor(fs*0.02);ms30=floor(fs*0.03);t=(0:length(x)-1)/fs; %计算样本时刻 subplot(2,1,1); %确定显示位置plot(t,x); %画波形图legend(waveform);xlabel( time(s);ylabel(amplitude); 运行后弹出语音信号处理系统的操作界面如图4.1:图4.1语音信号处理系统的操作界面然后点击file菜单中的子菜单inp
23、ut,回到matlab软件的输入界面如图4.2:图4.2输入界面输入要处理的语音信号的名称,便可得到语音语音的波形图如图4.3: 图4.3语音语音的波形图 如图中提取的语音的波形图所示,整段音频数据中得声音高低起伏与录入的声音信号基本一致,并且可以观察到其中包含部分高频噪声。4.3.2 语音信号的调整在语音信号的研究中,经常会对语音信号进行进行多倍频率以及多倍幅度变换调整,日常应用中,这种变换调整也经常要用到。所以在设计中也添加了这种功能,并能够观察调整后的信号的波形图得变化, 而且能通过语音处理界面的输出功能试听处理后的语音信号。4.3.2.1 语音信号的频率调整 在设计中,可以将语音信号的
24、采样频率提高或降低,来实现语音信号的调整,得到理想的语音信号。例如将采样频率提高一倍,即可得到语音信号频率为原频率2倍新的语音信号。运行processadjustfrequency,得到如图4.4的信号波形图,并试听调整后的效果。图4.4频率调整后波形图与原语音信号相比,经过调整后的信号周期变为原来的1/2,此时的语速明显变快,即实现了信号的2倍频功能。4.3.2.2语音信号的振幅调整在设计中,可以将语音信号的幅度进行提高或降低操作,来实现语音信号的调整,得到声音音量大小不同的语音信号,例如将原语音信号的幅度提高一倍,得到如下图4.5的信号波形图,可以通过gui操作界面的输出功能试听调整后的效
25、果。图4.5 幅度调整后波形图 此时听到的调整后声音声调变高,但不是很明显,可以将幅度的变化值设置的比较大,那样的话就可以得到效果相当明显的语音信号了。4.3.3 语音信号的傅里叶变换倒谱分析是指信号短时振幅谱的对数进行傅里叶反变换。它具有可近似地分离并提取出频谱包络信息和细微结构信息的特点。 对语音信号进行频谱分析,在matlab中可以利用函数fft对信号行快速傅里叶变换,得到信号的频谱图,并进行倒谱分析,得到倒谱图。 傅里叶变换的部分程序如下:x=y(44101:55050,1); %提取原语音信号的一部分t=(0:length(x)-1)/fs; %计算样本时刻subplot(3,1,1
26、); %确定显示位置plot(t,x); %画波形图legend(波形图);xlabel( time(s);ylabel(amplitude);y=fft(x,hamming(length(x); %做加窗傅里叶变换fm=5000*length(y)/fs; %限定频率范围f=(0:fm)*fs/length(y); %确定频率刻度subplot(3,1,2);plot(f,20*log10(abs(y(1:length(f)+eps);legend(频谱图); %画频谱图ylabel(幅度(db);xlabel(频率(hz);c=fft(log(abs(x)+eps); %倒频谱计算ms1=
27、fs/1000;ms20=fs/50q=(ms1:ms20)/fs; %确定倒频刻度subplot(3,1,3);plot(q,abs(c(ms1:ms20); %画倒谱图legend(倒谱图);xlabel(倒频(s));ylabel(倒频谱幅度(hz));运行process transform,对语音信号的一部分进行傅里叶变换,并进行倒谱分析,得到如图4.6图4.6 声音样本波形图、频谱图和倒谱图从上面的倒谱图可以看出当读“主人,信息收到了”时,所对应的频率大概在200hz左右。这与人的语音信号频率集中在200 hz到4.5 khz之间是相一致的。而在未发声的时间段内,相对的小高频部分(2
28、00500hz)应该属于背景噪声。4.3.4 语音信号的滤波 从图4.4中发现,语音信号中包含背景噪声,这些噪声的频率一般较高。所以可以利用matlab软件中的滤波器进行滤波处理,得到较为理想的语音信号。4.3.4.1 语音信号的低通滤波 系统中设计了一个截止频率为200hz切比雪夫i型低通滤波器,它的幅频特性如下图4.7:图4.7 低通滤波器的幅频特性低通滤波器性能指标: wp=0075pi,ws =0125pi,rp=025;as =50db;经过低通滤波器处理后,比较处理前后的波形图的变化,如下图4.8:图4.8 低通滤波后波形和频谱的变化低通滤波后,声音稍微有些发闷、低沉,原因是高频分
29、量被低通滤波器衰减。但是很接近原来的声音。4.3.4.2 语音信号的高通滤波运用切比雪夫型数字高通滤波器,对语音信号进行滤波处理。高通滤波器性能指标: wp=0375pi,ws =0425pi,rp=025;as =50db;然后将其与原信号的比较图如下图4.9:图4.9高通滤波后波形和频谱的变化高通滤波后,此时只有少许杂音,原因是低频分量被高通滤波器衰减,而人声部分正好是低频部分,所以只剩下杂音,或者发出高频杂音但人的耳朵听不到。4.3.4.3 语音信号的带通滤波运用椭圆数字带通滤波器函数,对语音信号进行滤波处理后其与原信号的比较图如下图4.10:图4.10带通滤波后波形和频谱的变化4.3.
30、4.4 语音信号的带阻滤波运用切比雪夫型数字带阻滤波器,对语音信号进行滤波处理后其与原信号的比较图如下图3.11:图4.11帯阻滤波后波形和频谱的变化从以上各种数字滤波器经过滤波后得出的语音信号相比较,低通滤波后,声音稍微有些发闷,但是很接近原来的声音;高通滤波后听不到人的声音;带通滤波后声音有点像机器人小叮当发出的声音。带阻滤波后,声音比较接近原来的声音。从频谱图中我们可以看出声音的能量主要集中在低频(0.2pi即22045hz以内)部分。4.4 语音信号的输出 可以将处理后的语音信号在matlab软件先播放,体验处理后的语音信号的效果。还可以将处理后的语音信号保存在电脑上。运行filesave,保存处理后的语音信号。如果没有语音信号被处理,则系统会出现提示如下图4.12:图4.12 保存提示界面如果有语音信号被处理,运行filesave,系统会出现提示如下图4.13:图4.13 保存界面保存后,整个操作过程就完成了。5 总结本文对语音信号处理系统的设计作了详细的介绍,采用一系列图像分析和处理技术,实现了语音信号的基本处理的功能,经过测试运行,本设计圆满的完成了对语音信号的读取与打
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 5《守株待兔》教学设计-2024-2025学年语文三年级下册统编版
- 8《大家的“朋友”》教学设计-2023-2024学年道德与法治三年级下册统编版
- 户外体操活动的准备与配合培训
- 02 姓氏歌 教学设计-2024-2025学年语文一年级下册统编版
- 治安管理法律
- 边坡作业安全教育培训
- 邮政物流文员培训
- Unit 1 My School 第四课时(教学设计)-2024-2025学年人教PEP版英语四年级下册
- Unit 4 Chinese and English names(教学设计)-2024-2025学年冀教版(2024)初中英语七年级上册
- 营销考核管理办法解读
- 部编版六年级语文下册期中考试卷(有答案)
- 电梯安全管理员考试题库
- 2024年4月自考00153质量管理(一)试题及答案
- 演出经纪人资格证常见试题及答案分析
- 2025年山东省东营市2024-2025学年下学期九年级模拟一模数学试题(原卷版+解析版)
- 大坝固结灌浆与帷幕灌浆施工方案
- 交警道路交通安全执法规范化课件
- 人教五四 六年级 下册 语文 第五单元《中国有能力解决好吃饭问题 第二课时》课件
- 2025年湖北省八市高三(3月)联考物理试卷(含答案详解)
- 贵州国企招聘2024贵州磷化(集团)有限责任公司招聘89人笔试参考题库附带答案详解
- 对标一流-2025年国央企风控合规案例白皮书
评论
0/150
提交评论