基于LabView的语音信号分析系统_第1页
基于LabView的语音信号分析系统_第2页
基于LabView的语音信号分析系统_第3页
基于LabView的语音信号分析系统_第4页
基于LabView的语音信号分析系统_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、湖南理工学院毕业设计(论文)学号业设计(论文) 题目: 基于LabVIEW的语音信号分析系统的设计 作 者 贾 邦 稳 届 别 2015 届 院 别 信息与通信工程学院 专 业 电子信息工程 指导教师 彭仕玉 职 称 副教授 完成时间 2015 年 5 月 摘 要虚拟仪器与传统仪器相比,实现了仪器的智能化、模块化、多样化等功能,体现出多功能、低成本等操作优点,应用前景广阔。随着计算机的出现及计算机技术的快速发展,语音信号处理技术更是得到了飞速发展,得到了广泛的应用,如语音合成技术、语音压缩编码和语音识别技术。本设计利用虚拟仪器软件平台LabVIEW 设计了一个语音信号

2、分析系统。先介绍了四种采集语音信号的方法,并选择采用录音机录制的方法采集语音信号,然后设计基于LabVIEW的时域信号的FFT分析模块,接着设计截止频率为3000Hz的Butterworth低通滤波器对语音信号进行滤波去噪,最后根据以上设计进行语音信号的时频分析、特性分析等。关键词:虚拟仪器;LabVIEW;语音信号;时频分析;数字滤波器AbstractCompared with traditional instruments, virtual instruments achieve the intelligent, modularity, diversity and other functi

3、ons of the instrument, and reflect the operating advantages, such as multi-purpose, low cost, etc. So it has broad application prospect. With the advent of computers and the rapid development of computer technology, speech signal processing technology has been develop rapidly, and used widely, such

4、as speech synthesis technology, speech coding and speech recognition technology.This design projects a speech signal analysis system based on the virtual instrument software platform LabVIEW. The first step is to introduce the methods of four kinds of voice signal acquisition, and select t

5、he method of recording voice signal by recorder . The second step is to design FFT analysis of time-domain signals which based on LabVIEW. Then design Butterworth low pass filter to realize the filtration of speech signals which cutoff frequency is 3000hz. Finally it is to achieve time-frequenc

6、y analysis and characteristic analysis according to the the above designs.Key words:Virtual instruments;LabVIEW;Speech signal;time-frequency analysis;digital filter.目 录摘 要IAbstractII目 录III第1章 绪 论11.1 虚拟仪器概述11.2 语音信号处理的发展及应用21.3 本课题研究任务及章节安排4第2章 系统设计方案52.1系统基本概述52.2系统总体实现52.3系统框图7第3章 语音信号的采集83.1

7、 语音信号的采集方法83.2 声卡的相关介绍及参数设置103.2.1 LabVIEW中的相关声卡函数103.2.2声卡的参数及设置113.3 读取历史语音信号的设计14第4章 基于LabVIEW的语音信号分析的实现154.1语音信号的时域分析154.1.1语音信号的预处理154.1.2语音信号的短时能量和短时平均幅度函数174.1.3语音信号的短时自相关函数和短时平均幅度差函数184.2语音信号的频域分析184.3滤波器的设计及滤波实现204.4语音信号的综合实现234.4.1语音分析系统的整体设计234.4.2语音信号的时频分析24第5章 总结25参考文献26致 谢27附 录2827第1章

8、绪 论1.1 虚拟仪器概述1986年美国NI公司最先提出“虚拟仪器”。其利用应用程序将功能化模块与通用计算机结合在一起,用户能通过计算机强大的在线帮助功能和数据处理存储图形环境,建成图形化界面的虚拟仪器软面板,存储和显示仪器的控制数据分析,使传统仪器的使用方式进行变换,增强仪器的功能、提高仪器的使用效率,从而大幅度降低仪器的成本,同时让用户能根据自己的需求设计仪器的功能。虚拟仪器以传统仪器为基础,继承发展了其所有的优点,而且还超越了前者。虚拟仪器在计算机中引入了传统仪器的显示和硬件数据处理,并用软件进行处理。虚拟仪器作为一个全新的概念,虚拟仪器是仪器技术和计算机的结晶,其也是计算机和测试技术深

9、层次结合的产物。虚伪仪器相较于传统仪器打破了其“万能”功能概念,将计算机技术运用到极致,特别强调“软件即仪器”.还可以利用LabVIEW、Agilent VEE等虚拟仪器软件开发平台来开发。在某种程序上软件能做到传统仪器不可能实现的一些硬件测试功能,例如,可以实现用户自己定义仪器或系统的功能、规模,虚拟仪器的功能软件的模块化和开放性,让组建系统变得更加灵活简单。虚拟仪器具有强大的功能,比如信号分析、数据处理等,还有友好的人机界面。特别地,用户不必花费大量钱财投资于多台不同功能的仪器,编程用户可以根据需要对各个功能和面板进行扩展和自定义。用户还可以修改程序实现对不同环境的测量、通过网络实现仪器的

10、远程调试和控制,以节省资源。常见的虚拟仪器有双踪示波器和频谱分析仪、多踪信号示波器、双踪仪器库、多踪X-Y轨迹仪、传递函数(频响特性)分析仪、多踪频谱分析仪等。虚拟仪器系统是由计算机、应用软件和仪器硬件三大要素构成的。计算机与仪器硬件又称为VI的通用仪器硬件平台。虚拟仪器的主要特点有:扩展性强、性能高、智能化程度高、灵活性好、界面友好、兼容性、开发时间少。虚拟仪器与传统仪器相比,实现了仪器的智能化、模块化、多样化等功能,体现出多功能、低成本等操作优点。具有更广泛的应用范围,在工业上的应用有羟基镍在线检查系统、输油泵机组在线监测系统、信号分析系统、桥墩位移监控系统、发电机组在线监测诊断系统、锅炉

11、供热自动控制系统等。因此它成为仪器行业发展的一个重要方向,并受到许多国家仪器行业的重视。世界上最早开发和应用虚拟仪器的公司是National Instruments公司。20世纪70年代,杰姆特鲁查德和杰夫柯德斯凯为美国海军研制了一种基于计算机的声呐测试仪,其可以再计算机的控制下完成指定指令的测试工作,毕竟是第一次开发虚拟仪器,成本与开发周期都不太理想。后来他们二人在多次研发、总结经验后,尝试功能模块化处理,从而使程序结构和操作的复杂性大大简化。1986年5月NI公司推出了LabVIEW Beta版本,同年10月推出了LABVIEW 1.0正式版。这些软件先是运行在Macintosh平台上,后

12、来出现了Windows 3.0操作系统,操作性能更加良好。科学技术迅猛发展的今天,在自动测试、仪器控制和数据采集等领域无一例外不应用到虚拟仪器技术,测试系统和仪器控制的设计方法与实现技术也因为虚拟仪器技术而发生了深刻的变化。测试与测量技术发展的重要标志也渐渐趋向“软件即仪器”。作为新兴的测控仪器,用户可以对虚拟仪器进行充分的想象并发挥,根据自己的实际需要设计符合开发要求的仪器系统。虚拟仪器具有先进的性能和广泛的应用前景吸引着许多国际知厂商如HP公司、PC仪器公司、Racal公司等先后开始研发虚拟仪器。常见的虚拟仪器开发软件是NI公司提供的LabVIEW和LabWindowa/CVI两种。Lab

13、Windowa/CVI是NI公司推出的一种基于C语音的虚拟仪器开发平台十分适合于开发面向测控领域的基于Windows的图形化应用软件。其以ANSIC和扩展集为编程语言,含有丰富的标准库函数,如RS232、GPIB、VISA、数据分析和TCP协议函数库等,可以进行测量、控制、数据传输及处理等。本设计主要采用LabVIEW。LabVIEW由NI公司推出,是一种图形化编程语言,与传统的文本编辑语言中的子程序或函数相似,虚拟仪器就是用LabVIEW开发的软件,其操作界面与现实中的仪器几乎没有什么差别,但功能却比现实中的传统仪器更强大。LabVIEW的全称是Laboratory Virtual Inst

14、rument Engineering Workbench,其源程序完全是图形化框图,没有文本代码,称图形化源代码为G代码。在LabVIEW平台上编写的程序拓展名是VI。LabVIEW还包括大量工具和函数、大量的控件,用来进行数据采集、分析、显示与存储等操作。不仅如此还提供了许多接口,方便与DDL、Visua Basic、 MATLAB等多种软件相互调用,大大拓展了其功能。它附带的扩展库函数,还能在自身配备的工具不能完成一些任务时,调用专业的数据采集和处理工具包扩展库进行强大的专业分析。它也具有强大的仪器驱动库可以和多种仪器连接。软件LabVIEW能编出功能强大、界面美观的程序,其编程语言简单形

15、象,可以让初学者很容易学习、掌握,也能够很快地掌握各类编程技巧。作为编程者你可以在编程过程中,直接找到所需控件然后拖动至程序框图中,再一一对应进行连线,便可以进行数据的传送了,避免了很多复杂的公式运算、程序调用及传递参数,十分简便。LabVIEW经过快速发展,自问世至今已被大多数人所认同。它已然成为当今测控领域的潮流热点,代表着未来虚拟仪器的发展方向。1.2 语音信号处理的发展及应用语音是人类相互交流和通信最方便快捷的手段,也是获取信息的重要来源和利用信息的重要手段。在高度信息化的今天,语音处理的一系列技术及应用已经成为信息社会不可或缺的重要组成部分。语言是人类特有的功能,其是记载和创造几千年

16、以来人类文明史的主要手段,如果没有语言那么就没有今天的人类文明。其中语音既是语言的声学表现,也是相互传递信息的最重要的手段之一,是人类最有效、最重要、最方便和最常用的交换信息的形式。语音信号的处理研究就是是起源于发声器官的模拟。早在一两千年以前,人们便对语音信号进行了研究。由于没有适当的仪器设备,长期以来,一直是由耳倾听和用口模仿来进行研究。因此,这种语言研究常备称为“口耳之学”,所以对语音只是停留在定性的描写上。语音信号处理真正意义上的研究可以追溯到1876年贝尔电话的发明,该技术首次用声电、电声转换技术实现了远距离的语音传输。1939年Homer Dudley提出并研制成功的第一

17、个声码器,从此奠定了语音产生模型的基础。这一发明在语音信号处理领域具有划时代的意义。19世纪60年代,亥姆霍兹应用声学方法对元音和歌唱进行了研究,从而奠定了语音的声学基础。20世纪40年代,一种语言声学的专用仪器语谱图仪问世了。它可以把语音的时变频谱用语图表示出来,从而得到了“可见语言”。1948年美国Haskins实验室研制成功“语音回放机”,该仪器可以把手工绘制在薄膜片上的语谱图自动转换成语音,并进行语音合成。20世纪50年代对语言产生的声学理论开始有了系统论述。随着计算机的出现,语音信号处理的研究得到了计算机技术的帮助,使得过去受人力、时间限制的大量的语音统计分析工作,得以在电子计算机上

18、进行。作为高科技应用领域的研究热点,语音信号处理技术主要研究和利用数字信号处理技术(DSP)对语音信号进行处理与分析,让未来的计算机更加智能,做到“能听会说”。语音分析会涉及许多很难的数学运算,但考虑到它的价格和灵活性,不建议采用硬件方式实现,对于用计算机软硬件结合的方法,采用主流的编程方式实现就可能存在不易拓展、编程复杂、界面不友好等问题。但若采用图形化软件LabVIEW,就会具有编程功能完备、有丰富的各种板卡和多种专用软件包可供选择等优点,就能很方便地提供一个界面友好、符合要求的语音分析开发平台。语音处理主要从基础理论、算法实现及实际应用等方面来研究。主要研究以下两个方面:一是从语音产生和

19、语音感知来研究;二是将语音作为一种信号进行处理。从20世纪60年代出现的数字滤波器、FFT到后来出现的线性预测编码技术,以及80年代出现的分析合成法、马激励线性预测、矢量量化、隐马尔可夫模型等一系列算法和模型等都极大地推动了语音信号处理的发展和应用。语音信号处理有着非常广泛的应用,最基本的是语音的数字传输,也就是键语音进行数字化后在数字通信系统中进行传输,以实现数字语音通信。主要从语音合成技术、语音压缩编码和语音识别技术这三个方面介绍语音处理的应用。语音合成技术的目的就是让计算机说话。按规则的文字语音合成系统将文字转换成语言让计算机模仿人来朗读文本。语音压缩编码技术的目的是在保证一定语音质量的

20、前提下,尽可能降低编码的比特率,以节省频率资源。实现语音压缩码的设备通常称为声码器,还可以利用线性预测、矢量量化、码本激励等技术来实现语音压缩编码。根据语音压缩采样率,语音压缩编码可分为3003400Hz的窄带、7kHz的宽带和20kHz的音乐带宽压缩编码。语音识别技术语音识别以语音为研究对象,最终目标是将语音转换成等价的书面信息实现人与机器进行自然语言通信。语音识别可以有许多分类方法,目前研究的重点是实现大词汇表、费特定人的连续语音识别系统,可应用于人机直接对话、语音打字机、两种语音之间的直接通信等。语音识别有着广泛的应用,若将语音识别与语音合成结合起来还可以实现甚低比特率的语音通信系统。1

21、.3 本课题研究任务及章节安排本课题研究的主要任务是设计基于LabVIEW的语音信号分析系统。语音信号分析系统包括时域分析和频域分析,语音信号的时域参数包括短时能量、短时过零率、短时自相关函数和短时平均幅度差函数等。语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱网络分析等频谱特性进行分析。但是本设计只进行了频谱分析。首先需要了解LabVIEW平台以及掌握LabVIEW的编程基础,在此基础上再设计相应的语音信号采集、语音信号时频分析、语音信号的滤波去噪处理等模块,用于进行语音信号的时频分析、特性分析等。本文共分为5个部分进行论述:第一章为绪论部分,介绍了虚拟仪器和语音信号处理的发展和

22、应用;第二章为系统的设计方案,交代了整体思路和设计流程;第三章主要介绍了语音信号的采集与声卡的相关知识;第四章介绍语音信号的处理分析,包括时域、频域分析、滤波分析;最后是总结,对本设计的一些不足之处进行总结,并提出进一步的研究方向。第2章 系统设计方案2.1系统基本概述本系统的设计思路如下:先设计基于计算机自带声卡和LabVIEW 的语音信号的采集模块;然后设计时域信号的快速傅氏变换模块、语音信号的滤波去噪模块,对于滤波处理模块设计了巴特沃斯低通滤波器进行滤波去噪;最后根据各个模块来进行语音信号的时域分析、频谱分析、特性分析。利用LabVIEW编程出语音信号分析系统的前面板图和程序流程图,搭建

23、基于LabVIEW开发平台的上述信号处理模块。采集语音信号频谱分析设计滤波器滤波去噪频谱分析图2.1 系统流程图2.2系统总体实现语音分析平台由软、硬件两部分组成。硬件部分:硬件部分的任务是利用麦克风和声卡将语音信号转换为电信号,经过A /D转换,以数字信号的形式传入计算机,还能通过声卡外接耳机或音箱将语音波形文件回放。硬件包括三个部分:拾音及信号调理电路,A /D转换电路,PC机接口电路。如今声卡作为计算机的标准配置,采用声卡与话筒的组合采集声音,可以省去大量硬件设计工作,使用起来非常简便。声音输入A/D转换放大器PGA放大器PGADSP放大器PGA放大器PGAD/A转换A/D转换PCA总线

24、声音输出图2.2 声卡工作流程显示(文件操作、图形图表处理、数据输出等)软件部分:LabVIEW的编程包括前面板和程序框图两个部分的设计。前面板就好像是一台仪器的面板,所呈现出来面板的和实际仪表面板几乎无差,可以对仪表进行控制、将信号显示表达出来。LabVIEW包含非常强大的控制模板库,用户可以找到所需模板并利用其来进行设计。而程序框图面板就负责一台仪器的内部工作部分,用于实现仪表对信号的采集处理等操作。对应的LabVIEW包含的功能模板库,用来帮助用户实现程序改造、仪器控制数据分析等功能。主要的功能模块如下:采集与预处理、时域处理、频域处理。数据采集与控制(RS232、GPIB、DAQ、PX

25、I、PCI等)信号分析处理(波形操作、数据滤波、数组处理等)被测信号图2.3 LabVIEW系统的组成2.3系统框图图2.4 系统总体框图图 2.5 信号发生及分析系统的组成第3章 语音信号的采集3.1 语音信号的采集方法利用电脑采集语言信号的方法有很多种,每一种都有其独特的地方,以下几种是比较常用的录制语音信号的方法。方法一:利用笔记本电脑系统自带录音机进行录制Windows 自带了一个录音机程序(简称录音机),通过它可以驱动声卡采集、播放和简单处理语音信号。语音信号的采集可以使用电脑的录音机直接录制人的语音,并将其保存在电脑中。图3-1 所示,电脑系统自带录音机对语音信号进行采样的过程,电

26、脑声卡会自动将原本模拟语音信号转换成数字信号,即进行A/D转换。转换之后获得WMA文件(WMA是录音时windows系统默认的文件格式),为数字信号处理准备了原文件。WMA文件 A/D转换 采样 L滤波 声音 图3.1 声卡语音信号采集过程图3.2 录音机方法二:利用LabVIEW中的声音采集函数进行采集在LabVIEW中,使用声音采集函数:Sound Input Congfigure.vi与Sound Input Read.vi。从声音输入设备读取数据时使用Sound Input Congfigure.vi 配置设备,设置相应的参数。Sound Input Congfigure.vi 采集到

27、的数据被发送到缓存,使用Sound Input Read.vi从声音输入设备读取数据。当执行采集数据时,可以对信号进行存储和实时地显示、分析。语音信号的存储主要由 Sound File Write Open.vi( 设置为写入) 和Sound File Write.vi实现。此时进行存储的语音格为.wav文件。Sound File Write Open.vi用于创建待写入的新.wav 文件。Sound File Write.vi将来自Sound Input Read.vi的输出数据写入.wav 文件。接着将系统功能切换至读取语音文件模块,执行对历史语音信号的读取、显示、分析。Sound Fil

28、e Write Open.vi读取文件的路径参数,打开用于读取的.wav 文件。Sound File Read.vi接收来自Sound File Write Open.vi的数据,将.wav 文件的数据以波形数组形式读出,并输入到后面所需的控件中。图3.3 声音采集函数采集设计方法三:使用Matlab软件直接调用wavrecord函数对语音信号进行采集。wavrecord是调用pc机声卡来对语音信号进行采集,函数调用方式为:wavrecord(n,fs,ch,dtype); n:采样点数;fs:采样频率,其系统默认值为11025Hz;ch:样本采集通道,1为单声道,2为双声道,默认值为1;dt

29、ype:采样数据存储格式,即每个样本的解析度。利用MATLAB实现录音的语句如下;clear;clc;fs=8000; %8000为采样频率channel=1;t=5 ; %采样时长fprintf('按任意键后开始 %d 秒录音:',t); pause; %文字提示 fprintf('录音中.'); %文字提示y=wavrecord(t*fs, fs,channel,'double'); %录制语音信号fprintf('录音结束n'); %文字提示wavwrite(y,fs,'E:jiayou.wav'); %存储

30、录音信号fprintf('按任意键后回放:');pause;wavplay(y,fs);方法四:使用GoldWave软件采集语音信号GoldWave是一个功能强大的数字音乐编辑器,包含声音编辑、播放、录制和转换等功能,它还可以对音频内容进行转换格式等处理。它体积小巧,功能强大,可以打开WAV、OGG、VOC、 IFF、AIFF、 AIFC、AU、SND、MP3、 MAT、 DWD、 SMP、 VOX、SDS、AVI、MOV、APE等格式。GoldWave的特性:* 直观、可定制的用户界面,使操作更简便;* 多文档界面可以同时打开多个文件,简化了文件之间的操作;* 编辑较长的音乐

31、时,GoldWave会自动使用硬盘,而编辑较短的音乐时,GoldWave就会在速度较快的内存中编辑,等等。3.2 声卡的相关介绍及参数设置声卡 (Sound Card)也叫音频卡(港台称之为声效卡):声卡是多媒体技术中最基本的组成部分,是实现声波/数字信号相互转换的一种硬件。声卡的基本功能是把来自话筒、磁带、光盘的原始声音信号加以转换,输出到耳机、扬声器、扩音机、录音机等声响设备,或通过音乐设备数字接口(MIDI)使乐器发出美妙的声音。3.2.1 LabVIEW中的相关声卡函数LabVIEW提供了一系列使用Windows底层函数编写的与声卡有关的函数,利用这些函数可以方便的搭建基于声

32、卡的信号采集程序,这些函数位于“函数-编程-图形与声音-声音”子选板上,如图3-2所示。这些函数都是用Windows底层函数编写的,直接与声卡驱动联系,可以实现对声卡的快速访问和操作,具有比较高的执行性能。声音子选板下有分输出、输入与文件三个子选板,它们分别提供声音输出、输入与声音文件相关的VI。图3.4 声卡操作函数子选板3.2.2声卡的参数及设置声卡作为一种数据采集设备,最主要的两个参数是采样位数和采样频率。采样频率,也称为采样速度或采样率,表示符号为fs,指每秒从连续信号中提取并组成离散信号的采样个数,单位为 Hz。采样频率的倒数是采样周期或采样时间,它是采样点之间的时间间隔。采样频率越

33、高,获得的声音文件质量越好,占用磁(光)盘的空间也就越大。采样率通常有44100 Hz,22050 Hz,11025 Hz,8000 Hz。对于少数专业的声卡,采样率能达到96kHz或者更高的192kHz等。采样位数,也就是采样值,可以衡量声卡对声音的解析度,又被称为声卡的分辨率。声卡的分辨率越大,解析度越高,录制或回放的声音效果就越好。相对大多数采集卡12位的分辨率来讲,目前市场上16位的主流声卡性能比较高。其他的参数还有:通道数,就是指定通道的个数,该输入可接受的通道数与声卡支持的通道数一致对于多数声卡,1为单声道,2 为立体声,设置为2。每通道采样数,指的是每次从通道读取的数据长度,其实

34、是从通道的buffer里面读取的。如果每次读得太少,而且读的间隔过长,那么buffer里面的数据就会堆积,最后导致buffer溢出。所以 buffer size应该大于数据读取间隔*采样率,否则一个间隔的数据就足以把buffer填满了,同时读取的长度也应该保证buffer不会溢出。录音设备录制设置及参数设置如下图所示:图3.5 录音设备录制设置图3.6 录音设备参数设置图3.7 声音采集函数参数设置3.3 读取历史语音信号的设计采用录音机录制语音直接对语音信号进行采集,将其保存在E盘,然后用控件path对其进行调用,接着采用读取并打开声音文件函数Sound File Open.vi 和读取声音

35、文件函数Sound File Read.vi对其进行读取,如下图所示:图3.8 录音机采集设计图3.9 读取历史语音信号的设计第4章 基于LabVIEW的语音信号分析的实现语音信号是一种非平稳的时变信号,它携带着各种信息,具有短时平稳性,因而在整个语音分析过程中将采用“短时分析技术”。也就是将语音信号分段分析,一段也就是一“帧”,然后再对其特征参数进行分析,得出的整体语音信号就是将各个帧的特征参数叠加成一个整体特征参数时间序列。分析语音信号的时候,可根据参数性质的不同,对语音信号进行时域分析、频域分析、倒频域分析等。对语音信号而言,非常重要的感知特性反映在功率谱中,而相位变化只起着很小的作用,

36、故虽然时域分析方法具有其简单、独特的优点,但相对而言,频域分析更重要。语音信号在频域内,它的频率范围通常集中在3003400Hz。对语音信号进行采集一般情况下取采样频率为8kHz即可,就可以得到离散的语音信号。采样频率越高,获得的声音文件质量越好,占用磁(光)盘的空间也就越大。4.1语音信号的时域分析语音信号的时域分析就是分析和提取语音信号的时域参数,语音信号本身就是时域信号,故直接利用语音信号的时域波形。语音信号的时域参数包括短时能量、短时过零率、短时自相关函数和短时平均幅度差函数等。4.1.1语音信号的预处理在进行分析之前,还要对语音信号的数字化、语音信号的预处理(包括预加重、加窗和分帧等

37、)等相关技术进行了解。由于电脑自带的声卡已经将所记录到的模拟信号(语音)转换为数字信号,故语音信号已为数字信号,可直接进行预处理。首先是预加重,然后进行加窗分帧处理,一般每秒的帧数约为33100帧。前一帧和后一帧的交叠不分称为帧移,帧移与帧长的比值一般为01/2。分帧是用可移动的有限长度窗口进行加权。图4.1 语音信号分帧图对语音信号进行数字处理的时候会经常用到汉明窗(hanning)、矩形窗等,窗函数的选择(形状和长度)非常影响短时分析参数的特性。如何选择合适的窗函数显得尤为重要:在时域,要减小时间窗两端的坡度以便让窗口边缘两端平滑过渡到零,让截取出的语音波形慢慢降为零,减小语音帧的截断效应

38、;在频域,要有较小的边带最大值和较宽的3dB带宽。Hanning Window和Rectangular Window的主瓣狭窄且旁瓣衰减较大,具有低通的性质。窗越长主瓣越窄,加窗后的频谱能够更好地逼近短时语音的频谱;窗长越长,频谱分辨率越高,但时间分辨率相应下降。矩形窗窗函数如下: (4-1)图4.2 矩形窗及其频谱汉明窗窗函数如下: (4-2)图4.3 汉明窗及其频谱本设计中采用汉明窗,由于Hanning Window的主瓣宽度比Rectangular Window大一倍,也就是带宽约增加一倍,而且它的带外衰减也比Rectangular Window大一倍多。虽然Rectangular Wi

39、ndow的谱平滑性较好,但损失了高频成分,使波形细节丢失,而Hanning Window却恰恰相反,所以汉明窗比矩形窗更加合适。采样周期、窗口长度N、和分辨率之间的关系: (4-3)对于时域而言,若N很大,就等效于很窄的低通滤波器了,反应语音信号波形细节的高频部分被阻碍,短时能量随时间变化小,不能真实反映语音信号的幅度变化;相反,若N太小,滤波器的通带变宽,短时能量随时间变化剧烈,不能得到平滑的能量函数。通常一个语音帧包含17个基音周期,最长基音周期约为20ms,N至少大于两个基音周期。4.1.2语音信号的短时能量和短时平均幅度函数短时能量定义为: (4-4)式中N为窗长。可见短时能量为一帧样

40、点值的加权平方。短时平均幅度函数定义为: (4-5)短时能量用来度量语音信号幅度值的变化,但它有一个缺点,就是对高电平非常敏感,为此,可采用短时平均幅度函数,另一个可以度量语音信号幅度值变化的函数。和主要用来区分浊音段和清音段,区分声韵母、有无声、连字的分界,用于语音识别。短时过零率表示一帧语音中语音信号波形穿过横轴(即零电平)的次数。它可以从背景噪声中找出语音信号,可用来判断寂静无声段和有声段的起点和终点位置。高频意味着高的平均过零率清音时,低频意味着低的平均过零率浊音时。4.1.3语音信号的短时自相关函数和短时平均幅度差函数短时自相关函数可以求出浊音语音的波形序列的基音周期,在进行语音信号

41、的线性预测分析时也要用到,其计算公式如下: (4-6)这里K为最大的延迟点数。自相关函数具有以下性质:1)周期性。周期为的信号的自相关函数是一个同周期的周期函数,即有2)对称性。3)存在最大值。对所有k有:4)对确定信号,值等于信号能量:对随机信号或周期信号,值等于平均功率。短时平均幅度差函数(AMDF)能代替自相关函数进行语音分析且大大减少了计算量。短时平均幅度差函数 (4-7)4.2语音信号的频域分析对一个时域信号进行傅里叶变换,就可以得到的信号的频谱,信号的频谱由两部分构成:幅度谱和相位谱。幅度谱以频率作为自变量,以组成信号的各个频率成分的幅值作为因变量,表征信号的幅值随频率的分布情况。

42、相位谱就是相位随频率变化的曲线,代表各频率分量在时间原点所具有的相位。功率谱是功率谱密度函数的简称,它定义为单位频带内的信号功率。它表示了信号功率随着频率的变化情况,即信号功率在频域的分布状况。语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱网络分析等频谱特性进行分析,常用的频域分析方法有傅里叶变化法、带通滤波器组发、线性预测法等几种。信号的傅立叶表示在信号的分析与处理中起着重要的作用。傅里叶频谱分析的基础是傅里叶变换,用傅里叶变换及其反变换可以求得傅里叶谱,自相关函数,功率谱,倒谱。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信

43、号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更深入地说明信号的各项宏物理现象。短时傅里叶变换就是对语音信号分帧处理,然后计算某一帧的傅里叶变换,定义为: (4-8)其中为实数窗序列,n取不同的值,窗沿时间轴滑动到不同的位置,取出不同的语音帧进行傅里叶变换。它反映了语音信号的频谱随时间变化的特性。短时傅里叶反变换由时频函数重构,主要有滤波器组相加法、叠接相加法。FFT即为快速傅氏变换,是离散傅氏变换的快速算法,可以将一个信号变换到频域,有些信号在时域上的特征不是很明显,但是如果变换到频域之后,就很容易看出特征了。这也是为什么很多信号分析采用FFT变换的原因。而且FFT

44、可以将一个信号的频谱提取出来,其根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得。用FFT对信号作频谱分析对学习数字信号处理来说十分重要。模拟信号和时域离散信号经常需要进行谱分析。对信号进行谱分析的重要问题是频谱分辨率D和分析误差。频谱分辨率直接和FFT的变换区间N有关,因为FFT能够实现的频率分辨率是2/N,因此要求2/ND。可以根据此式选择FFT的变换区间N。误差主要来自于用FFT作频谱分析时,得到的是离散谱,而信号(周期信号除外)是连续谱,只有当N较大时离散谱的包络才能逼近于连续谱,因此N要适当选择大一些。假设采样频率为Fs,采样点数为N,做FFT之后,某一点n

45、(n从1开始)表示的频率为:Fn=(n-1)*Fs/N;该点的模值除以N/2就是对应该频率下的信号的幅度;该点的相位即是对应该频率下的信号的相位。要精确到x Hz,则需要采样长度为1/x秒的信号,并做FFT。要提高频率分辨率,就需要增加采样点数,但是这却并不可取,在实际应用中需要在较短的时间内完成分析。可以尝试频率细分法来解决问题,要想简单些的话采样比较短时间的信号,然后在后面补充一定数量的0,使其长度达到需要的点数,再做FFT。图4.4 原始信号及滤波信号的时频分析设计4.3滤波器的设计及滤波实现采集信号的时候由于受到外在因素等原因的干扰不可避免地会产生噪声信号,从而导致信号的失真,于是,就

46、需要滤波技术来消除这些噪声。滤波器是一种选频装置,能让信号中特定的频率成分通过而衰减其他不需要的频率成分。数字滤波器,就是输入、输出均为数字信号,通过数值运算处理改变输入信号所含频率成分的相对比例,或者滤除某些频率成分的数字器件或程序。其基本工作原理是利用离散系统特性去改变输入数字信号的波形或频谱,让有用信号频率分量通过,抑制无用信号分量输出。数字滤波器根据其冲击响应函数的时域特征,可分为两种,即无限长冲击响应(IIR)滤波器和有限长冲击响应(FIR)滤波器。IIR滤波器的特征是,具有无限持续时间冲击响应,具有递归性,幅频特性较平坦,但其相位响应非线性。FIR滤波器的冲击响应只能延续一段时间,

47、其系统稳定、严格线性相移,但不易取得较好的通带与阻带衰减特性。1) 巴特沃斯滤波器巴特沃斯滤波器的幅频响应表达式: (4-9)式中,为通带截止频率,n为滤波器的阶数。Butterworth滤波器具有许多特性:通带内具有最大平坦的幅频特性;随频率的增大,平滑单调下降;在通带中,是理想的单位响应,在阻带中响应为零;在截止频率处即当时,有半功率频率,即有3dB衰减。2)切比雪夫滤波器切比雪夫滤波器的幅频响应表达式: (4-10)式中,为通带截止频率,n为滤波器的阶数,为小于1的正数,决定通带纹波大小的系数,表示通带内幅度波动的程度,越大波动幅度越大。Chebyshev滤波器具有许多特性:通带内峰值误

48、差最小;通带内具有等幅的波纹起伏特性;阻带内幅频响应单调下降且具有更大的衰减;与巴特沃斯滤波器相比,过度迅速。通过仿真实验可以证实,当滤波器的阶次较高时,系统的频率响应速度越快,阶次越高就越接近理想特性。通过巴特沃斯滤波处理的信号不会出现抖动现象,因为在滤波器的通带和阻带之间有一平滑过渡。综合以上对滤波器特性的考虑,本设计采用Butterworth低通滤波器对所采集到的语音信号进行滤波处理。语音信号在频域内,它的频率范围通常集中在3003400Hz。故低通滤波器的低截止频率设置为3000Hz。图4.5 数字滤波器的参数设置图4. 6 语音信号的滤波设计4.4语音信号的综合实现4.4.1语音分析

49、系统的整体设计图4.7语音分析系统的程序框图图4.8 语音分析系统的前面板4.4.2语音信号的时频分析图4.9 读取信号的时、频域波形图图4.10 滤波信号的时、频域波形图对于巴特沃斯低通滤波器的低截止频率设置为3000Hz,由图4-9和图4-10对比,可以很明显地看出在3000Hz以后的高频成分几乎被滤掉了。而且通过改变其阶数可以发现,阶数越高,滤波效果就越好。第5章 总结我设计的是基于labview的语音信号分析系统的设计,首先要了解LabView平台、掌握LabView的编程技术,然后设计相应的语音信号采集系统,语音信号时频分析,语音信号的滤波处理等模块,用于对语音信号分析系统的分析和处

50、理。真正开始的时候,才发现毕业设计比我想象中要难得多。我按部就班,从搜索有用资料开始,通过阅读大量相关文献和书籍,慢慢对语音信号的相关知识有了一定的了解,在此基础上,我开始打开labview软件进行模拟操作,尝试做出结果。我向指导老师彭老师说了一下自己大概的思路,彭老师听了之后也做了相关补充说明,然后我朝着自己的思路继续摸索。我首先参考采集部分的文献,调用了labview软件库中自带的声音采集函数,画出了采集部分的程序框图,并调用了利用电脑录音机录制了5秒的音频。比较难的是语音分析模块和滤波模块,手中的文献书籍远远不够,于是在同学的建议下,我去labview论坛搜索看看有没有我想要的知识,在论

51、坛里,我才发现labview有如此强大的功能和广泛的应用,更加激发了我学习labview的热情和动力。Labview的软件库非常强大,省去了复杂的运算,可以直接调用所需要的控件,比如滤波器控件、FFT控件、功率谱控件等。经过反反复复的探索和尝试,终于将频谱分析模块、功率谱波形模块、滤波模块完成。在波形图出现的时候,心中才舒畅许多,但是由于理论掌握不够到位,分析起来还是存在些许困难,于是我又继续拾起理论知识,多番钻研。在第一次交论文的时候,彭老师不辞辛劳,帮我们面批初稿,给每个人从内容到格式都十分详细地进行了讲解,因此我对整个论文和整个设计又有了一个全新的把握,并进行了第二次修改。在一次次的调试

52、过程中发现前面的设计仍然存在很多问题,如没有弄清录音机采集和labview中声卡采集函数采集之间的区别,采用了声卡采集函数,却一直以为是在对自己用录音机采集的语音信号进行分析。经过和彭老师及同组同学的共同探讨,终于理清思路,进行完善。但是本设计仍然存在不足之处,比如对于加噪模块的设计依旧有待探讨。彭老师在此基础上进一步指出,对采用声卡采集函数这种采集方法,如果可以,采集时设计开始采集和结束采集控制。在整个实验过程中,我参考了很多方法,进行了很多次试验,一次次失败激励着我不断发现问题、解决问题,从而不断更新了自己的知识库,此过程虽然无数次压抑、烦躁,但是解决问题后的愉悦也是无法代替的,在整个设计探究过程中,我受益匪浅。 参考文献1 赵力.语音信号处理.M机械工业出版社. 2003.4:1461502 高西全,丁玉美.数字信号处理(第三版)M.西安:西安电子科技大学. 2008.08:33123 3 林遂芳.基于LabVIEW的语音分析平台的实现J. 现代电子技术2005年第3期总第194期4 周鹏等.精通LabVIEW信号处

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论