通信工程专业语音信号增强技术的研究与仿真毕业设计_第1页
通信工程专业语音信号增强技术的研究与仿真毕业设计_第2页
通信工程专业语音信号增强技术的研究与仿真毕业设计_第3页
通信工程专业语音信号增强技术的研究与仿真毕业设计_第4页
通信工程专业语音信号增强技术的研究与仿真毕业设计_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 单位代码 01 学 号 分 类 号 TN912.3 密 级 毕业设计论文语音信号增强技术的研究与仿真实现 院(系)名称信息工程学院 专业名称通信工程 学生姓名 指导教师 2011 年 5 月 15 日 第 I 页 语音信号增强技术的研究与仿真实现摘 要语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门新兴学科。语音信号处理的应用极为广泛,其中的主要技术包括语音编码、语音合成、语音识别和语音增强等,实际中,语音常常受到环境噪声的干扰而使通话质量下降,严重时使语音处理系统不能正常工作。在这种情况下,必须采用信号处理方法进行语音增强,抑制背景噪声,以提高语音通信质量。因此,就语音增强技术

2、本文着重在抑制背景噪声上进行了研究和仿真。 首先,对语音信号的各种处理技术进行了较为详细地介绍;其次根据对语音信号增强处理技术的分析,设计了一个用于抑制噪声的数字滤波器,从而达到了语音增强的目的。最后在 MATLAB 的环境中,对含噪声语音信号读入,然后通过设计的滤波器进行了仿真实现,使语音信号得到了增强。关键词:语音信号处理,语音增强,MATLAB 第 II 页 Speech signal processing technology research and simulationAuthor:Zhu ChaojunTutor:Tang Hailing AbstractSpeech signa

3、l processing is a new developing discipline which has a research on the speech signal using the technology of digital signal processing. The application is very widespread. Speech coding, speech synthesis, speech recognition and speech enhancement are the primary kinds of technology of speech signal

4、 processing. Actually, speech is often disturbed by environmental noise.So that the speech quality will drop down. If it is serious,the speech processing system will work unnormally. Under this kind of circumstances, we must adopt signal handling mathod to enhance speech so that the noise from backg

5、round can be controled. If we do this, the speech quality can be improved. So about speech enhancement technology, this text emphasizes on research and simulation about the control of background noise.Firstly, we have introduced various kinds of processing technology in detail. Secondly, on the basi

6、s of analysis about the technology of speech signal enhancement processing, we have designed a transform for digital filter to control noise so that the objective of speech enhancement can be made. Finally, in the environment of MATLAB, the speech signal that contains noise will be readed-in. Then t

7、hrough the transform for digital filter that has been devesed the simulation can be realized. By means of this, speech signal was enhanced in deed.Key words: Speech signal processing, speech enhancement, MATLAB 第 III 页 目目 录录1 绪论 .11.1 语音处理技术的概述.11.1.1 语音编码技术.21.1.2 语音合成技术.31.1.3 语音识别技术.31.1.4 语音增强技术

8、.51.2 课题研究背景及意义.61.3 本文主要研究内容.62 语音及语音增强研究的基础.82.1 语音增强概述.82.2 语音增强技术的基本理论 .92.3 常用的语音增强算法 .102.4 小结.113 语音信号增强的实现.123.1 语音信号的获取及相应处理 .123.1.1 时域信号的 FFT 分析.123.1.2 语音信号的获取.123.2 针对语音信号的 FIR 数字滤波器的设计.153.2.1 数字滤波器设计原理 .153.2.2 数字滤波器的设计步骤 .153.2.3 FIR 滤波器与 IIR 滤波器的性能比较.153.2.4 FIR 数字滤波器的设计.163.2.5 针对语

9、音信号的 FIR 数字滤波器的设计.16 第 IV 页 3.3 语音信号的增强处理 .183.4 小结.194 结论 .20致谢 .21参考文献 .22 第 1 页 1 绪论1.1 语音处理技术的概述通过语音来与人传递信息是人类最重要的基本功能之一,语言是人类特有的功能;声音是人类常用的工具,是相互传递信息的最为重要的手段。虽然,人可以通过多种手段拉来获得外界的信息,但最重要最精细的信息源只有语言、文字和图像三种。与用声音传递信息相比,虽然用视觉和文字相互传递信息,其效果要差的多。这是因为语音中除包含实际发音内容的语言信息外,还包括发音这是谁及喜怒哀乐等各种信息。所以,语言是人类最重要、最有效

10、、最常用和最方便的交换信息的形式。另一方面,语言和语音与人的智力活动密切相关,与文化和社会的进步紧密相连,它具有最大的信息容量和最高的智能水平。语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门新兴学科,处理的目的是用于得到某些参数以便高效传输或存储;或者是用于某种应用,如人工合成出语音、辨识出讲话者。识别出讲话内容,进行语音增强等。语音信号处理是一门新兴的学科,同时又是综合性的多学科领域,是一门涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来自信息处理及计算机等学科,但是它与语音学、语言学、声学、认知科学、生理学、心理学及数理统计等需要学科也有非常密切的联系1。语音信号处理是

11、信息需要领域应用的可信技术之一,是目前发展最为迅速的信息科学研究领域中的一个。语音处理是目前极为活跃和热门的研究领域,其研究设计一系列前言科研课题,并且处于迅速发展之中;其研究成果具有重要的学术及应用价值。20 世纪 60 年代中期形成的一系列数字信号处理方法和算法,如数字滤波器、快速傅里叶变换等是语音信号数字处理的理论和技术基础。进入 70 年代之后,语音技术取得了需要实际性的进展;用于语音信号的嬉戏压缩和特征提取的线性预测技术,已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域; 第 2 页 用于输入语音与参考样本之间时间匹配的动态规划方法。80 年代初一种新的

12、基于聚类分析的高效数据技术矢量量化应用于语音信号处理中;而用隐式马尔可夫模型描述语音信号过程的产生式 80 年代语音信号处理技术的重大进展。近年来人工神经网络的研究取得了迅速发展,语音信号处理的各项课题是促使其发展的重要动力之一;同时,它的许多成果,也体现在有关语音的各项应用之中,尤其语音识别是神经网络的一个重要应用领域。从技术角度讲,语音信号处理是信息高速公路、多媒体技术、办公自动化、现代通信及智能系统等新兴领域应用的核心技术之一。在高度发达的信息社会用数字化的方法进行语音的传送、存储、识别、合成、增强等是整个数字化通信网中最重要、最基本的组成部分之一。同时,由于语言是人类相互间沟通的最自然

13、和最方便的形式,所以它是一种理想的人机通信方式。因而可为计算机、自动化系统等建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会信息化和自动化的程度。语音处理技术的应用及其广泛。包括工业、军事、交通、医学、民用等各个领域。目前,语音处理技术处于蓬勃发展时期,已有大量产品投放市场,并且不断有新产品被开发研制,具有及其广泛的市场需要和应用前景2。1.1.1 语音编码技术对于移动通信而言,最多的信息就是语音信号,语音编码的技术在数字移动通信中具有相当关键的作用,高质量低速率的语音编码技术是数字移动网永远的追求。所谓语音编码,它是将模拟语音信号转变为数字信号以便在信道中传输。除了通信

14、带宽的要求外,计算机存储容量的限制也要求对语音信号进行压缩,以满足海量数据情况下进行实时或准时计算机处理的目的。 在语音信号的数字处理过程中,语音编码技术至关重要,直接影响到话音的存储、语音合成、语音识别与理解。语音编码是将模拟语音信号实现数字化的基本手段。语音信号是一种时变的准周期信号,而经过编码描述以后,语音信号可以作为数字数据来传输、存储或处理,因而具有一般数字信号的优点。语音编码主要有三种方式:波形编码、信源编码和混合编码,这三种方式都涉及到语音的压缩编码技术。通常把编 第 3 页 码速率低于 64 kbps 的语音编码方式称为语音压缩编码技术。如何在尽量减少失真的情况下,降低语音编码

15、的比特数已成为语音压缩编码技术的主要内容,换言之,在相同编码比特率下,如何取得更高质量的恢复语音是较高质量语音编码系统的要求3。1.1.2 语音合成技术从 18 世纪开始,人们就研究“会说话的机器” ,现代电子技术产生以后, “会说话的机器”这一术语也被“语音合成”所替代,由人工制作出语音称为语音合成,就是由机器产生出声音,它是人机语音通信的一个重要组成部分。语音合成系统是一个单向系统,由计算机到人,用语音合成来传递语言具有下面的优点:不用特别注意和专门训练,任何人都可以理解,可以直接使用电话网和电话机,无须消耗纸张等资源。语音合成,又称文语转换技术,能将任意文字信息实时转化为标准流畅的语音朗

16、读出来,相当于给机器装上了人工嘴巴。解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。语音合成技术经历了一个逐步发展的过程,从参数合成到拼接合成,再到两者的逐步结合,其不断发展的动力是人们认知水平和需求的提高。目前,常用的语音合成方法主要有:共振峰合成、LPC 合成、PSOLA 拼接合成和 LMA 声道模型技术。它们各有优缺点,人们在应用过程中往往将多种技术有机地结合在一起,或将一种技术的优点运用到另一种技术上,以克服另一种技术的不足。语音合成的目的是产生与人通信有关的语音,所以可懂度是很重要的。同时,语音的和自然度,这些主观因素对语音合成的实用性也有很大的影响

17、。由于计算机和集成电路技术的发展,推动了语音信号处理的实用化,已开发出了很多产品。现在有很多专用语音处理芯片,这些芯片和微型计算机或微处理器相结合可以组成各种复杂的语音处理系统。器重语音合成在技术上比较成熟,在语音处理中影响也最大,多是有限词汇量的语音合成器。目前,语音合成的应用领域十分广泛,从办公信息处理、工业自动化、交通运输到文化教育以至日常生活用品等无处不在4。 第 4 页 1.1.3 语音识别技术语音识别也称为语音自动识别,语音识别基于模式匹配的思想,从语音中抽取声学特征,然后在特征空间完成模式的比较匹配,寻找最接近的词或字作为识别的结果。语音信号处理技术是语音处理领域中新近发展起来的

18、一个学科分支,是研究使机器能够准确的听出人的语音内容的问题,即准确的识别所说的话。几十年来,语音识别技术经历了从特定人中小词汇量的孤立词语和连接词语的语音识别到非特定人大词汇量的自然口语识别的发展历程。尽管如此,语音识别技术要走出实验室、全面融入人们的日常生活还需假以时日。当使用的环境与训练的环境有差异时,如在存在有背景噪声、信道传输噪声、说话人的语速和发音不标准等的情况下,识别系统的性能往往会显著下降,无法满足实用的要求。环境噪声、方言和口音、口语的识别已经成为目前语音识别中三个主要的新难题。 语音识别技术是 2000 年间至 2010 年间信息技术领域的十大重要科技发展技术之一。它是一门交

19、叉学科,正逐步成为信息技术中人与机接口的关键技术。与机器进行语音交流,让机器明白你在说什么,这是人们长期来梦寐以求的事情。语音识别技术就是让机器通过识别和理解的过程把语音信号转变为相应的文本或命令的高技术。让机器识别语音的困难在某种程度上就像一个外语不好的人听外国人讲话一样,它和不同的说话人、不同的说话速度、不同的说话内容、以及不同的环境条件有关。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来 10 年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音信号本身的特点造成了语音识别的困难。这些特点包括多变性,动态性,瞬时性和

20、连续性等。在电话与通信系统中,智能语音接口正在把电话机从一个单纯的服务工具变成为一个服务的“提供者”和生活“伙伴” ;使用电话与通信网络,人们可以通过语音命令方便地从远端的数据库系统中查询与提取有关的信息;随着计算机的小型化,键盘已经成为移动平台的一个很大障碍,想象一下如果手机仅仅只有一个手表那么大,再用键盘进行拨号操作已经是不可能的。语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 第 5 页 一个完整的语音识别系统可大致分为三部分:语音特征提取、声学模型与模式匹配(

21、识别算法)和语言模型与语言处理。当前在语音识别中,如何去充分借鉴和利用人在完成语音识别和理解时所利用的方法和原理是一大课题,因而将人工神经网络引入语音识别中引起了人们极大的兴趣。对于汉语语音识别来说,本质上与其他的语言没有区别,但也有其本身特点,主要是他易于用音节作为基本研究的对象,从而使特征的提取,字节的分割,动态时间匹配方法的选取等等,也具有特点。目前汉语语音识别的研究重点是以词为单位的孤立词的识别以及连续语音识别等5。1.1.4 语音增强技术 在之前所述的理论中,大部分的语音数据都是在接近理想的情况下采集的。大多数的语音识别和语音编码在开始研究时都要在高保真设备上录制语音,尤其要在无噪环

22、境下录音。在实际应用中,由于噪声的存在会产生很多问题,比如,环境噪声的污染会使许多语音处理系统的性能急剧恶化。例如,语音识别正在步入实用阶段,但识别系统大都是在安静的环境中工作的,在噪声环境中,尤其是在强噪声的环境中,语音识别系统的识别器将严重受到影响,低速率的编码也会遇到类似的问题。由于语音生成模型是低速率的参数编码的基础,在语音通信中不可避免的会受到来自周围环境、传输媒介引入噪声、通信设备内部的电噪声,甚至其他人的说话声的干扰。这些干扰将致使接收到的参数已非纯净的原始的语音参数,而是受到噪声污染的参数,当噪声污染严重时,重建的语音质量将急剧恶化,甚至变得完全听不懂。而且特别遗憾的是,线性预

23、测的技术作为语音处理中最有效的方法,恰恰是最容易受噪声污染的。如果将线性预测技术看作频谱的匹配过程,则在大量的噪声使频谱畸变时预测器就设法与畸变频谱匹配,而不是与基本的语音匹配。当在声码器的接收端使用和发送端相同的预测器时,则合成语音的可懂度就大大的降低了。语音增强是解决噪声污染的一种最为有效地方法,它的主要目标是从带噪声的语音信号中提取尽可能纯净的原始的语音,它不但与信号处理的技术有关,还涉及到人 第 6 页 的听觉感知和语音学,此外,噪声来源众多,随着应用场合的不同,它的特性也各不相同,因而很难找出一种通用的语音增强算法来适用于各种噪声环境。必须针对不同的噪声采取不同的语音增强对策。1.2

24、 课题研究背景及意义语音信号处理是信息高速公路、多媒体技术、办公自动化、现代通信及智能系统等新兴领域应用的核心技术之一,它主要包括语音编码、合成、识别和语音增强等方面。然而人们在获得语音信号的同时,不可避免地会受到来自传输媒介引入的噪声、通信设备内部电噪声、房间混响乃至其他说话人的话音干扰。这些干扰不仅会使接收者得到的语音被噪声污染,同时也会导致许多语音处理系统的性能急剧恶化。语音增强作为前置处理方案是抑制干扰的一种有效途径,是语音信号其它应用的基础。随着语音增强研究的深入,人们越来越认识到由于噪声通常是随机的,要想从带噪语音信号中提取完全纯净的原始语音信号几乎是不可能的。在这种情况下,语音增

25、强的目的主要有两个:1.主观度量:改进语音质量,消除背景噪声,使听者乐于接受,不感觉疲劳。2.客观度量:提高语音可懂度。在实际情况下,往往这两个目的不能兼得。由此可见,语音增强是一项很复杂的技术,不仅仅是数字信号处理的问题,还涉及到人的听觉感知特性和语音学。同时,噪声的多样性,即噪声来源众多,随着应用场合不同而特性各不相同,也增加了语音增强的难度。因此,要想一劳永逸的设计出一种算法是不可能的,只能是针对不同的噪声情况,采取不同的语音增强算法。因此,对于语音增强算法的研究对我们的生活起着十分重要的作用,它也扮演着十分重要的角色。1.3 本文主要研究内容基于语音短时谱估计的增强方法和基于语音生成模

26、型的增强方法,是语音增强方法中的两大类。基于语音短时谱估计的增强方法种类繁多,如谱相减法、维纳滤波法、最小均方误差法等。该类方法具有适应信噪比范围大、方法简单、易于实时处理等优点。尽管该方法研究比较早,但仍具有很强的生命力,成为应用最广泛的语音增强方法。 第 7 页 本文重点是研究现有的语音增强方法,设计一种实用的语音增强系统。增强过程不以单纯提高信噪比为目标。在第二章中,介绍语音增强的基础,介绍了目前流行的几种语音增强算法,给人们一个语音增强算法的整体印象。在第三章中,针对语音增强技术,设计出合适的语音信号滤波器;在MATLAB上用滤波器实现对含噪声语音信号的滤波。在第四章中,从整体对论文做

27、出了总结,并描述了一下对今后工作的展望。 第 8 页 2 语音及语音增强研究的基础 2.1 语音增强概述语音处理技术的发展可以从 1876 年的贝尔发明电话算起,贝尔第一次采用电讯号将语音传输到远方。1939 年 HDudley 首次成功设计出了声码器,它是将语音提取参数后,传输语音的参数,然后在接收端重新生成语音。它的发明中所孕育的伟大思想是对语音信号的建模。数字计算机是语音处理研究的重要工具。此后时期语音识别的主要研究方向和方法都是利用硬件提取语音的频谱信息,使用计算机进行匹配计算和判决。对语音处理技术产生决定性的影响的是在上个世纪 70 年的三项研究成果:70 年代初期的将动态规划法用于

28、语音识别及隐马尔可夫模型,为语音识别在匹配算法上提供了新的方法;中期的线性预测法,在语音识别、语音编码等方面获得了极大成功,成为现代语音处理的主要方法,随后在七十年代末期的矢量编码量化技术,更推进了语音处理技术的发展。目前常用的语音信号增强算法一般可分为基于语音生成模型参数和非基于语音生成模型参数两大类。基于语音生成模型参数方法的特点是对语音生成模型的参数进行估计和恢复。然而在低信噪比下,很难对模型参数进行准确估计,并且此类算法往往因需要迭代而增加算法的复杂度。非基于语音生成模型参数的语音增强方法主要有自适应噪声滤波法和基于语音短时谱估计的增强方法等。语音信号增强的典型方法有:谱减法、自适应噪

29、声对消法以及基于语音信号模型的语音增强法。近些年来,语音增强的研究工作有了一定的进展。适用于在带噪语音信号采集过程中同时能获得参考噪声源的自适应噪声对消技术,已日趋成熟。近四十年以来,人们对不同的语音增强算法进行了大量的研究。1978 年 Lim 和Oppenheim 提出了维纳滤波语音增强方法;1979 年 SBoll 提出了谱减法语音增强, 1980 年 Macaulay 和 MalpaSs 提出了软判决语音增强方法;1984Ephraim 和 Malall 提出了基于最小均方误差短时谱幅度估计的(MMSESTSA)方法,并且在 1985 年提出了基于人耳听觉特性的最小均方误差对数短时谱幅

30、度估计 (MMsELoGsTsA);1987 年Paliwal 提出了卡尔曼滤波语音增强方法方;1994 年 Rainer M 眦 in 提出了基于最小统 第 9 页 计的语音增强方法;1995 年 Ephraim 提出了基于子空间的语音增强方法;2001 年Rajner Manin 提出了基于最优平滑和最小统计的噪声功率谱密度估计。近年,随着对语音增强技术的不断研究,一些新的语音增强方法如小波变换语音增强方法、卡亨南洛维变换方法、离散余弦变换方法、人工神经网络方法、隐含马尔可夫模型方法等被相继提出。国内的研究较之国外起步较晚,主要的研究单位有清华大学、中科院声学所和西安电子科技大学等单位。无

31、限词汇汉语听写机首先由清华大学于 1988 年研制成功,四达公司等单位在 90 年代初使之产品化、商品化。但从目前的市场应用范围来看,语音产品的实际应用还很狭窄,这说明语音技术产品还存在缺陷,达不到市场化、商品化的要求,在技术上许多工作要做。近几年,汉语言识别成为研究的重点,国外公司投入巨资进行研究,国家“863计划也在这方面加大了投资6。2.2 语音增强技术的基本理论语音增强不仅涉及信号检测、波形估计等传统信号处理理论,而且与语音特性、人耳感知特性密切相关,从语音信号产生的信号模型和语音信号增强系统出发,介绍了几种常用的语音增强算法,并总结归纳了各种算法的思想、适用条件和存在的问题。为了充分

32、了解语音信号的特性,首先给出一个语音信号的模型,如 21 所示。这个模型比较简单,但可以表现出语音信号的主要特性,能够满足大多数情况下对语音信号的研究和应用。浊音/清音开关语音 ( )SZ周期脉冲 发生器声门脉冲 模型 ( )GZ随机噪声 发生器声道模型 ( )VZ辐射模型 ( )RZ 图 2-l 语音信号产生模型从上图可以看出模型包括三个部分:激励源、声道模型和辐射模型。除语音生成模型外,还可以通过它的时域或频域波形来分析其特性。以数字化方式进行语音的传输和储存,无论在可靠性、抗干扰能力、交换速度、保密性和价格等方面都远胜于模拟 第 10 页 方式。因此从 50 年代以来在通信系统中数字化语

33、音所占比例不断增加。在卫星通信、移动通信、微波通信和信息高速公路等系统中将无一例外地采用数字化语音进行传输和贮存。通常情况下,为了了解信号的某些性质,我们需要对信号的时域波形和频谱进行分析。语音信号作为一种常见的信号也包含着许多的特性,在对语音信号进行处理前有必要对其特性进行分析,下面将介绍一些常见的分析方法。进行语音信号分析时,最先接触到并且也是最直观的是它的时域波形。根据时间波形可以看出语音信号的一些重要特征。清音和浊音这两类语音的波形有很大的不同。浊音具有较强的振幅,呈周期性变化,并且波形随时间变化比较缓慢,大致可以认为在 l0ms30ms 内其波形是固定不变的;清音的振幅比较小,波形随

34、机变化,没有规律性,非常类似于白噪声的时域波形。2.3 常用的语音增强算法以下介绍一些语音增强的基本方法:1、一般滤波法一般滤波法就是输入信号中有用的频率成分和希望滤除的频率成分各占不同的频带,通过一个合适的选频滤波器达到滤波的目的。例如,输入信号中含有干扰,如果信号和干扰的频带互不重叠,可滤除干扰得到纯信号。但对于一般滤波器如果信号和干扰的频带互相重叠,则不能完成干扰的有效滤除,这时就需要另外的滤波方法。2、梳状滤波法语音中的浊音部分能量很大,往往占据一段语音的大部分能量,同时它具有明显的周期性。利用语音浊音的周期性,可进行梳状滤波。就频域而言,是保留基频及其整数倍的各谐波量,抑制非谐波分量

35、。各谐波之间的间隙基本上是噪声成分。只要知道基频就可以把谐波之间的噪声成分完全滤掉。3、维纳滤波法这种方法不仅用到了噪声的统计知识,还用到了部分语音知识,但显然这些知识都是一种近似的代替。当噪声不是白噪声时,按照语音的产生模型就很难准确预测语音参数。因此对有色噪声维纳滤波法就很难应付。由此可以看出采用这种方法来提高语音信噪比和可懂度效果十分有限。特别是在噪声比较强的情况下估计的全极点模型 第 11 页 参数误差明显增大,而如果使用迭代方法,计算结果能够有所改进,但仍然存在较大误差,且计算量比较大。4、自适应滤波法这种方法是从带噪声语音中减去噪声,用两个话筒的采集系统,一个采集带噪语音,另一个采

36、集噪声,通过双话筒采集系统的自适应噪声抵消法的原理,经自适应滤波器处理后与带噪语音相减。自适应噪声抵消法可以用于平稳噪声相消,也可以用于准平稳噪声。采用噪声抵消法时为保证系统的性能,两个话筒之间必须要有相当的隔离度,应避免语音信号混入噪音通道,如实在无法隔离,则自适应滤波器的系数只能在语音间隙期间进行刷新7。2.4 小结本章讨论了语音信号的特征、噪声特性及其分类,介绍了国内外常用的语音增强方法,并就语音增强的计算机模拟处理时采用的方法做了简单介绍。由于本文采集到的语音信号中的有用信号和噪声信号的频带互不干扰,根据以上几种方法的介绍,我们选择一般滤波法对语音信号进行滤波,滤除干扰噪声信号,得到有

37、用的语音信号,达到使语音信号增强的目的。 第 12 页 3 语音信号 增强 的实现3.1 语音信号的获取及相应处理3.1.1 时域信号的 FFT 分析FFT 即为快速傅里叶变换,是离散傅 里叶变换的快速算法,它是根据离散傅里叶变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。在 MATLAB 的信号处理工具箱中函数 FFT 和 IFFT 用于快速傅立叶变换和逆变换。函数 FFT 用于序列快速傅立叶变换,其调用格式为 y=fft(x),其中,x 是序列,y 是序列的 FFT,x 可以为一向量或矩阵,若 x 为一向量,y 是 x 的 FFT 且和 x 相同长度;若 x 为一矩阵,则

38、 y 是对矩阵的每一列向量进行 FFT。如果 x 长度是 2 的幂次方,函数fft 执行高速基2FFT 算法,否则 fft 执行一种混合基的离散傅立叶变换算法,计算速度较慢。函数 FFT 的另一种调用格式为 y=fft(x,N),式中,x,y 意义同前,N 为正整数。函数执行 N 点的 FFT,若 x 为向量且长度小于 N,则函数将 x 补零至长度 N;若向量 x 的长度大于 N,则函数截短 x 使之长度为 N;若 x 为矩阵,按相同方法对 x 进行处理8。3.1.2 语音信号的获取在 MATLAB 中,y,fs,bits=wavread(*.wav);用于读取语音,采样值放在向量 n中,fs

39、 表示采样频率(Hz),bits 表示采样位数。sound(y,fs); 用于对声音的回放。向量y 则就代表了一个信号(也即一个复杂的“函数表达式”)也就是说可以像处理一个信号表达式一样处理这个声音信号。本设计所采用的语音信号,是一个经过处理的非常纯净的语音信号,下面的一段程序是语音信号在 MATLAB 中的最简单表现,它实现了语音的读入打开,以及绘出了语音信号的波形频谱图。并利用 MATLAB 对此语音信号加入了随机噪声,然后绘制出其加噪前后的波形与频谱图。 第 13 页 其MATLAB程序如下:y,fs,bits=wavread(E:yu.wav);%sound(y,fs) % 回放语音信

40、号n=length(y) %选取变换的点数 y_p=fft(y,n); %对 n 点进行傅里叶变换到频域f=fs*(0:n/2-1)/n; % 对应点的频率figure(1)subplot(2,2,1);plot(y); %语音信号的时域波形图title(原始语音信号采样后时域波形);xlabel(时间轴)ylabel(幅值 A)subplot(2,2,2);plot(f,abs(y_p(1:n/2); %语音信号的频谱图title(原始语音信号采样后频谱图);xlabel(频率 Hz);ylabel(频率幅值);L=length(y) %计算音频信号的长度noise=0.1*randn(L,

41、2); %产生等长度的随机噪声信号(这里的噪声的大小取决于随机函数的幅度倍数) y_z=y+noise; %将两个信号叠加成一个新的信号加噪声处理 %sound(y_z,fs)%对加噪后的语音信号进行分析n=length(y); %选取变换的点数 y_zp=fft(y_z,n); %对n点进行傅里叶变换到频域f=fs*(0:n/2-1)/n; % 对应点的频率subplot(2,2,3);plot(y_z); %加噪语音信号的时域波形图 第 14 页 title(加噪语音信号时域波形);xlabel(时间轴)ylabel(幅值 A)subplot(2,2,4);plot(f,abs(y_zp(

42、1:n/2); %加噪语音信号的频谱图title(加噪语音信号频谱图);xlabel(频率Hz);ylabel(频率幅值);程序运行同时可以听到声音,得到的结果如图 3-1 所示:01234x 105-1-0.500.51信 信 信 信 信 信 信 信 信 信 信 信 信信 信 信信 信 A0123x 10401000200030004000信 信 信 信 信 信 信 信 信 信 信 信信 信 Hz信 信 信 信01234x 105-1-0.500.51信 信 信 信 信 信 信 信 信 信信 信 信信 信 A0123x 10401000200030004000信 信 信 信 信 信 信 信

43、信信 信 Hz信 信 信 信图 3-1 语音及加噪语音信号的读入与打开 第 15 页 3.2 针对语音信号的 FIR 数字滤波器的设计3.2.1 数字滤波器设计原理数字滤波是数字信号分析中最重要的组成部分之一,与模拟滤波相比,它具有精度和稳定性高、系统函数容易改变、灵活性强、便于大规模集成和可实现多维滤波等优点。在信号的过滤、检测和参数的估计等方面,经典数字滤波器是使用最广泛的一种线性系统。数字滤波器的作用是利用离散时间系统的特性对输入信号波形(或频谱)进行加工处理,或者说利用数字方法按预定的要求对信号进行变换。3.2.2 数字滤波器的设计步骤不论是 FIR 滤波器还是 IIR 滤波器的设计都

44、包括三个步骤:(1) 按照实际任务的要求,确定滤波器的性能指标。(2) 用一个因果、稳定的离散线性时不变系统的系统函数去逼近这一性能指标。根据不同的要求可以用 FIR 系统函数,也可以用 IIR 系统函数去逼近。(3) 利用有限精度算法实现系统函数,包括结构选择、字长选择等。3.2.3 FIR 滤波器与 IIR 滤波器的性能比较FIR:Finite Impulse response,有限脉冲响应IIR:Infinite Impulse response,无限脉冲响应从性能上来说,IIR 滤波器传输函数的极点可位于单位圆内的任何地方,因此可用较低的阶数获得高的选择性,所用的存贮单元少,所以经济而

45、效率高。但是这个高效率是以相位的非线性为代价的。选择性越好,则相位非线性越严重。相反,FIR 滤波器却可以得到严格的线性相位,然而由于 FIR 滤波器传输函数的极点固定在原点,所以只能用较高的阶数达到高的选择性;对于同样的滤波器设计指标,FIR 滤波器所要求的阶数可以比 IIR 滤波器高 510 倍,结果,成本较高,信号延时也较大;如果按相同的选择性和相同的线性要求来说,则 IIR 滤波器就必须加全通网络进行相位较正, 第 16 页 同样要大增加滤波器的节数和复杂性。整体来看,IIR 滤波器达到同样效果阶数少,延迟小,但是有稳定性问题,非线性相位;FIR 滤波器没有稳定性问题,线性相位,但阶数

46、多,延迟大3.2.4 FIR 数字滤波器的设计FIR 滤波器和 IIR 滤波器的设计方法完全不同。IIR 滤波器设计方法有间接法和直接法,间接法是借助于模拟滤波器的设计方法进行的。其设计步骤是:先设计过渡模拟滤波器得到系统函数 H(s),然后将 H(s)按某种方法转换成数字滤波器的系统函数 H(z)。FIR 滤波器采用间接法,常用的方法有窗函数法、频率采样发和切比雪夫等波纹逼近法。对于线性相位滤波器,经常采用 FIR 滤波器9。如前所述,IIR 滤波器和 FIR 滤波器的设计方法有很大的区别。下面我们着重介绍用窗函数法设计 FIR 滤波器的步骤。如下:(1)根据对阻带衰减及过渡带的指标要求,选

47、择串窗数类型(矩形窗、三角窗、汉宁窗、哈明窗、凯塞窗等) ,并估计窗口长度 N。先按照阻带衰减选择窗函数类型。原则是在保证阻带衰减满足要求的情况下,尽量选择主瓣的窗函数。(2)构造希望逼近的频率响应函数。(3)计算 h(n).。(4)加窗得到设计结果。3.2.5 针对语音信号的针对语音信号的 FIR 数字滤波器的设计数字滤波器的设计在 Matlab 中,可以利用函数 fir1 设计 FIR 滤波器,利用 Matlab 中的函数 freqz 画出各步步器的频率响应。hn=fir1(M,wc,window),可以指定窗函数向量 window。如果缺省 window 参数,则 fir1 默认为哈明窗

48、。其中可选的窗函数有矩形窗(Rectangle Window)、三角形窗(Bartlett Window)、汉宁(Hanning)窗、哈明(Hamming)窗、布莱克曼(Blackman)窗、凯塞贝塞尔窗(Kaiser Basel Window) ,其相应的都有实现函数9。函数 fftfilt 用的是重叠相加法实现线性卷积的计算。调用格式为:y=fftfilter(h,x,M)。 第 17 页 其中,h 是系统单位冲击响应向量;x 是输入序列向量;y 是系统的输出序列向量;M是有用户选择的输入序列的分段长度,缺省时,默认的输入向量的重长度 M=512。接下来,根据分析语音信号加噪前和加噪后的频

49、谱图的对比,设定滤波器的技术指标:fp=1500Hz,fc=1700Hz,As=100db ,Ap=1dB相应的 MATLAB 程序如下:wc=2*pi*fc/fs; wp=2*pi*fp/fs;wdel=wc-wp;beta=0.112*(As-8.7);N=ceil(As-8)/2.285/wdel);wn= kaiser(N+1,beta);ws=(wp+wc)/2/pi;b=fir1(N,ws,wn);figure(2);freqz(b,1);运行结果如下图所示:00.10.20.30.40.50.60.70.80.91-10000-50000Normalized Frequency

50、( rad/sample)Phase (degrees)00.10.20.30.40.50.60.70.80.91-200-1000100Normalized Frequency ( rad/sample)Magnitude (dB) 第 18 页 图 3-2 幅频和相频特性曲线3.3 语音信号的增强处理为达到语音信号增强的目的,我们采用低通滤波器,对已经加入随机噪声的语音信号进行去噪,在去除噪声以后,将语音信号放大,以达到语音信号增强的目的。其 MATLAB 程序如下:x=fftfilt(b,y_z);X=fft(10*x,n);figure(3);subplot(2,2,1);plot(f,abs(y_zp(1:n/2);title(滤波前信号的频谱);subplot(2,2,2);plot(f,abs(X(1:n/2);title(滤波后信号频谱);subplot(2,2,3);plot(y_z);title(滤波前信号的波形)subplot(2,2,4);plot(x);title(滤波后信号的波形);%sound(x,fs,bits);运行结果如下图所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论