数字语音处理及matlab实现第一章_第1页
数字语音处理及matlab实现第一章_第2页
数字语音处理及matlab实现第一章_第3页
数字语音处理及matlab实现第一章_第4页
数字语音处理及matlab实现第一章_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数字语音处理及,MATLAB,仿真,张雪英编著,1,数字语音处理及,MATLAB,仿真,太原理工大学信息工程学院,张雪英编著,College of Information Engineering, Taiyuan,University of Technology,数字语音处理及,MATLAB,仿真,张雪英编著,2,2,课程总括,课程性质,1,课程目的和任务,2,课程重点,3,课程难点,4,数字语音处理及,MATLAB,仿真,张雪英编著,3,课程性质,语音信号处理是通信、电子信息专业的选,修课程,主要用于现代通信和电子信息领域,其主要前修专业基础课程为信号与系统和数字,信号处理,数字语音处理及,

2、MATLAB,仿真,张雪英编著,4,课程目的和任务,通过本课程的学习理解语音发声和听觉机理,及其数字模型;掌握语音信号处理的基本概念,原理和方法,为以后的学习提供理论依据;掌握,语音信号的短时时域分析和频域分析方法,并且,能够用,Matlab,语言编程实现对实际语音信号进行,的处理;熟悉语音信号处理的应用领域,并了解,该领域的新理论、新技术和发展趋势,为今后的,进一步学习和工作打下坚实的基础,数字语音处理及,MATLAB,仿真,张雪英编著,5,课程重点,语音信号的产生和语音信号数字模型。短时,能量、平均过零率、自相关的意义,以及这些特,征,参,量,在,语,音,信,号,中,的,应,用,并,且,会

3、,用,MATLAB,实现。短时频域分析的两种解释以及,实现,LPC,的基本原理以及与语音模型的关系,自适应量化的,PCM,自适应预测编码原理以及,前馈和反馈的主要区别,另外增量调制中所造成,的失真以及失真补偿。矢量量化原理,LBG,算法,以及实验,数字语音处理及,MATLAB,仿真,张雪英编著,6,课程难点,语音信号的产生和激励、端点检测和基音周,期的估计、用数学公式来证明短时频谱是如何反,映整个语音信号的频谱的,LPC,方程组解法、自,适应预测编码原理,LBG,算法以及实验中的分帧,和基音周期检测,数字语音处理及,MATLAB,仿真,张雪英编著,7,第,1,章,绪论,1.1,概述,1,1.2

4、,语音信号处理的发展,2,1.3,语音信号处理的应用及新方向,3,1.4,语音信号处理过程的总体结构,4,1.5 MATLAB,在数字语音信号处,理中的应用,5,数字语音处理及,MATLAB,仿真,张雪英编著,8,语音信号处理是一门新兴的边缘学科,是语音,学与数字信号处理两个学科相结合的产物。它和认,知科学、心理学、语言学、计算机科学、模式识别,和人工智能等学科有着紧密的联系,语音信号处理的目的,得到某些语音特征参数,以便高效地传输或存储,通过某种处理运算以达到某种用途的要求,1.1,概述,数字语音处理及,MATLAB,仿真,张雪英编著,9,语音信息的交换大致上可以分为三大类,1,人与人之间的

5、语言通信,包括语音压缩与编码、语音增强等,2,第一类人机语言通信问题,语音合成,机器讲话、人听话的研究,3,第二类人机语言通信问题,语音识别和理解,语音识别和理解:人讲话、机器听话的情况,数字语音处理及,MATLAB,仿真,张雪英编著,10,突破进展,系统论述语言,产生的声学理论,语谱图仪问世,语谱图,语音,语音合成,1.2,语音信号处理的发展,计算机,1,贝尔电话,的发明,3,用声学方法对元音和,歌唱进行了研究,2,第一个,声码器,1876,年,1939,年,19,世纪,60,年代,4,20,世纪,40,年代,1948,年,6,7,基础研究方面,技术应用领域,5,数字语音处理及,MATLAB

6、,仿真,张雪英编著,11,1.2,语音信号处理的发展,1,语音合成,3,语音编码,2,语音识别,语音编码,数字语音处理及,MATLAB,仿真,张雪英编著,12,1.2.1,语音合成,以语言信息压缩、存储为主要目的对语音信,号数字模型进行研究,同时研究音素、音节、词,组与句子的发音规则。最终恢复出自然流畅的语,音来。例如文语转换系统,Text-to-speech,语音,分析与合成将赋予,计算机说话,的功能。也是进行,话音编码、语音识别研究的基础,数字语音处理及,MATLAB,仿真,张雪英编著,13,1.2.2,语音编码,语音编码的目的,在保证一定语音质量的前提下,尽可能降低,编码比特率,以节省频

7、率资源,数字语音处理及,MATLAB,仿真,张雪英编著,14,1.2.2,语音编码,语音编码与文本到语音转换两个主要区别,一、前者是人与人之间的话音交流,要保留,说话人的声音特征。后者是文本到声音的转换即,计算机发声。它可以是标准播音员或其它声音,二、前者不仅对压缩率和音质有要求,而且,要求较低的编、解码延迟。而后者对处理帧长没,有什么太严格的限制,数字语音处理及,MATLAB,仿真,张雪英编著,15,1.2.3,语音识别,研究如何使,计算机能够听懂人类的语言,以,汉语语音为例:汉语约有,400,个音节,加上声调约,1200,个音调节,把这些语音信号的特征存储到计,算机内,并与计算机接收到的汉

8、语发音进行比较,找到特征相同的音节或音调节,这个过程就是语,音识别。将识别出的音节序列转换成文字,就是,语言理解。许多算法将理解过程溶入到识别中来,提高识别的准确性。因此可以将语音识别与理解,归入同一类应用,数字语音处理及,MATLAB,仿真,张雪英编著,16,语音识别研究领域包括,1,根据对说话人说话方式的要求,可以分,为孤立字语音识别系统,连接字语音识别系统以,及连续语音识别系统,2,根据对说话人的依赖程度可以分为特定,人和非特定人语音识别系统,3,根据词汇量大小,可以分为小词汇量,中等词汇量、大词汇量以及无限词汇量语音识别,系统,数字语音处理及,MATLAB,仿真,张雪英编著,17,1.

9、3,语音信号处理的应用及新方向,语音技术的应用领域,包括语音识别、说话人的鉴别和确认、语种的鉴,别和确认、关键词检测和确认、语音合成、语音,编码等,但其中最具有挑战性和最富有应用前景的为,语音,识别技术,一:语音信号处理的应用,数字语音处理及,MATLAB,仿真,张雪英编著,18,1,说话人识别技术的应用,安全加密、银行信息电话查询服务,公安机关破案和法庭取证方面,在声控应用中,识别输入的语音内容,并根据内容来执行相,应的动作,这包括了声控电话转换、声控语音拨号系统、声,控智能玩具、信息网络查询、家庭服务、宾馆服务、旅行社,服务系统、医疗服务、股票查询服务和工业控制等,数字语音处理及,MATL

10、AB,仿真,张雪英编著,19,1,说话人识别技术的应用,在电话与通信系统中,智能语音接口正在把,电话机从一个单纯的服务工具变成为一个服务的,提供者”和生活“伙伴,目前,自动口语分析、用户交换机、电话机,手机已经包含了语音识别拨号功能,还有语音记事,本、语音智能玩具等产品也包含了语音识别与语音,合成功能。人们可以通过电话网络用语音识别口语,对话系统查询有关的机票、旅游、银行信息,数字语音处理及,MATLAB,仿真,张雪英编著,20,2,语音合成的应用,公交汽车上的自动报站、各种场合的自动报,时、自动报警、手机查询服务和各种文本校对中,的语音提示、在电信声讯服务:如股票、售后服,务、车站查询等信息

11、;也可用于基于微型机的办,公、教学、娱乐等智能多媒体软件,例如语言学,习、教学软件、语音玩具、语音书籍等;也可与,语音合成技术与机器翻译技术结合,实现语音翻,译等,数字语音处理及,MATLAB,仿真,张雪英编著,21,3,语音编码的应用,在移动通信、卫星通信、军事保密通信、信息,高速公路和,IP,电话通信中的应用,在个人移动通信、语音存储、多媒体通信、数,字数据网,DDN,中的应用,未来的,ISDN,卫星通信、移动通信、微波接,力通信和信息高速公路以及保密电话等中的应用,数字语音处理及,MATLAB,仿真,张雪英编著,22,二、语音信号处理的新方向,1,基于语音的信息检索。网络技术及数字图书馆

12、,技术的发展,基于语音识别的信息检索技术正成为,研究热点,2,基于语音识别的广播新闻的自动文摘技术的研,究。由于广播、电视中的发音较为标准规范,在识,别中避免了说话人发音上的不规范,有利于语音识,别系统性能的提高,数字语音处理及,MATLAB,仿真,张雪英编著,23,二、语音信号处理的新方向,3,VoIP,技术。是通过,TCP/IP,网络,而不是传统的,电话网络来传输语音的新的通信方式,通常称之为,IP,电话技术。在网络上对压缩的语音数据以数据包,的形式进行传输和识别,4,语音训练与校正技术。现在越来越多的人希望,掌握其他非母语语言,以便方便的进行交流。因此,语言学习机已成为当今外语学习者的有

13、利工具,数字语音处理及,MATLAB,仿真,张雪英编著,24,二,语音信号处理的新方向,5,语种识别。是近年来新出现的研究方向,通过,分析处理一个语音片断来判别其所属语音的种类,本质上属于语音识别的研究范畴,6,基于语音的情感处理研究。在人与人的交流中,除了语音信息外,非语言信息也起着重要的作用,为了使人机交流更自然、更人性化,基于语音的情,感处理研究也是非常必要的,数字语音处理及,MATLAB,仿真,张雪英编著,25,1.4,语音信号处理过程的总体结构,图,1.1,信号处理和加工的一般示意图,信号提取与利用,信号变换,信号表示,观察与测量,信号源,信息加工和处理的一般流程如图,1.1,所示,

14、数字语音处理及,MATLAB,仿真,张雪英编著,26,语音输入,预处理,数字化,特征提取,合成,传输,参考模式库,模式匹配,识别结果,压缩处理,识别,训练,语音识别,解压缩,存储,语音输出,图,1.2,语音处理过程的结构框图,语音处理过程的结构框图,数字语音处理及,MATLAB,仿真,张雪英编著,27,1.5 MATLAB,在数字语音信号处,理中的应用,数字语音信号处理是将数字信号处理与语音学,相结合,解决现代通信领域中人与人、人与机器之,间的信息交流的学科,MATLAB,是一种功能强大、效率高、交互性,好的计算机高级语言,近年来,MATLAB,已成为学习语音信号处理和,进行研究工作的仿真软件

15、工具,数字语音处理及,MATLAB,仿真,张雪英编著,28,MATLAB,在数字语音信号中的几方面应用,1,通过,MATLAB,可以对数字化的语音信号进,行时频域分析,2,通过,MATLAB,可以对数字化的语音信号进,行估计和判别,3,通过利用,MATLAB,编程对语音信号进行处,理,本书中的程序实例均用,MATLAB,语言编写,供,大家上机实践时参考,数字语音处理及,MATLAB,仿真,张雪英编著,29,数字语音信号处理研究内容,涉及三方面相互密切配合的任务和课题,1,应用,2,基础理论和算法,3,硬件系统,数字语音处理及,MATLAB,仿真,张雪英编著,30,1,应用方面,通信产业起源于,

16、1874,年电话的发明。从那时,起,通信产业大致发生了三次重大变革,1,第一次变革产生于七十年代初,1972,年,CCITT,组织公布了第一个语音编码标准,G.711,即对数,PCM,编码,由此开始,数字程控交换网络,逐步淘汰了传统的模拟交换传输方式,数字语音处理及,MATLAB,仿真,张雪英编著,31,2,第二次重大变革产生于八十年代末,1988,年,欧共体,13,个国家数字移动特别工作组,GSM,制定了,采用长时预测规则码激励的编码标准,13k,bps,RPE-LTP,1989,年美国蜂窝通信工业协会,CITA,宣布了,北美数字移动通信话音编码标准,8K,bps,矢量和激,励,VSELP,

17、从而确立了全球范围第二个传输网移,动通信产业的崛起,数字语音处理及,MATLAB,仿真,张雪英编著,32,3,第三次变革发生在世纪之交。以新兴的计算,机因特网为基础的信息高速公路在全世界范围迅,速发展。如何在,INTERNET,网上有效地传输话音,成为产业界关注的焦点,IP,电话将使因特网成为,第三个话音通信传输网。目前,IP,电话所用的话音,编码标准有,G.723.1,G.728,G.729,等。这些标准,各有长短。人们正在努力研究适合,IP,电话的新的,编码算法。低延迟、低码率、低复杂性、高音质,的话音编码算法将是未来,IP,电话网络的奠基石,数字语音处理及,MATLAB,仿真,张雪英编著,33,2,基础理论和算法方面,从以下方面进行,1,语音产生的机理(发音)和感知机理(听,涉及心理学、语音学、语言学、认知学、神经生,理学等,2,将语音作为一种信号来处理,常用方法,数字滤波器,FIR,IIR,;快速付里,叶变换,FFT,线性预测编

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论