版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、豪rr亠处孝数字语音处理尺MATLAB仿真 张習英编著数字语音处理及MATLAB仿真数字语音处理及MATLAB仿真张雪英太原理工大学信息工程学院张雪英编著College of Information Engineering, TaiyuanUniversity of Technology谏程总括课程性质课程貝的和任务课程重点 课程难点2豪rr亠处孝数字语音处理尺MATLAB仿真 张習英编著2豪rr亠处孝数字语音处理尺MATLAB仿真 张習英编著2数字语音处理及MATLAB仿真 张雪英编玉数字语音处理及MATLAB仿真 张雪英编玉無程性质语音信号处理是通信、电子信息专业的选 修课程,主要用于现代
2、通信和电子信息领域, 其主要前修专业基础课程为信号与系统和数字 信号处理。数字语音处理及MATLAB仿真 张雪英编玉课程目的和任务通过本课程的学习理解语音发声和听觉机理 及其数字模型;掌握语音信号处理的基本概念、 原理和方法,为以后的学习提供理论依据;掌握 语音信号的短时时域分析和频域分析方法,并且 能够用Mat I ab语言编程实现对实际语音信号进行的处理;熟悉语音信号处理的应用领域,并了解 该领域的新理论、新技术和发展趋势,为今后的 进一步学习和工作打下坚实的基础。课程重点语音信号的产生和语音信号数字模型。短时 能量、平均过零率、自相关的意义,以及这些特 征参量在语音信号中的应用,并且会用
3、 MATLAB实现。短时频域分析的两种解释以及 实现、LPC的基本原理以及与语音模型的关系.前馈和反馈的主要区别,另外增量调制中所造成 的失真以及失真补偿。矢量量化原理、LBG算法 以及实验。数字语音处理及MATLAB仿翼张雪英编著课程难点语音信号的产生和激励.端点检测和基音周期的估计.用数学公式来证明短时频谱是如何反 映整个语音信号的频谱的、ITC方程组解法、自 适应预测编码原理、LBG算法以及实验中的分帧 和基音周期检测。数字语音处理及MATLAB仿翼张雪英编箸r1.5 MATLA数字语音处理及MATLAB仿真张雪英编著1.1概述数字语音处理及MATLAB仿真 张雪英编著飞i章绪论1,1.
4、概述1.2语音信号处理的发展1. -3.语音信号处理的应用及新方向1.4语音信号处理过程的总体结构理中的应用数字语音处理及MATLAB仿翼张雪英编箸语音信号处理是一门新兴的边缘学科,是语音 学与数字信号处理两个学科相结合的产物。它和认 知科学、心理学、语言学.计算机科学.模式识别 和人工智能等学科有着紧密的联系。语音信号处理的目的: 得到某些语音特征参数以便高效地传输或存储;通过某种处理运算以达到某种用途的要求。语音信息的交换大致上可以分为三大类:(1)人与人之间的语言通信:包括语音压缩与编码、语音增强等。(2)第一类人机语言通信问题:语音合成,机器讲话、人听话的研究。(3)第二类人机语言通信
5、问题:语音识别和理解 语音识别和理解:人讲话、机器听话的情况。数字语音处理及MATLAB仿真张雪英编爭h喬菩祜号处理的发展'数字语音处理及MATLAB仿真 张雪英编爭1.2语音信号处理的发展数字语音处理及MATLAB仿真 张雪英编爭1.2.1 语音合成数字语音处理及MATLAB仿真 张雪英编爭数字语音处理及MATLAB仿真 张雪英编爭以语言信息压缩、存储为主要目的对语音信号数字模型进行研究,同时研究音素、音节.词数字语音处理及MATLAB仿真 张雪英编爭组与句子的发音规则。最终恢复出自然流畅的语 音来。例如文语转换系统(Text-to-speech)o语音 分析与合成将赋予计算机说话的
6、功能。也是进行 话音编码、语音识别研究的基础。1.2.2语音编码语音编码的目的:在保证一定语音质量的前提下,尽可能降低 编码比特率,以节省频率资源。数字语音处理及MATLAB仿真 张雪英编爭1.2.2 语苜编码语音编码与文本到语音转换两个主要区别一、前者是人与人之间的话音交流,要保说话人的声音特征。后者是文本到声音的转换即 计算机发声。它可以是标准播音员或其它声音。二.前者不仅対压缩率和音质有要求,而且 要求较低的编、解码延迟。而后者对处理帧长没 有什么太严格的限制。数字语音处理及MATLAB仿真 张雪英编爭归入同一类应用。数字语音处理及MATLAB仿真 张雪英编玉1.2.3语音识别研究如何使
7、计算机能够听懂人类的语言。以 汉语语音为例:汉语约有400个音节,加上声调约1200个音调节,把这些语音信号的特征存储到计算机内,并与计算机接收到的汉语发音进行比较, 找到特征相同的音节或音调节,这个过程就是语 音识别。将识别出的音节序列转换成文字,就是 语言理解。许多算法将理解过程溶入到识别中来 提高识别的准确性。因此可以将语音识别与理解(1) 根据对说话人说话方式的要求,可以分 为孤立字语音识别系统,连接字语音识别系统以 及连续语音识别系统。(2) 根据对说话人的依赖程度可以分为特定 人和非特定人语音识别系统。(3) 根据词汇量大小,可以分为小词汇量. 中等词汇量、大词汇量以及无限词汇量语
8、音识别 系统。理的应用及新方向-:语音信号处理的应用语音技术的应用领域包括语音识别、说话人的鉴别和确认、语种的鉴 别和确认、关键词检测和确认、语音合成、语音 编码等。但其中最具有挑战性和最富有应用前景的为语音 识别技术。数字语音处理几MATLAB仿真 张雪英编爭1.说话人识别技术的应用安全加密、银行信息电话查询服务公安机关破案和法庭取证方面在声控应用中,识别输入的语音内容,并根据内容来执行相 应的动作,这包括了声控电话转换、声控语音拨号系统、声 控智能玩具、信息网络查询、家庭服务.宾馆服务、旅行社 服务系统、医疗服务、股票查询服务和工业控制等。数字语音处理几MATLAB仿真 张雪英编爭1.说话
9、人识别技术的应用在电话与通信系统中,智能语音接口正在把 电话机从一个单纯的服务工具变成为一个服务的 “提供者”和生活“伙伴”。目前,自动口语分析、用户交换机、电话机、 手机已经包含了语音识别拨号功能,还有语音记事 本、语音智能玩具等产品也包含了语音识别与语音 合成功能。人们可以通过电话网络用语音识别口语 对话系统査询有关的机票、旅游、银行信息。数字语音处理及MATLAB仿真张常英编爭22数字语音处理几MATLAB仿真 张雪英编爭22数字语音处理几MATLAB仿真 张雪英编爭2. 语音合成的应用公交汽车上的自动报站、各种场合的自动报时、自动报警、手机查询服务和各种文本校对中 的语音提示、在电信声
10、讯服务:如股票.售后服 务、车站查询等信息;也可用于基于微型机的办公、教学、娱乐等智能多媒体软件,例如语言学 语音合成技术与机器翻译技术结合,实现语音翻 译等。习、教学软件.语音玩具.语音书(等;也可与3. 语音编码的应用在移动通信、卫星通信、军事保密通信、信息 高速公路和1P电话通信中的应用。在个人移动通信、语音存储、多媒体通信、数 字数据网(DDN)中的应用。未来的ISDN、卫星通信、移动通信、微波接 力通信和信息高速公路以及保密电话等中的应用。数字语音处理几MATLAB仿真 张雪英编爭21二、语音信号处理的新方向(1)基于语音的信息检索。网络技术及数字图书馆 技术的发展,基于语音识别的信
11、息检索技术正成为 研究热点。(2)基于语音识别的广播新闻的自动文摘技术的研 究。由于广播、电视中的发音较为标准规范,在识 别中避免了说话人发音上的不规范,有利于语音识 别系统性能的提高。二、语音信号处理的新方向(3) VoIP技术。是通过TCP/IP网络,而不是传统的 电话网络来传输语音的新的通信方式,通常称之为IP电话技术。在网络上对压缩的语音数据以数据包的形式进行传输和识别。(4)语音训练与校正技术。现在越来越多的人希望23掌握其他非母语语言,以便方便的进行交流。因此 语言学习机已成为当今外语学习者的有利工具。22数字语音处理几MATLAB仿真 张雪英编爭22数字语音处理几MATLAB仿真
12、 张雪英编爭数字语音处理及MATLAB仿真 张雪英编爭二、语音信号处理的新方向(5)语种识别。是近年来新出现的研究方向,通过 分析处理一个语音片断来判别其所属语音的种类, 本质上属于语音识别的研究范畴。(6)基于语音的情感处理研究。在人与人的交流中, 除了语音信息外,非语言信息也起着重要的作用。 为了使人机交流更自然.更人性化,基于语音的情;处理研究也是非常必要的。22信息加工和处理的一般流程如11所示数字语音处理及MATLAB仿真 张雪英编爭百番着着喜一处理过程的总体结构图11信号处理和加工的一般示意图数字语音处理及MATLAB仿真 张雪英编爭25语音处理过程的结构框图语音输入预处理1数字化
13、特征提取传蒯解压缩;语音输世压缩处理加存储语音识别参考模式库 |模珏K识别结果数字语音处理及MATLAB仿真 张雪英编玉1.5 MATLAB在数字语音信号处理中的应用数字语音信号处理是将数字信号处理与语音学 相结合,解决现代通信领域中人与人、人与机器之 间的信息交流的学科。MATLAB是一种功能强大、效率高、交互性 好的计算机高级语言。近年来MATLAB已成为学习语音信号处理和 进行研究工作的仿真软件工具。数字语音处理及MATLAB仿真张雪英编著MATLAB在数字语音信号中的几方面应用:(1) 通过MATLAB可以对数字化的语音信号进 行时频域分析。(2) 通过MATLAB可以对数字化的语音信
14、号进 行估计和判别。(3) 通过利用MATLAB编程对语音信号进行处本书中的程序实例均用MATLAB语言编写,供 大家上机实践时参考。数字语音信号处理研究内容涉及三方面相互密切配合的任务和课题:1 应用2. 基础理论和算法3. 硬件系统1.应用方面通信产业起源于1874年电话的发明。从那时 起,通信产业大致发生了三次重大变革。第一次变革产生于七十年代初。1972年 CCITT组织公布了第一个语音编码标准G.711o 即对数PCM编码,由此开始,数字程控交换网络 逐步淘汰了传统的模拟交换传输方式。数字语音处理及MATLAB仿真 张雪英编玉(1) 第二次重大变革产生于八十年代末。1988年 欧共体
15、13个国家数字移动特别工作组(GSM)制定了 采用长时预测规则码激励的编码标准(13k bps RPE-LTP)。1989年美国蜂窝通信工业协会(CITA)宣布了 北美数字移动通信话音编码标准(8K bps矢量和激 励VSELP) o从而确立了全球范围第二个传输网移 动通信产业的崛起。数字语音处理及MATLAB仿真 张雪英编爭(2) 第三次变革发生在世纪之交。以新兴的计算机因特网为基础的信息高速公路在全世界范围迅速发展。如何在INTERNET网上有效地传输话音成为产业界关注的焦点。IP电话将使因特网成为第三个话音通信传输网。目前1P电话所用的话音编码标准有G.723.1、G.728、G.729等。这些标准 各有长短。人们正在努
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论