语音信号处理综述1_第1页
语音信号处理综述1_第2页
语音信号处理综述1_第3页
语音信号处理综述1_第4页
语音信号处理综述1_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、课 程 综 述课程名称 语音信号处理 任课教师 周泽华 班级 08电子(1班) 姓名 靳国 学号 0805070064 日期 2011年10月16日 目录1前言22. 语音信号处理的概念33. 语音信号处理的发展历史34. 语音信号处理的应用44.1 语音编码技术44.2 语音合成技术44.3语音识别技术54.4语音理解技术55. 语音信号处理的发展趋势66总结:77参考文献:7综述语音信号处理1前言语音信号数字处理技术在国民经济、日常生活和军事领域有着极为重要的应用价值和极其广阔的应用空间。本文介绍了语音信号处理在信息科学中的作用以及应用于科学领域的技术。众所周知,语音在人类社会中起了非常重

2、要的作用。在现代信息社会中,小至人们的日常生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都离不开语言和文字。近年来,普通电话、移动电话和互联网已经普及到家庭。在这些先进的工具中,语音信号处理中的语音编码和语音合成就有很大贡献。再进一步,可以预料到的口呼打字机(又称听写机,它能把语音转换为文字)、语音翻译机(例如输入为汉语,输出为英语,或者相反),已经不是梦想而是提到日程上的研究工作了。二正文2. 语音信号处理的概念语音信号处理简称语音处理,是以语音学和数字信号处理为基础而形成的一门综合性学科,处理的目的是要得到一些语音参数以便高效的传输或存储,或者通过处理的某种运算以达到某种用途的要求

3、,例如人工合成出语音,辨识出说话者,识别讲话的内容等。其研究的内容包括:语音信号的传输、编码、降噪;语音识别;语音合成;说话人识别(声纹识别);语种识别等。3. 语音信号处理的发展历史语音识别技术以语音信号处理为研究对象,涉及语言学、计算机科学、信号处理、生理学、心理学等诸多领域,是模式识别的重要分支。该技术有非常广阔的应用前景,从年代至今,世界许多著名公司不惜投入巨资进行开发研究。我国的北京大学和中科院声学研究所一直紧跟国际水平,进行汉语语音识别技术的研究工作。年代,是语音识别研究工作的开始时期,它以贝尔实验室研制成功可识别十个数字的系统为标志。年代,计算机广泛应用于语音识别的研究工作中,动

4、态规划和线性预测分析技术是这一时期的重要成果。年代,语音识别的研究取得了突破性进展。基于线性预测倒谱和动态时间规整技术的特定人孤立语音识别系统被研制成功,提出了矢量量化和隐马尔可夫模型理论。年代,语音识别的研究工作进一步深入。其标志是人工神经元网络在语音识别中的成功应用。年代,随着计算机技术的飞速发展,语音识别正从研究走向实用,其研究成果已达到相当高的水平。年,正象美国微软公司总裁所说的那样,语音识别技术将使计算机丢掉键盘和鼠标。这无疑将改变我们许多人的工作和生活方式。4. 语音信号处理的应用4.1 语音编码技术在语音信号数字处理过程中,语音编码技术是至关重要的,直接影响到话音存储、语音合成、

5、语音识别与理解。语音编码是模拟语音信号实现数字化的基本手段。语音信号是一种时变的准周期信号,而经过编码描述以后,语音信号可以作为数字数据来传输、存储或处理,因而具有一般数字信号的优点。语音编码主要有三种方式:波形编码、信源编码(又称声码器) 和混合编码,这三种方式都涉及到语音的压缩编码技术。通常把编码速率低于64 kbps的语音编码方式称为语音压缩编码技术。如何在尽量减少失真的情况下,降低语音编码的比特数已成为语音压缩编码技术的主要内容。换言之,在相同编码比特率下,如何取得更高质量的恢复语音是较高质量语音编码系统的要求。4.2 语音合成技术语音合成技术就是所谓“会说话的机器”。它可分为三类:波

6、形编码合成、参数式合成和规则合成。波形编码合成以语句、短语、词或音节为合成单元。合成单元的语音信号被录取后直接进行数字编码,经数据压缩组成一个合成语音库。重放时根据待输出的信息,在语音库中取出相应的合成单元的波形数据,将它们连接在一起,经解码还原成语音。参数式合成以音节或音素为合成单元。4.3语音识别技术 语音识别又称语音自动识别(Automated Speech Recognition,ASR),语音识别基于模式匹配的思想,从语音流中抽取声学特征,然后在特征空间完成模式的比较匹配,寻找最接近的词(字)作为识别结果。几十年来,语音识别技术经历了从特定人(Speaker Dependent,SD

7、)中小词汇量的孤立词语和连接词语的语音识别到非特定人(Speaker Independent,SI) 大词汇量的自然口语识别的发展历程。尽管如此,语音识别技术要走出实验室、全面融入人们的日常生活还需假以时日。当使用环境与训练环境有差异时,如在存在背景噪声、信道传输噪声、说话人语速和发音不标准等情况下,识别系统的性能往往会显著下降,无法满足实用的要求。环境噪声、方言和口音、口语识别已经成为目前语音识别中三个主要的新难题。4.4语音理解技术语音理解又称自然语音理解(Natural Language Understanding,NLU),其目的是实现人机智能化信息交换,构成通畅的人机语音通信。目前,

8、语音理解技术开始使计算机丢掉了键盘和鼠标,人们对语音理解的研究重点正拓展到特定应用领域的自然语音理解上。一些基于口语识别、语音合成和机器翻译的专用性系统开始出现,如信息发布系统、语音应答系统、会议同声翻译系统、多语种口语互译系统等等,正受到各方面越来越多的关注。这些系统可以按照人类的自然语音指令完成有关的任务,提供必要的信息服务,实现交互式语音反馈。语音是语言的声学表现形式,是最符合人类自然习惯的一种人际信息传播方式,具有便捷性、高效性、随机性、交互性等显著特点,是实现人机交互的一种重要通信方式。可以预见,随着计算机技术、数字信号处理技术和大规模集成电路的迅速发展,语音信号数字处理技术将成为信

9、息化战争不可或缺的重要组成部分,并直接进入到信息化战争的前沿。5. 语音信号处理的发展趋势语音合成方向:公共交通自动报站,各种场合的自动 报时,自动告警等,文本校对中的语音提示,电话查询服务; 与Internet结合,有声Email, 网上信息的有声获取,语音聊天等;与机器 翻译技术结合的语音翻译;与图象,视频技 术结合的视觉语音。语音编码方向:数字通信,移动通信,保密语音通 信;呼叫服务(数字录音电话,语音信箱 等)。另外ANN在语音识别中的应用是目前研究的热点。该网络本质上是一个自适应非线性动力学系统,模拟了人类大脑神经元活动的基本原理,具有学习、记忆判断、联想、对比、推理、概括等能力。与HMM和ANN相比,DTW是较早的一种模式匹配和模型训练技术,它应用动态规划法成功地解决了在语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好的性能。但由于它不适合连续语音大词汇量语音识别系统,目前已被HMM和ANN所代替。6总结:毫无疑问,飞速发展的计算机技术推动了语音识别技术的突破性进展,语音识别技术又反过来作用于计算机。假如微软公司的语音识别技术真正能使计算机彻底丢掉键盘和鼠

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论