版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语音信号处理
SpeechSignalProcessing为什么开语音信号处理这门课?典型性是计算机应用领域典型研究方向之一前沿性是极其重要的、亟待解决的、前沿的研究课题标志性计算机对语音的处理能力是人工智能水平的重要标志什么是语音信号处理?
语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段,是人类进行思维的依托。
人的言语过程什么是语音信号处理?语音信号处理是一门涉及诸多学科的交叉学科,它以生理学、心理学、语音学及声学等学科为基础,以信息论、系统论的理论为指导,通过应用信号处理、统计分析、模式识别等现代化技术手段而发展形成的一门综合性学科。什么是语音信号处理?语音识别SpeechRecognition语音信号处理领域的研究方向语音识别SpeechRecognition什么是语音信号处理?语音识别将语音装换成等价的书面信息,也就是让计算机听懂人说话。典型应用声音拨号系统;声控系统;听写机;自动口语翻译;会话系统;语音信息监测系统等。什么是语音信号处理?语音识别SpeechRecognition语音合成SpeechSynthesis语音信号处理领域的研究方向语音合成SpeechSynthesis什么是语音信号处理?语音合成将书面信息装换成等价的语音,也就是让计算机说话。典型应用自动报站信息查询语言学习软件TTS(TexttoSpeech)技术等。什么是语音信号处理?语音识别SpeechRecognition语音合成SpeechSynthesis语音编码SpeechCoding语音信号处理领域的研究方向语音编码SpeechCoding什么是语音信号处理?语音编码用尽可能低的比特率来存储和传输语音数据典型应用数字通信系统--各种编码格式保密通信语音信箱VOIP(Voiceoverinternetprotocol)多媒体流媒体。什么是语音信号处理?语音识别SpeechRecognition语音合成SpeechSynthesis语音编码SpeechCoding说话人识别SpeakerRecognition语音信号处理领域的研究方向说话人识别SpeakerRecognition什么是语音信号处理?
说话人识别根据语音辨认说话人典型应用
声控门锁电子商务司法鉴定
情报搜集。什么是语音信号处理?语音识别SpeechRecognition语音合成SpeechSynthesis语音编码SpeechCoding说话人识别SpeakerRecognition语音信号处理领域的研究方向如何来学习这门课程?
四个研究方向被分成两个部分,采用不同的讲解方法
语音识别SpeechRecognition语音合成SpeechSynthesis语音编码SpeechCoding说话人识别SpeakerRecognition语音信号处理领域的研究方向详细讲解,围绕着识别语音这个目标,逐步给出解决方案介绍性讲解,了解经典方法和研究现状如何来学习这门课程?跟随我的脚步认真完成课堂练习涉及到的其它学科的知识会被讲解或指出会布置若干题目作为课程报告参考书韩纪庆、张磊、郑铁然《语音信号处理》清华大学出版社。
易克初、田斌等《语音信号处理》国防工业出版社。蔡莲红、黄德智等《现代语音技术基础与应用》清华大学出版社RabinerL,JuangBH.FundamentalsofSpeechRecognition.NewJersey:PrenticeHallPTR,北京:清华大学出版社,1999
研究历史和现状概况:起步很早、尚未完全成熟1876年Bell发明电话。1939年H.Dudley研制成功第一个声码器。1942年Bell实验室发明了语谱仪。1948年美国Haskin实验室研制成功“语图回放机”。1952年Bell实验室研制成功能识别十个英语数字的识别器1956年声控打字机60年代以后,随着计算机技术的发展,语音信号处理技术获得了长足的进步,计算机模拟试验取代了硬件研制的传统做法。各种突破性的思想不断涌现。
研究历史和现状1960年Denes等人用计算机实现自动语音识别,引入了时间归正算法改进匹配性能;60年代中期,Martin等人为邮局研制了邮政编码阅读机;70年代开始,人工智能技术开始引入到语音识别中。美国国防部ARPA组织了有CMU等五个单位参加的一项大规模语音识别和理解研究计划;70年代中,日本学者提出的动态时间弯折算法对小词表的研究获得了成功,从而掀起了语音识别的研究热潮;研究历史和现状70年代末,基于矢量量化码本生成的LBG算法被提出,从而使矢量量化技术广泛地应用于语音识别、语音编码和说话人识别中;从70年代末80年代初开始,隐马尔可夫模型HMM(HiddenMarkovModel)技术被应用到语音识别中;80年代以来出现了语音处理技术产品化的热潮。1985年IBM公司研制了5000词英语听写机Tangora-5,80年代末完成的Tangora-20能识别的词汇达到了20000,识别率达到了94.6%研究历史和现状90年代初,CMU的LeeKaifu完成的非特定人连续语音识别系统SPHINX是最有代表性的,它能识别997个词汇的连续语音,识别率达到95.8%;1997年IBM推出的汉语听写机产品ViaVoice为语音识别在汉字输入方面的实际应用开辟了新的道路;1999年Intel推出语音识别软件开发包Spark3.0;
MicrosoftVoice及基于.net的语音识别引擎。
研究历史和现状语音识别目前已开展的应用领域呼叫中心自动总机语音电话本旅行预定信息检索语音门户和客户自助服务等系统听写机机辅和网络英语教学中的应用电话上网研究历史和现状举例美国联合航空(UnitedAirlines):客户通过致电(800)824-6200,应用ScanSoft的OSR(OpenSpeechRecognizer)语音识别技术可方便查询联合航空公司每天2400个航班的状态,每天有8万多人使用这一系统。BellCanada,加拿大最大的电信运营商,也拥有多个语音驱动系统,提供从客户服务,增值业务和资讯服务多种功能。这些系统不但减少了用户的投诉,也为无线网络服务增值,增强了客户的忠诚度并开辟了新的收入来源。(NuanceCommunications)研究历史和现状语音识别引擎:IBM:ViaVoice-目前已经开源Microsoft:Office软件中集成了听写功能,SAPILernout&HauspieASR1500ScanSoft
:OSR(OpenSpeechRecognizer)Nuance:NuanceCommunications中科院:Pattek
ASR最早开展的三家公司:IBM、Dragon、L&H
最早的语音识别器:Sphinx研究历史和现状中文语音合成引擎:国内处于领先地位Microsoft:SAPI中科大讯飞公司:畅言2000清华Sonic浙江大学(杭州音通软件有限公司):IntoneT
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025液化石油气供货合同
- 智能卷帘门定制安装合同
- 酒店管理备案合同承诺书
- 律所文职人员劳动合同
- 体育教练班主任聘用合同
- 网络设备安装合同样本
- 矿产开采班组施工合同
- 2024版房屋出售委托代理协议书范文
- 研究所出纳岗位劳动合同
- 化妆品简易仓库租赁合同
- 2024-2025学年铜官山区数学三年级第一学期期末调研试题含解析
- ISO 56001-2024《创新管理体系-要求》专业解读与应用实践指导材料之18:“7支持-7.1资源”(雷泽佳编制-2025B0)
- JGJ46-2024 建筑与市政工程施工现场临时用电安全技术标准
- 江西省2023-2024学年高二上学期期末教学检测数学试题 附答案
- 2023-2024-1习思想学习通超星期末考试答案章节答案2024年
- 说明书hid500系列变频调速器使用说明书s1.1(1)
- 通达信-低位放量公式(已验证)
- 第四章 船舶动力管路系统
- 太上正一天尊说镇宅消灾龙虎妙经
- 全球实验室仪器耗材国际品牌简介
- 空白数独格子
评论
0/150
提交评论