开题报告:语音识别系统中的快速搜索算法研究_第1页
开题报告:语音识别系统中的快速搜索算法研究_第2页
开题报告:语音识别系统中的快速搜索算法研究_第3页
开题报告:语音识别系统中的快速搜索算法研究_第4页
开题报告:语音识别系统中的快速搜索算法研究_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、北方工业大学 本科毕业设计(论文)开 题 报 告 书题 目: 语音识别系统中的快速搜索算法研究 指导教师 : 专业班级: 学 号: 姓 名: 日 期: 2013年3月4日 一、选题的目的、意义我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是将人类的语音中的

2、词汇内容转换为计算机可读的输入,例如,二进制编码或者字符序列。语音识别技术的应用可以分为两个发展方向:一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的;另外一个重要的发展方向是小型化、便携式语音产品的应用,如手机上的拨号、汽车设备的语音控制、家电遥控等方面的应用,这些应用系统大都使用专门的硬件系统实现。嵌入式孤立词识别是小型化、便携式语音识别方向的应用热点,拥有较好应用成果,若在此基础上,开发大词量孤立词语音识别系统或中等词汇量连续语音识别系统,不仅使语音识别系统的应用范围扩大,而且令用户得到更好的语音识别

3、体验。搜索时间消耗与词量成正比,为在识别率和识别速度之间寻求合适的平衡点,必须提升系统性能。任何电子设备(系统)都是由硬件部分和软件部分组成的,所以只要改进这两部分就能提升成品的性能,但是由于嵌入式平台的苛刻性,即计算机性能和内存资源受限,所以只能考虑改进软件方面,即精炼、修改解码算法,从而提高搜索速度。二、本题的基本内容从语音识别技术诞生以来,识别率就是评价语音识别系统的一个重要指标,随着语音识别技术的实用化,识别系统的速度也成为了和识别率一样重要的评价系统的重要指标,我们都知道,语音识别系统的精度和速度是一对互相矛盾的参数,那么如何能在尽量不影响识别率的前提下提高速度指标是本文研究的一个重

4、点。本文搭建的语音识别系统基于隐马尔可夫模型(HMM)。HMM 语音识别的基本原理如图 1所示。帧同步维特比束搜索(Time Synchronous Viterbi Beam Search)是目前基于HMM(隐马尔可夫模型)的语音识别所广为采用的方法。对于孤立词语音识别,帧同步维特比束搜索的时间消耗与词表规模近似成正比。当词表规模增大到一定程度时,Viterbi搜索将成为识别算法的主要时间消耗因素。所以本文针对Viterbi搜索,部分进行了优化算法的研究。基于观察矢量与孤立词识别网络单向有序对应的特点,本文提出了一种基于自动音节切分的束搜索算法。本文先描述了一下该理念的理论基础,因为待识别语音

5、得到的观察矢量是一个线性序列,则该网络Q与观察矢量序列E是单向对应的,进行Viterbi搜索时,若只保留观察矢量序列E的对应段Q,其余路径不予计算, 则可实现基于音节切分的束搜索。该方法无需对路径排序即可实现音节层的剪枝。而后很大的篇幅在讲述本文的重点内容即自动音节切分的束搜索算法的实现,实现的过程概括的分为四步:1)搜索之初,初始化搜索范围即对语音进行切分;2)对每个音节进行判定,得出分数;3)将所得分数进行归一化处理;4)将所得词条与模板一一比对,得出结果。最后将束搜索算法植入预先准备的语音识别系统里,测试束搜索算法的性能,为准确比较束搜索算法的时间性能,测试中不包含特征参数提取、输出概率

6、计算等公共时间开销。三、完成期限和主要措施第 1周: 收集资料第 2周: 文献翻译第 3周: 撰写开题报告第 4周: 开题答辩第56周: 制定实施方案第 7周: 电路设计,编程第 8周: 中期答辩第910 周: 改进已设计的电路或程序第1113周: 软硬件调试第14周: 验收第15周: 撰写毕业论文,为毕业答辩做准备第16周: 毕业答辩四、预期达到的目标1、使用matlab编写出可应用的完整的语音搜索算法.2、在基础搜索语言完成的基础上,增大语音识别系统的词库的词汇量,在不降低识别精度和不增加内存消耗的同时,搜索耗时不增加。五、主要参考文献1 荆嘉敏, 刘加, 刘润生. 基于 HMM 的语音识

7、别技术在嵌入式系统中的应用 J . 电子技术应用, 2003, 10: 12 -14.JING Jiamin, LIU Jia, LIU Runsheng. Application of HMM - based speech recognition on embedded system J .Application of Electronic Technology, 2003, 10: 12 -14. ( in Chinese)2 黄昆. 嵌入式, 语音识别技术新趋向 J . 中国计算机用户2006, 45: 46.H UANG Kun. Embedded, new trend of spee

8、ch recognition J . China Computer Users, 2006, 45: 46. ( in Chinese)3 刘斌, 杜利民, 谢凌云. 嵌入式语音识别系统性能分析 J .微计算机应用, 2008, 29( 7) : 52 -55.LIU Bin, DU Limin, XIE Lingyun. Performance analysis of embedded speech recognition system J. Microcomputer Application, 2008, 29( 7) : 52 -55. ( in Chinese)4 孙阿利, 蒋冬梅,

9、吕国云, 等. 基于动态贝叶斯网络的语音识 别 及 音 素 切 分 J . 计 算 机 应 用 研 究, 2007,24( 10) : 104 -106.SUN Ali, JIANG Dongmei, LV Guoyun, ital. Research on DBN-based continuous speech recognition and phoneme segment J. Application Research of Computer, 2007, 24( 10) : 104 -106. ( in Chinese)5 龙潜. 噪声环境下的语音识别技术研究 D . 合肥: 中国科学技

10、术大学, 2007.LONG Qian. Research on Speech Recognition in Noisy Environment D. Hefei: University of Science and Technology of China, 2007. ( in Chinese)6 董倩. 鲁棒语音识别技术的研究 D . 长春: 吉林大学,2007. DONG Qian. Research on Robust Speech Recognition D .Changchun: Jilin University, 2007. ( in Chinese)7Wu G D, Lin C

11、 T . Word boundary detection with me- l scale frequency bank in noisy environment J . IEEE Trans Speech and Audio Proc , 2000, 8( 5) : 541 -554.8张东滨, 杜利民. 语音识别的自适应束剪枝方法 J . 电声技术, 2004, 8: 40 - 45.ZHANG Dongbin , DU Limin. Adaptive beam pruning for speech recognition J . Audio Engineering , 2004, 8: 40 -45.( in Chinese)9Rabiner L R. Atutorial on hidden Markov models and selected applications in speech recognition J . Proceedings of the IEEE , 1989, 77( 2) : 257 -286.10 Huang X D, Acero A, Hon H , et al. Spoken Language Processing: A Guide to Theory, Algorithm and System Development M . New Je

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论