语音识别的特征参数的提取与研究的毕业论文_第1页
语音识别的特征参数的提取与研究的毕业论文_第2页
语音识别的特征参数的提取与研究的毕业论文_第3页
语音识别的特征参数的提取与研究的毕业论文_第4页
语音识别的特征参数的提取与研究的毕业论文_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

桂林航天工业学院毕业设计题目:基于语音识别的特征参数提取研究专业:电子信息工程技术姓名:黄莉珊 学号:201004520121指导教师:潘丹青20 13 年 4 月 1 日 I毕 业 设 计( 论 文 )评 语指导教师评语签字: 20 年 月 日评阅教师评语签字: 20 年 月 日II毕业设计(论文)答辩记录成绩及评语答辩提问记录记录人: 20 年 月 日答辩委员会评语成 绩:主任签字: 20 年 月 日III桂 林 航 天 工 业 学 院电 子 工 程 系毕 业 设 计 任 务 书专 业 : 电 子 信 息 工 程 技 术 年 级 : 2010 级姓 名 黄 莉 珊 学 号 201004520121 指 导 教 师 ( 签 名 )毕 业 设 计 题 目 基于语音识别的特征参数提取研究任 务 下 达 日 期 2012 年 11 月 10 日 设 计 提 交 期 限 2013 年 6 月 10 日设 计 主 要内 容本毕业论文的主要内容首先是分析语音识别的基本原理及语音识别的方法;然后讨论了语音信号的预处理、端点检测及语音特征参数:Mel倒谱系数和LPC倒谱系数;最后针对MEL频率倒谱系数及LPC倒谱系数的提取进行研究,并对仿真结果进行分析。主 要 技 术参 数 指 标Mel 倒谱系数和 LPC 倒谱系数的提取方法, 语音信号的预处理、端点检测方法的分析 ,Matlab 仿真。成 果 提 交形 式 将论文装订成册,提交全部毕业文档设 计 进 度安 排1、课题的准备阶段:(2012 年 11 月-2013 年 12 月)2、课题研究与系统开发阶段:(2013 年 1 月-2013 年 3 月)3、撰写阶段(2013 年 4 月-2013 年 5 月)4、提交论文准备答辩阶段:(2013 年 5 月2013 年 6 月) 教 研 室意 见 签 名 : 20 年 月 日 系 主 任意 见 签 名 : 20 年 月 日装订线IV桂 林 航 天 工 业 学 院电 子 工 程 系毕 业 设 计 开 题 报 告姓 名 黄 莉 珊 学 号 201004520121 指 导 教 师 潘 丹 清毕 业 设 计 题 目 基于语音识别的特征参数提取研究 同 组设 计目 的意 义语音信号处理是一门新兴的边缘学科,它是语音学和数字信号处理两个学科相结合的产物。它和认知科学、心理学、语言学、计算机科学、模式识别和人工智能等学科有着紧密的联系。语音信号处理的发展依赖于这些学科的发展,而语音信号处理技术的进步也会促进这些领域的进步。作为高科技应用领域的研究热点,语音信号处理技术从理论的研究到实际应用已取得非常大的进步。对语音识别特征参数的提取与研究对语音信号处理技术的发展起着重要的作用,而语音信号处理技术的发展推动者社会进步的发展。方案论证利用马尔可夫模型方法(HMM)。隐马尔可夫模型是一种基于转移概率和输出概率的随机模型,最早在 CMU 和 IBM 被用于语音识别。它把语音看成由可观察到的符合序列组成的随机过程,符号序列则是发声系统状态序列的输出。在使用隐马尔可夫模型识别时,为每个说话人建立发声模型,通过训练得到状态转移概率矩阵和符号输出概率矩阵。识别时计算未知语音在状态转移过程中的最大概率,根据最大概率对应的模型进行判决。对于与文本无关的语音识别一般采用各态历经型 HMM;对于与文本有关的说话人识别一般采用从左到右型 HMM。HMM 不需要时间规整,可节约判决时的计算时间和存储量,在目前被广泛应用。 时间安排1、课题的准备阶段:(2012 年 11 月-2013 年 12 月)2、课题研究与系统开发阶段:(2013 年 1 月-2013 年 3 月)3、撰写阶段(2013 年 4 月-2013 年 5 月)4、提交论文准备答辩阶段:(2013 年 5 月2013 年 6 月) 指 导教 师意 见签 字 : 年 月 日 审 核小 组意 见 组 长 签 字 : 年 月 日装订线桂林航天工业学院毕业设计(论文)第 V 页摘 要语音识别就是让机器能够听懂人话,它是以语音为研究对象的,是语音信号处理的一个重要的研究方向。随着计算机技术、多媒体技术、数字信号处理技术的发展,人们对语音识别技术的发展寄予了更高的期望. 语音识别拥有着可观的应用背景,同时作为一个交叉学科也具有深远的理论研究价值。论文首先在第一章介绍了语音识别发展历史及发展趋势,语音识别系统的原理组成以及语音特征参数的提取在语音识别中的作用。之后,本文对语音信号识别的一些基本理论及算法进行了一些研究和实验.首先在第二章对语音信号的处理及特征进行了介绍.论文在介绍分析了语音识别产生的数字模型和语音信号预处理问题之后,针对传统端点检测算法的不足,提出了一种基于短时平均能量的端点检测算法。论文论述了语音特征参数的提取需要满足的条件对线性预测进行了详细的分析,通过做实验,对实验结果进行仿真.对 MEL 倒谱系数进行阐述,并对 MFCC 参数提取过程进行分析最后对实验结果进行仿真与分析。关键词:语音识别;特征提取;端点检测 ;倒谱系数桂林航天工业学院毕业设计(论文)第 VI 页AbstractThe speech recognition is one of the important research directions of speech signal processingThe study of speech recognition is to force machine to understand what the logical expressionSpeech recognition is very promising in application As an interdisciplinary field,it is also theoretically very valuedThis thesis introduces some theories about speech recognition and also presents the results of some experiments of improving the speech recognition algorithms. In chapter 2 we describe the processing of the speech signal and the feature extraction. Based on introduction and analysis of the speech recognition produce digital model and speech signal preprocessing after problems, aiming at the deficiency of the traditional endpoint detection algorithm, this paper puts forward a speech signal based on short time average energy endpoint detection algorithm. This paper discusses the extraction of speech feature parameters need to meet the conditions on the linear prediction are analyzed in detail, and through the experiment, the result of the experiment simulation. For MEL cepstrum coefficient is expounded, and the MFCC parameter extraction process to carry on the analysis to the experimental results in simulation and analysis.Keywords:speech recognition feature extraction endpoint detection MFCC桂林航天工业学院毕业设计(论文)第 VII 页目 录评语 答辩记录 毕业设计任务书 毕业设计开题报告 中英文摘要 V引言 .11 绪论 .21.1 语音识别发展历史及发展趋势 .21.2 语音识别系统的原理组成 .31.3 语音特征参数的提取在语音识别中的作用 .42 语音信号预处理 .52.1 语音信号的预加重 . 62.2 语音信号的采样与滤波 . 72.3 语音信号的加窗与分帧 .82.4 语音端点检测 .92.4.1 语音信号短时平均能量 .102.4.2 语音信号短时平均过零率 .123 语音特征参数提取 .133.1 线性预测倒谱系数 LPCC.143.1.1 线性预测分析 .153.1.2 线性预测倒谱分析 .153.2 MEL 倒谱系数 MFCC.163.2.1 MEL 频率 .163.2.2MFCC 参数提取 .173.2.3 实验仿真结果与分析 .184 结论 .20谢辞 .23参考文献 .24附录 .26桂林航天工业学院毕业设计(论文)1引 言语音信号处理是语音学与数字信号处理技术相结合的交叉学科,它和认知科学、心理学、语言学、计算机科学、模式识别和人工智能等学科联系紧密。语音信号处理技术的发展依赖于这些学科的发展,而语音信号处理技术的进步也会促成这些学科的进步。语音信号处理的目的是要得到某些语音特征参数以便高效地传输或存储;或者是通过某种处理运算以达到某种用途的要求,如人工合成语音、辨识出讲话者、识别出讲话的内容等。语音合成技术、语音编码技术及语音识别技术作为语音信号处理的三个分支。语言作为人类最重要的交流工具,是人类获得信息的重要来源之一,让计算机能“听懂”人类的语言,也是人与计算机之间进行沟通最方便的形式之一。用语音来实现人与计算机之间的交互,主要包括三项技术,即语音识别、自然语言理解和语音合成。随着计算机处理能力的迅速提高,语音识别技术得到了飞速发展。20 世纪 90 年代,语音识别技术从实验室走向应用,今天,语音识别技术受到了国内外研究机构的广泛关注和高度重视,其应用也必将带来良好的社会和经济效益。桂林航天工业学院毕业设计(论文)21 绪论人类的语言在人们的生活中起着极其重要的作用,人与人之间的交流方式有很多种,但是 70都是通过语音来有效的完成的。语音是人类相互之间进行交流时,使用最多、最自然、最基本的信息载体。与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。而语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。1.1 语音识别发展历史及趋势语音识别,就是让计算机听得懂人说的话,并能做出相应的处理,也是人机交互最重要的第一步。它是语音信号处理的一个重要研究方向,是模式识别的一个分支,它涉及到生理学、心理学、语言学、计算机科学、通信科学以及信号处理等诸多领域,甚至还涉及到人的体态语言。就语音识别技术而言,其基本任务是将输入语音转化为相应的文本或命令。语音识别的市场前景广泛,在一些应用领域中正迅速成为一个关键的具有竞争力的技术。例如在声控应用中,计算机识别输入的语音内容,并根内容来执行相应的动作,这包括声控电话转换、声控语音拨号系统、声控智能玩具、信息网络查询、家庭服务、宾馆服务、医疗服务等等。语音识别也可用于将文字以口授的方式输入到计算机中,即广泛开展的听写机研究,如声控打字机等。语音识别技术还可以用于自动口语翻译,即通过将口语识别技术、机器翻译技术、语音合成技术等相结合,可将一种语言输入的语音翻译成另一种语言的语音输出,实现跨语言的交流。对说话人识别技术,近年来已经在安全加密、银行信息电话查询服务等方面得到了很好的应用。此外,在公安机关破案和法庭取证方面也发挥着重要的作用。语音识别技术的研究开始于上世纪 40 年代末,起初发展很慢。到了上世纪50 年代初,当时 AT&TBell 实验室实现了第一个可识别十个英文数字的语音识别系统Audry 系统,也标志着语音识别技术的研究

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论