


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、语音识别论文(语音识别技术论文):噪声环境下汉语连续语音识别技术研究 【摘要】: 语音识别已经有了半个多世纪的研究历史,取得了很大的进展。当前的语音识别系统在纯净语音环境中已经获得了非常高的识别精度,但在现实应用中,无处不在的噪声使得系统的识别性能大幅度降低,抗噪声问题是语音识别系统实用化的关键问题之一。 本文主要研究加性噪声环境下的汉语连续语音识别技术。首先介绍了语音识别的基本原理、语音识别系统的组成及其关键技术,随后介绍了噪声的分类和各种抗噪声技术,在此基础上本文的主要工作有: 1)在个人电脑平台上实现了一个中等词汇量、非特定人的汉语连续语音识别系统。系统采用带调音节作为识别基元
2、,Mel频标倒谱系数作为特征参数、隐马尔可夫模型作为识别模型,并对其进行实验,分析系统的性能。 2)在汉语连续语音识别中,准确检测出音节的始点和终点是很重要的一步。现有的汉语连续语音端点检测方法在纯净语音环境下检测准确率很高,但在噪声环境下准确率大幅度降低。本文根据汉语连续语音的特点以及噪声的特性,提出了基于元音检测的汉语连续语音端点检测方法,有效提高了噪声环境下端点检测的准确率。 3)语音识别系统处理的对象是特征参数,特征参数的抗噪性能对系统的抗噪性能影响很大。本文在分析传统Mel频标倒谱系数提取过程的基础上,结合小波包分析和滤波器加权分析,提出了一种新的特征参数提取方法。实验结果表明:改进
3、后的特征参数比传统Mel频标倒谱系数具有更高的识别率和更好的抗噪性能。【关键词】:汉语连续语音识别 端点检测 特征提取 隐马尔可夫模型 抗噪 【学位授予单位】:西北大学【学位级别】:硕士【学位授予年份】:2010【作者】:王艳【索取该硕士论文全文(WORD文档)】博硕教育网客服Q Q: 138113721 139938848【著作权益说明】本站仅为中国学术文献总库的合作代理商,作者如有异议请直接与总库联系【目录】: · 摘要3-4· Abstract4-8· 第一章 绪论8-14· 1.1 语音识别简介8-10· 1.1.1 语音识别技术概述8
4、-9· 1.1.2 国内外语音识别技术研究与发展9-10· 1.2 噪声环境下连续语音识别的意义10-11· 1.2.1 连续语音识别的意义10· 1.2.2 抗噪技术在语音识别中的意义10-11· 1.3 本文主要工作及创新11· 1.4 本文章节安排11-14· 第二章 语音识别系统构成14-34· 2.1 语音识别基本原理14-15· 2.2 语音预处理15-18· 2.2.1 预滤波与数字化15· 2.2.2 预加重15· 2.2.3 加窗分帧15-16·
5、2.2.4 端点检测16-18· 2.3 语音特征提取18-22· 2.3.1 线性预测倒谱系数19-21· 2.3.2 Mel频标倒谱系数21-22· 2.4 识别模型22-23· 2.4.1 动态时间规整22-23· 2.4.2 人工神经网络23· 2.5 隐马尔可夫模型23-32· 2.5.1 马尔可夫链23-24· 2.5.2 隐马尔可夫模型的定义24-25· 2.5.3 HMM的三个基本问题25· 2.5.4 HMM三个基本问题的解决方法25-29· 2.5.5 H
6、MM模型分类29-32· 2.6 小结32-34· 第三章 语音抗噪技术简介34-42· 3.1 噪声分类34-35· 3.1.1 加性噪声与乘性噪声34· 3.1.2 平稳噪声与时变噪声34-35· 3.1.3 全频带噪声与窄带噪声35· 3.2 噪声对连续语音识别的影响35-36· 3.3 各种抗噪技术36-41· 3.3.1 抗噪声语音增强技术36-39· 3.3.2 抗噪型语音特征提取技术39-40· 3.3.3 噪声环境下的模型补偿技术40-41· 3.4 小结41
7、-42· 第四章 噪声环境下端点检测技术研究42-48· 4.1 基于元音检测的端点检测方法42-47· 4.1.1 语音段检测42-44· 4.1.2 元音段检测44-45· 4.1.3 音节拆分45-46· 4.1.4 端点检测的流程46-47· 4.2 实验与结果分析47· 4.3 小结47-48· 第五章 噪声环境下特征提取方法研究48-54· 5.1 小波包分析及Mel滤波器组加权分析思想48-49· 5.1.1 小波包分析48-49· 5.1.2 Mel滤波器组加
8、权分析思想49· 5.2 特征参数提取过程49-51· 5.2.1 传统的MFCC提取过程49-50· 5.2.2 基于小波包分析及WFBA的MFCC参数提取过程50-51· 5.3 实验结果及其分析51· 5.4 小结51-54· 第六章 实验及结果分析54-60· 6.1 软硬件环境54· 6.2 语音库的建立54· 6.3 声学模型54-55· 6.3.1 语音识别基元54-55· 6.3.2 特征参数55· 6.3.3 模型选取55· 6.4 语言模型55-56· 6.5 系统实现56-58· 6.6 实验及分析58-59
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 辽宁省辽阳太子河区五校联考2024-2025学年初三月考试卷(二)物理试题含解析
- 永平县2024-2025学年三年级数学第二学期期末联考试题含解析
- 江苏省泰州市泰兴市黄桥教育联盟重点名校2024-2025学年初三年级五月份月考卷语文试题含解析
- 兴义市第八中学2025年高三接轨考试物理试题文试题含解析
- 劳务分包安全合同
- 抵押车借款合同二零二五年
- 美甲美睫店员工正式聘用合同书范例
- 婚恋中介合同书范例
- 场地租赁保证金合同书二零二五年
- 二零二五商铺转租租赁简单合同书范例
- 儿童保健学课件:绪论
- 中小学校园安全稳定工作岗位责任清单
- 论提高行政效率的途径 开题报告
- 校园安全存在问题及对策
- NY∕T 309-1996 全国耕地类型区、耕地地力等级划分
- 浓缩机的选择与计算
- 沪教版六年级下册单词表
- 地基基础软弱下卧层验算计算表格
- 最新投标书密封条
- SAPFI清账接口和部分清账接口例子
- TWI之工作改善JM精讲
评论
0/150
提交评论