人工智能:语音识别理解与实践_第1页
人工智能:语音识别理解与实践_第2页
人工智能:语音识别理解与实践_第3页
人工智能:语音识别理解与实践_第4页
人工智能:语音识别理解与实践_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能:语音识别理解与实践读书笔记模板01思维导图目录分析读书笔记内容摘要作者介绍精彩摘录目录0305020406思维导图人工智能实践深度神经网络语音语音经典模型神经网络语音模型技术训练深度第章系统特征算法信号本书关键字分析思维导图内容摘要内容摘要全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用,包括“深度神经网络-隐马尔可夫混合模型”的训练和优化,特征表示学习、模型融合、自适应,以及以循环神经网络为代表的若干先进深度学习技术。目录分析1.1自动语音识别:更好的沟通之桥1.2语音识别系统的基本结构1.3口语理解与人机对话系统1.4全书结构第1章简介第3章隐马尔可夫模型及其变体第2章混合高斯模型第I部分传统声学模型第2章混合高斯模型2.1随机变量2.2高斯分布和混合高斯随机变量2.3参数估计2.4采用混合高斯分布对语音特征建模第3章隐马尔可夫模型及其变体3.1介绍3.2马尔可夫链3.3序列与模型3.4期望最大化算法及其在学习HMM参数中的应用3.5用于解码HMM状态序列的维特比算法3.6隐马尔可夫模型和生成语音识别模型的变体第4章全连接深层神经网络第6章深层神经网络-隐马尔可夫模型混合系统第5章高级模型初始化技术第II部分深层神经网络在语音识别中的应用及分析第7章训练加速和解码加速第8章深层神经网络中的特征表示学习第9章深层神经网络和混合高斯模型的融合第10章VAD和唤醒词识别第II部分深层神经网络在语音识别中的应用及分析第4章全连接深层神经网络4.1全连接深层神经网络框架4.2使用误差反向传播进行参数训练4.3实际应用第5章高级模型初始化技术5.1受限玻尔兹曼机5.2深度置信网络预训练5.3降噪自动编码器预训练5.4鉴别性预训练5.5混合预训练5.6采用丢弃法的预训练第6章深层神经网络-隐马尔可夫模型混合系统6.1DNN-HMM混合系统6.2CD-DNN-HMM的关键模块及分析6.3基于KL距离的隐马尔可夫模型第7章训练加速和解码加速7.1训练加速7.2解码加速第8章深层神经网络中的特征表示学习8.1特征和分类器的联合学习8.2特征层级8.3使用随意输入特征的灵活性8.4特征的鲁棒性8.5对环境的鲁棒性8.6信号严重失真情况下的推广能力8.7使用合成数据提升鲁棒性第9章深层神经网络和混合高斯模型的融合9.1在GMM-HMM系统中使用由DNN衍生的特征9.2识别结果融合技术9.3帧级别的声学分数融合9.4多流语音识别第10章VAD和唤醒词识别10.1基于信号处理的VAD10.2基于DNN的VAD10.3唤醒词识别的解码器方案10.4只用DNN的唤醒词识别10.5可定制的唤醒词识别10.6多阶段唤醒词识别10.7唤醒词识别的位置第11章卷积神经网络第13章基于深度学习的语言模型第12章循环神经网络及相关模型第III部分先进深度学习模型在语音识别中的应用第11章卷积神经网络11.1概述11.2卷积神经网络的基本架构11.3卷积神经网络的训练11.4时间延迟神经网络11.5时频域上的卷积11.6时域上的卷积11.7深层卷积神经网络第12章循环神经网络及相关模型12.1概述12.2基本循环神经网络中的状态-空间公式12.3沿时反向传播学习算法12.4一种用于学习循环神经网络的原始对偶技术12.5结合长短时记忆单元的循环神经网络12.6高速公路LSTM和网格LSTM12.7双向LSTM12.8GRU循环神经网络12.9循环神经网络的对比分析第13章基于深度学习的语言模型13.1统计语言模型简介13.2DNN语言模型13.3RNN和LSTM语言模型13.4CNN语言模型13.5语言模型的建模单元13.6双向语言模型13.7深度学习语言模型的使用13.8语言模型与声学模型的联合优化第14章深层神经网络的自适应技术第16章端到端模型第15章深层神经网络序列鉴别性训练第IV部分高级语音识别方法第14章深层神经网络的自适应技术14.1深层神经网络中的自适应问题14.2线性变换14.3保守训练14.4子空间方法14.5DNN说话人自适应的效果第15章深层神经网络序列鉴别性训练15.1序列鉴别性训练准则15.2具体实现中的考量15.3无须词图的神经网络序列鉴别性训练15.4噪声对比估计第16章端到端模型16.1连接时序分类模型16.2带注意力机制的“编码-解码”模型16.3联合CTC-注意力模型第17章深层神经网络中的表征共享和迁移第19章远场语音识别的前端技术第18章基于深度学习的单通道语音增强和分离技术第V部分复杂场景下的语音识别第17章深层神经网络中的表征共享和迁移17.1多任务和迁移学习17.2多语言和跨语言语音识别17.3语音识别中深层神经网络的多目标学习17.4使用视听信息的鲁棒语音识别第18章基于深度学习的单通道语音增强和分离技术18.1单通道语音增强技术18.2单通道多说话人的语音分离和标注置换问题18.3深度聚类18.4深度吸引子18.5排列不变性训练18.6将排列不变性训练用于多说话人语音识别18.7时域音频分离网络第19章远场语音识别的前端技术19.1远场识别的前端链路19.2DOA算法19.3波束形成的信号处理方法19.4结合信号处理和深度学习方法19.5前后端联合优化第20章基于深度学习的口语理解第22章对话策略优化第21章对话状态跟踪及自然语言生成第VI部分口语理解及对话系统的深度学习实践第20章基于深度学习的口语理解20.1自然语言处理及深度学习20.2口语理解任务20.3基于深度学习的口语理解第21章对话状态跟踪及自然语言生成21.1口语对话系统概述21.2对话状态跟踪21.3自然语言生成第22章对话策略优化22.1对话策略及对话系统评估22.2数据驱动的对话策略训练22.3统计对话系统的冷启动技术第23章总结及未来研究方向23.1路线图23.2技术前沿和未来方向作者介绍同名作者介绍这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论