语音识别算法的现状_第1页
语音识别算法的现状_第2页
语音识别算法的现状_第3页
语音识别算法的现状_第4页
语音识别算法的现状_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、董雪 卷积神经网络 深度学习神经网络 BP神经网络 RBF神经网络 模糊聚类神经网络 改进的T-S模糊神经网络 循环神经网络 小波神经网络 混沌神经网络 小波混沌神经网络 神经网络和遗传算法 动态优化神经网络 K均值和神经网络集成 HMM与自组织神经网络的结合 正交基函数对向传播过程神经网络 HMM和新型前馈型神经网络 特征空间随机映射 SVM多类分类算法 特征参数归一化 多频带谱减法 独立感知理论 分段模糊聚类算法VQ-HMM 优化的竞争算法 双高斯GMM特征参数 MFCC和GMM MFCCs和PNN SBC和SMM MEL倒谱系数和矢量量化 DTW LPCC和MFCC 隐马尔科夫模型HMM

2、 BP算法在神经网络的层数增多时容易陷入局部最优的 困境,也很容易产生过拟合的问题。20世纪90年代,各 种各样的浅层机器学习模型相继被提出,如支撑向量机 (Support Vector Machines, SVM)、Boosting、最大熵 方法(如 Logistic Regression, LR)等。这些模型具有高 效的学习算法,且不存在局部最优的问题,在理论分析与 实际应用中都获得了巨大的成功。相比之下,MLP的训 练需要很多经验和技巧,多层前馈神经网络的研究逐渐 变得冷清。 随着2006年深度神经网络(DNN)和深度学习(deep丨 earning)概念的提出,神经网络又成为机器(统计

3、)学习 领域的研究热点。这些名词由多伦多大学的Geoff Hinton研究组于2006年创造。Hinton研究组提出 1)多隐藏层的人工神经网络具有优异的特征学习能力 ,学习得到的特征对数据有更本质的刻画,从而有利于可 视化或分类; 2)深度神经网络在训练上的难度,可以通过“逐层预训 练”(layer-wise pre-training)来有效克服。关于预训练 有助于深度学习的原因,最直接的解释是预训练将网络 参数训练到一组合适的初始值,从这组初始值出发会得 到一个较优的局部最优解。 卷积神经网络(Convo丨utional Neural Network, CNN) 由纽约大学的 Yann 1

4、601116于1998年提出(如图1.2所 示),在手写体认别、交通标志识别等图像分类任务中 得到了广泛应用。CNN本质上是一个多层感知机,其成 功的原因关键在于它所采用的局部连接和共享权值的 方式,一方面减少了的权值的数量使得网络易于优化,另 一方面降低了过拟合的风险。 圆圈代表神经网络的一个输入值,“+1”标识的圆圈称为 偏置神经元,也就是截距项。神经网络最左边的一层叫 做输入层,最右的一层叫做输出层(本例中,输出层只有 一个神经元)。中间所有神经元组成的一层叫做隐藏层 ,隐藏层神经元功能是以某种方式介入输入与输出之间 。可以看到,图1.1神经网络有3个输入单元(偏置单元不 计算在内),1个隐藏层及1个输出单元。 CNNs 由一组或多组卷积层 convolutional layer + 采样 层 pooling layer 构成。一个卷积层中包含若干个不同 的卷积器,这些卷积器对语音的各个局部特征进行观 察。采样层通过对卷积层的输出结点做固定窗长的采 样,减少下一层的输入结点数,从而控制模型的复杂 度。一般采样层采用最大采样算法(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论