版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录1深度学习的观点........................................................................................................01。1卷积神经网络模型.......................................................................................11.2深度相信网络模型.........................................................................................21.3货仓自编码网络模型......................................................................................32深度学习算法............................................................................................................42。1深度费希尔映照方法....................................................................................42。2非线性变换方法...........................................................................................42。3稀少编码对称机算法...................................................................................52.4迁徙学习算法.................................................................................................52.5自然语言分析算法.........................................................................................52.6学习率自适应方法.........................................................................................53深度学习的实质应用..............................................................................................53。1语音辨别.......................................................................................................63。2视频剖析........................................................................................................63。3人脸辨别.......................................................................................................63.4图像辨别和检索.............................................................................................74深度学习的问题及发展趋向....................................................................................75总结............................................................................................................................8参照文件........................................................................................................................9深度学习综述纲要:深度学习是机器学习研究中的一个新领域,在于成立、模拟人脑进行剖析学习的神经网络,它模拟人脑的体制来解说数据.近来几年来,深度学习在各领域上也获得了丰富的研究成就。本文简要阐述了深度学习的观点、模型、算法以及在各领域的应用,最后说明深度学习的问题及发展趋向.要点字:深度学习,神经网络,机器学习ReviewofDeepLearningAbstract:Deepleaningisanewfieldinmachinelearningresearch.Itisawhichsimulatesthehumanbraintoanalyzeandstudythemechanismofthehumantointerpretthedata.Inrecentyears,deepleaninghasachievedfruitfulresultsinvariousfields。Thispaperbrieflydiscussestheconcept,model,algorithmandapplicationinvariousfieldsofdeeplearning.Finally,explainstheproblemsanddevelopmenttrendofdeeplearning。Keywords:Deeplearning,neuralnetwork,machinelearning深度学习的观点深度学习是机器学习领域一个新的研究方向,近来几年来在图像辨别与检索、语言信息办理、语音辨别等多领域中都获得较为成功的发展。深度学习应用的发展基础在于成立模型来模拟人类大脑的神经连结构造,在办理图像、声音和文本这些信号时,经过多个变换阶段分层对数据特色进行描绘,从而给出数据的解说。深度学习的观点源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习构造.深度学习经过组合低层特色形成更为抽象的高层表示属性类型或特色,以发现数据的散布式特色表示。深度学习的观点最早G。E.Hinton等于2006年提出。鉴于坚信度网(DBN)提出非监察贪婪训练逐层算法,为解决深层构造有关的优化难题带来希望,随后提出多层自动编码器深层构造。其余Lecun等人提出的卷积神经网络是第一个真切多层构造学习算法,它利用空间相对关系减少参数数目以提升训练性能。同机器学习方法同样,深度机器学习方法也有有监察学习和无监察学习之分,不一样的学习框架下成立的学习模型不一样。比如卷积神经网络就是一种深度的监察学习下的机器学习模型,而就是一种无监察学习下的机器学习模型.0典型的深度学习模型有卷积神经网络、深度置信网络和货仓自编码网络模型等,下边对这些模型进行描绘。1.1卷积神经网络模型卷积神经网络是人工神经网络的一种,已成为目前语音剖析和图像辨别领域的研究热门。它的权值共享网络构造使之更近似于生物神经网络,降低了网络模型的复杂度,减少了权值的数目。该长处在于网络的输入是多维图像时表现的更为明显,使图像能够直接作为网络的输入,防止了传统算法中复杂的特色提取和数据重修过程。卷积网络是为辨别二维形状而特别设计的一个多层感知器,这类网络构造对平移、比率缩放、倾斜或是其余形式的变形拥有高度不变形。Lecun的卷积神经网络由卷积层和子抽样层两种种类的神经网络层构成。每一层有一个拓扑图构造,即在接收域内,每个神经元与输入图像中某个地点对应的固定二维地点编码信息关系。在每层的各个地点散布着很多不一样的神经元,每个神经元有一组输入权值,这些权值与前一层神经网络矩形块中的神经元关系;同一组权值和不一样输入矩形块与不一样地点的神经元关系.下列图是一个用于手写体字符识其余卷积神经网络,由一个输入层、四个隐层和一个输出层构成。由下列图能够看出,与完整连结的多层前馈感知器网络对比,卷积神经网络经过使用接收域的局部连结,限制了网络构造。卷积神经网络的另一个特色是权值共享,图中包含大批连结权值,可是因为同一隐层的神经元共享同一权值集,大大减少了自由参数的数目。图1-1用于手写体字符识其余卷积神经网络卷积神经网络实质上实现一种输入到输出的映照关系,能够学习大批输入与输出之间的映照关系,不需要任何输入和输出之间的精准数学表达式,只需用已知的模式对卷积神经网络加以训练,就能够使网络拥有输入输出之间的映照能力.1卷积神经网络履行的是有监察训练,在开始训练前,用一些不一样的小随机数对网络的全部权值进行初始化。卷积神经网络中这类层间联系和空域信息的密切关系,使其适于图像办理和理解。并且,在其自动提取图像的明显特色方面还表现出了比较优秀的性能.在目前大多数的工作中,研究者将卷积神经网络应用到了多种机器学习问题中,包含人脸辨别,文档剖析和语言检测等.为了达到找寻视频中帧与帧之间的相关性的目的,目前卷积神经网络经过一个时间想干性去训练,但这个不是卷积神经网络独有的。1。2深度相信网络模型深度相信网络能够解说为贝叶斯概率生成模型,由多层随机隐变量构成,上面的两层拥有无向对称连结,下边的层获得来自上一层的自顶向下的有向连结,最基层单元的状态为可见输入数据向量。深度相信网络由若干构造单元货仓组成,如图1-2所示,构造单元往常为RBM.货仓中每个RBM单元的可视层神经元数目等于前一RBM单元的隐层神经元数目.依据深度学习体制,采纳输入样例训练第一层RBM单元,并利用其输出训练第二层RBM模型,将RBM模型进行货仓经过增添层来改良模型性能。在无监察预训练过程中,DBN编码输入到顶层RBM后解码顶层的状态到最基层的单元实现输入的重构。图1—2DBN的生成过程RBM的无向图模型如图1—3所示,作为DBN的构造单元,RBM与每一层DBN共享参数。2图1—3RBM的无向图模型RBM是一种特别形式的波尔兹曼机,变量之间的图模型连结形式有限制,只有可见层节点与隐层节点之间有连结权值,而可见层节点与可见层节点以及隐层节点与隐层节点之间无连结。1.3货仓自编码网络模型货仓自编码网络的构造与深度相信网络近似,由若干构造单元货仓构成,不同之处在于其构造单元为自编码模型而不是RBM。自编码模型是一个两层的神经网络,第一层称为编码层,第二层称为解码层.如图1—4所示,训练该模型的目的是用编码器c(·)将输入x编码成表示c(x),再用解码器g(·)从c(x)表示中解码重构输入r(x)=g(c(x))。所以,自编码模型的输出是其输入自己,经过最小化重构偏差L(r(x),x)来履行训练。当隐层是线性的,并且L(r(x),x)=‖r(x),x‖2是平方偏差时,c(x)训练网络将输入投影到数据的主重量空间中,此时自编码模型的作用等效于PCA;当隐层非线性时与PCA不一样,获得的表示能够货仓成多层,自编码模型能够获得多模态输入散布。重构偏差的概率散布能够解说为非归一化对数概率密度函数这类特别形式的能量函数,意味着有低重构偏差的样例对应的模型拥有更高的概率.图1-4自编码模型构造3自编码模型的重构偏差的梯度与深度相信网络的CD更新规则表达式存在对应关系。货仓自编码网络的构造单元除了上述的自编码模型以外,还能够使用自编码模型的一些变形,如降噪自编码模型和缩短自编码模型等.降噪自编码模型防止了一般的自编码模型可能会学习获得无编码功能的恒等函数和需要样本的个数大于样本的维数的限制,试试经过最小化降噪重构偏差,从含随机噪声的数据中重构真切的原始输入。降噪自编码模型使用由少许样本构成的微批次样本履行随机梯度降落算法,这样能够充分利用图办理单元的矩阵到矩阵迅速运算使得算法能够更快地收敛。降噪自编码模型与得分般配方法直接有关。得分般配是一种概括原理,当所求解的问题易于办理时,能够用来取代极大似然求解过程。深度学习算法2。1深度费希尔映照方法Wong等人提出一种新的特色提取方法—-正则化深度费希尔映照方法,学习从样本空间到特色空间的显式映照,依据Fisher准则用深度构造神经网络提升特色的划分度.深度构造神经网络拥有深度非局部学习构造,从更少的样本中学习变化很大的数据集中的特色,显示出比核方法更强的特色辨别能力,同时RDFM方法的学习过程因为引入正则化因子,解决了学习能力过强带来的过拟合问题.在各样种类的数据集长进行试验,获得的结果说了然在深度学习微调阶段运用无监察正则化的必需性。2。2非线性变换方法Raiko等人提出了一种非线性变换方法,该变换方法使得多层感知器网络的每个隐神经元的输出拥有零输出和均匀值上的零斜率,使学习MLP变得更简单。将学习整个输入输出函数的线性部分和非线性部分尽可能分开,用shorteut权值成立线性映照模型,令Fisher信息阵靠近对角阵,使得标准梯度靠近自然梯度.经过实考证明非线性变换方法的有效性,该变换使得基本随机梯度学习与目前的学习算法在速度上伯仲之间,并有助于找到泛化性能更好的分类器.用这类非线性变换方法实现的深度无监察自编码模型进行图像分类和学习图像的低维表示的实验,说明这些变换有助于学习深度起码达到五个隐层的深度构造神经网络,证了然变换的有效性,提升了基本随机梯度学习算法的速度,有助于找到泛化性4能更好的分类器。2。3稀少编码对称机算法Ranzato等人提出一种新的有效的无监察学习算法——稀少编码对称机,能够在不必归一化的状况下有效产生稀少表示。稀少编码对称机的损失函数是重构偏差和稀少罚函数的加权总和,鉴于该损失函数比较和选择不一样的无监察学习机,提出一种与文件算法有关的迭代在线学习算法,并在理论和实验大将稀少编码对称机与深度相信网络和PCA进行比较,在手写体数字辨别MNIST数据集和实质图像数据集长进行实验,表示该方法的优胜性。2.4迁徙学习算法在很多常有学习场景中训练和测试数据集中的类标签不一样,一定保证训练和测试数据集中的相像性进行迁徙学习.Mesnil等人研究了用于无监察迁徙学习场景中学习表示的不一样种类模型构造,将多个不一样构造的层货仓使用无监察学习算法用于五个学习任务,并研究了用于少许已标志训练样本的简单线性分类器货仓深度构造学习算法。叫研究了无监察迁徙学习问题,议论了无监察预训练实用的原由,怎样在迁徙学习场景中利用无监察预训练,以及在什么状况下需要注意从不一样数据散布获得的样例上的展望问题。2。5自然语言分析算法Collobert鉴于深度递归卷积图变换网络提出一种迅速可扩展的鉴别算法用于自然语言分析,将文法分析树分解到货仓层中,只用很少的基本文本特色,获得的性能与现有的鉴别分析器和标准分析器的性能相像,而在速度上有了很大提升。2.6学习率自适应方法学习率自适应方法可用于提升妙度构造神经网络训练的收敛性并且去除超参数中的学习率参数,此中包含全局学习率、层次学习率、神经元学习率和参数学习率等。近来研究人员提出了一些新的学习率自适应方法,如Duchi等人提出的自适应梯度方法和Schaul等人提出的学习率自适应方法;Leroux等人提出自然梯度的对角低秩在线近似方法,并说明该算法在一些学习场景中能加快训练过程。深度学习的实质应用53.1语音辨别2011年,微软语音辨别采纳深度学习技术降低语音辨别错误20-30%,是该领域十多年来最大的打破性进展.2013年6月18日,微软宣告已经研发出一种新型语音辨别技术,可供给“靠近即时”的语音至文本的变换服务,比目前的语音辨别技术快两倍。同时,正确率提升了15%,该技术模拟人类大脑对交流理解的方式。深度神经网络技术能够像人类大脑同样工作,该技术将会取代谷歌等竞争敌手在搜寻和安卓产品中常用的技术。在国际上,IBM、谷歌等企业都迅速进行了深度学习语音辨别研究,并且速度飞速。国内方面,科大讯飞、百度、中科院自动化所等企业或研究单位,也在进行深度学习在语音辨别上的研究.3。2视频剖析描绘视频的静态图像特色能够采纳从imageNet上学习的获得的深度模型。过去的视觉研究方法对动向特色的描绘常常依靠于光流预计、对要点点的追踪和动向纹理。怎样将这些信息表此刻深度模型中是个难点。最直接的做法是将视频是为三维图像,直策应用卷积网络在每一层学习三维滤波器。可是这一思路明显没有考虑到时间维和空间维的差别性.此外一种简单更为有效的思路是,经过与办理计算光流场或其余动向特色的空间厂散布,作为卷及网络的一个输入通道。也有研究工作利用深度编码器以非线性的方式提取动向纹理。在最新的研究工作中,长短时记忆网络遇到宽泛关注,它能够捕获长久依靠性,对视频中复杂的动向建模.3。3人脸辨别深度学习在物体辨别上的另一个重要打破就是人脸辨别。人脸识其余最大挑战是怎样划分因为光芒、姿态和表情等要素惹起的类内变化和因为身份不一样产生的类间变化.这两种变化的散布是非线性的,且极为复杂,传统的线性模型没法将它们有效划分开。深度学习的目的是经过多层的非线性变换获得新的特色表示。这些特色须尽可能多地去掉内变化,而保存类间变化.人脸辨别包含人脸确认和人脸辨别两种任务。人脸确认是判断两张人脸照片能否属于同一个人的,属于二分类问题。人脸鉴别是将一张人脸分为N个类型之一,类型是由人脸的身份定义的。这个是多分类问题,更拥有挑战性,其难度跟着类型数的增添而增大。两种任务都能够经过深度模型学习人脸的特色表达。63.4图像辨别和检索深度相信网络和货仓自编码网络在单个图像辨别任务中表现出很好的性能,成功用于生成紧凑而存心义的图像检索表示形式,并且已用于大型图像检索任务中,获得特别好的结果。图像辨别方面比深度相信网络更一般的方法。Taylor等人将条件深度相信网络用于视频排序和人类动作合成,条件深度相信网络使得深度相信网络的权值与以前的数据有关系,能够提升训练的有效性.Lee和Raina等人用稀少编码和深度相信网络从自然图像中学习有效特色表示。Nair等人提出改良的深度相信网络,该模型的顶层模型用三阶BM,他们将这类模型用于三维目表记别任务NORB数据集上,实验结果显示出训练获得了很低的展望偏差率.Tang等人提出两种策略来提升妙度相信网络的鲁棒性,第一将深度相信网络的第一层拥有稀少连结构造引入正则化方法,接着提出一种概率降噪算法,这些技术在高噪声图像辨别任务和随机噪声的鲁棒性方面显示出其有效性。Lee等人提出一种深度学习方法使脑图像切割自动化,用卷积神经网络成立用于脑图像切割的鉴别特色,能自动从人类专家供给的类标签中进行学习,经过实验考证该方法在自动多类脑图像切割方面显示出优胜的性能,表示该方法能够代替已有的模板图像切割方法,减少了图像切割过程对人类专家的干涉和对先验信息的需求。深度学习的问题及发展趋向深度学习算法在计算机视觉(图像辨别、视频辨别等)和语音辨别中的应用,特别是大规模数据集下的应用获得打破性的进展,但仍有以下问题值得进一步研究:(1)无标志数据的特色学习目前,标志数据的特色学习仍旧占有主导地位,而真切世界存在着海量的无标志数据,将这些无标志数据逐个增添人工标签,明显是不现实的。所以,跟着数据集和储存技术的发展,势必愈来愈重视对无标志数据的特色学习,以及将无标志数据进行自动增添标签技术的研究。(2)模型规模与训练速度、训练精度之间的衡量一般地,同样数据集下,模型规模越大,训练精度越高,训练速度会越慢.比如一些模型方法采纳ReLU非线性变换、GPU运算,在保证精度的前提下,常常需要训练。固然离线训练并不影响训练以后模型的应用,可是关于模型优化,诸如模型规模调整、超参数设置、训练时调试等问题,训练时间会严重影响其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淮阴工学院《化工原理3》2022-2023学年第一学期期末试卷
- 危化品行业安全生产治本攻坚三年行动实施方案
- 2024年员工离职补偿合同(适用于员工离职后的补偿)
- 短视频平台用户运营合作协议
- 2024年专业室内设计服务合同
- 2024年专利许可居间协议
- 2024年过滤净化材料项目立项申请报告模范
- 2024年吐鲁番小型客运从业资格证2024年考试题
- 教育行业自费补习班管理制度
- 2024年快速热处理设备项目规划申请报告模范
- 播音主持艺术毕业晚会策划
- 《线性代数》教案完整版教案整本书全书电子教案
- 塑胶原料烘料温度对照表
- 司法所安置帮教工作流程图
- 贫困户困难补助申请书
- 桥梁养护与加固绪论课件
- 部队战时政治工作-PPT课件
- 平板显示技术:TFT-LCD工艺
- 动火安全作业票填写模板2022年更新
- 外研版九年级英语上册全套ppt课件
- 沟槽开挖支护专项施工方案(46页)
评论
0/150
提交评论