版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1主要内容主要内容 2006 2006年以来,机器学习领域中一个叫年以来,机器学习领域中一个叫“深度学习深度学习”的的课题开始受到学术界广泛关注,如今课题开始受到学术界广泛关注,如今拥有拥有大数据的互联网大数据的互联网公司争相投入大量资源研发深度学习技术公司争相投入大量资源研发深度学习技术。为什么为什么有有deep learningdeep learning?WhyWhy什么是什么是deep learningdeep learning?WhatWhat怎么来的?怎么来的?Deep learningDeep learning与神经网络的异同与神经网络的异同2机器学习机器学习机器学习(机器学习(M
2、achine LearningMachine Learning)是一门专门研究计算机怎是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科重新组织已有的知识结构使之不断改善自身的性能的学科。简单的说,机器学习就是通过算法,使得机器能从大量的简单的说,机器学习就是通过算法,使得机器能从大量的历史数据中学习规律,从而对新的样本做智能识别或预测历史数据中学习规律,从而对新的样本做智能识别或预测未来。未来。19591959年美国的年美国的塞缪尔塞缪尔(Samuel)(Samuel)设
3、计了一个下棋程序,这个设计了一个下棋程序,这个程序具有学习能力,它可以在不断的对弈中改善自己的棋程序具有学习能力,它可以在不断的对弈中改善自己的棋艺。艺。4 4年后,这个程序战胜了设计者本人。又过了年后,这个程序战胜了设计者本人。又过了3 3年,这年,这个程序战胜了美国一个保持个程序战胜了美国一个保持8 8年之久的常胜不败的冠军。年之久的常胜不败的冠军。这个这个程序向人们展示了程序向人们展示了机器学习的能力,机器学习的能力,提出了许多令人提出了许多令人深思的社会问题与哲学问题。深思的社会问题与哲学问题。3Why?Why?机器学习虽然发展了几十年,但还是存在很多没有良好解决机器学习虽然发展了几十
4、年,但还是存在很多没有良好解决的问题。的问题。例如例如以视觉感知为例,通过机器学习去解决这些问以视觉感知为例,通过机器学习去解决这些问题的思路:题的思路: Input Feature Representation Learning Algorithm手工选取特征不太好,那么能不能自动地学习一些特征呢?手工选取特征不太好,那么能不能自动地学习一些特征呢?答案是能!答案是能!Deep LearningDeep Learning就是用来干这个事情的,它有一个别就是用来干这个事情的,它有一个别名名Unsupervised Feature LearningUnsupervised Feature Lea
5、rning。WhyWhy?答案:让机器自动学习良好的特征,而免去人工选取过程。答案:让机器自动学习良好的特征,而免去人工选取过程。4WhatWhat?深度学习深度学习是机器学习研究中的一个新的领域,其是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习是无监督学习的一种。声音和文本。深度学习是无监督学习的一种。深度学习的概念源于人工神经网络的研究。含多深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结
6、构。深度隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。属性类别或特征,以发现数据的分布式特征表示。5怎么来的?怎么来的?从机器学习的模型结构层次来分,机器学习经历了两从机器学习的模型结构层次来分,机器学习经历了两次浪潮:次浪潮:1 1、浅层、浅层学习(学习(Shallow LearningShallow Learning):机器学习第一次):机器学习第一次浪潮浪潮2 2、深度、深度学习(学习(Deep LearningDeep Learning):机器学习第二次浪潮):机
7、器学习第二次浪潮6 浅层浅层学习(一)学习(一)2020世纪世纪8080年代末期年代末期,由于,由于人工神经网络人工神经网络的的反向传播算反向传播算法法(BPBP算法算法)的发明,给机器学习带来了希望,掀起)的发明,给机器学习带来了希望,掀起了了基于统计模型的机器学习基于统计模型的机器学习热潮。这个热潮一直持续热潮。这个热潮一直持续到今天。到今天。基于统计的机器学习方法可以基于统计的机器学习方法可以让一个人工神经网络模让一个人工神经网络模型从大量训练样本中学习统计规律,从而对未知事件型从大量训练样本中学习统计规律,从而对未知事件做预测做预测。这个时候的人工神经网络,虽也被称作这个时候的人工神经
8、网络,虽也被称作多层感知机多层感知机(Multi-layer PerceptronMulti-layer Perceptron),但实际是一种只含有),但实际是一种只含有一层隐层节点的浅层模型一层隐层节点的浅层模型。7浅层学习(二)浅层学习(二)2020世纪世纪9090年代,各种各样的浅层机器学习模型相继被年代,各种各样的浅层机器学习模型相继被提出,例如提出,例如支撑向量机支撑向量机(SVMSVM)、 BoostingBoosting、最大熵最大熵方法方法(LRLR)等)等。这些模型的结构基本上可以看成带有一层隐层节点这些模型的结构基本上可以看成带有一层隐层节点(如(如SVMSVM、Boost
9、ingBoosting),或没有隐层节点(如),或没有隐层节点(如LRLR)。)。这些模型无论是在理论分析还是应用中都获得了巨大这些模型无论是在理论分析还是应用中都获得了巨大的成功。的成功。相比之下,由于理论分析的难度大,训练方法又需要相比之下,由于理论分析的难度大,训练方法又需要很多经验和技巧,这个时期深度人工神经网络反而相很多经验和技巧,这个时期深度人工神经网络反而相对沉寂。对沉寂。8深度学习(一)深度学习(一)20062006年,加拿大多伦多大学教授、机器学习领域的泰斗年,加拿大多伦多大学教授、机器学习领域的泰斗Geoffrey Geoffrey HintonHinton等在等在Scie
10、nceScience上发表了一篇上发表了一篇文章文章11,开启了深度学习在学术界和工业界的浪潮开启了深度学习在学术界和工业界的浪潮。这这篇文章有两个主要观点:篇文章有两个主要观点:1 1)多隐层的人工神经网络具有优异的特征学习能力,学)多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化习得到的特征对数据有更本质的刻画,从而有利于可视化或分类;或分类;2 2)深度神经网络在训练上的难度,可以通过)深度神经网络在训练上的难度,可以通过“逐层初始逐层初始化化”来来有效克服,在这篇文章中,逐层初始化是通过无监有效克服,在这篇文章中,逐层初始化是通过无监督学
11、习实现的督学习实现的。11 Hinton, Geoffrey;Osindero, Simon;Welling, Max;Teh, Yee-Whye . Unsupervised Discovery of Nonlinear Structure Using Contrastive Backpropagation. Science.2006(30)4: 725-732.9当前多数分类、回归等学习方法为浅层结构算法,当前多数分类、回归等学习方法为浅层结构算法,其局限性在于有限样本和计算单元情况下对复杂其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化函数的表示能力有
12、限,针对复杂分类问题其泛化能力受到一定制约。能力受到一定制约。深度学习深度学习可通过学习一种深层非线性网络结构,可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示,实现复杂函数逼近,表征输入数据分布式表示,并展现了强大的从少数样本中集中学习数据集本并展现了强大的从少数样本中集中学习数据集本质特征的能力。(多层的好处是可以用较少的参质特征的能力。(多层的好处是可以用较少的参数表示复杂的函数)数表示复杂的函数)10深度学习深度学习的实质,是通过构建具有很多隐层的机器学习模的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提型和海量的训
13、练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。因此,升分类或预测的准确性。因此,“深度模型深度模型”是手段,是手段,“特征学习特征学习”是目的。是目的。区别区别于传统的浅层学习,深度学习的不同在于:于传统的浅层学习,深度学习的不同在于:1 1)强调了)强调了模型结构的深度模型结构的深度,通常有,通常有5 5层、层、6 6层,甚至层,甚至1010多多层的隐层节点;层的隐层节点;2 2)明确突出了)明确突出了特征学习的重要性特征学习的重要性,也就是说,通过逐层,也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征特征变换,将样本在原空间的特征表示变换到一个新特征空间,
14、从而使分类或预测更加容易空间,从而使分类或预测更加容易。利用。利用大数据来学习特大数据来学习特征,更能够刻画数据的丰富内在信息。征,更能够刻画数据的丰富内在信息。11深度学习与神经网络的异同深度学习与神经网络的异同Deep learningDeep learning与传统的神经网络之间有相同的地与传统的神经网络之间有相同的地方也有很多不同方也有很多不同。相同相同点:点:deep learningdeep learning采用了神经网络相似的分采用了神经网络相似的分层结构,系统由包括层结构,系统由包括输入层、隐层(多层)、输输入层、隐层(多层)、输出层出层组成的多层网络,只有相邻层节点之间有连组
15、成的多层网络,只有相邻层节点之间有连接,同一层以及跨层节点之间相互无连接,每一接,同一层以及跨层节点之间相互无连接,每一层可以看作是一个逻辑回归模型;这种分层结构,层可以看作是一个逻辑回归模型;这种分层结构,是比较接近人类大脑的结构的。是比较接近人类大脑的结构的。12不同点:采用了不同不同点:采用了不同的训练机制。的训练机制。传统传统神经网络神经网络中,采用的是反向传播(中,采用的是反向传播(BPBP)的方)的方式进行。即采用迭代的算法来训练整个网络,随式进行。即采用迭代的算法来训练整个网络,随机设定初值,计算当前网络的输出,然后根据当机设定初值,计算当前网络的输出,然后根据当前前计算的输出值
16、计算的输出值和和实际的标记值实际的标记值之间的差去改变之间的差去改变前面各层的参数,直到收敛(整体是一个梯度下前面各层的参数,直到收敛(整体是一个梯度下降法)。降法)。BPBP算法不适合深度神经网络:算法不适合深度神经网络:如果对所有层同时如果对所有层同时训练,时间复杂度会太高;如果每次训练一层,训练,时间复杂度会太高;如果每次训练一层,偏差就会逐层传递,出现过拟合偏差就会逐层传递,出现过拟合。deep learningdeep learning整体上是一个整体上是一个layerlayer- -wisewise的训练机的训练机制制。13深度学习的训练过程深度学习的训练过程1 1)自下而上的非监督学习)自下而上的非监督学习:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度企业融资咨询服务合同
- 2024年度企业财务代理委托合同2篇
- 广东省建设工程施工合同样本(2009版)
- 2024年度股权转让合同标的为公司股权
- 2024年度广告投放合同标的及广告投放范围详细描述2篇
- 2024年度人工智能产品研发与授权协议
- 2024年企业劳动合同范本复杂度分析
- 2024中国电信山东德州分公司校园招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2024年度互联网保险业务合作与发展合同
- 2024中国国际工程咨询限公司高端人才招聘1人易考易错模拟试题(共500题)试卷后附参考答案
- ASTMD638-03中文版塑料拉伸性能测定方法
- 贵州省黔南州2024年中考历史真题试卷(含答案)
- 八年级英语下册 Unit 10 I've had this bike for three years单元说课稿 (新版)人教新目标版
- 译林版(2024新版)七年级上册英语期中复习:完型及阅读 练习题汇编(含答案)
- 新苏教版五年级科学上册活动手册答案
- JJF(浙) 1149-2018 生物实验用干式恒温器校准规范
- 2024-2025学年五年级科学上册第二单元《地球表面的变化》测试卷(教科版)
- 学校厨房设备投标方案(技术标)
- 大型综合楼新建工程技术方案、施工方案投标文件(投标方案)
- 2025年高考作文专练(25道真题+审题立意+范文)- 2025年高考语文作文备考总复习
- 大学生创新创业基础学习通超星期末考试答案章节答案2024年
评论
0/150
提交评论