![深度学习绪论_第1页](http://file4.renrendoc.com/view12/M08/2D/38/wKhkGWXIR32ACrxUAAK4pi5kGGA415.jpg)
![深度学习绪论_第2页](http://file4.renrendoc.com/view12/M08/2D/38/wKhkGWXIR32ACrxUAAK4pi5kGGA4152.jpg)
![深度学习绪论_第3页](http://file4.renrendoc.com/view12/M08/2D/38/wKhkGWXIR32ACrxUAAK4pi5kGGA4153.jpg)
![深度学习绪论_第4页](http://file4.renrendoc.com/view12/M08/2D/38/wKhkGWXIR32ACrxUAAK4pi5kGGA4154.jpg)
![深度学习绪论_第5页](http://file4.renrendoc.com/view12/M08/2D/38/wKhkGWXIR32ACrxUAAK4pi5kGGA4155.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§1.1引言§1.2基本术语§1.3监督学习算法§1.4无监督学习算法§1.5机器学习简介§1.6深度学习的趋势深度学习绪论§1.1引言机器学习致力于研究如何通过计算的手段,利用学习样本的方式来自动改善系统的性能。在计算机系统中,“经验”通常以“数据”的形式存在,因此,机器学习所研究的主要内容就是如何使计算机具有智能,如何使计算机自动学习隐含在数据中的特征。那么这种提取隐含特征的方法就是计算机在原始数据上建立的“模型”(Model),也就是我们听说过的“学习算法”(LearningAlgorithm)。如果说计算机科学是研究关于“算法”的学问,那么类似的,可以说机器学习是研究关于“学习算法”的学问。样本
数据集特征属性维数样本空间特征向量标签学习训练训练数据训练样本训练集假设实际输出目标输出预测损失函数代价函数分类回归二分类多分类迭代迭代次数测试验证集测试集过拟合欠拟合泛化能力鲁棒性迁移学习监督学习无监督学习聚类簇独立同分布§
1.2基本术语1.3.1支持向量机支持向量机(SupportVectorMachine,SVM)是监督学习中最有影响力的方法之一。不同于逻辑回归,SVM输出的仅仅是样本的类别而不是概率。不同于传统的线性回归,SVM的重要创新就是核函数(KernelFunction)。在图1.4中两种样本最边缘的判决函数值被设为+1、-1,即:
图1.4支持向量与划分超平面关系§
1.3监督学习算法那么这样的两个向量即被称为“支持向量”(SupportVector),这也是支持向量机这个名字的由来。距离两类样本的边界都最远的超平面是最优的。其实也就是令两个超平面之间的距离最远。两个平行直线
与
的距离为:所以可以推导得出两个异类支持向量到超平面的距离之和为:它被称为“间隔”(Margin)。显然,为了最大化间隔我们仅需最小化
。那么这就是支持向量机的基本原理。1.3.2决策树决策树(DecisionTree)及其变种是另一类将输入空间分成不同的区域,每个区域有独立参数的算法。我们希望从训练集中学到一个判断模型用来对新样本进行分类。决策树,顾名思义就是通过树状结构的决策方式来判断一个样本的归属,这是一种很自然的处理机制。决策树学习基本算法的实现过程由图给出无监督学习算法训练含有很多特征的数据集,然后学习出这个数据集上有用的结构性质。无监督算法只处理“特征”,而不处理标签。其实,监督和无监督算法之间的区别并没有规范严格的定义,通俗地说,无监督学习的大多数尝试是指从没有人为注释的样本的分布中抽取信息。一个经典的无监督学习任务是找到数据的“最佳”表示。这个“最佳”表示一般来说,是指该表示在比本身表示的信息更简单或更易访问而受到限制的情况下,尽可能地保存关于样本的更多信息。§1.4无监督学习算法1.4.1主成分分析主成分分析(PrincipalComponentAnalysis,PCA)是最常用的一种降维方法。PCA学习一种比原始输入维数更低的表示。它也学习了一种元素之间彼此没有线性相关的表示。这是学习表示中元素统计独立标准的第一步。要实现完全独立性,表示学习算法也必须去掉变量间的非线性关系。这也就是我们之前所希望的,所有样本之间都是独立同分布的。PCA的具体实现过程如图PCA将输入高维函数投影表示成低维函数,学习数据的正交线性变换。由于我们是想在低维空间中依旧能区分原始样本的,因此我们希望所有样本的投影尽可能地分开。此时,则需要最大化投影点的方差(由于方差是衡量一组数据离散程度的度量)。PCA这种将数据变换为元素之间彼此不相关表示的能力是PCA的一个重要性质。它是消除数据中未知变化因素的简单表示示例。在PCA中,这个消除是通过寻找输入空间的一个旋转(通过协方差矩阵完成),使得最大方差的主坐标和新表示空间的基对齐(如Y’X’坐标系)。图1.8PCA原理示例,找到一个新函数,使所有样本在其上的投影尽可能分开(明显A要比B性能更好,因为样本在A上的投影相较于B来讲更为分散)1.4.2k-均值聚类k-means算法是一种简单的迭代型聚类算法,采用距离作为相似性指标,从而发现给定数据集中的K类,且每个类的中心是根据类中所有值的均值得到,每个类用聚类中心来描述。对于给定的一个包含
个
维数据点的数据集X以及要分得的类别K,选取欧式距离作为相似度指标,聚类目标是使得各类的聚类平方和最小,即最小化。K-means算法的步骤如下所示:①从N个样本中选取K个样本作为聚类中心;②对剩余每个样本计算其到每个聚类中心的距离;③重新计算各个类的质心(聚类中心),即每一个中心点更新为该类别中所有训练样本的均值;④多次迭代后,聚类中心不再变化或小于某阈值时,算法结束。作为一种实现人工智能的强大技术,深度学习(DeepLearning)已经在手写数字识别、维数约简、语音识别、图像理解、机器翻译、蛋白结构预测和情感识别等各个方面获得了广泛应用。因屡屡取得打破记录的评测结果并超越其他方法,而很快受到了非常高度的关注。依靠硬编码的知识体系面对的困难表明,AI系统需要具备自己获取知识的能力,即从原始数据中提取模式的能力。这种能力被称为机器学习(MachineLearning)。由韦恩图表示的人工智能、机器学习和深度学习之间的关系§
1.5
机器学习简介机器学习的发展由建立知识体系的思想逐渐向自动学习知识的方向改变。解决这个问题的途径之一是使用机器学习来发掘表示本身,而不仅仅把表示映射到输出。这种方法我们称之为表示学习(RepresentationLearning)。深度学习(DeepLearning,也曾被叫作FeatureLearning)是在人工神经网络(Aritificialneuralnetwork,ANN)基础上发展而来的一种表示学习方法,也是一种机器学习算法。机器学习备受瞩目当然是由于它强大的智能数据分析能力,但机器学习研究还有另一个不可忽视的意义,即通过建立一些计算模型来促进我们发现一些新的自然规律,如新型的蛋白质结构等。自然科学研究的驱动力归结起来无外是人类对宇宙本源、万物本质、生命本性、自我本质的好奇,从这个意义上说,机器学习不仅在信息科学中占有重要地位,还具有一定的自然科学探索色彩。不同类型人工智能系统的流程图如图深度学习的再次崛起,依赖于四个世界发展的基本趋势:①与日俱增的数据量;②愈发庞大的计算资源;③深度学习越来越高的识别精度与预测能力;④深度学习成功地解决越来越多的实际问题。§1.6深度学习的趋势1.6.1与日俱增的数据量幸运的事,在社会日益数字化的驱动下,我们能够获得的数据量日益增加。由于计算机的愈发普及,互联网的日益发展,数据也可以更容易地被收集与记录,并更容易地被整理成适用于机器学习的应用数据集。大数据时代的到来,是机器学习变得更加容易。具不完全统计,截止至2016年,监督深度学习算法在每类给定约5000个标注样本情况下一般将达到可以接受的性能,当至少有1000万个有标签样本的数据集用于训练时,机器学习算法将接近甚至超越人类表现。1.6.2愈发庞大的计算资源考虑到深度学习庞大的计算需求和CPU综合计算性能的限制,人们提出使用GPU(GraphicsProcessingUnit)来解决深度学习庞大的计算问题。神经网络算法通常涉及大量参数、激活值、梯度值的缓冲区,其中每个值在每一次训练迭代中都要被完全更新。会超出传统计算机的高速缓存(Cache),所以内存带宽通常会成为主要瓶颈。相比CPU,GPU一个显著的优势是其具有极高的内存带宽。由于神经网络的训练算法通常不涉及大量的分支运算与复杂的控制指令,所以其更适合在GPU硬件上训练。并且由于神经网络能够被分为多个单独的“神经元”,并且独立于同一层内其他神经元进行处理,所以具有并行特性的GPU更适用于神经网络的计算。1.6.3展现出越来越高的性能以及解决实际问题的潜力在深度网络的规模和精度有所提高的同时,它们可以解决的任务也日益复杂。(Goodfello
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 行纪服务合同
- 2025年湘教版九年级历史下册阶段测试试卷含答案
- 2025储藏室长期租赁合同
- 2025民间借款合同集锦
- 2025年单一稀土金属项目提案报告模范
- 建筑工程的质量检测技术
- 2025年造纸黑液碱回收成套装置项目提案报告模板
- 2025年硫精砂项目规划申请报告模板
- 2025年记忆绵床垫项目申请报告
- 建筑工程法规与政策解读
- 聚焦任务的学习设计作业改革新视角
- 《监理安全培训》课件
- 2024高二语文期末试卷(选必上、中)及详细答案
- 淋巴瘤患者的护理
- 水利工程建设管理概述课件
- 人美版初中美术知识点汇总九年级全册
- 2022中和北美腰椎间盘突出症诊疗指南的对比(全文)
- 深度学习视角下幼儿科学探究活动设计
- 乳房整形知情同意书
- 全国核技术利用辐射安全申报系统填报指南
- GB/T 18344-2016汽车维护、检测、诊断技术规范
评论
0/150
提交评论