版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章机器学习3.1
应用场景CONTENTS目录应用场景
01自动驾驶
02应用范围文本分类基因识别空间数据处理卫星图片分析客户群的特征分类与价值分析……01OriginalPointsK-means(2Clusters)
01应用范围经济预测疾病自动诊断病人分类新闻分类邮件分类……01
01应用范围应用范围:01范围领域模式识别机器学习数据挖掘机器学习+数据库统计学习统计+机器学习计算机视觉图像处理+机器学习语音识别语音处理+机器学习自然语言处理文本处理+机器学习
01应用范围01视频来源:/sv/cIfmOW4mUBP7UC.html?from=videoso_result
01自动驾驶驾驶辅助系统(DAS)
部分自动化系统高度自动化系统完全自动化01
02第三章机器学习3.2
机器人学习概述CONTENTS目录人工智能,机器学习和深度学习的区别
01机器学习的发展
02机器学习的分类
03各主流框架基本情况
04人工智能,机器学习和深度学习的区别02人工智能:人工智能,简称AI,是指为机器赋予人的智能。人工智能是计算机科学的一个分支,它企图了解智能的本质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。机器学习:机器学习,简称ML,是一种实现人工智能的方法。机器学习属于人工智能的一个分支,也是人工智能的和核心。机器学习理论主要是设计和分析一些让计算机可以自动“”学习的算法。深度学习:深度学习,简称DL,是一种实现机器学习的技术。最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并不是一个全新的概念,可大致理解为包含多个隐含层的神经网络结构。
01人工智能,机器学习和深度学习的区别请分别讨论下列各组数据的内部关系,并填空。02x131724y14.52.58.53.5?x236812y210.537.565.52.5?y1=x1+1.5y2=x22+1.5
01人工智能,机器学习和深度学习的区别定义:计算机利用已有的数据(经验),得出了某种模型(规律),并利用此模型预测未来数据特征的一种方法。02人类学习VS机器学习
01人工智能,机器学习和深度学习的区别视频来源:/video/BV1fA411a7X6?from=search&seid=1697965520941191505502
01机器学习的发展02机器学习的发展:在机器学习领域,计算机科学家不断探索,基于不同的理论创建出不同的机器学习模型。从发展历程来说,大致经历了三个阶段:符号主义时代(1980年左右)概率论时代(1990-2000年)联结主义时代(2010年左右)
02机器学习的分类机器学习的分类:可以按照输入的数据本身是否已被标定特定的标签将机器学习区分为有监督学习、无监督学习以及半监督学习三类。02机器学习有监督学习无监督学习半监督学习
03机器学习的分类监督学习:从带标签(标注)的训练样本中建立一个模式(模型),并依此模式推测新的数据标签的算法。无监督学习:在学习时并不知道其分类结果,其目的是对原始资料进行分类,以便了解资料内部结构算法。半监督学习:利用少量标注样本和大量未标注样本进行机器学习,利用数据分布上的模型假设,建立学习器对未标签样本进行标签。02
03各主流框架基本情况各主流框架基本情况对比:02库名发布者支持语言支持系统TensorFlowGooglePython/C++/Java/GoLinux/Mac
OS/Android/iOSCaffeUCBerkeleyPython/C++/MatlabLinux/Mac
OS/WindowsCNTKMicrosoftPython/C++/BrainScriptLinux/WindowsMXNetDMLC(分布式机器学习社区)Python/C++/Matlab/Julia/Go/R/ScalaLinux/Mac
OS/Windows/Android/iOSTorchFacebookC/Lua/Linux/Mac
OS/Windows/Android/iOSTheano蒙特利尔大学PythonLinux/Mac
OS/WindowsNeonIntelPythonLinux
04各主流框架基本情况各主流框架的性能对比:02库名学习材料丰富程度CNN建模能力RNN建模能力易用程度运行速度多GPU支持程度TensorFlow★★★★★★★★★★★★★★★Caffe★★★★★★★CNTK★★★★★★★★★★★MXNet★★★★★★★★★★★★Torch★★★★★★★★★★★★★Theano★★★★★★★★★★★Neon★★★★★★★★★04第三章机器学习3.3监督学习及案例体验CONTENTS目录监督学习简介
01案例体验1:电影票房数据分析
02案例体验2:鸢尾花分类
03监督学习简介在监督学习中,每一个例子都是一对由一个输入对象(通常是一个向量)和一个期望的输出值(也被称为监督信号)组成的。01
01监督学习简介应用步骤:步骤1:数据集的创建和分类。步骤2:训练。步骤3:验证。步骤4:使用。01
01监督学习简介回归(Regression)y是连续值(实数或连续整数),f(x)的输出也是连续值。这种类型的问题就是回归问题。对于所有已知或未知的(x,y),使得f(x,θ)和y尽可能地一致。损失函数通常定义为平方误差。分类(Classification)y是离散的类别标记(符号),就是分类问题。损失函数有一般用0-1损失函数或负对数似然函数等。在分类问题中,通过学习得到的决策函数f(x,θ)也叫分类器。01
01监督学习简介回归分析确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。一元线性回归只涉及一个自变量和一个因变量。因变量与自变量呈线性关系。因变量与自变量的关系可以用一个线性方程表示:01
01案例体验1:电影票房数据分析步骤:数据读取数据预处理模型建立与训练数据可视化模型预测与可视化02
022.1数据读取02案例体验1:电影票房数据分析
0202案例体验1:电影票房数据分析2.2数据预处理
0202案例体验1:电影票房数据分析2.3模型建立与训练(使用一元线性回归进行分析)
0202案例体验1:电影票房数据分析2.4数据可视化
0202案例体验1:电影票房数据分析2.5模型预测与可视化
02案例体验2:鸢尾花分类步骤:数据读取数据预处理数据可视化模型建立与训练模型评估03山鸢尾(setosa)
变色鸢尾(versicolor)
维吉尼亚鸢尾(virginica)
03使用K近邻对鸢尾花进行分类(物以类聚,人以群分)K近邻(K-NearestNeighbor,KNN)方法的核心思想是:在特征空间中,如果一个样本的K个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。03案例体验2:鸢尾花分类
03花萼长度(spepallength)花萼宽度(spepalwidth)花瓣长度(petallength)花瓣宽度(petalwidth)03案例体验2:鸢尾花分类3.1数据读取
03标签映射03案例体验2:鸢尾花分类3.2数据预处理
03四个特征值相关性03案例体验2:鸢尾花分类3.3数据可视化
03四个特征值相关性03案例体验2:鸢尾花分类3.3数据可视化
0303案例体验2:鸢尾花分类3.4模型建立与训练
0303案例体验2:鸢尾花分类3.5模型评估
03第三章机器学习3.4无监督学习及案例体验CONTENTS目录无监督学习简介
01案例体验:使用K-Means对观影用户进行聚类
02无监督学习简介无监督学习就是在样本数据中只有数据,而没有对数据进行标记。无监督学习的目的就是让计算机对这些原始数据进行分析,让计算机自己去学习、找到数据之间的某种关系。01视频来源:/v?vid=11285795004709214679&pd=bjh&fr=bjhauthor&type=video视频:监督学习、无监督学习、强化学习是什么?
01无监督学习简介无监督学习主要包括:聚类聚类是对于未标记的数据,在训练时根据数据本身的数据特征进行训练,呈现出数据集聚的形式,每一个集聚群中的数据,彼此都有相似的性质,从而形成分组。降维降维是缓解维数灾难的一种重要方法,就是通过某种数学变换将原始高维属性空间转变成一个低维子空间。01
01无监督学习简介聚类主要方法:基于划分的聚类方法(partitioningmethods):K-MEANS算法、K-MEDOIDS算法、CLARANS算法基于层次的聚类方法(hierarchicalmethods):BIRCH算法、CURE算法、CHAMELEON算法基于密度的聚类方法(density-basedmethods):DBSCAN算法、OPTICS算法、DENCLUE算法基于网格的聚类方法(grid-basedmethods):STING算法、CLIQUE算法、WAVE-CLUSTER算法基于模型的聚类方法(model-basedmethods):统计的方案和神经网络的方案01聚类方法的优点:对数据输入顺序不敏感。聚类方法的缺点:在数据分布稀疏时,分类不准确;当高维数据集中存在大量无关的属性时,使得在所有维中存在簇的可能性几乎为零;缺乏处理“噪声”数据的能力。
01案例体验:使用K-Means对观影用户进行聚类K-Means算法原理:K-Means是典型的聚类方法。其中,K表示类别数,Means表示均值。顾名思义,K-Means是一种通过均值对数据点进行聚类的方法。K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。01视频来源:/video/BV1ei4y1V7hX/?spm_id_from=333.788.recommend_more_video.-1
02案例体验:使用K-Means对观影用户进行聚类K-Means算法步骤:(随机)选择K个聚类的初始中心;对任意一个样本点,求其到K个聚类中心的距离,将样本点归类到距离最小的中心的聚类,如此迭代n次;每次迭代过程中,利用均值等方法更新各个聚类的中心点(质心);对K个聚类中心,利用2,3步迭代更新后,如果位置点变化很小(可以设置阈值),则认为达到稳定状态,迭代结束,对不同的聚类块和聚类中心可选择不同的颜色标注。01
02案例体验:使用K-Means对观影用户进行聚类K-Means算法的优缺点及应用领域:优点:算法简单、快速。特别是在处理大数据集时,算法可伸缩性高,并且相对高效。当分类(簇)是密集的球状或团状,且簇与簇之间区别明显时,聚类效果较好。缺点:只有在簇的平均值被定义的情况下才能使用,且对有些分类属性的数据不适合;要求用户必须事先给出要生成的簇的数目K;对初始值敏感:使用不同的初始值可能会形成不同的聚类结果;不适合于非凸面形状的簇类分析,或者大小差别很大的簇;对于“噪声”和孤立点数据敏感,少量的该类数据可能对平均值产生极大影响。应用:广泛应用于统计学、生物学、数据库技术和市场营销等领域。01
02案例体验:使用K-Means对观影用户进行聚类使用K-Means对观影用户进行聚类,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论