![《机器学习与Python实践》课件-05决策树KNN_第1页](http://file4.renrendoc.com/view6/M02/04/35/wKhkGWetR0OAcdk8AACPaYSk7-A201.jpg)
![《机器学习与Python实践》课件-05决策树KNN_第2页](http://file4.renrendoc.com/view6/M02/04/35/wKhkGWetR0OAcdk8AACPaYSk7-A2012.jpg)
![《机器学习与Python实践》课件-05决策树KNN_第3页](http://file4.renrendoc.com/view6/M02/04/35/wKhkGWetR0OAcdk8AACPaYSk7-A2013.jpg)
![《机器学习与Python实践》课件-05决策树KNN_第4页](http://file4.renrendoc.com/view6/M02/04/35/wKhkGWetR0OAcdk8AACPaYSk7-A2014.jpg)
![《机器学习与Python实践》课件-05决策树KNN_第5页](http://file4.renrendoc.com/view6/M02/04/35/wKhkGWetR0OAcdk8AACPaYSk7-A2015.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
01距离度量02KNN算法本章目录03KD树划分04KD树搜索01距离度量02KNN算法03KD树划分04KD树搜索1.距离度量距离度量欧氏距离(Euclideandistance)
电影分类距离度量曼哈顿距离(Manhattandistance)
想象你在城市道路里,要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?显然不是,除非你能穿越大楼。实际驾驶距离就是这个“曼哈顿距离”。而这也是曼哈顿距离名称的来源,曼哈顿距离也称为城市街区距离(CityBlockdistance)。距离度量切比雪夫距离(Chebyshevdistance)
二个点之间的距离定义是其各坐标数值差绝对值的最大值。国际象棋棋盘上二个位置间的切比雪夫距离是指王要从一个位子移至另一个位子需要走的步数。由于王可以往斜前或斜后方向移动一格,因此可以较有效率的到达目的的格子。上图是棋盘上所有位置距f6位置的切比雪夫距离。距离度量闵可夫斯基距离(Minkowskidistance)
距离度量汉明距离(Hammingdistance)
汉明距离是使用在数据传输差错控制编码里面的,汉明距离是一个概念,它表示两个(相同长度)字对应位不同的数量,我们以表示两个字之间的汉明距离。对两个字符串进行异或运算,并统计结果为1的个数,那么这个数就是汉明距离。距离度量余弦相似度
01距离度量02KNN算法03KD树划分04KD树搜索2.KNN算法2.KNN算法
2.KNN算法
2.KNN算法算法流程如下:1.计算测试对象到训练集中每个对象的距离2.按照距离的远近排序3.选取与当前测试对象最近的k的训练对象,作为该测试对象的邻居4.统计这k个邻居的类别频次5.k个邻居里频次最高的类别,即为测试对象的类别K=3K=501距离度量02KNN算法03KD树划分04KD树搜索3.K-D-Tree划分KD树划分
①
KD树划分
①②②
KD树划分
①②②③③
KD树划分
①②②③③④
KD树划分
①③③④②②KD树划分样本空间结构图
01距离度量02KNN算法03KD树划分04KD树搜索4.K-D-Tree搜索KD树搜索
1.首先要找到该目标点的叶子节点,然后以目标点为圆心,目标点到叶子节点的距离为半径,建立一个超球体,我们要找寻的最近邻点一定是在该球体内部。搜索(4,4)的最近邻时。首先从根节点(6,4)出发,将当前最近邻设为(6,4),对该KD树作深度优先遍历。以(4,4)为圆心,其到(6,4)的距离为半径画圆(多维空间为超球面),可以看出(7,2)右侧的区域与该圆不相交,所以(7,2)的右子树全部忽略。KD树搜索
2.返回叶子结点的父节点,检查另一个子结点包含的超矩形体是否和超球体相交,如果相交就到这个子节点寻找是否有更加近的近邻,有的话就更新最近邻。接着走到(6,4)左子树根节点(4,5),与原最近邻对比距离后,更新当前最近邻为(4,5)。以(4,4)为圆心,其到(4,5)的距离为半径画圆,发现(6,4)右侧的区域与该圆不相交,忽略该侧所有节点,这样(6,4)的整个右子树被标记为已忽略。KD树搜索
3.如果不相交直接返回父节点,在另一个子树继续搜索最近邻。4.当回溯到根节点时,算法结束,此时保存的最近邻节点就是最终的最近邻。遍历完(4,5)的左右叶子节点,发现与当前最优距离相等,不更新最近邻。所以(4,4)的最近邻为(4,5)。参考文献[1]AndrewNg.MachineLearning[EB/OL].StanfordUniversity,2014./course/ml[2]李航.统计学习方法[M].北京:清华大学出版社,2019.[3]周志华.机器学习[M].北京:清华大学出版社,2016.[4]CoverTM,HartPE.Nearestneighborpatternclassification[J].IEEETrans.inf.theory,1953,13(1):21-27.[5]HastieT.,TibshiraniR.,FriedmanJ.TheElementsofStatisticalLearning[M].NewYork:Springer,2001.[6]CHRISTOPHERM.BISHOP.PatternRecognitionandMachineLearning[M].NewYork:Spr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2022年普通高等学校招生全国统一考试(全国甲卷)英语试题含答案
- 生物信息学在临床决策支持系统中的应用研究进展报告
- 2025年传动机械项目可行性研究报告
- 中国毛条行业市场前景预测及投资方向研究报告
- 上调工资申请书
- 2025年山东德州市陵城区誉衡供销集团有限公司招聘笔试参考题库附带答案详解
- 贫困支助的申请书
- 2025年中国盐酸金刚烷胺颗粒行业发展监测及投资战略研究报告
- 2024年焦化行业竞争格局分析及投资战略咨询报告
- 2025年广西南宁糖业宾阳大桥制糖有限责任公司招聘笔试参考题库附带答案详解
- 小学二年级语文上册阅读理解专项训练20篇(含答案)
- 2024年中考语文名著阅读知识(考点)专题10《水浒传》真题精练(单一题)(解析版)
- 新能源电力市场与电力交易
- 《英国饮食文化》课件
- 视频号运营规则
- 班规班约高一班规班约及考核细则
- 《幼儿文学》 课件全套 第1-8章 幼儿文学概述- 图画书
- 第15课 记忆小窍门(教学设计)-苏教版心理健康四年级上册
- 41篇小学三年级语文课外阅读练习题及答案
- 马克笔绘图方法培训PPT课件(内容详细)
- 部编2023版道德与法治六年级下册活动园问题及答案
评论
0/150
提交评论