K-means聚类算法PPT学习课件_第1页
K-means聚类算法PPT学习课件_第2页
K-means聚类算法PPT学习课件_第3页
K-means聚类算法PPT学习课件_第4页
K-means聚类算法PPT学习课件_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

K-均值聚类算法,由张明磊报道,1,2020/8/3,K-均值算法是一种典型的基于距离的聚类算法,它使用距离作为相似性的评价指标,即两个物体之间的距离越近,它们的相似性越大。该算法认为类是由距离较近的对象组成的,所以最终的目标是得到紧凑且独立的类。2,2020/8/3,假设数据集是(x1,x2,xn),并且每个xi是一个D维向量,K-means聚类的目的是给定k(kn)的值,将原始数据分成K个类:S=S1,S2,SK在数值模型上,也就是说,找到下面的表达式(2)根据最小距离原则将数据样本集中的样本分配到最近的聚类;(3)根据聚类结果,重新计算k个聚类的中心,并将其作为新的聚类中心;(4)重复步骤2.3,直到群集中心不变。4,2020/8/3,数学表达式:n:样本数。k:样本分为k类。Rnk:第n个采样点是否属于第k类,如果是,rnk=1,如果不是,rnk=0。kth中心点。5,2020/8/3,K-means要做的就是最小化这个函数。迭代方法:1 .修正k得到rnk。2.修正rnk并找到最优K,6,2020/8/3,求rnk并求K,7,2020/8/3,8,2020/8/3,k- means算法性能分析优势:1 .K-means算法框架清晰、简单、易懂。2.对于处理大型数据集,该算法相对可扩展且高效,计算复杂度为0(NKt

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论