




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 扌旨导教师 丿XXX 线 I I I I I I I I 题目: K_Means聚类算法分析与实现 院一 XXXXXXXXXXXXXXXXXXXX 业 XXXXXXXXXXXXXXXX 号一 XXXXXXXXXXX 名 XXXX 20 xx 年 x 月 xx H K-Means 聚类算法 KMeans算法的基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类 样本 点分到各个簇。然后按平均法重新计算各个簇的质心,从而确立新的簇心。一直 迭代,直 到簇心的移动距离小于某个给定的值。 K-Means聚类算法主要分为三个步骤: (1) 第一步是为待聚类的点寻找聚类中心 (2) 第二步是计算每个
2、点到聚类中心的距离,将每个点聚类到离该点最近的聚类中去 (3) 第三步是计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中 心 反复执行(2)、(3),直到聚类中心不再进行大范围移动或者聚类次数达到要求为止 下图展示了对n个样本点进行K-means聚类的效果,这里k取2: (a) 未聚类的初始点集 (b) 随机选取两个点作为聚类中心 (C)计算每个点到聚类中心的距离,并聚类到离该点最近的聚类中去 (d) 计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心 (e) 重复(c),计算每个点到聚类中心的距离,并聚类到离该点最近的聚类中去 (f) 的坐标平均值, 重复(d),
3、计算每个聚类中所有点 并将这个平均值作为新的聚类中 (c) (b) Mat lab 实现: %!机获取150个点 X = randn (50, 2) +o nes (50, 2) ;ra ndn (50, 2)o nes (50, 2) ;ra ndn (50, 2) + o nes (50, 1), o nes ( 50,1); opts 二 statset( Displayfi naV): %调用Kmeans函数 %X N*P的数据矩阵 %Idx N*1的向量,存储的是每个点的聚类标号 %Ctrs K*P的矩阵,存储的是K个聚类质心位置 %SumD 1*的和向量,存储的是类间所有点与该类质
4、心点距离之和 %DN*K的矩阵,存储的是每个点与所有质心的距离;ldx, Ctrs,SumD, D = kmea ns (X, 3, Replicates , 3, Optio ns , opts); %8出聚类为1的点。X(Idx=l, 1),为第一类的样本的第一个坐标;X(Idx=l,2)为第二类 的样本 的第二个坐标 plot (X(ldx=l, 1), X(ldx=l, 2), r. , MarkerSize, 14) hold on plot (X (Idx=2, 1), X (Idx=2, 2)bMarkersize, 14) hold on plot (X(Idx=3, 1),
5、X (Idx=3, 2)MarkerSize, 14) %绘出聚类中心点,kx表示是圆形 plot (Ctrs (:, 1), Ctrs (:, 2), kx ,,Markersize,, 14, LineWidth , 4) plot (Ctrs (:, 1), Ctrs (:, 2)kx MarkerSize , 14, LineWidth , 4) plot (Ctrs(:, 1), Ctrs(:, 2),,kx , MarkerSize, 14, LineWidth, , 4) legendCluster 1 , Cluster 2, Cluster 3 , Centroids,, L
6、ocation , NW) Ctrs SumD 执行结果: Kmeans 6 iterations, 10 iterations, totai sum of distances 二 204.821 total sum of distances 二 205. 886 total sum of distances 二 204.821 9 iterations, total sum of distances 二 16 iterations, 205.886 9 iterations, totai sum of distances 二 205.886 8 iterations, 8 iterations, 14 iterations, total sum of distances 二 204. 821 total sum of distances 二 204. 821 total sum of distances 二 205. 886 14 it erations, t otel sum of dis tances 二 205. 886 6 iterations, total sum of distances 二 204.821 Ctrs 二 1.0754 1. 0482 -1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 铁道养路机械应用技术专业教学标准(高等职业教育专科)2025修订
- 药学专业教学标准(高等职业教育专科)2025修订
- 临床皮内注射技术
- 税务师考试东奥课件
- 中国广告发布行业市场调查研究及投资前景预测报告
- 中国农药杀菌剂行业市场调查报告
- 2025年中国手袋线行业市场发展前景及发展趋势与投资战略研究报告
- 回复反射器行业深度研究分析报告(2024-2030版)
- 中国城市经营行业市场发展现状及前景趋势与投资分析研究报告(2024-2030)
- 2025年中国小曲酒行业市场深度调研分析及投资前景研究预测报告
- 第三方外包管理制度
- 2025年重庆市中考生物试卷真题(含标准答案)
- 2025高考英语解析及其范文
- 2025年6月8日北京市事业单位面试真题及答案解析(下午卷)
- 人力资源测评期末考试试题及答案
- 2024年贵州省粮食储备集团有限公司招聘真题
- 护理生物学试题及答案
- 电子产品仓库管理制度与流程
- 浙江国企招聘2025杭州地铁科技有限公司招聘51人(第一批)笔试参考题库附带答案详解析
- 深度学习的基本概念试题及答案
- 甘肃省平凉市2025届七下数学期末教学质量检测试题含解析
评论
0/150
提交评论