版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
K-means聚类算法K-means聚类算法聚类分析概念1K-means算法2K-means实验-国民健康3K-means实验-图像分割4K-means实验-商户评级5目录聚类分析概念1K-means算法2K-means实验-国民健1.聚类分析概念聚类与分类的不同在于:分类简单来说,就是根据文本的特征或属性,划分到已有类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。聚类的理解更简单,就是你压根不知道数据会分为几类,通过聚类分析将数据或者说用户聚合成几个群体,那就是聚类了。聚类不需要对数据进行训练和学习。1.聚类分析概念聚类与分类的不同在于:2.K-means算法Q1:K是什么?A1:k是聚类算法当中类的个数。Summary:Kmeans是用均值算法把数据分成K个类的算法!Q2:means是什么?A2:means是均值算法。2.K-means算法Q1:K是什么?A1:k是聚类算法当中2.K-means算法距离的定义欧式距离:N维空间点或向量的距离曼哈顿距离:城市街区距离夹角余弦:向量方向的差异相关系数:信息熵:
2.K-means算法距离的定义欧式距离:2.K-means算法K-means算法详解步骤一:取得k个初始中心点从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类2.K-means算法K-means算法详解步骤一:取得k个2.K-means算法K-means算法详解MinofthreeduetotheEuclidDistance步骤二:把每个点划分进相应的簇根据欧氏距离最小原则,把每个点划分进相应的簇2.K-means算法K-means算法详解Minof2.K-means算法K-means算法详解MinofthreeduetotheEuclidDistance步骤三:重新计算中心点根据均值等方法,重新计算每个类的中心点2.K-means算法K-means算法详解Minof2.K-means算法K-means算法详解步骤四:迭代计算中心点重复第二步和第三步2.K-means算法K-means算法详解步骤四:迭代计算2.K-means算法K-means算法详解步骤五:收敛聚类中心不再发生移动2.K-means算法K-means算法详解步骤五:收敛聚类3.K-means实验-国民健康数据示意图国家和地区婴儿死亡率(‰)出生时平均预期寿命/岁1990年2000年2006年1990年2000年2006年中国36.329.920.168.970.372中国香港77.480.981.6孟加拉国1006651.654.86163.7文莱108874.276.277.1柬埔寨84.57864.854.956.558.9印度806857.459.162.964.5印度尼西亚603626.461.765.868.2伊朗54363064.868.970.7以色列105.64.276.67980日本4.63.22.678.881.182.3哈萨克斯坦50.537.125.868.365.566.2朝鲜42424269.966.867韩国854.571.375.978.5老挝120775954.660.963.9马来西亚16119.870.372.674蒙古78.547.634.262.765.167.2缅甸917874.45960.161.6巴基斯坦1008577.859.16365.2菲律宾41302465.669.671.4新加坡6.72.92.374.378.179.9斯里兰卡25.616.111.271.273.675泰国25.711.77.26768.370.2越南382314.664.869.170.8埃及66.74028.962.268.871尼日利亚12010798.647.246.946.8南非45505661.948.550.7加拿大6.84.977.479.280.4墨西哥41.531.629.170.97474.5美国9.46.96.575.27777.8[X,textdata]=xlsread('examp09_04.xls');row=~any(isnan(X),2);X=X(row,:);countryname=textdata(3:end,1);countryname=countryname(row);X=zscore(X);startdata=X([8,27,42],:);idx=kmeans(X,3,'Start',startdata);[S,H]=silhouette(X,idx);代码3.K-means实验-国民健康数据示意图国家和地区婴儿死亡轮廓图聚类结果3.K-means实验-国民健康轮廓图聚类结果3.K-means实验-国民健康4.K-means实验-图像分割灰度图代码分割后二值图像4.K-means实验-图像分割灰度图代码分割后二值图像4.K-means实验-图像分割真彩图4.K-means实验-图像分割真彩图4.K-means实验-商户评价数据示意图代码大众点评网上1000家商户的评分4.K-means实验-商户评价数据示意图代码大众点评网上14.K-means实验-商户评价聚类结果MINMAX
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 当幸福来敲门观后感合集15篇
- 巾帼标兵先进事迹材料集锦15篇
- 感恩父母讲话稿(集合15篇)
- 扭转治疗分享会
- 培训学校招生宣传
- 初级金融专业-《金融专业知识与实务》名师预测卷1117
- 初级会计经济法基础-初级会计《经济法基础》预测试卷325
- 智研咨询发布-2024年中国曲轴行业市场竞争格局、行业政策及需求规模预测报告
- 产业研究报告-2024年中国磁悬浮轴承行业发展现状、市场规模、投资前景分析(智研咨询)
- 二零二五年度家居定制销售购销合同(含设计服务)2篇
- 2025江苏太仓水务集团招聘18人高频重点提升(共500题)附带答案详解
- 2024-2025学年人教新版高二(上)英语寒假作业(五)
- 《旅游资料翻译》课件
- 2024年安徽省中考数学试卷含答案
- 微项目 探讨如何利用工业废气中的二氧化碳合成甲醇-2025年高考化学选择性必修第一册(鲁科版)
- 广东省广州市黄埔区2024-2025学年八年级物理上学期教学质量监测试题
- 财务管理学(第10版)课件 第1章 总论
- 《鼻咽癌的诊治》课件
- 有关信用证的案例分析
- 水中大肠杆菌的检测实验报告
- 智慧体育场馆建设方案
评论
0/150
提交评论