




已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
K-均值聚类算法,由张明磊报道,1,2020/8/3,K-均值算法是一种典型的基于距离的聚类算法,它使用距离作为相似性的评价指标,即两个物体之间的距离越近,它们的相似性越大。该算法认为类是由距离较近的对象组成的,所以最终的目标是得到紧凑且独立的类。2,2020/8/3,假设数据集是(x1,x2,xn),并且每个xi是一个D维向量,K-means聚类的目的是给定k(kn)的值,将原始数据分成K个类:S=S1,S2,SK在数值模型上,也就是说,找到下面的表达式(2)根据最小距离原则将数据样本集中的样本分配到最近的聚类;(3)根据聚类结果,重新计算k个聚类的中心,并将其作为新的聚类中心;(4)重复步骤2.3,直到群集中心不变。4,2020/8/3,数学表达式:n:样本数。k:样本分为k类。Rnk:第n个采样点是否属于第k类,如果是,rnk=1,如果不是,rnk=0。kth中心点。5,2020/8/3,K-means要做的就是最小化这个函数。迭代方法:1 .修正k得到rnk。2.修正rnk并找到最优K,6,2020/8/3,求rnk并求K,7,2020/8/3,8,2020/8/3,k- means算法性能分析优势:1 .K-means算法框架清晰、简单、易懂。2.对于处理大型数据集,该算法相对可扩展且高效,计算复杂度为0(NKt
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030美白保湿霜行业深度分析及发展趋势与投资前景研究报告
- 2025-2030红霉素肠溶胶囊市场前景分析及投资策略与风险管理研究报告
- 2025-2030窄幅机织面料行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2025-2030移动应急供电车行业市场发展现状及竞争格局与投资价值研究报告
- 2025-2030电热水壶行业风险投资发展分析及投资融资策略研究报告
- 2025-2030电子管行业并购重组机会及投融资战略研究咨询报告
- 2025-2030生物阻抗测量仪行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2025-2030瑶柱市场发展分析及行业投资战略研究报告
- 2025-2030玩具跨境电商行业市场发展分析及前景趋势与投资研究报告
- 2025-2030牲猪饲料项目可行性研究报告
- 英语-北京市朝阳区2025年高三年级第二学期质量检测一(朝阳一模)试题和答案
- 教师规范汉字书写培训
- 2024年新疆医科大学附属肿瘤医院招聘事业单位考试真题
- 2025年《宏观经济政策与发展规划》核心备考题库(含典型题、重点题)
- 【百强校】【黑吉辽卷】黑龙江省哈尔滨市第三中学2025年高三学年第一次模拟考试(哈三中一模)语文试卷
- 2025年河南医学高等专科学校单招职业适应性考试题库含答案
- 肿瘤化学疗法的护理
- 2025至2030年中国网球捡球篮数据监测研究报告
- 角膜塑形镜试戴片参数选择和配适评估巩朝雁课件
- 2025年河南经贸职业学院单招职业技能测试题库1套
- 全国计算机等级考试一级试题及答案(5套)
评论
0/150
提交评论