版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第8章聚类《机器学习》胡晓8.1聚类基本理论
8.1聚类基本理论
相似性测度在聚类算法,样本间相似度通常需要采用两个样本之间的“距离测度(DistanceMetric,DM)”进行衡量。
常见距离:欧氏距离、曼哈顿距离、闵可夫斯基距离、值差异值测度8.1聚类基本理论类簇中心类簇中心,又称为簇质心,定义为簇内样本分布中心,如图8.1中每簇的中心点。然而,不同聚类算法定义各有差别,简单分为两种:K均值聚类簇中心
基于密度的类簇中心AlexRodriguez和AlessandroLaio在Science期刊文章中提出:类簇中心周围都是密度比其低的点,同时这些点距离该簇中心的距离相比于其他聚类中心最近。8.1聚类基本理论聚类算法评价指标
纯度(Purity)将每个簇内频数最高的样本类别作为正确的类簇,聚类熵
8.1聚类基本理论聚类算法评价指标同质性也叫均一性,一个类簇中仅有一个类别的样本,均一性最高同质性(Homogeneity)
相当于精确率,即被聚类的类簇中正确分类的样本数占该类簇中的样本数的比例,
8.1聚类基本理论聚类算法评价指标完整性(Completeness)同类别的样本被归类到同一聚类簇中,则满足完整性。相当于召回率,即每个聚类中正确分类的样本数占该类别样本的数量,
8.1聚类基本理论聚类算法评价指标兰德指数和调整兰德指数
8.2K均值聚类
8.3层次聚类层次聚类(hierarchicalclustering)是基于簇间的相似度的树形聚类算法。一般有两种划分策略:自底向上的凝聚策略和自顶向下的分拆策略。凝聚策略
分拆策略
初始时将每个样本点当做一个类簇,然后依据相似度准则合并相似度最大的类簇,直到达到终止条件。
8.4密度聚类
密度聚类(Density-BasedSpatialClustering)是一种基于密度的聚类算法。8.4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 领导干部带班作业记录表
- 2024届新疆木垒县中学高三1月检测试题数学试题
- 2024届上海市市西初级中学高三下学期最后一次模拟考试试卷数学试题
- 幼儿课件制作软件
- 2024年兰州客运从业资格证实际操作考试答案
- 2024年杭州客运资格证试题及答案选择题
- 2024年云南客运从业资格证都考什么题型
- 2024年沈阳客运从业资格证急救考试试题教程
- 2024年西安客运从业资格证考试多少道题
- 上海市静安区上戏附中2025届高二生物第一学期期末经典试题含解析
- 工务电务联合整治设备管理办法
- 北师大版生物八年级上册18.2《微生物与人类的关系》课件(共27张PPT)
- 综合布线 工程 11 综合布线系统的验收方案
- 葫芦丝校本教材(共38页)
- 怎样上好一节数学课(课堂PPT)
- 10KV配电调试报告
- 中医院新入职护士培训计划
- 中南大学湘雅二医院临床试验协议
- 【研究手册】初中数学课堂合作学习的低效成因分析及对策研究
- 园林景观施工组织设计方案
- 伺服攻丝机使用说明书
评论
0/150
提交评论