下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精品文档聚类分析聚类分析是将个对象按各自的特征将相似的对象归到同一个类或簇的一种方法,它的原则是同一个类中的对象有很大的相似性, 而不同类间的对象有很大的相异性。特点:适用于没有先验知识情况下的分类。 对于没有先前的经验或一些规则的对象进行分类,则显得很随意和主观, 这时需要使用聚类分析法通过对象各自的特性来合理的分类;能处理多个维度或属性决定的分类。 例如,对于某个地区的全部家庭的富裕程度而言,通过家庭的收入和支出差可以简单分类, 容易知道。 但是如果要求从家庭的收入、 家庭的支出、 家庭的固有资产、 家庭所在地区的地段等多个变量来分析就比较复杂,然后解决这个问题可以使用聚类分析算法。聚类分
2、析算法也是一种探索性分析方法,能够挖掘对象的潜在规律和特性,并根据相似性原则对事物进行分类。几类距离公式:1.类平均距离D pq1dijnp nqi Gpj GqD pq =dxp , xqxpxqT2.重心距离xp , xq3.离差平方和距离 wardD pq2np nqxpxqTxp , xqnp nqp14.闵科夫斯基Minkowskidijq| xikx jk |qqk1p5.绝对值距离dij 1| xikxjk|k1p126.欧氏距离dij 2| xikxjk |2k17.兰式距离 WiliamsdijLp| xikx jk|k 1xikx jk18.马氏距离 Mahalanobis
3、dijMxix jSxi xj 其中是样品协方差系统聚类法思想先将每一个样本作为一个单独的类,然后计算各个样本之间的距离Si ,在将计算出来的距离 Si 定义为类之间的距离Sj ,以为 Sj 标准的距离,进行合理合并,形成新的一个类, 在重新对新类和其他剩余的类进行计算其距离,循环执行合并。1 欢迎下载精品文档动作,直到全部的样本都属于一个大类为止。步骤:若有 n 个样本点,计算出每两个样本点之间的距离dij ,即矩阵 D( dij )n n ;建立 n 个类,每个类中仅有一个样本点,且每个类的平台高度都为0;将距离最近的两个类合并为新类, 选取聚类图的平台高度为这两类之间的距离值;求出新类和
4、目前各类之间的距离, 如果类的个数等于 1,执行步骤 ,否则,返回执行步骤;画出聚类图;确定类的数目和类,例题:设有 5个销售员 w1 , w2 , w3 , w4 , w5 ,他们的销售业绩由二维变量(v1, v2 ) 描述,见表1。表 1 销售员业绩表记销售员 wi (i1,2,3, 4,5) 的销售业绩为 (vi1 , vi 2 ) 。若使用绝对值距离来测量点与点之间的距离,使用最短距离法来测量类与类之间的距离,即2d ( wi , wj )vikvjk , D (Gp ,Gq ) mind ( wi , wj )k1wi G pwj Gq题中有 5个样本点,计算出每两个样本点之间的距离
5、dij ,即矩阵 D 为0146603550 2 40 40建立 5 个类 H1w1, w2 , w3 , w4 , w5 。每个类的平台高度f (wi )(i1,2,3,4,5) 都为 0;将 w1 ,w2 , 合并为新类 w6 ,选取新的平台高度为1,此时有 H1w6 , w3 , w4 , w5 ;将 w3 , w4 , 合并为新类 w7 ,选取新的平台高度为2,此时有 H 2w6 , w7 , w5 ;。2 欢迎下载精品文档将 w6 , w7 , 合并为新类 w8 ,选取新的平台高度为3,此时有 H 3w8 , w5 ;将 w8 , w5 , 合并为新类 w9 ,选取新的平台高度为4,此时有 H 4w9 ;画出聚类图;有聚类图可以看出,在这五个推销员中w5 的工作成绩最佳, w3 , w4 的工作成绩较好,而w1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度股权质押借款合同共环保产业项目融资合作协议
- 2025年茶叶新品研发合作代理销售合同4篇
- 二零二五年度汽车内饰材料采购及加工合同3篇
- 2025年红砖行业市场分析及竞争策略咨询合同
- 2025年度国际海洋油气田开发合同范本(勘探与开采一体化)
- 2025年度全国花艺教师职业资格认证与聘用合同
- 2025年度外墙涂料生产设备租赁合同样本
- 2025年度科幻动作片《星际霸主》联合制作合同
- 2025年环保型锅炉销售合同模板
- 2025年度海运货物包装与运输合同范本年度更新
- (二模)遵义市2025届高三年级第二次适应性考试试卷 地理试卷(含答案)
- 二零二五隐名股东合作协议书及公司股权代持及回购协议
- 2025年计算机二级WPS考试题目
- 高管绩效考核全案
- 《经济思想史》全套教学课件
- 环境卫生学及消毒灭菌效果监测
- 对合同条款有异议函
- 中医馆工作细则
- 寻梦缘古法驻颜培训课件
- 建设用地报批服务投标方案(技术方案)
- 2023年11月英语二级笔译真题及答案(笔译实务)
评论
0/150
提交评论