宇传华聚类分析第2部分_第1页
宇传华聚类分析第2部分_第2页
宇传华聚类分析第2部分_第3页
宇传华聚类分析第2部分_第4页
宇传华聚类分析第2部分_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ClusterAnalysis

聚类分析(第2部分)1(二)最长距离法

(completelinkage,furthestneighbor)

B2A2**B1A1**B3*样品间:欧氏距离类类间:两类间样品两两距离最长。即图中样品A2和B3之间的距离

(三)中间距离法

(medianmethod)

最长距离夸大了类间距离,最短距离低估了类间距离。介于两者间的距离即为中间距离KLJM(四)中间距离法的变形

——可变法

(五)类平均法

(averagelinkagebetweengroup)SPSS作为默认方法,称为between-groupslinkageKLJM(六)可变类平均法

(flexible-betamethod)类平均法的变型KLJM(七)重心法

(centroidmethod)

B2A2**B1A1**B3*类类间的距离用各自重心间的距离表示

(八)Ward最小方差法

(Ward’minimumvariancemethod)

先将n个样品各自成一类,然后每次每缩小一类,每缩小一类离差平方和就要增加,选择使离差平方和增加(SSM-SSK-SSL)最小的两类合并,直至所有的样品归为一类为止。(九)八种系统聚类方法的统一

以上聚类方法的计算步骤完全相同,仅类与类之间的定义不同。Lance和Williams于1967年将其统一为:八种系统聚类法公式的参数

系统聚类法的性质

单调性中间距离法、重心法不具有单调性空间的浓缩与扩张不同聚类法作图,横坐标的范围可相差很大。最短距离法与重心法比较浓缩;可变类平均比较扩张;类平均法比较适中。有关问题

几种聚类方法获得的结果不一定相同指标聚类采用相似系数,相似系数大或距离小则表示类间关系密切,为了统一,可采用以下公式变换。

五、快速聚类法

(quickclustermethodk-meansmodel)

也叫动态聚类、逐步聚类、迭代聚类)样本量很大,用系统聚类法计算的工作量极大,作出的树状图也十分复杂,不便于分析原理选择初始凝聚点根据欧氏距离将每个样品归类各类的重心代替初始凝聚点根据欧氏距离将每个样品归类,……直至分类达到稳定初始凝聚点

initialclusterseeds;clustercenters自动选择

必须给出允许分类的最大个数k(

SAS中用MAXCLUSTERS=k(或MAXC=k))凭经验选择

以初始凝聚点建立一个数据文件,在SAS的FASTCLUS过程的SEED=选择项中输入该数据文件六、变量聚类法

原理与以上聚类法类似,只是将标准化后的变量视为“个体”,变量间的相关系数描述“个体”间的相似程度。

SAS中采用VARCLUS过程。七、小结

与判别分析的区别(作用,数据要求?)聚类分析是一种探索性技术,对于同一问题,可获得多种结果,解释需要结合专业知识样品量大可采用快速聚类方法变量的形式?距离与相似系数?系统聚类常用方法?存在的问题

分类数的确定专业知识聚类方法的选择试用多种方法,系统聚类与快速聚类相结合(一)SPSS聚类分析

八、软件计算与实例分析

1.系统聚类

指定参与聚类的变量名和样品号

Statistics

聚类进度表相似矩阵样品或变量的分类情况Plot

树状结构图冰柱图冰柱的方向Method

聚类方法标准化变换亲疏关系指标Method

将分类结果存入数据文件中2.快速聚类

选项

读写凝聚点人为固定分类数ANOVA表,初始凝聚点等(二)SAS聚类分析

样品聚类:PROCCLUSTERpseudoRSQUARESTDMETHOD=(AVE,AVERAGE,CEN,CENTROID,COM,COMPLETE,DEN,DENSITY,EML,FLE,FLEXIBLE,MCQ,MCQUITTY,MED,MEDIAN,SIN,SINGLE,TWO,TWOSTAGE,WAR,WARD);IDnational;PROCTREEHORIZONTAL;IDnational;变量聚类:PROCVARCLUSCORRCENTROIDHIERARCHYMAXC=4;快速聚类:PROCFASTCLUSMAXC=4MAXITER=100;IDnational;资料预处理:PROCACECLUS;(ACECLUS(ApproximateCovarianceEstimationforCLUStering))如果要采用非欧式距离,SAS中可用宏程序(%distance)计算。或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论