判别分析和聚类分析_第1页
判别分析和聚类分析_第2页
判别分析和聚类分析_第3页
判别分析和聚类分析_第4页
判别分析和聚类分析_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

判别分析和聚类分析第1页,课件共11页,创作于2023年2月一、判别分析二、聚类分析本讲结构

第2页,课件共11页,创作于2023年2月一、判别分析回归分析,判别分析,聚类分析被称为多元统计的三大方法.判别分析(discriminantanalysis)是根据要判别对象的若干个指标的观测结果判断其应属于已知类中的哪一类的统计学方法.经典的判别分析方法有:Fisher判别和Bayes判别,原理都是建立判别函数使得错判率达到最小.第3页,课件共11页,创作于2023年2月判别分析方法SPSS实现步骤1.选择classify→discriminant;2.选择分类变量(GroupingVariable),定义分类范围数(1~n);3.选择分类指标变量(Independents);4.设置统计量Statistics中的Fisher系数,Classify中的判别符合率表Summarytable;例:判别分析.sav第4页,课件共11页,创作于2023年2月5.由Fisher判别函数计算要判别的对象,哪个判别函数计算的值最大,该判别对象就属于哪一类.第5页,课件共11页,创作于2023年2月二、聚类分析聚类分析(ClusterAnalysis)是按”物以类聚”的原则将特性相近的对象进行归类.SPSS中的聚类分析按数据的排列位置分为变量聚类(Variables)和样品(Cases)聚类两类.SPSS中的聚类分析按方法分为三种:两步聚类(TwoStepCluster)K类中心聚类(K-MeansCluster)系统聚类(HierarchicalCluster)第6页,课件共11页,创作于2023年2月系统聚类(HierarchicalCluster)的基本思想(1)相近的聚为一类(以距离表示);(2)相似的聚为一类(以相似系数表示);最短距离法(singlelinkage)最长距离法(completelinkage)中间距离法(medianmethod)可变距离法(flexiblemedian)重心法(centroid)类平均法(average)可变类平均法(flexibleaverage)Ward最小方差法(Ward’sminimumvariance)第7页,课件共11页,创作于2023年2月构造n个类,每个类包含且只包含一个样品。计算n个样品两两间的距离,构成距离矩阵,记作D0;合并距离最近的两类为一新类;计算新类与当前各类的距离。若类的个数等于1,转到步骤(5),否则回到步骤(3);画聚类图;决定类的个数,及各类包含的样品数,并对类作出解释。系统聚类的基本步骤第8页,课件共11页,创作于2023年2月聚类(cluster)分成几类?每个样品属于哪一类?判别(discriminate)已知分成几类;根据训练样品建立判别函数;根据判别函数对待判样品进行归类.聚类与判别的区别第9页,课件共11页,创作于2023年2月例:聚类分析.sav对11项血常规和生化指标进行聚类.选择聚类方式Cluster→Variables;选择要聚类的11个变量;设置其他需要的选项(可以采用默认值);第10页,课件共1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论