用SPSS进行聚类分析PPT课件.ppt_第1页
用SPSS进行聚类分析PPT课件.ppt_第2页
用SPSS进行聚类分析PPT课件.ppt_第3页
用SPSS进行聚类分析PPT课件.ppt_第4页
用SPSS进行聚类分析PPT课件.ppt_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用SPSS进行聚类分析 广州大学地理科学学院蔡砥 参考文献 薛薇 统计分析与SPSS的应用 徐建华 计量地理学 1 前言 聚类分析实质是一种建立分类的方法 它能够将一批样本按照它们在性质 变量 上的亲疏程度在没有先验知识的情况下自动进行分类 这里 一个类就是一个具有相似性的个体的集合 不同类之间具有非相似性 聚类过程中 不必事先给出一个分类标准 聚类分析能够从样本数据出发 根据所采用的聚类方法产生分类标准 并且绘制处聚类的谱系图 2 层次聚类法 3 层次聚类法基本思想 层次累类的基本思想首先是 在聚类分析的开始 每个样本自成一类 然后 按照某种方法度量所有样本之间的亲疏程度 并把其中最亲密或称最相似的样本首先聚成一小类 接下来 度量剩余的样本和小类问的亲疏程度 并将当前最亲密的样本或小类再聚成一类 再按下来 再度量剩余的样本和小类 或小类和小类 间的亲疏程度 并将当前最亲密的样本或小类再聚成一类 如此反复 直到所有样本聚成一类为止 4 一个小例子 样本 小类 亲疏程度用距离来衡量 下面这个小例子用于展示不同的距离的计算方法 5 距离的衡量 1 假设两样本 x y 用k个变量来描述 6 距离的衡量 2 7 距离的衡量 3 另外 还有Pearson简单相关系数 即平时说的相关系数 还有夹角余弦COSINE x y 等 参见薛薇的 统计分析与SPSS的应用 8 距离矩阵 9 小类与小类间亲疏程度的度量 最短距离法 NearestNeighbor 参见徐建华 计量地理学 最长距离法 FurthestNeighbor 参见徐建华 计量地理学 组间平均连锁法 Between groupsLinkage 组内平均连锁法 Within groupsLinkage 重心法 Centroidclustering 离差平方和法 Ward sMethod 10 组间平均连锁法 Between groupsLinkage 11 组内平均连锁法 Within groupsLinkage 12 2020 1 27 13 重心法 Centroidclustering 14 离差平方和法 Ward sMethod 15 聚类的步骤 分析研究对象 明确若干相关变量 指标 收集变量对应的样本数据 对数据进行预处理 比如填补缺失值 对变量进行标准化 开展聚类分析 形成聚类谱系图 对结果开展分析讨论 16 例子 农业区的聚类 17 数据 21个农业区 18 标准化 在Descriptives 中可标准化 19 聚类 20 关于参数选择的一些解释 21 关于Method按钮中距离计算的说明 22 结果判读 聚集表 23 结果判读 垂直冰柱图 从最后一行观察起 第9和第10个Case中间有一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论