




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
聚类分析与判别分析第一页,共十二页,编辑于2023年,星期一10.1聚类分析概述
聚类分析的意义聚类分析说明第二页,共十二页,编辑于2023年,星期一10.1.1聚类分析的意义
聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类分析,所得到的聚类数未必一致。因此,这里所说的聚类分析是一种探索性的分析方法。对个案的聚类分析类似于判别分析,都是将一些观察个案进行分类。聚类分析时,个案所属的群组特点还未知。即,在聚类分析之前,研究者还不知道独立观察组可以分成多少个类,类的特点也无所得知。变量的聚类分析类似于因素分析。两者都可用于辨别变量的相关组别。不同在于,因素分析在合并变量的时候,是同时考虑所有变量之间的关系;而变量的聚类分析,则采用层次式的判别方式,根据个别变量之间的亲疏程度逐次进行聚类。10.1.2聚类分析说明聚类分析的方法主要有两种,一种是“快速聚类分析”;另一种是“层次聚类第三页,共十二页,编辑于2023年,星期一分析”。如果观察值的个数多或文件非常庞大,则宜使用快速聚类分析方法。因为观察值数目巨大,层次聚类分析的两种判别图形会过于分散,不容易解释。判别分析是一种有效的对个案进行分类分析的方法。和聚类分析不同的是,判别分析时,组别的特征已知。如银行为了对贷款进行管理,需要预测哪些类型的客户可能不会按时归还贷款。已知过去几年中,900个客户的贷款归还信誉度,据此可以将各户分成两组:可靠客户和不可靠客户。再通过收集客户的一些资料,如年龄、存款、收入等,将这些资料作为自变量,通过判别分析,建立判别函数。那么,如果有200个新的客户提交贷款请求,就可以利用刚建好的判别函数,对新的客户进行分析,从而判别新的客户是属于可靠客户类还是不可靠客户类。第四页,共十二页,编辑于2023年,星期一10.2层次聚类
层次聚类Q型聚类
层次聚类Q型聚类应用实例
层次聚类R型聚类层次聚类R型聚类应用实例第五页,共十二页,编辑于2023年,星期一10.2.1层次聚类Q型聚类层次聚类分析中的Q型聚类可使具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析。层次聚类分析中,测量样本之间的亲疏程度,一种是样本数据与小类,小类与小类之间的亲疏程度。样本数据之间的亲疏程度主要通过样本之间的距离、样本间的相关系数来度量。SPSS根据变量数据类型的不同,采用不同的测定亲疏程度的方法。10.2.2层次聚类Q型聚类应用实例
经调查得知某班8个学生入学时的语文成绩和中期测试语文成绩,现要求对这8名学生的语文成绩进行聚类,聚类的依据是入学语文成绩和第一次考试的语文成绩。第六页,共十二页,编辑于2023年,星期一10.2.4层次聚类R型聚类层次聚类R型聚类是对研究对象的观察变量进行分类,它使具有共同特征的变量取在一起,以便可以从不同类中分别选出具有代表性的变量作为分析,从而减少分析变量的个数。其计算公式与Q型聚类计算公式相似,不同的是R型聚类是对变量进行距离的计算,Q型聚类是对样本间进行距离的计算。10.2.5层次聚类R型聚类应用实例该例可以借用层次聚类Q型聚类的实例,分析某班级中语文成绩、数学成绩、化学成绩和外语成绩四门,哪些课程属于同一个类。第七页,共十二页,编辑于2023年,星期一10.3快速聚类快速聚类分析的概念快速聚类分析的计算过程及公式快速聚类分析应用实例第八页,共十二页,编辑于2023年,星期一快速聚类分析的计算过程如下:10.3.1快速聚类分析的概念快速聚类分析是由用户指定类别数的大样本资料的逐步聚类分析。它先对数据进行初始分类,然后逐步调整,得到最终分类。快速聚类分析的实质是K-Mean聚类。和层次聚类分析一致,快速聚类分析也以距离为样本间亲疏程度的标志。但两者的不同在于:层次聚类可以对不同的聚类类数产生一系列的聚类解,而快速聚类只能产生固定类数的聚类解,类数需要用户事先指定。另外,在快速聚类分析中,用户可以自己指定初始的类中心点。如果用户的经验比较丰富可以指定比较合理的初始类点,否则,需要增加迭代的次数,以保证最终聚类结果的准确性。10.3.2快速聚类分析的计算过程及公式在SPSS中确定个类的初始类中心点。SPSS会根据样本数据的实际情况,选择个由代表性的样本数据作为初始类中心。初始类中心也可以由用户自行指定,需要指定组样本数据作为初始类中心点。
1.指定聚类的类数第九页,共十二页,编辑于2023年,星期一
2.确定中心点接着,SPSS重新确定个类的中心点。SPSS计算每个变量的变量值均值,并以均值点作的类中心点;最后重复上面的两步计算过程,直到达到指定的迭代次数或终止迭代的判断要求为止。10.3.3快速聚类分析应用实例本实例调查了全国10个学校的校风、校纪、领导角色和教师态度4个指标,希望使用快速聚类分析将这10个学校按照其各自的特点分成4种类型。第十页,共十二页,编辑于2023年,星期一10.4判别分析判别分析的概念判别分析应用实例第十一页,共十二页,编辑于2023年,星期一判别分析先根据已知类别的事物的性质建立函数式,然后对未知类别的新事物进行判断以将之归入已知的类别中。在判别分析中有如下假定:预测变量服从正态分布。预测变量之间没有显著的相关。观测变量的平均值和方差不相关。预测变量之间的相关性在不同类中是一样的。10.4.1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 办公室项目管理简明教程
- 2024年秋九年级化学下册 第七章 溶液 7.3 溶液浓稀的表示 7.3.3 溶质质量分数的综合计算教学实录 (新版)粤教版
- 1 春夏秋冬 教学设计-2024-2025学年统编版语文一年级下册
- 红酒基本知识培训
- 2024-2025学年新教材高中物理 微专题三 共点力平衡中的四类典型问题教学实录 新人教版必修第一册
- 2024年八年级生物上册 4.4.1《遗传的物质基础》教学实录 (新版)济南版
- 找春天教学设计教案
- 2024-2025学年高中化学下学期第八周 乙醛教学实录
- 20 雾在哪里(教学设计)2024-2025学年部编版语文二年级上册
- 2024年秋九年级历史上册 第21课《日本明治维新》教学实录 中图版
- 有机化学(第9版)第四章 烷烃与环烷烃
- JJF 1496-2014声源识别定位系统(波束形成法)校准规范
- GB/T 6478-2015冷镦和冷挤压用钢
- JB-T 501-2021 电力变压器试验导则
- GB/T 16474-2011变形铝及铝合金牌号表示方法
- 【课件】细胞呼吸的原理和应用(第1课时)说课-2021-2022学年高中生物必修1
- 教学讲解课件-杜鹃花
- 护理查对制度-课件
- 设备清单-15年物联网智慧生活实训平台专业版
- 汉字偏旁部首表及例字
- 平安银行“感恩10年·一路有你”十周年庆典活动概念案
评论
0/150
提交评论