多元统计分析实验报告-聚类分析_第1页
多元统计分析实验报告-聚类分析_第2页
多元统计分析实验报告-聚类分析_第3页
多元统计分析实验报告-聚类分析_第4页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品资料武汉理工大学实 验(实训)报告项 目 名 称实验 2聚类分析所属课程名称多元统计分析项目类型设计性实验实验(实训)日期年月日班级学号姓名指导教师武汉理工大学统计学系制可编辑修改精品资料一、实验(实训)概述:【目的及要求】聚类分析的目的是将分类对象按一定规则分为若干类, 这些类不是事先给定的,而是根据数据的特征确定的。 在同一类里的这些对象在某种意义上倾向于彼此相似,而在不同的类里的对象倾向于不相似。按具体的题目要求完成实验报告,并及时上传到给定的FTP 和课程网站!【基本原理】系统聚类法是聚类分析中用的最多的一种,其基本思想是:开始将 n 个对象各自作为一类, 并规定对象之间的距离和类

2、与类之间的距离, 然后将距离最近的两类合并成一个新类, 计算新类与其它类之间的距离; 重复进行两个最近类的合并,每次减少一类,直至所有的对象合并为一类。【实施环境】(使用的材料、设备、软件)SPSS 等软件二、实验(实训)内容:【项目内容】聚类分析。【方案设计】共含两道题目 :第一题为基于距离矩阵的聚类分析;第二题为基于原始数据的聚类分析。三、指导教师评语及成绩:评语:成绩:指导教师签名:批阅日期:可编辑修改精品资料实验报告 2聚类分析 (设计性实验)实验原理:聚类分析的目的是将分类对象按一定规则分为若干类,这些类不是事先给定的,而是根据数据的特征确定的。 在同一类里的这些对象在某种意义上倾向

3、于彼此相似, 而在不同的类里的对象倾向于不相似。系统聚类法是聚类分析中用的最多的一种,其基本思想是:开始将n 个对象各自作为一类,并规定对象之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其它类之间的距离; 重复进行两个最近类的合并,每次减少一类, 直至所有的对象合并为一类。实验题目一:为了对 11 种语言英语、挪威语、丹麦语、荷兰语、德语、法语、西班牙语、意大利语、波兰语、匈牙利语及芬兰语进行比较研究,研究人员选取每种语言的 1至 10十个数字相应的单词列表分析。 对于同一数字, 某两种语言的第一个字母若相同,则称这两者在该数字上一致,否则非一致。将这11 种语言

4、两两比较后,计算每一对在十个数字上非一致的数目,得到下列距离矩阵:ENDaDuGFrSpIPHFiE0N20Da210Du7560G64550Fr666970Sp6659720I66597110P7761085340H98889101010100Fi99999999980可编辑修改精品资料( 1)对这 11 种语言分别用最小距离法( single linkage)、最大距离法(completelinkage )、平均距离法( average linkage)进行聚类分析;( 2)画出以上三种方法聚类分析结果的树状图;( 3)结合三种方法的树状图,你认为将 11 种语言分为哪几类比较合适?( 4

5、)用最大距离法将 11 种语言聚为 3 类,并将聚类结果存储在一个 SPSS 数据文件中。实验题目二:下表给出了 2010 年湖北省省各地区的人均各项消费支出情况。表 -1 :2010年湖北省各地区人均各项消费支出市(县)食品类衣着类家庭设备 医疗保健 交通和通 娱乐教育居住服务项目(代码)(元)(元)(元)(元)(元)(元)(元)(元)42013303645626.5444.1547.51079701442.942022985608845.1537590.51028706.7334.1420327445543806074968275823504204284362352945342466241

6、440542053033527851.1317.5403.21347612.9338420628853947484164511063746261420732516325424406759378543694208286450084158870992131438242093561566953.1463.1887.4967722.3434.3421026496671798372.3650.2844768.4541.74211243741013996714576348602234212237249779349340777443638942132200567708.6500.4781790.8606.5262.7实验要求:( 1)分别应用最小距离法 (single linkage)、最大距离法( complete linkage)、平均距离法( average linkage)对湖北省的 13 个城市进行聚类分析;( 2)画出以上三种方法聚类分析结果的树状图,比较异同;可编辑修改精品资料( 3)用最小距离法将 13 个城市聚为 3 类,并将聚类结果存储在一个 SPSS 数据文件中;( 4)对表 -1 中的人均各项消费支出进行聚类分析。可编辑修改精品资料实验题目一分析报告:1. 实验(实训)过程(步

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论