主成分分析和聚类分析_第1页
主成分分析和聚类分析_第2页
主成分分析和聚类分析_第3页
主成分分析和聚类分析_第4页
主成分分析和聚类分析_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、理学院 信息与计算科学专业 实验报告信 成绩【实验目的】(1)熟悉利用主成分分析进行数据分析,能够使用 SPSS软件完成数据的主成分分析;(2)熟悉利用聚类分析进行数据分析,能够运用主成分分析的结果,做进一步分析,如聚类分析、回归分析等,能够使用 SPSS软件完成该任务。【实验要求】根据各个题目的具体要求,分别运用 SPSS软件完成实验任务。【实验内容】1、表4.9(数据见 exercise4_5.txt)给出了1991年我国 30个省市、城镇居民的月平均/人)X1: 人均粮食支出;X3: 人均烟酒茶支出;X5:人均衣着商品支出;X7: 人均燃料支出;X2:人均副食支出;X4: 人均其他副食支

2、出;X6: 人均日用品支出;X8: 人均非商品支出。(1)求样本相关系数矩阵 R。(2)从 R出发做主成分分析,求出各主成分的贡献率及前两个主成分的累积贡献率;21)对题 1中的数据,按照原有的八个指标,对 30个省份进行聚类,给出分为 3类的聚类结果。(2)利用题 1得到的前 2平方距离,对样本进行谱系聚类分析,并画出谱系聚类图;给出分为 3类的聚类结果。并与(1)的结果进行比较【实验步骤】主要包括实验过程、方法、结果、对结果的分析、结论等)11)V5-.061V9.319V2V3V4V5V6V7V8V9.711.033.468.2801.000.417.702.835-.258.313-.

3、081.702-.139-.258-.171.313-.208-.0811.000.399.399.319.8351.000第页 共页2)表:方差贡献率和累计贡献率旋转平方和载入方差的 % 累积 %38.70429.59038.48568.294提取方法:主成份分析。由上图可知, 只有前两个成分的特征值大于1,所以只选择前两个主成分。第一个主成分的方差贡献率是38.704%,第二个主成分的方差贡献率是29.590%,前两个主成分的方差占所有主成分方差的64.294%。前两个主成分的累计贡献率为68.294%,选择前两个主成分即可代表绝大多数原来的变量。2最终聚类中心每个聚类中的案例数聚类10.

4、000118.000V2V3V4V5V6V7V8V910.382.00030.000.00070.376.76有效缺失16.7317.2918.563.0913.6311.5124.20由上图可知,聚类2包含样本数最多,聚类3包含样本数最少。通过中心聚类分析,可以对我国各地区生活中的人均支出类别情况有一个基本的了解。我们可以将不同地区的人均消费情况分为3类;其中第二类包含的省市最多,有18个,其他两类包含城市较少。通过分析结果也可知每个地区所属类别。第页 共页)按最短距离法(最近邻居距离)对样本进行谱系聚类分析群集 1 群集 2 下一阶1536613 10.4098 10.53910 11.7

5、304 12.46911 15.19414 17.53916 18.69818 19.26415 20.7785 22.7783 25.40717 27.95625 33.74819 37.41424 37.94512 38.07022 39.76523 47.43220 52.46826 64.04821 82.05327 82.06628 259.40929 300.22330 396.7751079141412131316151819192020232225242526272829010111213141516171819202122232425262728292120232425262

6、72810由聚类表可知聚类的具体过程。以第一步为例,样品 1 和 2 合并为一类,距离系数为 3.299,在“首次出现阶段集群”里显示为 0,因此合并两项都是第一次出现,合并结果取 15,即归为第 15 类。第页 共页11111111111111111111111111112310:宁夏11:新疆12:湖北13:云南14:湖南15:安徽16:贵州17:辽宁18:四川19:山东20:江西21:福建22:广西23:海南24:天津25:江苏26:浙江27:北京28:西藏29:上海30:广东3第页 共页第页 共页最长距离法(最远邻居距离)群集 1 群集 2 下一阶269155713 10.4097 1

7、2.2764 12.46910 15.29414 17.55916 18.69811 27.07718 27.95615 28.85525 33.74822 39.7658 40.8875 49.5203 67.77817 68.93127 82.06619 86.81723 102.21624 160.50320 219.10828 333.01330 396.77526 459.19529 821.70612 846.54021 3198.1298161015121217181822211617232024222726282627282929010111213141516171819202

8、1222324252627282922212328242526271第页 共页11111111111222222221333222223310:宁夏11:新疆12:湖北13:云南14:湖南15:安徽16:贵州17:辽宁18:四川19:山东20:江西21:福建22:广西23:海南24:天津25:江苏26:浙江27:北京28:西藏29:上海30:广东第页 共页类平均距离法(组间平均距离)第页 共页下一阶174714810.40912.46913.51217.54918.69821.70424.98127.95632.35032.65133.74839.76540.43747.82468.64574

9、.04174.824110.184126.926134.045197.455396.775453.036489.8471591.2271310111113181814172021241922232524252727292829010111213141516171819202122232425262728291719262320271224302128292427281261:山西2:内蒙古3:吉林4:黑龙江5:河南6:甘肃7:青海8:河北11111111第页 共页111111111111111111123310:宁夏11:新疆12:湖北13:云南14:湖南15:安徽16:贵州17:辽宁18:四川19:山东20:江西21:福建22:广西23:海南24:天津25:江苏26:浙江27:北京28:西藏29:上海30:广东第页 共页重心距离法下一阶14461389121112111613142316192120222524232625262729290101112131415161718192021222324252627282929129 1368.51827281:山西2:内蒙古3:吉林4:黑龙江5:河南

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论