应用多元统计分析应用报告(DOC)_第1页
应用多元统计分析应用报告(DOC)_第2页
应用多元统计分析应用报告(DOC)_第3页
应用多元统计分析应用报告(DOC)_第4页
应用多元统计分析应用报告(DOC)_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、应用多元统计分析课程报告班级专业 :_ 市调 0901号 : 2009名:_ CYQ 成绩 :2010年10月 7日我国部分城市主要经济指标统计官方与民间数据差异分析 一、引言经济指标是反映一定社会经济现象数量方面的名称及其数值。 本题主要经济 指标包括人均 GDPx1(元)、人均工业产值 x2 (元)、客运总量 x3(万人)、货运 总量 x4 (万吨)、 x5 (亿元)、固定资产投资总额 x6 (亿元)、在岗职工占总人口 的比例 x7 ()、在岗职工人均工资额 x8 (元)、城乡居民年底储蓄余额 x9 (亿 元)。所以我们借助这一指标体系对我国部分城市的主要经济指标进行分析。 二、数据分析

2、过程1. 在 SPSS窗口中选择 Analyze Classify Hierachical Clus,ter调出 系统聚类分析主界面,并将变量 X 1X5移入 Variables 框中。在 Cluster 栏中选择 Cases 单选按钮,即对样品进行聚类(若选择 Variables,则对变量进行聚类) 。在 Display 栏中选择 Statistics 和 Plots 复选框,这样在结果输出窗口中可以同时得到聚类结果统计 量和统计图。2.3.点击 Statistics 按钮,设置在结果输出窗口中给出的聚类分析统计 量。这里我们选择系统默认值, 点击 Continue 按钮,返回主界面。点击

3、Plots 按钮,设置结果输出窗口中给出的聚类分析统计图。选中 Dendrogram 复选框和 Icicle 栏中的 None 单选按钮,即只给出聚类树形图, 而不给出冰柱图。 单击 Continue 按钮,返回主界面。104.点击 Method 按钮,设置系统聚类的方法选项。这里我们仍然均沿 用系统默认选项。单击 Continue 按钮,返回主界面。5.点击 Save按钮,指定保存在数据文件中的用于表明聚类结果的新 变量。 None 表示不保存任何新变量; Single solution 表示生成一个分类变量,在其后的矩形框中输入要分成的类数; Range of solutions 表 示

4、生成 多 个分类 变 量 。这 里我们 选 择 Range of solutions,并在后面的两个矩形框中分别输入 2 和 4,即生成三个 新的分类变量,分别表明将样品分为 2 类、3 类和 4 类时的聚类 结果。点击 Continue,返回主界面。6. 点击 OK 按钮,运行系统聚类过程从上面的树状图可以直接的观察到,如果用聚类分析将这些地区分为三类,则 24 深圳独自为一类, 10 上海和 16 厦门为一类,剩下的城市为一类三,K 值聚类分析过程1. 在 SPSS窗口中选择 Analyze Classify -MKeans Cluster,调出 K 均值聚类分析主界面,并将变量 移入 V

5、ariables 框中,将标志变 量 Region 移入 Label Case by 框中。在 Method 框中选择 Iterate classify,即使用 K-means 算法不断计算新的类中心,并替换旧的 类中心(若选择 Classify only,则根据初始类中心进行聚类,在聚 类过程中不改变类中心) 。如果不手工设置,则系统会自动设置初 始类中心,这里我们不作设置。2. 1. 在 SPSS窗口中选择 Analyze Classify -MKeans Cluster,调出K 均值聚类分析主界面,并将变量 移入 Variables 框中,将标志 变量 Region 移入 Label C

6、ase by 框中。在 Method 框中选择 Iterate classify,即使用 K-means 算法不断计算新的类中心,并替换旧的 类中心(若选择 Classify only,则根据初始类中心进行聚类,在聚 类过程中不改变类中心) 。如果不手工设置,则系统会自动设置初 始类中心,这里我们不作设置。3. 点击 Save按钮,设置保存在数据文件中的表明聚类结果的新变量。其中 Cluster membership选项用于建立一个代表聚类结果的变量, 默认变量名为 qcl_1; Distance from cluster center 选项建立一个新 变量,代表各观测量与其所属类中心的欧氏距

7、离。我们将两个复 选框都选中,单击 Continue 按钮返回。4. 点击 Options按钮,指定要计算的统计量。选中 Initial cluster centers 和 Cluster information for each case复选框。 这样,在输出窗口中将 给出聚类的初始类中心和每个观测量的分类信息,包括分配到哪 一类和该观测量距所属类中心的距离。单击 Continue 返回。5. 点击 OK 按钮,运行 K 均值聚类分析程序2. K 值聚类分析(1) 给出初始类中心给出每次迭代结束后类中心的变动。由图看出本次类聚过程共经历了三次迭代Cluster MembershipCaseN

8、umber城市ClusterDistance1北京22.541E42天津22.128E43石家庄32.400E34太原31.067E45呼和浩特31.154E46沈阳31.005E47大连32.215E48长春39.707E39哈尔滨38.512E310上海24.708E411南京21.722E412杭州21.173E413宁波21.626E414合肥31.056E415福州31.078E416厦门25.114E417南昌31.020E418济南31.403E419青岛22.293E420郑州33.591E321武汉38.584E322长沙35.487E323广州21.896E424深圳1.00025南宁31.466E426海口37.824E327重庆35.234E428成都36.332E429贵阳31.049E430昆明37.426E331西安35.635E332兰州31.215E433西宁31.761E434银川31.428E435乌鲁木齐31.282E4给出各观测量所属的类及所属中心的距离用 K 值聚类分析可以把这些城市被分为 3 类。第一类包括:深圳。第一类城市 人均 GD

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论