基于SPSS多元统计分析报告_第1页
基于SPSS多元统计分析报告_第2页
基于SPSS多元统计分析报告_第3页
基于SPSS多元统计分析报告_第4页
基于SPSS多元统计分析报告_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

部分省会城市和计划单列市主要经济指标的多元统计分析小组成员:崔媛、孔燕华、黄睿、邱明、谷红蕊、李亮报告人:崔媛

时间

2009年12月16号研究目的:.探究青岛市、广州市、太原市的城市生活水平及其在全国省会及计划单列市的城市生活水平中的位置研究方法:因子分析、聚类分析、判别分析资料来源:统计年鉴摘要

为研究青岛市、广州市和太原市在全国省会城市和计划单列市的城市生活水平中的位置,我们以《统计年鉴》(2007年)中省会城市及计划单列市主要经济指标为基础,随机剔除5个样本后,首先对剩余样本进行因子分析做降维处理,利用特征向量实现原指标值向几个主要指标的转换;然后将除青岛市、广州市和太原市之外的城市利用Ward法进行聚类分析,将指标分成3类,最后利用判别分析实现这三个城市生活水平的判别。关键词

城市生活水平因子分析聚类分析判别分析原始数据如下:从上面的数据,我们可以看到统计的指标很多,不便于分析

做出指标的相关系数矩阵进一步观察如下:

因此,我们可以利用因子分析将相关性很大的指标综合为数量较少的几个因子利用spss软件实现,其中各输出及统计量等的选择如下: 描述统计量:单变量描述性、原始分析结果 相关阵:系数、KMO和Bartlett的球形检验 抽取方法:主成分 分析:相关性矩阵 输出:未旋转的因子解 抽取:因子的固定数量3

旋转方法:最大方差法 输出:旋转解、载荷图 得分保存为变量:回归 显示因子得分系数矩阵 缺失值使用均值替换结果如下:

各个变量的数字特征描述如下:相关矩阵

年底总人数 地区生产总值 客运量 货运量 固定资产投资总额 城乡居民储蓄 在岗职工平均工资 邮局数 社会商品零售总额 货物进出口总额 剧场影剧院数 高校学生人数 医院卫生院个数 环境污染治理投资总额 相关 年底总人数 1.000 .459 .870 .670 .692 .484 .000 .928 .530 .140 .466 .471 .854 .386

地区生产总值 .459 1.000 .307 .756 .895 .964 .671 .505 .975 .890 .775 .392 .306 .742

客运量 .870 .307 1.000 .522 .532 .275 -.013 .896 .354 .078 .230 .303 .733 .145

货运量 .670 .756 .522 1.000 .806 .689 .336 .599 .718 .514 .517 .385 .467 .824

固定资产投资总额 .692 .895 .532 .806 1.000 .893 .498 .639 .924 .625 .741 .568 .514 .679

城乡居民储蓄 .484 .964 .275 .689 .893 1.000 .669 .509 .979 .825 .813 .435 .393 .705

在岗职工平均工资 .000 .671 -.013 .336 .498 .669 1.000 .098 .625 .726 .526 .042 .119 .524

邮局数 .928 .505 .896 .599 .639 .509 .098 1.000 .541 .312 .445 .284 .845 .290

社会商品零售总额 .530 .975 .354 .718 .924 .979 .625 .541 1.000 .805 .820 .523 .378 .682

货物进出口总额 .140 .890 .078 .514 .625 .825 .726 .312 .805 1.000 .627 .090 .059 .592

剧场影剧院数 .466 .775 .230 .517 .741 .813 .526 .445 .820 .627 1.000 .360 .376 .538

高校学生人数 .471 .392 .303 .385 .568 .435 .042 .284 .523 .090 .360 1.000 .241 .314

医院卫生院个数 .854 .306 .733 .467 .514 .393 .119 .845 .378 .059 .376 .241 1.000 .242

环境污染治理投资总额 .386 .742 .145 .824 .679 .705 .524 .290 .682 .592 .538 .314 .242 1.000 可以看出KMO值达到了0.748>0.5

通过了检验可见:特征值的累计贡献率已前三个达到85.745%。所以取前三个特征值所对应的特征向量如下:

第一特征向量U1第二特征向量U2第三特征向量U30.25370.40050.02360.3255-0.1906-0.01900.19440.4383-0.15710.29250.04940.08950.33270.00300.14000.3245-0.17070.00620.1970-0.3452-0.32120.25260.3637-0.25230.3308-0.13770.08640.2504-0.3264-0.26040.2768-0.12190.00350.17370.09820.79180.20480.3864-0.24950.2586-0.16960.1248旋转前的成分矩阵如下:这样并不好清晰地把各变量归并重新命名,旋转后的成分矩阵如下:针对原始变量的更直观变量的因子分析结果如下图:由成分转换矩阵可见,每个因子只有少数几个指标的因子载荷较大,因此可据上表进行分类,将14个指标按高载荷分成三类,列于下表:高载荷指标意义1X2:地区生产总值X4:货运量X5:固定资产投资总额X6:城乡居民储蓄余额X7:在岗职工平均工资X9:社会商品零售总额X10:货物进出口总额X11:剧场影院数X14:环境治理投资总额基本经济指标2X1:年底总人口X3:客运量X8:年末邮政局数X13:医院、卫生院数生产生活规模3X13:普通高等学校在校学生数教育情况另外,我们还得到了碎石图如下:第一特征向量U1第二特征向量U2第三特征向量U30.25370.40050.02360.3255-0.1906-0.01900.19440.4383-0.15710.29250.04940.08950.33270.00300.14000.3245-0.17070.00620.1970-0.3452-0.32120.25260.3637-0.25230.3308-0.13770.08640.2504-0.3264-0.26040.2768-0.12190.00350.17370.09820.79180.20480.3864-0.24950.2586-0.16960.1248这样,通过因子分析,我们将14个有相关关系的指标用三个主成分进行重新解释特征向量如下:则可以用主成分表示如下:F1=0.2537X1+.03255X2+……+0.2586X14F2=0.4005X1-0.1906X2+……-0.1696X14F3=0.0236X1-0.019X2+……+0.1248X14这样,我们把原来14个指标转换成了3个成分现在对指标进行聚类分析利用

离差平方合法(Ward)法进行

聚类分析结果如下:冰柱图:树状图:新变量的数字特征:从上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论