




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、课 程 设 计 报 告课程名称 多元统计分析 专 业 统 计 学 班 级 统计学1101 学 号 姓 名 指导教师 2013年 11 月 11 日课 程 设 计 任 务 书课程名称 多元统计分析 课 题 专业班级 统计学1101 学生姓名 学 号 指导老师 审 批 任务书下达日期 2013 年 11 月 11日任务完成日期 2013年 11 月 24 日本页不打印附:课程设计报告装订顺序:封面、任务书、目录、正文、评分 正文的格式:一级标题用4号黑体,二级标题用小四号宋体加粗,正文用小四号宋体;行距为22。正文的内容:一、课题的调查方案;二、问卷设计;三、收集数据;四、分析报告;五、总结;六、
2、附件(原始数据、图表)。正文总字数要求在5000字以上(不含图表)。三号,黑体目 录四号,黑体,行距22磅一级标题一(一 源数据)【对应页码】小四号,宋体,加粗 二级标题一级标题二(二 统计分析过程及分析)二级标题一级标题三(三 结合实际解释说明结果)二级标题参考文献(附在课程设计分析报告后)总结评分标准目录顺序即装订顺序。注:括号内的说明是参考的报告的书写内容,标题可以自己修改目 录一源数据 1.1 聚类分析数据说明 1.2 主成分分析数据说明二 统计分析过程及分析2.1 聚类分析2.2 主成分分析三结合实际解释说明结果 参考文献总结评分标准一源数据1.1 聚类分析数据说明 对全国主要城市消
3、费能力与水平(2013年)进行聚类分析,选取36个主要城市为代表,记录包括家庭设备用品及维修服务()、医疗保健和个人用品消费()、居住()、粮食()、娱乐教育文化用品及服务()、水产品()、蛋()、食品()、交通和通信()、消费价格指数()、烟酒及用品()、鲜果()、衣着()、肉禽及其制品()、鲜菜()15个消费价格指数(上年同期为100)。1.2 主成分分析数据说明 考察全国省会城市和计划单列市的经济发展状况,衡量比较了36个城市包括年末总人口()、地区生产总值()、客运量()、货运量()、地方财政预算内收入()、地方财政预算内支出()、固定资产投资总额()、城乡居民储蓄存款年末余额()、在
4、岗职工平均工资()、年末邮政局数()、年末固定电话用户数()、社会消费品零售总额()、货物进出口总额()、年末实有公共(汽)电车运营车辆数()、剧场影剧院数()、普通高等学校在校生数()、医院卫生所数()、执业(助理)医师数()、工业废水排放量()等19项指标变量,作主成分分析。二 统计分析过程及分析2.1 聚类分析2.1.1 方法与步骤1.数据预处理 第 个样本的第个变量为,第个变量的均值为,标准差为,对数据进行标准化变换,消除量纲的影响。 其中,均值 标准差: 标准化变换:2衡量样本间的距离 采用明氏距离中的欧氏距离的平方衡量。明氏距离:当时, 即欧式距离。 3分类方法采用离差平方和法(w
5、ard法) 将个样本分为类:用表示中的第个样本,表示中的样本个数,是的重心,则中的样本的离差平方和为:个类的类内离差平方和为:2.1.2 软件运行结果用SPSS运行后得到结果树状图图一:图一:聚类分析的结果2.2 主成分分析2.2.1 计算步骤与方法1.样本资料阵为:则样本斜差阵和样本相关阵分别为:其中: 2.2.2 软件运行结果1KMO 和 Bartlett 的检验结果见表一:表一:KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.854Bartlett 的球形度检验近似卡方1230.372df171Sig.000其中:KMO检验为0.854&g
6、t;0.6,通过检验;Bartlett的检验p值小于0.05,通过检验,说明变量之间存在一定的相关性,可以做主成分分析。2.SPSS得到表二成分矩阵,可由此求出特征根与单位特征向量(表三)。 表二:成份矩阵1 2 3 X10.692 0.685 -0.073 X20.963 -0.148 0.101 X30.688 0.035 -0.574 X40.780 0.371 0.244 X50.948 -0.212 0.045 X60.963 -0.063 -0.021 X70.785 0.429 0.085 X80.948 -0.242 0.049 X90.757 -0.519 0.209 X10
7、0.711 0.428 -0.430 X110.979 -0.138 0.036 X120.956 -0.141 0.140 X130.784 -0.556 -0.132 X140.784 -0.401 -0.274 X150.755 -0.247 0.030 X160.466 0.384 0.429 X170.656 0.673 -0.172 X180.923 0.112 -0.092 X190.545 0.147 0.540 12.37572.57851.2732 表三:单位特征向量0.196708 0.426589 -0.064696 0.273742 -0.092168 0.08951
8、0 0.195571 0.021797 -0.508702 0.221722 0.231043 0.216243 0.269478 -0.132025 0.039881 0.273742 -0.039234 -0.018611 0.223144 0.267163 0.075330 0.269478 -0.150707 0.043426 0.215184 -0.323211 0.185224 0.202108 0.266540 -0.381083 0.278290 -0.085941 0.031905 0.271752 -0.087809 0.124074 0.222859 -0.346253
9、-0.116984 0.222859 -0.249726 -0.242830 0.214616 -0.153821 0.026587 0.132465 0.239139 0.380197 0.186474 0.419116 -0.152433 0.262371 0.069749 -0.081534 0.154921 0.091545 0.478570 因此,前三个主成分为:第一个主成分:第二个主成分:第三个主成分:3. 将各城市数据代入可求得各城市主成分得分(表五)并进行排序(图二)。 表四:各城市的主成分得分 北京 10.46656-3.10502-1.6528119.4206 天津 3.3
10、711490.9251410.26846144.44761 石家庄 -0.796221.1480120.475812-6.28793 太原 -2.32494-0.33503-0.144-29.82呼和浩特 -3.14285-0.64399-0.15005-40.7466 沈阳 0.0051750.111422-0.006790.342686 大连 -0.02868-0.009261.1587671.09657 长春 -1.421720.239851-0.18734-17.2149哈尔滨 -0.55790.82965-0.37347-5.24063 上海 10.03059-2.069912.40
11、4607121.86 南京 0.740324-0.042971.5738311.05503 杭州 1.337153-0.300311.68186517.91522 宁波 -0.12827-0.77290.220593-3.29951 合肥 -1.061450.782527-0.11287-11.2622 福州 -1.47638-0.03847-0.24274-18.6795 厦门 -2.29493-1.168580.730636-30.4843 南昌 -2.368590.1080780.251703-28.7138 济南 -1.163530.3250080.49019-12.9374 青岛 -
12、0.1709-0.056460.038418-2.21167 郑州 -0.551111.0409540.426269-3.59353 武汉 1.2491310.7100461.69732619.45075 长沙 -0.467320.860686-0.54717-4.26086 广州 3.953812-0.549431.72429149.70991 深圳 3.928418-3.59514-3.5819434.78649 南宁 -2.10820.3969890.210193-24.7993 海口 -3.67878-0.80404-0.84232-48.6731 重庆 7.3654656.65914
13、4-2.01512105.7576 成都 2.0351471.825787-0.7890828.88946 贵阳 -2.748640.005578-0.80945-35.0325 昆明 -1.520010.422175-0.31826-18.1279 拉萨 -3.47359-1.10478-0.5052-46.48 西安 -0.021640.972560.446222.808047 兰州 -3.12567-0.28748-0.2255-39.7107 西宁 -3.64319-0.60419-0.81052-47.6769 银川 -3.42517-1.04095-0.13059-45.2392乌
14、鲁木齐 -2.78323-0.83471-0.35397-37.0474由各城市的最终主成分得分可得出以经济指标为依据的各城市经济状况的排序: 图二:各城市经济状况排序 由图 ,上海、北京重庆、广州等排名靠前,与实际状况相符。三结合实际解释说明结果3.1 聚类分析结果第一类:海口、上海、广州、成都、深圳、合肥、南京、南宁、福州、长沙、天津、北京、贵州、长春、厦门、济南,多为省会城市与沿海发达城市,物价水平高,居民消费选择多消费量大,费价格指数高第二类:太原、西安、重庆、昆明、宁波、武汉、杭州、郑州、大连、兰州、沈阳、南昌、青岛、哈尔滨、石家庄,多为内陆城市,物价水平中等,消费价格指数中等。第三
15、类:乌鲁木齐、银州、西宁、呼和浩特、拉萨,多为西北部落后地区,物价水平低,居民消费量小,消费价格指数低。3.2 主成分分析结果在第一主成分的表达式中第二、五、六、八、十一、十二、十五、十八项指标的系数较大,这三个指标起主要作用,可以将第一主成分看成是由地区生产总值,地方财政预算内收入,地方财政预算内支出,年末固定电话用户数,剧场影院,社会消费品零售总额执业医师数所刻画的反映经济发展状况的综合指标。在第二主成分的表达式中第一、四、七、九、十三、十四、十七项指标的影响大,且一和十七的影响尤其大,可看成由年末总人数,货运量,固定资产投资总额,在岗职工平均工资,货物进出口总额,年末实有公共电(汽)车运营车辆数和医院卫生院数所刻画的反映经济发展状况的综合指标。在第三主成分的表达式中第三、十、十六、十九项指标的影响大,可看成由客运量,年末邮政局数,普通高等学校在校学生数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论