多元统计分析作业一(第三题)_第1页
多元统计分析作业一(第三题)_第2页
多元统计分析作业一(第三题)_第3页
多元统计分析作业一(第三题)_第4页
多元统计分析作业一(第三题)_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上精选优质文档-倾情为你奉上专心-专注-专业专心-专注-专业精选优质文档-倾情为你奉上专心-专注-专业课 程 名 称: 多元统计回归分析 实 验 项 目:边远及少数民族聚居区和会经济发展水平实 验 类 型: 验证性 学 生 学 号: 学 生 姓 名: 学 生 班 级: 课 程 教 师: 实 验 日 期: 2016-03-28 1.实验目的: 利用spss软件验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。2.实验内容: 现选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省区。选取人均GDP、第三产业比重、人均消费支出、人

2、口自然增长率及文盲半文盲人口占15岁以上人口等五项能够较好的说明各地区社会经济发展水平的指标,验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。边远及少数民族聚居区社会经济发展水平的指标数据地区人均GDP(元)三产比重(%)人均消费(元)人口增长(%)文盲半文盲(%)内蒙古506831.121418.2315.83广西407634.220409.0113.32贵州234229.8155114.2628.98云南435531.3205912.125.48西藏371643.5155115.957.97宁夏427037.3194713.0825.56新疆622935.4274

3、512.8111.44甘肃345632.8161210.0428.65青海436740.9204714.4842.92资料来源:中国统计年鉴(1998),北京,中国统计出版社,1998。五项指标的全国平均水平为: 3.实验步骤及结果:解:(1)先利用SPSS软件检验各变量是否遵从多元正态分布(见输出结果1-1)输出结果1-1正态性检验Kolmogorov-SmirnovaShapiro-Wilk统计量DfSig.统计量dfSig.人均GDP.2199.200*.9589.781三产比重.1459.200*.9259.437人均消费.2099.200*.8739.131人口增长.1509.200

4、*.9499.682文盲半文盲.2469.124.8989.242*. 这是真实显著水平的下限。a. Lilliefors 显著水平修正上表给出了对每一个变量进行正态性检验的结果,因为该例中样本数n=9,所以此处选用Shapiro-Wilk统计量。则Sig.值分别为0.781、0.437、0.131、0.682、0.242均大于显著性水平,由此可以知道,人均GDP、三产比重、人均消费、人口增长、文盲半文盲这五个变量组成的向量均服从正态分布,即我们认为这五个指标可以较好对各地区社会经济发展水平做出近似的度量。(2)提出原假设及备选假设(3)做出统计判断,最后对统计判断作出具体的解释SPSS的GL

5、M模块可以完成多元正态分布有关均值与方差的检验。依次点选AnalyzeGeneral Linear ModelMultivariate进入Multivariate对话框,将人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等这五项指标选入Dependent列表框,将分类指标选入Fixed Factor(s)框,点击OK运行,则可以得到如下结果(见输出结果1-2)。输出结果1-2主体间因子值标签N分类1.00边远及少数民族聚居区社会经济发展水平92.00全国经济平均发展水平1多变量检验a效应值F假设 df误差 dfSig.截距Pillai 的跟踪.99081.

6、986b5.0004.000.000Wilks 的 Lambda.01081.986b5.0004.000.000Hotelling 的跟踪102.48281.986b5.0004.000.000Roy 的最大根102.48281.986b5.0004.000.000分类Pillai 的跟踪.8344.029b5.0004.000.101Wilks 的 Lambda.1664.029b5.0004.000.101Hotelling 的跟踪5.0374.029b5.0004.000.101Roy 的最大根5.0374.029b5.0004.000.101a. 设计 : 截距 + 分类b. 精确统

7、计量上面第一张表是样本数据分别来自边远及少数民族聚居区社会经济发展水平、全国的个数。第二张表是多变量检验表,该表给出了几个统计量。由Sig.值可以看到,无论从哪个统计量来看,两个分类的经济发展水平是无显著差别的。实际上,GLM模型是拟合了下面的模型: 式中(人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲)分类上面多变量检验表实际上是对该线性模型显著性的检验,此处有常数项是因为不能肯定模型过原点。而模型没有通过显著性检验,意味着分类中的不同取值对Y的取值无显著影响,也就是说,不同分类的经济发展水平是相同的。但是,在实际中,我们往往更希望知道差别主要来自哪些分类,或者不同分类经

8、济发展水平的比较。对此,对GLM模块的选项作如下设置:在GLM主对话框中点击Contrasts按钮进入Contrasts对话框,在Change Contrasts框架中打开Contrasts右侧的下拉框并选择Simple,此时下侧的Reference Category被激活,默认是Last被选中,表明边远及少数民族聚居区社会经济发展水平与全国平均发展水平作比较,点击Change按钮,Continue继续,OK进行,得到如下结果(见输出结果1-3)输出结果1-3对比结果(K 矩阵)分类 简单对比a因变量人均GDP三产比重人均消费人口增长文盲半文盲级别 1 和级别 2对比估算值-2003.2322

9、.274-1006.1112.71212.014假设值00000差分(估计 - 假设)-2003.2322.274-1006.1112.71212.014标准 误差1129.2654.912395.8602.76115.688Sig.114.656.035.355.466差分的 95% 置信区间下限-4607.321-9.053-1918.967-3.655-24.162上限600.85713.602-93.2569.07948.190a. 参考类别 = 2见输出结果1-3表示(1)在显著性水平的水平下,可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466,由此我

10、们可以知道边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均消费存在显著差别,即全国的平均人均消费大于边远及少数民族聚居区人均消费,相差值为1006.111元。人均GDP、三产比重、人口增长率、文盲半文盲等指标无明显差别。(2)在显著性水平的水平下,可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466均大于显著性水平,我们可以看出边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均GDP、三产比重、人均消费、人口增长率、文盲半文盲等指标无明显差别。输出结果1-4多变量检验结果值F假设 df误差 dfSig.Pillai 的跟踪.8344.02

11、9a5.0004.000.101Wilks 的 lambda.1664.029a5.0004.000.101Hotelling 的跟踪5.0374.029a5.0004.000.101Roy 的最大根5.0374.029a5.0004.000.101a. 精确统计量4.实验结果(或心得体会):通过实验,得出输出结果1-4是上面多重比较可信性的度量,并且由Sig.值可以让我们看到,比较检验是可信的。利用spss可将多指标数据进行良好的分析。5.指导教师点评(总分100分,所列分值仅供参考,以下部分打印时不可以断页)实验内容出色完成30分良好完成25分基本完成20分部分完成15分初步完成5分实验步骤精益求精30分比较完善25分合乎要求20分缺少步

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论