地理建模原理实验报告_第1页
地理建模原理实验报告_第2页
地理建模原理实验报告_第3页
地理建模原理实验报告_第4页
地理建模原理实验报告_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、地理建模原理实验报告 地理建模原理实验 报告 学 学 号 号: : xx20310262 姓 姓 名 名: : 高义丰 班 班 级 级: : 1223102 专 专 业: 地理 信息系统 指导 老师: 陵南燕 xx 年 年 6 月 月 27 日 日 目录 一、实习工程 . 3 二、实习目的 . 3 三、实习内容 . 3 1、简单相关分析 . 3 2、偏相关 . 5 3、距离过程 . 6 4、因子分析 . 7 5、回归分析 . 9 6、多元线性回归 . 11 7、时序分析 . 12 8、实习总结 . 15 一、实习工程 1. 学习 spss 软件,学会如何该软件进行因子分析与回归分析(课堂);

2、2. 学习 spss 软件,学会如何该软件随机时序分析(课堂); 3. 利用 spss 软件,完成数据文件里的一系列操作。 二、实习目的 在实习后根据老师讲解的内容能够对 spss 软件有所了解并能够掌握如何用统计软件进行相关分析、因子分析和回归分析等用实习数据完成此类实习操作,相关分析与回归分析有相关系数、相关分析与偏相关分析、距离分析。 三、实习内容 1、 、 简单相关分析 在进行相关分析时,散点图是重要的工具,分析前应先做散点图,以初步确定两个变量间是否存在相关趋势,该趋势是否为直线趋势,以及数据中是否存在异常点。否那么可能的出错误结论。 输入数据后,依次单击 graphsscatter

3、plot 散点图 确定两个变量间是否存在相关趋势,该趋势是否为直线趋势 bivariate 相关分析的步骤: (1)输入数据后,依次单击 analyzecorrelatebivariate,翻开 bivariate correlations对话框。 如图翻开双变量相关后在点选项就会得到结果图右边结果,如图设置即可得到结果 结果分析: 描述性统计量表,如下: 从表中可看出, pearson 相关系数为 0.865,即小鸡的体重与鸡冠的相关系数为 0.865,显著性水平是 0.01,这两者之间不相关的双尾检验值为 0.001。从统计结果可得到,小鸡的体重与鸡冠重之间存在正相关关系,当小鸡的体重越大

4、时,那么小鸡的鸡冠越重。并且,否认了小鸡的体重与鸡冠重之间不相关的假设。 2 、偏相关 当有多个变量存在时,为了研究任何两个变量之间的关系,而使与这两个变量有联系的其它变量都保持不变。即控制了其它一个或多个变量的影响下,计算两个变量的相关性。偏相关系数是用来衡量任何两个变量之间的关系的大小。 选择 analyzecorrelatepartial 翻开偏相关,如下: 在统计学中,自由度(df)指的是计算某一统计量时,取值不受限制的变量个数。通常 df=n-k。其中 n 为样本含量,k 为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。自由度通常用于抽样分布中。 结果分析:在

5、固定变量 x2 下 y 与 x1 的偏相关系数为 0.9483 在 a=0.001 下线性关系显著。 3 、距离过程 程 距离相关分析是:对观测量之间或变量之间相似或不相似的程度的一种测量,可用于同一变量内部各个取值间,以考察其相互接近程度;也可以用于变量间,以考察预测测值对实际值的拟合优度。 距离相关分析的结果给出的是个变量或记录之间的距离大小,以供用户自行判断相似性。 选择 analyzecorrelatedistances 距离分析 设置如下图点击确定就可以到达结果: proximity matrix correlation between vectors of values h1 h2

6、 h3 h1 1.000 .573 .731 h2 .573 1.000 .088 h3 .731 .088 1.000 this is a similarity matrix 三次测量结果的相关系数矩阵。第一次测量与第二次测量结果的 r = 0.573,第一次测量与第三次测量结果的 r = 0.731,第二次测量与第三次测量结果的 r = 0.088,由此可见,后两次测量的结果一致性较差,这意味着第一次恰好是后两次的“均值”,故对该指标作重复测量意义不大。 4 、因子分析 因子分析的根本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比拟密切的几个变量归在同一类中,每一类变量就

7、成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量,这与聚类分析不同),以较少的几个因子反映原资料的大局部信息。 选择analyze=>data reduction=>factor,显示的factor analysis 结果分析: 共同度(公共因子方差),共同度越大表示 xi 对因子的共同依赖程度越大,因子描述变量越有效。 两个因子对所有变量的共同度都很大,在 0.880 到 0.988 之间。 从结果可以看出五个变量在第一个因子上都具有大的正负荷,尤其是 x4 的负荷特别大。在第二个因子上变量 x1 和 x3 都有较大的正负荷,x2 和 x5 都有较大的负荷,

8、x1、x3 和 x2、x5 形成了鲜明的对照,而在 x4 上的负荷非常小。 因子得分:对公共因子的取值进行估计,计算各个样本的公共因子得分。在公共因子的空间中,按照各个样本的因子得分值标出其对应的位置。 结果如以下图所示: 5 、回归分析 如果在研究变量之间的相关关系时,把其中的一些因素作为所控制的变量(自变量),而另一些随机变量作为它们的因变量,这种关系分析就称为回归分析。 ( (1) ) 一元线性回归 选择主菜单analyze=>regression=>linear翻开线性回归 因变量为 y,自变量为 x,得到以下参数分析表: 拟合优度检验: 样本观察值聚集在样本回归直线周围的

9、紧密程度利用判定系数r2来判定r2越大模型拟合度越高 相关系数显著性检验: 两个变量间的线性相关程度,用相关系数 r 来判别,sxy 称为 x 与 y 的样本协方差,sx 称为 x 的样本标准差,sy 称为 y 的样本标准差。根据给定的显著性水平和样本容量 n,查相关系数表得到临界值 r。假设|r|>r,那么 x 与 y 有显著的线性关系,否那么 x 与y 的线性相关关系不显著。 tss=ess+rss (ess 可由回归直线解释,rss 不可解释的残差 e) 回归方程的显著性检验(f 检验): 对回归总体线性关系是否显著的一种假设检验 根据给定的显著水平确定临界值 f(1,n-2),或

10、者计算 f 值所对应的 p 值来判定。如果 f 值大于临界值 f(1,n-2)(或者 p<),回归方程的线性关系是显著的。 输出结果中的非标准化的系数估计值(b)及其标准误差(std.error)。可以看出,系数估计值分别为 b 0= 0.607 和 b1 = 0.542,那么 。 0.607+ 0.542x。 std.error 表示 b i 与 i 之间的差异,其值越小证明 b i 越可靠。 回归参数的显著性检验(t 检验): 根据样本估计结果对总体回归参数的有关假设进行检验检验的临界值是由显著水平和自由度决定的,如果 t 的绝对值大于临界值(或者 p(实际显著性水平)<),说

11、明 x 对y 具有显著的影响作用。 6、 、 多元线性回归 选择主菜单analyze=>regression=>linear 运行结果如以下图所示: 拟合优度检验: 1.r2=0. 902,说明 y 的变动中 95%可由 x1,x2 解释 2.调整判定系数去除自变量个数对拟合优度的影响 3.复相关系数 r 等于 r2 开平方,反映样本观测值与拟合直线间的线性相关程度。r=0.95, 说明 y 与 x1,x2 之间相关程度为 95%。 7 、时序分析 系统中某一变量的观测值按时间顺序(时间间隔相同)排列成一个数值序列,展示研究对象在一定时期内的变动过程,从中寻找和分析事物的变化特征、

12、开展趋势和规律。它是系统中某一变量受其它各种因素影响的总结果。 特征识别认识时间序列所具有的变动特征,以便在系统预测时选择采用不同的方法。 (1)随机性:均匀分布、无规那么分布,可能符合某统计分布。(用因变量的散点图和直方图及其包含的正态分布检验随机性,大多数服从正态分布。) (2)平稳性:样本序列的自相关函数在某一固定水平线附近摆动,即方差和数学期望稳定为常数。 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋近 0,前者测度当前序列与先前序列之间简单和常规的相关程度,后者是在控制其它先前序列的影响后,测度当前序列与某一先前序之间的相关程度 根本步骤 (1) 作直方图:检验正态性、零均

13、值。按图形 graphs直方图 histogram 如上图所示可得直方图结果: (2)作相关图:检验平稳性、周期性。 按分析预测自相关 autocorrelations 翻开选项: 因为一般要求时间序列样本数据 n>50,滞后周期 k 确定后得到结果: 我们从上图中看出样本序列数据的自相关系数在某一固定水平线附近摆动,且按周期性逐渐衰减,所以该时间序列根本是平稳的。 相关图法: 运行自相关图后,出现自相关图和偏自相关图 从图中看出:自相关系数和偏相关系数具有相似的衰减特点:衰减快,相邻二个值的相关系数约为 0.3,滞后二个周期的值的相关系数接近 0.1,滞后三个周期的值的相关系数接近0.

14、05。所以,根本可以确定该时间序列为 arma(p,q)模型形式,但还不能确定是 arma(1,1)或是 arma(2,2)模型。但假设前四个自相关系数分别为 0.40、0.16、0.064、0.0256,那么可以考虑用 ar(1) 模型 实际上,具体应用自相关图进行模型选择时,在观察 acf 与 pacf 函数中,应注意的关键问题是:函数值衰减的是否快;是否所有 acf 之和为-0.5,即进行了过度差分;是否acf 与 pacf 的某些滞后项显著和容易解释的峰值等。但是,仅依赖 acf 图形进行时间序列的模型识别是比拟困难的。 8、 、 实习总结 spss 是我们专业接触的第一个统计软件,功能强大,虽然对它很多的输出结果还不会做出解释,但是随着学习的深入,这将使我们的一个好帮手,帮助我们完成很多的任务在 spss学习中,对它的认识由浅入深,循序渐进,实践中遇到的各种问题逐个攻克,学习这种在日常工作中有价值的分析方法,使我们更能轻易应付日后的社会的信息工作;掌握这种高级的技能,对我们工作就业提

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论