




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验二、相关与回归分析一、实验目的及要求掌握利用SPSS 10.0软件进行相关分析和回归分析的基本操作方法,理解SPSS 10.0软件给出的相关分析和回归分析结果。二、实验内容了解SPSS 10.0软件中Statistics 菜单的Correlate 子菜单的功能;利用 SPSS 10.0 软件进行简单相关分析;了解SPSS 10.0软件中Statistics菜单的Regression子菜单的主要功能;利用SPSS 10.0软件进行多元线性回归和一元非线性回归分析。三、实验仪器、设备及材料硬件环境:PC 软件环境:操作系统Windows系列SPSS 10.0四、实验原理计量地理学中关于地理数据
2、相关分析和回归分析的基本理论及SPSS 10.0软件操作指南。五、实验步骤§.1利用SPSS进行相关分析SPSS的相关分析功能被集中在Statistics 菜单的Correlate 子菜单中,他一般包括以下三个过程:Bivariate 过程:此过程用于进行两个/多个变量间的相关分析,如果是多个变量,则给出两两相关的分析结果。 Partial过程:Partial过程专门用于进行偏相关分析。 Distances过程:该过程在实际应用中用的非常少。有兴趣的同学自己查阅。1.1.1 Bivariate 过程1.1.1.1 界面说明Variables 框】用于选入需要进行相关分析的变量,至少需
3、要选入两个。【Correlation Coefficie nts复选框组】用于选择需要计算的相关分析指标,有:Pearson复选框 选择进行积距相关分析,即最常用的参数相关分析« Kendall's tau-b 复选框计算Kendall's 等级相关系数* Spearman复选框 计算Spearman相关系数,即最常用的非参数相关分析(秩相关)【Test of Sig ni fica nee单选框组】用于确定是进行相关系数的单侧( One-tailed )或双侧(Two-tailed )检验,一般选双 侧检验。【Flag sig ni fica nt correlat
4、i ons】用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时P<0.05的系数值旁会标记一个星号,P<0.01的则标记两个星号。【Options钮】弹出Options对话框,选择需要计算的描述统计量和统计分析:* Statistics复选框组可选的描述统计量。它们是:1. Mea ns and sta ndard deviatio ns每个变量的均数和标准差2. Cross-product deviatio ns and covaria nces各对变量的交叉积和以及协方差阵* Miss ing Values 单选框组定义分析中对缺失值的处理方法,可以是具体分析
5、用到的两个变量有缺失值才去除该记录( Exclude cases pair wise ),或只要该记录中 进行相关分析的变量有缺失值(无论具体分析的两个变量是否缺失),则在所有分析中均将该记录去除(Excludes cases list wise)。默认为前者,以充分利用数据。1.1.1.2分析实例计算SPSS自带的样本数据judges.sav中意大利法官(judgel)和韩国法官(judge2)得 分的相关性。由于judgel和judge2的数据分布不太好,这里同时计算 Pearson相关系数和 Spearman 相关系数。操作如下:1. Variables 框:选入 judgel、judg
6、e22. Pearson复选框:选中3. Spearman复选框:选中4. 单击OK钮1.1.1.3结果解释输出结果如下所示:(1) CorrelationsIialjrSouth KoreaItalyPeaKon CoTrelatioiiI 000S 运.000N300300South KoreaPearson Correlatioii910*1.000理(2-tailed).000-N300300Cotnshtioti is fign应血 it th£ 0.01 Lvel 宀询泌)一在上面的结果中,变量间两两的相关系数是用方阵的形式给出的。每一行和每一列的两个变量对应的格子中就是
7、这两个变量相关分析结果,共分为三列,分别是相关系数、P值和样本数。由于这里只分析了两个变量,因此给出的是 2*2的方阵。由上表可见judgel、judge2自身的相关系数均为1 ( of course ),而judgel和judge2的相关系数为 0.91,P<0.001,有非常显著的统计学意义。注:如果需要得到具体的 P值。请进入表格的编辑模式,双击P值所在的单元格,就可以看到精确的 P值大小。上表的标题内容翻译如下:Italy| South KoreaPearson积距相关系数1.000.910Italyp值(双侧).000样本数300300Pearson积距相关系数.9101.00
8、0South Koreap值(双侧).000.样本数300300(2) Non parametric Correlati onsCorrelationsItalySmith Kd 垢 aSpEamiAxiH iho ItalyCoirelAtion Coflkint1.0009初柯Sig (2-taikd)-.000N300300South KoreaCoirelation Coefficient520+*1.000Sig (2-tailed)DOO-N300300时,也百常血泄1 牡血 JI level (2-uikd此处的表格内容和上面Pears on相关系数的结果非常相似,只是表格左侧注
9、明为Spearman等级相关。可见judgel和judge2的等级相关系数为 0.92,P<0.001,有非常显著 的统计学意义。1.1.2 Partial 过程1.1.2.1 界面说明【Variables 框】用于选入需要进行偏相关分析的变量,至少需要选入两个。【Co ntrolli ng for框】用于选择需要在偏相关分析时进行控制的协变量,如果不选入,则进行的就是普通的 相关分析。【Test of Sig ni fica nee单选框组】意义同前,用于确定是进行相关系数的单侧( One-tailed )或双侧(Two-tailed )检 验,一般选双侧检验。【Display act
10、ual sig nificince level复选框】用于确定是否在结果中给出确切的P值,一般选中。【Options钮】弹出Options对话框,选择需要计算的描述统计量和统计分析:* Statistics复选框组可选的描述统计量。它们是:1. Mea ns and sta ndard deviatio ns每个变量的均数和标准差2. Zero-order correlatio ns给出包括协变量在内所有变量的相关方阵« Miss ing Values单选框组定义分析中对缺失值的处理方法,可以是具体分析用到的两个变量有缺失值才去除该记录( Exclude cases pairwise
11、 ),或只要该记录中进 行相关分析的变量有缺失值(无论具体分析的两个变量是否缺失),则在所有分析中均将该记录去除(Excludes cases listwise)。默认为前者,以充分利用数据。1.122 结果解释与Bivariate过程的结果显示类似,只不过这时显示的相关系数是偏相关系数。§ 1.2 利用SPSS进行回归分析SPSS的回归分析功能被集中在Statistics 菜单的Regression子菜单中。其中:Linear过程可完成二元或多元的线性回归分析;Curve Estimati on过程可以用于拟合各种各样的曲线;Bi nary Logistic过程可以用于拟合 Log
12、istic 曲线。1.2.1Lin ear 过程121.1 界面详解在菜单中选择Regressio n=>li ner,系统弹出线性回归对话框如下:其中:【Dependent框】用于选入回归分析的应变量。【Block按钮组】由Previous和Next两个按钮组成,用于将下面 Independent框中选入的自变量分组。 由于多元回归分析中自变量的选入方式有前进、后退、逐步等方法,如果对不同的自变量选入的方法不同,则用该按钮组将自变量分组选入即可。Independent 框】用于选入回归分析的自变量。【 Method 下拉列表】用于选择对自变量的选入方法, 有 Enter (强行进入法)
13、 、Stepwise (逐步法) 、Remove (强制剔除法)、Backward (向后法)、Forward (向前法)五种。该选项对当前Independent 框中的所有变量均有效。【Selection Variable框】选入一个筛选变量,并利用右侧的 Rules 钮建立一个选择条件,这样,只有满足该条 件的记录才会进入回归分析。【Case Labels 框】选择一个变量,他的取值将作为每条记录的标签。最典型的情况是使用记录ID 号的变量。【WLS钮】可利用该按钮进行权重最小二乘法的回归分析。单击该按钮会扩展当前对话框,出现WLS Weight 框,在该框内选入权重变量即可。【 Stat
14、istics 钮】弹出 Statistics 对话框,用于选择所需要的描述统计量。有如下选项:o Regression Coefficients 复选框组:定义回归系数的输出情况,选中 Estimates 可输出回归系数 B 及其标准误, t 值和 p 值,还有标准化的回归系数 beta ;选中 Confidence intervals 则输出每个回归系数的 95%可信区间;选中 covariance matrix 则会输出各个自变量的相关矩阵和方差、协方差矩阵。以上选项默认只选中 Estimates 。o Residuals 复选框组:用于选择输出残差诊断的信息,可选的有 Durbin-Wa
15、tson 残 差序列相关性检验、超出规定的 n 倍标准误的残差列表。o Model fit 复选框:模型拟合过程中进入、退出的变量的列表,以及一些有关拟合优度的检验:,R, R2和调整的R2,标准误及方差分析表。o R squared change 复选框:显示模型拟合过程中 R2、 F 值和 p 值的改变情况。o Descriptives 复选框:提供一些变量描述,如有效例数、均数、标准差等,同时还 给出一个自变量间的相关矩阵。o Part and partial correlations复选框:显示自变量间的相关、部分相关和偏相关系数。o Collinearity diagnostics
16、复选框:给出一些用于共线性诊断的统计量,如特征根 (Eigenvalues )、方差膨胀因子 (VIF) 等。以上各项在默认情况下只有Estimates和Model fit复选框被选中。【Plot钮】弹出Plot对话框,用于选择需要绘制的回归分析诊断或预测图。可绘制的有标准化残 差的直方图和正态分布图,应变量、预测值和各自变量残差间两两的散点图等。【Save钮】许多时候我们需要将回归分析的结果存储起来,然后用得到的残差、预测值等做进一 步的分析,Save钮就是用来存储中间结果的。可以存储的有:预测值系列、残差系列、距 离(Distances )系列、预测值可信区间系列、波动统计量系列。下方的按
17、钮可以让我们选 择将这些新变量存储到一个新的SPSS数据文件或XML中。【Options钮】设置回归分析的一些选项,有:oStepping Method Criteria单选钮组:设置纳入和排除标准,可按P值或F值来设置。o In clude con sta nt in equation复选框:用于决定是否在模型中包括常数项,默认选中。oMiss ing Values 单选钮组:用于选择对缺失值的处理方式,可以是不分析任一选入的变量有缺失值的记录(Exclude cases listwise)而无论该缺失变量最终是否进入模型;不分析具体进入某变量时有缺失值的记录( Exclude casesp
18、airwise );将缺失值用该变量的均数代替(Replace with mean )。121.2 多元线性回归实例某种商品的需求量Y、价格X1和消费者收入X2的统计资料如所示,试估计丫对X1和 X2的线性回归方程。年fji:儿AX2 i 儿、15919023.56762002654502.449120036236032.0710670046470D32.46期56740D31.1511900066444034.1412920076G00D35 3100007240D38 715960097571D3&.6S180000V706GD193000用SPSS估计参数步骤如下:1、 在SPS
19、S中输入变量数据,设变量名分别为Y、XI、X2。2、 选择主菜单Analyze=>Regression=>Linear,显示如下图所示的对话框。i Liimear iRegressionElocM Qf1 也QLJDependert.Independent?):Method' | EnterSstetjgn ViiatfeLdbT*Ryfe ” |IltKbCE3、选择Y进入Dependent因变量框,选择 XI、X2进入Independent(s)自变量列表框,单 击OK。4、回归结果输出:Model ScimmaryModelRR SquareAdjusted R Sq
20、uareSid. Error of Une Eslimate1950.902.074173S.9346a Predictors Conatant), X2 XiANOVAModelSum of Squares出Mean SduareFSig.1Regression195318937 J124259460'32 294.000Residual21168472 57613024067.511rotal21687410 0009a Predictors. (Constant). X2 X' b D即endenl Variable YCoefficientsModelUnstandar
21、dizedCoefficientsS'.ri K.'c:- 一 KCoefTicientstSigBSid ErrorBela1(GonEtant)62650.92E4013 01C15 612DOCX1I9.057319.7BJ*1 331-3 062aieX2.206052.2114.902CC2a Dependent Variable Y注:参照所学理论知识学会看输出结果。1.2.2 Curve Estimation 过程Curve Estimati on过程可以用于拟合各种各样的曲线,原则上只要两个变量间存在某种可以被它所描述的数量关系,就可以用该过程来分析。但这里我们
22、要指出,由于曲线拟合非常的复杂,而该模块的功能十分有限,因此最好采用将曲线相关关系通过变量变换的方式 转化为直线回归的形式来分析,或者采用其他专用的模块分析。Curve Estimation过程中有特色的对话框界面内容如下:m fModels¥ linear 厂 Logarithmic 厂 Inverse厂 Quadratic厂 Cubic厂 Power厂 CompoundGrowlh厂 $I- xponentia厂 LogisticUpper bound:17 Include conslanl ir p Plot models厂 Display ANOVAUbleF面我们分别解释一
23、下它们的具体功能。【Dependent框】用于选入曲线拟和中的应变量,可选入多个,如果这样,则对各个应变量分别拟合模 型。【Independent单选框组】用于选入曲线拟和中的自变量,有两种选择,可以选入普通的自变量,也可以选择时 间作为自变量,如果这样做,则所用的数据应为时间序列数据格式。【Models复选框组】是该对话框的重点,用于选择所用的曲线模型,可用的有:Li near :拟合直线方程,实际上与Lin ear过程的二元直线回归相同;Quadratic :拟合二次方程 Y = bO+b1X+b2X2 ;Compound拟合复合曲线模型Y = b0 x b1X;Growth :拟合等比级数曲线模型Y = e(bO+b1X);Logarithmic :拟合对数方程 Y = bO+
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 知识产权和保密合同协议书
- 多维遥感技术应用合作协议
- 企业文化与品牌形象塑造合同
- 物流公司聘用驾驶员劳动合同
- 双方协商培育树苗合同书
- 挖机买卖合同书样本
- 场食品安全协议书
- 招投标合作代理协议
- 资源租赁合同
- 汽车租赁行业车辆使用期间损失免责协议
- 医院培训课件:《静脉采血法并发症的预防及处理》
- 《修缮学习交底资料》课件
- 2024年全国卷新课标1高考英语试题及答案
- 2024-2025学年高二上学期期末复习解答题压轴题十七大题型专练(范围:第四、五章)(含答案)
- 2024年10月自考13003数据结构与算法试题及答案
- 华为经营管理-华为激励机制(6版)
- 2024年标准化工地建设管理实施细则(3篇)
- 筑牢安全防线共创平安校园
- 干燥综合征诊断及治疗指南
- 粮油厂食品安全培训
- 南京信息工程大学《教师领导力》2022-2023学年第一学期期末试卷
评论
0/150
提交评论