SPSS实验报告线性回归曲线估计_第1页
SPSS实验报告线性回归曲线估计_第2页
SPSS实验报告线性回归曲线估计_第3页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据分析实务与案例实验报告曲线估计学号:2614班级:2013应用统计姓名:日期:2014T2-7数学与统计学学院一、实验目的准确理解曲线回归分析的方法原理。1. 了解如何将本质线性关系模型转化为线性关系模型进行回归分析。2. 熟练掌握曲线估计的SPSS操作。3. 掌握建立合适曲线模型的判断依据。4. 掌握如何利用曲线回归方程进行预测。5. 培养运用多曲线估计解决身边实际问题的能力。二、准备知识非线性模型的基本内容变量之间的非线性关系可以划分为本质线性关系和本质非线性关系。所谓本质线性关系是指变量关系形式上虽然呈非线性关系,但可以通过变量转化为线性关系,并可最终进行线性回归分析,建立线性模型。

2、本质非线性关系是指变量之间不仅形式上呈现非线性关系,而且也无法通过变量转化为线性关系,最终无法进行线性回归分析,建立线性模型。本实验针对本质线性模型进行。下面介绍本次实验涉及到的可线性化的非线性模型,所用的变换既有自变量的变换,也有因变量的变换。乘法模型:yXX2X3其中,都是未知参数,是乘积随机误差。对上式两边取自然对数得到InyInInInx2Inx3In上式具有一般线性回归方程的形式,因而用多元线性回归的方法来处理。然而,必须强调指出的是,在求置信区间和做有关试验时,必须是In:N(0,2ln),而不是:(0,2ln),因此检验之前,要先检验In是否满足这个假设三、实验内容已有很多学者验

3、证了能源消费与经济增长的因果关系,证明了能源消费是促进经济增长的原因之一。也有众多学者利用C-D生产函数验证了劳动和资本对经济增长的影响机理。所有这些研究都极少将劳动、资本、和能源建立在一个模型中来研究三个因素对经济增长的作用方向和作用大小。现从我国能源消费、全社会固定资产投资和就业人员的实际出发,假定生产技术水平在短期能不会发生较大变化,经济增长、全社会固定资产投资、就业人员、能源消费可以分别采用国内生产总值、全社会固定资产投资总量、就业总人数、能源消费总量进行衡量,并假定经济增长与能源消费、资本和劳动力的关系均满足C-D生产函数。问题中的C-D生产函数为:YAKLE式中:丫为GDP,衡量总

4、产出;K为全社会固定资产投资,衡量资本投入量;L为就业人数,衡量劳动投入量;E为能源消费总量,衡量能源投入量;A,,为未知参数。根据C-D函数的假定,一般情形,均在0和1之间,但当,中有负数时,说明这种投入量的增长,反而会引起GDP的下降,当,中出现大于1的值时,说明这种投入量的增加会引起GDP成倍增加,这在经济学现象中都是存在的。以我国19852004年的有关数据建立了SPSS数据集,参见“data16-2.sa”请以此数据集为基础估计生产函数中的未知参数。四、实验步骤及结果分析1. 确定非线性回归模型的类型有上述分析过程确定要建立的回归模型为:YAKLE式中,丫为自变量,K,L,E为解释变

5、量,A为常数项。2. 通过变换将非线性方程转化为线性方程将原回归模型两遍同时取对数:InYlnAInKInLInE得:ycx-ix2x3式中,yInY,cInA,x-iInK,x2InL,x3InE。选择【转换】一【计算变量】,对所有数据取对数完成数据的处理,过程及结果如下图:=ja;F.*1CBa)LIt:电诞軟/a£H丄tSZ>.丄(.h,i-*e“鬥赛冋jfFRWi的mme<r(n楓rumtdii.fiftKlDKf-fMtlXH-3. 进行初步线性回归分析(选入所有变量)用最小二乘法建立回归方程由非线性模型转化为线性模型后,即可按照建立多元线性回归模型的步骤进行操

6、作,求得回归方程表达式。(1) 选择【分析】-【回归】-【线性】,弹出“线性回归”对话框。将lnY选入“因变量”框,Ink到InE选入“自变量”框。注意,可以通过点击“上一张”与“下一张”按钮切换,选择不同的自变量构建模型,每个模型中可以对不同的自变量采用不同的方法进行回归。“方法”下拉框中有5个选项,此处先选择“进入”,即所选变量全部强行进入回归模型。(2) 点击“统计量”按钮,选择输出各种常用判别统计量,本案例选择“估计”、“模型拟合度”、“描述性”、“共线性诊断”,以及残差中的“Durbin-Watson”检验和“个案诊断”。得到如下结果:得到如下结果:如线性回归国帀旳(75A>l

7、|U【广阳雀剧测量卜怏1旳1t;FS自宸呈,):上掙tKkiL/淀Z;£CU;r迓入'瞬JItADSKij1模型兀总b棋型R调整R打标准估计的谋urbln*Watson1.9953.991.989.05796763乩预测S;InE.InL,InK-b囱娈星IrfYAmouab謨型平有和df均店FSig.1回归5.9651.S&9594.101P,000a赣差.05717X03总计6.02320atsmfiInEJnL,inK*bglt:lnY菲标准化象数标准卷敎共毀性娇计星模型B标准诣羞试用版1Sig容差VIF1偉對-4.5301.971-2.422.027bKess

8、074.3288.360.DOO.os4Qs.ggghIriL782.223.1913.507003.1635327InE,21&.00002.0440匚4迟1a.医1蛊垦:InY由模型汇总表,R20.991,R20.989,拟合优度很强。统计量DW=0.763,该检验用于判断相邻残差序列的相关性,其判断标准如下:DWvdL,认为残差序列存在正的一阶自相关;du<DW<4-du,认为残差序列间不存在一阶自相关;DW>4-dL,认为残差序列间存在负的一阶自相关;dLvDWvdu或4-du<DW<4-dL时,无法确定残差序列是否存在自相关。本例中,k=4,n=

9、21(k为解释变量的数目,包括常数项,n是观察值的数目)时,5%的上下界:dL=1.03,dU=1.670有DWdi,认为残差序列存在一阶自相关。由方差分析表,统计量F=594.101,p值小于0.05,认为方程在95%的置信水平下是显著的。但是,t0.025(2131)2.110变量lnK、InL、常量lnA的t值均大于2.110,所以这几个变量对方程的影响都很显著,而变量lnE的t值很小且p值明显大于0.05且回归系数为零,说明该变量对方程影响不显著,回归模型是无效的。4. 消除模型中变量的共线性(逐步回归)“共线性统计量”中,容忍度Toleranee越接近于0,表示复共线性越强,越接近于

10、1,复共线性越弱。而方差膨胀因子VIF的值越接近于1,解释变量间的多重共线性越弱,如果VIF的值大于或等于10,说明一个解释变量与其他解释变量之间有严重的多重共线性。本例中,变量InK和InE的VIF值都大于10,说明它们与其他解释变量之间有严重的多重共线性,不符合经典假设,需要修正。通过以上结果分析,采用逐步回归的方法来消除变量之间的多重共线性。重复以上步骤从新建立回归方程,将【进入】替换为【逐步】如下图所示:得到如下结果:螟型汇RR方调整尺方Durbin-Watson12.S90J.991.991.979>.07891.05E23b'WlSS-St)JnKJnLc,InYa.

11、因索量:InY拽型非标准化角褻r兰找性扯计虽H标;吐逞罐试用版VIF1InK3.U15.7832230251J.5D30.914.uUI-IU1.OUO10002国星)inkInL-4.620,b66.7S21.732UJ6170.101-2.&151H694,375(.0noXooq.2/6*.2?e从上表可以看出通过逐步回归剔除掉了变量InE,整个模型的拟合优度上升,调整R方从0.989上升至0.990。方差膨胀因子VIF值均小于10,多重共线性已消除。T检验的概率明显小于0.05说明变量对模型的影响显著。而此时DW值并未有明显改变,残差序列仍然存在一阶自相关。此时采用数据变换的方

12、法来消除残差的自相关。5. 消除残差的自相关对于自相关的处理方法,其基本思想是通过一些数学转化,对数据进行处理,消除数据的自相关性,在对参数进行估计。当误差序列的自相关系数已知,且1时,采用差分法,即利用增量数据来代替原有的样本数据建立方程。当误差序列的自相关系数未知时,先求处自相关系数,再通过反复迭代法消除来自相关。我们知道DW与之间的近似关系:DW2(1卩)其中:我们考虑相邻观测间存在的一种毎简单的相关悄形阶自相关.设6与E屮有如下抉乘*=声+昭i"'«1茶中旳,吗叫相互独立,为卩时"称匚间存在i阶自相关。此时检验渓差的独立性问題变成了下列假设枪验问题

13、,0(4.13)进一步假定码(0,八并旦丹不太大时,我们叮以引入D-W檢验,即QW=(4,14J由于是不可观测的随机变lb所以等察町间的相关性常用残建,来进行,将応|山纣,1)和爲.看成两个序列英相关系数称为一阶自相关系数亍因为DW=0.764,代入上式很明显得出不为1,所以此处不能用差分而采用迭代的方法消除自相关性。这里先求出lny的一元线性回归方程:中的残差e,i=1,,n,将残差代入如下公式:(eiei,nI)(ei1e2.,n)i1n1el,n1)(ei1i1其中e,n1e,1e2,n1残差序列代入上式求的一阶自相关系数r0.60966再令:yyi1ryi,Xi1rXi,i1,.,n1

14、用EXCEL完成数据的迭代得到新的数据,这里用丫1代表原先的lnY,K1代表原先的lnK,L1代表原先的InL。并导入到SPSS中,重复以上步骤对新的数据进行回归分析。lnYLnKInLnL19.117.3410.829.177.翎10.853.0159993.2002674.2534=80905268+1110.873.669423.2449154.2551SOI119.318,1610.93.&64553.2156594.2729979149.2?人站10.923.5M0672.9451764.274708129.33匚9111.083.6784543.0814944.422511

15、9249.45S.M11.093.76137432675914.334&65355958.111.13.8387153.4678524-3388T27579.748.7411.118.3872663.6188584.3427761599838.7911.123.8919133.4615734-3466795619.91Q.811.133.9170443.4410943505829639.99S.8511.143.948271S.484994£35448636510,06&9111.153.9&94S93.5145114.3583876710.149.0511.

16、174.0068223.617931£37229316910.219.1111.134.023053.5925734.37009397310.319.211.194.0853733.64宛994.37400337510.49.3211.24.1144073.711134-37790&77710,59.4811.214.15953837979714.38181017910.619.7211.224.2085723.9404254.38571358110.743.211.234.2715093.9941074.38961698310.6510+1311.244.3022544.0

17、821754.393520385得出结果的:蟆輕彳匚总b已预測变星:L1,K1-模型RRS调整R污标准怙计的谍Durbln-Watsop-1.964.0441&741.570Jb系数a因麥量:门複型标准系数tSig.建线性生魁惬B试用皈VIF1囲)-2,215-2.017.05CK1.B10043.84214111.ODC.5901.6BSL1.920.273.2013.3SB.0041.860数据经过一次迭代以后DW的值有明显增加,查表k=3,n=20(k为解释变量的数目,包括常数项,n是观察值的数目)时,5%的上下界:dL=1.10,dU=1.54<有du<DW<

18、4-du,认为残差序列间不存在一阶自相关。此时得到新的回归方程:丫16. 残差正态性检验点击“绘制”按钮,将“ZRESID”选入丫轴,“ZPRED”选入X轴,绘制散点图,并在“标准化残差图”中选择“直方图”,输出带有正态曲线的标准化残差的直方图。'框中框中选择点击“保存”按钮,在对话框中保存一些统计量的值,此案例在“预测值选择“未标准化”,在“残差”框中选择“未标准化”,在“预测区间”“均值”和“单值”。其他不变,点击【继续】-【确定】。输出结果如下图:因变童:Y1上寸伯jkSqm.=a归纽N=2D上面操作已输出残差的直方图,还可以通过【分析】T【描述统计】T【P-P图】和【分析】-【

19、描述统计】-【Q-Q图】输出正态分布的P-P图、Q-Q图,若散点围绕图中所给斜线有规律的分布,则可以认为所检测变量服从正态分布。H.飞穿用齢1SL.".1flkb”慶E吃.麹T*二毆股:*島府®.3'U乂曳嘉CJr冥謝蝎金>Z出现1Bm*b(pl*a剤©>gciF'C:P-P图P-P图Q-Q图UnstandardizedResidual止态QQ圈D1Q305'305'曲望正态何300-3JQS-规测值从以上图形可以初步认为该模型的残差服从正态分布。进一步进行K-S检验。选择【分析】-【非参数检验】-【旧对话框】-【1-样

20、本K-S检验】,弹出“单样本Kolmogorov-Smirnov检验”窗口,将未标准化残差选入变量框,K-S检验输出结果单样本KDlrnogorov-Smirnov检艇IJnslandardizsdResidualN20正态签數"卜均值.0000000标准建.04177618最极端差别绝刪豆.151正094-.151Kolmogorov-SmirnovZ676.751a检脸分布对正iS分布QB根据隸据计算得到。K-S检验统计量为0.676,检验概率p值为0.751,大于0.05,可以认为在95%的置信水平下,该模型的残差服从正态分布。7. 残差的其他检验(1)异方差检验:根据回归分析输出的标准化残差的散点图,初步判断是否存在异方差,但此种判断方法较主观,且不容易判断。进一步用Spearman等级相关检验分析是否存在异方差。首先对未标准化残差取

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论