


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
〈〈数据分析实务与案例实验报告》曲线估计学号:2614班级:2013应用统计姓名:日期:2014-12-7数学与统计学学院1/17'.一、实验目的准确理解曲线回归分析的方法原理。了解如何将本质线性关系模型转化为线性关系模型进行回归分析。熟练掌握曲线估计的SPSS操作。掌握建立合适曲线模型的判断依据。掌握如何利用曲线回归方程进行预测。培养运用多曲线估计解决身边实际问题的能力。二、准备知识非线性模型的基本内容变量之间的非线性关系可以划分为本质线性关系和本质非线性关系。所谓本质线性关系是指变量关系形式上虽然呈非线性关系,但可以通过变量转化为线性关系,并可最终进行线性回归分析,建立线性模型。本质非线性关系是指变量之间不仅形式上呈现非线性关系,而且也无法通过变量转化为线性关系,最终无法进行线性回归分析,建立线性模型。本实验针对本质线性模型进行。下面介绍本次实验涉及到的可线性化的非线性模型,所用的变换既有自变量的变换,也有因变量的变换。乘法模型:yXiX2X3其中,,,都是未知参数,是乘积随机误差。对上式两边取自然对数得到lnyInInx1Inx2Inx3In上式具有一般线性回归方程的形式,因而用多元线性回归的方法来处理。然而,必须强调指出的是,在求置信区间和做有关试验时,必须是In:N(0,2In),而不是:N(0,2In),因此检验之前,要先检验In是否满足这个假设。三、实验内容已有很多学者验证了能源消费与经济增长的因果关系,证明了能源消费是促进经济增长的原因之一。也有众多学者利用C-D生产函数验证了劳动和资本对经济增长的影响机理。所有这些研究都极少将劳动、资本、和能源建立在一个模型中来研究三个因素对经济增长的作用方向和作用大小。现从我国能源消费、全社会固定资产投资和就业人员的实际出发,假定生产技术水平在短期能不会发生较大变化,经济增长、全社会固定资产投资、就业人员、能源消费可以分别采用国内生产总值、全社会固定资产投资总量、就业总人数、能源消费总量进行衡量,并假定经济增长与能源消费、资本和劳动力的关系均满足C-D生产函数。问题中的C-D生产函数为:YAKLE式中:Y为GDP,衡量总产出;K为全社会固定资产投资,衡量资本投入量;L为就业人数,衡量劳动投入量;E为能源消费总量,衡量能源投入量;A,,,为未知参数。根据C-D函数的假定,一般情形,,均在0和1之问,但当,,中有负数时,说明这种投入量的增长,反而会引起GDP的下降,当,,中出现大丁1的值时,说明这种投入量的增加会引起GDP成倍增加,这在经济学现象中都是存在的。以我国1985—2004年的有关数据建立了SPSS数据集,参见“data16-2.sa4。请以此数据集为基础估计生产函数中的未知参数。四、实验步骤及结果分析确定非线性回归模型的类型有上述分析过程确定要建立的回归模型为:YAKLE式中,Y为自变量,K,L,E为解释变量,A为常数项。通过变换将非线性方程转化为线性方程将原回归模型两遍同时取对数:lnYlnAlnKlnLlnE彳寸:ycx1x2x3式中,ylnY,clnA,x1lnK,x2lnL,x3lnE。选择【转换】一【计算变量】,对所有数据取对数完成数据的处理,过程及结果如下图:
;F.■*1EKWiV///与幅fla.二巨;F.■*1EKWiV///与幅fla.二巨HZIQ旧■S£1□1口,g,h,i-+a的如me<r朋?ift1口由数字■于进行初步线性回归分析(选入所有变量)用最小二乘法建立回归方程由非线性模型转化为线性模型后,即可按照建立多元线性回归模型的步骤进行操作,求得回归方程表达式。(1)选择【分析】t【回归】t【线性】,弹出“线性回归”对话框。将lnY选入“因变量”框,Ink到lnE选入“自变量”框。注意,可以通过点击“上一张”与“下一张”按钮切换,选择不同的自变量构建模型,每个模型中可以对不同的自变量采用不同的方法进行回归。“方法”下拉框中有5个选项,此处先选择“进入”,即所选变量全部强行进入回归模型(2)点击“统计量”按钮,选择输出各种常用判别统计量,本案例选择“估计”、“模型拟合度”、“描述性”、“共线性诊断”,以及残差中的“Durbin-Watson”检验和“个案诊断”
i•宰专倍二〔定》[K](?5AJM〔广琥野近时...i•宰专倍二〔定》[K](?5AJM〔广琥野近时...珈回GOPte元】[¥1成吞席年E;根型汇总°棋型RR方调整R方标擂估计的误差Durbin-Watson1.9953.991.989.C5736763乳预测查量(常星).InEJnLMK,b因变星IrfYAmouab程型平方和df均方FSig.1回归嗾差忌计5.966.0576.023317201.989D03594.101,000aaEOlgfi-(常O,I低lnL,igb.S^l:lnY根型非标准化槃舰标准务教1珈,共线柱统计量B标谁识茬试用版容是VIF1(常量)bKlnLbE-4.5306557821.971074.223P,21&.328.191.□00-2.4228.3603.507002.027.000003.163>0445327a.因麦垦:InV由模型汇总表,R20.991,R20.989,拟合优度很强。统计量DW=0.763,该检验用于判断相邻残差序列的相关性,其判断标准如下:DW<dl,认为残差序列存在正的一阶自相关;du<DW<4-du,认为残差序列间不存在一阶自相关;DW>4-dL,认为残差序列问存在负的一阶自相关;dL<DW<du或4-du<DW<4-dL时,无法确定残差序列是否存在自相关。本例中,k=4,n=21(k为解释变量的数目,包括常数项,n是观察值的数目)时,5%的上下界:dL=1.03,dU=1.67。有DWdl,认为残差序列存在一阶自相关。由方差分析表,统计量F=594.101,p值小丁0.05,认为方程在95%的置信水平下是显著的。但是,t0.025(2131)2.110变量lnK、lnL、常量lnA的t值均大丁2.110,所以这几个变量对方程的影响都很显著,而变量lnE的t值很小且p值明显大丁0.05且回归系数为零,说明该变量对方程影响不显著,回归模型是无效的。消除模型中变量的共线性(逐步回归)“共线性统计量”中,容忍度Tolerance越接近丁0,表示复共线性越强,越接近丁1,复共线性越弱。而方差膨胀因子VIF的值越接近丁1,解释变量问的多重共线性越弱,如果VIF的值大丁或等丁10,说明一个解释变量与其他解
释变量之间有严重的多重共线性。本例中,变量lnK和lnE的VIF值都大丁10,说明它们与其他解释变量之间有严重的多重共线性,不符合经典假设,需要修正。通过以上结果分析,采用逐步回归的方法来消除变量之间的多重共线性。重复以上步骤从新建立回归方程,将【进入】替换为【逐步】如下图所示:得到如下结果:供型汇模型RR方调整R方标淮T警十的谟Durbin-Wateon12m3.991啊.979,07051)06623巳按测爽髦(常妥MG0预刚另最(甯最),lnK,1板c,InY棋型齐标准化命数祚准曾!故rH标温惺怪试用颛VIF■i津最)InK3.U15.783223025.9901J.5D330.914ULIU1.ouo10002(信量JinkInL-4.620.65&.7S21.732U据170.101-2.&151E.丽0心76I.0noX^ooq^].2/6/.2?e电mg]a.因衰星:InY从上表可以看出通过逐步回归剔除掉了变量lnE,整个模型的拟合优度上升,调整R方从0.989上升至0.990。方差膨胀因子VIF值均小丁10,多重共线性已消除。T检验的概率明显小丁0.05说明变量对模型的影响显著。而此时DW值并未有明显改变,残差序列仍然存在一阶自相关。此时采用数据变换的方法来消除残差的自相关。消除残差的自相关对丁自相关的处理方法,其基本思想是通过一些数学转化,对数据进行处理,消除数据的自相关性,在对参数进行估计。当误差序列的自相关系数已知,且1时,采用差分法,即利用增量数据来代替原有的样本数据建立方程。当误差序列的自相关系数未知时,先求处自相关系数,再通过反复迭代法消除来自相关。我们知道DW与之间的近似关系:DW2(1丹其中:我们考虑相邻观测间存在的一种最简单的相关情形阶白相关.设孔与E*有如下关系,=俾・+虬*1,i=L«—1其中临,地,…,K相互独直,当PMO时,称勺,…,R间存在阶自相关,此时检验误差的独立性问题变成了下列假设楼励问鼬t(4.13)进一步偶定电〜N(0>尹),并旦村不太大时,我们叮以引入。-并检骋,即.Z一心尸QW=(4.14)以由于€是不可观测的随机变斌,所以考察七间的相关性常用技差&来进行■埒…,<J和….看成两个序列,其相关系数『称为一阶肓相关系数,因为DW=0.764,代入上式很明显得出不为1,所以此处不能用差分而采用迭代的方法消除自相关性。这里先求出lny的一元线性回归方程:Iny4.5290.655lnK0.782lnL中的残差e,i=1,…,n,将残差代入如下公式:(ei®1,nI)(ei1%n)i1rn1n1.;(e%1)(e1e,n1);i1i1其中e,n1残差序列代入上式求的一阶自相关系数r0.60966再令:**yYi1ryi,Xix〔1%」1,...,n1用EXCEL完成数据的迭代得到新的数据,这里用Y1代表原先的lnY,K1代表原先的lnK,L1代表原先的lnL。并导入到SPSS中,重复以上步骤对新的数据进行回归分析。lnYLnKInLnKLL19.117,3410.829.177.9810.853.0159993.2002674.2534809059.268+1110.87&&69423.2449154.2551SOI119.31&1610.93.&64553.2156594-2729979149.2?7.旎10.923.J940672.94517&4.274708129.337.9111.OS3.6784543.0814944.4225149249.458.购11.093.7613743.2675914.334&653559.68.411.13.8387153.4678524.3388T27579.748.7411.113.3872663.6188584-3427761599.83&7911.123.8919133.4615734一3466795619.918.811.133.9170443.441094.3505829639.99S.8511.143.9482712.4849944-35448636510.068’9111.153.9&94993.5145114.35838976710.149.0511.174.0068223.617931虹37229316910.219.1111.134.028053.5925734.37009397310.319.211.194.0853733.64599^4.37400337510.49.3211.24.1144073.711134.37790&77710,59.4811.214.1595383.7979714.38181017910.61伐7211.224.2085723.9404254.38571358110.743.3211.234.2715093.9941074.38961698310.6510+1311.2+4.3022544.0821754.393520385得出结果的:
赛型拒总b模型RR方调整R方标淮估计的误茬Durbin-Watsop-^1.964.959.0441&741.570j)白.顼测芟皇:席昼XL1,K1obHM:Y1模型作标准化系数标准系数t81g.共线性吉荆俚B标建谨走试用版容莲VIF1-2,2151间-2.Q17伽UK1.B10043.84214111.ODC.5901.6BSL1.920.273.2013漩.004副91.860a囹变量*1数据经过一次迭代以后DW的值有明显增加,查表k=3,n=20(k为解释变量的数目,包括常数项,n是观察值的数目)时,5%的上下界:dL=1.10,dU=1.54<有du<DW<4-du,认为残差序列问不存在一阶自相关。此时得到新的回归方程:Y12.2160.610K10.920L1残差正态性检验点击“绘制”按钮,将“ZRESID”选入Y轴,“ZPRED”选入X轴,绘制散点图,并在“标准化残差图”中选择“直方图”,输出带有正态曲线的标准化残差的直方图。”框中框中选择点击“保存”按钮,在对话框中保存一些统计量的值,此案例在“预测伯”框中框中选择“均值”和“单值”。其他不变,点击【继续】T【确定】。输出结果如下图:急方图出空皇!Y1上面操作已输出残差的直方图,还可以通过【分析】->【描述统计】[P-P图】和【分析】T【描述统计】T【Q-Q图】输出正态分布的P-P图、Q-Q图,若散点围绕图中所给斜线有规律的分布,则可以认为所检测变量服从正态分布。尹布I、:,尹布I、:,S^FlM)歇遗军用琶朋』窗口处十古卜Gkflk£用姬统冲,弦们»r曳淑罟电»温皆华昭)*目担四*■庭,E■-五聪匚卫父宝袁C:-图蜓&.RLfI•:...%g-眼q:P-P图■|c06-dfl-UnetandJrdizedRgidel的正虑PPFI观油的景枳宰牌空的^枳断率Q-Q图■|c06-dfl-UnetandJrdizedRgidel的正虑PPFI观油的景枳宰牌空的^枳断率Q-Q图D10-3JCH'3M-JJtK--010-4J.13T.IQ-Q.D9Q.aODQ3050.I观测值从以上图形可以初步认为该模型的残差服从正态分布。进一步进行K-S检验。选择【分析】T【非参数检验】T【旧对话框】T【1-样本K-S检验】,弹出“单样本Kolmogorov-Smirnov检验”窗口,将未标准化残差选入变量框,
K-S检验输出结果单样本Kolrnogarov-Smirnav桂验UnslandardizsdKesiduaiN正寿参数水均值标准差盈极端茬别绝楠直正负Kolmogorov-SmirnovZ渐近显著性硬倒)20.0000000.04177618.151094-.151676.751a拖验分布为正态分布b根据数据计算得到。K-S检验统计量为0.676,检验概率p值为0.751,大丁0.05,可以认为在95%的置信水平下,该模型的残差服从正态分布。残差的其他检验(1)异方差检验:根据回归分析输出的标准化残差的散点图,初步判断是否存在异方差,但此种判断方法较主观,且不容易判断。进一步用Spearman等级相关检验分析是否存在异方差。首先对未标准化残差取绝对值,点击【转换】t【计算变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【课件】Unit+3+Keep+Fit+Section+B++1a~1d课件+人教版(2024)七年级英语下册+
- DB32/T 4544-2023潮滩与盐沼生态系统碳储量调查技术规范
- 2025年中国电磁炉行业市场专项调研及投资前景可行性预测报告
- 中医就医礼仪培训课件
- 2025年医院健康促进工作计划
- 果品北郊冷库改建融资投资立项项目可行性研究报告(2025咨询)
- 人教版九年级数学下册27.1 图形的相似 第1课时课件
- 小学生心理健康与课堂氛围改善措施
- 拓展延伸:空间向量的直角坐标运算
- 幼儿园教学改革与创新计划
- 工改工政策分析课件
- 2023年徐州市泉山区工会系统招聘考试笔试题库及答案解析
- 醇基燃料技术资料
- 施工企业资质及承接工程的范围
- 泥浆测试记录表
- 《摩擦力》说课课件(全国获奖实验说课案例)
- 个人信用报告异议申请表
- 初中数学 北师大版 七年级下册 变量之间的关系 用图象表示的变量间关系 课件
- 2023年艺术与审美期末试卷答案参考
- 电气工程竣工验收表格模板
- 制程品质检验流程图
评论
0/150
提交评论