



版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实用标准文案数据分析实务与案例实验报告曲线估计学号: 2013111104000614班级:2013应用统计姓名:日期:201412 7数学与统计学学院文档实用标准文案一、实验目的1. 准确理解曲线回归分析的方法原理。2. 了解如何将本质线性关系模型转化为线性关系模型进行回归分析。3. 熟练掌握曲线估计的 SPSS操作。4. 掌握建立合适曲线模型的判断依据。5. 掌握如何利用曲线回归方程进行预测。6. 培养运用多曲线估计解决身边实际问题的能力。二、准备知识1. 非线性模型的基本内容变量之间的非线性关系可以划分为 本质线性关系和本质非线性关系。 所谓本质线性关系是指变量关系形式上虽然呈非线性关系
2、,但可以通过变量转化为线性关系,并可最终进行线性回归分析,建立线性模型。本质非线性关系是指变量之间不仅形式上呈现非线性关系,而且也无法通过变量转化为线性关系,最终无法进行线性回归分析,建立线性模型。本实验针对本质线性模型进行。 下面介绍本次实验涉及到的可线性化的非线性模型, 所用的变换既有自变量的变换,也有因变量的变换。乘法模型:yx1 x2 x3其中,都是未知参数,是乘积随机误差。对上式两边取自然对数得到ln ylnln x1ln x2ln x3ln上式具有一般线性回归方程的形式,因而用多元线性回归的方法来处理。然而,必须强调指出的是,在求置信区间和做有关试验时, 必须是 lnN (0,2
3、I n ) ,而不是N(0,2 I n) , 因此检验之前,要先检验ln是否满足这个假设。三、实验内容已有很多学者验证了能源消费与经济增长的因果关系,证明了能源消费是促进经济增长的原因之一。 也有众多学者利用C-D 生产函数验证了劳动和资本对经文档实用标准文案济增长的影响机理。 所有这些研究都极少将劳动、 资本、和能源建立在一个模型中来研究三个因素对经济增长的作用方向和作用大小。现从我国能源消费、 全社会固定资产投资和就业人员的实际出发, 假定生产技术水平在短期能不会发生较大变化, 经济增长、 全社会固定资产投资、 就业人员、能源消费可以分别采用国内生产总值、 全社会固定资产投资总量、 就业总
4、人数、能源消费总量进行衡量, 并假定经济增长与能源消费、 资本和劳动力的关系均满足 C-D 生产函数。问题中的 C-D 生产函数为:YAK LE式中: Y 为 GDP,衡量总产出; K 为全社会固定资产投资,衡量资本投入量;L 为就业人数,衡量劳动投入量; E 为能源消费总量, 衡量能源投入量; A,,为未知参数。根据C-D 函数的假定,一般情形,均在 0 和 1 之间,但当,中有负数时,说明这种投入量的增长,反而会引起GDP的下降,当 , , 中出现大于 1 的值时,说明这种投入量的增加会引起 GDP成倍增加,这在经济学现象中都是存在的。以我国 19852004 年的有关数据建立了SPSS数
5、据集,参见“data16-2.sav ”。请以此数据集为基础估计生产函数中的未知参数。四、实验步骤及结果分析1. 确定非线性回归模型的类型有上述分析过程确定要建立的回归模型为:YAK LE式中, Y 为自变量, K,L,E 为解释变量, A 为常数项。2. 通过变换将非线性方程转化为线性方程将原回归模型两遍同时取对数:ln Yln Aln Kln Lln E得:ycx1x2x3式中, yln Y, cln A, x1ln K , x2ln L, x3ln E。选择【转换】【计算变量】 ,对所有数据取对数完成数据的处理,过程及结果文档实用标准文案如下图:3. 进行初步线性回归分析(选入所有变量)
6、用最小二乘法建立回归方程由非线性模型转化为线性模型后, 即可按照建立多元线性回归模型的步骤进行操作,求得回归方程表达式。(1) 选择【分析】【回归】【线性】 ,弹出“线性回归”对话框。将 lnY选入“因变量”框, lnk 到 lnE 选入“自变量”框。注意,可以通过点击“上一张”与“下一张”按钮切换,选择不同的自变量构建模型,每个模型中可以对不同的自变量采用不同的方法进行回归。 “方法”下拉框中有5 个选项,此处先选择“进入”,即所选变量全部强行进入回归模型。(2) 点击“统计量”按钮,选择输出各种常用判别统计量,本案例选择“估计”、“模型拟合度”、“描述性”、“共线性诊断”,以及残差中的“D
7、urbin-Watson ” 检验和“个案诊断” 。文档实用标准文案得到如下结果:文档实用标准文案由模型汇总表,R20.991, R20.989 ,拟合优度很强。统计量DW=0.763,该检验用于判断相邻残差序列的相关性,其判断标准如下:DWdL,认为残差序列存在正的一阶自相关; duDW4-dL,认为残差序列间存在负的一阶自相关; dLDWdU或 4-d UDW4-Ld时,无法确定残差序列是否存在自相关。本例中,k=4,n=21( k 为解释变量的数目, 包括常数项, n 是观察值的数目)时, 5%的上下界: dL=1.03 ,dU=1.67。有 DW dl ,认为残差序列存在一阶自相关。由
8、方差分析表,统计量F=594.101,p 值小于 0.05 ,认为方程在 95%的置信水平下是显著的。但是,t0.025 (2131)2.110 变量 lnK 、lnL 、常量 lnA 的 t 值均大于 2.110 ,所以这几个变量对方程的影响都很显著,而变量 lnE 的 t 值很小且 p 值明显大于0.05 且回归系数为零,说明该变量对方程影响不显著,回归模型是无效的。4. 消除模型中变量的共线性(逐步回归)“共线性统计量”中,容忍度Tolerance 越接近于 0,表示复共线性越强,越接近于 1,复共线性越弱。而方差膨胀因子VIF 的值越接近于 1,解释变量间的多重共线性越弱,如果VIF
9、的值大于或等于10,说明一个解释变量与其他解文档实用标准文案释变量之间有严重的多重共线性。本例中,变量lnK 和 lnE 的 VIF 值都大于 10,说明它们与其他解释变量之间有严重的多重共线性,不符合经典假设,需要修正。通过以上结果分析,采用逐步回归的方法来消除变量之间的多重共线性。重复以上步骤从新建立回归方程,将【进入】替换为【逐步】如下图所示:得到如下结果:从上表可以看出通过逐步回归剔除掉了变量lnE, 整个模型的拟合优度上升,调整 R方从 0.989 上升至 0.990 。方差膨胀因子 VIF 值均小于 10,多重共线文档实用标准文案性已消除。 T 检验的概率明显小于0.05 说明变量
10、对模型的影响显著。而此时DW值并未有明显改变,残差序列仍然存在一阶自相关。此时采用数据变换的方法来消除残差的自相关。5. 消除残差的自相关对于自相关的处理方法, 其基本思想是通过一些数学转化,对数据进行处理, 消除数据的自相关性, 在对参数进行估计。 当误差序列的自相关系数已知,且1时,采用差分法, 即利用增量数据来代替原有的样本数据建立方程。当误差序列的自相关系数未知时,先求处自相关系数,再通过反复迭代法消除来自相关。我们知道 DW与之间的近似关系:DW2(1)其中:因为 DW=0.764,代入上式很明显得出不为 1,所以此处不能用差分而采用迭代的方法消除自相关性。这里先求出lny 的一元线
11、性回归方程:ln y4.5290.655ln K0.782ln L中的残差 ei, i=1,n,将残差代入如下公式:文档实用标准文案n 1(eie1,n 1 )(ei 1 e2,n )ri 11n1n(eie1,n 1) 2(ei 1 e2,n 1 )2i1i1其中1n 1ei1ne1,n 11 i 1,e2,n 1einn1 i 2残差序列代入上式求的一阶自相关系数r0.60966再令:y*yry,x*xrx,i 1,.,n 1i 1iii 1i用 EXCEL完成数据的迭代得到新的数据,这里用 Y1 代表原先的 lnY , K1 代表原先的 lnK ,L1 代表原先的 lnL 。并导入到 S
12、PSS中,重复以上步骤对新的数据进行回归分析。得出结果的:文档实用标准文案数据经过一次迭代以后 DW的值有明显增加, 查表 k=3,n=20(k 为解释变量的数目,包括常数项, n 是观察值的数目)时, 5%的上下界: dL=1.10 ,dU=1.54。有 duDW4-dU,认为残差序列间不存在一阶自相关。此时得到新的回归方程: Y1 2.216 0.610K1 0.920L16. 残差正态性检验点击“绘制”按钮,将“ ZRESID”选入 Y 轴,“ZPRED”选入 X 轴,绘制散点图,并在“标准化残差图”中选择“直方图” ,输出带有正态曲线的标准化残差的直方图。文档实用标准文案点击“保存”按
13、钮,在对话框中保存一些统计量的值,此案例在“预测值”框中选择“未标准化”,在“残差”框中选择“未标准化” ,在“预测区间”框中选择“均值”和“单值” 。其他不变,点击【继续】【确定】 。输出结果如下图:文档实用标准文案上面操作已输出残差的直方图,还可以通过【分析】 【描述统计】 【 P-P图】和【分析】【描述统计】【Q-Q图】输出正态分布的P-P 图、 Q-Q图,若散点围绕图中所给斜线有规律的分布,则可以认为所检测变量服从正态分布。文档实用标准文案P-P 图Q-Q 图从以上图形可以初步认为该模型的残差服从正态分布。进一步进行K-S 检验。选择【分析】【非参数检验】【旧对话框】【1- 样本 K-
14、S 检验】,弹出“单样本 Kolmogorov-Smirnov 检验”窗口,将未标准化残差选入变量框,文档实用标准文案K-S 检验输出结果K-S 检验统计量为 0.676 ,检验概率 p 值为 0.751 ,大于 0.05 ,可以认为在95%的置信水平下,该模型的残差服从正态分布。7. 残差的其他检验(1) 异方差检验:根据回归分析输出的标准化残差的散点图,初步判断是否存在异方差, 但此种判断方法较主观,且不容易判断。进一步用 Spearman等级相关检验分析是否存在异方差。首先对未标准化残差取绝对值,点击【转换】【计算变量】 ,弹出“计算变量”窗口,“目标变量”输入“abs”,“数学表达式”
15、 输入“abs(RES_1)”,选择【分析】 【相关】 【双变量】,将 abs、所有回归变量及未标准化预测值选入变量框中,【相关系数】栏选择“ Spearman”,点击确定。文档实用标准文案文档实用标准文案Spearman 相关系数表观察系数表的“ abs”行,发现未标准化预测值与残差绝对值的相关性p 值为 0.443 大于 0.05 ,说明该模型的残差不存在的异方差问题。文档实用标准文案五、实验总结根据上述分析,采用逐步回归法得到最后确定的回归方程:Y12.2160.610K 10.920L1其中Y1ln yi1r ln yiK1ln ki1r ln kiL1ln l i 1r ln li , i 1,., n 1代入上式得回归方程为:ln yi 1r ln yi2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 定位服务合同范本
- 2025至2030年中国木工电刨数据监测研究报告
- 名人活动中介协议
- 基因测序样本处理标准化企业制定与实施新质生产力战略研究报告
- 女式包企业数字化转型与智慧升级战略研究报告
- 2025至2030年中国振动冲击夯数据监测研究报告
- 高效节能质量评估服务企业ESG实践与创新战略研究报告
- 银矿尾矿再开发利用企业数字化转型与智慧升级战略研究报告
- 文学艺术书籍企业ESG实践与创新战略研究报告
- 棉麻加工企业数字化转型与智慧升级战略研究报告
- 2025年企业法务顾问聘用协议范本
- 教育部人文社科 申请书
- 无菌手术台铺置的细节管理
- 《康复评定技术》课件-第五章 运动控制
- 议论文8(试题+审题+范文+点评+素材)-2025年高考语文写作复习
- 【理特咨询】2024生成式人工智能GenAI在生物医药大健康行业应用进展报告
- 2025新人教版英语七年级下单词默写表(小学部分)
- 2025年春新外研版(三起)英语三年级下册课件 Unit6第1课时Startup
- 2025江苏苏州高新区狮山商务创新区下属国企业招聘9人高频重点提升(共500题)附带答案详解
- 《蒙牛集团实施财务共享过程中存在的问题及优化建议探析》8800字(论文)
- 平抛运动的经典例题
评论
0/150
提交评论