




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据分析实务与案例实验报告曲线估计学号:204班级:2013 应用统计姓名:日期: 2 0 1 4- 12 - 7数学与统计学学院一、实验目的1. 准确理解曲线回归分析的方法原理。2. 了解如何将本质线性关系模型转化为线性关系模型进行回归分析。3. 熟练掌握曲线估计的SPSS操作。4. 掌握建立合适曲线模型的判断依据。5. 掌握如何利用曲线回归方程进行预测。6. 培养运用多曲线估计解决身边实际问题的能力。二、准备知识1. 非线性模型的基本内容变量之间的非线性关系可以划分为 本质线性关系和本质非线性关系。 所谓 本质线性关系是指变量关系形式上虽然呈非线性关系,但可以通过变量转化 为线性关系,并可
2、最终进行线性回归分析,建立线性模型。本质非线性关系 是指变量之间不仅形式上呈现非线性关系,而且也无法通过变量转化为线性 关系,最终无法进行线性回归分析,建立线性模型。本实验针对本质线性模 型进行。 下面介绍本次实验涉及到的可线性化的非线性模型, 所用的变换既有自变量的变换,也有因变量的变换。乘法模型:yx1 x2 x3其中 , , 都是未知参数,是乘积随机误差。对上式两边取自然对数得到ln y lnln x1ln x 2ln x3ln上式具有一般线性回归方程的形式, 因而用多元线性回归的方法来处理。 然 而,必须强调指出的是,在求置信区间和做有关试验时, 必须是 ln : N(0, 2In)
3、, 而不是 : N(0, 2I n), 因此检验之前,要先检验 ln 是否满足这个假设。三、实验内容已有很多学者验证了能源消费与经济增长的因果关系, 证明了能源消费是促 进经济增长的原因之一。也有众多学者利用C-D生产函数验证了劳动和资本对经 济增长的影响机理。 所有这些研究都极少将劳动、 资本、 和能源建立在一个模型 中来研究三个因素对经济增长的作用方向和作用大小。现从我国能源消费、 全社会固定资产投资和就业人员的实际出发, 假定生产 技术水平在短期能不会发生较大变化, 经济增长、 全社会固定资产投资、 就业人 员、能源消费可以分别采用国内生产总值、 全社会固定资产投资总量、 就业总人 数、
4、能源消费总量进行衡量, 并假定经济增长与能源消费、 资本和劳动力的关系 均满足 C-D 生产函数。问题中的 C-D 生产函数为:Y AK L E式中:丫为GDP衡量总产出;K为全社会固定资产投资,衡量资本投入量;L为就业人数,衡量劳动投入量;E为能源消费总量,衡量能源投入量;A,为未知参数。根据 C-D 函数的假定,一般情形 , 均在 0 和 1 之间,但当,中有负数时,说明这种投入量的增长,反而会引起 GDP勺下降, 当,中出现大于1的值时,说明这种投入量的增加会引起 GDP成倍增加, 这在经济学现象中都是存在的。以我国1985 2004年的有关数据建立了 SPSS数据集,参见“”。请以此数
5、 据集为基础估计生产函数中的未知参数。四、实验步骤及结果分析1. 确定非线性回归模型的类型有上述分析过程确定要建立的回归模型为:丫 AK L E式中,丫为自变量,K,L,E为解释变量,A为常数项。2. 通过变换将非线性方程转化为线性方程将原回归模型两遍同时取对数:lnY ln A In K In L In E得:y cx1 x2 x3式中,y In Y, c In A, x-i In K, x2 In L,x3 In E 。选择【转换】【计算变量】 ,对所有数据取对数完成数据的处理,过程及结果如下图:3. 进行初步线性回归分析(选入所有变量)用最小二乘法建立回归方程由非线性模型转化为线性模型后
6、,即可按照建立多元线性回归模型的步骤进 行操作,求得回归方程表达式。(1) 选择【分析】-【回归】-【线性】,弹出“线性回归”对话框。将InY 选入“因变量”框,Ink到InE选入“自变量”框。注意,可以通过点击“上一 张”与“下一张”按钮切换,选择不同的自变量构建模型,每个模型中可以对不 同的自变量采用不同的方法进行回归。“方法”下拉框中有5个选项,此处先选 择“进入”,即所选变量全部强行进入回归模型。(2) 点击“统计量”按钮,选择输出各种常用判别统计量,本案例选择“估 计”、“模型拟合度”、“描述性”、“共线性诊断”,以及残差中的“ Durbi n-Wats on ” 检验和“个案诊断”
7、。得到如下结果:由模型汇总表,R2 0.991, R2 0.989,拟合优度很强。统计量DW=该检验用于判断相邻残差序列的相关性,其判断标准如下:DWd认为残差序列存在正的一阶自相关;duDW4-d,认为残差序列间存在负的一阶自相关; dLDWM 4-d UDW4-d时,无法确定残差序列是否存在自相关。本例中,k=4,n=21 (k为解释变量的数目,包括常数项,n是观察值的数目) 时,5%勺上下界:dL=,dU=。有DW dl ,认为残差序列存在一阶自相关。由方差分析表,统计量F=, p值小于,认为方程在95%勺置信水平下是显著 的。但是,t0.025(21 3 1)2.1 10变量lnK、I
8、nL、常量lnA的t值均大于,所以 这几个变量对方程的影响都很显著, 而变量 lnE 的 t 值很小且 p 值明显大于且回 归系数为零,说明该变量对方程影响不显著,回归模型是无效的。4. 消除模型中变量的共线性(逐步回归)“共线性统计量”中,容忍度 Tolerance 越接近于 0,表示复共线性越强, 越接近于 1,复共线性越弱。而方差膨胀因子 VIF 的值越接近于 1,解释变量间 的多重共线性越弱,如果 VIF 的值大于或等于 10,说明一个解释变量与其他解 释变量之间有严重的多重共线性。本例中,变量 lnK 和 lnE 的 VIF 值都大于 10, 说明它们与其他解释变量之间有严重的多重共
9、线性, 不符合经典假设, 需要修正。通过以上结果分析,采用逐步回归的方法来消除变量之间的多重共线性。 重复以上步骤从新建立回归方程,将【进入】替换为【逐步】如下图所示: 得到如下结果:从上表可以看出通过逐步回归剔除掉了变量 lnE, 整个模型的拟合优度上升,调整R方从上升至。方差膨胀因子 VIF值均小于10,多重共线性已消除。T 检验的概率明显小于说明变量对模型的影响显著。 而此时DW值并未有明显改变, 残差序列仍然存在一阶自相关。此时采用数据变换的方法来消除残差的自相关。5. 消除残差的自相关对于自相关的处理方法, 其基本思想是通过一些数学转化, 对数据进行处理, 消 除数据的自相关性, 在
10、对参数进行估计。 当误差序列的自相关系数已知, 且 1 时,采用差分法, 即利用增量数据来代替原有的样本数据建立方程。 当误差序列 的自相关系数未知时,先求处自相关系数,再通过反复迭代法消除来自相关。我们知道DW与 之间的近似关系:DW 2(1 卩)其中:因为DW=K入上式很明显得出不为1,所以此处不能用差分而采用迭代 的方法消除自相关性。这里先求出lny的一元线性回归方程:In y 4.529 0.655In K 0.7821nL中的残差e , i=1,,n,将残差代入如下公式:(eie1,n 1)(ei 1e2,n)i 1n 1ei,n 1) (e 1 Qn 1)i 1n 1(ei 1其中
11、1 n11 ne,n 1e,e21en 1 i 1n 1 i 2残差序列代入上式求的一阶自相关系数r 0.60966再令:y* yi 1 ryi,X* N 1 rXi,i 1,.,n 1用EXCEL完成数据的迭代得到新的数据,这里用丫1代表原先的lnY , K1代表原先的InK , L1代表原先的InL。并导入到SPSS中,重复以上步骤对新的数 据进行回归分析。得出结果的:数据经过一次迭代以后DW勺值有明显增加,查表k=3, n=20(k为解释变量 的数目,包括常数项,n是观察值的数目)时,5%勺上下界:dL二,dU三有duDW4-d, 认为残差序列间不存在一阶自相关。此时得到新的回归方程:丫
12、1 2.216 0.610K1 0.920L16. 残差正态性检验点击“绘制”按钮,将“ ZRESID选入丫轴,“ZPRED选入X轴,绘制散点图,并在“标准化残差图”中选择“直方图” ,输出带有正态曲线的标 准化残差的直方图。点击“保存”按钮,在对话框中保存一些统计量的值,此案例在“预测值”框中 选择“未标准化”,在“残差”框中选择“未标准化” ,在“预测区间”框中选择“均值”和“单值”。其他不变,点击【继续】-【确定】。输出结果如下图:上面操作已输出残差的直方图,还可以通过【分析】-【描述统计】-【P-P 图】和【分析】-【描述统计】-【Q-Q图】输出正态分布的P-P图、Q-Q图, 若散点围
13、绕图中所给斜线有规律的分布,则可以认为所检测变量服从正态分布。P-P 图Q-Q图从以上图形可以初步认为该模型的残差服从正态分布。进一步进行 K-S 检 验。选择【分析】-【非参数检验】-【旧对话框】-【 1-样本 K-S 检验】,弹 出“单样本 Kolmogorov-Smirnov 检验”窗口,将未标准化残差选入变量框,K-S 检验输出结果K-S检验统计量为,检验概率p值为,大于,可以认为在95%勺置信水平下,该模型的残差服从正态分布7. 残差的其他检验 (1) 异方差检验:根据回归分析输出的标准化残差的散点图, 初步判断是否存在异方差, 但此 种判断方法较主观,且不容易判断。进一步用Spea
14、rman等级相关检验分析是否存在异方差。首先对未标准化残 差取绝对值,点击【转换】-【计算变量】,弹出“计算变量”窗口,“目标变量” 输入“abs”,“数学表达式”输入“abs(RES_1)”,选择【分析】-【相关】-【双 变量】,将abs、所有回归变量及未标准化预测值选入变量框中,【相关系数】栏选择“ Spearman,点击确定。Spearman 相关系数表观察系数表的“ abs”行,发现未标准化预测值与残差绝对值的相关性p值为大于,说明该模型的残差不存在的异方差问题。rln ki)0.920(1 n h 1 Inh)五、实验总结Y12.216 0.610K1 0.920L1Y1ln Yi 1r ln YiK1ln ki 1r ln kiL1lnli 1r l nh, i 1,., n 1代入上式得回归方程为:根据上述分析,采用逐步回
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 承包地土地租赁合同
- 乡村旅游开发实施细则指南
- 挡土墙工程劳务承包合同
- 预制砼界碑施工方案
- 镂空砖隔断施工方案
- 遂宁雨水收集系统施工方案
- 四川球场拼装地板施工方案
- 沙坪坝餐厅石膏板施工方案
- 沥青站搬迁改造方案
- 青浦区遮阳停车棚施工方案
- 2021北京高三期末文言文阅读汇编
- 护理查房-股骨颈骨折护理查房
- 新教科版六年级科学下册教学计划
- 物候期观察记录表(竖向表)
- 《西方文明史》课程教学大纲
- GB/T 4348.2-2014工业用氢氧化钠氯化钠含量的测定汞量法
- GB/T 23265-2009水泥混凝土和砂浆用短切玄武岩纤维
- 《中华人民共和国宪法》知识测试题
- DB31-T 1338-2021 船舶供应服务物料产品分类与编码要求
- 常用法定计量单位及使用规则
- 铁路工程质量管理与质量验收标准培训课件
评论
0/150
提交评论