版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、题 及 参 考 解 答假设在模型Yi2X 2i3X3iUi中,X2与X3之间的相关系数为零,于是有人建议你进行如下回归:Y2X3X:2i3iUiiU2i是否存在?2 且?3?为什么?var ?3 ?是否有 var ?2var ?2 且 var 4练习题参考解答:存在?2g且?3?3。因为?22“ X2iX3i2X2i2X3iyi X3i X2i X3i2X2iX3i当X2与X3之间的相关系数为零时,离差形式的x2i x3i有?22yiX2iX3i2X2iX3iyiX2i?会等于z或?的某个线性组合因为Y?2X2?2 X22X3由于?2X 22X2Y ?1X2Y?2X2X21X2J3存在var2
2、 var ?2 且 varvar当230时,同理,有var2X2i1r23var 22 .2X2i 1r2322-varX2i3 var 2在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据f检验看其对ess的贡献而作出决定的。根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗?为什么?练习题参考解答:根据对多重共线性的理解,逐步向前和逐步向后回归的程序都存在不足。逐步向前法不能反映引进新的
3、解释变量后 的变化情况,即一旦引入就保留在方程中;逐步向后法则一旦某个解释变量被剔出就再也没有机会重新进入方程。而解所以要寻找到“最优”变量子集则采用逐步回归较好,下表给出了中国商品进口额释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而呈现出不同, 它吸收了逐步向前和逐步向后的优点。丫、国内生产总值GDP居民消费彳/b格指数 CPI。lnY 1+ 2lnGDPt表中国商品进口额、列 模 型3lnCPIt Ui国内生产总值、居民消费价格指数1)利用表中数据估计此模型的参数。2)你认为数据中有多重共线性吗?3)进行以下回归:根据这些回归你能对数据中多重共线性的 性质说些什么
4、?4)假设数据有多重共线性,但?2和?3在5%平上个别地显着,并且总的 F检验也是显着的。对这样的情形,我们是否应考虑共线性的问题?练习题参考解答:(1)参数估计结果如下DepEmScrrl VarMbt LN¥Mvihod Lr»1 SqiurnsUatc 皿1 行门口 Tirar riD:13SafTple.ZED?耻G/曲皿/胤iMi* 2JVaiiEiblecciniD&fitSt1占Kif1-stallagepHibc3就。即愣网颉子qcowLNGDP1助必.LyjJUtV .二1a.ooiEiLMCPI-1.0670534K加胡a 01R-EMda-Bd
5、也曲2怕hfean比你倒日回如金9.15S3030.S9IWSjD.l27e50JS E炉:1"口片/山|ri - 1- r即5“313463Suvi3工us卜三d归5匐0L7719K2S*NArrr :rie«-inn- 1tLonIS 1CM21275093Qu褊冷刃和切口 starII .ocaowln(进 口) 3.060 1.6571n(GDP) 1.0571n(CPI) (0.337) (0.092)(0.215)R2 0.992 R2 0.991 F 1275.093(括号内为标准误),且且CPI与进口之间的简单相关系数呈现正向(2)居民消费价格指数的回归系数
6、的符号不能进行合理的经济意义解释 变动。可能数据中有多重共线性。LNGDPLNCPILNGDP1 .ooocoo0 964803LNCPI0.964E061 ODOOOD计算相关系数:(3)最大的CI=,表明GD吗CPI之间存在较高的线性相关。(4)分别拟合的回归模型如下:GDP和CPI对进口分别有显着的单一影响,在这两个变量同单方程拟合效果都很好,回归系数显着,可决系数较高, 时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现 (5)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引起注意。自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解
7、释变量数据矩阵X才可能避免多重共线性的出现?练习题参考解答:本题很灵活,主要应注意以下问题:(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与解释变量之间要有因果关系,并高度相关。(2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。克莱因与戈德伯格曾用 1921-1950年(1942-1944年战争期间略去)美国国内消费丫和工资收入XI、非工资一非农业 收入X2、农业收入X3的时间序列资料,利用 OLSE古计得出了下列回归方程:括号中的数据为相应参数估计量的标准误差。试对上述模型进行评析,指出其中存在的问题。练习题参考解答:从模型拟合结果可知
8、,样本观测个数为27,消费模型的判定系数 R2 0.95, F统计量为,在置信水平下 查分子自由度为3,分母自由度为23的F临界值为,计算的F值远大于临界值,表明回归方程是显着的。 模型整体拟合程度较高。依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值:8.133 八1.059 八0.452 八 .0.121 八一to 0.91,t1 6.10, t2 0.69,t3 0.11 除 t1外,其余8.920.170.661.09的tj值都很小。工资收入 X1的系数的t检验值虽然显着,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为,意味着工资收入每增加一美元,消费支出的
9、增长平均将超过一美元,这与经济理论和常识不符。另外,理论上非工资一非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表 产业发展水平
10、及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率()X7(代表 能源转换技术)等在1985-2007年期间的统计数据,具体如表所示。表19852007年统计数据资料来源:中国统计年鉴,中国统计出版社2000、2008年版。要求:1)建立对数多元线性回归模型,分析回归结果。2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。 练习题参考解答:(1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下:生成:lny=log(y), 同样方法生成
11、:Inx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7.作全部变量对数线性多元回归,结果为:从修正的可决系数和 F统计量可以看出,全部变量对数线性多元回归整体对样本拟合很好,各变量联合起来对能源消费影响显着。可是其中的lnX3、lnX4、lnX6对lnY影响不显着,而且lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。(2)预料此回归模型会遇到多重共线性问题,因为国民总收入与 GDP本来就是一对关联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是GDP的组成部分。这两组指标必定存在高度相关。解释变量国民总收入(亿元)X1(代表收入水平)、
12、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、 建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率()X7(代表能源转换技术)等很可能线性相关,计算相关系数如下: 可以看出lnx1与lnx2、lnx3、lnx4、lnx5、lnx6之间高度相关,许多相关系数高于以上。如果决定用表中全部 变量作为解释变量,很可能会出现严重多重共线性问题。(3)因为存在多重共线性,解决方法如下:A:修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型:而对变量取
13、对数后,能源消费 总量的对数与人均生活电力消费的对数相关程度最高,可建立这两者之间的回归模型。如B:进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。采用逐步回归的办法,去检验和解决多重共线性问题。分别作 ln Y对ln X1,ln X2,ln X31n X4,ln X51n X6,ln X7的一元回归,结果如下:一元回归结果:其中加入lnX6的方程调整的可决系数最大,以lnX6为基础,顺次加入其他变量逐步回归。结果如下表经比较,新加入lnX5的方程调整可决系数改进最大,各参数的t检验也都显着,但是lnX5参数的符号与经济意义不符合。若再 加入其他变量后的逐步回归,若剔除
14、不显着的变量和无经济意义的变量后,仍为第一步所建只包含lnX6的一元回归模型。如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。例如,不取对数作全部变量多元线性回归,结果为:可以看出还是有严重多重共线性。作逐步回归:分别作一元回归得到:以X1为基础加入其他变量,结果为:注:括号中为p彳I.可以发现加入X2、X5 X& X7后参数的符号不合理,加入X4后并不显着。只有加入X3后修正的可决系数有所提高 而且参数符号的经济意义合理 ,X3参数估计值的p值为,在10%勺显着性水平下是显着的。所以相对较为合理的模型估 计结果可以为:在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗? ”的例子中,如果所采用的数据如下表所示试分析:为什么会出现本章开始时所得到的异常结果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度电商平台赠品营销合作合同3篇
- 2024年度个人教育贷款合同终止及还款计划协议3篇
- 2024年中英进口农产品加工设备采购合同范本3篇
- 2024年度高低压配电施工责任承包协议版B版
- 2024年小客车车牌指标租赁及租赁车辆安全协议3篇
- 2024年教育行业母子公司股权转让与教育资源整合协议3篇
- 2024年度商业连锁分租合作协议3篇
- 海珠区年度初中信息技术结业考试质量分析
- 化工工程安装合同范例
- 灯箱广告含税合同范例
- 2024年电子交易:电脑买卖合同
- 中国文化概论知识试题与答案版
- 期末复习提升测试(试题)(含答案)2024-2025学年四年级上册数学人教版
- 铸牢中华民族共同体意识-形考任务3-国开(NMG)-参考资料
- 学术交流英语(学术写作)智慧树知到期末考试答案章节答案2024年哈尔滨工程大学
- TSEESA 010-2022 零碳园区创建与评价技术规范
- 无形资产评估习题与实训参考答案
- 国内异形盾构机分析课件
- 唤醒孩子内驱力家校共育家庭教育PPT课件(带内容)
- 合成气精脱硫催化剂的研究报告
- 市政项目吊装施工方案
评论
0/150
提交评论