版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第8章多公选:说明了与变量相关的结果,本章想回答以下问题:多重共线性的特性是什么?多重共线性的理论结果是什么?多公选的实际结果是什么?实际上如何发现多重共线性?多重共线性真的是个问题吗?消除多重共线性的补偿措施是什么?8.1多重共线性的特点:完全多重共线性的情况下,8.2近似或不完全多重共线性的情况下,8.3多重共线性的理论结果,8.4多重共线性的实际结果,8.5多重共线性的诊断8.6多重共线性的诊断不一定好,8.7的扩展例子:1960-1982年的美国鸡肉需求8.8如何解决多重共线性:解决方法8.9摘要,简单表8-1假设X3和X4是两个研究人员估计的,为了区别,X3称为收入,X4称为工资。展
2、开需求函数,将其写入:yi=a1 a2x 2i a3x 3i ui(8-1)yi=B1 b2x 2i b3x 4i ui(8-2)这两个需求函数取决于不同的收入衡量标准。8.1多重共线性特性:对于完全多重共线性,当回归到表8-1中的数据时,计算机拒绝“回归”估计。(Excel软件和Eviews软件的情况不同。)价格(X2)和收入(X3)的关系图,请参见图8-1。从X3返回X2后,X3i=300-2X2i R2(=r2)=1.00 (8-3),即收入变量(X3)和价格变量(X2)完全相关,因此存在多个公用路线。图8-1收入X3与价格X2的关系图具有完全的共线性,因此不能对方程(8-1)进行回归估
3、计。将方程式(8-3)取代为方程式(8-1)时:yi=a1 a2x 2ia 3(300-2x2i)ui=(a1 300 a3)(a2-2 a3)x2i ui=c1c 2x 2i ui(8-4),其中C1=a1 300 a3se=(0.746)(0.1203)t=(66.538)(-17.935)R2=0.9757(8-7),C1=49.667,C2,如果解析变数之间有完整的多重共线,则无法取得所有参数的唯一估计,也无法对参数执行假设测试。其中,多重共线表示两个或多个变量完全线性相关,完全多重共线的情况。实际上,完全的多重共线性较少。在大多数情况下,如果两个或更多的解析变量接近完全线性相关或非常
4、线性的关系,则称为接近或不完全的多重共线或高度多重共线关系。结论:对于、8.2近似或不完全多重路线,结果如下:se=(120.06)(0.8122)(0.4003)t=(1.2107)(-3.4444)(-0.7971)R2=0.9778(8-)表8-1中的数据使用收入作为收入变量返回。Eviews软件回归结果:ls y c2x4,先验信息,Eviews文件,结论:(1)不能估计回归方程(8-1),但(8-2)(2)与预测相同,方程式(8-7)和(8-8)的价格系数都是负数,两者之间的数值差异很小。(3)方程式(8-8) R2的值比率(8-7)仅增加0.0020,此增量在统计上并不重要。(4)
5、收益(收益)变量的系数在统计上不重要。而且对于一般商品,这个符号是错误的。(5)销售变量不重要,但价格和收益共同对商品的需求有相当大的影响。价格和收入图表(请参见图8-2)。如图所示,价格和利润之间有很高的相关性。这两个变量之间的回归方程如下:x4i=299.92-2.0055 x2 I ei(8-9)se=(0.6748)(0.1088)t=(444.44)(-18.44)RR相关系数为-0.9884,即高度共线或接近完全多孔线。相关系数为-1时,表示完全多重共线性状态。图8-2工资X4和价格X2的关系图:只有说明变量的两种情况下,相关系数r可以用作共同线性度的衡量标准。但是,如果有多个变量
6、,则相关系数不适用于测量公用线。在8.3经典线性回归模型(CLRM)的假设下,OLS估计是最佳线性偏转估计(BLUE)。如果变量之间存在多条公共关系,OLS估计值会怎么样?完全多重共线性的结果:不存在参数估计,无法估计模型的参数。接近或高度多孔线的结果:(1)即使接近孔线,OLS估计也没有偏转。即使某些系数在统计上不重要,仍是最佳线性偏转估计量。(2)近似协方差也不破坏OLS估计的最小方差。但是,最小方差并不意味着平方差也很小。(3)多重共线性本质上是样本(回归)现象。8.4多重共线性的实际结果可能产生接近或高多重共线性的情况下(1)OLS估计的方差和标准差较大的一个或多个结果。(2)信任区间
7、扩大了。(3)t值不重要。(4)R2的值很高,但t的值并不都很重要。(5)OLS估计及其标准偏差对数据的微小更改非常敏感。(6)回归系数符号无效。(7)很难测量单个解释变量对回归平方和或R2的贡献。由于分析变量之间存在公共关系,因此分析变量前面的参数反映了正在分析的变量的共同影响,而不是反映了正在分析的变量和每个变量之间的结构关系。因此,由于各自的参数已经失去了正当的经济意义,因此看起来异常的现象也经常出现,回归参数的符号与经济理论不符。即,多重共线性的存在导致OLS估计的标准差增大,参数估计的经济意义不合理,变量的重要性检查失去了意义,无法衡量每个解释变量的贡献。8.5多重共线性诊断,多重共
8、线性带来的严重后果,我们非常担心模型是否有多重共线性和多重共线性。多重通用性是范例特性,必须注意以下问题:(1)多共性是程度问题,而不是存在。(2)多重共线性是在假设变量为无定形的条件下发生的问题,因此不是整体特性,而是样本的特性。测量特定样品的多重共线性时常用的定律如下:(1)R2很高,但t值相当小。(参考(8-8)的回归结果)(2)变量两个高度的相关解释。但是这个标准不太可靠。因为即使分析变量的两个相关系数较低,也可能存在较高的多重共线性。(3)检查部分相关系数。假定有三个解释变量:X2、X3和X4。R23表示X2和X3之间的相关系数。称为偏相关系数的相关系数r23.4是变量X4为常数的条
9、件下X2和X3之间的相关系数。部分相关系数是测试多重共线性的另一种方法。(4)“从属”(subsidiary)或“辅助”(auxiliary)回归。对其他解析变数执行每个解析变数的回归,并计算对应的R2值。每个此类回归称为从属回归或次要回归,依赖于所有变量的y回归。范例:x对X2、X3、X4、X5、X6、X7考虑这六个解析变数的回归。如果回归结果指示存在多条线性,则辅助回归可以帮助您确定哪些分析变量是线性的。在此示例中,假定对于每个解析的变量,存在容量50的随机示例,以执行剩馀解析变量的回归。f统计信息计算如下:其中n是观测值的数目,k是已解析变数(包括节距)的数目。每个次要回归的R2值为:R
10、22=0.90(X2其他分析变量的回归)R32=0.18(X3其他分析变量的回归)r42=0.36(其他分析变量的X4回归)r52=0.86(其他分析变量的X5回归)R62=0.09通过简单代数变换,这些方差公式可以写成、其中R22是X2和X3之间的辅助回归方程的样本确定系数。方程式(8-14)右侧的表示式称为漫射膨胀系数VIF,因为随R2的增加,系数B2,B3的散布度也会增加(膨胀)。还要注意,B2,B3的方差不仅取决于VIF,还取决于ui的方差及其变量X2,X3的方差。因此,如果Ri2的方差高,但ui的方差低,X2,X3的方差高,或者两种情况同时发生,则B2,B3的方差低,t的值高是很有可
11、能的。(8-14)因此,次回归方程的Ri2可以是多线性曲面指示器,不一定扩展估计量的标准偏差。高Ri2不是高标准偏差的必要条件或充分条件。多公线本身不一定导致高标准偏差。8.6多重共线性不一定是好的,(1)如果用模型预测所解释变量的未来平均值的研究,多重共线性本身未必是坏的。预测员通常根据分析能力(以R2衡量)选择模型。如果变量之间的多重共线性关系保持不变,即使模型具有这种多重共线性,也可以将模型用于预测。如果这种多重共线完全是随机抽样因素造成的,那么模型和预测都没有意义。(2)如果研究不仅仅是预测,而是明确地估计选定模型的各个参数,那么严重的多线性会成为“坏事”,因为估计量的标准差可能会增加
12、。8.7扩展实例:1960-1982年美国鸡肉需求,表7-8显示了美国1960-1982年当时平均人均鸡肉消费量(y(英镑)和人均实际(即通货膨胀调整后)可支配收入(X2(美元),),理论上,商品的需求通常是消费者实际收入,该商品的实际价格,以及竞争商品或补充商品实际价格的函数。预计需求函数包括:变量是平均每人鸡肉消费量(y)的自然对数。Eviews软件回归结果:ls log (y) c log (x2) log (x4) log (X5),治疗,进口价格猪肉,我们拟合了多个描述变量的双对数回归模型。因此,所有系数都是y相对于相应x变量的部分弹性。例如:需求的收入弹性约为0.34,需求的自身价
13、格弹性约为-0.50,需求(猪肉)的交叉弹性约为0.15,需求(牛肉)的交叉弹性约为0.09。回归结果表明,需求的收入和自身的价格弹性分别在统计上很重要,而两种交叉弹性在统计上并不重要。那么模型有多重共线性吗?鸡肉需求函数的协方差检查方程(8-15)相关矩阵:表8-3给出了四个解释变量(代数形式)之间的两个相关系数。在Eviews软件的数据窗口中,单击viewcorrelations即可。从表中可以看出,分析变量之间的两个相关系数都很高。但是,这并不意味着需求函数必须具有共线,只有可能性存在。发现辅助回归角解析变量与其他剩余解析变量回归时存在共线问题。表8-4中显示的结果表明了这一点。表8-4
14、次回归,ls log (x2) c log (x4) log (X5),通过观察上述回归结果中的R2值和f值,表明模型具有多重共线性。每个分析变量与其他分析变量共享高度。8.8解决多重共线性的方法:改进措施,1 .从模型中删除不重要的分析变量。2.汇入其他资料或新范例。3.重新考虑模型。4.使用词典信息。5.变量转换6。其他改进:如果要分析模型中变量之间的多重共线性(例如主成分分析),则简单的方法是从模型中删除一个或多个不重要的分析变量。但是,如果模型本身的设置有效,删除某些变量称为“模型设置错误”。提出了去除猪肉和牛肉价格变量后的回归结果,从8.8.1模型中删除了不重要的解释变量。重新考虑t
15、=(17.497) (18.284) (-5.8647),模型,回归结果与方程式(8-15)相比,收入弹性增加,但价格弹性绝对值减少。在回归方程(8-15)中,猪肉价格系数的t值大于1,从模型中删除此变量将减少调整后的R2。8.8.2获取其他数据或新示例。因为多重共线性是样例特性,重新选择样例可以解决多重共线性问题。但是该方法的可行性不高。因为:1。这是因为如果自行解释变量是线性关联的,则可能无法通过选择样本来消除共线性。2.如果可以重新选择样品以消除通用性,则不能保证重新提取的样品能达到此效果。3.一般的经济时间序列具有逆向性,不能重新提取样品。4.横断面数据也可以重新提取采样,但重新选择需要很高的成本。在某些情况下,通过获取附加数据增加样品的容量,可以消除非线性结果。样式(8-12
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年影视作品摄制合同协议书(含分成模式)
- 专业律师转租合同
- 2024年度智能物流系统设计与实施合同
- 2024施工合同司法解释
- 2024办公楼零星维修项目建设项目施工合同
- 农村合作信用社贷款合同
- 2024没有借条、合同的借贷关系案例
- 工程承包合同模板简化版
- 校园学生安全保障协议书样本
- 超值供货合同模板汇编
- 二年级排球教案
- 小数乘除法竖式计算专项练习题大全(每日一练共15份)
- 天津市和平区2024-2025学年九年级上学期期中考试英语试题
- 2024版抗菌药物DDD值速查表
- 2024二十届三中全会知识竞赛题库及答案
- 预防接种工作规范(2023年版)解读课件
- 医院检验外包服务项目招标文件
- 档案整理及数字化服务方案
- 正高级会计师答辩面试资料
- 道路桥涵工程施工方案(完整版)
- 60万吨MTO装置中交发言稿
评论
0/150
提交评论