版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第6 6章章 多重共线性多重共线性6.1 多重共线性及其产生的原因6.1.1 6.1.1 多重共线性多重共线性( (MulticollinearityMulticollinearity) )的定义的定义 6.1.2 多重共线性产生的原因 根据经验,多重共线性产生的经济背景和原因有以下几个方面: 1经济变量之间往往存在同方向的变化趋势 2经济变量之间往往存在着密切的关联度 3在模型中引入滞后变量也容易产生多重共线性 4在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性 6.2 多重共线性造成的影响以二元线性回归模型为例: 由此可知,参数估计量经济含义不合理。当解释变量存在多重共线性时
2、,虽然可以得到参数的最小二乘估计值,但估计值很不稳定,即使样本观测数据发生微小变化,都会造成模型参数估计值的很大变化。6.3 6.3 多重共线性的检验多重共线性的检验6.3.1 相关系数检验法(Klein判别法) EViews软件中可以直接计算(解释)变量的相关系数矩阵: 命令方式 COR 解释变量名 菜单方式 将所有解释变量设置成一个数组,并 在 数 组 窗 口 中 点 击 Vi e w C o v a r i a n c e AnalysisCorrelations 。6.3.2 法勒格劳伯(FarrarGlauber)检验 6.3.3 6.3.3 方差膨胀因子检验方差膨胀因子检验 6.3
3、.4 特征值检验 考察解释变量的样本数据矩阵: 利用特征值还可以构造两个用于检验多重共线性的指标:条件数(或病态数)CN(Condition Number)和条件指数(或病态指数)CI(Condition lndex)。其指标定义为CN=最大特征值最小特征值 这两个指标都反映了特征值的离散程度,数值越大,表明多重共线性越严重。一般的经验法则是:CI10即认为存在多重共线性,大于30认为存在严重的多重共线性。6.3.5 根据回归结果判断下的临界值,而发现:(1)系数估计值的符号与理论分析结果相违背;(2)某些变量对应的回归系数t值偏低或不显著;(3)当一个不太重要的解释变量被删除后,或者改变一个
4、观测值时,回归结果显著变化,则该模型可能存在多重共线性。 例6.3.1 分析我国居民家庭电力消耗量与可支配收入及居住面积的关系,以预测居民家庭对电力的需求量(具体数据见表6.3.1)。表6.3.1 我国居民家庭电力消耗量与可支配收入及居住面积统计资料年度年度年人均家庭电力消耗年人均家庭电力消耗量(千瓦小时)量(千瓦小时)人均居住面积人均居住面积(平方米)(平方米)年人均可支配收入年人均可支配收入指数(指数(1978=1001978=100)1985198521.221.212.4512.45243.17243.171986198623.223.213.0213.02254.28254.2819
5、87198726.426.413.4913.49265.39265.391988198831.231.213.9413.94277.61277.611989198935.335.314.4214.42273.49273.491990199042.442.414.8714.87281.33281.331991199146.946.915.4415.44289.71289.711992199254.654.615.6415.64307.66307.661993199361.261.216.9916.99321.07321.071994199472.772.716.6516.65339.33339.
6、331995199583.583.517.2517.25356.58356.581996199693.193.117.8217.82383.95383.9519971997101.8101.818.3318.33399.85399.85首先,作家庭电力消耗量电量与家庭可支配收入的回归模型,结果如下:可见,收入对用电量有很好的解释作用。然后,作用电量与住房面积的的回归方程,结果如下:同样,住房面积对电力也有很好的解释作用。作二元回归方程,结果如下:表6.3.2 回归结果 住房面积的系数在方程(6.3.7)中是显著的,在方程(6.3.8)中不显著;从F统计量值可以看出,收入和住房面积对电力消费量的
7、共同影响是显著的。 (1)相关系数检验:数组窗口中点击ViewCorrelations,结果如表6.3.3所示:表6.3.3 相关系数 X1与X2相关系数高达0.963124,两者高度正相关。 图6.3.1 住房面积与收入之间的关系图 (2)辅助回归模型检验:将住房面积对收入进行回归,住房面积与收入之间存在显著的线性关系。2402803203604004401213141516171819X1X2(3)方差膨胀因子检验:6.4 多重共线性的解决方法 6.4.1 保留重要的解释变量,去掉次要的或可替代的解释变量 6.4.2 利用先验信息改变参数的约束形式 根据经济理论或其他信息,找出参数间的某种
8、关系,并将这种关系作为约束条件与样本信息结合起来,进行有约束的最小二乘估计。例如,著名的Cobb-Douglas生产函数中: 6.4.3 变换模型的形式 对原设定的模型进行适当的变换,也可以消除或削弱原模型中解释变量之间的相关关系。具体有三种变换方式,一是变换模型的函数形式;二是变换模型的变量形式;三是改变变量的统计指标。 例6.4.1 在电力消费量函数中,电力消费量与收入和住房面积之间可能是对数形式的模型,而不是线性模型。我们利用对数模型拟合上述数据,结果如下:表6.4.1 回归结果 与方程(6.3.8)相比,在对数模型中,收入和住房面积系数在统计上都是显著的,回归模型在整体上也是显著的。说
9、明我们原先设计的线性回归模型是有误的。 例6.4.2 根据表6.4.2,建立我国进口需求与GNP和消费价格指数之间的关系模型。表6.4.2 我国进口支出与GNP和消费价格指数 (单位:亿元人民币)年份GNP(当年价)进口总额IM消费价格指数CPI19858989.11257.8100.0198610201.41498.3106.5198711954.51614.2114.3198814922.32055.1135.8198916917.82199.9160.2199018598.42574.3165.2199121662.53398.7170.8199226651.94443.3181.719
10、9334560.55986.2208.4199446670.09960.1258.6199557494.911048.1302.9199666850.511557.4328.0199773142.711806.5337.2199878017.811622.4334.5根据表6.4.2中的数据,回归结果如表6.4.3所示。 表6.4.3 回归结果 回归结果表明,在5%的显著性水平下,收入和价格的系数各自均不是统计显著的。模型通过F检验。我们可以断定方程(6.4.5)中存在严重的多重共线性。为解决这个问题,我们可以用实际进口额对实际收入进行回归,得到如下结果: 表6.4.4 回归结果 这表明,实际
11、进口额与实际收入显著正相关。这样,通过将名义变量转换为实际变量,显然削弱了原模型中的多重共线性。 6.4.4 综合使用时序数据与截面数据 在模型的参数估计中,如果模型利用的是时间序列数据,这时模型又存在多重共线性,可考虑用时间序列数据与截面数据相结合的办法来修正多重共线性对模型的影响。 6.4.5 逐步回归法 从所有解释变量中间先选择影响最为显著的变量建立模型,然后再将模型之外的变量逐个引入模型;每引入一个变量,就对模型中的所有变量进行一次显著性检验,并从中剔除不显著的变量;逐步引入剔除引入,直到模型之外所有变量均不显著时为止。这种消除多重共线性的方法称为逐步回归法也称Frisch综合分析法。
12、 具体步骤为 (1)利用相关系数从所有解释变量中选取相关性最强的变量建立一元回归模型。 (2)在一元回归模型中分别引入第二个变量,共建立k-1个二元回归模型(设共有k个解释变量),从这些模型中再选取一个较优的模型。选择时要求模型中每个解释变量影响显著,参数符号正确,调整的R2值有所提高。 (3)在选取的二元回归模型中以同样方式引入第三个变量;如此下去,直至无法引入新的变量时为止。6.4.6 增加样本容量 6.4.7 主成分回归 其基本原理是:利用主成分分析将解释变量转换成若干个主成分,这些主成分从不同侧面反映了解释变量的综合影响,并且互不相关。因此,可以将被解释变量关于这些主成分进行回归,再根
13、据主成分与解释变量之间的对应关系,求得原回归模型的估计方程。 主成分回归的具体步骤为6.5 6.5 案例分析案例分析我国旅游市场收入函数我国旅游市场收入函数 根据理论和经验分析,影响国内旅游市场收入Y的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数X1,城镇居民人均旅游支出X2,农村居民入均旅游支出X3,并以公路里程X4和铁路里程X5作为相关基础设施的代表。统计数据如表6.5.1所示。试估计以下形式的计量经济模型: 其中,Y为全国旅游收入(亿元);X1为国内旅游人数(万人次);X2为城镇居民人均旅游支出(元);X3为农村居民人均旅游支
14、出(元);X4为公路里程(万km);X5为铁路里程(万km)。表6.5.1 19942003年中国旅游收入及相关数据年份全国旅游收入(亿元)国内旅游人数(万人次)城镇居民人均旅游支出(元)农村居民人均旅游支出(元)公路里程(万km)铁路里程(万km)19941023.552400414.754.9111.785.9019951375.762900464.O61.5115.705.9719961638.463900534.170.5118.586.4919972112.764400599.8145.7122.646.6019982391.269450607.0197.0127.856.64199
15、92831.971900614.8249.5135.176.7420003175.574400678.6226.6140.276.8720013522.478400708.3212.7169.807.0120023878.487800739.7209.1176.527.1920033442.387000684.9200.0180.987.30 利用EViews软件,输入Y、X1、X2、X3、X4、X5等数据,采用这些数据对模型进行OLS回归,结果如表6.5.2所示。表6.5.2 回归结果由此可见,该模型可决系数很高,F检验值173353,明显显著。但是X1、X5系数的t检验不显著,而且X5系数
16、的符号与预期的相反,这表明很可能存在严重的多重共线性。 1多重共线性检验 (1)相关系数检验相关系数检验 在命令窗口键入:COR Y X1 X2 X3 X4 X5,输出的相关系数矩阵为 表6.5.3 相关系数矩阵 由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。 (2)辅助回归模型检验)辅助回归模型检验 建立每个解释变量对其余解释变量的辅助回归模型: 从以上辅助回归模型中的R2、F统计量的数值可以看出,解释变量X1、X2、X3、X4、X5之间存在较为严重的多重共线性。 (3)方差膨胀因子检验 从以上辅助回归模型可知,VIF1 =17.9;VIF2 =19.
17、2;VIF3 =4.4;VIF4 =10.9;VIF5 =20。明显大于10,解释变量X1、X2、X3、X4、X5之间存在较为严重的多重共线性。 2修正多重共线性:逐步回归法 采用逐步回归的办法,去检验和解决多重共线性问题。分别做Y对X1、X2、X3、X4、X5的一元回归,结果如表6.5.4所示。表6.5.4 一元回归结果(被解释变量为Y,下同)解释变量X1X2X3X4X5参数估计值0.0849.05211.66734.3322014.146t统计量8.66613.1605.1976.4688.749R20.9040.9560.7720.8390.905调整的R20.8920.9500.743
18、O.8200.894 其中,含有解释变量X2的回归方程,调整的R2最大,以X2为基础,顺次加入其他变量逐步回归,结果如表6.5.5所示。表6.5.5 加入新变量的回归结果(一)变量X1X2X3X4X5Adj-R2X2、X10.030(2.153)6.194(4.287)0.966X2、X38.017(5.748)1.716(0.858)0.949X2、X46.737(6.645)10.908(2.658)0.972X2、X57.851(2.909)285.178(0.462)0.945 经比较,新加入X4的方程,其调整的R2=0.972,改进最大,而且各参数的t检验显著,选择保留X4,再加入其
19、他新变量逐步回归,结果如表6.5.6所示。表6.5.6 加入新变量的回归结果(二)变量X1X2X3X4X5Adj-R2X2、X4、X10.009(0.423)6.355(4.522)8.565(1.215)0.968X2、X4、X34.216(3.945)3.222(3.068)13.629(4.693)0.987X2、X4、X58.098(4.078)12.928(2.639)-424.396(-0.805)0.970 在X2、X4基础上加入X3后的方程,其调整的R2=0.987明显增大,而且各个参数t检验都显著。加入X1后不仅调整的R2下降,而且X4参数的t检验变得不显著。加入X5后不仅调
20、整的R2下降,X5参数的t检验不显著,甚至X5的符号也变得不合理。 保留X3,再加入其他新变量逐步回归,结果如表6.5.7所示。加入X1后调整的R2没有改进,而且X1参数的t检验不显著。加入X5后虽然调整的R2略有改进,但X5参数的t检验不显著,并且参数为负值不合理。这说明X1、X5引起严重多重共线性,应予剔除。表6.5.7 加入新变量的回归结果(三)最后修正严重多重共线性影响的回归结果如表6.5.8所示。变量X1X2X3X4X5Adj-R2X2、X4、X3、X10.008(0.516)3.919(3.067)3.200(2.852)11.677(2.389)0.985X2、X4、X3、X55
21、.699(4.173)3.297(3.471)15.969(5.264)-480.610(-1.535)0.990表6.5.8 最终回归结果 这说明,在其他因素不变的情况下,当城镇居民人均旅游支出X2和农村居民人均旅游支出X3分别增l加100元,公路里程X4每增加1万km时,国内旅游收入Y将分别增加421.6亿元、322.2亿元和13.629亿元。 利用利用EViews6.0解决本例多重共线性问题:逐步解决本例多重共线性问题:逐步回归法回归法 在主窗口,选择QuickEstimate Equation,在弹出方程设定对话框通过估计方法的下拉选单选择逐步最小二乘法(STEPIS-Stepwise
22、 Least Squares),EViews将显示逐步最小二乘法的设定(Specification)标签页,如图6.5.1所示。图6.5.1 方程设定标签页 逐步回归采用列表式进行变量的基本设定。在第一个编辑区域,首先设定被解释变量,在第二个编辑区域,输入设定被解释变量。本例在第一个设定框内输入:Y C,在第二个框内输入: X1 X2 X3 X4 X5,然后,可以利用选项(Options)标签页来控制逐步回归具体采用的方法。 打开选项(Options),见图6.5.2。其中选择模型(Selection Method)部分用来设定逐步回归的方法,包括单向逐步回归法(Uni-directional
23、),有进有出逐步回归法(Stepwise),交换逐步回归法(Swapwise)和组合逐步回归法(Combinatorial)。EViews6.0默认使用前向有进有出(Stepwise-forwards)法。图6.5.2 逐步回归法设定 对话框中的其他选项随选择方法不同而变化。对于单向(Uni-directional)逐步回归和有进有出(Stepwise)逐步回归,可以设定前向和后向两种方法。这两种方法添加或剔除变量的终止准则有p值和t统计量两种选项,同时终止程序的准则还可以采用“利用回归变量个数”(Use number of regressors),需要在相应的编辑区域提供回归变量个数。 在对
24、话框可以看到程序的最大回归步数(Maximum steps)。如果设定向模型中添加变量的最大步数,就要选用前向(Forwards)方法,如果设定从模型中剔除变量的最大步数,则要使用后向(Backwards)方法,同时还要设定模型添加和剔除变量的总步数(Total),一般情况下应设定一个较大数值。 交换逐步回归法需要选择利用最大R2还是最小R2,并选择添加变量的个数。组合逐步回归法的选项只需要提供添加变量的个数。一般选择能够使R2有最大改进的变量添加到模型中。 每种方法都有权重(Weight series)数列的选择,以执行加权最小二乘法。如果选择利用权重数列(Use weight series),在编辑区输入权重数列名称即可。 对于本例,在Selection Method部分,采用默认的前向有进有出法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度石粉独家供应合同3篇
- 2024年度农业物流运输服务承包合同3篇
- 二零二四年度消防改造工程招投标代理合同
- 2024全新煤矸石运输合同下载
- 2024年度演出合同注意事项及条款3篇
- 2024年广告创意设计合同标的及应用场景
- 2024年屋顶花园租赁合同3篇
- 2024年品牌授权独家经销协议模板一
- 2024年办公用房租赁合同3篇
- 2024年工程爆破劳务分包协议2篇
- 山东省2024年冬季普通高中学业水平合格考试语文仿真模拟卷02(考试版)
- 公司安全事故隐患内部举报、报告奖励制度
- 2024年劳务员考试题库及答案【夺冠】
- 2024-2030年中国聚酰胺6(PA6)行业产能预测及投资风险研究报告
- 凝血系统课件教学课件
- 2025届高考英语二轮复习《七选五》备考策略课件
- 化工厂光化车间停车检修施工方案
- 油漆涂料行业生产技术标准
- 2024年铁总服务中心招聘6人高频难、易错点500题模拟试题附带答案详解
- 福建省泉州市2023-2024学年高一上学期期末质检英语试题(解析版)
- 中华人民共和国民法典(总则)培训课件
评论
0/150
提交评论