




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四讲线性回归分析的扩展
LinearRegressionAnalysis:Extension一、引言:放宽经典模型的假设二、多重共线性三、异方差性四、序列相关五、设定误差第四讲线性回归分析的扩展
LinearRegressi一、引言:放宽经典模型的假设一、引言:放宽经典模型的假设引言:放宽经典模型的假设经典正态线性回归模型(CNLRM)的假定(一)关于模型的假定回归模型对参数而言是线性的模型是正确设定的(二)关于解释变量的假定解释变量X是确定性变量若X是随机的,则误差项与X不相关解释变量的取值有足够变异解释变量之间不存在完全的线性关系引言:放宽经典模型的假设经典正态线性回归模型(CNLRM)的3引言:放宽经典模型的假设经典正态线性回归模型(CNLRM)的假定(三)关于误差项的假定对于给定的X,误差项均值为0对于给定的X,误差项方差相等对于给定的X,误差项之间不存在序列相关误差项服从正态分布引言:放宽经典模型的假设经典正态线性回归模型(CNLRM)的4引言:放宽经典模型的假设放宽的假定相应的问题假定1、2模型设定问题假定3、4随机解释变量假定5过度决定(微数缺测性)假定6多重共线性假定7误差项均值非零假定8异方差性假定9序列相关假定10误差项非正态分布假定3和4在联立方程模型中讨论对假定5我们做简单讨论假定7影响参数估计的无偏性,暂不讨论假定10对于大样本数据不是必需的假定。本讲主要考虑放宽了其余假定后面临的问题引言:放宽经典模型的假设放宽的假定相应的问题假定1、2模型设5引言:放宽经典模型的假设微数缺测性从理论上讲,样本容量n和解释变量数目k必须满足n>k+2,才能进行OLS估计和假设检验。但事实上,即便n满足上述条件,但如果样本很小,那么虽然能够进行估计和检验,也很难通过t检验。引言:放宽经典模型的假设微数缺测性6什么是多重共线性多重共线性的影响多重共线性的诊断多重共线性的处理二、多重共线性什么是多重共线性二、多重共线性什么是多重共线性多重共线性(multicollinearity):回归模型中的一些或全部解释变量之间存在一定程度的线性关系什么是多重共线性多重共线性(multicollinearit8什么是多重共线性例题4.1其他例题:p200X1
X2X3X410555267158075251895973424125129183015515289什么是多重共线性例题4.1X1X2X3X4105552679什么是多重共线性图形表示:巴伦坦图YX1X2YX1X2低度多重共线性高度多重共线性什么是多重共线性图形表示:巴伦坦图YY低度多重共线性高度多重10什么是多重共线性产生多重共线性的原因样本过小模型设定有误:添加了过多的解释变量由于样本过小,即便在总体中解释变量之间没有线性关系,也可能在获得的样本中观察到较强的线性关系什么是多重共线性产生多重共线性的原因11多重共线性的影响存在完全线性关系时的OLS估计无法得到OLS估计量例题:p201-202多重共线性的影响存在完全线性关系时的OLS估计12多重共线性的影响存在多重共线性关系时的OLS估计可以证明即便存在多重共线性,OLS估计量仍然是BLUE,但系数估计量的方差较大,从而不容易通过t检验,同时预测区间变宽,降低了预测精确度。例题:p202-203多重共线性的影响存在多重共线性关系时的OLS估计例题:p2013多重共线性的影响影响程度的度量:方差膨胀因子(variance-inflationfactor)多重共线性的影响影响程度的度量:方差膨胀因子(varianc14多重共线性的影响例题4.2RjVIFj0.001.00A0.501.331.33A0.905.765.76A0.9510.2610.26A0.9950.2550.25A多重共线性的影响例题4.2RjVIFj0.001.00A0.15多重共线性的诊断简单诊断方法R2高而单个系数的t值小,换言之,F检验显著,但显著的t值少任意两个解释变量之间的相关系数较大,比如大于0.9解释变量之间的偏相关系数较大简单方法一般来说不很精确多重共线性的诊断简单诊断方法16多重共线性的诊断运用回归分析进行诊断逐步分析法:先引入经济意义明显,并且在统计上最显著的解释变量,然后逐步引入其他解释变量。如果新引入的解释变量使原有解释变量的系数估计值发生明显变化,或t统计量明显变小,则说明新引入的解释变量与原有解释变量之间存在多重共线性,可以去掉新引入的解释变量辅助回归法:做每一个解释变量对其余解释变量的回归,得出相应的F统计值,如果在给定的显著性水平下F统计值是显著的,说明该解释变量与其他解释变量之间存在线性关系,可以去掉该解释变量(p207,p211)多重共线性的诊断运用回归分析进行诊断17多重共线性的诊断运用一些指标进行诊断方差膨胀因子:计算每个解释变量的方差膨胀因子VIF,一般认为如果VIF大于10,说明该变量与其他变量存在高度共线性容许度(tolerance):定义容许度TOL如下,一般认为如果TOL小于0.1,说明该变量与其他变量存在高度共线性条件指数(conditionindex,CI):一般认为,如果条件指数在10到30之间,存在较强的多重共线性,如果大于30,则存在严重的多重共线性多重共线性的诊断运用一些指标进行诊断18多重共线性的诊断例题4.3(p218)YConsumptionX1IncomeX2Wealth7080810651001009901201273951401425110160163311518018761202002052140220220115524024351502602686例题:p209-211多重共线性的诊断例题4.3(p218)YX1X27080819多重共线性的诊断几点说明多重共线性是一个程度问题而不是存在与否的问题多重共线性是关于样本的一种特征如果研究是为了估计斜率系数和预测,多重共线性不是一个严重的问题;但如果研究的主要目的是假设检验,则高度多重共线性的危害就很大多重共线性的诊断几点说明20多重共线性的处理剔除共线性变量中不太重要的解释变量补充新数据重新设定模型练习题:p216-217,习题10.14-10.19多重共线性的处理剔除共线性变量中不太重要的解释变量21什么是异方差性异方差性的影响异方差性的诊断异方差性的处理三、异方差性什么是异方差性三、异方差性什么是异方差性异方差性(heteroscedasticity):回归模型误差项的方差不相同同方差性(homoscedasticity):回归模型误差项的方差不相同什么是异方差性异方差性(heteroscedasticity23什么是异方差性同方差性XY概率密度X:受教育年限Y:工资什么是异方差性同方差性XY概率密度X:受教育年限24什么是异方差性异方差性XY概率密度X:收入Y:消费支出什么是异方差性异方差性XY概率密度X:收入25什么是异方差性异方差性XY概率密度X:时间Y:打字错误例题:p220-224什么是异方差性异方差性XY概率密度X:时间例题:p220-226什么是异方差性产生异方差性的原因原因解释变量:收入被解释变量:消费支出解释变量与误差项相关随着收入的增加,支出差异性更大有重要的解释变量未被包含在回归模型中物价也是影响支出的因素,物价上涨时,高收入者有可能拿出更多的钱来消费,因而支出差异性更大异常值(outliers)什么是异方差性产生异方差性的原因原因解释变量:收入解释变量与27异方差性的影响回归系数的OLS估计量虽然是无偏的、一致的,但不再是有效的回归标准差的估计不再是无偏的回归系数OLS估计量的方差估计不再是无偏的,因而t统计量不再服从t分布,F统计量不再服从F分布,从而无法进行区间估计和假设检验无法根据回归结果进行预测异方差性的影响回归系数的OLS估计量虽然是无偏的、一致的,但28异方差性的诊断图解法布罗施-培甘检验(Breusch-Pagantest)怀特检验(Whitetest)帕克检验(Parktest)Glesjertest戈德菲尔德-匡特检验(Goldfeld-Quandttest)异方差性的诊断图解法29异方差性的诊断图解法在同方差假定下作回归分析,用残差项平方与解释变量做散点图X异方差性的诊断图解法X30异方差性的诊断图解法:简便处理用残差项平方与因变量拟合值做散点图异方差性的诊断图解法:简便处理31异方差性的诊断例题4.4(p222)1988年美国公司销售额与研发支出的关系异方差性的诊断例题4.4(p222)32异方差性的诊断例题4.4异方差性的诊断例题4.433异方差性的诊断布劳殊-培干检验(Breusch-Pagantest)异方差性的诊断布劳殊-培干检验(Breusch-Pagan34异方差性的诊断例题4.4:BPTest异方差性的诊断例题4.4:BPTest35异方差性的诊断怀特检验(Whitetest)异方差性的诊断怀特检验(Whitetest)36异方差性的诊断怀特检验的特例异方差性的诊断怀特检验的特例37异方差性的诊断例题4.4:WhiteTest异方差性的诊断例题4.4:WhiteTest38异方差性的诊断在EViews等计量经济学软件中,直接提供White异方差检验的结果,不需要手工计算。异方差性的诊断在EViews等计量经济学软件中,直接提供Wh39异方差性的处理加权最小二乘法(WeightedLeastSquare,WLS)WLS是广义最小二乘估计(GeneralizeLeastSquare,GLS)方法中的一种通过WLS可以得到BLUE重新设定模型怀特一致协方差矩阵估计(WhiteHeteroskedasticity-ConsistenceCovarianceMatrixEstimation)得到无偏一致估计量(在大样本情形下适用)异方差性的处理加权最小二乘法(WeightedLeast40异方差性的处理加权最小二乘估计:误差项方差已知异方差性的处理加权最小二乘估计:误差项方差已知41异方差性的处理加权最小二乘估计:误差项方差未知异方差性的处理加权最小二乘估计:误差项方差未知42异方差性的处理例题4.4:加权最小二乘估计(p233)1988年美国公司销售额与研发支出的关系异方差性的处理例题4.4:加权最小二乘估计(p233)43异方差性的处理可行的广义最小二乘估计在一般情况下,我们并不知道异方差的具体形式,需要对异方差的函数形式做出估计,然后再进行加权最小二乘估计,这种方法属于可行的广义最小二乘估计(FeasibleGeneralizedLeastSquare,FGLS)(伍德里奇,2000;赵国庆,2001)异方差性的处理可行的广义最小二乘估计44异方差性的处理可行的广义最小二乘估计异方差性的处理可行的广义最小二乘估计45异方差性的处理例题4.51996年中国各省市城镇居民人均收入与人均消费的关系异方差性的处理例题4.546异方差性的处理重新设定模型例题:p235异方差性的处理重新设定模型例题:p23547异方差性的处理例题4.51996年中国各省市城镇居民人均收入与人均消费的关系异方差性的处理例题4.548异方差性的处理怀特一致协方差矩阵估计如果存在异方差,则对于通过OLS得到的估计量不能进行t检验和F检验。EViews等软件提供怀特一致协方差矩阵估计量(WhiteHeteroskedasticity-ConsistenceCovarianceMatrixEstimator),这种方法提供大样本情形下回归标准差和回归系数的一致估计量,可以进行t检验和F检验。例题:p236异方差性的处理怀特一致协方差矩阵估计49异方差性的处理例题4.6:怀特一致协方差矩阵估计1998年中国各省市城镇居民人均可支配收入与通讯交通支出异方差性的处理例题4.6:怀特一致协方差矩阵估计50什么是序列相关序列相关的影响序列相关的诊断序列相关的处理四、序列相关什么是序列相关四、序列相关什么是序列相关序列相关(serialcorrelation):回归模型的误差项之间不完全独立,存在一定程度的相关。也称自相关(autocorrelation)序列相关经常出现在时间序列数据中,但在横截面数据中也会出现什么是序列相关序列相关(serialcorrelation52什么是序列相关序列相关图示tut无序列相关什么是序列相关序列相关图示tut无序列相关53什么是序列相关序列相关图示Tutut-1utTututut-1正相关负相关什么是序列相关序列相关图示Tutut-1utTututut-54什么是序列相关产生序列相关的原因原因实例惯性或滞后经济周期;消费惯性有重要的解释变量未被包含在回归模型中在研究总量生产函数时,没有考虑政策的影响,而政策对总产量的影响在每一期都可能是正的或负的什么是序列相关产生序列相关的原因原因实例惯性或滞后经济周期;55序列相关的影响回归系数的OLS估计量虽然是无偏的、一致的,但不再是有效的回归系数OLS估计量的方差估计不再是无偏的,一般而言会低估实际的方差,从而使得系数的显著性检验容易被通过,而实际上该系数是不显著的t检验和F检验是不准确的序列相关的影响回归系数的OLS估计量虽然是无偏的、一致的,但56序列相关的影响序列相关对方差估计的影响:图示总体回归曲线样本回归曲线XtYt序列相关的影响序列相关对方差估计的影响:图示总体回归曲线样本57序列相关的影响序列相关对方差估计的影响(1)序列相关的影响序列相关对方差估计的影响(1)58序列相关的影响序列相关对方差估计的影响(2)序列相关的影响序列相关对方差估计的影响(2)59序列相关的影响序列相关对方差估计的影响(3)序列相关的影响序列相关对方差估计的影响(3)60序列相关的影响序列相关对方差估计的影响(4)序列相关的影响序列相关对方差估计的影响(4)61序列相关的影响序列相关对方差估计的影响(5)序列相关的影响序列相关对方差估计的影响(5)62序列相关的诊断图解法:在无序列相关的假定下作回归分析,然后用残差项与时间变量做散点图,或者用本期的残差与上一期的残差做散点图(p248)游程检验(runstest,p249-250)德宾-沃森检验序列相关的诊断图解法:在无序列相关的假定下作回归分析,然后用63序列相关的诊断例题4.7:图解法1968-1987年美国居民对进口商品的消费支出与可支配收入的关系(数据在p116)序列相关的诊断例题4.7:图解法64序列相关的诊断德宾-沃森检验(Durbin-Watsontest)序列相关的诊断德宾-沃森检验(Durbin-Watsont65序列相关的诊断德宾-沃森检验(Durbin-Watsontest)序列相关的诊断德宾-沃森检验(Durbin-Watsont66序列相关的诊断德宾-沃森检验(Durbin-Watsontest)根据OLS估计的残差计算出来的d统计量服从特定的分布,可根据样本容量n和解释变量数目k查表并判断是否存在序列相关d的值域序列相关性(0,dL)正的序列相关[dL,dU]无法判定(dU,4-dU)无序列相关[4-dU,4-dL]无法判定(4-dU,4)负的序列相关序列相关的诊断德宾-沃森检验(Durbin-Watsont67序列相关的诊断德宾-沃森检验的步骤对原方程进行OLS估计得到残差根据d统计量的公式计算d值根据样本容量和解释变量数目查找d的下临界值和上临界值根据决策规则判定是否存在一阶自相关统计软件会自动计算d值,因此我们需要做的仅是后两步序列相关的诊断德宾-沃森检验的步骤68序列相关的诊断例题4.7:德宾-沃森检验进口商品消费支出(IMPORT)与可支配收入(PDI)例题:p252-253序列相关的诊断例题4.7:德宾-沃森检验例题:p252-2569序列相关的诊断德宾-沃森检验的适用条件回归模型中有常数项误差项为一阶自相关不含有因变量的滞后项(不是自回归模型)序列相关的诊断德宾-沃森检验的适用条件70序列相关的诊断包含滞后变量(自回归模型)的序列相关诊断对于此类模型,DW检验是无效的,为此,Durbin提出可以计算h统计量来进行序列相关诊断(平狄克、鲁宾费尔德,1998)序列相关的诊断包含滞后变量(自回归模型)的序列相关诊断71序列相关的处理出现序列相关的原因有很多,我们仅仅考虑最简单的情况,即存在一阶自相关时对于序列相关问题的处理序列相关的处理出现序列相关的原因有很多,我们仅仅考虑最简单的72序列相关的处理基本思想序列相关的处理基本思想73序列相关的处理一阶差分法注意:使用一阶差分法时不含截距项序列相关的处理一阶差分法注意:使用一阶差分法时不含截距项74序列相关的处理例题4.7:一阶差分法序列相关的处理例题4.7:一阶差分法75序列相关的处理根据d统计量估计自相关系数序列相关的处理根据d统计量估计自相关系数76序列相关的处理例题4.7:根据d统计量估计自相关系数序列相关的处理例题4.7:根据d统计量估计自相关系数77序列相关的处理根据OLS估计的残差估计自相关系数序列相关的处理根据OLS估计的残差估计自相关系数78序列相关的处理例题4.7:根据OLS估计的残差估计自相关系数序列相关的处理例题4.7:根据OLS估计的残差估计自相关系数79什么是设定误差设定误差的影响设定误差的诊断和处理测量误差五、设定误差什么是设定误差五、设定误差什么是设定误差经典正态线性模型假定模型的设定是正确的,但一般情况下我们建立的模型很可能是不正确的,这种情况称为设定误差(specificationerror)好模型的标准节省性(parsimony)可识别性(identifiability)拟和优度(goodnessoffit)理论一致性(theoreticalconsistency)预测能力(predictivepower)什么是设定误差经典正态线性模型假定模型的设定是正确的,但一般81什么是设定误差设定误差的类型遗漏相关变量包含无关变量采用错误函数形式什么是设定误差设定误差的类型82什么是设定误差例题4.8:设定误差1968-1987年美国居民对进口商品的消费支出(IMPORT)与可支配收入(PDI)的关系什么是设定误差例题4.8:设定误差83设定误差的影响遗漏相关变量:回归系数的OLS估计量可能是有偏的、非一致的;系数的方差估计也是有偏的包含无关变量:回归系数的OLS估计量是无偏的,方差估计也是无偏的,但不是最小方差,因而OLS估计量不是有效的(证明见古扎拉蒂(1995),参看例题13.3)错误的函数形式:回归系数的OLS估计量可能是有偏的(参看例题13.4)一般来说,遗漏相关变量的后果要严重一些,因为它损失了无偏性。特别是当样本比较大时,包含不相关变量带来的自由度减少不太严重,因而包含不相关变量的影响要小一些设定误差的影响遗漏相关变量:回归系数的OLS估计量可能是有偏84设定误差的影响遗漏相关变量的影响证明见古扎拉蒂(1995)或平狄克等(1998)例题13.1、13.2设定误差的影响遗漏相关变量的影响85设定误差的诊断和处理遗漏相关变量和采用错误的函数形式根据设定好的模型进行OLS估计,对结果进行判断残差图R2和调整的R2与预期相比,系数估计值的符号回归系数的t值德宾-沃森d统计量如果R2较低,或者系数估计值的符号与预期相反,或者有很多t值不显著,或者d统计量偏小。就有可能是因为遗漏了某个相关变量,或者采用了错误的函数形式特别是,d统计量偏小很可能不是因为序列相关,而是因为遗漏了某个相关变量。因此,如果加入某些变量后d统计量接近2,那么就应该把这些变量包含在模型中设定误差的诊断和处理遗漏相关变量和采用错误的函数形式86设定误差的诊断和处理例题4.9(p272)美国居民对进口商品的消费支出与可支配收入的关系设定误差的诊断和处理例题4.9(p272)87设定误差的诊断和处理包含无关变量如果不知道某个变量是否应包含在模型中,可将该变量加入模型进行回归并作t检验,如果不显著,该变量很可能是多余的如果不知道某些变量是否应包含在模型中,可将该变量加入模型进行回归,并对这些变量的系数做联合F检验(对于线性约束的检验),如果不显著,这些变量很可能是多余的(也可以应用似然比检验)例题13.5注意:如果根据理论分析,某些变量必须包括在模型中,那么即便这些变量的回归系数不显著,也应该把他们保留在模型中设定误差的诊断和处理包含无关变量88设定误差的诊断和处理一般情况下设定误差的检验(RESET)回归设定误差检验(regressionspecificationerrortest)参看古扎拉蒂(1995)、伍德里奇(2000)设定误差的诊断和处理一般情况下设定误差的检验(RESET)89设定误差的诊断和处理一般情况下设定误差的检验(RESET)Eviews等计量经济学软件会给出每个回归方程的RamseyRESET统计量,从而判断是否存在设定误差通过RESET可以判断是否存在设定误差,但无法得知正确的模型应该如何设定设定误差的诊断和处理一般情况下设定误差的检验(RESET)90设定误差的诊断和处理判断回归模型预测效果的指标如果要对两个回归模型的预测效果做出比较,不能对R2进行比较Eviews等计量经济学软件会给出每个回归方程的AIC(Akaikeinformationcriterion)和SC(Schwarzcriterion),这两个指标越低的回归方程预测效果越好设定误差的诊断和处理判断回归模型预测效果的指标91测量误差例题4.10:测量误差(measurementerror)测量误差例题4.10:测量误差(measurementer92测量误差测量误差的影响因变量存在测量误差:回归系数的OLS估计量是无偏的,方差估计也是无偏的,但OLS估计量不是有效的自变量存在测量误差:回归系数的OLS估计量是有偏的、非一致的测量误差的诊断和助理诊断是否存在测量误差需要应用豪斯曼检验(HausmanTest),对测量误差进行纠正则应该使用工具变量法(参看:平狄克等,1998)测量误差测量误差的影响93第四讲线性回归分析的扩展
LinearRegressionAnalysis:Extension一、引言:放宽经典模型的假设二、多重共线性三、异方差性四、序列相关五、设定误差第四讲线性回归分析的扩展
LinearRegressi一、引言:放宽经典模型的假设一、引言:放宽经典模型的假设引言:放宽经典模型的假设经典正态线性回归模型(CNLRM)的假定(一)关于模型的假定回归模型对参数而言是线性的模型是正确设定的(二)关于解释变量的假定解释变量X是确定性变量若X是随机的,则误差项与X不相关解释变量的取值有足够变异解释变量之间不存在完全的线性关系引言:放宽经典模型的假设经典正态线性回归模型(CNLRM)的96引言:放宽经典模型的假设经典正态线性回归模型(CNLRM)的假定(三)关于误差项的假定对于给定的X,误差项均值为0对于给定的X,误差项方差相等对于给定的X,误差项之间不存在序列相关误差项服从正态分布引言:放宽经典模型的假设经典正态线性回归模型(CNLRM)的97引言:放宽经典模型的假设放宽的假定相应的问题假定1、2模型设定问题假定3、4随机解释变量假定5过度决定(微数缺测性)假定6多重共线性假定7误差项均值非零假定8异方差性假定9序列相关假定10误差项非正态分布假定3和4在联立方程模型中讨论对假定5我们做简单讨论假定7影响参数估计的无偏性,暂不讨论假定10对于大样本数据不是必需的假定。本讲主要考虑放宽了其余假定后面临的问题引言:放宽经典模型的假设放宽的假定相应的问题假定1、2模型设98引言:放宽经典模型的假设微数缺测性从理论上讲,样本容量n和解释变量数目k必须满足n>k+2,才能进行OLS估计和假设检验。但事实上,即便n满足上述条件,但如果样本很小,那么虽然能够进行估计和检验,也很难通过t检验。引言:放宽经典模型的假设微数缺测性99什么是多重共线性多重共线性的影响多重共线性的诊断多重共线性的处理二、多重共线性什么是多重共线性二、多重共线性什么是多重共线性多重共线性(multicollinearity):回归模型中的一些或全部解释变量之间存在一定程度的线性关系什么是多重共线性多重共线性(multicollinearit101什么是多重共线性例题4.1其他例题:p200X1
X2X3X410555267158075251895973424125129183015515289什么是多重共线性例题4.1X1X2X3X410555267102什么是多重共线性图形表示:巴伦坦图YX1X2YX1X2低度多重共线性高度多重共线性什么是多重共线性图形表示:巴伦坦图YY低度多重共线性高度多重103什么是多重共线性产生多重共线性的原因样本过小模型设定有误:添加了过多的解释变量由于样本过小,即便在总体中解释变量之间没有线性关系,也可能在获得的样本中观察到较强的线性关系什么是多重共线性产生多重共线性的原因104多重共线性的影响存在完全线性关系时的OLS估计无法得到OLS估计量例题:p201-202多重共线性的影响存在完全线性关系时的OLS估计105多重共线性的影响存在多重共线性关系时的OLS估计可以证明即便存在多重共线性,OLS估计量仍然是BLUE,但系数估计量的方差较大,从而不容易通过t检验,同时预测区间变宽,降低了预测精确度。例题:p202-203多重共线性的影响存在多重共线性关系时的OLS估计例题:p20106多重共线性的影响影响程度的度量:方差膨胀因子(variance-inflationfactor)多重共线性的影响影响程度的度量:方差膨胀因子(varianc107多重共线性的影响例题4.2RjVIFj0.001.00A0.501.331.33A0.905.765.76A0.9510.2610.26A0.9950.2550.25A多重共线性的影响例题4.2RjVIFj0.001.00A0.108多重共线性的诊断简单诊断方法R2高而单个系数的t值小,换言之,F检验显著,但显著的t值少任意两个解释变量之间的相关系数较大,比如大于0.9解释变量之间的偏相关系数较大简单方法一般来说不很精确多重共线性的诊断简单诊断方法109多重共线性的诊断运用回归分析进行诊断逐步分析法:先引入经济意义明显,并且在统计上最显著的解释变量,然后逐步引入其他解释变量。如果新引入的解释变量使原有解释变量的系数估计值发生明显变化,或t统计量明显变小,则说明新引入的解释变量与原有解释变量之间存在多重共线性,可以去掉新引入的解释变量辅助回归法:做每一个解释变量对其余解释变量的回归,得出相应的F统计值,如果在给定的显著性水平下F统计值是显著的,说明该解释变量与其他解释变量之间存在线性关系,可以去掉该解释变量(p207,p211)多重共线性的诊断运用回归分析进行诊断110多重共线性的诊断运用一些指标进行诊断方差膨胀因子:计算每个解释变量的方差膨胀因子VIF,一般认为如果VIF大于10,说明该变量与其他变量存在高度共线性容许度(tolerance):定义容许度TOL如下,一般认为如果TOL小于0.1,说明该变量与其他变量存在高度共线性条件指数(conditionindex,CI):一般认为,如果条件指数在10到30之间,存在较强的多重共线性,如果大于30,则存在严重的多重共线性多重共线性的诊断运用一些指标进行诊断111多重共线性的诊断例题4.3(p218)YConsumptionX1IncomeX2Wealth7080810651001009901201273951401425110160163311518018761202002052140220220115524024351502602686例题:p209-211多重共线性的诊断例题4.3(p218)YX1X270808112多重共线性的诊断几点说明多重共线性是一个程度问题而不是存在与否的问题多重共线性是关于样本的一种特征如果研究是为了估计斜率系数和预测,多重共线性不是一个严重的问题;但如果研究的主要目的是假设检验,则高度多重共线性的危害就很大多重共线性的诊断几点说明113多重共线性的处理剔除共线性变量中不太重要的解释变量补充新数据重新设定模型练习题:p216-217,习题10.14-10.19多重共线性的处理剔除共线性变量中不太重要的解释变量114什么是异方差性异方差性的影响异方差性的诊断异方差性的处理三、异方差性什么是异方差性三、异方差性什么是异方差性异方差性(heteroscedasticity):回归模型误差项的方差不相同同方差性(homoscedasticity):回归模型误差项的方差不相同什么是异方差性异方差性(heteroscedasticity116什么是异方差性同方差性XY概率密度X:受教育年限Y:工资什么是异方差性同方差性XY概率密度X:受教育年限117什么是异方差性异方差性XY概率密度X:收入Y:消费支出什么是异方差性异方差性XY概率密度X:收入118什么是异方差性异方差性XY概率密度X:时间Y:打字错误例题:p220-224什么是异方差性异方差性XY概率密度X:时间例题:p220-2119什么是异方差性产生异方差性的原因原因解释变量:收入被解释变量:消费支出解释变量与误差项相关随着收入的增加,支出差异性更大有重要的解释变量未被包含在回归模型中物价也是影响支出的因素,物价上涨时,高收入者有可能拿出更多的钱来消费,因而支出差异性更大异常值(outliers)什么是异方差性产生异方差性的原因原因解释变量:收入解释变量与120异方差性的影响回归系数的OLS估计量虽然是无偏的、一致的,但不再是有效的回归标准差的估计不再是无偏的回归系数OLS估计量的方差估计不再是无偏的,因而t统计量不再服从t分布,F统计量不再服从F分布,从而无法进行区间估计和假设检验无法根据回归结果进行预测异方差性的影响回归系数的OLS估计量虽然是无偏的、一致的,但121异方差性的诊断图解法布罗施-培甘检验(Breusch-Pagantest)怀特检验(Whitetest)帕克检验(Parktest)Glesjertest戈德菲尔德-匡特检验(Goldfeld-Quandttest)异方差性的诊断图解法122异方差性的诊断图解法在同方差假定下作回归分析,用残差项平方与解释变量做散点图X异方差性的诊断图解法X123异方差性的诊断图解法:简便处理用残差项平方与因变量拟合值做散点图异方差性的诊断图解法:简便处理124异方差性的诊断例题4.4(p222)1988年美国公司销售额与研发支出的关系异方差性的诊断例题4.4(p222)125异方差性的诊断例题4.4异方差性的诊断例题4.4126异方差性的诊断布劳殊-培干检验(Breusch-Pagantest)异方差性的诊断布劳殊-培干检验(Breusch-Pagan127异方差性的诊断例题4.4:BPTest异方差性的诊断例题4.4:BPTest128异方差性的诊断怀特检验(Whitetest)异方差性的诊断怀特检验(Whitetest)129异方差性的诊断怀特检验的特例异方差性的诊断怀特检验的特例130异方差性的诊断例题4.4:WhiteTest异方差性的诊断例题4.4:WhiteTest131异方差性的诊断在EViews等计量经济学软件中,直接提供White异方差检验的结果,不需要手工计算。异方差性的诊断在EViews等计量经济学软件中,直接提供Wh132异方差性的处理加权最小二乘法(WeightedLeastSquare,WLS)WLS是广义最小二乘估计(GeneralizeLeastSquare,GLS)方法中的一种通过WLS可以得到BLUE重新设定模型怀特一致协方差矩阵估计(WhiteHeteroskedasticity-ConsistenceCovarianceMatrixEstimation)得到无偏一致估计量(在大样本情形下适用)异方差性的处理加权最小二乘法(WeightedLeast133异方差性的处理加权最小二乘估计:误差项方差已知异方差性的处理加权最小二乘估计:误差项方差已知134异方差性的处理加权最小二乘估计:误差项方差未知异方差性的处理加权最小二乘估计:误差项方差未知135异方差性的处理例题4.4:加权最小二乘估计(p233)1988年美国公司销售额与研发支出的关系异方差性的处理例题4.4:加权最小二乘估计(p233)136异方差性的处理可行的广义最小二乘估计在一般情况下,我们并不知道异方差的具体形式,需要对异方差的函数形式做出估计,然后再进行加权最小二乘估计,这种方法属于可行的广义最小二乘估计(FeasibleGeneralizedLeastSquare,FGLS)(伍德里奇,2000;赵国庆,2001)异方差性的处理可行的广义最小二乘估计137异方差性的处理可行的广义最小二乘估计异方差性的处理可行的广义最小二乘估计138异方差性的处理例题4.51996年中国各省市城镇居民人均收入与人均消费的关系异方差性的处理例题4.5139异方差性的处理重新设定模型例题:p235异方差性的处理重新设定模型例题:p235140异方差性的处理例题4.51996年中国各省市城镇居民人均收入与人均消费的关系异方差性的处理例题4.5141异方差性的处理怀特一致协方差矩阵估计如果存在异方差,则对于通过OLS得到的估计量不能进行t检验和F检验。EViews等软件提供怀特一致协方差矩阵估计量(WhiteHeteroskedasticity-ConsistenceCovarianceMatrixEstimator),这种方法提供大样本情形下回归标准差和回归系数的一致估计量,可以进行t检验和F检验。例题:p236异方差性的处理怀特一致协方差矩阵估计142异方差性的处理例题4.6:怀特一致协方差矩阵估计1998年中国各省市城镇居民人均可支配收入与通讯交通支出异方差性的处理例题4.6:怀特一致协方差矩阵估计143什么是序列相关序列相关的影响序列相关的诊断序列相关的处理四、序列相关什么是序列相关四、序列相关什么是序列相关序列相关(serialcorrelation):回归模型的误差项之间不完全独立,存在一定程度的相关。也称自相关(autocorrelation)序列相关经常出现在时间序列数据中,但在横截面数据中也会出现什么是序列相关序列相关(serialcorrelation145什么是序列相关序列相关图示tut无序列相关什么是序列相关序列相关图示tut无序列相关146什么是序列相关序列相关图示Tutut-1utTututut-1正相关负相关什么是序列相关序列相关图示Tutut-1utTututut-147什么是序列相关产生序列相关的原因原因实例惯性或滞后经济周期;消费惯性有重要的解释变量未被包含在回归模型中在研究总量生产函数时,没有考虑政策的影响,而政策对总产量的影响在每一期都可能是正的或负的什么是序列相关产生序列相关的原因原因实例惯性或滞后经济周期;148序列相关的影响回归系数的OLS估计量虽然是无偏的、一致的,但不再是有效的回归系数OLS估计量的方差估计不再是无偏的,一般而言会低估实际的方差,从而使得系数的显著性检验容易被通过,而实际上该系数是不显著的t检验和F检验是不准确的序列相关的影响回归系数的OLS估计量虽然是无偏的、一致的,但149序列相关的影响序列相关对方差估计的影响:图示总体回归曲线样本回归曲线XtYt序列相关的影响序列相关对方差估计的影响:图示总体回归曲线样本150序列相关的影响序列相关对方差估计的影响(1)序列相关的影响序列相关对方差估计的影响(1)151序列相关的影响序列相关对方差估计的影响(2)序列相关的影响序列相关对方差估计的影响(2)152序列相关的影响序列相关对方差估计的影响(3)序列相关的影响序列相关对方差估计的影响(3)153序列相关的影响序列相关对方差估计的影响(4)序列相关的影响序列相关对方差估计的影响(4)154序列相关的影响序列相关对方差估计的影响(5)序列相关的影响序列相关对方差估计的影响(5)155序列相关的诊断图解法:在无序列相关的假定下作回归分析,然后用残差项与时间变量做散点图,或者用本期的残差与上一期的残差做散点图(p248)游程检验(runstest,p249-250)德宾-沃森检验序列相关的诊断图解法:在无序列相关的假定下作回归分析,然后用156序列相关的诊断例题4.7:图解法1968-1987年美国居民对进口商品的消费支出与可支配收入的关系(数据在p116)序列相关的诊断例题4.7:图解法157序列相关的诊断德宾-沃森检验(Durbin-Watsontest)序列相关的诊断德宾-沃森检验(Durbin-Watsont158序列相关的诊断德宾-沃森检验(Durbin-Watsontest)序列相关的诊断德宾-沃森检验(Durbin-Watsont159序列相关的诊断德宾-沃森检验(Durbin-Watsontest)根据OLS估计的残差计算出来的d统计量服从特定的分布,可根据样本容量n和解释变量数目k查表并判断是否存在序列相关d的值域序列相关性(0,dL)正的序列相关[dL,dU]无法判定(dU,4-dU)无序列相关[4-dU,4-dL]无法判定(4-dU,4)负的序列相关序列相关的诊断德宾-沃森检验(Durbin-Watsont160序列相关的诊断德宾-沃森检验的步骤对原方程进行OLS估计得到残差根据d统计量的公式计算d值根据样本容量和解释变量数目查找d的下临界值和上临界值根据决策规则判定是否存在一阶自相关统计软件会自动计算d值,因此我们需要做的仅是后两步序列相关的诊断德宾-沃森检验的步骤161序列相关的诊断例题4.7:德宾-沃森检验进口商品消费支出(IMPORT)与可支配收入(PDI)例题:p252-253序列相关的诊断例题4.7:德宾-沃森检验例题:p252-25162序列相关的诊断德宾-沃森检验的适用条件回归模型中有常数项误差项为一阶自相关不含有因变量的滞后项(不是自回归模型)序列相关的诊断德宾-沃森检验的适用条件163序列相关的诊断包含滞后变量(自回归模型)的序列相关诊断对于此类模型,DW检验是无效的,为此,Durbin提出可以计算h统计量来进行序列相关诊断(平狄克、鲁宾费尔德,1998)序列相关的诊断包含滞后变量(自回归模型)的序列相关诊断164序列相关的处理出现序列相关的原因有很多,我们仅仅考虑最简单的情况,即存在一阶自相关时对于序列相关问题的处理序列相关的处理出现序列相关的原因有很多,我们仅仅考虑最简单的165序列相关的处理基本思想序列相关的处理基本思想166序列相关的处理一阶差分法注意:使用一阶差分法时不含截距项序列相关的处理一阶差分法注意:使用一阶差分法时不含截距项167序列相关的处理例题4.7:一阶差分法序列相关的处理例题4.7:一阶差分法168序列相关的处理根据d统计量估计自相关系数序列相关的处理根据d统计量估计自相关系数169序列相关的处理例题4.7:根据d统计量估计自相关系数序列相关的处理例题4.7:根据d统计量估计自相关系数170序列相关的处理根据OLS估计的残差估计自相关系数序列相关的处理根据OLS估计的残差估计自相关系数171序列相关的处理例题4.7:根据OLS估计的残差估计自相关系数序列相关的处理例题4.7:根据OLS估计的残差估计自相关系数172什么是设定误差设定误差的影响设定误差的诊断和处理测量误差五、设定误差什么是设定误差五、设定误差什么是设
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年软磁材料项目发展计划
- 2025年高中语文100个常用成语高中三年都适用
- 2025年高中人教版地理选修四《城乡规划》知识点归纳
- 3 心脏和血液 教学设计-2023-2024学年科学五年级上册教科版
- 2023一年级数学下册 五 加与减(二)练习三教学实录 北师大版
- 7生命最宝贵 (教学设计)2024-2025学年统编版道德与法治三年级上册
- 农村社区公共服务体系建设与创新方案
- 2024年春八年级历史下册 第13课 民族团结与共同繁荣教学实录1(pdf) 川教版
- 健康管理手册与饮食运动建议(侧重健康生活)
- 农业科技行业农业信息化技术应用测试卷
- 2025年全国高考体育单招政治时事填空练习50题(含答案)
- 2024年医疗器械经营质量管理规范培训课件
- 中华人民共和国学前教育法-知识培训
- 2024年计算机二级WPS考试题库380题(含答案)
- 节能评估报告编制要求 具体规定
- 基于智能巡检机器人与PLC系统联动控制设计和实现电子信息工程专业
- 毕业设计(论文)VFP小说租阅管理系统
- 河南省内影响工程选址的主要活动断裂资料汇编(最终版)
- (完整版)幼儿园教师优质课评分表
- 河北省工伤职工停工留薪期分类目录 (工伤)
- 人民调解档案规范文本.doc调解文书的格式及使用说明
评论
0/150
提交评论