赵卫亚3回归模型的扩展课件_第1页
赵卫亚3回归模型的扩展课件_第2页
赵卫亚3回归模型的扩展课件_第3页
赵卫亚3回归模型的扩展课件_第4页
赵卫亚3回归模型的扩展课件_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第四章回归模型的扩展一、异方差性二、自相关性三、多重共线性四、虚拟变量五、滞后变量(视时间安排)2一、异方差1、异方差的定义2、异方差产生的原因3、异方差性的后果4、异方差性的检验5、异方差性的解决办法6、案例分析31、异方差的定义

分析:5

定义:对于模型如果出现即对于不同的解释变量的值,随机误差项的方差不再是常数,则认为出现了异方差性(Heteroskedasticity)。ikiki1iiXXXYmbbbb+++++=L221062、异方差性产生的主要原因(1)假性异方差模型遗漏了重要的变量模型函数形式的设定误差解决方法:通过设定正确的模型来解决。7(2)真正的异方差,随机因素的影响截面数据中,波动(不确定性)与经济规模的比例关系。例如赚钱越多,消费的选择余地越大。时间序列中,波动的系统变化干中学的模型自回归条件异方差ARCH经验表明,横截面数据更易产生异方差性,我们主要研究横截面数据中的异方差问题83、异方差问题的后果计量经济模型一旦出现异方差,如果仍采用OLS估计模型参数,会产生以下后果OLS估计量仍然是线性、无偏的,但是OLS估计不再是有效估计。无法正确估计回归系数的标准差(参数估计的标准差出现偏差,有可能增大也可能偏小)T检验失效模型预测不准确(区间估计与随机误差项的方差有关)10常用方法(1)图示检验法(2)戈德菲尔德-匡特检验(3)怀特检验(4)帕克检验和戈里瑟检验11(1)、图示检验法相关图分析绘制YX的散点图考察Y的离散程度与解释变量是否有相关关系Eviews实现ScatxY13残差序列分布图考察残差分布图的离散程度。不存在异方差时,参差序列均匀分布在横轴上下一定范围如果随I(Xi)的增大,残差分布增加、减少,则可能存在异方差如果呈现其他规律变化,可能是复杂异方差,也可能是参数变化或者函数设定偏差14(a)(b)15(c)(d)17残差分析图的eview实现(SortX)LsYCXGenrE1=residGenrE2=abs(E1)或者genrE2=E1*E1ScatxE218(2)、戈德菲尔德-夸特

(Goldfeld-Quandt)检验G_Q检验的适用范围:样本容量较大单调异方差(异方差递增或者递减)的情形。对于复杂异方差则无法应用检验思路19具体步骤:1)将样本观察值Xi按大小顺序排列2)将序列中间的c个观察值除去,并将剩下的观察值划分成大小相同的两个子样本,每个子样本的容量为(n-c)/23)对每个子样本分别求回归方程,并计算各自的残差平方和21G-Q检验的Eviews实现SortXSmpl1x1LsYCX,求RSS1Smplx2nLsYCX,求RSS2计算F,查F临界值,并进行判断22G-Q检验缺点:无法确定具体形式,对于接下来如何解决异方差没有提供很好的建议对于复杂异方差不适用对于多元的情况,处理比较麻烦23(3)、怀特(white)检验怀特检验的适用范围(优点):任何形式的异方差(不仅限于单调异方差)对于多元模型也很方便可以初步推测异方差的形式。25怀特检验步骤(1)估计回归模型,并计算残差平方(2)估计辅助回归方程即将残差平方关于所有解释变量的一次项,二次项和交叉项回归。计算辅助回归的判定系数,可以证明:同方差假设下(

),渐进地有:在给定的显著性水平下,如果26注意:

辅助回归是残差平方(用以表示条件方差)与解释变量各种可能组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。不过为了节省自由度,往往到两次就可以了。在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。检验的是辅助回归方程的整体显著性29帕克检验的模型形式:30通常拟合和之间的回归模型:

戈里瑟检验形式31Park检验的Eviews实现LsYCXGENRLNE2=LOG(RESID^2)GENRLNX=LOG(X)LSLNE2CLNX32Gleiser检验的Eviews实现LsYCXGENRE=ABS(RESID)GENRX1=**(如:1/X,x*x等)LSECX1335、异方差性的解决办法如果是假性异方差模型遗漏重要变量函数形式设定不当(比如可以取对数)首先修正模型,若检验后发现异方差不存在了,说明原来的异方差是假性异方差。模型修正后就已经解决。345、异方差性的解决办法如果是真正的异方差(通过模型修正无法改善异方差的情形),利用增长率模型,将与规模有关的异方差去除或减弱。模型变换法加权最小二乘法(WLS)35(1)、模型变换法思想:通过对存在异方差的总体回归方程作适当的代换使之成为满足同方差假定的模型,然后用OLS估计。变换的关键是事先对异方差的具体形式有一个合理的假设。若其中σ2为常数,是不变方差,将上述回归模型两边除以,化为同方差(方差为)36假设原模型为:变换为新模型:新模型的变量:新模型的随机误差项的方差:37注意:模型的变换在相差一个常数的基础上,都可以化为同方差模型。对于变换后的模型,其方差是满足同方差的随机变量,故可以对模型实施普通最小二乘法估计。对新模型进行最小二乘估计的残差平方和的实质:(加权最小二乘)38。例:当f(Xi)取下列形式时,如何进行模型变换:1、2、3、39(2)、加权最小二乘法(WLS)在一元线性回归分析法中,对各点的残差平方和所提供的信息的重要程度是一视同仁的,它们在决定参数估计的过程中所起的作用是相同的(取了相同的权数)。在异方差的情况下,合理的做法是:对于较大的残差平方赋予较小的权重,而对于较小的残差平方则赋予较大的权重,这样可以提高参数估计的精度。在异方差存在的情况下,WLS估计量才是最优线性无偏估计量(BLUE)

40几点说明:例如,模型变换时?理解成权重,则构成了“加权最小二乘法”事实上权数可以选取任一变化趋势与异方差的趋势相反的变量序列416、案例分析42二、自相关问题及解决办法1、自相关性的定义2、自相关性产生的原因3、自相关性的后果4、自相关性的检验5、自相关性的解决方法6、案例分析431、自相关的定义自相关的概念:如果对于不同的样本点,随机误差项之间存在自相关性,则认为出现了误差序列相关(自相关),即:442、自相关性产生的原因假性自相关:模型中遗漏了重要的解释变量模型函数形式的设定误差真正的自相关经济惯性(例如:本期投资于前年的投资有关)随机因素的影响(例如:自然灾害,金融危机等的持续性)45OLS估计虽然是线性无偏的,但不再是有效的估计。OLS估计的标准误差估计不再准确。参数显著性t检验失效模型预测精度下降3、自相关问题的后果464、自相关的检验

(1)自相关的表示形式:P阶自相关:

称为s阶自相关系数。是满足基本假定的随机变量。47一阶自相关误差序列相关比较基本和重要类型——一阶自回归(为什么重视一阶自回归?):

这里ρ是自相关系数,|ρ|≤1ρ>0时为正自相关,

ρ<0时为负自相关。

是满足基本假定的随机变量。48(2)、自相关的检验①、残差序列图分析误差序列随时间变化如果ei随时间变化呈有规律的变化,说明存在自相关。49误差序列自相关残差分布图50②、偏相关系数检验偏相关系数是衡量多个变量之间相关程度的重要指标,可以用它来判断自相关性的类型。只要有一个自相关系数显著不为零,就存在自相关。利用eviews可以方便的进行(见92页)方程窗口—view—residualtest—correlogram-Q-statistics51③、德宾-沃森(Durbin-Walson)检验D—W检验适用条件①随机项一阶自相关②解释变量与随机项不相关③样本容量比较大52DW检验的原理对线性回归模型如果误差项有一阶自回归问题,那么其中的,是均值为0的独立同分布随机变量。

53根据和的性质,有因此54考虑与有密切关系的DW统计量55因为所以D-W统计量的值域并且:56检验误差序列正自相关性——DW检验区域图一阶自相关无法判断无一阶自相关性无法判断一阶负自相关Durbin-Watson根据样本容量n和解释变量数目k,在给定的显著性水平λ下,建立了D-W统计量的下临界值dλL和上临界值dλU.57◆0≤d≤dL,拒绝H0,接受H1。存在一阶正自相关,并且d越靠近0,正自相关越强。◆4-dL≤d≤4,拒绝H0,接受H1。存在一阶负自相关,并且d越靠近4,负自相关越强。◆dU≤d≤4-dU,接受H0,拒绝H1。不存在一阶自相关,并且d越靠近2,无相关把握越大。◆dL<d<dU或4-dU<d<4-dL,不能确定是否存在自相关。58D-W检验的局限性:①只适用一阶自回归,不适合高阶自回归②不适用解释变量与随机项相关的模型(当有滞后变量作为解释变量时,DW有趋向2的趋势)。需要利用Durbin-h统计量进行判断③D-W检验存在两个不能确定的区域,一旦d落入这两个区域,要通过其他方法(或者增加样本数据,或者重新取样,或者用其他检验方法。)Eviews直接给出DW值59④、布罗斯-戈弗雷检验(Breusch-Godfrey),又称拉格朗日乘数检验(LM检验)简称B-G检验,或LM(lagrangemultiphcator)检验分析:对于模型设自相关形式为:假设,即不存在自相关性。实际操作中,用代替60检验步骤用OLS方法估计模型,得残差序列将关于所有解释变量和和残差的滞后值进行回归,并计算出辅助回归模型的判定系数61检验步骤布罗斯和戈弗雷证明,在大样本情况下,渐近的有:在给定的显著性水平下,62布罗斯-戈弗雷检验的eviws实现在方程窗口中,view—residualtest—serialcorrelationLMtest需要人为设定滞后期长度,一般从s=1开始,直到s=10左右。如果检验结果均不显著,则可以认为不存在自相关性。63案例分析(一)P91【例3】自相关问题的检验645、自相关性的解决方法假性自相关:模型遗漏重要变量模型函数形式设定不当首先修正模型,若检验后发现自相关不存在了,说明原来的自相关假性自相关。模型修正后就已经解决65真正的自相关:广义差分方法广义最小二乘法(GLS)66(一)广义差分法

(1)相关系数已知时,直接利用广义差分法设线性回归模型为已知有一阶自相关性,即把滞后一期的观测值代入变量关系,得方程:可得令,根据可得如果记,所以上式为67(2)、相关系数未知时,

先估计相关系数,再采用广义差分根据估计相关系数方法的不同,可以分为下面几种方法:68①、近似估计法近似估计法1:然后再利用广义差分方法。69近似估计法2:对于小样本,Theil给出以下近似公式:K为解释变量个数。然后再利用广义差分方法70近似估计法3:利用残差代替随机误差项,计算再利用广义差分方法71②、科克兰内—奥克特迭代方法步骤:S1.根据样本观察值数据,用OLS方法估计模型,得到样本回归方程S2.计算残差et,作为ut

的估计.S2.用OLS方法求ρ的初次估计值72S4用对原模型进行广义差分变换,作第一次迭代。得广义差分模型用OLS方法估计模型,得到残差序列并进行自相关检验。如果无自相关,迭代结束,求得如果存在自相关,则重复进行上述工作:S5.计算ρ的第二次估计值,S6.用对原模型进行广义差分变换,作第二次迭代。得广义差分模型同样的过程可以重复进行,直到收敛,或达到迭代的预定上限。73③、搜索估计法又称为希尔德雷思-卢估计法。在区间[-1,1]中按照一定间隔选取相关系数然后利用每个进行广义差分变换,估计相应的广义差分模型并计算每个模型的残差平方和从所有模型中选取一个使残差平方和最小的模型,作为最佳模型。对应的即为所估计的该方法的特点:保证使得残差平方和总体最小,而达到最优。而迭代方法可能仅是局部最优(与初始值有关)74广义差分方法的eviews实现(1)用OLS估计模型,得残差序列(2)根据残差序列判断自相关的类型(3)利用广义差分法估计模型LSYCXAR(1)(4)可以对迭代过程进行控制方程窗口中,estimate按扭—对话框中options—在迭代程序对话框中输入最大迭代次数或收敛精度。(3)广义差分法案例分析75(二)广义最小二乘法(GLS)1、GLS的基本思想

就是通过对总体方差协方差矩阵的分解,将回归的残差转变成满足古典假定的残差,然后使用OLS估计。可见WLS与广义差分都是GLS的特例762、GLS估计由于是一个正定的对称矩阵,由矩阵代数的知识,我们知道存在一个满秩矩阵P,使得77在古典回归方程两边同乘,得到或者可见78显然变换后的模型满足古典假定,因此可以用OLS对该式进行估计。得到如下结果793、FGLS(可行的GLS)如果已知,那么GLS就是最优的估计方法如果未知。必须先对矩阵进行估计,得到,然后再按照上述GLS的方法对回归模型进行估计,称为FGLS估计。8081三、多重共线性1、完全多重共线性2、多重共线性的定义3、多重共线性产生的原因4、多重共线性的后果5、多重共线性的检验6、多重共线性的解决方法7、案例821、完全多重共线性定义:多元线性回归模型中的解释变量之间,存在严格的线性关系。(违反基本假定)原因:通常是模型设定的失误后果:此时无法唯一解出确定的参数估计值,估计的方差无穷大检验:出错提示解决:可以放弃部分解释变量。83(1)(近似)多重共线性定义(注意修正书上P107的说法)对于多元线性回归模型解释变量之间存在较强的线性关系。或者说存在一组不全为0的常数,使得不违反基本假定2、多重共线性及产生原因84(2)多重共线性的原因变量之间的内在联系(如劳动和资本投入在数量上的必然联系)经济变量变化趋势的“共向性”(比如经济繁荣时经济指标趋向增长)滞后变量的引入样本资料的原因。可见,经济变量之间总存在一定程度的线性相关,因此,问题不是多重共线性的有无,而是多重共线性的严重程度。3、多重共线性产生的原因854、多重共线性的后果好消息!近似多重共线性不违反任何假设。可以得到参数估计值。OLS估计量仍旧是唯一的,最小方差的线性无偏估计量。864、多重共线性的后果后果增大OLS估计的方差,使得参数估计不稳定,异常值多。难以区分每个解释变量的单独影响检验的可靠性降低。(判决系数,F值很高,但是单个参数的t检验不显著,甚至符号相反。)回归模型缺乏稳定性875、多重共线性的检验多重共线性并不违反经典假设,多重共线性普遍存在,因此对于不严重的多重共线性我们无需处理,只有当多重共线性比较严重时才需要处理。

所以我们检验的不是多重共线性的有无,而是多重共线性的强弱。下面给出的不是严格的统计方法。而是基于经验的判断88

(1)、相关系数检验主要针对两个解释变量的情况。一般,如果两个解释变量简单相关系数比较高(如,大于0.8),可以认为存在较严重的多重共线性注意,该方法对解释变量多于两个时,不一定有效。此时变量之间两两相关系数很低,也可能存在严重的多重共线性。89(2)、辅助回归模型检验当模型解释变量个数多于两个,而且呈现复杂相关关系时采用用每一个解释变量对其他解释变量构造辅助回归方程来检验多重共线性。①如果方程整体显著(F),则表明存在多重共线性。②若有R2<,则怀疑有多重共线性③看辅助回归方程的拟合度的大小。90(3)方差膨胀因子检验分析思路:多重共线性使得参数估计方差放大。通过考察参数估计被放大的程度,判断模型存在多重共线性的程度。可以推出,在多元回归中有:91当时,当时,方差扩大因子,记作常以方差扩大因子是否大于10来判断第j个解释变量是否存在较强的、必须加以处理的多重共线性。对应的辅助方程的判决系数为0.992R200.50.80.90.950.980.990.999VIF1251020501001000当完全共线时,R2=1,VIF=无穷大93与VIF等价的指标。“容许度”判别显然,一般当TOL<0.1,认为模型存在较严重的多重共线性。94看参数估计量的符号,数值是否与理论相符和?如果与定性分析结果违背,可能可能存在多重共线性。(当然也可能模型设定出现了问题)若回归整体显著性F拒绝H0,但参数t检验多数都不显著。当增加或者剔除一个解释变量,回归参数的估计值和标准差发生较大变化。

(4)、直观判断956、多重共线性的解决方法基本原则①如果建模目的是预测,则模型的拟合优度较高,并且相关关系保持不变,就可以忽略多重共线性问题。如果建模目的是结构分析,则需要消除多重共线性的影响。②引起多重共线性的原因是模型存在相关的解释变量,因此消除多重共线的根本方法只能是删除这些变量,但剔除变量要要谨慎。否则,去掉了重要的变量,经济意义不合理,或者模型设定出现偏误。96(1)扩大或改变样本原理:多重共线是一种样本现象。可以从样本入手。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论