违背经典假设的回归模型课件(PPT 106页)

上传人：6*** IP属地：贵州上传时间：2022-07-21 格式：PPTX 页数：106 大小：723.36KB 积分：25 举报 版权申诉

已阅读5页，还剩101页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、违背经典假设的回归模型异方差性序列相关性多重共线性随机解释变量模型设定误差1第1页，共106页。第11章异方差（方差非齐性）一、方差非齐性的概念二、实际中的异方差性三、异方差性的后果四、异方差性的检验五、异方差的解决加权最小二乘法（WLS） 2第2页，共106页。方差非齐性的概念经典线性回归分析的一个基本假设是：回归模型中随机误差项的方差为常数，即这一假设称为方差齐性假定或同方差性假定。3第3页，共106页。如果回归模型中的随机误差项的方差不是常数，即对于不同的样本点，随机误差项的方差不再是常数，则称随机误差项的方差非齐性或为异方差。4第4页，共106页。实际中的异方差性情形之

2、一：随机误差项的方差是随着某一个解释变量观测值的变化而呈现规律性的变化；例如，越来越小，边错边改学习模型在学习过程中行为误差随时间而减少；随着收入的增加，储蓄的变异越来越大；情形之二：数据采集技术的改进带来差错率的减小；5第5页，共106页。情形之三：回归模型的设定不正确，如遗漏了重要变量；情形之四：因为存在异常值；最常见情形：采用截面数据作样本的经济计量学问题，由于在不同样本点上解释变量以外的其他因素的差异较大，所以往往存在异方差性。 6第6页，共106页。异方差性的后果一旦出现异方差性，如果仍采用普通最小二乘法估计模型参数。会产生以下不良后果：参数估计量非有效。（是无偏和一致量）变量

3、的显著性检验失去了意义。可能由显著变成不显著。模型的预测失效。 7第7页，共106页。异方差性的检验检验异方差性，也就是检验随机误差项的方差与解释变量观测值之间的相关性。如果相关，就说明存在异方差性，如果不相关，严格说，不能认为不存在异方差。但在实际中，如果不相关，就不再进行异方差处理了。 8第8页，共106页。残差图分析法一般情况下，当回归模型满足所有假定时，残差图上的个点散布应是随机的、无任何规律。如果回归存在异方差时，残差图上的点的散布呈现出相应的趋势：残差值随被解释变量值的增大而增大，或增大而减小，或呈现蛛网现象（表明具有自相关）。这都表明，方差非齐性。对于多元模型，需要选

4、择残差对多个解释变量描点。 9第9页，共106页。等级相关系数法又称斯皮尔曼（spearman）检验，是一种应用较广泛的方法。它既可用于大样本，又可用于小样本。等级相关检验的步骤有三：第一步，对y进行x的普通最小二乘回归，求出残差的估计值；第二步，取残差的绝对值，把自变量与残差估计值按递增或递减的次序排列后分成等级，按下式计算出等级相关系数10第10页，共106页。其中，为样本容量，为等级的差数。第三步，对等级相关系数进行显著性检验。在8下，用下式对样本等级相关系数进行检验。检验统计量为如果, 可以认为异方差性问题不存在，反之，说明自变量与残差之间存在系统影响关系，异方差性问题存在。(等级

5、相关系数可以如实反映单调递增或单调递减趋势的变量之间相关性，而简单相关系数适宜衡量直线趋势变量之间相关性）11第11页，共106页。样本分段比较法又称戈德菲尔德匡特检验。其思路如下：首先将样本按某个解释变量的大小顺序排列，并将样本从中间(略去居中的c个观测)截成两段；然后各段分别用普通最小二乘法拟合回归模型，计算各段的残差平方和，从而计算出各段模型的随机误差的方差估计量。12第12页，共106页。由此可构造出检验统计量F其中，为样本容量，为解释变量个数。该统计量服从自由度为（-1）和（ -1）的F分布。在给定的显著性水平下，若统计量F值大于临界值，则认为存在异方差。 13第13页，共106

6、页。4.(布劳殊培干戈弗雷)检验其思想是：对于多元模型，如果误差方差与解释变量具有线性函数关系，则通过对该方程回归系数的联合检验可以判断是否同方差。14第14页，共106页。其步骤如下：第一步，采用方法估计原模型，得到残差估计值；第二步，计算这是随机误差项方差的极大似然估计量。第三步，构造：第四步，建立对诸的回归:第五步，求出(回归平方和)，并计算统计量15第15页，共106页。假定随机误差项是正态分布的。可以证明：如果有同方差性，当样本容量无限增大时，统计量服从自由度为的方分布。判断：如果超过给定显著性水平对应的临界值，就可拒绝同方差性假设；否则不拒绝。16第16页，共106页。5残差回归

7、检验法它采用普通最小二乘估计的残差或其绝对值或其平方作为被解释变量，建立各种回归方程，然后通过检验回归系数是否为0，来判断模型的随机误差项是否有某种变动规律。如果为0,，说明没有规律存在，如果不为0,说明有规律存在。如果有规律存在，则存在异方差。 17第17页，共106页。6.怀特异方差性检验戈德菲尔德匡特检验要求按照被认为是引起异方差性的解释变量观测值的重新排序，而则容易受到偏离正态性假定的影响。怀特的检验更具实用性。用残差平方对所有解释变量及其平方项和交叉乘积项进行回归，并检验各回归系数是否为0,这是H.White 提出的方法。18第18页，共106页。其基本步骤如下：步骤一，对给定的

8、数据采用方法估计模型，并得到残差；第二步，建立如下辅助回归模型，得到：第三步，构建统计量在无异方差性的零假设下，该统计量渐进服从自由度为解释变量个数的方分布。19第19页，共106页。第四步，当计算的统计量数值超过给定显著性水平下的方临界值时，拒绝零假设，认为存在异方差性，否则，接受零假设，即不存在异方差性。值得注意的是：怀特检验可能是异方差性的一个检验，也可能是设定错误的一个检验，或两者兼有。20第20页，共106页。其他常用的方法（1）用残差对理论值的平方或立方进行线性回归，然后检验各回归系数是否显著不为0。（2）用残差绝对值对每个解释变量建立各种（线性一次、倒数、二次方）回归模型，并

9、检验回归系数是否显著为0。这是格莱泽(Glejser)在1969年提出的方法。 21第21页，共106页。异方差的解决加权最小二乘法（WLS）如果模型被证明存在异方差性，则需要发展新的方法估计模型，最常用的方法就是加权最小二乘法。一般情况下，对于模型 22第22页，共106页。即存在异方差性。设用左乘线性回归模型得到：该模型具有同方差性。 23第23页，共106页。因为于是用普通最小二乘法得到参数估计量为24第24页，共106页。这就是原模型的加权最小二乘估计量，是无偏的、有效的估计量。 25第25页，共106页。如何得到权矩阵？以原模型的普通最小二乘估计的随机误差的近似估计量为权

10、矩阵的估计量。即 26第26页，共106页。利用统计软件计算时，只要选择加权最小二乘法，将上述权矩阵输入，估计过程即告完成。在实际使用时，并不对原模型进行异方差性检验，而是直接选择加权最小二乘法，如果确实存在异方差性，则被有效地消除了；如果不存在，则加权最小二乘法等价于普通最小二乘法。 27第27页，共106页。加权最小二乘法的步骤 1.选择普通最小二乘法估计原模型，得到随机误差项的近似估计值； 2.建立近似估计值倒数的数据序列； 3.选择加权最小二乘法，以序列作为权，进行估计得到参数估计量。实际上是以乘原模型的两边，得到一个新模型，采用普通最小二乘法估计新模型。28第28页，共106

11、页。加权最小二乘估计的计算可以用SPSS软件完成如果方差已知，观测值的权数应该是观测值误差项方差的倒数，即分母为第i个观测值误差项的方差。误差项较大的观测值接受较小的权数；误差项方差较小的观测值接受较大的权数。误差项方差随一个自变量变化。如果误差项的方差常常是未知的，而当误差项方差随自变量水平以系统的形式变化时，可以利用这种关系来构造权数。(书中列出了四种假设)即 29第29页，共106页。而比例系数k在参数估计时可以消去。类似地，可设定特殊的权函数为(其中m为待定的未知参数).statistics Regression Weight Estimation 进入权函数对话框x选入Weight

12、变量框，幂指数Power取默认值，可得输出结果。（取似然函数的极大值） 30第30页，共106页。加权最小二乘残差图计算加权最小二乘估计的残差，这需要重新作回归:第一步，在weight estmation对话框中的option选项中，保存最优权作为新变量；第二步，进入线性回归对话框，点选WLS，线性回归对话框会增加一行weight变量框，选入第一步的最优权变量；第三步，点选线性回归对话框的Save选项，保存残差变量，运行；第四步，以自变量为横轴，加权最小二乘估计的残差为纵轴画残差图。 31第31页，共106页。几点说明：怀特的“异方差性相一致”的方差与标准差。见Eviews软件。对原始数据取对

13、数，也可以减低异方差性。但如果数据中出现负数或零的数据时便不适用。32第32页，共106页。举例说明等级相关戈德菲尔德-匡特检验33第33页，共106页。第12章序列相关性一、序列相关的概念二、序列相关产生的背景与原因三、序列相关性的后果四、序列相关性的检验五、序列相关问题的处理方法 34第34页，共106页。一、序列相关的概念在回归模型中我们总假定不同时点的随机误差项之间是不相关的，即如果一个回归模型不满足上述假设，即则我们称随机误差项之间存在序列相关现象。 35第35页，共106页。如果仅存在称为一阶序列相关，这是最常见的一种序列相关问题。序列相关不是指两个或两个以上的变

14、量之间的相关关系，而是指一个变量前后期数值之间存在的相关关系。序列相关又称自相关。本节主要讨论序列相关现象产生的背景和原因，序列相关现象对回归分析带来的影响，诊断序列相关是否存在的方法，以及如何克服序列相关现象带来的影响。 36第36页，共106页。二、序列相关产生的背景与原因 1.遗漏关键变量时会产生序列自相关性。2.经济变量的滞后性会给序列带来自相关性。3.采用错误的回归函数形式也可能引起序列相关4.蛛网现象可能带来序列的自相关性5.因对数据加工整理而导致误差项之间产生自相关性。37第37页，共106页。三、序列相关性的后果一旦出现序列相关，而仍采用普通最小二乘法估计模型参数，会产生下列

15、不良后果：1.参数估计量是无偏和一致的，但不是有效的，而且呈现出低估的情形。2.变量的显著性检验失去意义3.模型的预测失效38第38页，共106页。对于时间序列数据其一般线性回归模型可表示为：式中随机误差项往往前后期相关，即序列相关。序列相关的表现形式有多种，对于多数经济现象而言，其现期数值受过去近期的数值影响较大，而受过去远期的数值影响较小，并且时间的间隔越远，其影响就越小。 39第39页，共106页。一阶自回归形式这种形式的序列相关可用一阶自回归形式来描述，且系数要限制为：且假设：在假定下，一阶自回归过程是平稳的，即随机误差项ut的均值、方差和各阶协方差都为常数，并不随时间的改变而改变

16、。 40第40页，共106页。平稳序列随机误差项的特征将随机误差项ut的各期滞后值代入一阶自回归模型得到： 41第41页，共106页。随机误差的期望与方差这表明回归模型的随机误差项可表示为独立同分布的随机误差序列的加权和，权数分别为1,，2,。当01时，这些权数随时间推移而几何衰减；而当-10)，那么接近奇异的程度就会比小得多。 97第97页，共106页。将数据标准化后，这时可以得到的岭回归估计量：如果Y也标准化，则得到标准化岭回归估计。作为的估计应比最小二乘估计稳定，当k=0时的岭回归估计实际就是普通最小二乘估计。98第98页，共106页。这是岭回归的编程语句：INCLUDEE:SPS

17、S10Ridge Regression.sps.RIDGEREG DEP=zy/ENTER zx1 zx2.运行后（run all）结果如下：当k较小时，回归系数很不稳定，而当k逐渐增大时，回归系数呈现稳定状态，那么k取何值时，回归参数才优于普通最小二乘估计呢？99第99页，共106页。二、岭回归估计的性质在讨论中，假设因变量观测值向量未经标准化。性质1：岭回归的参数估计是回归参数的有偏估计 100第100页，共106页。显然，只有当k=0时，，当k0时，是的有偏估计。有偏性一岭回归估计的一个重要性质。性质2：在岭参数k与y无关的情形下，是最小二乘估计的一个线性变换，也是理论值y的线性函数。因为 101第101页，共106页。性质3：以MSE表示估计向量的均方误差，则存在k0,，使得102第102页，共106页。三、岭参数k的选择我们的目的是要选择使MSE（k）达到最小的k，而最优k值依赖于未知参数和，因而在实际应用中必须通过样本来确定。目前还没有形成一个公认的最优方法。但常用的方法主要有：岭迹法、方差扩大因子法、残差平方和方法。我们主要介绍岭迹法。103第103页，共106页。岭迹法如果最小二乘估计看来有不合理之处，就可采用适当的岭估计来加以一定程度的改善，岭参数k 值的选择很重要。选择k值的一般原则是：各回归系数的岭估计基本稳定；104第104页，共106页

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

违背经典假设的回归模型课件(PPT 106页)

文档简介

温馨提示

最新文档

评论

违背经典假设的回归模型课件(PPT 106页)

文档简介

温馨提示

最新文档

评论

相关文档