




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、4. White)检验 1980 不需要排序,且适合任何形式的异方差。 怀特检验的基本思想与步骤(以二元为例)(2)然后做如下辅助回归:(1)先对该模型作OLS回归,得到:1(对一元模型,其辅助回归模型: ) (3)可以证明,在同方差假设下:(*) R2为(*)的可决系数,h为(*)式解释变量的个数,表示渐近服从某分布。(4)在原假设H0: ,(i=0,1,2,3,4,5)若 ,则拒绝H0,表明回归参数至少有一个显著不为零,扰动项 存在异方差性。iiiiiiiiXXXXXXeeaaaaaa+=2152242132211022 Eviews中的White检验步骤:(1)建立回归模型: LS Y
2、C X(2)检验异方差: 1)命令: View Residual Test White Heteroskedasticity 2)在选项中选择在辅助模型中是否包含交叉乘积项 (Cross terms) 3)输出结果中Obs*R-squared即White检验统计量,由其双侧概率可判断是否拒绝无异方差性的原假设。3例如:欲判断某二元回归模型是否存在异方差。辅助回归模型有4个解释变量,不存在交叉项。则执行命令后,显示EViews的辅助回归模型估计结果(见下表):4当显著性水平为0.05时,由于所以存在异方差。实际上,统计量的P值为0.0135,小于0.05的水平,所以存在异方差。实际应用中,一般是
3、直接观察P值的大小,若P值校小,则拒绝不存在异方差的假设,认为模型存在异方差。5注意: 辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。 如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。 当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。6六、异方差的修正常见以下四种修正方法:1.模型对数变换法2.原模型变换法3.加权最小二乘法4.广义最小二乘法71.模型对数变换法 在模型 Yi = 0 + 1Xi + i 中,变量Yi和Xi分别用l
4、nYi和 lnXi 取代,则对全对数模型: lnYi = 0 + 1lnXi + i 进行回归后,通常可降低异方差性的影响。 原因: 对数变换能使测定变量值的尺度缩小。 经对数变换的模型,其残差表示为相对误差,而相对误差往往具有较小的差异。 全对数模型中,1 可看作反映Y对X的弹性,即Y相对于X的百分比变化,这在实际分析中有较强的应用意义。82. 原模型变换法 对存在异方差的模型作适当的变量变换,使变换后的模型满足同方差假定,则可用OLS重新估计模型,得最佳线性无偏估计。 模型的前提是要合理确定异方差性的具体形式,这可以通过对问题的经验分析,或用帕克检验,戈里瑟检验等方法所提供异方差的具体形式
5、来确定。9设模型为: Yi = 0 + 1Xi + I () 扰动项i具有异方差性,由前面Glejser检验知,异方差性与Xi的变化有关,且2为常数,(Xi)为解释变量Xi的函数,当(Xi)=1时,为同方差;当(Xi)1时,为异方差。用 去乘原模型的两端得10记 ,则vi具有同方差性。事实上,函数(Xi)可以有不同的形式, Glejser检验提供了相应的信息。 (Xi)一般取如下形式:11(1) (Xi)=Xi, 则Var(i)=2 Xi。对原模型两端同除 得令 , 则 Var(vi)为同方差,因为12(2) (Xi)=Xi2, 则Var(i)=2 Xi2。对原模型两端同除 得令 ,则 Var
6、(vi)为同方差,因为13(3) (Xi)=(a0+a1Xi)2 ,则Var(i)=2(a0+a1Xi )2。对原模型两端同除(a0+a1Xi ) 得令 , 则 Var(vi)为同方差,因为14注意: 对原模型变换的方法与加权最小二乘法实际上是等价的,他们最多相差一个常数因子;对原模型变换后的拟合优度有可能变小,这是对样本观测值加权的结果。153.加权最小二乘法(WLS) 模型检验出存在异方差性,可用加权最小二乘法(Weighted Least Squares, WLS)进行估计。加权最小二乘法的基本思想: 加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计
7、其参数。 即对加了权重的残差平方和实施OLS法:其中:Wi为权数21102)(+-=kkiiiiXXYWeWbbb16 设Var(i)随X的递增而递增,则: 对较小的残差平方ei2赋予较大的权数; 对较大的残差平方ei2赋予较小的权数。 以更好地使ei2反映Var(i)对残差平方和的影响程度,从而改善参数估计的统计性质。设取权数Wi为1/i2 (i=1,2,n),且i2越小Wi越大, i2越大Wi越小。因此,称为加权的残差平方和,运用最小二乘法得参数估计式:1102(+-=iiiiX )2YWeWbb17其中,这一求解参数估计的方法为加权最小二乘法。容易看出,当w1=w2=wn时,即对于每一个
8、样本有相同的权数,则加权最小二乘估计式就是普通最小二乘估计式。18EViews中可直接进行加权最小二乘估计,但需要事先确定权数变量,这可以通过Park检验、 Glejser检验等判断异方差的具体形式,也可以选取某个与异方差变动趋势反向变动的变量序列,如1/|et|,1/et2等等。19EViews具体执行过程: (1)生成权数变量;(2)使用加权最小二乘法估计模型,命令和菜单两种方式。命令方式:LS(W=权数变量或表达式) Y C X菜单方式:在方程窗口中点击“Estimate”按钮;在弹出的方程说明对话框中点击“Option”进入参数设置对话框;在参数设置对话框中选定“Weighted LS
9、”方法,并在权数变量栏中输入权数变量,然后点击“OK”返回方程说明对话框;点击“OK”,系统将采用WLS方法估计模型。(3)对估计后的模型,再使用White检验判断是否消除了异方差性。20 对于模型 Y=X+ 存在: 即存在异方差性。 显然W是一对称正定矩阵,故存在一可逆矩阵D使得: W=DD W=wwwn124.广义最小二乘法(GLS)21用D-1乘以方程:Y=X+ 的两边,得到一个新的模型: 该模型具有同方差性。因为 1211211111)()()(-=DDDDDWDDDDD*ssEEE22 这就是原模型Y=X+的加权最小二乘估计量,是无偏、有效的估计量。 这里权矩阵为D-1,它来自于原模
10、型残差项的方差-协方差矩阵2W 。23 如何得到2W ? 从前面的推导过程看,它来自于原模型残差项的方差协方差矩阵。因此仍对原模型进行OLS估计,得到随机误差项的近似估计量 ,以此构成权矩阵的估计量,即这时可直接以 作为权矩阵。 =2212neeWs|/1,|,|/1|,|/1211neeediagL=-D24 注意: 在实际操作中人们通常采用如下的经验方法: 不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。 如果确实存在异方差,则被有效地消除了; 如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。25七、案例分析案例1 我国城镇居民收入对通信交通支
11、出的影响26七、案例分析 例4.1.4 中国农村居民人均消费支出主要由人均纯收入来决定。 农村人均纯收入包括:(1)从事农业经营的收入;(2)包括从事其他产业的经营性收入(3)工资性收入;(4)财产收入;(4)转移支付收入。 考察从事农业经营的收入(X1)和其他收入(X2)对中国农村居民消费支出(Y)增长的影响,可用以下双对数模型:案例2 中国农村居民人均消费函数27表4.1.4 中国2001年各地区农村居民家庭人均纯收入与消费支出相关数据(单位:元)地区人均消费支出Y从事农业经营的收入1X其他收入2X地区人均消费支出Y从事农业经营的收入1X其他收入2X北京3552.1 579.14446.4
12、 湖北2703.36 1242.92526.9 天津2050.9 1314.62633.1 湖南1550.62 1068.8875.6 河北1429.8 928.81674.8 广东1357.43 1386.7839.8 山西1221.6 609.81346.2 广西1475.16 883.21088.0 内蒙古1554.6 1492.8480.5 海南1497.52 919.31067.7 辽宁1786.3 1254.31303.6 重庆1098.39 764.0647.8 吉林1661.7 1634.6547.6 四川1336.25 889.4644.3 黑龙江1604.5 1684.15
13、96.2 贵州1123.71 589.6814.4 上海4753.2 652.55218.4 云南1331.03 614.8876.0 江苏2374.7 1177.62607.2 西藏1127.37 621.6887.0 浙江3479.2 985.83596.6 陕西1330.45 803.8753.5 安徽1412.4 1013.11006.9 甘肃1388.79 859.6963.4 福建2503.1 1053.02327.7 青海1350.23 1300.1410.3 江西1720.0 1027.81203.8 宁夏2703.36 1242.92526.9 山东1905.0 1293.0
14、1511.6 新疆1550.62 1068.8875.6 河南1375.6 1083.81014.1 28普通最小二乘法的估计结果: 可看出:其他收入(不是农业经营收入)的增长,对农村人均消费支出的增长更有刺激作用。29异方差检验 从结果分析中可认为,不同地区农村人均消费支出的差别主要来源于非农经营收入和其他收入的差别。因此,如果存在异方差性,则可能是X2引起的。30图示检验法表明存在单调递增型异方差31进一步的统计检验 (1)G-Q检验 将原始数据按X2排成升序,去掉中间的7个数据,得两个容量为12的子样本。 对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2: 32表4.1
15、.4 中国2001年各地区农村居民家庭人均纯收入与消费支出相关数据(单位:元)地区人均消费支出Y从事农业经营的收入1X其他收入2X地区人均消费支出Y从事农业经营的收入1X其他收入2X北京3552.1 579.14446.4 湖北2703.36 1242.92526.9 天津2050.9 1314.62633.1 湖南1550.62 1068.8875.6 河北1429.8 928.81674.8 广东1357.43 1386.7839.8 山西1221.6 609.81346.2 广西1475.16 883.21088.0 内蒙古1554.6 1492.8480.5 海南1497.52 919
16、.31067.7 辽宁1786.3 1254.31303.6 重庆1098.39 764.0647.8 吉林1661.7 1634.6547.6 四川1336.25 889.4644.3 黑龙江1604.5 1684.1596.2 贵州1123.71 589.6814.4 上海4753.2 652.55218.4 云南1331.03 614.8876.0 江苏2374.7 1177.62607.2 西藏1127.37 621.6887.0 浙江3479.2 985.83596.6 陕西1330.45 803.8753.5 安徽1412.4 1013.11006.9 甘肃1388.79 859.
17、6963.4 福建2503.1 1053.02327.7 青海1350.23 1300.1410.3 江西1720.0 1027.81203.8 宁夏2703.36 1242.92526.9 山东1905.0 1293.01511.6 新疆1550.62 1068.8875.6 河南1375.6 1083.81014.1 3334子样本1: (3.18) (4.13) (0.94) R2=0.7068, RSS1=0.0648 子样本2: (0.43) (0.73) (6.53) R2=0.8339, RSS2=0.272935计算F统计量: F= RSS2/RSS1=0.2792/0.064
18、8=4.31 查表 给定=5%,查得临界值 F0.05(9,9)=3.18判断 F F0.05(9,9) 否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性。36(2)怀特检验 作辅助回归: (-0.04 (0.10) (0.21) (-0.12) (1.47) (-1.11)R2 =0.4638 似乎没有哪个参数的t检验是显著的 。但 n R2 =31*0.4638=14.38=5%下,临界值 ,n R2 所以,拒绝同方差性的原假设。 37去掉交叉项后的辅助回归结果 (1.36) (-0.64) (064) (-2.76) (2.90) R2 =0.4374查表得临界值:所以,X2
19、项与X2的平方项的参数的t检验是显著的,且 n R2 =31 0.4374=13.56 =5%下,临界值 20.05(4)=9.49,因此,拒绝同方差的原假设。 38原模型的加权最小二乘回归 对原模型进行OLS估计,得到随机误差项的近似估计量 i,以此构成权矩阵2W的估计量; 再以1/| i|为权重进行WLS估计,得可看出: 各项统计检验指标全面改善39一、序列相关性概念二、实际经济问题中的序列相关性 三、序列相关性的产生原因及后果四、序列相关性的检验五、案例4.2 序列相关性 40一、序列相关性概念 如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关
20、性(Serial Correlation)。 对于模型 Yi=0+1X1i+2X2i+k X ki +i i=1,2, ,n随机项互不相关的基本假设表现为 Cov (i , j)=0 i j, i, j=1,2, ,n41或I22ss=42 称为一阶序列相关,或一阶自相关(autocorrelation),或一阶自回归。 其中:被称为一阶自相关系数(first-order coefficient of autocorrelation)随机扰动项的序列相关可有多种形式一阶序列相关形式即随机扰动项只与它的前一期值相关。如果仅存在 cov (t , t-1) E (t t-1) 0 或 t=1,2,
21、 ,n一阶自相关往往可写成如下形式: t=t-1+t -1 143 由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标t代表i。 p阶序列相关形式(模型存在p阶序列相关) t=1t-1+ 2t-2+ + p t -p+ t 此为序列相关(自相关)的一般形式t是满足以下OLS基本假定的随机扰动项:0)(=tEe, 2)var(se=t, 0),cov( =steest44二、实际经济问题中的序列相关性 大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列在不同时间的前后关联上。由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关 )。例如,绝对收入假
22、设下居民总消费函数模型: Ct=0+1Yt+t t=1,2,n1.经济变量固有的惯性452.模型设定的偏误 所谓模型设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。 例如,本来应该估计的模型为 Yt=0+1X1t+ 2X2t + 3X3t + t但在模型设定中做了下述回归: Yt=0+1X1t+ 1X2t + vt又如:现期消费水平(Ct)往往受到其上一期的影响,若放入U中即存在自相关。 Ct=B0+B1Ct-1+B2Yt46因此, vt=3X3t + t,如果X3确实影响Y,则出现序列相关。又如:如果真实
23、的边际成本回归模型应为: Yt= 0+1X1t+2X1t2+t其中:Y=边际成本,X=产出。 但建模时设立了如下模型: Yt= 0+1X1t+vt因此,由于vt= 2X1t2+t ,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。473. 数据的“编造” 例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。 在实际经济问题中,有些数据是通过已知数据生成的。 因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。 48(一)产生原因 1. 许多经济变量往往存在序列相关是因为其时间序列有一种惯性,呈现出时间趋势变化,且其
24、前后期总相关(如上例)。对这种经济变量(作为因变量)的模型作回归分析时,若其滞后量不作为解释变量,其影响必反映在随机扰动项u中,导致u 前后期的自相关。同时u中非重要解释变量之间的自相关,也可引起u的自相关。 以上自相关也称“伪自相关”。三、序列相关性的产生原因和后果 从一般经验讲,对于采用时间序列数据作样本的计量经济学问题,由于在不同样本点上解释变量以外的其他因素在时间上的连续性,带来它们对被解释变量的影响的连续性,所以往往存在序列相关性。492。构造模型错误 如构造 Y=A+BX为线性,但实际应为曲线形式。 错误的模型形式所产生对Y的系统影响带入u中,使u呈序列相关趋势。3。许多情况下,u
25、本身存在自相关性(“真正自相 关”) 如生产过程中出现的偶然事故,天灾等,不仅影响生产,且影响以后的时期,从而导致自相关。 504. 数据的处理方法 实际问题中,有时为需要,原始数据往往都经过拟合“编造”处理,即有些数据是通过已知数据生成的。故新原数据间的内在联系,表现出序列相关性。例如,季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动而引进了数据中的匀滑性,此匀滑性本身就能使随机扰动项中出现系统性的因素,从而出现序列相关性。 当然原因还有很多,不一一列举。511. 参数估计量非有效 因为,在有效性证明中利用了 E(uu)=2I即同方差性和互相独立性条件。 而且,在大样本情况
26、下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。(二)后果 计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:52 2. 变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。 如果存在序列相关,估计的参数方差 出现偏误(偏大或偏小),t检验就失去意义。 其他检验也是如此。533. 模型的预测失效 区间预测与参数估计量的方差有关,在方差(标准差)有偏误的情况下,使得预测估计不准确,预测精度降低。 所以,当模型出现序列相关性时,它的预测功能失效。54 然后,通过分析
27、这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。 序列相关性各检验方法的基本思路都相同:基本思路: 四、序列相关性的检验首先,采用OLS法估计模型,以求得随机误差项的 “近似估计量”,用 ei表示:lsiiiYYe0)(-=检验方法多: 如回归检验法、DW检验、冯诺曼比检验等 551. 图示法几种常用检验方法:562. 回归检验法 t=2,nt=3,n对方程估参并作显著性检验。以te为被解释变量,以各种可能的相关量,诸如以1-te、2-te、2te等为解释变量,建立各种方程:ttteeer+=-1tttteeeerr+=-221157 如果存在某一种函数形式,使得方程显著成
28、立,则说明原模型存在序列相关性。 回归检验法的优点是:(1)能够确定序列相关的形式。(2)适用于任何类型序列相关性问题的检验。 但工作量大,计算复杂繁琐。583. 杜宾瓦森(Durbin-Watson,D-W)检验法 D-W检验是杜宾(J.Durbin)和瓦森(G.S. Watson)于1951年提出的一种检验序列自相关的方法。该方法的假定条件是:(1)解释变量X非随机;(2)随机误差项i为一阶自回归形式: i=i-1+i59(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式: Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项针对原假设:H0: =0,即不具有一阶自相关形式 对立假设:H1: 0 即具有一阶自相关形式 为的自相关系数 ,且1构造如下统计量: D.W. 统计量:60 该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。 但是,他们成功地导出了临界值的下限dL和上限dU ,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。注意:n15 =-=nttnttteeeWD12221)(.61 D.W检验步骤:(1)计算DW值(2)给定显著性水平,由n和k
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 供应链成本管理实践考核试卷
- 2025危化品安全管理培训
- 公司保安工作总结14篇
- 青春健康与你同行
- 中秋节给员工的感谢信(15篇)
- 《科学家的故事》读书笔记
- 人生的选择演讲稿范文
- 管道工程施工方案
- 歌唱家活动策划方案
- 江苏省技师学院活动方案
- 婴幼儿配方乳粉市场销售管理规范
- 教科版四年级下册科学期末测试卷含完整答案(各地真题)
- 放化疗相关口腔黏膜炎预防及护理课件
- 2024时事政治必考试题库附答案(完整版)
- 金融计量学智慧树知到期末考试答案章节答案2024年山东管理学院
- 04SG518-3-门式刚架轻型房屋钢结构(有吊车)
- 基于“教-学-评”一体化的初中语文有效教学策略
- 安全隐患排查月报
- 硬核赢创新智慧树知到期末考试答案2024年
- SIYB游戏模块Ⅱ 学习供给与需求
- 科学认识天气智慧树知到期末考试答案2024年
评论
0/150
提交评论