版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.,经济计量学的几种检验,.,多重共线性,.Multicollinearity arises because we have put in too many variables that measure the same thing. As the degree of multicollinearity increases, the regression model estimates of the coefficients become unstable and the standard errors for the coefficients can get wildly inflated.
2、 Measure :vif, tol=1/vif,condition index;etc.,.,多重共线性的后果,1.存在完全多重共线性时,参数的估计值无法确定,而且估计值的方差变为无穷大. 2.存在不完全多重共线性时,可以估计参数值,但是数值不稳定,而且方差很大. 3.多重共线性会降低预测的精度,甚至失效,增大零假设接受的可能性(t值变小).,.,多重共线性的检测方法 (1)样本可决系数法,如果样本的可决系数R-square 比较大,且回归系数几乎没有统计上的显著性,则可认为存在多重共线性。 Theil 提出了一个指标:多重共线性效应系数,.,Theil test results,Sas 结
3、果: 结果表明有多重共线性。,.,多重共线性检测方法 (2)辅助回归检验法,若存在多重共线性,则至少有一个解释变量可精确或近似地表示为其余皆是变量的线性组合。 相应的检验统计量为:,.,辅助回归检验结果,Sas 结果: Klein经验法则:若存在一个i,使得 R(i)-squareR-square,则认为多重共线性严重;本例中x1,x3有多重共线性。,.,多重共线性检验方法 (3)样本相关系数检验法,.,FG test results,fg=20.488013401 p=0.0001344625; 拒绝零假设,认为存在多重共线性。 具体那些变量之间存在多重共线性,除了上面提到的辅助回归的方法外
4、,还有以下提到的条件数检验和方差膨胀因子法。,.,多重共线性检验方法: (4)特征值分析法所用的检验统计指标,; 为第k各自变量和其余自变量回归的可决系数. VIF10,有多重共线性;TOL=1/VIF; 条件指数: 条件数: ;C20,共线性严重.,.,多重共线性的检验和补救,例一:进口总额和三个自变量之间回归; Sas 结果如下:Pearson Correlation Coefficients, N = 11 Prob |r| under H0: Rho=0 x1 x2 x3 x1 1.00000 0.02585 0.99726 GDP 0.9399 F Model 4 12.42236
5、3.10559 14.06 |t| Intercept 1 0.59511 0.28349 2.10 0.0384 GRADE 1 0.08354 0.02009 4.16 F Model 12 1.18881 0.09907 0.88 0.5731 Error 87 9.83078 0.11300 Corrected Total 99 11.01958 Root MSE 0.33615 R-Square 0.1079 Dependent Mean 0.20989 Adj R-Sq -0.0152 Coeff Var 160.15281 Parameter Standard Variable
6、DF Estimate Error t Value Pr |t| Intercept 1 -0.07767 0.98580 -0.08 0.9374 GRADE 1 -0.01220 0.12502 -0.10 0.9225 POTEXP 1 0.07784 0.07188 1.08 0.2819 EXP2 1 -0.00399 0.00409 -0.97 0.3325 UNION 1 0.64879 0.86160 0.75 0.4535 grade2 1 0.00220 0.00425 0.52 0.6065 exp4 1 -3.34378E-7 0.00000151 -0.22 0.82
7、56 exp3 1 0.00006170 0.00014192 0.43 0.6648 gx2 1 0.00011683 0.00011102 1.05 0.2955 gp 1 -0.00375 0.00494 -0.76 0.4498 gu 1 -0.05137 0.04430 -1.16 0.2494 pu 1 0.00193 0.06061 0.03 0.9746 eu 1 -0.00022185 0.00126 -0.18 0.8605,残差项平方对所有一阶,二阶及交叉项回归. 1.由左边的结果可知: 故同方差的假设未被拒绝. 2.Proc reg data=aa; Model y=x
8、/spec; Run; 可得到相同的结果。,.,布罗施-帕甘/戈弗雷检验 怀特检验的特例,(1)OLS残差额et和一个估计的干扰误差 (2)用OLS将 对选中的解释变量进行回归,并计算解释平方和(ESS); (3)在零假设下,有 (4)一个更简单且渐进等价的做法是直接利用残差平方对选中的解释变量进行回归.在零假设(同方差)下,.,Dependent Variable: rsq Sum of Mean Source DF Squares Square F Value PrF Model 12 1.18881 0.09907 0.88 0.5731 Error 87 9.83078 0.11300
9、 Corrected Total 99 11.01958 Root MSE 0.33615 R-Square 0.1079 Dependent Mean 0.20989 Adj R-Sq -0.0152,BPG test results(1),.,BPG test results(2),Dependent Variable: rsqadjust Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr F Model 3 10.70415 3.56805 1.43 0.2386 Error 96 239.41116
10、 2.49387 Corrected Total 99 250.11531 Root MSE 1.57920 R-Square 0.0428 Dependent Mean 0.99997 Adj R-Sq 0.0129 Coeff Var 157.92443 ESS=10.70415,.,BPG test results(3),*ESS=5.35 F Model 3 0.47160 0.15720 1.43 0.2386 Error 96 10.54798 0.10987 Root MSE 0.33147 R-Square 0.0428,.,戈德菲尔德-匡特(Goldfeld-Quandt)检
11、验,按potexp的值将数据从小到大进行排列. 取前后个35个观测值分别回归.c=30; 回归的主要结果: RSS1=6.39573;RSS2=7.2517;RSS2/RSS1=1.13; 而 ;该比值不显著,不能拒绝同方差的原假设; 去掉的中间观测值的个数要适中,否则会降低功效,一般取观测值个数的1/3.,.,补救措施-已知方差的形式,1.广义最小二乘法(GLS); 请参考讲义中的例子; 2.模型变换法,适用于函数型异方差;已知方差的函数形式; 3.加权最小二乘法(WLS);实质上是一种模型变换法;具体参见讲义中的例子; 采用面板数据,增加信息量.,.,未知方差的形式,Furnival(19
12、61)提出了一种拟合指数进行不断的修正,最后找出最佳的权重(使得该指数值最小).,.,处理盲点-robust regression,1.迭代加权最小二乘法(IRLS),Neter提出了2中加权函数, Huber and Bisquare,但是不易操作.SAS v8中常使用Proc NLIN迭代. 2.非参数回归.Proc Loess. 3.SAS v9.0中有一个过程Proc robustreg Stata 中有一个比较好的命令:rreg直接进行鲁棒回归(robust),采用迭代过程.,.,序列相关性(serial correlation),OLSE unbiased,but ineffici
13、ent and its standard error estimators are invalid; BLUE of the Gauss-Markov Theorem no longer holds. The variance formulas for the least squares estimators are incorrect. AR,MA,or ARMA forms of serial correlation. Take the AR(1) for instance:,.,Dw 检验需要注意的地方,假定了残差是服从正态分布,而且是同方差;自变量是外生的,如果包含了内生滞后变量,就需
14、要用修正的dh检验(proc autoreg). 只适用于一阶自相关,对高阶或非线性自相关不适用. 样本容量至少为15.,.,自相关检验的标准,德宾和沃森根据显著水平,n,k,确定了二个临界值du(上界),dl(下界);然后进行比较; (1)ddu,不拒绝零假设; (3)dl2,负自相关;d=2,无自相关;,.,Eg:Ice cream demand(Hildreth,Lu(1960),Cons:consumption of ice cream per head(pints); Income:average family income per week($); Price :price of
15、ice cream(per pint); Temp: average temperature(in Fahrenheit); Data:30 four-weekly obs from March 1951 to 11 July 1953;,.,残差的散点图,.,回归结果,Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr |t| Intercept 1 0.19732 0.27022 0.73 0.4718 price 1 -1.04441 0.83436 -1.25 0.2218 incom
16、e 1 0.00331 0.00117 2.82 0.0090 temp 1 0.00346 0.00044555 7.76 |t| resid 1 0.38454 0.17029 2.26 0.0319,.,补救方法,1.已知rho时,采用广义差分变换. 2.未知rho时,先求相关系数,然后进行广义差分. 求相关系数的方法有: (1)Cochrane-Orcutt迭代方法; (2)Hildreth-Lu. (3)Durbin 2 step.,.,对严格外生回归元的序列相关的校正 AR(1)模型-可行的广义最小二乘法(FGLS),采用估计的相关系数值 回归方程: FGLS步骤: 1. .yt对
17、做xt1,xt2,xtk回归,得到残差t. 2. t = t-1+et,求出相关系数的估计值 3.对上面的方程进行回归.常见的标准误,t统计量和F统计量都是渐进正确的.采用相关系数估计值的代价是FGLS有限样本性质较差,可能不是无偏的(数据弱相关时),但仍然是一致的. 尽管FGLS不是无偏的,不是BLUE,但是当序列相关的AR(1)模型成立时,比OLS更渐进有效,.,区分科克伦-奥克特(Cochrane-Orcutt)和普莱斯-温斯登(Paris-Winsten)估计,Co 估计省略了第一次的观测值,使用的是t = t-1+et 滞后项系数估计值,而Pw估计方法使用了第一次的观测值,见上面的回
18、归式. 大体来说是否使用第一次的估计值并不会带来很大的差别,但是时间序列的样本很小,实际中还是有很大差别. 注意下面的估计结果中没有还原到原方程,还原时要写正确. 高阶序列相关的校正,类似于一阶的修正,广义的差分方法.,.,Sas 程序,data ice; input cons income price temp time; cards;.; proc reg data=ice; model cons=price income temp/dw; output out=ice1 p=consp r=resid; run; symbol1 i=none v=dot c=blue h=.5; pro
19、c gplot data=ice1; plot resid*time=1/vref=0; run;,/*BG test*/ data tt1; set ice1; resid1=lag(resid); run; proc reg data=tt1; model resid=resid1/noint; run;/*rh0=0.40063,R-square=0.1541*/; data bgt; bg=29*0.1541; chisq=cinv(0.95,1); if bgchisq then t=1;else t=0; put t=; run;/*t=0*/;,.,Sas 程序,高阶的BG检验:
20、 /*高阶BG test p=3*/; data tt2; set ice1; resid1=lag(resid); resid2=lag(resid1); resid3=lag(resid2); run; proc reg data=tt2; model resid=resid1 resid2 resid3/noint; run;/*R-square=0.1792*/; data bgt2; bg=(29-3)*0.1792; chisq=cinv(0.95,3); if bgchisq then t=1;else t=0; put t= chisq= bg=; run;/*t=0,无高阶自
21、相关*/;,.,Sas 程序,/*yule-walker estimates*/; proc autoreg data=ice; model cons=price income temp/nlag=1 method=yw ; run; * COCHRANE-ORCUTT; proc reg data=ice; model cons=price income temp/dw; output out=tt p=chat r=res; run; proc print data=tt;run; data tt; set tt; relag=Lag(res); run; proc print data=
22、tt;run; proc reg data=tt outest=b1; model res=relag/noint; run;/*可算出rh0=0.40063*/;,data pp; set tt; c1=lag(cons); t1=lag(temp); i1=lag(income); p1=lag(price); run; proc print data=pp;run; data pp1; set pp; if _n_=1 then delete; c2=cons-0.40063*c1; t2=temp-0.40063*t1; i2=income-0.40063*i1; p2=price-0
23、.40063*p1; run; proc print data=pp1;run; proc reg data=pp1; MODEL c2=t2 i2 p2/dw; run; /*dw=1.541.65,因此不拒绝平稳性假设*/;,.,Sas 程序,上页的科克伦-奥科特迭代只用了1次; 对小样本情况,迭代多次的仍然很难收敛,我做了三次迭代发现仍然不收敛;所以说多次迭代效果和一次的效果相差不大.从理论上来说两者的渐进性一样. 大样本情况只需几步就可收敛;,/*下面采用fgls进行估计校正*/; data fgls; set tt1; if _n_=1 then int=sqrt(1-0.40063
24、*0.40063);else int=1-0.40063; if _n_=1 then cons1=cons*sqrt(1-0.40063*0.40063);else cons1=cons-0.40063*cons; if _n_=1 then price1=price*sqrt(1-0.40063*0.40063);else price1=price-0.40063*price; if _n_=1 then income1=income*sqrt(1-0.40063*0.40063);else income1=income-0.40063*income; if _n_=1 then temp
25、1=temp*sqrt(1-0.40063*0.40063);else temp1=temp-0.40063*temp; run; proc reg data=fgls; model cons1=int price1 income1 temp1/noint; run;,.,Sas 程序,proc autoreg data=ice; model cons=price income temp/nlag=1 dwprob archtest; run; 估计方法缺省为yule-walker估计;又称为两步完全变换法;已知自回归参数下的GLS估计; 其他方法:在model /method=ML;ULS;
26、ITYW; 分别为极大似然估计,无条件最小二乘估计,以及迭代yule-walker估计;自回归参数较大时ml方法uls(又称NLS)方法较好. 详见SAS/ETS中的autoreg过程.,.,Yuler-walker estimate,The AUTOREG Procedure Dependent Variable cons Ordinary Least Squares Estimates SSE 0.03527284 DFE 26 MSE 0.00136 Root MSE 0.03683 SBC -103.63408 AIC -109.23887 Regress R-Square 0.7190 Total R-Square 0.7190 Durbin-Watson 1.0212 Pr DW 0.9997 NOTE: PrDW is the p-value for testing negative autocorrelation Standard Approx Variable DF Estimate Error t Value Pr |t| Intercept 1 0.1973 0.2702 0.73 0.4718 price 1 -1.0444 0.8344 -1.25 0.2218 income 1 0.003308 0.001171 2.82 0.0090
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论