版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第,6,章,回归模型的假设检验,回归分析,是要判断,解释变量,X,是否是,被解释变,量,Y,的一个显著性的影响因素。,在,一元线性模型,中,就是要判断,X,是否对,Y,具有,显著的线性性影响。这就需要进行,变量的显著性,检验。,变量的显著性检验所应用的方法是数理统计学,中的,假设检验,。,计量经计学中,,主要是针对变量的参数真值是,否为零来进行显著性检验的。,第一节,假设检验,?,所谓,假设检验,,,就是事先对总体参数或总体分,布形式作出一个假设,然后利用样本信息来判断,原假设是否合理,即判断样本信息与原假设是否,有显著差异,从而决定是否接受或否定原假设,。,?,假设检验采用的逻辑推理方法是反
2、证法。,先假定原假设正确,然后根据样本信息,观察,由此假设而导致的结果是否合理,从而判断是否,接受原假设。,?,判断结果合理与否,是基于“小概率事件不易,发生”这一原理的,1,、显著性检验,t,检验,),(,?,2,2,1,1,?,i,x,N,?,?,?,),2,(,?,?,?,1,?,1,1,2,2,1,1,?,?,?,?,?,?,n,t,S,x,t,i,?,?,?,?,?,?,t,值是用来检验根据,OLS,估计出来的回归系数是否显著,的统计量。,检验步骤:,(,1,)对总体参数提出假设,H,0,:,?,1,=0,,,H,1,:,?,1,?,0,(,2,)以原假设,H,0,构造,t,统计量,
3、并由样本计算其值,(,3,)给定显著性水平,?,,查,t,分布表,得临界值,t,?,/2,(n-2),(4),比较,判断,若,|t|,t,?,/2,(n-2),,则拒绝,H,0,,接受,H,1,;,若,|t|,?,t,?,/2,(n-2),,则拒绝,H,1,,接受,H,0,;,T=,1,1,(,2),(,),b,t,n,S,b,?,:,对于一元线性回归方程中的,?,0,,可构造如下,t,统计量进行显著性检验:,),2,(,?,?,?,0,?,0,2,2,2,0,0,?,?,?,?,?,?,n,t,S,x,n,X,t,i,i,?,?,?,?,?,在上述,收入,-,消费支出,例中,首先计算,?,2
4、,的估计值,13402,2,10,7425000,777,.,0,4590020,2,?,2,?,2,2,2,1,2,2,2,?,?,?,?,?,?,?,?,?,?,?,?,?,n,x,y,n,e,i,i,i,?,?,0425,.,0,0018,.,0,7425000,/,13402,?,2,2,?,1,?,?,?,?,?,i,x,S,?,?,41,.,98,7425000,10,/,53650000,13402,?,2,2,2,?,0,?,?,?,?,?,?,?,i,i,x,n,X,S,?,?,t,统计量的计算结果分别为:,29,.,18,0425,.,0,777,.,0,?,1,?,1,1
5、,?,?,?,?,?,S,t,048,.,1,41,.,98,17,.,103,?,0,?,0,0,?,?,?,?,?,?,?,S,t,给定显著性水平,?,=0.05,,查,t,分布表得临界值,t,0.05/2,(8)=2.306,|t,1,|2.306,,说明,家庭可支配收入在,95%,的置信,度下显著,即是消费支出的主要解释变量;,|t,2,|,2.306,表明在,95%,的置信度下,无法拒绝截,距项为零的假设。,2,、显著性检验,F,检验,F,检验属于回归方程的显著性检验,它是对所有参数感兴趣的,一种显著性检验。其检验步骤为:,第一步:提出假设。,原假设,H,0,:,(,同时为零),备择
6、假设,H,1,:,不同时为零,0,1,?,?,,,0,1,?,?,?,=0,0,1,?,?,,,第二步:构造,F,统计量。,可以证明:,1,(1,2),(,2),ESS,F,F,n,RSS,n,?,?,?,:,(2.4.6),即,F,统计量服从第一自由度为,第二自由度为,n-2,的,t,分布。,F,统计量的计算一般通过下列方差分析表进行。,表,2.4.2,方差分析表,变差来源,平方和,自由度,均方,F,统计量,回归,残差,ESS,RSS,1,2,n,?,ESS,2,2,e,RSS,n,S,?,?,1,(,2),ESS,F,RSS,n,?,?,总变差,TSS,1,n,?,2,1,y,TSS,n,
7、S,?,?,第三步:给定显著水平,,查,F,分布临界值得到,第四步:做出统计决策,?,(1,2),F,n,?,?,例,2.3.2,仍以例,2.2.1,资料为例,,F,检验过程如下:,第一步:提出假设。,原假设,H,0,:,(,同时为零),备择假设,H,1,:,不同时为零,0,1,?,?,,,0,1,?,?,?,=0,0,1,?,?,,,第二步:计算,F,统计量,因为,ESS,1602708.6 (,计算过程见表,2.4.3),或直接取自输出结果,2.2.1,中的方差分析部分“回归分析(行),SS,(列)”,(1602708.6),。,2,1,?,(,),n,i,i,RSS,y,y,?,?,?,
8、?,40158.071 (,计算过程见计算表,2.3.3),或直接取,自输出结果,2.2.1,中的方差分析部分“残差(行),SS,(列)”,(40158.071),。,(,见方差分析表,2.3.4),1602708.6/1,1,399.09999,40158.071 /10,(,2),ESS,F,RSS,n,?,?,?,?,或直接取自输出结果,2.2.1,中的方差分析部分“回归分析(行),F,(列)”,(399.09999),。,(,见表,2.4.4),表,2.4.3,计算表,汽车销售量(辆),y,广告费(万元),x,?,i,y,2,?,(,),i,i,y,y,?,2,?,(,),i,y,y,
9、?,1000,1100,1250,1280,1360,1480,1500,1720,1800,1890,2100,2200,357,385,420,406,490,525,602,651,735,721,840,924,1087.996761,1144.805205,1215.81576,1187.411538,1357.83687,1428.847425,1585.070646,1684.485423,1854.910755,1826.506533,2067.94242,2238.367752,7743.429946,2007.506395,1168.562264,8572.623296,4
10、.679131397,2616.585929,7237.014811,1261.285179,3015.191015,4031.420352,1027.688435,1472.084394,219651.4805,169629.8636,116179.3406,136349.35,39533.28804,16337.75854,806.786042,16337.63447,88949.53623,72813.55346,261402.8959,464716.3697,表,2.4.4,方差分析表,方差分析,变差来源,df,SS,MS,F,Significance F,回归,1 1602708.6
11、,1602708.6,399.09999,2.16982E-09,残差,10 40158.071,4015.8071,总计,11 1642866.7,第三步:给定显著水平,5%,?,?,,查,F,分布临界值得到,0.05,(1,10),4.96,F,?,第四步:做出统计决策,,所以我们拒绝原假设,0,H,,接受备择假设,认为,x,与,y,关系显著即回归方程显著,,F,检验通过。,因为,F=399.09999,0.05,(1,10),4.96,F,?,?,三,结构变化的,F,检验,结构变化的,F,检验,也成为,Chow test,,用于调查,检验经济分析中一个极其重,要的问题,即,“,是否存在结
12、构变化,”。,步骤,1,:在利用时间序列所做的回归分析中,找,出估算期间内发生结构变化的时点(分界点),,以此时点为标准,将期间分为前期和后期。,步骤,2,:,对前期,后期,全部期间进行回归分析,,求各自的残差平方和,。,步骤,3,:,根据结构变化的,F,检验公式,计算,F,值。,R,S,R,S,SSR,S,2,S,1,:,1,SSR,前期的残差平方和,:,1,n,前期的样本数,:,2,SSR,后期的残差平房和,:,2,n,后期的样本数,:,SRR,全部期间的残差平方和,:,k,解释变量的数,(,1,),,,1,1,2,1,?,?,?,?,k,n,k,n,的情形。,结构变化的,F,检验为,1,
13、),1,(,2,2,S,1,),2,1,S,(,2,1,?,?,?,?,?,?,?,?,?,k,k,n,n,R,S,SSR,SSR,R,S,SSR,F,(,2,),,,1,1,?,?,k,n,的情形(以及,),1,1,?,?,k,n,2,1,),1,(,1,1,n,k,n,SSR,SSR,SSR,F,?,?,?,?,?,步骤,4:,利用,F,分布表,对步骤,3,计算出的,F,值进行检验。在,检验时,分别就上述(,1,)的情形中,自由度(分子,分,母),=,,,(2),的情形中,自由度,进行,F,检验。,如果计算出的,F,值,大于,F,分布表中的判,定值,放弃“前期的回归系数与后期的回,归系数完
14、全相等”的假设,,说明出现了结,构性变化。,相反,如果计算出的,F,值小于,F,分布表中的判定值,不放弃“前期的回,归系数与后期的回归系数完全相等”的假,设,说明没有发生结构性变化。,),2,2,1,(,2,1,?,?,?,?,k,n,n,k,),1,(,1,2,?,?,k,n,n,4,、相关系数检验(,r-Test,),由于一元线性回归方程研究的是变量,x,与变量,y,之间的线性相关,关系,所以我们可以用反映变量,x,与变量,y,之间的相关关系密切,程度的相关系数来检验回归方程的显著性。,由于总体相关系数定义为,ov(,),(,),(,),C,x,y,Var,x,Var,y,?,?,设,(,
15、),1,2,.,i,i,x,y,i,n,?,是,(,),x,y,的,n,组样本观测值,则我们称,1,2,2,1,1,(,)(,),(,),(,),n,i,n,n,i,i,i,i,x,x,y,y,Lxy,r,LxxLyy,x,x,y,y,?,?,?,?,?,?,?,?,?,?,?,?,1,1,1,2,2,2,2,1,1,1,1,n,n,n,i,i,i,i,i,i,i,n,n,n,n,i,i,i,i,i,i,i,i,n,x,y,x,y,n,x,x,n,y,y,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,
16、?,?,?,?,?,?,?,?,?,?,?,1,Lxx,b,Lyy,?,其中,xy,L,?,1,(,)(,),n,i,x,x,y,y,?,?,?,?,xx,L,?,2,1,(,),n,i,i,x,x,?,?,?,yy,L,?,2,1,(,),n,i,i,y,y,?,?,?,为,x,与,y,的简单线性相关系数,简称相关系数。它表示,x,和,y,的线,性相,关关系的密切程度。其取值范围为,|r| 1,,即,-1 r 1,。,?,?,?,当,r=-1,时,表示,x,与,y,之间完全负相关;,当,r=1,时,表示,x,与,y,之间完全正相关;,当,r=0,时,表示,x,与,y,之间无线性相关关系,即说
17、明,x,与,y,可,能无相关关系或,x,与,y,之间存在非线性相关关系。,5,、四种检验的关系,前面介绍了,t,检验、拟合优度(,)检验、,F,检验和相关,系数(,r,)检验,对于一元线性回归方程来说,可以证,明,这四种检验:,2,R,2,2,1,r,n,t,r,?,?,?,(2.4.8),2,(,2),F,R,n,F,?,?,?,(2.4.9),2,F,t,?,(2.4.10),2,r,R,?,(2.4.11),因此,对于一元线性回归方程,我们只需作其中的一种检验,即可。但对于多元线性回归方程这四种检验有着不同的意义,,并不是等价的,需分别进行检验。,是等价的。,5,、回归方程的标准记法,为
18、了方便,我们往往将回归方程的参数估计和系数的显著性检,验统计量结果放在一起。例如,对于例,2.2.1,,我们可以采用以,下标准记法:,363.6891 + 2.028873x,S,(,62.455288,),(,0.101558,),t,(,)(,),?,i,y,*,5.8231909,*,19.977487,有时,S,(回归系数的标准差,有时也记为,)也可不写;,t,统计,量右上角,*,的表示显著性水平的大小,,*,一般表示在显著性水平,1,下显著,,*,一般表示在显著性水平,5,下显著,无,*,表示,5,下,不显著。,e,S,第,2,节,预测与控制,一、预测,(点预测、区间预测),二、控制
19、,对于一元线性回归模型,i,i,X,Y,1,0,?,?,?,?,?,?,?,给定样本以外的解释变量的观测值,X,0,,可以得到被解,释变量的预测值,?,0,,可以此作为其,条件均值,E(Y|X=X,0,),或,个别值,Y,0,的一个近似估计,注意:,严格地说,这只是被解释变量的预测值的估计,值,而不是预测值。,原因,:,(,1,)参数估计量不确定;,(,2,)随机项的影响,一、预测,(一)点预测,即,0,?,y,是,0,(,),E,y,的无偏估计量,但不是,0,y,的无偏估计量。但,0,0,?,(,),0,E,y,y,?,?,,说明预测误差,0,0,?,(,),y,y,?,在多次,观察中,平均
20、值趋于零。因此,也可以用,0,?,y,作为,0,y,的点估计值。,于是,我们把点预测分为两种:一是平均值的点预测,二是,个别值的点预测。利用回归方程,对于,x,的一个固定值,推算,出,y,的平均值的一个估计值,就是平均值的点预测;如果对于,x,的一个特定值,推算出,y,的一个个别值的估计值,则属于个别,值的点预测。,例,2.5.1,仍以例,2.2.1,资料为例,若要估计广告费用为,1000,万元,时,所有,12,个汽车销售分公司的汽车,销售量的平均数为,0,(,),E,y,363.6891,2.028873,?,1000,?,2393,(辆),,就是平均值的点预测;若要估计广告费用为,602,
21、万元的那个汽车,销售分公司的汽车销售量为,0,?,y,363.6891,2.028873,?,602,1585,(辆),就属于个别值的点预测。,(,二,),、区间预测值,1,、总体均值预测值的置信区间,由于,0,1,0,0,?,?,?,X,Y,?,?,?,?,),(,?,2,2,1,1,?,i,x,N,?,?,?,),(,?,2,2,2,0,0,?,?,?,?,?,i,i,x,n,X,N,),?,(,),?,?,(,2,),?,(,),?,(,1,2,0,1,0,0,0,0,?,?,?,?,Var,X,Cov,X,Var,Y,Var,?,?,?,0,1,0,1,0,0,0,),?,(,),?,
22、(,),?,(,X,E,X,E,Y,E,?,?,?,?,?,?,?,?,于是,可以证明,?,?,?,2,2,1,0,/,),?,?,(,i,x,X,Cov,?,?,?,因此,?,?,?,?,?,?,?,2,2,2,0,2,2,0,2,2,2,0,2,),?,(,i,i,i,i,x,X,x,X,X,x,n,X,Y,Var,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,2,0,0,2,2,2,2,2,2,X,X,X,X,n,X,n,X,x,i,i,?,),),(,(,2,0,2,2,2,X,X,n,x,x,i,i,?,?,?,?,?,?,故,),),(,1,(,(,?,2
23、,2,0,2,0,1,0,0,?,?,?,?,i,x,X,X,n,X,N,Y,?,?,?,),2,(,),(,?,0,?,0,1,0,0,?,?,?,?,n,t,S,X,Y,t,Y,?,?,),),(,1,(,?,2,2,0,2,?,0,?,?,?,?,i,Y,x,X,X,n,S,?,其中,于是,在,1-,?,的置信度下,,总体均值,E(Y|X,0,),的置信区间为,0,2,0,2,?,0,0,?,0,?,),|,(,?,Y,Y,S,t,Y,X,Y,E,S,t,Y,?,?,?,?,?,?,?,?,2,、总体个值预测值的预测区间,由,Y,0,=,?,0,+,?,1,X,0,+,?,知,:,),(
24、,2,0,1,0,0,?,?,?,X,N,Y,?,于是,),),(,1,1,(,0,(,?,2,2,0,2,0,0,?,?,?,?,?,i,x,X,X,n,N,Y,Y,?,),2,(,?,0,0,?,0,0,?,?,?,?,n,t,S,Y,Y,t,Y,Y,式中,:,),),(,1,1,(,?,2,2,0,2,?,0,0,?,?,?,?,?,?,i,Y,Y,x,X,X,n,S,?,从而在,1-,?,的置信度下,,Y,0,的置信区间,为,0,0,2,0,2,?,0,0,0,?,0,?,?,Y,Y,Y,Y,S,t,Y,Y,S,t,Y,?,?,?,?,?,?,?,?,?,?,在上述,收入,-,消费支出
25、,例中,得到的样本回归函数为,i,i,X,Y,777,.,0,172,.,103,?,?,?,?,则在,X,0,=1000,处,,?,0,=,103.172+0.777,1000=673.84,29,.,3727,7425000,),2150,1000,(,10,1,13402,),?,(,2,0,?,?,?,?,?,?,?,?,?,?,Y,Var,而,05,.,61,),?,(,0,?,Y,S,因此,,总体均值,E(Y|X=1000),的,95%,的置信区间为:,673.84-2.306,?,61.05,E(Y|X=1000),673.84+2.306,?,61.05,或,(,533.05,
26、 814.62,),同样地,对于,Y,在,X=1000,的,个体值,,其,95%,的置信区间为:,673.84 -,2.306,?,61.05Y,x=1000,673.84 + 2.306,?,61.05,或,(372.03, 975.65),?总体回归函数的,置信带(域),(,confidence band,),?,个体的,置信带(域),对于,Y,的总体均值,E(Y|X),与个体值的预测区间(置信,区间),:,(,1,),样本容量,n,越大,预测精度越高,反之预测精,度越低;,(,2,),样本容量一定时,置信带的宽度当在,X,均值处,最小,其附近进行预测(插值预测)精度越大;,X,越,远离其
27、均值,置信带越宽,预测可信度下降。,二、控制,所谓控制实际上就是预测的反问题。,即若因变量,y,取值于一定范围内,例如,,,已经给定,求自变量,x,应控制在什么范围内。这等价于求,与,,使得当,时,因变量,y,以,1-,的,概率取值于,。,1,2,y,y,y,?,?,1,2,y,y,和,1,x,2,x,1,2,1,2,(,),(,),Min,x,x,x,Max,x,x,?,?,?,1,2,(,),y,y,对于个别值的区间预测,1,0,1,1,0,0,2,2,0,1,2,0,0,2,?,(,2),(,),?,(,2),(,),y,b,b,x,t,n,Var,y,y,y,b,b,x,t,n,Var
28、,y,y,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,由,可以解出,1,x,与,2,x,作为,x,的控制限。,但应注意,要实现控制必须,,即应有,1,2,0,x,x,?,?,2,1,0,0,2,?,(,2),(,),0,y,y,t,n,Var,y,y,?,?,?,?,?,f,从而,1,y,和,2,y,应满足,2,1,0,0,2,?,2,(,2),(,),y,y,t,n,Var,y,y,?,?,?,?,f,当此条件满足时,,1,2,1,2,(,(,),(,),Min,x,x,Max,x,x,即为,x,的控制范围。,同理,对于平均值的区间预测,2,1,0,1,1,0,0,2
29、,2,2,0,1,2,0,0,2,?,(,2),(,(,),?,(,2),(,(,),y,b,b,x,t,n,Var,y,E,y,y,b,b,x,t,n,Var,y,E,y,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,由,可以解出,1,x,与,2,x,作为,x,的控制限。,第,3,节,案例:一元线性回归模,型的应用,已知某地区,1978,年,2003,年的国内生产总值,GDP,与货运周转,量的数据如下表所示:,年,份,GDP,(,亿元,),货运周转量,(亿吨公里),年,份,GDP,(,亿元,),货运周转量,(,亿,吨,公,里),1978,1979,1980,1981,1
30、982,1983,1984,1985,1986,1987,1988,1989,1990,5.0,8.7,12.0,16.0,19.0,22.0,25.0,28.0,36.0,40.0,41.0,32.0,34.0,9.0,12.0,14.0,15.0,17.0,20.0,20.5,23.5,30.0,35.0,32.0,24.0,28.0,1991,1992,1993,1994,1995,1996,1997,1998,1999,2000,2001,2002,2003,44.0,47.0,54.0,56.5,56.0,57.0,59.0,63.0,66.5,67.0,70.5,70.6,73.0
31、,32.0,34.0,37.0,40.0,44.0,43.5,43.5,43.5,44.0,45.5,47.0,46.0,52.0,试对其进行一元线性回归分析。若,2005,年国内生产总值,GDP,达,到,80,亿元,试对其货运周转量做出区间预测,。,(,5%),?,?,一、相关分析,绘制散点图,以观察国内生产总值,GDP,与货运周转量之间的,关系形态。,用,Excel,软件制作散点图的步骤如下:,第一步:选择“插入”下拉菜单。,第二步:选择“图表”选项,第三步:选择,XY,散点图。,第四步:输入数据区域。,第五步:定义,X,轴为“国内生产总值,GDP,”、,Y,轴为“货运周,转量”。,第六步:选择新工作表插入还是作为其中的对象插入,(,在这里,我们选择作为其中的对象插入,),。按“完成”。图形如,2.6.1,所,0,10,20,30,40,50,60,0,20,40,60,80,由图,2.6.1,可以看出,国内生产总值,GDP,与货运周转量之间具,有线性相关关系。于是我们可以对国内生产总值,x,与货运周转,量,y,建立一元线性回归方程,?,i,y,0,1,b,b,?,?,i,x,进行回归分析。,二、回归分析,用,Excel,软件进行回归计算的步骤如下:,第一步:选择“工具”下拉菜单。,第二步:选择“数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 奥玛电动执行器培训
- 二零二四年度旅游服务合同(标的为旅游咨询服务)3篇
- 充电桩停车场租赁合同范本
- 二零二四年度图书馆搬迁合同
- 服装店劳动合同简短
- 二零二四年度商标许可使用协议
- 二零二四年度场地租赁及经营管理合同
- 2024年度智能化系统集成承包合同
- 第39辑:钝感力+根和花-中学生作文高频话题导写40题
- 二零二四年度设备采购合同:甲乙双方关于某型机器人采购的详细条款
- 少儿体适能训练方案
- 肠内营养支持小讲课护理课件
- 肾造瘘的滑脱应急预案
- 高二期中考试家长会课件
- 初中数学八年级上册 轴对称与轴对称图形 市赛一等奖
- 沉浸式展览-技术催生的新体验
- 琵琶演出策划方案
- 车辆动态监控员培训课件
- 毛概讨论全面建设小康社会
- 煤矿职工安全生产的权利和义务
- 银行客户经理竞聘演讲课件
评论
0/150
提交评论