




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章双变量模型:假设检验本章目的:介绍如何检验样本回归直线对总体回归函数的拟合程度要求:掌握古典线性回归模型的基本假定;OLS估计量方差、标准差的含义;回归标准差的含义、高斯---马尔柯夫定理的内容;会运用计算机软件得到回归方程。教学时数:6学时第一节至第五节:3学时第一节介绍古典线性回归模型的基本假定及含义1、误差项均值为零 E(u.)=02、误差项同方差 Var(Uj)=b23、误差项无自相关 Cov(Uj,u.)=04、 解释变量与误差项不相关CoV(X.,u.)=0i,j=1,2,3.....,闰 11第二节OLS估计量的期望值(均值)、方差、标准差1、 OLS估计量是随机变量对于回归模型丫广8]+82*+*_ _参数的OLS估计量为"1=\一"2x乙Xy“2=ZX2'由于u是随机变量,Y是随机变量u与非随机变量X的代数和,则Y也是随机变量。由OLS估计量的表达式可以看出听、b2是Y的线性函数,所以b「b2也是随机变量。2、 OLS估计量的期望值E(b1)=B],E(b2)=B2可见b「b2分别为B1、B2无偏估计量。3、 OLS估计量的方差方差量度随机变量与其平均值的偏离程度,OLS估计量的方差与观测值及随机误差项的方差有关系var(b)=^XLq2 。=.'varb)1nZz2 b1 1var(b2)=z^~ q=Jvarb)4、由于我们通常不知道误差的生成过程,当然也不知道误差项的方差,通常使用残差信息来估计误差的方差Q2=」 且E(Q2)=q2n一25、我们用样本信息、残差信息来估计OLS估计量的方差和标准差如下se(b)=se(b)=var(bse(b)=se(b)=1 nZx2ivar(b)=Z^~*i6、计算Widget教科书需求函数中参数的标准差第三节OLS估计量的性质1、高斯---马尔柯夫定理如果满足古典线性回归模型的基本假定,OLS估计量是最优线性无偏估计量。高斯---马尔柯夫定理包含三个层次含义
(1) 线性性:b「b2是Y的线性函数(2) 无偏性:E(b1)=B],E(b2)=B2,E(。2)=。2(3) 有效性(最小方差性):OLS估计量的方差是所有无偏估计量中方差最小的。3、蒙特卡罗试验(随机模拟试验Simulation)演示OLS估计量的无偏性蒙特卡罗试验又称为随机模拟试验,经常被用来研究一个未知的随机过程的概率分布,这里该方法被用来演示OLS估计量的无偏性,请查看随机模拟(蒙特卡罗)试验一一OLS估计量的无偏性专题。第四节OLS估计量的抽样分布为了研究OLS估计量的抽样分布,增加一条古典假定假定u~N(0,b2)i则b]〜N(B],bb),b2〜N(B2,bb)请查看随机模拟(蒙特卡罗)试验一一OLS估计量的抽样分布第五节假设检验提出问题:由于得不到总体数据,当然也得不到总体回归函数的参数的值。当我们用样本数据得到参数的样本估计值时,由于存在抽样误差,我们不知道这个样本估计值与总体参数的差异,所以我们必须检验得到的样本估计值对总体参数的代表性。检验的方法就是假设检验法。由于我们事先不知道总体参数的值,一般地,我们检验总体参数是否为某一确定值,不妨设为B*。为此,对于一元回归Y.=B]+B2X.+u.设定一个零假设(也称原假设或原假说)H0:B2=B*,含义为总体参数值为B*;备择假设为H]:B2丰B*,含义为总体参数值不等于B*。看我们是否有充分的证据拒绝或接受这一假设。特别地:如果检验解释变量对被解释变量是否有解释作用,设定一个零假设(也称原假设或原假说)H0:B2=0,含义为假设X对Y没有解释作用;备择假设为B2更0,含义为X对Y有解释作用。1、 置信区间法构造总体参数B295%的置信区间,这个区间称为的接受区域,即:B*如果位于接受区域,我们就接受零假设;置信区间之外称为B2的拒绝区域,即:B*如果位于拒绝区域,我们就拒绝零假设。2、 显著性检验法(以t检验为例)H0:B2=B*,H]:B2丰B*取定显著水平a,查表得到ta/2(n-2)(对于多元回归,自由度为n-k,k为参数个数)计算t=史二B*的值se(b)Id>t&/2拒绝零假设(通常称为统计显著),/<ta/2接受零假设。3、置信区间法与显著性检验法假设检验法的关系--等价我们以t检验(即参数显著性检验)为例说明。需要注意,此处提供的不是严格的数学证明,只是举例说明,以帮助同学们理解这两种假设检验方法的关系。如果我们计算的t统计量的值是不显著的,则-1 <t=—B*<t。解不等式得a/2se(b)a”到B*e[b-tse(b),b-tse(b)],即B*在接受区域中,我们接受零假设。2a/2 2 2a/2 2反之,如果B*在接受区域中,则b-tse(b)<B*<b-t se(b),即:2a/2 2 2a/2 2-ta/2<t=^T^B-<t-ta/2<t=^T^B-<t,se(b)a/2|t|<t ,a/2于是,我们接受零假设。24、检验教科书的需求量模型参数的显著性5、运用假设检验原理检验b2的显著性为n-2的X2分布。H0为n-2的X2分布。H0:节=1.5,(n-2)b2H1:节丰1.58x1.1939—^5——=6.3675<X2)=15.5 (直信水平=0.05)我们不能拒绝H0:b2=,即认为样本估计值1.1939与真实值1.5没有显著差别。第六节至第九节:3学时第六节拟和优度的检验:判定系数r21、离差分解我们有恒等式 Y-Y=(Y-Y)+(Y-Y)TOC\o"1-5"\h\zi i ii两边平方并求和:£(Y—y)2=E(Y—y)2+E(Y—Y)2+2£(Y—y)(y—Y)i i ii i ii由正规方程中£eX=0和£e=0- -V 一(Y—Y)(Y—Y)=£e(b+bX—Y)
i ii i1 2i=b£e+b£eX—Y£e=01i2ii i于是有:£(Y—Y)2=£(Y—Y)2+£(Y—Y)2i i ii£(Y—Y)2称为总离差平方和,记为TSSE- ——一,一、一、一(Y—Y)2称为回归平方和,记为ESSi£(Y—Y)2称为残差平方和,记为RSSii总离差平方和=回归平方和+残差平方和说明总离差可以分解为两个部分:一部分归于回归直线,一部分归于随机因素定义ESS
r2= TSS来量度回归线的拟和优度。r2表示回归线对样本点的解释程度,0<r2<10应注意:如果回归中没有截距项,不可能有£e.=0,也就得不到离差分解公式,所以我们定义的r2=理只对有截距项的回归有效。对没有截距项的回归的拟和优度的TSS判断应使用其它方法,同学们可以参考《经济计量学》(古亚拉提著,中国人民大学出版社,1998年)的相应内容。2、 教科书需求量例子中的r23、 判定系数与相关系数的关系对于一元回归,判定系数是相关系数的平方。第七节常见回归结果的报告以教科书需求量为例Y=49.667—2.1576Xi ise=(0.7464)(0.1203)t=(66.542)(—17.935)r2=0.9757,d.f.=8这样根据给出的信息可以判断参数是否统计显著(一般约定参数统计显著的含义为参数显著不为零)第八节正态性检验1、 我们可以通过残差的频度直方图直观地检验2、 JB统计量JB=勺S2+丝二也]6 4JB渐进地服从x、,n为样本容量,S为偏度,K峰度。正态分布变量,偏度为0,峰度为3。JB检验只对大样本有效,一般认为30个样本以上为大样本。H0:误差项服从正态分布,H1:误差项不服从正态分布如果JB>x2临界值,拒绝原假设,得到结论误差项不服从正态分布;否则,就接受原假设,得到结论误差项服从正态分布。第九节回归分析软件介绍个人计算机的普及使我们可以利用计算机软件来处理回归问题。常用的软件有:EVIEWS,SASS,SPSS,MINITAB等。同学们可以利用任何一种自己喜欢的工具来完成回归工作。第十节实例:美国进口支出1、 目的:研究美国进口消费品支出与个人可支配收入的关系2、 理论依据:凯恩斯的消费理论表明,个人消费支出与可支配收入正相关。对进口消费品支出是总消费品支出的一部分,可以认为进口消费品支出与可支配收入正相关。我们利用1968-1987年的数据进行研究(1982年不变价)。3、 理论模型:Yi=B1+B2Xi+ui丫=进口消费品支出(亿美元)X=个人可支配收入(亿美元)B2的经济含义:进口消费品的边际消费倾向,应该有0<B2<1B1的经济含义:如果从理论上讲,B]应表示收入为零时的对进口商品的消费量,B1这时应该为零。但从我们所取得数据中可以看出,我们只收集了个人可支配收入不低于1552亿元的数据,所以我们利用这组数据得到的截距项只能是一个数值,没有什么经济意义。4、数据与回归结果美国进口商品支出Y与/'人可支配收入X单位:亿美元XYXY19681,551.3135.719782,167.4274.119691,599.8144.619792,212.6277.919701,668.1150.919802,214.3253.619711,728.4166.219812,248.6258.719721,797.4190.719822,261.5249.519731,916.3218.219832,331.9282.219741,896.9211.819842,469.8351.119751,931.7187.919852,542.8367.919762,001.0229.919862,640.9412.319772,066.6259.419872,686.3439.0Eviews回归结果(Eviews是英文软件,为了同学们学习方便,特意在每行下加注中文翻译)DependentVariable:Y因变量:YMethod:LeastSquares方法:最小二乘法Date:03/22/02Time:19:44日期:03/22/02时间:19:44Sample:19681987样本区间:1968--1987Includedobservations:20回归中包括观察值个数:20VariableCoefficientStd.Errort-StatisticProb.变量系数系数的标准差估计值t统计量的值双尾概率值X0.2452310.01475916.615750C-261.091431.3266-8.3344950R-squared0.938793Meandependentvar253.08R2因变量的均值AdjustedR-squared0.935392S.D.dependentvar85.78792R2因变量的标准差S.E.ofregression21.80559Akaikeinfocriterion9.096849i . Ze2回归标准差Q= 1n一2AIC准则Sumsquaredresid8558.709Schwarzcriterion9.196423残差平方和Ze2Schwarz准则Loglikelihood-88.96849F-statistic276.0832对数似然值F--统计值Durbin-Watsonstat0.595073Prob(F-statistic)0DW统计量概率值Y=-261.09+0.24523Xse=(31.327)(0.0148)t=(-8.334)(16.599)P=(0.0000)(0.0000)r2=0.9387d.f=185、对回归结果的解释与我们预期的相同,进口支出与可支配收入正相关。斜率0.245表示可支配收入每增加一亿元,对进口商品的支出平均来说增加0.245亿元,即进口商品的边际消费倾向为0.245。截距项没有意义。r2值为0.9387,说明该模型解释了进口商品需求变化的93.87%,可见该模型很好地拟和了实际数据。6、回归结果的显著性检验我们关心可支配收入对进口商品支出的变动是否真的有影响,为此建立零假设:真实斜率为零,由回归结果可以看到t值为16.615,相应的p值为0.00<显著水平5%,所以我们拒绝原假设。即认为可支配收入确实对进口商品支出的变动有影响。大家还可以运用置信区间法或显著检验法进行检验,会得到相同的结论。7、误差正态性检验我们从下图中Eviews残差频度直方图中可以看出残差近似正态分布。下面我们使用JB统计量检验误差是否服从正态分布。运用JB统计量进行正态性检验要求大样本数据,一般认为样本容量大于30的样本为大样本。虽然本例中样本容量为20,不适合使用JB检验法,此处只是为了使同学们实践一下如何使用JB统计量检验误差的正态性。H0:误差项服从正态分布,H]:误差项不服从正态分布JB〜X2,z25%置信水平的临界值为5.99(2) (2)由于X2=0.71<临界值5.99,我们不能拒绝原假设,我们接受误差服从正态分布的假设。如果我们不使用临界值进行假设检验,从Eviews给出JB统计值及其对应的p值可以看到p>5%,由此可以判断出我们不能拒绝原假设,从而得到结论误差服从正态分布。应该注意到,如果误差项不服从正态分布,回归参数检验的统计量t=b2-B*的se(b)抽样分布就不是t分布、r2的抽样分布也不是F分布,当然我们就不能使用t检验进行参数显著性检验,也不能使用F检验进行总体显著性检验。回归方程误差正态性检验的操作:在Eviews的方程输出窗口中—►View-^ ResidualTes^^ NormalityTest第十一节预测Series:ResidualsSample19681987Observations20Mean1.05E-13Median4.547345Maximum41.32676Minimum-43.99901Std.Dev.第十一节预测Series:ResidualsSample19681987Observations20Mean1.05E-13Median4.547345Maximum41.32676Minimum-43.99901Std.Dev.21.22400Skewness-0.439647Kurtosis2.718693Jarque-Bera0.710243Probability0.7010881、点预测给定解释变量的值,根据回归模型得到对应的被解释变量期望值的预测值。表示为:X=X,利用得到的模型计算E(YIX)的估计量Y=E(Y1X)0 0 0 0以本节中美国进口消费品支出与个人可支配收入关系模型为例。假定 1998年的X0=2800亿美元,估计1998年对进口商品的需求Y1998=-261.09+0.24523x2800=425.56亿美元根据得到的预测值,我们可以认为1998年美国居民对进口商品的支出在425.56亿美兀左右。2、区间预测经济计量学理论证明了在古典假定下,寸服从正态分布,其均值、方差分别为:
0.八- .E(Y)=E(Y|X)=0 一Var(Y)=b2B+BX0 1 2 01 (X-X)2—+ 0 n Xx2i」Y-Y由于b2未知,我们用无偏估计量S2代替,则_次服从自由度为n-k的t分布,Se(Y)0k为模型中参数个数。我们建立与X0相关的真实总体均值E(Y|X0)的一个100(1-a)%的置信区间如下:Y-Se(Y)t<E(Y|X)<Y+Se(Y)t0 0a 0 0 0a2 2即莅-Se(Y)t,Y+Se(Y)t]0 0a0 0a2a-这个置信区间称为区2间预测。由Y的方差表达式可以看出0就越宽、预测误差越大。因此,X0与X差异越大,匕的方差就越大,从而置信区间当我们利用回归线预测因变量的均值时,需要格外小心。同学们可以利用本节例子求出1998年对进口商品支出的95%置信区间。第十二节实例:人均消费支出与人均可支配收入下表给出了美国1980-1995年间人均消费支出与人均可支配收入数据,我们利用Eviews回归的结果如下:美国1980年--1995年人均消费支出与人均可支配收入美元,1992年不变价PCEPDPI人均消费支出人均可支配收入13,21614,81313,24515,00913,27014,99913,82915,27714,41516,25214,95416,59715,40916,98115,74017,10616,21117,62116,43017,80116,53217,94116,24917,75616,52018,06216,80918,07817,15918,33017,40018,799DependentVariable:PCEMethod:Leas
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论