版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、222.5一元线性回归模型的置信区间与预测多元线性回归模型的置信区间问题包括参数估计量的置信区间和被解释变量预测值的置信区间两个方面,在数理统计学中属于区间估计问题。所谓区间估计是研究用未知参数的点估计值(从一组样本观测值算得的)作为近似值的精确程度和误差范围,是一个必须回答的重要问题。一、参数估计量的置信区间在前面的课程中,我们已经知道,线性回归模型的参数估计量是随机变量yi的函数,即:,工ky,所以它也是随机变量。在多次重复抽样中,每次1ii的样本观测值不可能完全相同,所以得到的点估计值也不可能相同。现在我们用参数估计量的一个点估计值近似代表参数值,那么,二者的接近程度如何?以多大的概率达
2、到该接近程度?这就要构造参数的一个区间,以点估计值为中心的一个区间(称为置信区间),该区间以一定的概率(称为置信水平)包含该参数。即回答以何种置信水平位于k-a,0+a)之中,以及如何求得a。111在变量的显著性检验中已经知道lt(n-k-1)(2.5.1)人卩.i这就是说,如果给定置信水平1-Q,从t分布表中查得自由度为(n-k-1)的临界值t,那么t值处在(-1,t)的概率是1-Q。表示为aa2a22P(ttt),1aaa22即P(-taAi-ita),1-a0iiP(0-1s00+1s)=1-iaiia2i2i于是得到:在(1,)的置信水平下0i的置信区间是(0ts,0+ts)i0010
3、02i2ii=0,1(2.5.3)在某例子中,如果给定=o.oi,查表得t(nk1)=t(13)=3.0120.0052从回归计算中得到0=102.3,0=0.21,S=15,S=0.01010001根据(2.5.2)计算得到0,0的置信区间分别为(57.12,147.48)和(0.1799,0.2401)01显然,参数0的置信区间要小。1在实际应用中,我们当然希望置信水平越高越好,置信区间越小越好。如何才能缩小置信区间?从(2.5.3)式中不难看出:(1)增大样本容量n。t在同样的置信水平下,n越大,从t分布表中查得自由度为(n-k-1)的临界值:越小;同时,增大样本容量,在一般情况下可使估
4、计值的标准差S减小,因为0式中分母的增大是肯定的,分子并不一定增大。(2)更主要的是提高模型的拟合度,以减小残差平方和工e2。设想一种极端情况,如果模型完全拟合样本观测i值,残差平方和为0,则置信区间也为0。(3)提高样本观测值的分散度。在一般情况下,样本观测值越分散,标准差越小。置信水平与置信区间是矛盾的。置t信水平越高,在其他情况不变时,临界值:越大,置信区间越大。如果要求缩小置信区间,在其他情况不变时,就必须降低对置信水平的要求。二、预测值的置信区间1、点预测计量经济学模型的一个重要应用是经济预测。对于模型y=0+0 x+u,i=1,2,,ni01ii如果给定样本以外的解释变量的观测值x
5、,有y=,+,x+uf01ff因x是前述样本点以外的解释变量值,所以u和u(i=1,2,n)是不相关ffi的。引用已有的OLS的估计值,可以得到被解释变量儿的点预测值:y邛+0 xf01(2.5.4)但是,严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因在于两方面:一是模型中的参数估计量是不确定的,正如上面所说的;二是随机项的影响。所以,我们得到的仅是预测值的一个估计值,预测值仅以某一个置信水平处于以该估计值为中心的一个区间中。于是,又是一个区间估计问题。2、区间预测如果已经知道实际的预测值y,那么预测误差为显然,e是一随机变量,可以证明E(e=E(y一yfff=E(,+,x+u
6、01=,+,x01fe+G+,x=o01f因为y,e=covCy(f)DCovef()f=Cov7,y丿一=c2+D(yf2CovCyf)ufff由原样本的OLS估计值求得,而y与原样本不相关,故有fCov(y,y=0,D(e)=2+D(y)fffuf=Covy,y丿一2Covy,y丿+Covy,y可以计算出来:z(2.5.5)(2.5.6)1+-+n为(x-X)2i1i因y和e均服从正态分布,用y构造统计量为:N(0,1)可利用它们的性质构造统计量,求区间预测值。利将,2用估计值,2代入上式,uut(n-2)ni1ii1Ne(1X-X1X-X1+f,21+fn工(x-Xun工(x-X)2ki
7、1iki1i,2ux-x+f工(x-X)(y-1*fa21X-X+fnX-x)八,2,uy+1*f21X-X+fn工(X-X)八,2ukki1iki1i这样,可得显著性水平a下Eyf丿的置信区间为(2.5.7)式称为y的均值区间预测。fe同理,利用f构造统计量,有(2.5.7)将2用估计值2代入上式,有:utet(n-2)x-x+f工(x-x丄1x-x1+ni1y-1*1x-x1+f2,y+1*1x-x1+f八2fa2n工(x-x,ufa2n工(x-x,uki1iki1i根据置信区间的原理,得显著性水平a下yf的置信区间:2.5.8)上式称为少的个值区间预测,显然,在同样的a下,个值区间要大于
8、均值区间。(2.5.7)和(2.5.8)也可表述为:y的均值或个值落在置信区间内的概率为f1-a,1-a即为预测区间的置信度。或者说,当给定解释变量值x后,只能得f到被解释变量y或其均值E。)以(l-a)的置信水平处于某区间的结论。ff经常听到这样的说法,“如果给定解释变量值,根据模型就可以得到被解释变量的预测值为值”这种说法是不科学的,也是计量经济学模型无法达到的。如果一定要给出一个具体的预测值,那么它的置信水平则为0;如果一定要回答解释变量以100%的置信水平处在什么区间中,那么这个区间是。在实际应用中,我们当然也希望置信水平越高越好,置信区间越小越好,以增加预测的实用意义。如何才能缩小置
9、信区间?从(2.5.5)和(2.5.6)式中不难看出:(1)增大样本容量n。在同样的置信水平下,n越大,从t分布表中查得自由度为(n-k-1)的临界值t越小;同时,增大样本容量,在一般情况下可使a2工e22-减小,因为式中分母的增大是肯定的,分子并不一定增大。(2)更un-2主要的是提高模型的拟合优度,以减小残差平方和工e2。设想一种极端情况,i如果模型完全拟合样本观测值,残差平方和为0,则置信区间长度也为0,预测区间就是一点。(3)提高样本观测值的分散度。在一般情况下,样本观测值越分散,作为分母的,x-X)2的值越大,致使区间缩小。置信水平与置信区间是矛i盾的。置信水平越高,在其他情况不变时
10、,临界值t越大,置信区间越大。如2果要求缩小置信区间,在其他情况不变时,就必须降低对置信水平的要求。四、一元线性回归模型参数估计实例为了帮助读者理解一元线性回归模型参数估计的原理,下面以我国国家财政文教科学卫生事业费支出模型为例,不采用计量经济学应用软件,用手工计算,进行模型的参数估计。经分析得到,我国国家财政中用于文教科学卫生事业费的支出,主要由国家财政收入决定,二者之间具有线性关系。于是可以建立如下的模型:ED=+阳+ttt其中,EDt为第t年国家文教科学卫生事业费支出额(亿元),FIt为第t年国家财政收入额(亿元),t,为随机误差项,和口为待估计的参数。选取19911997年的数据为样本
11、,利用(2.2.6)和(2.2.7)的计算公式,分别计算参数估计值。表2.2.1有关数据表年份EDFIEDFIAEDAED-ED(ED-ED)/ED19917083149-551-2351734-26-0.03719927933483-466-2017804-11-0.01419939584349-301-11511001-43-0.04519941278521819-2821196820.0641995146762422087421424430.02919961704740844519081685190.01119971904865164531511963-59-0.031有关中间计算结果如
12、下:,ED=8812,FI=38500ttED=1259FI=5500tt,FI2=236869644t,FIED=54078207ttt,FI=5612207t,FI2=25119644由电脑计算的参数估计值为t=-39.65,B二0.24全部统计结果如下表。从表中可看出,判定系数R20.99,表示以国家财政收入额来解释国家文教科学卫生事业费支出额,在1991至1997年间,拟合度相当理想。截距项A的估计值对应的t-统计量为0.47,不能通过显著性检验,即不能推翻为0的假设;而一次系数,的估计值对应的t-统计量为20.34,不用查表即可知通过显著性检验,即,显著不为0,因果关系成立。F-统计
13、量的值为413.58,也表示方程系数显著不为0。表一:Eviews计算结果DependentVariable:EDMethod:LeastSquaresDate:09/21/02Time:16:22Sample:19911997Includedobservations:7VariableCoefficientStd.Errort-StatisticProb.C30.0523763.906910.4702520.6580FI0.2234190.01098620.336590.0000R-squared0.988055Meandependentvar1258.857AdjustedR-square
14、d0.985666S.D.dependentvar459.8972S.E.ofregression55.06160Akaikeinfocriterion11.08974Sumsquaredresid15158.90Schwarzcriterion11.07428Loglikelihood-36.81408F-statistic413.5768Durbin-Watsonstat1.644626Prob(F-statistic)0.000005表二:不含截距项的Eviews计算结果:DependentVariable:EDMethod:LeastSquaresDate:09/21/02Time:1
15、6:19Sample:19911997Includedobservations:7VariableCoefficientStd.Errort-StatisticProb.FI0.2283040.00333768.408770.0000R-squared0.987526Meandependentvar1258.857AdjustedR-squared0.987526S.D.dependentvar459.8972S.E.ofregression51.36364Akaikeinfocriterion10.84730Sumsquaredresid15829.34Schwarzcriterion10.
16、83957Loglikelihood-36.96556Durbin-Watsonstat1.630622DependentVariable:LEDMethod:LeastSquaresDate:09/21/02Time:16:21Sample:19911997Includedobservations:7VariableCoefficientStd.Errort-StatisticProb.C-1.5223290.383141-3.9732900.0106LFI1.0055630.04476422.463410.0000R-squared0.990188Meandependentvar7.077
17、084AdjustedR-squared0.988226S.D.dependentvar0.382958S.E.ofregression0.041554Akaikeinfocriterion-3.288701Sumsquaredresid0.008634Schwarzcriterion-3.304156Loglikelihood13.51045F-statistic504.6048Durbin-Watsonstat1.930000Prob(F-statistic)0.000003多元线性回归模型的参数估计实例例2.3.1建立中国消费模型。根据消费模型的一般形式,选择消费总额为被解释变量,国内生
18、产总值和前一年的消费总额为解释变量,变量之间关系为简单线性关系,选取1981年至1996年统计数据为样本观测值。样本观测值列于表2.3.1中。表2.3.1中国消费数据表年份消费总额国内生产总值前一年消费额年份消费总额国内生产总值前一年消费额19813309490129761989105561646693601982363854893309199011362183210556198340216076363819911314621280113621984469471644021199215952258641314619855773879246941993201823450115952198665421013357731994272164711120182198774511178465421995345295940527216198893601470474511996401726849834529以y代表消费总额,xi代表国内生产总值,3代表前一年消费总额,应用计量经济分析软件包TSP6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福利分房合同范本
- 旅游美学学习通超星期末考试答案章节答案2024年
- 2024年新趋势:《画漫画》教案设计展望
- 强电布线合同范本
- 水塔拆迁合同范本
- 种植质保合同范本
- 2023年贵州科技馆制员工招聘考试真题
- 甲方宅基地转让合同范本
- 2024年销售人员劳动协议格式
- 土鸡预售合同范本
- 第9课《这些是大家的》(课件)-部编版道德与法治二年级上册
- 2024年四川省南充市从“五方面人员”中选拔乡镇领导班子成员201人历年高频500题难、易错点模拟试题附带答案详解
- 医疗行业智能化医疗设备维修与保养方案
- 2024年母婴护理考试竞赛试题
- 人工智能算力中心项目可行性研究报告写作模板-申批备案
- 2024-2030年中国空压机(空气压缩机)行业运营现状与可持续发展建议研究报告
- 2024-2030年中国机器翻译行业市场发展趋势与前景展望战略分析报告
- 高速公路综合监控太阳能供电系统技术方案设计
- 2024年秋新华师大版七年级上册数学 2.4.3去括号和添括号 教学课件
- 【论述土木工程的信息化建设应用8600字(论文)】
- 北师大版(三起)(2024)三年级上册英语Unit 5单元测试卷(含答案)
评论
0/150
提交评论