第5章-区间估计及假设检验_第1页
第5章-区间估计及假设检验_第2页
第5章-区间估计及假设检验_第3页
第5章-区间估计及假设检验_第4页
第5章-区间估计及假设检验_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章区间估计与假设检验(IntervalEstimationandHypothesisTesting)

§5.1统计学的预备学问自己复习§5.2区间估计:一些基本概念 第三章给出了边际消费倾向(MPC)的估计值为0.5091。我们也知道,,但是,由于抽样的波动性,单个估计值可能并不等于真值。因此,我们不能完全依靠一个点估计值,而是要围绕点估计量构造出一个区间,使这一区间在确定的概率保证之下包含真实的参数值(真值),这就是区间估计。我们的任务就是求出两个正数和,,使得随机区间(randominterval)包含的概率为:(5.2.1)这样的区间称为置信区间(confidenceinterval);称为置信系数(confidencecoefficient);而称为显著性水平(levelofsignificance)。置信区间的端点称置信限(confidencelimits)也称临界值(criticalvalues)。为置信下限(lowerconfidencelimit)为置信上限(upperconfidencelimit)(5.2.1)式表示的是:随机区间包含真实的概率为。区间估计量给出了一个真实会落入其中的数值范围。点估计与区间估计:单一的点估计量可能不同于总体真值,即存在估计误差。点估计既不能给出误差范围的大小,也没有给出估计的牢靠程度。区间估计则可以显示和是怎样的接近总体真值和,以及这种接近的牢靠性。§5.3回来系数和的置信区间一、的置信区间 OLS估计量和听从正态分布,因此,若令(5.3.1)则,Z为一个标准化正态变量,。

假如总体方差已知,就可以用正态分布对作出概率上的表述。在正态曲线下,之间的面积为68.26%之间的面积为95%之间的面积为95.45%之间的面积为99.73%

从而的区间估计就简洁了。选定为95%,则但是,在很多实际问题中,总体方差都是未知的,只能用其无偏估计量来替代。(5.3.1)式便为:(5.3.2)为估计量的标准误的估计值(estimatedstandarderror)。这里定义的t变量听从自由度为n-2的t分布

证明:令(1)

(2)假如已知,(1)式就是对进行标准化,所以Z1听从标准正态分布,。Z2听从(n-2)个自由度的分布(证明参见有关的数理统计教程),而且,可以证明Z2的分布独立于Z1。运用P160定理5.5(附录),变量听从自由度为n-2的t分布。把(1)式和(2)式代入上式,即可得到(5.3.2)式。用t分布构造的的置信区间为:(5.3.3)上式中t值由(5.3.2)式给出。为显著水平上的临界值,查表;显著水平,自由度n-2可得的值。于是有:(5.3.4)整理得:(5.3.5)

即的水平的置信区间为:例子:P123两个游戏:掷硬币套圈请问:区间估计更象哪一个?置信区间的两个特点:位置的随机性长度的随机性二、的置信区间:利用和进行类似的推导,可得:(5.3.7)也就是说,的水平的置信区间为:(5.3.8)在区间估计中,置信区间的宽度与估计量的标准误或成正比例。这说明,标准误越大,置信区间越宽,对总体真值进行估计的接近程度越差。因此,估计量的标准误被看作是估计量的精度(precision),它反映了估计量的精确程度。§5.4的置信区间在正态性假定下,变量:(5.4.1)听从自由度为n-2的分布。因此,可以用分布构造的置信区间:(5.4.2)其中的值由(5.4.1)式给出,和可以查表得到,自由度为n-2,见P125Figure5.1。把(5.4.1)式中的代入(5.4.2)式整理得: (5.4.3)该式给出了的置信系数为的置信区间。

§5.5假设检验(HypothesisTesting):概述参数估计与假设检验都是在样本分布基础上作出概率性推断,两者既有联系又有区分,但其基本原理则是一样的。参数的区间估计主要解答某一总体参数真值落在什么区间内的问题;而假设检验就是要对一个已知估计值或已得出的数据进行检验,推断它是否与某一个指定的假设(statedhypothesis)相容或一样(compatible)。所谓相容或一样,是指某一已知估计值充分地接近其假设的数值,从而导致接受新指定的假设。用统计上的话说,这个指定的(声称的)假设叫做虚拟假设(nullhypothesis),或维持假设(maintainedhypothesis),用H0来表示。通俗地说,是一个靶子。另外,还须要一个备择假设(对立假设)(alternativehypothesis),用H1表示。H0和H1构成一个完备事务。备择假设可以是简洁的(simple)或复合的(composite)。例如,是一个简洁假设,而则是一个复合假设。进行统计假设检验,就是要制定一套步骤和规则,以使确定接受或拒绝一个虚拟假设(原假设)。一般来说,有两种相互联系、相互补充的方式:置信区间(confidenceinterval)和显著性检验(testofsignificance)。

§5.6假设检验:置信区间的方法双侧或双尾检验(Two-sidedorTwo-TailTest)利用P88页Table3.2的数据,估计出MPC(边际消费倾向)是0.5091。可以造构如下的检验假设:在虚拟假设下,MPC是0.3,在对立假设下MPC大于或小于0.3。虚拟假设是一个简洁假设,而对立假设则是一个复合假设;事实上就是我们所说的双侧假设(two-sidedhypothesis)。那么,我们估计的是否与上述相容?可以用置信区间来加以推断。P123页的(5.3.9)式给出的置信区间:(0.4268,0.5914)。也就是说,从长远来看,像(0.4268,0.5914)这样的很多个区间将会有95%的概率包含真实的。因而,置信区间给出了可信的(plausible)虚拟假设的一个集合。如果虚拟假设的落入这个置信区间,我们就不拒绝虚拟假设;如果它落在区间之外,我们就可以拒绝虚拟假设。

图5.2的一个置信区间在假设下,落入此区间的值有的可信性。因此,若果真落入此区域,就不拒绝决策规则:构造一个的置信区间。假如在假设H0下落入此区间,就不要拒绝H0。但假如它落在此区间之外,就要拒绝H0。在上例中,,很明显地落在(0.4268,0.5914)这个置信区间之外,因此我们能以95%的置信度拒绝MPC的真值是0.3的假设。在统计上,当虚拟假设被我们拒绝时,就称我们的发觉是统计上显著的(statisticallysignificant)。反之,当我们不拒绝虚拟假设时,我们说,我们的发觉不是统计上显著的。当选择的显著性水平又比较低,比如,从而置信系数比较高,如99%时,仍旧达到了统计上是显著的,我们就称它是统计上高度显著(highlystatisticallysignificant)。单侧或单尾检验One-SidedorOne-TailTest当我们有着很强的理论支撑或者先验性预期时,可以把备择假设H1取为单侧的或单向的。如:和对于这种单尾检验,最好的方法是显著性检验方法。§5.7假设检验:显著性检验法检验回来系数的显著性:t检验显著性检验法(test-of-significanceapproach)是由R.A.Fisher(费希尔),Negman(尼曼)和Pearson(皮尔逊)合作独创的,它是利用样本结果,来证明一个虚拟假设的真伪的一种检验程序。t分布的来历:student显著性检验的关键在于构造出一个检验统计量(teststatistic)(作为估计量),在虚拟假设下这个统计量会听从确定的抽样分布(如t分布,F分布,正态分布,分布等)。构造出统计量以后,就可以利用样本数据计算出这个统计量的样本值,再把这个样本值与给定某一显著水平的临界值进行比较,看它与临界值是否有显著差别,从而作出推断,确定拒绝还是接受所作的假设。在正态性假设下的变量:(5.3.2)听从自由度为n-2的t分布。在虚拟假设下的真值被设定,就可以利用样本数据算出(5.3.2)式,即这个t统计量是可以算出来的,从而可以作出如下的置信区间:

(5.7.1)

其中,是在H0下的值。和是从t分布表中查得的数据,为显著水平,n-2为自由度,这些值就是所谓的临界值。将(5.7.1)式整理得:(5.7.2)

上式中建立的置信区间叫做虚拟假设的接受域(regionofacceptance),而置信区间以外的区域叫做H0的拒绝域(region(s)ofrejection)或临界域(criticalregion(s))。置信限,即置信区间的端点,又叫做临界值(criticalvalues)。在实践中,并不须要估计(5.7.2)式,而可利用(5.7.1)式计算t值,看它是落在两个t临界值之间还是落在它们之外。在上例中,有:(5.7.4)这个t值明显落在P131图5.4中的临界域内。结论和前面的一样:拒绝H。越大,它越是可能落在临界域内,因而,它越是与虚拟假设相左。这种利用t分布进行的检验叫t检验(ttest)。一个统计量是统计上显著的,假如这个统计量的值落在临界域上。这时我们将拒绝虚拟假设。同样地,一个检验是统计上不显著的,假如这个统计量的值落在接受域中。这时我们不拒绝虚拟假设。假如把两个尾端当作拒绝域,则虚拟假设值落入任一尾端,就拒绝该假设,这种检验程序是双侧或双尾显著性检验。这样做的虚拟假设H0必需是一个双侧的复合假设。假如从前的阅历或理论告知我们,MPC预期要比0.3大,我们就可以这样设定:和。这里H1虽然是一个复合假设,但它却是单侧的。这样的检验就是单尾检验(右尾部检验)。

二、检验的显著性:检验考虑下面的变量:(5.4.1)遵循自由度为n-2的分布。在P88页的例子中,。假如假设:对。把数据代入(5.4.1)得:取的的两个临界值为2.1797和17.5346。落在两个临界值的中间,我们不拒绝H0。这个检验叫做显著性检验。见P121,Table5.2。§5.9回来分析与方差分析已经推导出下面的恒等式:(3.5.2)这就是:TSS=ESS+RSS,总平方和TSS可以分解为两部分:说明平方和ESS和残差平方和RSS。对TSS的这些构成部分进行探讨就叫做从回来的观点做方差分析(analysisofvariance,简记ANOVA)。方差分析的主要功能在于,分析和检验某种或多种因素(或自变量)的变更对试验结果(或因变量)的观测数据是否有显著的影响。每一个平方和都是和它的自由度数相联系的,亦即与它所依据的独立观测值的变量数目有关。就一元回来而言:(1)TSS的自由度数为n-1,因为在计算的离差和时,失去了一个自由度;(2)ESS的自由度为1,因为对1个自变量回归来说,回归平方和具有1个自由度数;(3)RSS的自由度数为n-2,因为计算参数和而失去两个自由度。在数理统计中,可以证明TSS,ESS和RSS分别服从自由度为n-1,1和n-2的分布。把各项平方和及其相应的df引入表5.3,成为AOV表的标准型式,有时又称ANOVA表。看P127Table5.3MSS——均方和SS——平方和现在考虑以下变量:

(5.9.1)假如假定干扰ui是正态分布的,且,就可以证明(5.9.1)的F满足定理4.6的条件,从而它听从自由度为1和n-2的F分布。证明:令,则。由定理4.3,分布。再令,则。同时,Z1的分布独立于Z2的分布。由定理4.6得:

听从自由度分别为1和的F分布。在:下,上述F比率简化为方程(5.9.1)式,#。)为了直观地说明方差比F的用途,列举两个有关的方程式如下:(5.9.2)

(5.9.3)求证:(5.9.2)

左边

代入上式

左边右边#

容易看出,如果,则(5.9.2)式和(5.9.3)式对真实方差提供等同的估计量。在这种情况下,解释变量X对被解释变量Y毫无线性影响,Y的总变异就由随机扰动项作出解释。反之,如果,则上述两个方程将得出不同的结果,从而Y的变异中有一部分将归因于解释变量X。因此,方差比F是适宜作为检验原假设(虚拟假设)的统计量。判断虚拟假设是否可信,需要有一个判断标准,这个标准就是与选定的显著水平和自由度,相对应的临界值如果由样本数据计算的,则拒绝,表示在显著性水平之下,该一元回归模型是统计上显著的;反之,假如,就接受,认为该模型并无显著意义。

F检验与t检验:在原假设下,二者是亲密联系的。在相同的显著性水平下,统计量F与t之间具有以下关系:

t检验和F检验是检验的两个互为补充的备选方法。其实,在双变量模型中,F检验是多余的,二者的结论总是一样的。但是,在多元回来分析中,F检验与t检验各有不同的功用。F检验:模型的显著性;t检验:系数的显著性。实质:X的贡献是否显著地大于U的贡献§5.10回来分析的应用:预料问题有两种预料:一、均值预料:对应于给定的X,比如,预料Y的条件均值,或者说是预料总体归线本身上的点。比如时,

给出了这一均值预料的点估计为:谁能预料将来,谁就能发财致富。中国的投资者和富人们特别关切的问题是:中国长期增长的拐点在哪里?--------探讨一般地,假如总体回来模型为依据样本数据可以求得样本回来模型为从而求出样本回来直线为经过t检验,假如是可以接受的,就可以运用上述样本回来直线估计式进行预料。给定,真实的均值的预料由下式给出:(1)我们用(2)来估计(1)式。给定,对(2)式取数学期望得,因此,这说明,是的一个无偏误的预料元(unbiasedpredictor)。由于是一个估计式,它是由样本资料计算而得出的,所得出的预料估计值可能不同于真值。这就涉及到预料的精确度问题。就是说,由于抽样波动,预料估计值与真值之间存在差异,预料具有误差。为了评定这种误差,须要查明的抽样分布。∵,∴也是听从正态分布的,其均值为,方差为:把(3.3.1)式(3.3.3)式和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论