计量经济学ppt第三章_第1页
计量经济学ppt第三章_第2页
计量经济学ppt第三章_第3页
计量经济学ppt第三章_第4页
计量经济学ppt第三章_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章区间估计与假设检验龚锋武汉大学经济与管理学院财税系3.1区间估计3.2假设检验3.3特定备择假设的拒绝域3.4假设检验的例子3.5p值3.6参数的线性组合ChapterContents3.1区间估计存在两种类型的估计(1)点估计b2的估计值是回归模型中总体参数的点估计(2)区间估计区间估计提供了一个取值范围,真实参数有可能落在这一区间。提供取值范围,明确参数的可能取值以及估计的精确度。这一区间称之为置信区间。之所以称为区间估计,是因为“置信”一词被广泛误解和误用。3.1IntervalEstimationβ2的最小二乘估计量b2服从正态分布:将b2

减去其均值并除以其标准误,可以得到服从标准正态分布的Z:3.1.1Thet-DistributionEq.3.13.1IntervalEstimation根据标准正态分布的特征。有:代入:移项:3.1IntervalEstimation3.1.1Thet-Distribution两个端点提供了一个区间估计量。在重复抽样中,95%的这一区间包含了β2的

真实值。基于假设SR6满足和误差项方差σ2已知的条件,易于推导出区间估计量。3.1IntervalEstimation3.1.1Thet-Distribution用替换σ2创建了一个随机变量t:比值

服从自由度为(N–2)的t分布,我们定义为:Eq.3.23.1IntervalEstimation3.1.1Thet-Distribution如果在简单线性回归模型中假设SR1-SR6成立,则我们定义:

(1)t分布的概率密度函数是一个以0为中心的钟形曲线。(2)其概率密度函数类似与正态分布,除了它发散范围更广、方差更大以及尾部更厚。(3)t分布的形状由单一参数控制,称之为自由度,通常缩写为df。Eq.3.33.1IntervalEstimation3.1.1Thet-Distribution从t分布中我们可以找到一个“临界值”,使得:

其中:

α

为概率,通常取值为α

=0.01或

α=0.05对自由度为m的t分布,临界值tc就是百分

位值t(1-α/2,m)。3.1.2ObtainingIntervalEstimates3.1IntervalEstimationFigure3.1Criticalvaluesfromat-distribution.3.1IntervalEstimation3.1.1Thet-Distribution每个尾部阴影部分包含α/2的概率,因此中间部分包含了1-α

的概率;可以将概率表述为:Eq.3.4Eq.3.53.1IntervalEstimation3.1.2ObtainingIntervalEstimates当bk

和se(bk)是基于给定样本得到的估计值时,称bk±tcse(bk)为bk

的100(1-α)%区间估计。这一估计也可称为100(1-α)%的置信区间;通常选α=0.01或α=0.05,因此我们一般获得99%的置信区间或95%的置信区间。3.1IntervalEstimation3.1.2ObtainingIntervalEstimates对置信区间进行解释需要注意以下几点:区间估计程序的特征基于重复抽样的概念;任何一个基于特定样本数据得到的置信估计值,可能包含也可能不包含真实参数βk,而且由于βk

是未知的,我们永远不可能知道包含还是不包含;置信度存在于构建区间估计的程序,而不在于任何基于特定样本数据计算得到的区间估计值。3.1IntervalEstimation3.1.2ObtainingIntervalEstimates对食品支出数据:临界值tc=2.024,是与=.05和自由度=38对应的t分布的百分位值;为计算2的区间估计值,需要运用最小二乘估计值b2=10.21及其标准误:3.1.3AnIllustrationEq.3.63.1IntervalEstimation2的“95%置信区间估计”为:当我们将这一程序运用于许多来自于同一总体的随机样本数据,则基于这一程序构建的95%的区间估计将包含真实参数。3.1IntervalEstimation3.1.3AnIllustrationβ2

是否确实位于区间

[5.97,14.45]内?我们不知道,我们永远也不可能知道。我们知道的是,当将这一程序应用于来自于同一总体的许多随机样本数据,则所有区间估计的95%将包含真实参数值。区间估计程序95%的时候都是有效的;

对于基于某一个特定样本得到的区间估计值,我们可以断言的是,给定估计程序是可靠的,如果真实参数β2落在区间[5.97,14.45]以外,我们应该感到很“奇怪”。3.1IntervalEstimation3.1.3AnIllustrationβ2

区间估计值的用处:当汇报回归结果时候,我们通常给出的是一个点估计值,比如b2=10.21;点估计值本身无法给出估计结果是否可靠的信息;因此,我们需要汇报区间估计值:

区间估计将点估计和估计标准误相结合,后者是最小二乘估计量变异性的测度指标。3.1IntervalEstimation3.1.3AnIllustration3.1.4TheRepeatedSamplingContext10个随机样本的最小二乘估计值3.1IntervalEstimation10个随机样本的区间估计值3.1IntervalEstimation3.1.4TheRepeatedSamplingContext3.2假设检验3.2HypothesisTests假设检验程序将对总体的推测和样本数据包含的信息进行比较;给定一个经济和统计模型,假设的形成与经济行为相关;这些假设表示为对模型参数的陈述;假设检验运用包含在样本数据中的参数及其最小二乘点估计值和标准误的信息,得出关于假设的结论。原假设H0备择假设

H1检验统计量拒绝域结论3.2HypothesisTestsCOMPONENTSOFHYPOTHESISTESTS

原假设是我们一直秉持的信念,除非基于样本证据,我们确信它不为真,此时我们就拒绝原假设。原假设陈述为:H0:βk=c

其中,c是一个常数,在特定的回归模型的背景下,它是一个重要的数值。通常c的取值为0。3.2.1TheNullHypothesis3.2HypothesisTests

与每一个原假设成对的是逻辑上的备择假设H1,如果原假设被拒绝我们就接受备择假设。

备择假设是弹性的,在某种程度上取决于经济理论。3.2.2TheAlternativeHypothesis3.2HypothesisTests可能的备择假设有:H1

:βk>cH1

:βk<cH1

:βk≠c3.2HypothesisTests3.2.2TheAlternativeHypothesis基于检验统计量的值,我们决定要么拒绝原假设,要么不拒绝原假设。检验统计量具有特别的特征:如果原假设为真的话,检验统计量的概率分布是完全已知的;如果原假设不为真,则检验统计量服从其他的分布。3.2.3TheTestStatistic3.2HypothesisTests基本的检验统计量为:如果原假设H0

:=c为真,我们用c替换βk

得到:如果原假设不为真,则Eq.3.7中的t统计量不再服从自由度为N-2的t分布。Eq.3.73.2HypothesisTests3.2.3TheTestStatistic拒绝域取决于备择假设的形式。检验统计量的取值范围导致拒绝原假设的拒绝域;只有当满足如下条件时,才能够构建一个拒绝域:当原假设为真时,存在一个分布已知的检验统计量;存在备择假设存在显著性水平3.2.4TheRejectionRegion3.2HypothesisTests拒绝域由当原假设为真时不可能出现或出现概率很低的数值组成。内在逻辑链条是:

“如果检验统计量的一个值是在低概率的区域获得的,那么检验统计量就不可能拥有假定的分布,因此原假设不可能为真。”3.2HypothesisTests3.2.4TheRejectionRegion如果备择假设为真,则检验统计量的取值倾向于不寻常地“大”或不寻常地“小”。“大”和“小”的界定通过选择概率α来实现,称α为检验的显著性水平,它提供了“不可能事件”的含义。检验的显著性水平α通常选择为0.01,0.05or0.10。3.2HypothesisTests3.2.4TheRejectionRegion我们通常会犯两类错误:当原假设为真时我们拒绝它,我们就犯了第一类错误。检验的显著性水平是犯第一类错误的概率;P(第一类错误)=α当原假设为假时我们不拒绝它,我们就犯了第二类错误。

●我们无法控制或计算发生这类错误的概率,因为它依赖于未知的真实参数βk

。3.2HypothesisTests3.2.4TheRejectionRegion你是拒绝原假设还是不拒绝原假设?避免说“接受”原假设;使用标准的做法来表述结论在你所研究问题的经济背景下具有什么含义,以及阐明研究发现的经济意义是什么。3.2.5Conclusion3.2HypothesisTests3.3特定备择假设的拒绝域为获得一个原假设的拒绝域,我们需要:一个检验统计量一个特定的备择假设检验的显著性水平α3.3RejectionRegionsforSpecificAlternatives3.3.1One-tailTestwithAlternative“GreaterThan”当原假设H0:βk=c的备择假设是H1:βk>c时,如果下式成立:t≥t(1-α;N-2)则拒绝原假设,接受备择假设。3.3RejectionRegionsforSpecificAlternativesFigure3.2Rejectionregionforaone-tailtestofH0:βk=cagainstH1:βk>c3.3RejectionRegionsforSpecificAlternatives3.3.1One-tailTestwithAlternative“GreaterThan”3.3.1One-tailTestwithAlternative“GreaterThan”当原假设H0:βk=c的备择假设是H1:βk<c时,如果下式成立:

t≤

t(α;N-2)

=-t(1-α;N-2)则拒绝原假设,接受备择假设。3.3RejectionRegionsforSpecificAlternativesFigure3.3Rejectionregionforaone-tailtestofH0:βk=cagainstH1:βk<c3.3RejectionRegionsforSpecificAlternatives3.3.2One-tailTestwithAlternative“LessThan”3.3.1One-tailTestwithAlternative“GreaterThan”当原假设H0:βk=c的备择假设是H1:βk≠c时,如果下式成立:t

t(α/2;N-2)

t

t(1-α/2;N-2)则拒绝原假设,接受备择假设。3.3RejectionRegionsforSpecificAlternativesFigure3.4RejectionregionforatestofH0:βk=cagainstH1:βk≠c3.3RejectionRegionsforSpecificAlternatives3.3.3One-tailTestwithAlternative“NotEqualTo”3.4假设检验的例子确定原假设和备择假设;设定检验统计量以及当原假设为真时检验统计量的分布;选择α并确定拒绝域;计算检验统计量的样本值;陈述结论。3.4ExamplesofHypothesisTests假设检验的步骤3.4.1aOne-tailTestofSignificance原假设为H0:β2=0

备择假设为

H1:β2>0检验统计量为

Eq.3.7在c=0的情况下,如果原假设为真,则t=b2/se(b2)~t(N–2)

选择

α=0.05右尾端拒绝域的临界值为自由度为N-2=38的t分布的第95百分位数值,t(0.95,38)=1.686。如果计算得到的t统计量大于等于1.686:t≥1.686,则拒绝原假设;如果t<1.686,则无法拒绝原假设。3.4ExamplesofHypothesisTests3.4.1aOne-tailTestofSignificance利用食品支出的数据,我们估计得到b2=10.21其标准误为:se(b2)=2.09检验统计量的值为:既然t=4.88>1.686,我们拒绝β2

=0的原假设,接受β2

>0的备择假设。也就是说,我们拒绝“收入和食品支出没有关系”的原假设,得到的结论是:在家户收入和食品支出之间存在统计显著的正相关关系。3.4ExamplesofHypothesisTests3.4.1bOne-tailTestofanEconomicHypothesis原假设为H0:β2≤5.5

备择假设为H1:β2>5.5如果原假设为真,则检验统计量为t=(b2-5.5)/se(b2)~t(N–2)选择α=0.01右尾端拒绝域的临界值为自由度为N-2=38的t分布的第99百分位数值,t(0.99,38)=2.429。如果计算得到的t统计量大于等于2.429:t≥2.429,则拒绝原假设;如果t<2.429,则无法拒绝原假设。3.4ExamplesofHypothesisTests利用食品支出数据,估计得到b2=0.21,标准误为:se(b2)=2.09检验统计量的取值为:既然t=2.25<2.429,我们无法拒绝β2

≤5.5的原假设;我们无法得出新超市有利可图的结论,因此新超市将不会开始建设。3.4.1bOne-tailTestofanEconomicHypothesis3.4ExamplesofHypothesisTests3.4.2Left-tailTests原假设为H0:β2≥15

备择假设为H1:β2<15如果原假设为真,检验统计量为t=(b2-15)/se(b2)~t(N–2)

选择α=0.05左尾端拒绝域的临界值为自由度为N-2=38的t分布的第5百分位数值,t(0.05,38)=-1.686。如果计算得到的t统计量小于等于-1.686:t≤-1.686,则拒绝原假设;如果t>-1.686,则无法拒绝原假设。3.4ExamplesofHypothesisTests利用食品支出数据,估计得到b2=10.21,标准误为:se(b2)=2.09检验统计量的取值为:既然t=-2.29<-1.686我们拒绝β2≥15的原假设,接受β2<15的备择假设。我们得到如下结论:家户收入每增加100美元,食品支出的增加会少于15美元。3.4.2Left-tailTests3.4ExamplesofHypothesisTests3.4.3aTwo-tailTestofanEconomicHypothesis原假设为H0:β2=7.5

备择假设为H1:β2≠7.5如果原假设为真,检验统计量为t=(b2–7.5)/se(b2)~t(N–2选择α=0.05双尾拒绝域的临界值为自由度为N-2=38的t分布的第2.5百分位数值t(0.025,38)=-2.024和第97.5百分位数值t(0.975,38)=2.024如果计算得到t≥2.024或t≤-2.024,则拒绝原假设;如果有-2.024<t<2.024,则无法拒绝原假设。3.4ExamplesofHypothesisTests利用食品支出数据,计算得到b2=10.21,标准误为:se(b2)=2.09检验统计量取值为:既然-2.024<t=1.29<2.024,则无法拒绝β2

=7.5的原假设;样本数据与推测的结果(“家户收入每增加100美元,食品支出会增加7.5美元”)是一致的。3.4.3aTwo-tailTestofanEconomicHypothesis3.4ExamplesofHypothesisTests3.4.3bTwo-tailTestofSignificance原假设为H0:β2=0

备择假设为H1:β2≠0如果原假设为真,检验统计量为t=(b2)/se(b2)~t(N–2)

选择α=0.05双尾拒绝域的临界值为自由度为N-2的t分布的第2.5百分位数值t(0.025,38)=-2.024和第97.5百分位数值t(0.975,38)=2.024如果计算得到

t≥2.024或

t≤-2.024,则拒绝原假设。3.4ExamplesofHypothesisTests利用食品支出数据,计算得到b2=10.21,标准误为:se(b2)=2.09检验统计量的取值为:

既然4.88>2.024,则拒绝β2

=0的原假设;得到如下结论:在收入和食品支出之间存在统计显著的关系。注意:统计显著不等于经济显著。3.4.3bTwo-tailTestofSignificance3.4ExamplesofHypothesisTests3.4.3bTwo-tailTestofSignificance

从Eviews汇报的结果中,很容易发现本例计算的t值:3.4ExamplesofHypothesisTests3.5

P值3.5Thep-Value当汇报统计假设检验的结果时,报告检验的P值(概率值的缩写)成为一个标准的做法;当确定了检验的P值,则通过比较P值和选择的显著性水平α的大小,不检查或计算临界值,就可以确定检验的结果。这极大简化了统计检验的工作量。当P值小于或等于显著性水平α时,则拒绝原假设。即如果p≤α则拒绝H0;如果

p>α则无法拒绝H0。P值准则3.5Thep-Value如果t是t统计量的计算值,则:如果

H1:βK>c p=位于t值右侧的概率如果H1:βK<c p=位于t值左侧的概率如果H1:βK≠c p=位于|t|值右侧的概率加位于|t|值左侧的概率。3.5Thep-Value从3.4.1b节,我们有:原假设为H0:β2≤5.5备择假设为H1:β2>5.5P值为:3.5.1p-ValueforaRight-tailTest3.5Thep-Value3.5.1p-ValueforaRight-tailTestFigure3.5Thep-valueforaright-tailtest.3.5Thep-Value从3.4.2节,我们有:原假设为H0:β2≥15备择假设为H1:β2<15P值为:3.5.2p-ValueforaLeft-tailTest3.5Thep-ValueFigure3.6Thep-valueforaleft-tailtest.3.5.2p-ValueforaLeft-tailTest3.5Thep-Value从3.4.3a节,我们有:原假设为H0:β2=7.5备择假设为H1:β2≠7.5P值为:3.5.3p-ValueforaTwo-tailTest3.5Thep-ValueFigure3.7Thep-valueforatwo-tailtestofsignificance.3.5.3p-ValueforaTwo-tailTest3.5Thep-Value从3.4.3b节,我们有:原假设为H0:β2=0备择假设为H1:β2≠0P值为:3.5.4p-ValueforaTwo-tailTestofSignificance3.5Thep-Value

从Eviews汇报的结果中,很容易发现本例的

P值。3.5.4p-ValueforaTwo-tailTestofSignificance3.5Thep-Value3.6参数的线性组合3.6LinearCombinationsofParameters我们可能会希望估计和检验关于参数线性组合的假设:λ=c1β1+c2β2,其中,c1

和c2

为我们设定的常数。在假设SR1–SR5满足的情况下,最小二乘估计量b1、b2是β1

、β2的最优线性无偏估计量;=c1b1+c2b2也是λ=c1β1+c2β2

的最优线性无偏估计量。线性组合的例子。令c1=1和c2=x0,则有:

3.6LinearCombinationsofParameters估计量

是无偏的,因为:3.6LinearCombinationsofParameters

的方差为:

上式中的方差和协方差由Eq.2.20-2.22给出。Eq.3.83.6LinearCombinationsofParameters

利用方差和协方差的估计值替换Eq.2.20-2.22中未知的方差和协方差,我们估计的方差为:Eq.3.93.6LinearCombinationsofParameters

的标准误为估计方差的平方根:Eq.3.103.6LinearCombinationsofParameters如果假设SR6成立,或样本量很大的话,最小二乘估计量b1

和b2服从(渐进)正态分布。服从正态分布的变量其线性组合也服从正态分布。因此,有:3.6LinearCombinationsofParameters我们可以估计食品的平均支出(期望支出):如果家户的收入是$2000,由于收入以100美元衡量,则样本中的数据应为20,平均支出为:我们估计收入为2000美元的家户,食品支出的期望值为每周287.6美元。3.6.1EstimatingExpectedFoodExpenditure3.6LinearCombinationsofParameters线性组合的t统计量为:3.6.2AnIntervalEstimateofExpectedFoodExpenditureEq.3.113.6LinearCombinationsofParameters将t值带入P(-tc≤t≤tc)=1–α,得到:

因此(1–α)%的置信区间是:3.6.2AnIntervalEstimateofExpectedFoodExpenditure3.6LinearCombinationsofParameters在我们的例子中,期望的方差和协方差是:3.6.2AnIntervalEstimateofExpectedFoodExpenditureCIncomeC1884.442-85.9032Income-85.90324.38183.6LinearCombinationsofParameters期望食品支出的估计方差为:

对应的标准误为:3.6.2AnIntervalEstimateofExpectedFoodExpenditure3.6LinearCombinationsofParameters则95%的置信区间为:

或我们在95%的置信水平上估计:收入为2000美元的家户,其期望食品支出在$258.91和$316.31之间。3.6.2AnIntervalEstimateofExpectedFoodExpenditure3.6LinearCombinationsofParameters包含

β1

和β2

两个参数的一般线性假设可以表述为:

或等价地表述为:3.6.3TestingaLinearCombinationofParametersEq.3.12aEq.3.12b3.6LinearCombinationsofParameters备择假设可以是下面任何一个:3.6.3TestingaLinearCombinationofParameters3.6LinearCombinationsofParameterst统计是:

如果原假设为真:单尾和双尾备择假设(i)–(iii)的拒绝域与第3.3节表述的拒绝域是一样的,对结论的解释也与前面一样。3.6.3TestingaLinearCombinationofParametersEq.3.133.6LinearCombinationsofParameters假定我们推测:以此作为备择假设:

或3.6.4TestingExpectedFoodExpenditure3.6LinearCombinationsofParameters原假设自然为:

或此处原假设和备择假设与一般线性假设是一样的,只是设定了

c1=1、c2=20、c0=250。3.6.4TestingExpectedFoodExpenditure3.6LinearCombinationsofParameterst统计量为:3.6.4TestingExpectedFoodExpenditure3.6LinearCombinationsofParameters既然t=2.65>tc=1.686,我们拒绝“收入为2000美元的家户每周花250美元或更少食品支出”的原假设,得到结论:这一家户食品支出高于250美元的推测是正确的,犯第一类错误的概率为0.05。3.6.4TestingExpectedFoodExpenditure3.6LinearCombinationsofParametersKeyWordsalternativehypothesisconfidenceintervalscriticalvaluedegreesoffreedomhypotheseshypothesistestingInference

Keywordsintervalestimationlevelofsignificancelinearhypothesisnullhypothesisone-tailtestspointestimatesprobabilityvalue

p-valuerejectionregiontestofsignificanceteststatistictwo-tailtestsTypeIerrorTypeIIerror

附录3A推导t分布3B备择假设H1下的t统计量的分布3C蒙特卡罗模拟3ADerivationofthet-Distribution考虑β2的最小二乘估计量b2服从正态分布:标准正态分布为:Eq.3A.1如果所有的随机残误差项是独立的,则:由于真实的随机误差项是不可观测的,我们用样本估计得到的最小二乘残差替换它:Eq.3A.3Eq.3A.23ADerivationofthet-Distribution因此:虽然我们并没有解释为什么卡方随机变量V在统计上独立于最小二乘估计量b1和b2,但这确实是成立的。因此,V和标准正态分布随机变量Z是独立的。Eq.3A.43ADerivationofthet-Distribution通过将标准正态分布随机变量Z~N(0,1)除以独立的卡方随机变量V~χ2(m)

除以自由度m后的平方根,得到服从t分布的随机变量:3ADerivationofthet-Distribution利用Z和V的公式(分别来自于Eq.3A.1和Eq.3A.4),我们得到:Eq.3A.53ADerivationofthet-Distribution3BDistributionofthet-StatisticunderH1Toexaminethedistributionofthet-statisticinEq.3.7whenthenullhypothesisisnottrue,supposethatthetrueβ2=1Wecanshowthat:Ifβ2=1andweincorrectlyhypothesizethatβ2=c,thenthenumeratorinEq.3A.5thatisusedinformingEq.3.7hasthedistribution:Sinceitsmeanisnotzero,thedistributionofthevariableinEq.3B.1isnotstandardnormal,asrequiredintheformationofat-randomvariableEq.3B.13BDistributionofthet-StatisticunderH13CMonteCarloSimulationWhenstudyingtheperformanceofhypothesistestsandintervalestimatorsiti

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论