计量经济学复习参数假设检验_第1页
计量经济学复习参数假设检验_第2页
计量经济学复习参数假设检验_第3页
计量经济学复习参数假设检验_第4页
计量经济学复习参数假设检验_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、引例 某厂要在生产线上加工一种直径为100mm的轴,加工出来一批后,检验人员从生产出来的轴中随机抽取了一个由16根轴构成的一个样本,测量出平均直径为110mm,样本方差为100。问生产线是否出了问题。应用中对于一个包含参数的总体,经常会遇到这样的问题:我们已经猜到了参数值或知道了参数的理论值,要利用样本来检验总体的参数值是否确实等于所猜到的值或理论值。这就是参数假设检验的问题。参数检验:已知总体分布,猜出总体的某个参数(假设H0),用一组样本来检验这个假设,是否正确(是接受还是拒绝H0)。非参数检验:猜出总体分布(假设H0),用一组样本来检验这个假设,是否正确(是接受还是拒绝H0)。两类错误:

2、在假设检验时有可能犯如下两类错误:第1类错误(“弃真”错误):拒绝了真实的假设H0 。通常称犯第1类错误的概率为显著性水平。第2类错误(“存伪”错误):接受了错误的假设H0 。样本值与假设值的误差:条件改变导致的。随机因素导致的。如果可以判断,误差在一个合理的范围并且主要是随机因素导致的,则接受假设H0,否则拒绝H0 。这种判断不是绝对意义上的判断,而是“统计意义”上的判断,因而可能出错。l设立假设设立假设 设立原假设(null hypothesis)H0和一个与之互斥的备择假设(alternative hypothesis) H1。l构造与计算检验统计量构造与计算检验统计量l根据事先给定的显

3、著性水平进行检验根据事先给定的显著性水平进行检验显著性水平的值通常取0.05或0.01。小概率事件在一次随机试验中发生的可能性是很小的。例如,有一个厂商声称,他的产品的合格品率很高,可以达到99%,那么从一批产品(譬如100件)中随机抽取一件,这一件恰恰相反好是次品的概率就非常小,只有1%。如果厂商的宣传是真的,随机抽取一件是次品的情况就几乎是不可能发生的。但如果这种情况确实发生了,就有理由怀疑原来的假设,即产品中只有1%的次品的假设是否成立,这时就有理由推翻原来的假设,可以做出厂商的宣传是假的这样一个推断。依据小概率原理推断可能会犯错误!依据小概率原理推断可能会犯错误!假设上例中100件产品

4、中确实只有1件是次品,如恰好在一次抽取中被抽到了,犯错误的概率是1%,也就是说我们在冒1%的风险做出厂商宣传是假的这样一个推断。在这一节中总是假设),(2NX原假设 H0: = 0备择假设 H1: 0注意备择假设H1相当于两个事件( 0)中有一个出现,因此这样的参数检验称为双尾检验(双侧检验)。:设X1, X2, , Xn是X的一组样本,则,有因此),(20nNX) 1, 0(0NnXZ统计量Z具有特征:一旦给定了样本数据的值,我们就可以计算出该统计量的值z; 其分布是完全确定的。于是对于一个充分小的(显著性水平),我们可以找到一个临界值 使得2z|2zZP /2的的面积面积z /2即 是小概

5、率事件。|2zZ :若我们通过样本数据计算得到的统计量Z的值z满足2|zz 则上述小概率事件发生了。但小概率事件在一次实验(或观察)中出现的可能性是非常小的。它居然发生了,因此有理由怀疑H0的真实性。也就是我们拒绝原假设。反之,若z满足2|zz 我们就接受原假设H0。根据变量Z的定义,Z也可以理解为一种标准化的误差,上述判断也就相当于,若由样本计算的参数值与假设值的误差在可接受的范围(z/2, z/2),则接受原假设;否则拒绝原假设。对引例中的问题,如果按某种生产规范,轴直径的标准差为8。并且一般来说,轴的直径服从正态分布。于是问题转化为,已知正态总体的方差,要检验其均值是否等于100mm的问

6、题。原假设H0: = 0 (= 100)备择假设H1: 0检验统计量51681001102znXZ于是对于给定的显著性水平=0.05,查表可以到临界值96. 12z而2|zz 所以拒绝H0,因此生产线可能出了问题。上面的讨论表明参数的假设检验中的检验统计量应该满足:1)其值通过样本观察值计算出来;2)其概率分布应该是完全确定的。如果X的方差2未知,则统计量) 1, 0(0NnXZ不再符合要求。处理的方法是将Z的表达式中的2用其样本方差代替。于是得到新的统计量) 1(0ntnSXT对于一个充分小的(显著性水平),我们可以找到一个临界值 使得2t|2tTP /2的的拒绝域拒绝域t/2记将样本数据代

7、入T统计量的表达式中计算的结果为t,则若2|tt 则表示出现了小概率事件 。这可能性非常小,但竟然发生了。因此我们怀疑H0的真实性,因此拒绝H0。|2tT 反之,若2|tt 接受H0。正态总体均值的假设检验(双尾检验,显著性水平)假设条件检验统计量检验原假设 H0: = 0备择假设 H1: 0已知总体方差 拒绝拒绝H H0 0 接受接受H H0 0 未知总体方差 拒绝拒绝H H0 0 接受接受H H0 0) 1, 0(0NnXZ) 1(0ntnSXT2|zz 2|zz 2|tt 2|tt 这实际上指考虑如下假设的检验原假设 H0: = 0备择假设 H1: 0这一检验称为单尾(单侧)检验,仍取T

8、为检验统计量,即面积的的拒绝域拒绝域) 1(0ntnSXT但拒绝原假设的事件为 其中 满足tT tTP(应注意与单尾检验的临界值的区别)显著性水平的意义可以用如下的表达式描述|00为真拒绝HHP因此是犯第1类错误的概率水平。此外,所谓双尾检验是备择假设具有形式 H1: 0的检验,单尾检验为备择假设具有形式 H1: 0的检验我们是通过由样本观察值计算得到的统计量值与临界值进行比较来判断是拒绝还是接受原假设的。以未知方差时的双尾检验为例。就是当2|tt 时拒绝原假设H0,否则接受H0。 /2的的拒绝域拒绝域t/2而临界值 的意义就是:k使得2tk |2tTP设由样本数据计算得到t (t 0)值,则

9、随机变量T位于t外侧的概率为PT t = 1 PT tt/2t-t概率密度函数曲线下方去掉阴影部分后,剩下部分的面积就是2(1 PT t)(如图),称这剩下部分的面积为“t统计值的p值”。很明显,如果 p ,则t位于临界值t/2的外侧,因此拒绝H0。t0时可以得到同样的结论(只需对-t进行讨论即可)。上述讨论表明p值是否定原假设H0的“最低显著性水平(实际显著性水平)”。利用p值进行假设检验的实际意义在于几乎所有的统计软件都自动地计算p值,因此现在利用p值来判断是否拒绝原假设比前面介绍的方法更为方便。对于单尾检验的情形,检验统计值的p值的定义为p = 1 P相应的统计量 该统计值 若p , 则

10、接受原假设H0。熟悉检验统计量,以及如何使用检验统计量进行检验不但有助于理解检验方法和原理,还能够获得进一步结果。假设总体X服从正态分布,但总体方差2未知。设X1, X2, , Xn是X的一组样本。则要检验总体的均值是否为0, 可以通过t检验进行。即对于给定的显著性水平,可以查t临界值表,得到临界值 。当检验统计量T的值满足2t2|tT 拒绝原假设,否则接受原假设。若拒绝原假设,意味着有)|(|2tTP若接受原假设,则意味着1)|(|2tTP也就是下面表达式成立的概率为120tnSX这不等式等价于nStXnStX202将样本数据代入后,这就是置信水平为1 的总体均值的置信区间。换言之,如果要检

11、验的参数假设值落在总体均值的置信区间内,我们应该接受原假设。例 6.6.1(p168)1. 按教材介绍方法:总体均值的总体均值的假设值假设值样本均值T统计值p值样本均值与总体均值差的置信区间下界对于显著性水平 =0.05,由于从SPSS的计算结果得到 p ,故接受原假设。2. 利用置信区间进行检验。由于待检验的总体参数假设值落在置信区间,故应该接受原假设。引例 某厂要在生产线上加工一种直径为100mm的轴,加工出来一批后,检验人员从生产出来的轴中随机抽取了一个由16根轴构成的一个样本,测量出平均直径为110mm,样本方差为100。问生产线是否出了问题。回顾引例,利用前面介绍的假设检验方法,我们

12、拒绝了总体均值为100mm的原假设。但是也可能有疑问:是不是由于样本数量太少,导致的这一结果?自然地,我们希望知道,多大的样本容量是合适的?基本思想:希望犯错误的风险越低,样本容量就应该越大。某厂要接受供货商提供的一批电池,按设计要求,电池寿命的均值应不低于120小时,现在检验人员从货物中随机抽取了一个由36个电池构成的一个样本进行检验,以确定是否应该接受这批电池。为便于说明问题,考虑如下的例子:假设电池的寿命服从正态分布。记0=120,并且已经知道正态分布的标准差为=12。考虑原假设 H0:0备择假设 H1:0则检验统计量为nXZ0对给定的显著性水平,若由样本数据计算的统计值zZ则拒绝原假设

13、H0,而接受备择假设H1。当显著性水平为0.05时,645. 1z因此,当645. 136121200zxnx即71.1163612645. 1120 x时,拒绝H0,否则,若71.116x则接受H0。按照这一方法来拒绝H0,犯第一类错误的概率为 。但接受H0时,也可能因为H0其实并不真,而犯第二类错误。现在考察犯第二类错误的概率。假设我们得到71.116x则我们将接受H0,但实际上电池的平均寿命为115a此时86. 0361211571.116nxz查正态分布表可知,当z=0.86时,位于z上侧的面积是10.8051 = 0.1949。面积为0.1949,接受H0对于均值为a的分布,面积为0

14、.1949,接受H0因此,当真实的均值为115时,只要我们计算的z值落入图中阴影部分,我们就会接受H0,所以概率1949. 0就是我们在 时犯第二类错误的概率。115aa0对于均值为0的分布,面积为0.05,拒绝H0对于同样的z值,它将落在相对于以0为中心的正态分布的H0的接受域中(如图)。由此可见,降低犯第一类错误的概率,将增加犯第二类错误的概率。因此,一般不会将显著性水平取得任意小。这时为了将犯第二类错误的概率下降到一个可接受的水平,通常的做法是,增大样本容量。a0c记c为正态分布 下拒绝H0的临界值,则它与标准正态分布下的临界值 的关系是),(20nNznzc0但与正态分布 比较,可知)

15、,(2nNanzca于是,可得nznza0解之得azzn0)(两边平方就得到给定犯第二类错误临界水平 的总体均值假设检验的样本容量公式2022)()(azzn注:对双尾检验,只要将式中的单尾检验的临界值换成相应的双尾检验的临界值即可。z 标准正态分布一侧面积为标准正态分布一侧面积为 时对应的时对应的z值;值; z 标准正态分布一侧面积为标准正态分布一侧面积为 时对应的时对应的z值;值; 0原假设中总体均值的值;原假设中总体均值的值; a出现第二类错误时总体均值的值。出现第二类错误时总体均值的值。某厂要接受供货商提供的一批电池,按设计要求,电池寿命的均值应不低于120小时,现在检验人员从货物中随

16、机抽取了一个由36个电池构成的一个样本进行检验,以确定是否应该接受这批电池。考虑例子关于第一类错误的说明:如果电池的平均寿命为120小时,我们愿冒0.05的风险概率拒绝这批货物。关于第二类错误的说明:如果电池的平均寿命比规格要求少5小时,我们愿冒0.10的风险概率接受这批货物。在本例中10. 0,05. 0查正态分布表,得28. 1,645. 110. 005. 0zz而已知115,120,120a于是3 .49)115120(12)28. 1645. 1 (222n因而建议选择的样本容量为不低于50。分为如下两种情形分为如下两种情形1.未知均值未知均值,原假设,原假设H0:2.未知均值未知均

17、值,原假设,原假设H0:202202202问题的实际背景见p152例6.2.4。原假设H0:202备择假设H1:202检验统计量 设已经得到样本观察值x1, x2, , xn。则可以计算样本方差S 2。根据上一章讨论的结果有统计量) 1() 1(2222nSn若原假设H0成立,则上面的统计量是一个合乎要求的检验统计量。对给定的显著性水平,可以确定临界值22122,使得2,22212222PP因此如果我们通过样本观察值计算得到的2统计量的值2满足2212222或这表明在一次抽样的结果中出现了概率仅为的事件。这不太可能,因此我们拒绝原假设H0;否则若表达式(*)不成立,则我们接受原假设H0 。(*

18、)22122202问题的实际背景见p153例6.2.5。原假设H0:202备择假设H1:202检验统计量 仍采用检验统计量) 1() 1(22022nSn这是一个单尾检验问题。对给定的显著性水平,可以确定单侧临界值21使得212P如果我们通过样本观察值计算得到的2统计量的值2满足212则我们拒绝原假设H0;否则上式不成立,则我们接受原假设H0 。21面积为l检验统计量检验统计量 检验均值检验均值 若已知方差若已知方差2 若未知方差若未知方差2检验方差检验方差 无论是否知道均值无论是否知道均值) 1, 0(0NnXZ) 1(0ntnSXT) 1() 1(22022nSn从应用的普遍程度来看,关于

19、方差的检验远不及关于均值的假设检验。关于均值是否改变的假设检验常用于下列问题:改变了工艺或配方,是否提高了平均效率或产品质量?培训前后(或学习前后),是否提高了技术水平、效率等?某管理措施实施后,是否提高了平均效率或产品质量?采用某治疗方案,病人的某项指标是否明显改变?。如果在两个不同的企业分别采用不同的培训方法,如何来判别培训的平均效果之间是否存在差异?设获得了两个正态总体的相互独立的样本观察值:x1, x2, , xn与y1, y2, , ym 。所要完成的参数检验问题,主要有四种情况:未知1, 2, 检验假设H0: 2221未知1, 2, 检验备择假设: 2221未知 ,但知道 (称为方

20、差齐性),检验假设H0: 22212221,21未知 ,但知道 (称为方差非齐性),检验假设H0: 22212221,21方差齐性检验对于上述列出的检验,检验的顺序是:当 均未知时,先做(1),检验 成立否?2221222121,若证实 ,再做(3)检验假设H0: 成立否?222121若证实 ,再做(4)检验假设H0: 成立否?222121对问题(1),(2)可采用检验统计量) 1, 1(22222121mnFSSF这时未知总体均值。原假设 H0:备择假设 H1:22212221若原假设H0成立,则F统计量简化为) 1, 1(2221mnFSSF检验统计量注意到这是一个双尾检验,而F分布为非对

21、称分布,因此对给定的显著性水平,需要找两个临界值212,ff使得2,2212fFPfFP像在其他检验中那样,临界值是通过查相应的F临界值表得到,但通常在F值表中可能无法直接查到临界值 ,这时需要利用公式 21f2211ff检验若通过样本观察值计算得到的统计值落入临界值的外侧,则拒绝原假设H0,否则接受原假设。注:在SPSS的均值比较(Compare Means)模块中,检验方差齐性的F统计量为),min(),max(22212221SSSSF 这与上面使用的) 1, 1(2221mnFSSF进行的检验并无本质区别。原假设 H0:备择假设 H1:22212221这是一个单尾检验。检验统计量仍然是

22、) 1, 1(2221mnFSSF需要找一个临界值 ,满足ffFP若通过观察值计算得到的统计值大于临界值则拒绝原假设。原假设 H0:虽然未知 ,但知道 。要检验22212221,21备择假设 H1:21检验统计量采用统计量mnmnSmSnYXT112) 1() 1()()(222121检验类似于前面的双尾t检验。原假设 H0:仍未知 ,且不具方差齐性,即 。要检验22212221,21备择假设 H1:21检验统计量采用统计量mSnSYXT222121)()(检验类似于前面的双尾t检验。前面对两个正态总体参数的比较并没有要求两个样本观察值:x1, x2, , xn与样本观察值y1, y2, ,

23、ym 之间存在任何对应关系,实际上样本容量m与n也不一定相等。在某些对比研究中两套样本的数据可能是成对出现的。这时就不再采用上述的方法进行均值比较的T检验,而是简单地令), 2 , 1(niyxuiii然后应用前面关于单个正态总体均值检验的方法检验ui的均值与0是否显著差异,从而得到两组样本均值是否存在显著差异的结论。这就是所谓的配对T检验。首先除了两个正态总体的参数比较外,两个一般总体的大样本的对应参数的比较,根据中心极限定理也可通过两个正态总体的参数比较进行检验。因此本节介绍的内容具有广泛的应用。包括采用两种设备工艺原料生产的产品某属性的比较采用两种方案措施政策的效果的比较设相互独立地从两

24、个总体中随机抽取数量足够大的样本。来自总体1的样本是: 1,21nXXX来自总体2的样本是: 2,21nYYY则由中心极限定理近似地有),(),(22221211nNYnNX检验总体1,2的均值是否相同的问题可转化为检验是否 的问题。021对于统计量 的分布,有如下性质:YX (1)均值:21)(YXE(2)方差:222121)()()(nnYDXDYXD(3)分布形式:在大样本下近似地有),(22212121nnNYX因此若已知方差,则可使用如下的统计量)1, 0()()(22212121NnnYXZ来检验零假设H0:021若方差未知,如下的统计量22212121)()(nSnSYXZ021在大样本下近似地服从标准正态分布N(0, 1)。因此可以用来检验零假设H

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论