概率论与数理统计第八章假设检验_第1页
概率论与数理统计第八章假设检验_第2页
概率论与数理统计第八章假设检验_第3页
概率论与数理统计第八章假设检验_第4页
概率论与数理统计第八章假设检验_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 假设检验 假设检验是统计推断的一个主要部分.在科学研究, 日常工作甚至生活中经常对某一件事情提出疑问. 解决疑问的过程往往是先做一个和疑问相关的假设, 然后在这个假设下去寻找有关的证据.如果得到的证据是和假设相矛盾的, 就要否定这个假设.8.1 假设检验的概念 当总体分布函数完全未知或只知其形式、但不知其参数的情况,为推断总体的性质,提出某些关于总体的假设。 为判断所作的假设是否正确, 从总体中抽取样本, 根据样本的取值, 按一定的原则进行检验。 何为假设检验?最后, 作出接受或拒绝所作假设的决定. 其理论背景为实际推断原理,即“小概率原理”,其想法和前面的最大似然类似:如果实际观测到

2、的数据在某假设下不太可能出现, 则认为该假设错误。我们主要讨论的假设检验的内容有参数检验非参数检验: 总体均值、均值差的检验总体方差、方差比的检验分布拟合检验假设检验的理论依据例1: 一条新建的南北交通干线全长10公里.公路穿过一个隧道(长度忽略不计),隧道南面3.5公里, 北面6.5公里. 在刚刚通车的一个月中, 隧道南发生了3起交通事故, 而隧道北没有发生交通事故,能否认为隧道南的路面更容易发生交通事故?分析: p表示一起交通事故发生在隧道南的概率.p=0.35表示隧道南北的路面发生交通事故的可能性相同.p0.35表示隧道南的路面发生交通事故的概率比隧道北的路面发生交通事故的概率大. H0

3、: p=0.35. 再作一个备择假设 H1: p 0.35.在本问题中,如果判定H0不对,就应当承认H1.-为了作出正确的判断, 先作一个原假设检验: 三起交通事故的发生是相互独立的。 如果H0为真, 则每一起事故发生在隧道南的概率都是0.35, 于是这三起交通事故都发生在隧道南的概率是 P= 0.353 0.043.这是一个很小的概率, 一般不容易发生. 所以我们否定H0, 认为隧道南的路面发生交通事故的概率比隧道北大. 因为当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯错误。犯错误的概率正是P=0.043. 于是, 我们判断正确的概率是1-0.043

4、=95.7%做出以上结论也有可能犯错误。(1) 根据问题的背景, 提出原假设 H0: p=0.35, 及其备择假设 H1: p0.35.(2) 在H0 成立的假设下, 计算观测数据出现的概率P. 如果P很小(一般用0.05衡量), 就应当否定H0, 承认 H1; 假设检验中的基本概念和检验思想注: 为了简便, 我们把以上的原假设和备择假设记作 H0: p=0.35 vs H1: p0.35. 其中的vs是versus的缩写. 如果P不是很小, 也不必急于承认H0, 这是因为证据往往还不够充分. 如果继续得到的观测数据还不能使得P降低下来, 再承认H0不迟. 例 2: 某产品的出厂检验规定: 次

5、品率 p 不超过4%才能出厂. 现从一万件产品中任意抽查12件发现3件次品, 问该批产品能否出厂?若抽查结果发现1件次品, 问能否出厂?解: 提出原假设和备择假设在H0成立时这不是 小概率事件, 没理由拒绝原假设。在不准备继续抽样的情况下,作出接受原假设的决定, 即该批产品可以出厂.这是 小概率事件, 故可认为原假设不成立, 即该批产品次品率p0.04 , 则该批产品不能出厂.若抽查结果发现1件次品, 则在H0成立时参数检验的一般提法 一般来讲, 设X1, X2,Xn是来自总体X的样本, 是总体X的未知参数, 但是已知 0 1, 它们是互不相交的参数集合. 对于假设 H0: 0 vs H1:

6、1, 根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则否定H0,否则接受H0,而且要求此时称W为拒绝域,为检验水平。 -否定H0 解决假设检验的问题时, 无论作出否定还是接受原假设H0的决定, 都有可能犯错误. (1) H0为真, 统计推断的结果否定H0, 犯第一类 错误, 犯该错误的概率不超过。(2) H0为假, 统计推断的结果接受H0, 犯第二类 错误,我们记犯该错误的概率为。我们称否定H0时犯的错误为第一类错误, 接受H0时犯的错误为第二类错误. 具体如下, 在正确的统计推断前提下,犯错误的原因总是随机因素造成的。要有效减少犯错误的概率,只好增加观

7、测数据,或在可能的情况下提高数据的质量,这相当于降低数据的样本方差。 在例1.1中, 如果第一起交通事故发生后, 就断定隧道南更容易发生交通事故, 犯第一类错误的概率是0.35.当第二起交通事故发生后, 断定隧道南更容易发生交通事故, 犯第一类错误的概率是0.352=0.1225.如果第四起交通事故又发生在隧道南, 否定p=0.35时犯第一类错误的概率是0.354=0.015.例1.:第一类错误与第二类错误的比较 一个有20多年教龄的教师声称他上课从来不“点名”. 如何判定他讲的话是真实的? 确立原假设H0: 他没有点过名, 然后再调查H0是否为真. 当调查了他教过的3个班, 都说他没有点过名

8、, 这时如果承认H0, 犯错误的概率还是较大的. 当调查了他教过的10个班, 都说他没有点过名, 这时承认H0 犯错误的概率会明显减少。 如果调查了他教过的30个班, 都说他没有点过名, 这时承认H0犯错误的概率就会很小了。可惜调查30个班是很难做到的! 反过来, 在调查中只要有人证实这位老师点过名, 就可以否定H0了(不论调查了几个班), 并且这样做犯错误的概率很小. 例1.2告诉我们, 要否定原假设H0是比较简单的, 只要观测到了H0下小概率事件就可以。 要承认H0就比较费力了: 必须有足够多的证据(样本量), 才能够以较大的概率保证H0的真实. 一般情况下,原假设应当和已有的事实相悖,以

9、利于得到否定原假设的结果。假设检验步骤(三部曲) 根据实际问题所关心的内容,建立H0与H1。(原假设应当和已有的事实相悖) 假设H0为真时,选择合适的统计量T, 并确定检验水平为 的拒绝域。 根据样本值计算,并作出相应的判断.8.2 正态均值的假设检验A. 已知 时, 的正态检验法例 4: 一台方差是0.8克的自动包装机在流水线上包装净重500克的袋装白糖. 现随机抽取了9袋白糖, 测得净重如下(单位:克): 499.12 499.48 499.25 499.53 500.82 499.11 498.52 500.01 498.87. 能否认为包装机在正常工作? 分析: 9袋白糖中有7袋净重少

10、于500克, 似乎净重0=500不对. 但是, 方差是0.8克, 也可能是由于包装机的随机误差导致了以上的数据.解: 将包装机包装的袋装白糖的净重视为总体X, 则X N ( 2), 其中2 =0.8已知,未知. 在H0下, 用Xj表示第 j 袋白糖的净重, 则X1,X2,X9是来自总体X的n=9个样本. 提出假设 H0: =0 vs H1: 0. 若要求对于标准正态分布,c应为其上/2分位数z/2,于是拒绝域为本例中,如果取=0.05, 则 根据抽样数据,得|z| = 1.97时, 小概率事件发生了, 于是否定原假设H0. 在例4中,称为检验的显著性水平, 简称为显著性水平, 检验水平, 或水

11、平(level); Z称为检验统计量; |Z| z/2称为检验的拒绝域或否定域; -由于这种检验方法是基于正态分布的方法, 所以又称为正态检验法或Z检验法.- 拒绝域是一个事件, 它的发生与否由|Z|, 从而由观测样本X1,X2,.,Xn决定.- 如果事件|Z| z/2发生了, 就称检验是显著的. 这时否定H0, 犯第一类错误的概率不超过。 在例4中, 如果取检验水平 =0.04, 则临界值z /2 =2.054 . 这时|z|=1.972.054, 不能否定H0. 这说明在不同的检验水平下可以得到不同的检验结果. 降低犯第一类错误的概率, 就会使得拒绝域减小,从而拒绝H0的机会变小,接受H0

12、的机会变大。 0 0 0 0 0正态 检验法 (2 已知)原假设 H0备择假设 H1检验统计量及其H0为真时的分布拒绝域 在例4中, 从实际数据计算得到 |z|=1.97. 如果拒绝域取成 |Z| 1.97, 则刚刚能够拒 绝H0. 这时犯第一类错误的概率是 P=P(|Z|1.97)=0.0488. 我们称P=0.0488是检验的P值(P-value). B. P 值检验法 P值越小, 数据提供的否定H0的证据越充分.如果检验的显著性水平是事先给定的, 当P值小于等于, 就要否定H0.C.未知时,均值 的t 检验法例 5: 在例4中如果9个袋装白糖的样品是从超级市场仓库中随机抽样得到的, 能否

13、认为这批500克袋装白糖的平均重量是500克? 标准差未知, 可用样本标准差S代替.解: 对0=500克, 仍作假设 H0: = 0 vs H1: 0.在H0下, 从 7.3节的定理3.6知道检验统计量 说明在H0下, T在0附近取值是正常的, 如果|T|取值较大就应当拒绝H0. 根据分位数t/2(n-1)的性质, 有 P(|T| t/2(n-1)= .于是H0的显著性水平为的拒绝域是 |T| t/2(n-1) 取=0.05, 查表得到t0.05/2(8)=2.306. 拒绝域为 作出以上判断也有可能犯错误, 但是犯错误的概率不超过 0.05.经过计算得到 S=0.676, |T|= 2.60

14、9 2.306, 所以应当否定H0, 认为500. D.未知时,均值 的单边检验法例6:在例5中, 抽查的9袋白糖的平均重量为499.412克可以引起我们的怀疑. 这批袋装白糖的平均重量是否不足呢? 解:为了解决这个问题, 我们提出假设 H0: 500 vs H1: 500 如果否定了H0, 就认定这批袋装白糖的份量不足. 由于在H0下, 不知道 的具体值, 所以T的分布是未知的. 但是这时有H0: 500 vs H1: 500因为 P(T -t(n-1) P( T0 -t(n-1)= , 所以可以构造拒绝域为 T -t(n-1)当T -t(n-1), 应当否定H0 在本例中, 查表得到-t0

15、.05(8)=-1.86, T=-2.609-1.86, 所以应当否定H0. 认定这批袋装白糖的分量不足。这时, 犯错误的概率不超过0.05. 由于这种检验方法是基于t分布的方法, 所以又称为t 检验法.注意:由于 ,故原假设通常设为 500,易被拒绝,以便得出显著性结论。 同理,对于来自总体的样本未知时,在检验水平假设这时在H0下有下,因此,所以,原假设的拒绝域为分析例2.1和2.3的问题背景就会看出, 在例2.1中应当作双边检验因为多装和少装白糖都是不符合生产标准的.在例2.3中只需要作单边检验因为超市只需要知道袋装白糖不缺斤少两就够了. 0 0 0 0 0T 检验法 ( 2 未知)原假设 H0备择假设 H1检验统计量及其H0为真时的分布拒绝域例7: 某厂生产小型马达, 其说明书上写着: 这种小型马达在正常负载下平均消耗电流不会超过0.8 安培. 现随机抽取16台马达试验, 求得平均消耗电流为0.92安培, 消耗电流的标准差为0.32安培. 假设马达所消耗的电流服从正态分布, 取显著性水平为 = 0.05, 问根据这个样本, 能否否定厂方的断言?解 根据题意待检假设可设为 H0 : 0.8 vs H1 : 0.8 未

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论