概率论第八章 假设检验_第1页
概率论第八章 假设检验_第2页
概率论第八章 假设检验_第3页
概率论第八章 假设检验_第4页
概率论第八章 假设检验_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 第八章第八章 假假 设设 检检 验验 1. 1. 假设检验假设检验一、假设检验的基本思想一、假设检验的基本思想四、四、 假设检验的两类错误假设检验的两类错误三、三、 假设检验的一般步骤假设检验的一般步骤二、假设检验中的一些基本概念二、假设检验中的一些基本概念2假设检验假设检验参数假设检验参数假设检验非参数假设检验非参数假设检验这类问题称作假设检验问题这类问题称作假设检验问题 .总体分布已总体分布已知,检验关知,检验关于未知参数于未知参数的某个假设的某个假设总体分布未知时的假设检验问题总体分布未知时的假设检验问题 在本节中,我们将讨论不同于参数估计的另一在本节中,我们将讨论不同于参数估计的另

2、一类重要的统计推断问题类重要的统计推断问题. 这就是这就是根据样本的信息检验根据样本的信息检验关于总体的某个假设是否正确关于总体的某个假设是否正确.一、假设检验的基本思想和方法一、假设检验的基本思想和方法3让我们先看一个例子让我们先看一个例子.这一章我们讨论对参数的假设检验这一章我们讨论对参数的假设检验 .4 生产流水线上罐装可乐生产流水线上罐装可乐不断地封装,然后装箱外运不断地封装,然后装箱外运. 怎么知道这批罐装可乐的容量怎么知道这批罐装可乐的容量是否合格呢?是否合格呢?把每一罐都打开倒入量杯把每一罐都打开倒入量杯, 看看看容量是否合于标准看容量是否合于标准. 这样做显然不这样做显然不行!

3、行!罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫升之间毫升之间.5 每隔一定时间,抽查若干罐每隔一定时间,抽查若干罐 . 如每隔如每隔1小时,小时,抽查抽查5罐,得罐,得5个容量的值个容量的值X1,X5,根据这些,根据这些值来判断生产是否正常值来判断生产是否正常. 如发现不正常,就应停产,找出原因,排除如发现不正常,就应停产,找出原因,排除故障,然后再生产;如没有问题,就继续按规定故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量时间再抽样,以此监督生产,保证质量.通常的办法是进行抽样检查通常的办法是进行抽样检查.6 很明显,不能由很明显

4、,不能由5罐容量的数据,在把握不罐容量的数据,在把握不大的情况下就判断生产大的情况下就判断生产 不正常,因为停产的损失不正常,因为停产的损失是很大的是很大的. 当然也不能总认为正常,有了问题不能及时当然也不能总认为正常,有了问题不能及时发现,这也要造成损失发现,这也要造成损失. 如何处理这两者的关系,假设检验面对的就如何处理这两者的关系,假设检验面对的就是这种矛盾是这种矛盾.7 在正常生产条件下,由于种种随机因素的影在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在响,每罐可乐的容量应在355毫升上下波动毫升上下波动. 这些这些因素中没有哪一个占有特殊重要的地位因素中没有哪一个占有特

5、殊重要的地位. 因此,因此,根据中心极限定理,假定每罐容量服从正态分布是根据中心极限定理,假定每罐容量服从正态分布是合理的合理的.现在我们就来讨论这个问题现在我们就来讨论这个问题.罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫升之间毫升之间.8它的对立假设是:它的对立假设是:称称H0为原假设为原假设(或零假设,解消假设);(或零假设,解消假设);称称H1为备择假设为备择假设(或对立假设)(或对立假设).在实际工作中,在实际工作中,往往把不轻易往往把不轻易否定的命题作否定的命题作为原假设为原假设. 0 H0:( = 355)0 H1:0 这样,我们可以认为这样,我们可

6、以认为X1,X5是取自正态是取自正态总体总体 的样本,的样本,2( ,)N 是一个常数是一个常数. 2 当生产比较稳定时,当生产比较稳定时,现在要检验的假设是:现在要检验的假设是:9那么,如何判断原假设那么,如何判断原假设H0 是否成立呢?是否成立呢?较大、较小是一个相对的概念,合理的界限在何较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?处?应由什么原则来确定?由于由于 是正态分布的期望值,它的估计量是样本是正态分布的期望值,它的估计量是样本均值均值 ,因此可以根据,因此可以根据 与与 的差距的差距XX 0 来判断来判断H0 是否成立是否成立.X- |0 较小时,可以认为较

7、小时,可以认为H0是成立的;是成立的;当当X- |0 生产已不正常生产已不正常.当当较大时,应认为较大时,应认为H0不成立,即不成立,即- |X|0 10问题归结为对差异作定量的分析,以确定其性质问题归结为对差异作定量的分析,以确定其性质.差异可能是由抽样的随机性引起的,称为差异可能是由抽样的随机性引起的,称为“抽样误差抽样误差”或或 随机误差随机误差这种误差反映偶然、非本质的因素所引起的随机这种误差反映偶然、非本质的因素所引起的随机波动波动.11 然而,这种随机性的波动是有一定限度的,然而,这种随机性的波动是有一定限度的,如果差异超过了这个限度,则我们就不能用抽样如果差异超过了这个限度,则我

8、们就不能用抽样的随机性来解释了的随机性来解释了.必须认为这个差异反映了事物的本质差别,即必须认为这个差异反映了事物的本质差别,即反映了生产已不正常反映了生产已不正常.这种差异称作这种差异称作“系统误差系统误差”12 问题是,根据所观察到的差异,如何判断问题是,根据所观察到的差异,如何判断它究竟是由于抽样的随机性在起作用,还是生它究竟是由于抽样的随机性在起作用,还是生产确实不正常?产确实不正常?即差异是即差异是“抽样误差抽样误差”还是还是“系统误差系统误差”所引所引起的?起的?这里需要给出一个量的界限这里需要给出一个量的界限 .13问题是:如何给出这个量的界限?问题是:如何给出这个量的界限?这里

9、用到人们在实践中普遍采用的一个原则:这里用到人们在实践中普遍采用的一个原则:小概率事件在一次试验小概率事件在一次试验中基本上不会发生中基本上不会发生 .14 在假设检验中,我们称这个小概率为在假设检验中,我们称这个小概率为显著性水显著性水平平,用,用 表示表示. 常取常取 的选择要根据实际情况而定。的选择要根据实际情况而定。 .05. 0,01. 0, 1 . 0 15 例例1. 某车间用一台包装机包装葡萄糖某车间用一台包装机包装葡萄糖, 包得的袋装糖包得的袋装糖重是一个随机变量重是一个随机变量, 它服从正态分布。当机器正常时它服从正态分布。当机器正常时,其均值为其均值为0.5公斤公斤, 标准

10、差为标准差为0.015公斤。某日开工后为公斤。某日开工后为检验包装机是否正常检验包装机是否正常, 随机地抽取它所包装的糖随机地抽取它所包装的糖9袋袋, 称得净重为称得净重为(公斤公斤): 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 问机器是否正常问机器是否正常?16,即即有有为为,犯犯这这类类错错误误的的概概率率记记断断错错误误即即判判绝绝是是对对的的,我我们们也也可可能能拒拒可可知知即即使使假假设设,反反之之接接受受时时拒拒绝绝假假设设,当当要要找找一一个个常常数数的的偏偏差差又又不不能能太太大大。即即与与动动,但但定定的的波波

11、来来进进行行判判断断,允允许许有有一一自自然然想想到到可可用用 )(HH.HHk|X|kXX0000*0*0为为解设该天的袋装糖重解设该天的袋装糖重,X和和为此可提出假设为此可提出假设现在的问题是要检验现在的问题是要检验,:H, 5 . 0:H?5 . 00100 由假设可知由假设可知).015. 0 ,(NX2 17时时,则则很很小小时时,比比如如取取,当当其其中中,于于是是由由假假设设知知对对于于本本题题可可用用统统计计量量:05. 010.z9015. 05 . 0XP)1 , 0(NZ,9015. 05 . 0XZ2/ 等等。或或一一般般取取或或为为真真拒拒绝绝01. 005. 0,k

12、nXP.|k|X|PH|HP00*0000 18计算得到计算得到。对于所给的样本值。对于所给的样本值查表可知查表可知,96. 1z025.0 ,居然发生了居然发生了率事件率事件这说明小概这说明小概z9015. 05 . 0X2/ 9015. 0,,96. 1z2 . 25 . 0 x511. 0 x2/ 是一个小概率事件是一个小概率事件 ,z9015. 05 . 0X2/ 中是很难发生的中是很难发生的”“小概率事件在一次试验小概率事件在一次试验原理:原理:由实际推断由实际推断不成立,不成立,因而有理由认为原假设因而有理由认为原假设5 . 0 的工作不正常。的工作不正常。即这天包装机即这天包装机

13、19 如果如果H0 是对的,那么衡量差异大小的某个统是对的,那么衡量差异大小的某个统计量落入区域计量落入区域 W(拒绝域拒绝域) 是个小概率事件是个小概率事件. 如果该如果该统计量的实测值落入统计量的实测值落入W,也就是说,也就是说, H0 成立下的成立下的小概率事件发生了,那么就认为小概率事件发生了,那么就认为H0不可信而否定它不可信而否定它. 否则我们就不能否定否则我们就不能否定H0 (只好接受它)(只好接受它).这里所依据的逻辑是:这里所依据的逻辑是:20 不否定不否定H0并不是肯定并不是肯定H0一定对,而只是一定对,而只是说差异还不够显著,还没有达到足以否定说差异还不够显著,还没有达到

14、足以否定H0的程度的程度 .所以假设检验又叫所以假设检验又叫“显著性检验显著性检验”21二、假设检验中的一些基本概念二、假设检验中的一些基本概念: :1. 称给定的称给定的 (0 1.645故拒绝故拒绝H0 ,即认为这批推进器的燃料率较以往,即认为这批推进器的燃料率较以往生产的有显著的提高。生产的有显著的提高。 落入否定域落入否定域解解: :提出假设提出假设: : 0010:40:HH645. 105. 00UnxU取统计量取统计量否定域为否定域为 W :0.05UU=1.64535 提出提出假设假设 根据统计调查的目的根据统计调查的目的, 提出提出原假设原假设H0 和备选假设和备选假设H1作

15、出作出决策决策抽取抽取样本样本检验检验假设假设 对差异进行定量的分析,对差异进行定量的分析,确定其性质确定其性质(是随机误差是随机误差还是系统误差还是系统误差. 为给出两为给出两者界限,找一检验统计量者界限,找一检验统计量T,在在H0成立下其分布已知成立下其分布已知.)拒绝还是不能拒绝还是不能拒绝拒绝H0显著性显著性水平水平P(T W)= -犯第一犯第一类错误的概率,类错误的概率,W为拒绝域为拒绝域小小 结结362 2 正态总体均值的假设检验正态总体均值的假设检验一、单个总体一、单个总体 均值均值 的的检验检验: :),(2 N二、两个正态总体均值差的检验(二、两个正态总体均值差的检验(t 检

16、验)检验): :三、基于成对数据的检验(三、基于成对数据的检验(t t 检验)检验): :37。和和差差分分别别为为的的样样本本,样样本本均均值值和和方方是是来来自自,设设总总体体2n212SXXX,X,X),(NX 一、单个总体一、单个总体 均值均值 的的检验检验: :),(2 N21 )已知)已知,:)(0100,HHi 0取统计量取统计量nXZ )10(对于给定的对于给定的 38)(检验法检验法或称或称检验法检验法Zu k2或或Z k1为为Z故拒绝域的形式故拒绝域的形式 从而拒从而拒.z| /20绝域为绝域为nX z|/20成立时有成立时有而当而当ZPH 0若若 偏大。偏大。偏小;反之,

17、偏小;反之, ZZ)1 , 0(10成立时,成立时,而当,而当成立时,成立时,当当HNZH3922 )未知)未知 nSXt0取统计量:取统计量: :H,:H0100检验:检验: )t ().1n(t|nSX| /20检验法检验法从而拒绝域为从而拒绝域为 ,)1n(t|t|P)1n( tt ,H/20,成立时成立时当当 ,)10( 的的对于给定对于给定。,可类似地推出拒绝域,可类似地推出拒绝域统计量:统计量:),仍取),仍取和和关于单侧假设检验(关于单侧假设检验(说明:说明:nSXT000 40 例例3 某工厂生产的一种螺钉,标准要求长度是某工厂生产的一种螺钉,标准要求长度是32.5毫米毫米.

18、实际生产的产品,其长度实际生产的产品,其长度X 假定服从正态分布假定服从正态分布 未知,现从该厂生产的一批产品中抽未知,现从该厂生产的一批产品中抽取取6件件, 得尺寸数据如下得尺寸数据如下:),(2 N2 32.56, 29.66, 31.64, 30.00, 31.87, 31.03问这批产品是否合格问这批产品是否合格?分析:这批产品分析:这批产品(螺钉长度螺钉长度)的全的全体组成问题的总体体组成问题的总体X. 现在要现在要检检验验E(X)是否为是否为32.5.41提出原假设和备择假设提出原假设和备择假设 01:32.5:32.5HH第一步:第一步:已知已知 X),(2 N2 未知未知.第二

19、步:第二步:能衡量差异大小且分布已知能衡量差异大小且分布已知取一检验统计量,在取一检验统计量,在H0成立下成立下求出它的分布求出它的分布32.5 (5)6XttS42第三步:第三步:即即“ ”是一个是一个小概率事件小概率事件 . 2| |(5)tt小概率事件在一次小概率事件在一次试验中基本上不会试验中基本上不会发生发生 . 对给定的显著性水平对给定的显著性水平 = =0.01,查表确定,查表确定临界值临界值0322. 4)5()5(005. 02 tt , ,使使2| |(5)Ptt得否定域得否定域 W: |t |4.032243得否定域得否定域 W: |t |4.0322故不能拒绝故不能拒绝

20、H0 .第四步第四步:将样本值代入算出统计量将样本值代入算出统计量 t 的实测值的实测值, ,| t |=2.9974.0322没有落入没有落入拒绝域拒绝域 这并不意味着这并不意味着H0一定对,只是差异还不一定对,只是差异还不够显著够显著, 不足以否定不足以否定H0 .44例例 4. 某种电子元件的寿命某种电子元件的寿命 x (以小时计以小时计)服从正态分布,服从正态分布, , 2 均未知均未知 , 现测得现测得16只元件的寿命如下只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为

21、元件的平均寿命大于问是否有理由认为元件的平均寿命大于225小时小时?,成立时,由成立时,由当当nSXnSXH00 。,统计量:,统计量:取取nSXt05. 0 按题意需检验按题意需检验解解.225:H,225:H:100 ,蕴含,蕴含知知)1n(tnSX)1n(tnSX0 45小时。小时。命不大于命不大于即认为元件的平均寿即认为元件的平均寿225不落在拒绝域中,不落在拒绝域中,t故接受故接受 H0, 7531. 16685. 0nSXt0 即有即有,又算得又算得7259.98s5 .241x ,现现7531. 1)15(t16n05. 0 ,成立时,成立时,当当)1n( ttH0 所以拒绝域为

22、:所以拒绝域为:)1n(tnSX0 .)1n(tt P 463 3 正态总体方差的假设检验正态总体方差的假设检验一、单个正态总体方差的检验一、单个正态总体方差的检验二、两个正态总体方差之比的检验二、两个正态总体方差之比的检验47一、单个正态总体方差的检验一、单个正态总体方差的检验,S)1n(:2022 c c取统计量取统计量:H:H2020212020 是已知常数。是已知常数。,:)(X 水平水平显著性显著性的样本。要求检验假设的样本。要求检验假设,),(NX22 均未知,均未知,设总体设总体X,X,Xn21是来自是来自L48).1n()1n(22/222/12 c c c c c c c c

23、 或或故拒绝域为故拒绝域为 .2)1n(P22/2 c c c c ,2)1(nP22/12 c c c c ,有,有对于给定的对于给定的)1n(H220 c cc c。成立时,成立时,当当)1(22/ n c c)1(22/1 n c c2 2 S)1n(2022 c c49 例例 2. 某厂生产的某种型号的电池某厂生产的某种型号的电池 , 其寿命长期以来其寿命长期以来服从方差服从方差 2 = 5000 (小时小时2) 的正态分布的正态分布, 现有一批这现有一批这种电池种电池 , 从它的生产情况来看从它的生产情况来看, 寿命的波动性有所改寿命的波动性有所改变变. 现随机取现随机取26只电池只

24、电池 , 测出其寿命的样本方差为测出其寿命的样本方差为 s2= 9200 (小时小时2) . 问根据这一数据能否推断这批电池问根据这一数据能否推断这批电池寿命的波动性较以往的有显著的变化寿命的波动性较以往的有显著的变化(取取 = 0.02)?.5000:H,5000:H2120 :02.0:下检验假设下检验假设在水平在水平解解 ,5000,524.11)25()1n(20299. 022/1 c c c c ,314.44)25()1n(,26n201. 022/现现 c c c c 50的结论,可知拒绝域为:的结论,可知拒绝域为:由前面由前面,3314.4446s )1n(9200s.524.11s )1n(314.44s )1n(2022202202 ,得得由由观观察察值值或或著的变化。著的变化。动性较以往有显动性较以往有显认为这批电池寿命的波认为这批电池寿命的波,H0所以拒绝所以拒绝51是否变大了?是否变大了?方差方差有没有显著变化?有没有显著变化?方差方差下检验:下检验:试在试在 水平水平样本标准差样本标准差件,件,抽取抽取现从新产品中随机地现从新产品中随机地,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论