




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章假设检验内容提要本章主要讲述假设检验思想概述;正态总体参数检验(u检验,t检验,X2检验和F检验);非正态总体参数检验(非正态总体均值检验的大样本方法,指数总体的参数检验);检验的实际意义及两类错误(检验结果的实际意义,检验中的两类错误,样本容量确定问题)等内容.重点分析1、理解假设检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两类错误。2、了解单个和两个正态总体的均值与方差的假设检验。3、了解总体分布假设的X2检验法。难点分析假设检验的基本思想、基本步骤及假设检验可能产生的两类错误。习题布置习题7(1,3,5,7,10,13,16,18)备注#教学内容(Contents)ChapterSeven假设检验(HypothesisTests)§7.1假设检验思想概述(SummaryofHypothesisTestIdea)前一章讲了对总体参数的估计问题,即是对样本进行适当的加工,以推断出参数的值(或置信区间)。本章介绍的假设检验,是另一大类统计推断问题。它是先假设总体具有某种特征(例如总体的参数为多少),然后再通过对样本的加工,即构造统计量,推断出假设的结论是否合理。从纯粹逻辑上考虑,似乎对参数的估计与对参数的检验不应有实质性的差别,犹如说:“求某方程的根”与“验证某数是否是某方程的根”这两个问题不会得出矛盾的结论一样。但从统计的角度看估计和检验,这两种统计推断是不同的,它们不是简单的“计算”和“验算”的关系。假设检验有它独特的统计思想,也就是说引入假设检验是完全必要的。我们来考虑下面的例子。某厂家向一百货商店长期供应某种货物,双方根据厂家的传统生产水平,定出质量标准,即若次品率超过3%,则百货商店拒收该批货物。今有一批货物,随机抽43件检验,发现有次品2件,问应如何处理这批货物?如果双方商定用点估计方法作为验收方法,显然2/43>3%,这批货物是要被拒收的。但是厂家有理由反对用这种方法验收。他们认为,由于抽样是随机的,在这次抽样中,次品的频率超过3%,不等于说这批产品的次品率p(概率)超过了3%.就如同说掷一枚钱币,正反两面出现的概率各为1/2,但若掷两次钱币,不见得正、反面正好各出现一次一样。就是说,即使该批货的次品率为3%,仍有很大的概率使得在抽检43件货物时出现2个以上的次品,因此需要用别的方法。如果百货商店也希望在维护自己利益的前提下,不轻易地失去一个有信誉的货源,也会同意采用别的更合理的方法。事实上,对于这类问题,通常就是采用假设检验的方法。具体来说就是先假设次品率P<3%,然后从抽样的结果来说明P<3%这一假设是否合理。注意,这里用的是“合理”一词,而不是“正确”,粗略地说就是“认为P<3%”能否说得过去。具体如何做,下面再说。还有一类问题实际上很难用参数估计的方法去解决。某研究所推出一种感冒特效新药,为证明其疗效,选择200名患者为志愿者。将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据。,、是否痊愈服何种药痊愈者未痊愈者合计未服药者4852100服药者5644100合计10496200问新药是否确有明显疗效?这个问题就不存在估计什么的问题。从数据来看,新药似乎有一定疗效,但效果不明显,服药者在这次试验中的情况比未服药者好,完全可能是随机因素造成的。对于新药上市这样关系到千万人健康的事,一定要采取慎重的态度。这就需要用一种统计方法来检验药效,假设检验就是在这种场合下的常用手段。具体来说,我们先不轻易地相信新药的作用,因此可以提出假设“新药无效”,除非抽样结果显著地说明这假设不合理,否则,将不能认为新药有明显的疗效。这种提出假设然后做出否定或不否定的判断通常称为显著性检验(Significancetest)。假设检验也可分为参数检验(Parametrictest)和非参数检验(Nonparametrictest)。当总体分布形式已知,只对某些参数做出假设,进而做出的检验为参数检验;对其它假设做出的检验为非参数检验。如例7.1中,总体是两点分布,只需对参数P做出假设检验,这是参数检验问题,而例7.2则是非参数检验的问题。与估计问题稍不同的是,一般来说非参数检验同参数检验一样,在实际中经常要用到,因此,我们准备花一定的篇幅分别加以介绍。无论是参数检验还是非参数检验,其原理和步骤都有共同的地方,我们将通过下面的例子来阐述假设检验的一般原理和步骤。据报载,某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、绿两色球各10个的暗箱中连续摸10次(摸后放回),若10次都是摸得绿球,则中大奖。某人按规则去摸10次,皆为绿球,商店认定此人作弊,拒付大奖,此人不服,最后引出官司。我们在此并不关心此人是否真正作弊,也不关心官司的最后结果,但从统计的观点看,商店的怀疑是有道理的。因为,如果此人摸球完全是随机的,则要正好在10次摸球中均摸到绿球的概率为(2)10=-1-绿球的概率为(2)1024生的事件不应该是小概率事件。现在既然这样小概率的事件发生了,就应当推测出此人摸球不是随机的,换句话说有作弊之嫌。上述的这一推断,实际上就是假设检验的全部过程。它一般包含了这么几步:提出假设,抽样,并对样本进行加工(构造统计量),定出一个合理性界限,得出假设是否合理的结论。为了便于操作,我们将结合例7.3,把这一过程步骤表述得更加形式化一点。这里要说明一点的是所谓“小概率事件”。究竟多大概率为小概率事件?在一个问题中,通常是指定一个正数a,0<a<1,认为概率不超过a的事件是在一次试验中不会发生的事件,这个a称为显著性水平(Levelofsignificance)。对于实际问题应根据不同的需要和侧重,指定不同的显著性水平。但为了制表方便,通常可选取a=0.01,0.05,0.10等。下面我们用假设检验的语言来模拟商店的推断:10提出假设:H:此人未作弊;H:此人作弊。01这里H0称为原假设(Nullhypothesis),H]称为备选假设(Alternativehypothesis)或对立假设(Oppositehypothesis),备选假设也可以不写。20构造统计量,并由样本算出其具体值:统计量取为10次模球中摸中绿球的个数N.由抽样结果算出N=10.30求出在H下,统计量N的分布,构造对H不利的小概率事件:00易知,在H0下,即如果此人是完全随机地摸球的话,统计量N服从二项分布B(10,1/2).其分布列为p=Ck(1)io,k=0,1,2,A,10.那么此人摸到的绿球数应该在平均数5k102个附近,所以对H不利的小概率事件是:“绿球数N大于某个较大的数,或小于某个较小的0数。”在此问题中,若此H0不成立,即此人作弊的话,不可能故意少摸绿球,因此只需考虑事件“N大于某个较大的数”,这个数常称为临界值,即某个分位数。40给定显著性水平a,确定临界值:即取一数n(a)使得p{N>n(a)}=a.如取a=0.01,由分布列算出:p=1/1024氏0.001,p=10/1024氏0.01,p+p氏0.011.10 9 9 10对于这种离散型概率分布,不一定能取到n(a).取最接近的n,使当H成立时,0P{N>n}<a,因此n=9,即该小概率事件是{N>9}.50得出结论:已算得N=10,即{N>9}发生了,而{N>9}被视为对H0不利的小概率事件,它在一次试验中是不应该发生的,现在{N>9}居然发生了,只能认为H是不成立的,即H:“此01
人作弊”成立。这一推断过程,也是假设检验的一般步骤,在这些步骤中,关键的技术问题是确定一个适当的用以检验假设的统计量,这个统计量至少应该满足在H0成立的情况下,其抽样分布易于计算(查到)。当然还应该尽量满足一些优良性条件,特别是在参数检验中。限于篇幅,我们不准备在本书中仔细讨论这些优良性条件。在统计量选定以后,便可构造出由该统计量T描述某个显著性水平下的一小概率事件{TgB},我们称使得这一小概率事件发生的样本空间a的点的全体V={(X,X,A,X)gX:T(X,X,A,X;6)gB}12 n 12 n a为H的否定域(Negationregion)或拒绝域(Rejectionregion),通常也简记为V={TgB}.最0a后的检验即是判断所给的样本是否落在V内,或者是TgB是否成立。因此,从这个意义上a可以说设计一个检验,本质上就是找到一个恰当的否定域V,使得在H下,它的概率0P(VIH)=(或<)a0今后我们总是把统计检验中提到的“小概率事件”视为与否定域V是等价的概念。另外,称V的余集X-V为H的接受域。0§7.2正态总体参数检验(ParameterTestofNormalCollectivity)对于正态总体,其参数无非是两个:期望N和方差o2,如果加上两总体的参数比较,概括起来,对参数的假设一般只有如下四种情形:(i)对N,(五)对o2,(皿)对口-日,12(iv)对o2/o2.其中情形(i)、(iii)又分为o2(或o2,02)已知和未知的两种情况。1 2 12下面我们将分别予以讨论。如前所提到的,对于设计一个检验,关键是构造一个统计量T=T(6),它需满足的一个必要条件是在H成立时,分布为已知(有表可查),同时它00对于需要检验的参数来说应该是“较好”的,这一点与参数的区间估计很相似。在正态总体参数的区间估计中,我们正好也是讨论了上述四种情形的置信区间。在区间估计中,我们曾提到过,构造参数6的置信区间的关键一步是从6的点估计出发,构造一个分布已知的含未知参数6的随机变量T(6),针对四种情况,当时我们构造的T(6)分别是X—LI X—L1C1.C2.对口:T⑴)=——竺,(o已知),T⑴)=——2L,(o未知)onn S7n—1C1.C2.nS2T(o2)= o2C3.对口一日:C3.对口一日:12T(N,N)=12T(N1,N2)=(X-Y)—(N-N) i-2-,Co,o已知)o2o2 12'^-+—2-
nn
1 1 2,nn(n+n—2)(X—Y)—(N—N),12——1 2 1 2\n+nnnS2+nS21 2 %11 22(o1=o未知)2o2 n(n—1)S2o2C4.对:T(o2,o2)=T_1 2-1-C4.o2 1 2n(n—1)S2o22 12 12对于正态参数检验,我们也将针对不同情况,采用形式与上述随机变量T(6)完全一样的统计量T(60),来作为检验统计量。但这里需要说明的是,作为区间估计中的T(6)与检验中的T(9)是有所不同的,第一,T(9)中含有待估的未知参数°,因此,它不是统计量,只是一0般的随机变量;而T(9)中的参数9为一已知数,因此它是统计量。第二,T(9)的分布是已00知的,这是因为其中的9与总体中的参数9是相一致的;而T(9)的分布则需在假设总体参数09明确时分布才已知。除此之外,它们的分布形式是完全一样的。上述统计量T(9)在H成立时通常有4种分布:00D1.N(0,1)情形C1.、C3.中,o(或o,o)已知;12D2.t分布情形,C1.、C3.中,o(或o,o)未知;12D3.X2分布,情形C2.;D4.F分布,情形C4.我们分别称以它们为检验统计量的检验为u检验、t检验、X2检验和F检验。下面将分别讨论这几种检验所适应的具体问题和检验的方法。一、u检验(utest)u检验适应在方差已知的情况下,对期望的检验(单总体或双总体)。(一)单总体情形考察下面的例子:Example7.4一台包装机装洗衣粉,额定标准重量为500g,根据以往经验,包装机的实际装袋重量服从正态N(N,o2),其中o=15g,为检验包装机工作是否正常,随机抽取900袋,称得洗衣粉净重数据如下(单位:g)497 506 518 524 488 517 510 515 516若取显著性水平a=0.01,问这包装机工作是否正常?所谓包装机工作正常,即是包装机包装洗衣粉的份量的期望值应为额定份量500g,多装了厂家要亏损,少装了损害消费者利益。因此要检验包装机工作是否正常,用参数表示就是日=500是否成立。首先,我们根据以往的经验认为,在没有特殊情况下,包装机工作应该是正常的,由此提出原假设和备选假设:H:旦二500;H:旦W50001然后对给定的显著性水平a=0.01,构造统计量和小概率事件,来进行检验。一般地,可将例7.4表述如下:设X〜N(艮o2),o2已知,X,X,A.,X,为X的0 0 12 n一子样,求对问题H:日=从;H:"从
00 1 0的显著水平为a(0<a<1)的检验。这个问题就归结为,总体服从N(N,o2),o2已知,需检验口,由前所述,用u检验法。00我们仿照例7.3的步骤来解这个问题。Solution10提出假设(已有,略)。20构造统计量。此问题属情形CL的u检验,故用统计量X—^u二——onn0并计算其具体值。在例7.4中u=(9(497+506+518+524+488+517+510+515+516)—500)/(15八9)=2.0230易知,在H0成立的条件下;u服从正态分布N(01),因此根据正态分布的特点,在H0成立的条件下,u的值应以较大的概率出现在0的附近,因此对H不利的小概率事件是u的0值出现在远离。的地方。即u大于某个较大的数,或小于某个较小的数。这一小概率事件对应的否定域为V={u<u}u{u>u}={{u\>u}五 1—五 1―72 2 2满足P(VIH)=a.构造这一否定域利用了u的概率密度曲线两侧尾部面积(图7-1),故02 1一2 250从u的值判断小概率事件是否发生,并由此得出接受或拒绝H0的结论。对于例7.4,因为在2。中算出的u值,其绝对值小于2.575,样本点在否定域V之外:即小概率事件未发生,故接受H,亦即认为包装机工作正常。0(二)双总体情形TOC\o"1-5"\h\z双总体u检验适应的问题的一般提法如下:设X,X,A.,X为出自N(从,。2)的样本,1 2 n 11y,r,a.,r为出自n(从,。2)的样本,o,o已知,两个总体的样本之间独立,求对于12 n 22 1 2N-N的显著水平为a的检验。例如假设具有下列形式:12H:从一旦<0;H:从一旦>001 2 11 2此问题属情形C3.的u检验,故用统计量(X-r)
u=, o2o21—U+~^-InnTOC\o"1-5"\h\z1 1 2当H成立时,总体所服从的是一族分布,因此u的分布也无法确定,通常我们是先取H成00立时的边界值N-日=0,这时u~N(0,1),据此来确定否定域。易知,此时若H:12 1日-日>0成立,则u的值应有变大的趋势。于是对H不利的小概率事件应为12 0V-{u>u}1-a显然当N-N-0时,P(VIN-N-0)-a;而当日一日-a<0时,u-a~N(0,1),12 12 12此时P(VIN-N-a)-P{u>u}-P{u-a>u-a}<a1 2 1-a 1-a如图7-2所示。图7-2总之,当H成立时,P(VIH)<a.它被认为是在一次试验中实际上不出现的事件。这00一否定域的构造利用了N(0,1)概率密度单侧的尾部面积,故称这种形式的检验为单侧检验
(One-sidedtest)。最后通过计算u的具体值,观察小概率事件是否发生,未发生接受H0,发生了则拒绝H.0一般地,检验统计量若为正态或t分布,采用双侧或单侧检验仅与假设的形式有关,当备选假设中的参数区域在原假设的参数区域的两侧时,用双侧检验,在一侧时,用对应于该侧的单侧检验。二、t检验(ttest)t检验用于当方差未知时对期望的检验,可以是单总体,也可是双总体。当然对于双总体,它们的样本之间应该是独立的。(一)单总体情形考察如下例子:Example7.5某部门对当前市场的价格情况进行调查。以鸡蛋为例,所抽查的全省20个集市上,售价分别为(单位:元/500克)3.05 3.31 3.34 3.82 3.30 3.16 3.84 3.10 3.90 3.183.88 3.22 3.28 3.34 3.62 3.28 3.30 3.22 3.54 3.30已知往年的平均售价一直稳定在3.25元/500克左右,能否认为全省当前的鸡蛋售价明显高于往年?对于这样的实际问题,通常可以补充下列条件,首先,一般可认为全省鸡蛋价格服从正态分布N(也o2),其次,我们定出一个显著水平如a=0.05.针对这一问题,提出一个合理的假设是HH:日=3.25;0
将这一问题一般化就是:设X,X,A,X
12题H:^>3.251为出自N(也o2)的样本,o2未知,求对问H:旦=从;H:旦>从
00 10的显著水平为a(0<a<1)的检验。这属于情形CLo2未知的情况,可用t检验。即取检验统计量为在H成立的条件下,t~t(n—1);又当H成立时,t有变大的趋势,因此用单侧检验,即取01否定域为V={t>t (n—1)}1—a最后根据计算出来的t值,看样本是否落在V内,若落在V内,则拒绝H,否则,接受H.TOC\o"1-5"\h\z_ 0 0具体到例7.5,可算出n=20,X=3.399,S=0.2622,由此计算出t=2.477.另外查表可得t(n—1)=t (19)=2.093<2.477,故拒绝H,即鸡蛋的价格较往年明显上涨。1—a 0.975 0(二)双总体的情形对于双总体,一般地讨论比较麻烦,通常考虑两种特殊情况,一种是o=o=o(未12知)的情形,这一情形问题的一般提法是:设X,X,A,X为出自N⑴,o2)的样本,12 n1 1Y,Y,A,Y为出自N(日,o2)的样本,两个总体的样本之间独立,求问题12 n2 2H:从—从=0;H:从—从丰0(或>0,或<0)o12 11 2的显著水平为a的检验。这是情形C3。中o2未知的场合,用统计量nn(n+n一2) (X一Y)(7.1)112——1 2 (7.1)'n+nJnS2+nS21 2 ill22TOC\o"1-5"\h\z其中S2=-1E(X一X)2,S2=—2(Y一Y)2.在H成立时,/服从自由度为1n i 2n i 01i=1 2i=1n+n-2的t分布.否定域则依照H的具体内容来构造,即依照H决定采用双侧或单侧12 1 1检验。第二种情形是o,o未知,但n=n=n,则可考虑所谓配对检验法(Methodof12 1 2paired-sampletest)。此时令Z=X一Y,i=12A,n,iiiZ=12z,S2=12(Z一Z)2
nini
i=1 i=1由于当日=日时,Z~N(0,o2+o2),且相互独立,则12 i 12o2+o2 nS2Z~N(0,^), ~X2(n-1)no2+o2 1 2zo+o2且Z与S2独立,故t= ':n =—~1Z~t(n-1)\o"CurrentDocument"■nS2 1S, ' 0o2+o2n一11 1 2t可作为H:从-从=0的检验统计量。01 2Example7.6某工厂生产某种电器材料。要检验原来使用的材料与一种新研制的材料的疲劳寿命有无显著性差异,各取若干样品,做疲劳寿命试验,所得数据如下(单位:小时):原材料: 40 110 150 6590210270新材料: 60 150 220 310380350250 450110175一般认为,材料的疲劳寿命服从对数正态分布,并可以假定原材料疲劳寿命的对数ln己与新材料疲劳寿命的对数lnn有相同的方差,即可设ln己〜N⑴,o2),lnn〜N(日,o2).12Solution问题归结为下述检验:H:从=N;H:从w日TOC\o"1-5"\h\z0 12 1 1 2当h成立时,in己与inn就有相同的分布,从而自与n有相同的分布,即两种材料的疲劳寿0命没有显著性差异。将前面的试验数据取对数:inm: 1.602 2.041 2.176 1.813 1.954 2.322 2.431lnn: 1.778 2.176 2.342 2.491 2.560 2.544 2.398 2.6532.0412.243记in己的样本为X,X,A,X,inn的样本为Y,Y,A,Y,则可算出2勺 12 n2X=2.0484,S2=0.501氏0.072,n=717 1Y=2.3246,S2=0.663=0.0663,n=102 10 2对此问题可用式(7.1)中的统计量t,具体算出:t=一2.01显然,这个问题须用双侧检验,若给显著性水平a=0.05,否定域V应为
{111>t (7+10—2)=t(15)x2.13}.,005 0.9752计算结果表明|t<2.{111>t (7+10—2)=t(15)x2.13}.,005 0.9752计算结果表明|t<2.13,因此不能否定H0,即认为两种材料的疲劳寿命没有显著性差异。、X2检验和F检验(X2testandFtest)X2检验和F检验都是对于方差的检验,前者用于单参数的情形C2数的情形C4.后者往往用于两参(一)X2检验设X,X,A,X为出自N(也o2)的样本,12要对参数O2进行检验这里N往往是未知的。假设的形式通常如H:o2=o2;00H:o2<o2;00(H:o2>o2;00都可选择统计量H:1H:O2<O2类似)对于(i),nS2X2二一O20当H成立时,式(7.1)右边服从X20(7.2)n(n-1)分布。由于一-S2是O2的无
n—1比值太大或太小都不利于H,自然地,可以来用双侧检验,取否定域为0如图7-3所示。v={X2<X2(n—1)}u{X2>X2(n—1)}如图7-3所示。a 1_a2 2图7-3aa此时尸(VIH)=—+—=a.对于(ii)当H成立时,O2<o2,令
0 22 0 0〜X〜X~2nS2O2则X2~X2(n-1),且22>x2.注意到此时,不利于H0的事件是统计量X2变大,因此,采用单侧检验,即取否定域为v={X2>X2(n—1)}
1—a可知此时有0(二)F检验P(VIH可知此时有0(二)F检验P(VIH)=P{X2>X21—a(n—1)}<P”2>X21—a(n—1)}二a设X,X,A,X为出自N(从,o2)的样本,Y,Y,A,Y为出自N(从,o2)的样本,12 n且样本之间独立。考虑1假设111 2 n222H:O2=o201H:o201对此可采用统计量H:o2wo211 2H:H:o2wo211 2H:O2>o21122<O2;(7.3)TOC\o"1-5"\h\z\o"CurrentDocument"F=-U——2 1-n(n—1)S221 2进行检验,易知,对于(i),12在H下,F~F(n-1,n-4,我们可取否定域为进行检验,易知,对于(i),12V={F<F(n—1,n—1)}u{F>F(n—1,n—1)]-1 2 1—-1 222此时P(VIH)=a.0对于(ii),类似前面的讨论,可取否定域为V={F>F(n—1,n—1)}1—- 1 2此时P(VIH)<a,0Example7.7一台机床大修前曾加工一批零件,共n1=10件,加工尺寸的样本方差为S2=2500(从2).大修后加工一批零件,共n=12件,加工尺寸的样本方差为S2=400(从2).TOC\o"1-5"\h\z1 22问此机床大修后,精度有明显提高的最小显著性水平大致有多大?Solution对此实际问题,可设加工尺寸服从正态分布,即机床大修前后加工尺寸分别服从N(从,o2)和N(从,o2).于是由题意有11 22H:o2=o2; H:o2>o201 2 11 2用F统计量厂n(n—1)S2 10x11x2500…F=t2 1-= p6.36n(n—1)S2 12x9x40021 2否定域为{F>F(9,11)},从表上查得1—-当a=0.005时,F(9,11)=5.54<6.36;1—-当a=0.001时,F(9,11)=8.12>6.36;1—-由此可知,在否定H的前提下,最小显著性水平在0.001到0.005之间。0§7.3检验的实际意义及两类错误(PracticalSignificanceofTestsandTwoTypesError)前面对参数的假设检验的方法进行了较详尽的讨论,但读者可能有不少疑问,如这些检验方法对于相应的问题是不是唯一的方法?若不是唯一的,是不是最优的方法?最优的标准又是什么?检验的优劣与显著性水平-的关系如何?下面我们将研究一下这方面的问题。为了不涉及过多的概念和理论推证,我们的讨论只是较为简略的。一、检验结果的实际意义(Practicalsignificanceofresultsoftests)a)检验的原理是“小概率事件在一次试验中不发生”,以此作为推断的依据,决定是接受H或拒绝H.但是这一原理只是在概率意义下成立,并不是严格成立的,即不能说小概00率事件在一次试验中绝对不可能发生。仍以例7.3来说,尽管按统计推断结论,认为摸球人作弊,但事实上也完全可能没有作弊。试想如果在不作弊的情况下,10次全部摸中绿球绝对不可能的话,那么开设摸奖就没有意义了。因此,当摸奖人事实上的确是未作弊的话,商店的统计推断就犯了错误,关于犯检验的错误我们放到后面再讲。b)在假设检验中,原假设H与备选假设H的地位是不对等的。一般来说-是较小的,01
因而检验推断是“偏向”原假设,而“歧视”备选假设的。因为,通常若要否定原假设,需要有显著性的事实,即小概率事件发生,否则就认为原假设成立。因此在检验中接受H0,并不等于从逻辑上证明了H的成立,只是找不到H不成立的有力证据。在应用中,对同一问00题若提出不同的原假设,甚至可以有完全不同的结论,为了理解这一点,举例如下:Example7.8设总体X~N⑴,),样本均值X=X=0.5,样本容量n=1,取a=0.05,欲检验旦=0,还是旦=1. 1这里有两种提出假设的方法,分别如下:H:旦=0; H:旦=101H:旦=1; H:旦=001如果按一般逻辑论证的想法,当然认为无论怎样提假设,日的最终结果应该是一样的。但事实不然,计算如下: _X—u对于(i)显然应取否定域为V={u>u=1.645},其中u=——=,当H成立时,0.95 o/yn0u~N(0,1),实际算得0500 .、一u=——=0.5<1.645,或X<1.645il接受H,即认为U=0.0对于(ii)应取否定域为V={u<u =—1.645}.此时0.05u=05—1=—0.5>—1.645,或X>—1.645+1111接受H,即认为U=1.0这种矛盾现象可以解释为,试验结果既不否定U=0,也不否定U=1,究竟应认为U=0,还是U=1,就要看你要“保护”谁,即怎样取原假设。这一结果的几何解释如图7-4.在图7-4中,X=0.5既不在N(0,1)密度函数的阴影部分所对应的区间里,也不在N(1,1)密度函数的阴影部分所对应的区间内。所以无论怎样提出H都否定不了。N(K1>0N(K1>图7-4这一事实提醒了我们,在应用中一定要慎重提出原假设,它应该是有一定背景依据的。因为它一经提出,通常在检验中是受到保护的,受保护的程度取决于显著性水平a的大小,a越小,以a为概率的小概率事件就越难发生,H就越难被否定。在实际问题中,这种保护是0必要的,如对一个有传统生产工艺和良好信誉的厂家的商品检验,我们就应该取原假设为产品合格来加以保护,并通过检验来印证,以免因抽样的随机性而轻易否定该厂商品的质量。C)从另一个角度看,既然H是受保护的,则对于H的肯定相对来说是较缺乏说服力的,充其量不过是原假设与试验结果没有明显矛盾;反之,对于H0的否定则是有力的,且a越小,小概率事件越难于发生,一旦发生了,这种否定就越有力,也就越能说明问题。在应用中,如果要用假设检验说明某个结论成立,那么最好设H0为该结论不成立。若通过检验拒
绝了H,则说明该结论的成立是很具有说服力的,如例7.3那样。而且a取得较小,如果仍0拒绝H的话,结论成立的说服力越强。0二、检验中的两类错误(Twotypeserroroftests)前面已说到检验可能犯错误,所谓犯错误就是检验的结论与实际情况不符,这里有两种情况:一是实际情况是H成立,而检验的结果表明H不成立,即拒绝了H,这时称该检0 00验犯了第一类错误(typeIerror)或“弃真”的错误;二是实际情况是H0不成立,H1成立,而检验的结果表明H0成立,即接受了H0,这时称该检验犯了第二类错误(typeIIerror),或称“取伪”的错误。我们来研究一下,对于一个检验,这两类错误有多大。我们知道,一个检验本质上就是一个否定域V,所谓拒绝H0,就是通过构造V的统计量计算,得出样本点落在V内的结论。所以,第一类错误的概率就是在H0成立的条件下V的概率P(VIH).从前几节的具体例子可知,一般地当H形如6=6时,P(VIH)=a.当0 00 0H形如6<6或6>6时,P(VIH)<a.由此可知,显著性水平a也就是检验V犯第一0 00 0类错误的概率。同样,接受H,即是指样本点落在接受域X-V中,因此犯第二类错误的概率是0p=P{X-VIH} (7.9)1当H中包含的参数不止一个时,一般P的具体计算是较困难的。1我们来看一个具体例子,加深对两类错误概念的理解。Example7.9设总体X〜N(从,。2),o02已知,样本容量为n,求对问题H:旦=从; H:旦=从>口0 0 1 10的u检验的两类错误的概率。Solution在此检验中,否定域应为V={u>u}1—aX—u …在H1成立时服其中u=——Q,a为某一显著性水平,易知u在H成立时服从N(0,1),在H1成立时服0从N(凹二匕,Yn,1).于是,犯第一类错误的概率为o0P{VIu=u}=a0犯第二类错误的概率为p=P{X—VIu=u}=P{u<u Iu=u}1 1—a 1u—u—u—u—=P{u—-u o-*n<uo 1—a0U—u-U !o0(7.10)=①u1—aV=①u1—aV-u 0Jno)0其中①(X)为标准正态分布函数。u上述两类错误概率的大小可用图7-5中的阴影面积表示。图中a=F,i=0,1,io/nn
0L=a+u.由图7-5或式(7.10)可以看出,若要第一类错误概率a变小,则u 变大,0 1—a 1—a从而第二类错误的概率P=①(u-出』n))也随之变大。1-a o00图7-5设计一个检验,当然最理想的是犯两类错误的概率都尽可能地小,但由例7.12可以看出,在样本容量n一定的情况下,要使两者都达到最小是不可能的。考虑到H的提出既然是慎重0的,否定它也要比较慎重。因此,在设计检验时,一般采取控制第一类错误的概率在某一显著性水平a内,对于固定的n,使第二类错误尽可能地小,并以此来建立评价检验是否最优的标准。关于这一点我们不准备深入讨论,只强调一点,在7.2节末表中所列出的检验都是某种意义下的最优检验,作为一个实例,可参看习题7.9,这也是对于正态总体参数的检验为什么要采用7.2节所介绍的那些方法的原因。三、样本容量确定问题(Determinateproblemofsamplecapacity)对于固定的样本容量n,若要控制第一类错误的概率a,就不可能使第二类错误的概率P尽可能地小。但另一方面,从(7.10)式可以看出,在例7.12中,如果保持a不变,使n增大,则P=①(u—生二匕)n)减小(注意从>口),当n-8时,pf0.也就是说,1-a o 1 00通过增大样本容量,犯第二类错误的概率可以小于任给的正数。在实际问题中,样本容量是不可能无限制扩大的,因为做试验需要成本,抽样数量太大,既做不起,又没有必要。另一方面,若样本容量太小,又不能使犯两类错误的概率同时都令人满意地小。由此引出这样的问题,即能否确定一个最小的样本容量,使得检验的两类错误概率都在预先控制的范围内?这就是样本容量确定问题。我们讨论两种具体的检验。(一)对于正态总体N
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论