




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计估计假设检作者:日期:第五章统计估计和假设检验统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统 计推断。统计推断包括两大部分:一是统计估计,二是假设检验。统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验;另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布, 而不对参数作检验,这称作
2、非参数的假设检验。非参数检验将在第六章进行讨论,本章着重讨论参数检验。第一节点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量(x1,x2, ,xn)来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然 会有误差产生。这种误差就称为抽样误差。极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。现根
3、据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?记A = "抽取15件产品,只有一件是次品”,设抽得正品用 X=0,抽得次品用X=1来表示。 抽样结果只有 X=0与X=1两种情形,于是,可得事件A发生的概率为:P(A尸其中:是这批产品的次品率。,一 一、一.14若次品率=0.1 ,贝U P(A尸 0.9 X 0.1=0.0229 .14若次品率=0.4,则 P(A尸 0.6 X 0.4=0.0003。现在事件A既然在一次观察中就发生了,直观地我们可以认为事件 A发生的概率P(A)不会小,故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。由于0.0229>0.
4、0003,故应选择0.1作为产品的次品率比选择 0.4更可靠些。把上例推广到一般的情形,我们就可以得到极大似然法的一般原理。设X1,X2, ,Xn是取自密度函数为f(x,)的总体的一组样本。其中:x和都为参数,待估计。的极大似然估计的基本思路是,若记A = "一次观察中,所得一组样本的样本值为(x1,x2, ,xn )”。现在在一次观察中A发生了,即P(A)应尽可能地大,即应在所有可能取值的集合中选出一个使P(A)达到最大值的作为的估计值。此时的又称为的极大似然估计值。由于x1,x2, ,xn相互独立,且都与X具有相同的分布,由此可以得到,P(A)就相当于事件:X1 x1,X2 x2
5、, ,Xn xn同时发生的概率,也就是 P(A尸,记为L(尸L(),于是有:L(尸L()称为 的似然函数。求极大似然值的问题就是求似然函数L()的最大值问题,根据微分学的结果,L()取到最大值的必要条件是它对的导数为零。因为 ln L()与L()取得极大值 的 点相同,为计算方便,我们通常就用对数似然方程来求解最大似然估计值。在我们上述例子中,f(1,)= , f(0,)=1- ,于是得到似然函数:15,八14L(尸 f Xi ,1i 1人 dLc o 1令=0,舍去?=1,得 的最大似然估计值 ? 一 二0.067。d151实际上,? 一正是在15次抽样中得到一次次品的频率,用频率估计概率,
6、当n充分大时15无疑是合理的。例5-2。从一个正态总体中抽取容量为 n的样本,求总体参数及 2的极大似然估计。解:构造似然函数nXi1 exp '2In L nln 2 n In2Xi80为了求和,使1n的极大,令解上述方程得到:所以得到和的极大似然估计量为:S221 2? X, ? 一 xi X n、估计量好坏的评选标准前面讨论了如何利用极大似然法来求参数的估计量。但对于同一个参数可以用不同的方法来求其估计量,于是,在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理 论问题。那么,什么样的估计量是好的估计量呢。这就有一个如何对估计进行评价的问题。请 看下面一个例子。例5-
7、3。假如某一建设单位购进了一批建筑用的线材,就需要了解这批线材的平均抗拉强 度是多少。现在要通过抽样,选择样本的某个函数(统计量)来推断总体指标值。由于随机原 因,每次抽取样本的测量结果是不同的。如果样本容量为3,抽取4组样本,测得结果如表 5-1所示。表5-1一组抽样样本的观察值样本顺序样本值均值X1X319009991011970299510501105106531010941890947495091011401000为了说明的方便起见,我们假定,实际上科 =1000公斤,当然这在事先是不知道的。我们 要求利用样本信息来推断总体指标,并使其误差最小。第一组样本的中位数最接近总体指标, 第二
8、组样本是最小值最接近总体指标,第三组样本是最大值最接近总体指标,第四组样本是均值刚好等于总体指标。于是就产生了一个问题,在大量的实验中,究竟采用哪一个指标来推断 总体指标更合理呢?评价点估计的结果通常有无偏性、有效性和一致性等标准。1 .无偏性无偏性的含义是个别样本由于随机原因可能偏大或偏小,然而一个好的估计量从平均上看应该等于所估计的那个指标,其直观意义是估计量的值应在参数的真值周围摆动而无系统误 差。一般地,无偏性的定义为:设为被估计参数,若有估计量 (x1,x2, ,xn ),对一切n,有E ?=,则称?为 的无偏估计量。若E ? - =b,则称b为估计量 ?的偏差。若bw0,则称?为
9、的有偏估计量。如果 lin b 0 ,则称?为 的渐近无偏估计量。 n不论是重复抽样或不重复抽样,也不论样本容量大小,样本均值及样本比例都是总体均值伊 P,但样本方差S22 .并不是总体方差2的无偏和总体比例的无偏估计,即 E X , E 估计量。这是因为如果我们把 S2定义为-2xi xE Snxi1enxi1enXixixi2nEnE x产生偏差的原因是总体方差的无偏估计应该是xi2一,但抽样时由于科是未知的,因而用估计量x来代替。根据最小平方原理,变量X距样本均值x的离差平方和为最小,因此-2xix就小于xix代替科计算的方差就低估了2,为了得到 2这时,由于S2xi x2-就是 2的无
10、偏估计了。样本方差与一 2 .Sn之差称为偏差。但当 n很大时0,所以它是渐近无偏差估计。当样的无偏估计,令xiS2本容量很大时, 较大了。n也可以直接用样本方差作为总体方差的估计值。但如样本容量较小时偏差就比图5-1 估计的无偏性和有效性2 .有效性即使是符合无偏性要求的估计统计量,在抽取个别样本时也会产生误差。为了使误差尽量地小,要求估计量围绕其真值的变动愈小愈好,也就是说要求统计量的离散程度要小,或者说其方差要小。一般地,有效性的定义为:设、是未知参数的两个估计量,若对任意的正常数c,有,则称比有效。有效性反映了估计量分布的集中程度,估计量的分布越是集中在参数真值附近,则其估计效率越高,
11、如图 5-1所示。但是为了方便起见,在实际上有效性可定义为:、是未知参数的两个无偏估计量,若用V(), V()分别表示各自的方差,若 V()/V()<1 ,则称比有效。例如,对正态总体,利用样本均值X及样本中位数M来估计总体的均值时,均为无偏估计, 那末哪一个更有效呢?_2均值的抽样分布为xN ,,统计上可以证明中位数的分布为 ,n2_M N ,由于。这就说明比有效,即用样本均值7来估计总体的均值比用中位数c , 2n来估计总体的均值效率高。换句话说,用中位数来估计总体均值的平均误差要比用样本均值来 估计总体均值时的更大。如果用中位数作为估计量要达到与以样本均值作为估计量同样可靠的 程度
12、,就要增加样本。设用均值估计的样本为n1,中位数估计的样本为 n2 ,设其估计效率相等,即方差相等,则2/2/ ,由此得到n2=1.57 n1,即用中位数估计时要比用样本ni. 2n221均值来估计时多抽57%的样本单位。3. 一致性这就是要使统计量随样本容量 n的增加,不断趋近于总体指标。在n-8 (有限总体n- N)时,估计值与总体参数完全一致。一般地,点估计的一致性定义如下:设(Xi,X2, ,Xn )为未知参数的估计量,若依概率收敛于,则为的一致估计量。现在来看样本均值这一统计量是否符合一致性的要求。根据切比雪夫等式:当时一致性是从极限意义上来说明统计量与总体参数关系的。这种性质只有当
13、样本容量很大时才起作用。另外,符合一致性的统计量也不止一个,因此,仅考虑一致性是不够的。事实上, 我们也可以证明,当总体为正态分布时,中位数这一统计量也符合一致性的要求。而样本的最小值和最大值尽管在个别的抽样中可能取得好的效果,但从总体上来看并不是一个好的估计 量。第二节区间估计一、区间估计的概念和步骤点估计用一个确定的值去估计未知的参数,具有较大的风险。因为估计量来自于一个随机抽取的样本,结果也就带有随机性。 样本估计量刚好等于所估计的总体参数的可能性极小。但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。这种
14、方法就是区间估计法。在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧又范围内的概率是0.683,落在总体均值 2 x范围内的概率是0.955,落在总体均值31范围内的概率是0.997等等。由此可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。我们把这种对总体均值的估计称作区间估计。从上述说明可以看到:1 .如果所估计的区间越大,参数被包含在该区间内的概率就越大。2 .如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。一般地,设为总体的一个未知参数,分别为由一组样本所确定的对的两个估计量,对于给定的01,若P()=1,
15、则称区间口为置信度是1 的置信区间。分别为置信区间的下限和上限。1称为置信度或置信概率,表示区间估计的可靠度。称为置信度水平。常用的置信度有0.80, 0.90, 0.95 0.99等。一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。置信度反过来也表示可能犯错误的概率。如置信度为 95%,则犯错误的概率就为 1-95%=5%。这一概率也就是置信度 水平,也可理解为风险率或风险水平。图5-2 根据不同样本所得到的置信度为95.5%的置信区间需要指出的是,P()=1不应理解为落在某一固定区间的概率。因为这里是一个参数,而不是随机变量,而是根据抽
16、样的结果计算出来的,因此,口是一个随机区间。即每一个样本都可产生一个估计区间 口,因此,上述概率1可以理解为随机区间口中包括参数的概率。图5-2表示根据不同样本所得到的置信度为95.5%的置信区间与总体均值的位置关系。从所有样本得到的置信区间中有95.5%的区间将包括总体均值,因此可以说所得到的估计区间包括总体均值具有95.5%的置信度。、单个总体参数的区间估计(一)正态总体,方差已知,总体均值的区间估计 安据第四章关于样本均值分布的结果,有xN(0, 1)n若样本的均值为x,同在给定了估计置信度为1 时,我们有我们可以根据这一原理用样本均值来推断总体均值的区间估计值。时若规定置信度为1,则总
17、体均值的区间估计的公式是这一置信区间的估计可以用图5-3来表示。上述估计公式仅适用于无限总体的情形,对于有限总体的不放回抽样来说,如果总体规模为N,样本大小为n,则区间估计的公式中还需要乘上一个修正系数J-一n 。因此,总体均-N 1值的区间估计的公式就变为图5-3置信度为1的置信区间从上述说明中我们可以总结出对于正态总体,方差已知,总体均值的区间估计的步骤如下:1 .计算出样本的统计量并确定该统计量的抽样分布。例如,若总体是正态的,那么样本 均值也必然服从正态分布。2 .根据研究的目的确定置信度或置信度水平大小。按照要求的置信度或置信度水平查出相应的系数Z /2 。3.计算样本均方差,即抽样
18、的标准误x4 .最后把上述数据代入公式,得到区间估计的结果。其实,这些步骤也同样适用于其他类型的区间估计问题。(二)非正态总体,方差未知,大样本,总体均值的区间估计实际中所遇到的总体, 往往不一定服从正态分布, 而且总体方差也是未知的。 在这种情况 下要推断总体均值, 就要借助于中心极限定理, 这需要抽取足够大的样本。 这样样本均值仍服 从正态分布。此时尽管总体方差未知,但当样本足够大时,一般当 n 30时,我们可用样本 标准差来代替总体标准差,直接把 S弋入上式中的 就可以了。(三)正态总体、方差未知,用小样本对总体均值的区间估计在总体方差未知的情况下,如果抽取的样本n 30就必须采用其他的
19、估计办法。我们已知服从t分布,其自由度为n-1。因此我们就可以利用t分布来进行估计。此时s/2,nst/2 ,nsx t /2 1n与前面同样地,上述估计公式仅适用于无限总体的情形,对于有限总体来说,如果总体规模为N,样本大小为n,不放回抽样的情形,则区间估计公式中也还需要乘上一个修正系数,N 1(四)总体比例的区间估计根据第四章关于样本比例 p分布的结果,我们有- -P 1-Pp N P,n若样本的比例为 p,同时规定估计的置信度为 1,则总体比例的区间估计的公式就是P P Z /2P(1 P) P p Z/2 nP本身,而p又恰恰是待估于是对于给定的置信度1,我们可以利用2分布的特性,查表
20、得到2/2 n 1 和21/221/2 n1 S222/2 n 1于是总体方差2的区间估计为这里有一个问题,就是在确定总体比例的置信区间时要用到值。但由点估计理论我彳门知道,样本比例p是总体比例P的无偏估计,于是在估计样本比例的方差P1 P时,直接用样本比例 p代替总体比例P。只要样本容量n足够大,并且满足np和 nn 1 p都大于5就可以保证结果是可靠的。最后,得到总体比例的置信区间为:P p Z /2P(1 P)P P Z/2 , P1 P 1nn当然对于有限总体不放回抽样的情形,也同样需要乘上一个修正系数(五)正态总体方差的区间估计在第四章关于 2分布的结果中我们介绍过,来自正态总体的一
21、组样本的方差和总体方差 之比服从于 2分布,即n 1 S222n 1n 1 S2n 1 S22/2 n 1三、两个总体参数的区间估计(一)两总体均值之差的区间估计1 .两个正态总体,方差已知,大样本从两个总体中所抽取的样本都是大样本, 差也服从正态分布。此时并且两个总体的方差已知时,则两个样本均值之E x12X1 X2n2因此,X1X2 N 1212 ,n1由此可以得到,在置信度水平为122on2的情况下,X1 X2 Z /2 .22-一,X1n2X2Z /212的置信区间为22n1n22 .两正态总体,方差未知,但相等,大样本两个样本都为大样本时, 两样本均值之差也服从正态分布, 由于假设两
22、总体方差相等, 但 未知,需要根据样本方差进行估计。由于样本方差具有随机性,一般地S12 S2 ,因此,合并推算总体方差222 _ n。n2s2合一,所以,2合n1“两个样本均值之差的抽样分布的方差为2/22合 11n1s1n2s22S1n2n1n2n1n22n1于是,对两总体均值之差估计的置信区间为X1 X2 Z /222.s2s1 , X n1n21X2Z/2,n12S1 on23 .两正态总体,方差未知但相等,小样本根据上一章的结果,总体方差未知时,我们用样本的方差代替总体的方差,由于小样本,相应的统计量不再服从正态分布而服从t分布。由于 22 ,则如大样本时一样,应将两个样本合并起来代
23、替总体方差。即222 n1 1 §n21s2S春n1 n2 2其自由度为n1 n2 2 ,则两总体差的区间估计结果为XiX2t /2s1V n, ni2$合,XiX2n2t /2 n21111X1 X2 t /2 2 2 F 1 n1 1,n21合, X1 X2 t /2 s合 J 一n n2 n n2(二)两总体比例之差的区间估计根据两个样本比例之差的抽样分布,两个样本比例之差的均值为两个总体比例之差。两个样本比例之差的方差为2p1qP2q2P1 P2 n1n2当两个比例的样本容量为大样本时,两个比例之差也服从正态分布,所以当置信度为1时,两总体比例之差 P P2的置信区间为:rP
24、1q1 P2q2r : p1q P2q2P1 P2 Z /2,,P1 P2 Z /2 JV n n2n n1n2(三)两正态总体方差比的区间估计根据第四章所介绍的 F分布的结果,来自于两个正态分布总体的总体方差和样本方差和, 和所构成的统计量故对于给定的置信度水平,我们可以从F分布表查得置信区间的临界值:和从而 P F1 2 n11,n2 1F Fn11,n2 1于是PS12S221F 2 n11,n212122S12S21F1 2 n1 1,n21最后我们得到的置信度为1-的置信区间为S;12S2Fn11,n2 1S121第三节样本容量的确定在区间估计中我们发现,对于某一个总体的参数进行估计
25、时,在样本数目一定的条件下,要提高估计结果的可靠性,就需要扩大置信区间,这就要增加估计中的误差,减少了估计的实 际意义。如果要减少估计的误差,就要缩短置信区间,但这样就必须要降低估计的可靠性。可 见在样本数目一定的条件下,估计的精确性和估计的可靠性不能两全其美。既要提高估计的精确性,减少误差,又要提高估计可靠性的办法就是增加样本容量。但是增加样本就要同时增加抽样调查的成本,同时又可能延误时间。因此就需要研究能够满足对估计的可靠性和精确性要 求的最小样本数问题。一、均值估计问题中,样本大小的决定在总体均值的估计问题中,要决定必要的样本大小,必须先明确如下三个问题:1 .要规定允许的估计误差的大小
26、,即允许的估计值与实际值之间的最大偏离值是多少, 实际上也就是估计区间的大小,2 .规定置信度,即估计所要求达到的可靠性,也就是实际的抽样误差不超过所规定的误 差的可信度。3.要明确总体的标准差,即要求了解总体的分布情况。总体的标准差小,只要抽较少的样本就能满足对估计精确度和可靠性的要求,若总体标准差大,就必须抽取较多的样本才能达到对估计精确度和可靠性的要求。设总体标准差为,样本均值的标准差为-o估计的置信度为1,于是可以相应地得到置信系数。于是对总体均值的估计可由下式得到:上式中的实际上就表示估计所允许的最大误差,我们用A表示,于是根据上式有Z /2查表得到相应的,1 的要求的最由此只要规定
27、了允许误差的大小A和总体的标准差%由置信度1代入公式,求得满足要求的最小整数就是满足估计误差不大于A和置信度为 少样本数。但对于有限总体不放回抽样的上述公式适用于重复抽样或无限总体不放回抽样时的情形。 情形,公式变为如下的形式:Nn/2 ,n , N1由此可求得满足上式要求的最小的整数为 其中:A为允许最大误差,为有限总体的个体数,为置信度水平,为根据置信度水平查表得到的置信系数。二、比例估计问题中,样本大小的决定关于总体比例的估计问题中, 要决定样本大小首先也要明确关于均值的估计问题中同样的 三个问题:1 .允许误差的大小,即规定估计值与实际值的最大偏离值。2 .规定置信度,即估计所要求达到
28、的可信度。3 .对总体比例的事先估计值,即大致的或估计的总体比例是多少。与均值的估计问题完全平行地,我们可以得到以下的结果。对于重复抽样或无限总体不重复(放回)抽样时的情形为但对于有限总体不放回抽样的情形,公式变为如下的形式:第四节假设检验一、假设检验的基本原理假设总体的均值为某一个值,为了检验这一假设的正确性,我们收集样本的数据,计算出 假设值与样本均值之间的差异,然后根据差异的大小来判断所作假设的正确性,这就是假设检验。直观地,我们知道差异越小,对于总体均值的假设正确的可能性就愈大。差异越大,对总 体均值的假设正确的可能性就愈小。然而在多数情况下,对总体参数的假设值与样本统计量之间的差异既
29、不至于大到显而易 见,应该拒绝假设,也不至于小到可以完全肯定,应该接受假设的程度。于是就不能简单地决 定接受或拒绝所作的假设,而需要判断所作的假设在多大的程度上是正确的。于是就需要研究假设和判断假设是否正确的程度。(一)假设检验中的假设假设检验中通常把所要检验的假设称作原假设或零假设,记作H0。例如要检验总体均值科二100这个假设是否正确,就表示为Ho:科=100。如果样本所提供的信息无法证明原假设成立, 则我们就拒绝原假设。此时,我们只能接受另外备选的假设了,称之为备择假设,我们以H1表示备择假设。备择假设可以有三种形式,例如,在原假设H0:科=100的条件下,备择假设可以Hi:科100。这
30、表示备择假设是总体的均值不等于100。或者是Hi:科100。这表示备择假设是总体的均值大于100。或者是H:科100。这表示备择假设是总体的均值小于100。上述备择假设的选择与检验的要求是密切相关的。我们根据假设检验的目的要求不同又把假设检验分为双侧检验和单侧检验。如果样本均值高于或低于假设的总体均值很显著时都拒绝原假设,我们称作双侧检验。在双侧检验时有左右两个拒绝区域。当原假设是:H。:科二100,备择假设是:H1:W100时就必须使用双侧检验。若只有在样本的均值高于 (或低于)假设的总体均值很显著时才拒绝原假设,这就称作单侧检验。单侧检验只有一个拒绝区域。若假设检验只有在样本均值高于假设的
31、总体均值很显著 时才拒绝原假设,这种假设检验称作右侧检验。此时,原假设实际上变为H0:科100,备择假设为H1*100。反之,如果只有在样本均值低于假设的总体均值很显著时才拒绝原假设, 则称作左侧检验。此时,原假设实际上变为H0:科100,备择假设为H1:科100。由此可见,原假设和备择假设总是排他性的。(二)检验的显著性水平假设检验需要确定一个是接受还是拒绝原假设的标准,这个标准就是显著性水平。所谓检验的显著性水平就表示,在假设正确的条件下落在某个界限以外的样本均值所占的百分比。具体地说,“在5%的显著性水平下检验假设 ”就是说,假定对总体参数所作的假设正确,那么 样本均值同假设的总体均值差
32、异过大的,在每100个样本中不应超过5个。如果样本均值与总体均值差异过大的超过这一数目就认为这个样本不可能抽自所假设的总体,所以拒绝零假设。我们可以用图5-4来直观地解释假设检验的原理。假如设检验的显著性水平=5%,我们已知在概率密度曲线下包括在假设的均值两侧直线间的面积是95%,两边每一个尾端的面积各为2.5%。于是若样本的均值落在 95%的区域内,我们就认为样本统计量与假设的总体参数 的差异是不显著的。结果就接受原假设。若样本统计量落在左右尾端的各为2.5%的区域内,则差异就是显著的。我们就拒绝原假设。接受备择假设。图5-4假设检验的接受区域和拒绝区域不过应该强调指出,在假设检验中“接受原
33、假设”的意思仅仅是意味着没有充分的统计证 据拒绝原假设。在假设检验中“接受原假设”的特定含义就是不拒绝原假设。但实际上,即使 样本统计量落在 95%的面积内,也并不能证明原假设就是正确的。因为只有在知道了总体参 数的真实值与假设值完全相同才能证明假设正确。但我们无法知道总体参数的真实值。在给定了检验的显著性水平后,我们可以根据假设来确定接受还是拒绝原假设的区域或范围。如果样本均值落在某一区域内我们就接受原假设,则就称这一区域为接受区域。如果样本均值落在某一区域内就拒绝原假设,我们就称这一区域为拒绝区域。对于显著性水平的选择没有一个唯一的或通用的标准。实际上在任何显著性水平下检验某个假设都是可能
34、的,但是必须注意不管选择什么样的显著性水平,都存在假设为真而被拒绝的可能性。另一方面,在检验同一个假设时,使用的显著性水平愈高,原假设为真时而被拒绝的 概率也就愈高。这就需要研究假设检验中的错误,我们在以后将对此进行讨论。二、假设检验的步骤1 .提出原假设Ho和备择假设Hi。原假设和备择假设必须由题意来决定。在一般情况下 总是把检验的目的作为备择假设,这样可以有充分的把握拒绝原假设。2 .选择检验的显著性水平,从而确定检验的拒绝区域或临界点。表示在假设检验时当原 假设为真而我们却拒绝了原假设,接受备择假设的错误概率。假设检验中还可能犯另一种错误, 这将在下面讨论。3 .确定样本的统计量和分布。
35、样本统计量又称检验统计量。不同的统计量具有不同的分 布,用于检验不同的假设,要根据所检验的假设来正确地选择检验统计量。4 .计算检验统计量并由此作出决策。根据样本数据计算出检验统计量的值,如果统计量 的值落在拒绝区(包括临界点)内就说明原假设与样本所反映的情形有显著的差异,应该拒绝原假设。如果统计量的值落在接受区域内,就说明原假设与样本所反映的情形的差异并不显著, 应该接受原假设。三、几种常用的假设检验(一)平均数的假设检验1 .双侧检验让我们研究下面的例子。例5-4。某食品厂规定某种罐头每罐的标准重量是500克。多年的经验表明这个厂每罐重量的标准差是15克。今随机抽取了 49个罐头,发现这些
36、罐头的平均重量是506克。问在=0.05的显著性水平下能否认为这批罐头的重量符合标准的要求?要检验这批罐头的重量是否符合标准的要求就是要检验这批样本的平均重量与标准重量之间是否具有明显的差别。因此可以列出要检验的假设为:H。:科=500H1:科 500。这是一个双侧检验问题。根据区间估计的结论可知原假设的接受区域为Z /2 , Z /2 nn由于置信度水平=0.05, Z /2=1.96。由此得到接受区域为495.8, 504.2。但现在样本的 实际均值为506,落在拒绝区域内,因此拒绝原假设接受备择假设。我们无法认为这批罐头的 重量符合标准的要求,即这批罐头的重量不符合标准的要求。当总体方差
37、未知,样本数量又小于等于30时,检验统计量样本均值服从t分布。这就要用t分布确定原假设的接受区域和拒绝区域了。在得到接受区域后也就可以利用上面同样的方法, 根据样本均值所处的位置作出判断。2 .单侧检验再看下面的例子。例5-5。某饮料厂规定某种纸罐包装饮料的容量不得少于500ml。今随机抽取了 25个纸罐,发现这些罐头的平均重量是498 ml ,标准差S=10o问在=0.05的显著性水平下能否认为这批纸罐的容重符合标准的要求?根据问题的要求可以列出要检验的假设为:H0:科 500H1:科 <500由于总体方差未知,样本容量又小于30,检验统计量服从t分布,其自由度为n-1o因此我们就必须
38、利用t分布来进行检验。这又是一个单侧(左侧)检验问题。根据区间估计的结论可 知原假设的接受区域为st n 1 ,)n根据置信度水平=0.05,查表得到t0.05 25 11.711。所以计算得到接受区域的临界点是496.6。现样本均值=498>496.6。可见样本均值落在原假设的接受区域内。我们接受原假设, 即认为这批纸罐的容重符合标准的要求。例5-6。某特种建材生产厂规定某种规格新型墙体材料的重量不得大于500公斤。今随机抽取了 16块这种规格新型墙体材料,测得其平均重量为 50册斤,标准差S=10。问在=0.05的显著 性水平下能否认为这批新型墙体材料的重量符合标准的要求?这次要检验
39、的假设为:H0:科 500H1:科 >500这次也需要利用t分布来进行检验。这是一个右侧检验问题。原假设的接受区域为s(,t n 1,、n根据置信度水平=0.05,查表得到t0.05 16 11.753。由此可以得到原假设的接受区域临界点是504.4。现样本均值=505>504.4。可见样本均值落在原假设的拒绝区域内。我们拒绝原假设,接受备择假设,即认为这批新型墙体材料的重量不符合标准的要求。(二)比例的假设检验例5-7。某酒厂规定某种酒中含有的糖度应为12%产品才能算合格。今随机抽取了100瓶这种酒,发现平均的糖度为 11.3%。问在显著性水平=0.10的条件下,这批酒与合格产品
40、对糖度 的要求有无明显的差别?问题要检验的假设为:H。: =0.12Hi:科 0.12这是比例的双侧检验问题。根据区间估计的结果,原假设的接受区域是P(1 P),P Z/2 n由于=0.10,则Z /2=1.64。计算得到原假设的接受区域是 0.114, 0.126。由于样本比例 0.113<0.114,落在原假设的拒绝区域内。 我们拒绝原假设,接受备择假设,即认为这批酒与合 格产品对糖度的要求有明显的差别。对于比例问题也同样可以进行单侧的假设检验。方法也几乎与总体均值的单侧检验的情形相同。此外,参照两个总体区间估计的情形,我们也可以对两个总体均值和比例差进行假设检验,所用的方法几乎是完
41、全同样的。四、假设检验中的两类错误假设检验是根据概率来进行判断的,因此有可能判断失误。 在三种不同显著性水平下,例如=0.01, 0.10,或0.50时,进行假设检验所得到的结果就可能是完全不同的。对于同一组样 本的均值的位置,在 =0.01和0.10的显著性水平下可能是接受零假设的,而在 =0.50的显著性 水平下拒绝零假设。可见,采用高的显著性水平不大可能接受一个不正确的零假设,但却很可能拒绝掉正确的零假设。在假设检验中,如果原假设正确而被拒绝时,就称为犯了第一类错误,这是弃真的错误, 犯第一类错误的概率记作。相反,如果原假设错误而被接受时,称作犯了第二类错误,这是取 伪的错误,犯第二类错误的概率记作。表 5-3表示了两者之间的关系。这两种错误是互相替补 的,这就是说,在样本容量一定的情况下,要减少第一类错误的概率就不得不增加发生第二类错误的概率,反过来也一样。实际上,为了减少第一类错误的概率就要增大接受区域,减少拒 绝区域。但此时由于接受区域的增大,不正确的原假设也被接受的概率也随之增大,即增加了,如图5-4所示。要减少接受不正确的原假设的概率,就要减少的值,此时不正确的零假设被接 受的概率减少了,但随着拒绝区域的增大,正确的零假设被拒绝的概率就上升,即增大了,如 图5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 4公民的基本权利和义务 第一课时 公民的基本权利 教学设计 -2024-2025学年道德与法治六年级上册统编版
- 江苏省昆山市锦溪中学八年级信息技术上册 16 制作基本动画教学实录1 苏教版
- 校本教研个人计划10篇
- 2024华为数据与机器视觉关系
- 第一单元 品景物之美感四季芳华-2024-2025学年七年级语文上册阅读综合实践教学设计(统编版2024)
- 22小毛虫教学设计-2023-2024学年二年级下册语文统编版
- 房地产交易知识
- 22《书戴嵩画牛》(教学设计)2024-2025学年六年级上册语文统编版
- 2023七年级英语上册 Unit 7 How much are these socks第5课时教学实录(新版)人教新目标版
- 2024-2025年高中化学 第1章 第3节 第1课时 烃的概述 烷烃的化学性质教学实录 鲁科版选修5
- 2025年安徽省滁州市凤阳县部分事业单位招聘历年自考难、易点模拟试卷(共500题附带答案详解)
- 2025年辽宁省交通高等专科学校单招职业适应性测试题库必考题
- 2024年临港新片区文员招聘笔试真题
- 2024年食品微生物检验技术试题库及答案(含各题型)
- 2025广东深圳证券信息有限公司人员招聘笔试参考题库附带答案详解
- 合金污水管施工方案
- 统编历史七年级下册(2024版)第8课-北宋的政治【课件】j
- 历史人物孙中山介绍完整版课件
- 2024春苏教版《亮点给力大试卷》 数学一年级下册(全册有答案)
- 小学生认识货币-ppt课件
- 胸腔积液.ppt1
评论
0/150
提交评论