统计学第六章 假设检验_第1页
统计学第六章 假设检验_第2页
统计学第六章 假设检验_第3页
统计学第六章 假设检验_第4页
统计学第六章 假设检验_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章假设检验第一节假设检验的基本概念第二节单个总体参数的假设检验第三节两个总体参数的假设检验第四届非参数检验教学目的与要求:1.掌握假设检验的相关概念及思路和步骤;2.掌握单个总体的假设检验方法;3.了解两个总体假设检验方法;4.了解非参数检验的特点和方法。第一节假设检验概述一、假设检验的基本概念(一)、假设检验与区间参数估计的区别和联系1、联系:参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断。2、区别:推断的角度不同,区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。(二)、假设检验的两大类别:一类是参数假设检验,另一类是非参数假设检验。本章分别讨论这两类检验方法。

大数定理表明:就大量观察而言,事件的发生具有一定的规律性。根据概率的大小,人们处理的态度和方式很不一样。在日常生活中,人们往往习惯于把概率很小的事件,当作一次观察中是极不可能看到的事件。例如,人们出门做事就有可能遇到不测事故,但却很少人因此而不敢出门。原因是:小概率事件极不可能发生。(三)小概率原理

小概率原理:即指概率很小的事件在一次试验中实际上不可能出现。这种事件称为“实际不可能事件”。

统计检验的依据是小概率原理:一是认为小概率事件在一次观察中是极少出现的;二是如果在一次观察中出现了小概率事件,那么应该否定原有事件具有小概率的说法或者假设。二、单侧检验与双侧检验(一)、双侧检验α/21–αα/2-Zα/2

Zα/2双侧检验双侧检验中拒绝域位于正态分布的两边上,对于提出的,只要或二者之中有一个成立,就可以否定原假设,这种假设有两个拒绝域、两个临界值,每个拒绝域的面积为α/2,临界值为-Zα/2、Zα/2。(二)单侧检验1、左单侧检验(下限检验)2、右单侧检验(上限检验)

α–Zα0

α0Zα左侧检验右侧检验假定:–Zα为临界值

假定Zα为临界值(三)、用单侧检验还是双侧检验,使用左侧检验还是右侧检验,决定于备选假设中的不等式形式与方向。与“不相等”对应的是双侧检验,与“小于”相对应的是左侧检验,与“大于”相对应的是右侧检验。三、两种类型的错误

1、决策结果存在四种情形:

接受拒绝真实判断正确弃真错误(第一类错误或α错误)

不真实取伪错误(第二类错误或β错误)

判断正确

在统计检验中,无论是拒绝或者接受原假设,都不可能做到百分之百的正确,都有一定的错误。1)、第一类错误:原假设是真实的,判断结论是拒绝原假设,这种错误叫着“弃真错误”,在原假设为真的情况下,检验统计量刚好落入小概率的拒绝区域,使我们拒绝原假设,因此犯第一类错误的概率大小等于显著性水平α,我们可通过控制显著性水平大小的方式来控制犯弃真错误的概率。在统计学上把第一类错误也叫着α错误。2)、第二类错误:原假设不真实,结论是接受原假设,这种错误叫着“取伪错误”,犯第二类错误的概率记为,因此,在统计学上称第二类错误为错误。3)、不管我们如何选择否定域,都不可能完全避免第一类错误和第二类错误,也不可能同时把犯两类错误的危险压缩到最小。对任何一个给定的检验而言,犯第一类错误的危险越小,犯第二类错误的概率就越大;反之亦然。一般来讲,不可能具体估计出第二类错误的概率值。第一类错误则不然,犯第一类错误的概率是否定域内各种结果的概率之和。2、两类错误及其关系四、检验功效1、检验功效或检验力:在犯第一类错误的概率α得到控制的条件下,犯取伪错误的概率β也要尽可能地小,或者说,不取伪的概率1-β应尽可能增大。1-β越大,意味着当原假设不真实时,检验判断出原假设不真实的概率越大,检验的判别能力就越好;1-β越小,意味着当原假设不真实时,检验结论判断出原假设不真实的概率越小,检验的判别能力就越差。可见1-β是反映统计检验判别能力大小的重要标志,我们称之为检验功效或检验力。2、影响检验功效的因素1)、α取值:α大,检验功效就大(1-β)2)、要满足α、β都尽可能的小,只有增加样本的容量,但样本容量都是有限的,因此在实际应用中会先控制α

原因如下:A、遵循统一原则,讨论问题较方便。

B、原假设清晰,备选假设模糊,,对于一个模糊的假设和一个清晰地假设,我们更关心原假设为真时,我们却把它放弃了的可能性有多大。

3)、原假设与备选假设的差异程度,差异明显,则β减少,检验功效就大。五、值 值是指在原假设为真的情况下,得到某一样本观察结果或更为极端情形出现的概率。如果值很小,说明小概率事件发生了,从而有理由拒绝原假设,值愈小则拒绝的理由愈充分。与根据检验统计量是否落入拒绝域的方法相比,利用值检验要更精确。在前一种方法中,在显著性水平确定后,拒绝域也就确定了,如果检验统计量落入拒绝域,我们犯弃真的错误就是,而不管得到这一样本观察结果或更为极端情形出现的概率大小,根据这一方法的做出决策对决策错误的风险反映不够。而值在决策风险度量上要更为精确。在应用中,通常先确定一个显著性水平,然后用值与比较,在双侧检验中,时拒绝原假设,在单侧检验中,

时拒绝原假设。(1)建立假设(2)确定统计量(4)计算检验统计量(3)选择显著性水平和否定域(5)判定所所包有

含统的计步检骤验

根据以往多年的统计表明,上海财大英语的平均成绩为90分,随机抽取100个学生,其平均成绩为80分,问今年财大学生的英语成绩是否下降?六、假设检验的步骤(5个)1.建立假设

1)、原假设(nullhypothesis):需要通过样本去推断其正确与否的命题称为原假设。用表示,即:2)、备选假设(alternativehypothesis):与原假设对立的是假设,备选假设是在原假设被否定时另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出现的结论作为备选假设。用表示,备选假设与原假设相对立,原假设成立,则备选假设不真实,如原假设不真实,则备选假设成立。关于均值,原假设与备选假设有三种情况:

双侧检验左侧检验右侧检验2、确定适当的检验统计量确定适当的统计量,且能在原假设成立的条件下知其分布。一般来说,检验统计量的基本形式可表示如下:

3、选择显著性水平和否定域被我们事先选定的可以犯第一类错误的概率,叫做检验的显著性水平(用α表示),它决定了否定域的大小。因此,有人也把第一类错误称之α错误。相应地第二类错误被人称为错误。在原假设成立的条件下,统计检验中所规定的小概率标准一般取为α=0.05或α=0.01。由α所决定的否定域与接受域之间的分界值被称为临界值,如Zα。4.计算检验统计量

在完成了上述工作之后,接下来就是做一次与理想试验尽量相同的实际抽样(比如实际做一次重复抛掷硬币的试验),并从获取的样本资料算出检验统计量。根据显著性水平确定统计量的否定域或临界值,并注意是单侧检验还是双侧检验。5.判定

假设检验系指拒绝或保留原假设的判断,又称显著性检验。在选择否定域并计算检验统计量之后,我们完成最后一道手续,即根据计算结果决定假设的取与舍。如果结果落在否定域内,我们将在已知犯第一类错误概率的条件下,否定零假设。反之,如果结果落在否定域外,则不否定零假设,与此同时,我们就有了犯第二类错误的危险。

第二节单个总体参数的假设检验

一、总体均值检验1、提出原假设和备选假设(有三种情况)双侧检验左侧检验右侧检验2、确定统计量3、确定显著性水平及拒绝域

(一)、总体σ已知,对总体均值的检验1)、确定显著性水平α

2)、双侧检验时,拒绝域为Z<-Zα/2或Z>Zα/2,即在

Z<-Zα/2或Z>Zα/2时拒绝原假设,接受备选假设,反

之接受原假设,拒绝备选假设。如Z=Zα/2或Z=-Zα/2

为了慎重,一般先不下结论,应再进行一次抽检。

3)、单侧检验时,左单侧检验时,拒绝域为Z<–Zα,即

Z<–Zα时拒绝原假设,接受备选假设;右单侧检验

时,拒绝域为Z>Zα,即Z>Zα时,拒绝原假设,接

受备选假设

4、计算统计量z的值

5、根据统计量的值与临界值的关系,进行判定是接受原假设还是拒绝备选假设1、根据长期经验和资料的分析,某砖瓦厂生产的砖的“抗断强度”服从正态分布,方差为1.21。从该厂产品中随机抽取6块,测得抗断强度如下(单位:KG/):32.5629.6631.6430.0031.8731.03

检验这批砖的平均抗断强度为32.50是否成立?(α=0.05)2、某厂生产一种产品,原月产量服从平均值为u=75,方差为14的正态分布,设备更新后,为了考察产量是否提高,抽查了6个月产量,求得平均产量为78,假定方差不变,问在显著性水平α=0.05下,设备更新后的月产量是否有显著性提高?3、某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1000小时。已知灯泡燃烧寿命服从正态分布,标准差为200小时。在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应购买这批灯泡?(二)、总体σ未知,对总体均值的检验总体方差未知时,可用样本标准差与方差代替它们,检验统计量应改为自由度为N-1的T分布,即:称为t-检验统计量,这个检验统计量适用于小样本情况,在大样本场合,t统计量与标准正态分布统计量近似,通常用z检验代替t检验。另T检验的步骤与z检验的步骤相同。1、提出原假设和备选假设(有三种情况)双侧检验左侧检验右侧检验2、确定统计量3、确定显著性水平及拒绝域

1)、确定显著性水平α2)、双侧检验时,拒绝域为t<-tα/2或t>tα/2,即在t<-tα/2或t>tα/2时拒绝原假设,接受备选假设,反之接受原假设,拒绝备选假设。3)、单侧检验时,左单侧检验时,拒绝域为t<–tα,即t<–tα时拒绝原假设,接受备选假设;右单侧检验时,拒绝域为t>tα,即t>tα时,拒绝原假设,接受备选假设

4、计算统计量z的值

5、根据统计量的值与临界值的关系,进行判定是接受原假设还是拒绝备选假设

练习:某机器制造的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试分别以0.05、0.01的显著性水平检验机器性能良好(即机器厚薄符合规定的假设)二、总体成数的检验当样本容量较大时,下列统计量服从标准正态分布:

上式中,ρ代表总体的成数,p代表样本的成数。以上的z统计量可以用作总体成数检验的检验统计量。检验的步骤和总体均值的检验步骤相同。练习:一项调查结果表明某市老年人口比重为14.7%,该市老年人口研究会为了检验该项调查是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上,调查结果是否支持该市老年人口比重为14.7%的看法?(显著性水平为0.05)三、p-值检验1、定义:p-值检验就是通过计算p-值,再将它与显著性水平α作比较,决定拒绝还是接受原假设。所谓p-值就是拒绝原假设所需的最低显著性水平。2、p-值判断的原则是:如果p-值小于给定的显著性水平α,则拒绝原假设;否则,接受原假设。或者,更直观来说就是:如果p-值很小,拒绝原假设,p-值很大,接受原假设。请大家注意的是这里的p-值是指概率,不要与成数指标相混淆。3、z检验的p-值:步骤1、2(作出假设、构造检验统计量)同

Z检验)步骤3:计算样本统计量步骤4:检验统计量为z统计量的p-值计算公式,表示检验统计量的抽样数据,则p-值的计算方法如下:如果:,p-值=2 如果:,p-值= 如果:,p-值=步骤五:作出决策,如果p-值>显著性水平,接受原假设,反之拒绝原假设。4、t检验的p-值与z检验类同。四、总体方差检验原假设为:

或或1.总体均值未知时假设~,但总体均值未知,此时可用样本方差与的比来构造检验统计量,在原假设为真时,统计量表达式为:~

当采用双侧检验时,若或则拒绝,反之接受;当进行右侧检验时,时拒绝,反之接受;当进行左侧检验时,时拒绝,反之接受。2、总体均值已知时假设~,则从总体中抽得的样本满足~在原假设为真时,可以构造统计量:~进而可以确定拒绝域。当采用双侧检验时,或时拒绝,反之接受;当进行右侧检验时,时拒绝,反之接受;当进行左侧检验时,时拒绝,反之接受。第三节两个总体参数假设检验一、两个总体均值之差的检验原假设(或)1.已知时由于~,~,且相互独立,所以有:~~

所以可用Z检验统计量来检验原假设成立与否。2.未知时 当未知但样本量较大时,依然可以使用Z统计量进行检验,此时总体分别用样本方差代替,公式如下:~

当未知且样本量较小时,则不能用代替的统计量来检验,此时需要使用t统计量。更具体了又可以分为两种情况,一种是根据以往的大量经验或者事先通过检验知道有,另一种是不相等或无法判断它们是否相等。我们先讨论第一种情况,此时可以得到的标准差的估计,,其中,于是可以构造检验统计量~

对于第二种情况,需要用来估计,可以得到,我们仍然通过构造t统计量来进行检验~

其中,

注意,此时统计量的自由度已不再是,而是近似服从自由度为的分布。二、两个总体比例之差的检验

实际中经常要检验两个总体中具有某一特征单位数的比例之差是否满足某一条件。此时需要用到两个总体比例之差的检验。设两个总体都服从二项分布,两个总体中具有某一特征单位数的比例分别为。从两个总体中分别抽出样本容量为的两个样本,样本比例分别用表示。1.检验两个总体比例之差为零的假设设所要检验的问题的原假设为:(或、)在原假设成立时,可以得到两个样本合并后得到的比例估计量,其中分别表示两个样本中具有该特征的单位数。在大样本条件下,可以构造统计量进行检验~2.检验两个总体比例之差不为零的假设设所要检验的问题的原假设为(或、)其中为不等于零的常数。在大样本条件下,依旧构造Z统计量进行检验,但此时Z统计量的形式稍有变化。

~三、两个总体方差比的检验两总体方差是否相等的检验又称为方差齐性检验。实际中常常需要对两个总体方差是否相等进行检验,比如比较两种资产的波动,比较生产工艺的稳定性,等等。在前面介绍的方差未知且小样本的两总体均值之差检验中,曾假定两总体的方差相等或不相等。而实际中往往需要通过方差齐性检验才能知道两总体的方差是否相等。四、配对样本的检验在实际中,经常会碰到检验两个相关样本或配对样本的平均数间是否有显著差异的问题,比如检验一组肥胖者参加减肥训练班后体重是否有明显的变化,车间工人在培训前后生产效率是否有明显的差异,等等。对于这类两个样本之间存在相关性的问题,采用匹配样本的检验,可以提高效率。这里通过一个例子介绍配对样本的均值之差的检验[例6-13]某工厂为工人组织了一次技术培训,为检验这次培训是否有效果,随机抽取了10名工人进行调查,测得他们的培训前后每小时平均生产零件数,如表6-2所示。第三节非参数检验非参数检验是对总体的分布不作任何限制的统计检验。故非参数检验又称为自由分布检验。非参数检验,无需做出经典统计所必要的关于分布的任何假设。唯一需要的假设是:全部数据或数据对都出自相同的基本总体,且取样是随机的、相互独立的。基于这种原因,非参数检验又称为分布自由(或无分布)检验。“无分布”不是指总体真的无分布,而是指虽有时对总体分布一无所知,但仍可以进行分析。不仅如此,这些很容易理解的方法还可以用于处理等级的资料和定性的信息。正因为如此,非参数检验成为管理科学中应用较为广泛的一种统计检验方法。

一、自由分布检验概述1、自由分布检验概念:又称为非参数检验,对总体分布未加限制的检验。2、自由分布检验对比参数检验,具有以下优点:首先,检验条件比较宽松,适应性强。其次,自由分布检验的方法比较灵活,用途广泛。对于那些不能进行加、减、乘、除运算的定类数据与定序数据,可使用符号检验、秩和检验等方法进行检验。再次,自由分布检验的计算相对简单。由于自由分布的检验方法不用复杂计算,一般使用计数方法就可以了,它的计数过程与结果都比较简单、直观与明显。3、自由分布检验缺点由于它对原始数据中包含的信息利用得不够充分,检验的功效相对较弱。当总体的分布形式已知时,基于这种分布类型的参数方法,一般说来比非参数方法为佳。例如,对于一批资料,可同时适用于参数的t-检验、非参数的符秩检验和符号检验。其检验功效是,t-检验的最好,符秩检验次之,符号检验最差。这主要是由于符号检验对信息的利用最不充分。二、符号检验(最简单的检验)该方法是建立在以正、负号表示样本数据与假设参数值差异关系基础上的,因此称之为符号检验。该方法既适用于单样本场合,也适用于配对样本场合。(一)单样本场合的符号检验中位数检验:

:=A样本每个数据都减去A,只记录其差数的符号。n+与n-分别是正、负符号的个数,当原假设为真是时,n+与n-应该很接近;若两者相差太远,就有有理由拒绝原假设。例4:设有20个工人,他们一天生产的产品件数,抽样结果如下:168,163,160,172,162,168,152,153,167,165,164,142,173,166,160,165,171,186,167,170。试以α=0.10的检验水平,判定总体中位数是否是160。解:第一步:作出假设。:=160,:160由备选假设知,这个检验是双侧的。第二步:计数。对样本数据,大于160的记下“+”,小于160的记下“-”,等于160的,予以剔除(以0记之),结果如下:++0+++--+++-++0+++++计数以上“+”的个数是n+=15,“-”的个数n-=3,剔除数据2个。最后有效的样本个数为n=n++n-=18。第三步:确定拒绝域。显著水平α=0.10,由于进行双侧检验,拒绝域分布在两边,每侧概率α/2=0.05,查二项分布临界值表,得到拒绝域的临界值是13。第四步:选择n+、n-较大者,再与临界值比较。结果是15>13。第五步:判断。由于上一步的比较结果可知,样本落入拒绝域,所以拒绝原假设,认为样本数据不能证明总体中位数等于160件。(二)配对样本场合的符号检验样本配对场合与单样本场合的符号检验,基本原理是一致的。设从两个总体中分别抽出一个容量相等的样本,然后将两样本的数据进行一一配对,得到一组配对值。再将各对配对值相减,记录下差数的符号,计算出“+”的个数n+与“-”的个数n-。如果两个样本的总体差异不显著,配对值之差的正负号出现的概率各是1/2,则n+与n-应当非常接近;如果n+、n-相差太大的话,说明两总体存在显著差异。例子见书上的。三、秩和检验秩和检验也称Wilcoxon-Man-Whitney检验。该检验方法可用于检验两个独立的样本是否来自同一个总体,或判断总体间是否存在显著性的差异。它和符号检验最主要的区别是,符号检验只考虑样本间差数的符号,而秩和检验还要考虑差数的顺序,比符号检验利用数据信息更加充分,因此,检验功效就更强。秩和检验原理:1、设分别从两个未知的总体独立、随机地抽取容量为n1和n2的样本,把样本容量较小的总体称为总体Ⅰ。如果两样本容量相等,就把任意一个总体称作总体Ⅰ,另一个总体称作总体Ⅱ,这里不妨设n1<n2。2、现将两个样本混合起来,并按数据的大小,从小到大排列编号,每个数值的编号就是它的秩次。如果混合样本中有若干个相同的数值,则把它们的秩次进行简单算术平均,用此平均值作为这些数值的秩次,计算来自总体Ⅰ的n1个数据在混合样本中的秩次之和,记为T。3、显然T最小的可能值是:T1=1+2+3+…+n1=[n1(n1+1)]/2;最大的可能值是T2=(n2+1)+(n2+2)+…+(n2+n1)=n1[(n2+1)+(n2+n1)]/2。如果两个总体分布无显著差异,则T值不应太大或太小,等于中间值(T1+T2)/2;如果总体Ⅰ分布于总体Ⅱ的右边,T将接近其最大值T2;如果总体Ⅰ位于总体Ⅱ的左边,T将接近于它的最小值T1。因此,我们可以用秩和T作为检验的统计量。4、第一种方法,当n1和n2都不超过10时,查“秩和检验表”确定临界值;第二种方法,当n1和n2都超过10时,秩和T服从正态分布:先对T进行标准化变换,再利用标准正态分布表,确定检验的临界值。练习:有A、B两家厂商供应同一种商品,两家商品价格与性能一致,但使用寿命是否一致有待检验。今分别从两家生产产品中抽出样本,测定产品使用寿命(见下表,单位:小时):试以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论