第7章参数假设检验_第1页
第7章参数假设检验_第2页
第7章参数假设检验_第3页
第7章参数假设检验_第4页
第7章参数假设检验_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 参数假设检验假设检验的概念 假设检验(显著性检验):事先对总体参数或总体分布形式作出一个假设,然后利用样本信息判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应接受或否定原假设。 参数检验:已知总体分布,猜出总体的某个参数(假设H0),用一组样本来检验这个假设是否正确(接受或拒绝假设H0) 非参数检验:猜出总体分布(假设H0),用一组样本检验该假设是否正确一、假设检验的基本思想p某企业生产一种零件,过去的大量资料表明,零件的平均长度为4厘米,标准差为0.1厘米。工艺改革后,抽查了100个零件,测得样本的平均长度为3.94厘米。现问:工艺改革前后零件的平均长度是否发生显

2、著变化?p分析:样本平均长度与原平均长度出现差异不外乎二种可能,一是改革后平均长度不变,但由于抽样的随机性使样本平均数与总体平均数存在误差;二是由于工艺条件的变化,使总体平均数发生显著变化。因此可以这样推断,如果样本平均数与总体平均数之间差异不大,未超出抽样误差范围,则认为总体平均数不变;反之,如果样本平均数与总体平均数之间的差异超出抽样误差的范围,则认为总体平均数发生显著变化。一、假设检验的基本思想00/ 20/ 2(0,1),/(1),*/ xNnxZxZnn根据抽样分布定理,如果对总体平均数的假设为真,则给定置信度 时,应有即样本平均数与总体平均 数之差属于抽样误差范 围,反之,样本平均

3、数 与总体平均数之差超过抽样误差范围,说明原假设不正确。因为 很小,这一小概率事件的出现是不合理的,从而有必要怀疑导致这一小概率事件发生的前提假设,即拒绝原假设。一、假设检验的基本思想著变化显革前后零件的长度有了定原假设,推断工艺改居然发生了,因此应否一小概率事件次,而一次抽样中,这生次的重复试验中才会发事件在是小概率事件,这一而于是,则,给定假设本例中,110058. 2/5100/1 . 0495. 3/58. 201. 04,100, 1 . 0,95. 30, 2/02/nxZnxZnx假设检验的特点:假设检验所采用的逻辑推理是反证法,为检验某个假设是否成立,先假定它是正确的,然后根据

4、抽样理论和样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设合理与否的依据是“小概率事件实际不可能发生的原理”。即一次观察中小概率事件发生了,则认为原假设是不合理的;反之,小概率事件没有出现,则认为原假设合理。因此,假设检验的反证法是带有概率性质的反证法,并非严格的逻辑证明.假设检验是基于样本资料进行总体特征的推断,而这种推断是在一定的置信概率下进行。二、假设检验的步骤p1、提出原假设和备择假设p原假设(零假设):正待检验的假设,记为H0 0;备择假设(对立假设):拒绝原假设后可供选择的假设,记为H1 1,p二者必须对立,检验结果二者取其一。p原假设的提出根据所检验问题的具体背

5、景而定,采取“不轻易拒绝原假设”的原则,即把没有充分理由不能轻易否定的命题作为原假设,而相应地把没有把握就不能轻易肯定的命题作为备择假设p假设的三种形式:p(1)双侧检验 H0: 0,H1: 0;p(2)左侧检验 H0: 0,H1: 0二、假设检验的步骤p2、选择适当的统计量,并确定其分布形式n不同的假设检验问题需选用不同的统计量作为检验统计量p3、选择显著性水平,确定临界值n显著性水平表示H0为真时拒绝原假设的概率,即拒绝原假设所冒的风险,假设检验应用小概率事件实际不发生的原理,小概率为,通常取0.1、0.05或0.01n给定,就可以确定接受区域和拒绝区域p4、作出结论n计算检验统计量的具体

6、值,与临界值比较,作出拒绝或接受原假设的结论。三、假设检验的两类错误p当我们依据样本数据,来判断 H H0 0对或不对时,我们可能犯错误。例如,当我们判断H H0 0不对时,就相当于拒绝了H H0 0 ,接受了H H1 1。这时,我们可能犯错误:在H H0 0 成立的情况下,我们却拒绝了H H0 0 。我们把这件事记为:“拒绝H H0 0 | H H0 0是对的”。p我们当然希望犯错误的概率很小,例如,1%,5%之类(记这个概率为),也就是概率P P拒绝H0| H0为真,很小。称这类错误,为很小。称这类错误,为“第一类错误第一类错误”,也就,也就是是“弃真弃真”错误。错误。三、假设检验的两类错

7、误p事实上还可能发生另一类错误:“存伪”错误。p如果我们假设H0是不对的,但计算的结果却接受H0(记为“接收H0| H0为假”),就犯了存伪错误。p当然,我们也希望所犯的“存伪”的错误的概率很小,也就是P接收H0| H0为假 =,很小(通常取5%,或1%)。这种错误,称为第二类错误p习惯上,一般采用“弃真”错误的概率很小的准则四四、一个正态总体下的参数假设检验、一个正态总体下的参数假设检验【总体【总体X服从N(,2)与2的参数假设检验。】p关于正态母体均值关于正态母体均值 的假设检验的假设检验p本节讨论:关于均值的假设检验的如下三种情况:p1)已知已知方差2,假设( 是某个确切的数字),通过样

8、本观察值x1,x2,, xn,检验H0是否成立(使弃真错误弃真错误概率很小,即概率PP拒绝拒绝H H0 0| H| H0 0为真为真 很小)。p2)未知未知方差2,假设,通过样本观察值x1,x2,, xn,检验H0是否成立(使弃真的错误弃真的错误的概率很小,也就是概率PP拒绝拒绝H H0 0| H| H0 0为真为真 很小)。p3)未知未知方差2,假设,通过样本观察值x1,x2,, xn,检验H0是否成立(使弃真的错误弃真的错误的概率很小,也就是概率PP拒绝拒绝H H0 0| H| H0 0为真为真 很小)。1)已知方差2,检验假设 H0 :=0p例1. 已知机器生产出来的零件直径服从正态分布

9、,已知方差2为0.09(毫米2),假设H0:均值=10(毫米)。现在有一组样本观察值:10.01,10.02,10.02,9.99。请判断假设H0是否正确。p首先,应当找出一个的统计量,我们知道当X服从正态分布时,统计量 p 可以由样本算出,所以,z可以算出。分布,服从)10(/)(NnXZx分析思路设,即拒绝原假设。概率事件发生的前提假有必要怀疑导致这一小是不合理的,从而的出现很小,这一小概率事件假设不正确。因为样误差范围,说明原抽与总体平均数之差超过围,反之,样本平均数数之差属于抽样误差范均,样本平均数与总体平即时,应有为真,则给定置信度平均数的假设如果对总体果原假设成立,则根据抽样分布定

10、理,如 /*,/)1 (),1 , 0(/Z2/02/00nZxZnxNnx接受原假设。因此的把握拒绝原假设,围之内,我们没有之差属于误差允许的范体平均数这说明样本平均数与总于是,则,给定假设本例中,95067. 04/3 . 01001.10/96. 105. 010, 4, 3 . 0,01.10, 2/02/ZnxZnx 2.5% 2.5% k k95%查表标准正态分布概率表(0.975所对应的)k = z z0.0250.025 = 1.96注意:一些习惯格式与术语注意:一些习惯格式与术语p习惯格式:原假设原假设(或零假设零假设)H0:=0,p 备择假设备择假设H1:0p若拒绝H0,就

11、相当于备择假设H1(0)可能发生。此时,称为双尾检验双尾检验。p若取=0.05,则z0.025 记为z/2 。 称为显著性水称为显著性水平平,也是犯弃真错误的概率。p当然,也可取=0.01,或其他值(在0与1之间),它反映出犯错误的不同的概率。2)未知方差2,检验假设:=0,p例2. 已知生产出来的零件直径服从正态分布,现有假设H0:均值=10(毫米)。这个假设可以是生产标准所要求的。现在有一组样本观察值:10.01,10.02,10.02,9.99。请判断假设H0是否正确。p同样,先要找出一个统计量,满足pA)已经知其分布和参数。pB)在题目的条件下,可以依据样本,算出这个统计量的值。我们知

12、道统计量 服从t(n-1)分布。它满足上述A、B两个条件:nSx/)(T分析思路设,即拒绝原假设。概率事件发生的前提假有必要怀疑导致这一小是不合理的,从而的出现很小,这一小概率事件假设不正确。因为样误差范围,说明原抽与总体平均数之差超过围,反之,样本平均数数之差属于抽样误差范均,样本平均数与总体平即时,应有为真,则给定置信度平均数的假设如果对总体原假设成立,则果根据抽样分布定理,如 /*,/)1 (),1(/ t 2/02/00nstxtnsxntnsx2.5%2.5% k k 如果k的右边的概率是0.025,就记k为t0.025,于是, P (| T | t0.025 ) = 0.05 如果

13、|t|真的 t0.025了,那么就拒绝拒绝H0,此时,犯“弃真弃真”错误的概率只有0.05p查t(3)表,/2=0.025 所对应的t t0.0250.025,得出t t0.0250.025 =3.1823.182。p 现在,依据题目的条件,可以算出p也就是p |t|=1.4140p同样,先要找出一个已经知分布和参数的统计量,并且,在上述题目的条件下,能够算出这个统计量的值。p选择统计量分布服从)1(/)(ntnSXtp弃真概率PP拒绝拒绝H H0 0,认为,认为0 | |=0为真为真=p它应当很小,那么,就应当有 P ( t t0.05 ) = 0.05p注意:此时的备择假设注意:此时的备择

14、假设H H1 1是是0,也就是应有,也就是应有 1010,由,由t t式式知,这可能会导致知,这可能会导致t t很大,所以,这里仅考虑很大,所以,这里仅考虑t k的概率为的概率为的的式子,这决定了只能从单侧来考虑式子,这决定了只能从单侧来考虑k的取值,也就是单尾检验的取值,也就是单尾检验)p如果t真的大于t0.05了,那么就拒绝拒绝H H0 0,此时,犯错误的概率只有0.05,查t(3)表,=0.05所对应的t t0.050.05,得出2.35342.3534。p现在,依据题目的条件,可以算出x14.140002.04)101.10(/)(nsxtp也就是 t=14.14 t t0.050.0

15、5=2.3534p 所以,拒绝假设H0,接受备择假设备择假设H H1 1,认为,认为0 =10(抗剪强度单位),也就是该用新材料后,抗剪强度提高了。此时犯错误错误的概率为0.05p1)先要找出一个已经知分布和参数已经知分布和参数的统计量统计量,并且,在题目的条件下,能够算出这个统计量算出这个统计量的值。的值。p2)在概率PP拒绝拒绝H H0 0| H| H0 0为真为真=很小的条件下,由查出临界值。进而比较计算出的统计量的值与临界值的大小,判断是拒绝还是接受H H0 0p3)从“原假设与备择假设”,判断是双尾检验还是单尾检验p p值:与查表找临界点的等价判别法值:与查表找临界点的等价判别法p1

16、. 1. 双尾检验的情形双尾检验的情形( (以以T T统计量为例统计量为例) )p此前,通过比较统计值此前,通过比较统计值(如t、z)与临界值与临界值(k)之间的大小关之间的大小关系,来判断拒绝还是接受零假设(系,来判断拒绝还是接受零假设( =0 ?)的。?)的。p其图解是:其图解是: 接受t = 0 即=10的区域k=t0.025=3.1821P(Tt0.025)=0.025t ?p由上图可知:由上图可知:pt tk k(t t0 0的情形)等价于:的情形)等价于:t t的外侧的概率的外侧的概率 /2/2(双(双尾情形)尾情形)pt tk k临界值(即临界值(即t t0.0250.025,参

17、见上图),等价于,参见上图),等价于t t的外侧的概的外侧的概率率 /2 /2(0.0250.025) p总之,在双尾检验的情形下,比较总之,在双尾检验的情形下,比较t t与临界值与临界值k k,与比较,与比较t t的外侧概率的外侧概率1 1P(Tt)P(Tt)和和 /2/2,是等价的。,是等价的。p 据此,我们定义双尾检验情况下统计值据此,我们定义双尾检验情况下统计值t t的的p p值为:统值为:统计值计值t t的的“外侧外侧”概率的两倍。即概率的两倍。即p 双尾检验情况下:双尾检验情况下:t t的的p p值值2 2(1 1P(Tt)P(Tt))p本书把本书把“统计值统计值t t的的p p值

18、值”称为统计值称为统计值t t的显著性概率。的显著性概率。p今后,今后,(SPSS(SPSS就是这样处理的就是这样处理的) )p若若p p ,则表明落在由所决定的分界点的外侧,应当,则表明落在由所决定的分界点的外侧,应当拒绝拒绝H H0 0,接受,接受H H1 1。p若若p p ,则表明落在由所决定的分界点的内侧,应当,则表明落在由所决定的分界点的内侧,应当接受接受H H0 0。p2. 2. 单尾检验的情形单尾检验的情形( (以以T T统计量为例统计量为例) )p在单尾检验的情况下,由于已经先验地得知在单尾检验的情况下,由于已经先验地得知与0的关系( 0 或0 ),因此,只用考虑前面的一半的情

19、形,不用除以2。p在单尾检验的情形下,统计值t的p值1P(Tt) p若若p p ,则表明落在由所决定的分界点的外侧,则表明落在由所决定的分界点的外侧,应当拒绝应当拒绝H H0 0,接受,接受H H1 1。p若若p p ,则表明落在由所决定的分界点的内侧,则表明落在由所决定的分界点的内侧,应当接受应当接受H H0 0。p 这与双尾的情形统一起来了。pSPSS会输出统计值的p值,从此就不用查表了。而且可以。关于正态母体的方差2的检验关于方差的假设检验,分如下两种情况:p1)未知均值,假设H0:总体方差2=20,通过样本观察值x1,x2,, xn,检验H0是否成立(使弃真的概率很小)。p2)未知均值

20、,假设H0:总体方差220,通过样本观察值x1,x2,, xn,检验H0是否成立 (使弃真的概率很小)。p1)未知均值,检验假设H0:总体方差2=20是否成立p 例2.4 已知生产出来的零件直径服从正态分布,长期以来直径的均方差=0.3毫米,现材质改进,抽出20个样本,(为方便,不列出这20个样本的数据,仅给出由这20个样本计算出来的样本方差s2=0.16)。请判断该生产线的方差是否改变。p此时的检验假设可以定为:pH0:总体方差 2 2= 2 20=0.09,H1:总体方差 2 2 2 20。p 同样,先要找出一个已经知分布和参数已经知分布和参数的统计量统计量,并且,在上述题目的条件下,能够

21、算出这个统计量算出这个统计量的值的值。p由第二章,我们知道统计量p显然这个统计量满足上述条件:分布及参数均已知,而且把0.3代入式中的 后,可以用样本值算出统计量的值。p注意到: (n-1)(n-1)关于关于y y轴是不对称的。当轴是不对称的。当 确定后,确定后,若若 S S2大,则大,则 大;若大;若S S2小,则小,则 小。小。)分布(服从1)1(2222nSn222p按照弃真概率很小的思路,有按照弃真概率很小的思路,有p PP拒绝拒绝H H0 0, , 2 20.09,| | 2 2=0.09为真为真=很小p即: P ( /2 ) = /2,p或: P ( 1-/2) = /2p如果代入

22、S2后,上述括号里面的事情发生了,就应当拒绝拒绝H H0 0。否则,就接受H H0 0。p由题目条件,可算出p查表得: 0.025(19)=32.9, 0.975(19)=8.91p现在, =33.7778 0.025(19)=32.9 p所以,拒绝H H0 0,此时,我们有95%的把握拒绝原假设,犯错误的概率只有0.0522227778.3316. 009. 019) 1(2202sn2222p2 2)未知均值)未知均值 ,检验假设,检验假设H H0 0:总体方差:总体方差 2 22 20 0是否成立是否成立p 例2.5 已知生产出来的零件直径服从正态分布,长期以来直长期以来直径的均方差径的

23、均方差 =0.3=0.3毫米,毫米,现材质改进,抽出9个样本,(为方便,不列出这9个样本的数据,给出由这9个样本计算出来的方差s2=0.352)。请判断该生产线的方差是否会小于方差是否会小于0.09。p此问题与例3相似,检验的目标有所不同。p可安排假设如下:pH0:总体方差 2 2 = 2 20 =0.09, (注意,这里H0的安排,采用的是国外一些教材的安排方法,与国内的许多教材不一样)pH1:总体方差 2 20.25),从而断定是否能够聘用。p显然,这是一个单侧检验的问题。 p应聘者答10道题,相当于得到10个样本:X1,X2,, X10。p我们不能用统计量 做检验,因为我们。(仅仅知道其

24、均值与方差)。p但我们,即二项分布B(10,p)B(10,p),并且可以计算出统计量Y的值,可用Y来做假设检验。p注意,Y就是答对题目的个数(因为答错时Xi=0)。p设:设:r r是是Y Y的观察值的观察值。p当答对题目的个数r r大于等于阈值大于等于阈值k k时,就拒绝时,就拒绝H H0 0,认为应答者的p0.25。p此时,概率,即把“p=0.25的人,判断为p0.25的人”的比率,很小。p于是应有:XX=rkkrP的所有大于等于答对的题目数)(p式中,k是拒绝H H0 0的答对的最少题目数。p由二项分布的如下概率公式 ,可得下表:回答正确(正面)的(正面)的次数rP(正面=r)自下而上的累

25、计概率的累计概率00.05631.000010.18770.943720.28160.756030.25030.447440.14600.224150.05840.07810.016270.00310.003580.00040.000490.00000.0000100.00000.0000由此可以看出,取r=6时,由所有大于等于的所有大于等于的r计算出的概率之计算出的概率之和和0.0197=0.05。 rnrpprnrP)1 ()(正面次数一个一个0-10-1总体的大样本比例值的参数检验总体的大样本比例值的参数检验 p例:例:某公司要招聘工程师。出了100道“正误”选择题。问:至少应当答对几道

26、题,才能考虑录取?p总体是0-1分布B(1,p),p0.5。p样本是一个应聘者答100个问题的正误:X1,X2,, X100,p总分Y,服从二项分布二项分布B(100,p)B(100,p)。p像上题那样计算,n100,量太大了,p改用大样本大样本(中中心极限定理心极限定理),完全已知,并且可由样本计算出统计值完全已知,并且可由样本计算出统计值z。所以可用来检验。npppXZ/)1 ( 要求:np10 n(1-p)10Xp于是,我们有假设p H0 :p=0.5=0.5(回答者猜答案,不聘用)p H1:p0.5(回答者依据知识选择答案,聘用)p 这是一个单尾检验(one-tail test)的问题

27、。p若H0成立,则Z应当很小()。,接受H1:回答者与猜答案猜答案有显著差异。p此时,仍然可有犯错误,但。p如果应聘者得了如果应聘者得了6262分分(即 =0.62),则容易算出 z 100/5 . 05 . 05 . 062. 0=2.4,查表,z=2.33,=0.01。z z,所以拒绝H0,在在1%的置信水平上,的置信水平上,62分与分与50分有显著区别,分有显著区别,不是瞎猜的不是瞎猜的,可以及格可以及格。此时,靠瞎猜猜到62分的概率不超过1%。若取=0.0233 ,可以算出60分与50分有显著差别,可及格。 x七、两个正态母体下的参数假设检验七、两个正态母体下的参数假设检验p概述概述p

28、设:获得来自两个母体的相互独立的样本(来自两个母体的相互独立的样本(x x1 1,x x2 2,, x, xn n)与()与(y y1 1,y y2 2,, y, ym m),完成如下4种情况的参数检验问题:p1)未知均值1,2,检验假设H0:总体方差 2 21= 2 22,p2)未知均值1,2,检验备择假设H1: 2 21 2 22p上两种检验,又称为对方差齐性的检验方差齐性的检验。p3)未知方差 2 21, 2 22,但知道知道 2 21= 2 22(称为方差齐性),检验假设H0:1=2 p4)未知方差 2 21, 2 22,但知道知道 2 21 2 22(称为非齐次方差),检验假设H0:

29、1=2 应当是:1), H0成立时, 3)p 1), H0不成立时, 4)p 2)单尾检验,可独立进行。p(关于相互独立的样本的说明见下页)(关于相互独立的样本的说明见下页)相互独立的两组样本相互独立的两组样本p如果两组样本:两组样本:x x1 1,x x2 2,, x, xn n 与与 y y1 1,y y2 2,, y, ym m,可以各自相互独立地颠倒样本的顺序,而不影响检验结果,那么,这两组样本就是相互独立的。p在SPSS的数据存放中,相互独立的两组样本是排在同相互独立的两组样本是排在同一列的一列的。p区别两组样本的标志,是靠另一个变量(分类变量)靠另一个变量(分类变量)。p存放方式,

30、见下图。 值变量值变量 分类变量分类变量 数字数字1 x 数字数字2 x 数字数字n x 数字数字n+1 y 数字数字n+2 y 数字数字n+m y样本存放方式样本存放方式p四种类型的假设检验的要点四种类型的假设检验的要点 p对问题对问题1 1)未知1,2,p由于H0是 2 21= 2 22,F统计量p可简化为p F=SF=S1 12 2 / / S S2 22 2 服从 F ( n-1, m-1) 分布p备择假设H1: 2 21 2 22,这是双尾检验。p注意F分布是非对称的。所以检验分析式为p P F f/2 = /2p PF f = p以下,只要计算出f值,与查表值f比较,就行了。p对问

31、题对问题3 3),已知 2 21= 2 22,要检验:,12,p在在 2 21 1=2 22 2条件下,有条件下,有:p(式中,n是X的样本数,m是Y的样本数)p由于H0是1=2,所以:分布服从)2(/1/1)2/() 1() 1()()(222121mntmnmnSmSnYXTmnmnsmsnyxt/1/1)2/() 1() 1()(2221把计算出来的t值,与t t0.0250.025(若=0.05)比较: 若 | t | t t0.0250.025,则拒绝H0,12, 若 | t | t t0.0250.025,则接受H0:1=2p对问题对问题4 4)已知 2 21 2 22(称为非齐次

32、方差),p要检验H0:1=2 12,p此时,此时,SPSSSPSS使用如下统计量,检验两个正态总体的均值使用如下统计量,检验两个正态总体的均值(见卢纹岱,(见卢纹岱,20002000):):p p把计算出来的t值,与t t0.0250.025(若=0.05)比较:p 若 | t | t t0.0250.025,则拒绝H0,12,p 若 | t | t t0.0250.025,则接受H0:1=2mSnSYXT/)()(22212111p关于两个正态分布总体的参数检验的小结关于两个正态分布总体的参数检验的小结:p 用样本(x x1 1,x x2 2,, x, xn n)与()与(y y1 1,y

33、y2 2,, y, ym m),来检验。p1 1)检验方差()检验方差( 2 21 1=2 22 2),用),用F F统计量(未知统计量(未知 1 1, 2 2)p2 2)检验方差()检验方差( 2 21 1 2 22 2),用),用F F统计量(未知统计量(未知 1 1, 2 2)p F=SF=S1 12 2 / / S S2 22 2 服从 F ( n-1, m-1) 分布p3 3)检验均值)检验均值(是否),用T统计量():p4 4)检验均值)检验均值(是否),用T统计量():分布服从)2(/1/1)2/() 1() 1()()(222121mntmnmnSmSnYXTmSnSYXT/)

34、()(22212111两个T统计量,均不用记忆。p1) 两个任意总体的均值任意总体的均值比较,大样本时,用中心极限定理中心极限定理,化为。问题,应用广泛应用广泛。p2) 例:两台设备两台设备生产的产品的某种性质,p 两种工艺两种工艺的产品某种性能,p 两批原料两批原料生产的产品某种效果,p 两种药品两种药品的疗效,p 两种饲料两种饲料的效果,p 两种治疗方法两种治疗方法的效果,p 两种训练方法两种训练方法的效果,p 两种学习方法两种学习方法的效果,p 两种激励方法两种激励方法的效果,p 两种组织方法两种组织方法的效果,p 两种(税收、投资等)政策两种(税收、投资等)政策的效果等。两个对象,可以

35、一个是before,一个是after;也可以两个同时两个同时,都要求两组样本相互独立相互独立。p3) 有些问题的数据是数据是的(如学生的(如学生2 2门课的成绩)门课的成绩)p 要用来处理:令(此时nm),再用方法,检验检验p 从而,得出的均值有无显著差异。p :p1 1)非配对的数据(样本观察值)的形式与)非配对的数据(样本观察值)的形式与SPSSSPSS中的存放中的存放:p 总体总体1 1:x x1 1,x x2 2,, x, xn np 总体总体2 2:y y1 1,y y2 2, y ym m, p在SPSS中的存放方法,。p2)配对的数据(样本观察值)的形式与配对的数据(样本观察值)

36、的形式与SPSSSPSS中的存放中的存放:p 总体总体1 1:x x1 1,x x2 2,, x, xn np 总体总体2 2:y y1 1,y y2 2, y yn n, p在SPSS中的存放方法,。p值变量值变量 分类变量分类变量p 数字数字1 1 x xp 数字数字2 2 x xp p 数字数字n n x xp 数字数字n+1 n+1 y yp 数字数字n+2 n+2 y yp p 数字数字n+mn+m y y样本存放方式样本存放方式变量变量x 变量变量y x1 y1 x2 y2 xn yn样本存放方式样本存放方式大样本下两个任意总体的均值检验大样本下两个任意总体的均值检验 p大样本下,

37、两个任意总体均值检验问题大样本下,两个任意总体均值检验问题p因为是大样本,所以每个总体的随机样本的均值函数随机样本的均值函数都近似地服从正态分布正态分布。p设两组样本X1,X2,, Xn1,Y1,Y2,, Yn2 的容量n1,n2,足够大,则p所以,在已知两个总体方差已知两个总体方差的情况下,有p p在未知未知两个总体方差情况下,有(Neter, John et al,1993) ),(22212121nnNYX近似服从),(近似服从)()(1022212121NnnYXZ),(近似服从)()(1022212121NnSnSYXZn,T分布N分布p大样本下两个大样本下两个0-10-1总体的比例

38、值(即均值)检验问题总体的比例值(即均值)检验问题p本节所介绍的问题,在管理科学、一般社会科学和相当多的在管理科学、一般社会科学和相当多的自然科学中,有着广泛的应用自然科学中,有着广泛的应用。 p问题:两个总体B(1,p1), B(1,p2),p 两组独立独立样本X1,X2,, Xn1,Y1,Y2,, Yn2 p要求检验H0:p1p2=0, H1:p1p20,p 近似服从N(0,1)。p设X的样本中具有某性质的样本数具有某性质的样本数为r1,Y的样本中具有某性具有某性质的样本数质的样本数为r2。 上式中的p p由由 来估计来估计:21)(1)(12121用求出求出z后后,比较z与z/2,就可以

39、断定拒绝或接受H0。p例:例: 有一个奶酪进口商靠邮寄广告来销售产品。在圣诞节前,进口商设计了两种不同的广告方案(layout),为了想知道方案案1 1是否比方案是否比方案2 2更好更好,该进口商从它的客户名单中随机地抽取了样本进行实验,结果如下:p这是个单尾检验:H0:p1p2=0,H1: p1p20 p由上页公式,可算出=0.24,进而算出z=0.81,取=0.05,差表得z=1.645,显然,z0.05 ,表明t在t t0.0250.025的左边,接受H0 )p解释95%的差值置信区间(差值置信区间( Confidence Interval of the Difference )的上下界

40、:p由上一章第五节,未知总体方差未知总体方差的均值均值的置信区间是:nsntx) 1(2/从第一张表第一张表,可知 =10.01;样本均值的标准差(标准差(Std. Error of sample Mean) =0.00707 ;查表知t0.025(3)=3.1824,于是,可以算出95%的置信区间的下上界为:(9.9875,10.0325),用上述置信区间的端点值端点值欲被检验的总体均值 (=10) ,就得到SPSS中置信区间的新的表达(-0.0125,0.0325)。这就是第二张表格中“95%的差值置信区间”。只要 ns/xp例例已知去年某市小学五年级学生400米的平均成绩是100秒,今年

41、该市测得60个五年级学生的400米成绩,检验该市五年级学生的400米的平均成绩是否有改变?p数据文件“CH6参检1小学生400米v提高?” p此检验的假设是:pH H0 0:该校五年级学生的400米的平均成绩仍为100秒。pH H1 1:该校五年级学生的400米的平均成绩不为100秒。p用SPSS的检验过程是:p点击p从左框中选取要分析的变量,放入右框(Test variables)中。p在右框下方的“Test value” 空格中,填入母体均值假设0值(100秒)p点击右下的Options按钮,选择1-值,如95%,99%等p点击OK,机器给出检验结果p(演示上述点击过程)输出结果输出结果O

42、 On ne e- -S Sa am mp pl le e S St ta at ti is st ti ic cs s60105.385038.820075.01165小学生跑400米的时间NMeanStd.DeviationStd. ErrorMeanOne-Sample TestOne-Sample Test1.07459.2875.3850-4.643315.4133小学生跑400米的时间tdfSig.(2-tailed)MeanDifferenceLowerUpper95% ConfidenceInterval of theDifferenceTest Value = 100p结果说

43、明结果说明1 1:在one-sample test表格中,在sig(2-tailed)名称下的值0.287,是p值。 p0.05,表明统计值t落在t t0.0250.025的左边,应当接受假设H0(该校五年级学生的400米的平均成绩仍为100秒。)。p结果说明结果说明2 2:在one-sample test表格的右端,给出的是差值差值的95%置信区间p同上例,未知总体方差未知总体方差的均值均值的置信区间是:p由One-sample Statistics表, =105.385, =5.0116p而当n45时,t/2 (n-1) 近似于z/2 。可查出z0.025 = 1.96。于是可计算出置信区

44、间的端点为(95.3567,115.4133),从而计算出(减去100秒)差值置信区间为(-4.6433,15.4133) 。p可以看出,只要 。nsntx)1(2/ns/x这里所说这里所说是指,样本是指,样本x x1 1,x x2 2,, x, xn n与与y y1 1,y y2 2,, y, ym m,可以独立颠倒,可以独立颠倒顺序,而不对问题产生影响。例如,调查对象是某单位的职工,一组样顺序,而不对问题产生影响。例如,调查对象是某单位的职工,一组样本是男职工的工资,另一组样本是女职工的工资。你可以任意颠倒职工本是男职工的工资,另一组样本是女职工的工资。你可以任意颠倒职工的顺序,而不对问题

45、产生影响。的顺序,而不对问题产生影响。 p本小节用SPSS处理重点处理如下四类检验问题中的B与C。pA)未知均值,检验两组样本的母体的方差齐性:方差齐性: 2 21= 2 22?pB)在两个正态母体具有方差齐性在两个正态母体具有方差齐性的前提下,检验两组样本的母体的均值均值是否相等是否相等(1=2?)pC)在两个正态母体不具有方差齐性在两个正态母体不具有方差齐性时,检验两组样本的母体的均值是否均值是否相等相等。pD)作为A)的延伸,检验 2 21 2 22?即单尾检验问题。相互独立的两组样本的相互独立的两组样本的T T检验(检验(Independent-Sample T testIndepen

46、dent-Sample T test)p在检验两组样本的均值是否相同时,所用的用的T T统计量,统计量,因两组样本是否具有方差齐性,而不同因两组样本是否具有方差齐性,而不同。p因此,在做均值检验前,要先做方差齐性检验。pSPSS 对方差齐性方差齐性的检验,所使用的仍然是F统计量p F=S12 / S22 服从 F ( n-1, m-1) 分布pSPSS把这个检验称为Levene检验(Levene test for Equality of variance)。p例例用两种激励方法(A与B),对同样工种的A、B两个两个班组进行激励(每个班组7个人。当然两个班组的人数可以不同),测得激励后业绩增长(

47、%),见数据文件“CH6CH7独立检验激励实验齐” (注注意独立样本在意独立样本在SPSSSPSS中的存放方式中的存放方式)。问:两种激励方法的平均激励效果,有无显著差异?p读入数据后,p1)点击 。系统弹出一个窗口,。p2)从左框变量名中选出“激励效果激励效果”变量,用箭头,放入右边Test Variables框中p3)从左框变量名中选出“激励方法激励方法”变量,用箭头放入右边Grouping框中。此时,该框下面的Define GroupsDefine Groups按钮被激活按钮被激活。p4)点击Define Groups按钮,机器弹出一个小对话框。要求输入两个组的变量值。对于本例的性别而言

48、,可把“0”输入group1,把“1”输入group2。p对对Define GroupsDefine Groups对话框的进一步说明对话框的进一步说明:如果分组变量如果分组变量是个连续变量,机器弹出的窗口与本例弹出的窗口不是个连续变量,机器弹出的窗口与本例弹出的窗口不同,在同,在group1group1与与group2group2之下,还有一个选项(之下,还有一个选项(cut cut pointpoint),要求你输入一个分界值),要求你输入一个分界值( (适合于把连续变量分为两组,一组是临界值,一组是临界值) )。p5)点击Continue,返回主窗口。p6)点击Options按钮,在弹出对

49、话框中,你可选择1-值,如95%,99%等。p7)点击OK,则机器输出结果输出结果:输出结果:G Gr ro ou up p S St ta at ti is st ti ic cs s717.0143.63095.23848716.5143.50474.19077AB两种激励方法A法B法两法的激励效果(业绩增长%)NMeanStd.DeviationStd. ErrorMeanI In nd de ep pe en nd de en nt t S Sa am mp pl le es s T Te es st t.121.7341.63712.128.5000.30539 -.16540 1.

50、165401.637 11.448.129.5000.30539 -.16897 1.16897Equal variancesassumedEqual variancesnot assumed两法的激励效果(业绩增长%)FSig.Levenes Test forEquality ofVariancestdfSig.(2-tailed)MeanDifferenceStd. ErrorDifference LowerUpper95% ConfidenceInterval of theDifferencet-test for Equality of Means输出结果说明:输出结果说明:p 注意注意

51、:首先,从“Independent sample test”表(第2张表)中数字可知,F检验(Levene检验)表明方差齐性成立(f的显著性概率p= 0.7340.05),两种激励方法的效果的方差没有明显差方差没有明显差异异。p 所以,观察检验的值,应当用上面一行应当用上面一行的结果(Equal variance assumed)。此时,t统计量的显著性(双尾)概率p=0.1280.05,即 t假设检验( =0=0)通过,两种激励方法的平均效果没有明显差异。xy例题p某证券公司从某城市某区的营业点抽样调查得到散户股民的卖出、买进和投资的有关数据,问不同文化程度的股民的证券投资额、证券市场外的收

52、入和入市年份有无显著差异?(P175)配对样本的配对样本的T T检验(检验(Paired-sample T testPaired-sample T test) p这里所说配对样本配对样本是指,样本样本x x1 1,x x2 2,, x, xn n与与y y1 1,y y2 2,, , y yn n,独立颠倒顺序。如果独立颠倒,就会改变问题独立颠倒顺序。如果独立颠倒,就会改变问题的性质的性质。例如,用两套问卷测量20个管理人员的素质,两套问卷的满分都是200分。两套问卷的测量结果x x1 1,x x2 2,, , x xn n与与y y1 1,y y2 2,, y, yn n,就不能独立颠倒顺序。因每一个被测量的人都有两个分值( x xi i与与y yi i )。如果独立地颠倒其中任何一组样本的顺序,则被测人的一个分值就被改变了。p例例: :用两套问卷测量20个管理人员的素质,两套问卷的满分都 是 2 0 0 分 。 两 套 问 卷 的 测 量 结 果 见 数 据 文 件“CH4CH6CH7配对问卷实验差值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论