




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章假设检验宋沈超假设检验在统计方法中的地位统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验参数估计和假设检验参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法。假设检验讨论的是用样本信息去检验对总体参数的某种假设是否成立的程序和方法。教学内容第一节 假设检验基本思想第二节 假设检验基本步骤第三节 I型错误与II型错误第四节 单侧检验与双侧检验第五节 假设检验需要注意的问题第六节 假设检验与区间估计的联系 教学目标掌握:假设检验的基本思想和基本步骤,掌握并理解I型错误与I
2、I型错误、检验效能的概念熟悉:假设检验需要注意的问题,单侧检验与双侧检验的概念和正确选择;理解假设检验与区间估计的联系。 第一节 假设检验基本思想一、 假设检验问题的提出例例1 已知一个暗箱中有已知一个暗箱中有100个白色与黑色个白色与黑色球,不知各有多少个。现有人猜测其中有球,不知各有多少个。现有人猜测其中有95个白色球,是否能相信他的猜测呢?个白色球,是否能相信他的猜测呢? 他相当于提出假设他相当于提出假设: p=P(A)=0.05,A=任取一球是黑球任取一球是黑球. 可有两种解释:可有两种解释: 现随机从中抽出一个球现随机从中抽出一个球, 发现是黑球发现是黑球, 怎样怎样解释这一事实?解
3、释这一事实? 1)他的猜测是正确的他的猜测是正确的, ,恰抽得黑球是随机性恰抽得黑球是随机性所致;所致;2)他的猜测错了他的猜测错了. .应接受哪一种呢?应接受哪一种呢? 根据根据小概率事件原理小概率事件原理, , 事件事件A(黑球)(黑球)的发的发生不能不使人们怀疑他的猜测生不能不使人们怀疑他的猜测, ,更更倾向于倾向于认为箱认为箱中白球个数不是中白球个数不是95个个. . 例2 某医院用新药与常规药物治疗婴幼儿贫血,将20名贫血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量(g/L)见表7-1。问新药与常规药的疗效有无差别? 表7-1 两种药物治疗婴幼儿贫血结果治疗药物 血红蛋
4、白增加量(g/L)新药组24 36 25 14 26 34 23 20 15 19常规药组14 18 20 15 22 24 21 25 27 23 由于事先对两种药品疗效(总体)情况一无所知,目前所关心的问题是如何根据两组样本患者治疗后血红蛋白增加量推断两种药品的疗效有无差异。可假设两组患者(总体)治疗后血红蛋白平均增加量无差异,即假设然后,利用两组样本患者治疗后血红蛋白平均增加量来检验这一假设是否正确。21 例3:根据1989年的统计资料,某地女性新生儿的平均体重为3190克。1990年从该地女性新生儿中随机抽取30人,测得其平均体重为3210克。从样本数据看,1990年女新生儿体重比19
5、89年略高。究竟是否存在显著差异?差异产生的两种可能(假设):随机误差导致的差异:生活水平提高使孕妇营养状况改善导致新生儿体重实质性增加:利用样本信息检验假设能否成立的过程称为假设检验。2121 上述案例的共同特点是:样本统计量与总体参数之间,或不同组样本统计量之间出现差异,这就提出了需要解决的问题:差异产生的原因(假设)?由两种误差导致: 由随机误差导致样本来自同一总体, 非本质差异 不是随机误差导致样本来自另一总体, 本质差异用样本信息检验(推断)上述假设哪个正确?统计假设统计假设2121假设检验假设检验 如何正确区分这两种误差,如何正确区分这两种误差,是解决问题的关键。是解决问题的关键。
6、假设检验就是处理这一类假设检验就是处理这一类问题的一种科学方法问题的一种科学方法它所根据的原理是它所根据的原理是小概率原理小概率原理。二、小概率原理假设检验所依据的基本原理是小概率原理。什么是小概率?q概率是01之间的一个数,因此小概率就是接近0的一个数,一般指概率在0.05以下的事件。q著名的英国统计家Ronald Fisher 把20分之1作为标准,也就是0.05,从此0.05或比0.05小的概率都被认为是小概率。Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的什么是小概率原理?小概率原理发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。在一次
7、试验中小概率事件一旦发生,我们就有理由拒绝原假设。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。检验中使用的小概率由研究者在检验前事先确定。小概率原理举例:某工厂质检部门规定该厂产品次品率不超过4方能出厂。今从1000件产品中抽出10件,经检验有4件次品,问这批产品是否能出厂? 如果假设这批产品的次品率P4,则可计算事件“抽10件产品有4件次品”的
8、出现概率为: 可见,概率是相当小的,1万次实验中可能出现4次,然而概率如此小的事件,在一次实验中居然发生了,这是不合理的,而不合理的根源在于假设这批产品次品率P4 ,因而认为假设次品率P4是不能成立的,故按质检部门的规定,这批产品不能出厂。00042. 0)04. 01 ()04. 0()4(6441010 CP又例又例 某医生测量了某医生测量了36名从事铅作业男性工名从事铅作业男性工人的血红蛋白含量,算得其均数为人的血红蛋白含量,算得其均数为130.83g/L,标准差为标准差为25.74g/L。问从事铅作业工人的血红。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值蛋白是否不同于正常成
9、年男性平均值140g/L?如果从事铅作业不会影响工人的血红蛋白如果从事铅作业不会影响工人的血红蛋白含量,则说明样本均数含量,则说明样本均数130.83g/L与总体均数与总体均数140g/L的差异是由抽样误差引起的,即的差异是由抽样误差引起的,即 = 0=140g/L,铅作业男性工人的平均血红蛋,铅作业男性工人的平均血红蛋白含量与正常成年男性的相等。白含量与正常成年男性的相等。 据此,可提出原假设:H0: = 0=140g/L若原假设成立,事件 应该是一个小概率事件(发生的概率为)。现在 |2.138| t0.05/2,35=2.030 P , ,不拒绝 H0若p-值 /2 /2, 不拒绝 H0
10、若p /2 /2 -值 /2 /2, 拒绝 H0假设检验结论的表述1.假设检验的目的就在于试图找到拒绝原假设的理由,而不在于证明什么是正确的2.拒绝原假设时结论是清楚的例如,H0: =3190,拒绝H0时,我们可以说31903.当不拒绝原假设时并非肯定原假设含义是 “不否定原假设” 或 “保留原假设”例如,当不拒绝H0: =3190,我们并未说它就是3190,但也未说它不是3190。我们只能说样本提供的证据还不足以推翻原假设假设检验结论的表述1.报告结果时,首先须给出检验统计量,如U值、t值、自由度、P值,然后报告是否拒绝H0,最后结合问题的具体背景给出专业结论。2.拒绝原假设时,表述为“差异
11、有统计学意义”,简称“有统计学意义”。3.不拒绝H0时,表述为“差异无统计学意义”,简称“无统计学意义”第三节 I型错误与II型错误(决策风险) 根据假设检验做出判断无非下述四种情况:1 1、原假设真实,、原假设真实, 并接受原假设,判断正确;并接受原假设,判断正确;2 2、原假设不真实,且拒绝原假设,判断正确;、原假设不真实,且拒绝原假设,判断正确;3 3、原假设真实,、原假设真实, 但拒绝原假设,判断错误;但拒绝原假设,判断错误;4 4、原假设不真实,却接受原假设,判断错误。、原假设不真实,却接受原假设,判断错误。 假设检验的两类错误假设检验是依据样本提供的信息进行判断,有犯错误的可能。所
12、犯错误有两种类型:第一类错误是原假设H0为真时,检验结果把它当成不真而拒绝了。犯这种错误的概率用表示,也称作错误(error)或弃真错误。第二类错误是原假设H0不为真时,检验结果把它当成真而接受了。犯这种错误的概率用表示,也称作错误(error)或取伪错误。假设检验的两类错误正确决策和犯错误的概率可以归纳为下表:假设检验中各种可能结果的概率接受H0拒绝H0,接受H1H0 为真1-1-(正确决策)(正确决策)(弃真错误)(弃真错误)H0 为伪(取伪错误)(取伪错误)1-1-(正确决策)(正确决策) 假设检验两类错误关系的图示以单侧上限检验为例,设H0 :XX0 ,H1:XX0从上图可以看出,如果
13、临界值沿水平方向右移,从上图可以看出,如果临界值沿水平方向右移,将变小而将变小而变大,即若变大,即若减小减小错误,就会增大犯错误,就会增大犯错误的机会;如果临界值沿水平方向左移,错误的机会;如果临界值沿水平方向左移,将变大而将变大而变小,即若减小变小,即若减小错误,也会增大犯错误,也会增大犯错误的机会。错误的机会。图图(a) X X0H0为真为真图图(b) X X1 X0H0为伪为伪 错误和 错误的关系你不能同时减你不能同时减少两类错误少两类错误!在样本容量n一定的情况下,假设检验不能同时做到犯和两类错误的概率都很小。若减小错误,就会增大犯错误的机会;若减小错误,也会增大犯错误的机会。要使和同
14、时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。两类错误的控制准则 假设检验中人们普遍执行同一准则:首先控制弃真错误(错误)。假设检验的基本法则以为显著性水平就体现了这一原则。 两个理由:统计推断中大家都遵循统一的准则,讨论问题会比较方便。更重要的是: 原假设常常是明确的,而备择假设往往是模糊的。如H0: X X0很清楚, 而H1: X X0则不太清楚,是 X X0还是 X X0 ?大多少小多少都不清楚。对含义清晰的数量标准进行检验更容易被接受。因此,第一类错误成为控制两类错
15、误的重点。第四节 单侧检验与双侧检验根据假设的形式不同,假设检验可以分为双侧假设检验(two-tailed test) 和单侧假设检验(one-tailed test)。若原假设是总体参数等于某一数值,如H0: X X0 ,即备择假设H1: X X 0,那么只要 X X 0和 X X 0 二者中有一个成立,就可以否定原假设。这种假设检验称为双侧检验。 双侧检验示意图(显著性水平与拒绝域 ) /2 若原假设是总体参数大于等于或小于等于某一数值,如H0: X X 0 (即H1: X X0);或H0 : X X0 (即H1: X X0),那么对于前者当 X X0时,对于后者当 X X0 时,可以否定
16、原假设。这种假设检验称为单侧检验。可以分为左侧检验和右侧检验。 单侧检验有一个临界值,一个拒绝域,拒绝域的面积为。分为左侧检验和右侧检验两种情况。 左侧检验示意图(显著性水平与拒绝域) 右侧检验示意图(显著性水平与拒绝域 ) 双侧检验与单侧检验 (假设的形式)假设研究的问题(总体均值检验)双侧检验左侧检验右侧检验H0 X X= X X0 0 X X X X 0 0 X X X X 0 0H1 X X X X 0 0 X X X X 0 0第五节 假设检验需要注意的问题 1.要有严密的研究设计要有严密的研究设计 组间应均衡,具有可比性组间应均衡,具有可比性。除对比的主要。除对比的主要因素因素(如
17、临床试验用新药和对照药如临床试验用新药和对照药)外,其它外,其它可能影响结果的因素可能影响结果的因素(如年龄、性别、病程、如年龄、性别、病程、病情轻重等病情轻重等)在对比组间应相同或相近。在对比组间应相同或相近。u配对设计计量资料:配对配对设计计量资料:配对t检验。检验。u完全随机设计两样本计量资料:完全随机设计两样本计量资料:小样本小样本(任一任一ni60)且方差齐且方差齐: 两样本两样本t检验检验 方差不齐方差不齐: 近似近似t 检验检验大样本大样本(所有所有ni60): u检验。检验。2.不同资料应选用不同检验方法不同资料应选用不同检验方法3.正确理解正确理解“significance”
18、一词的含义一词的含义过去称差别有或无过去称差别有或无“显著性显著性”,易造成两,易造成两样本统计量之间比较相差很大的误解。样本统计量之间比较相差很大的误解。u现在称差别有或无现在称差别有或无“统计学意义统计学意义”,相应,相应推断为:可以认为或还不能认为两个或多个总推断为:可以认为或还不能认为两个或多个总体参数有差别。体参数有差别。4.结论不能绝对化结论不能绝对化 u因统计结论具有概率性质,故因统计结论具有概率性质,故“肯定肯定”、“一定一定”、“必定必定”等词不要使用。等词不要使用。u在报告结论时,最好列出检验统计量的在报告结论时,最好列出检验统计量的值,尽量写出具体值,尽量写出具体P值,而
19、不简单写成值,而不简单写成P0.05,以便读者与同类研究进行比较或进行,以便读者与同类研究进行比较或进行循证医学时采用循证医学时采用Meta分析。分析。 P ,拒绝H0,不能认为H0肯定不成立,因为虽然在H0成立的条件下出现等于及大于现有统计量的概率虽小,但仍有可能出现;同理,P ,不拒绝H0,更不能认为H0肯定成立。由此可见,假设检验的结论是具有概率性的,无论拒绝H0或不拒绝H0,都有可能发生错误,即第一类错误或第二类错误 5.统计统计“有意义有意义”与医学与医学“有意义有意义” 统计统计“有意义有意义”对应统计结论,医学对应统计结论,医学“有意义有意义”对应专业结论。对应专业结论。u统计结
20、论有意义,专业结论无意义,统计结论有意义,专业结论无意义,最终结论没有意义,样本含量过大或设计最终结论没有意义,样本含量过大或设计存在问题。存在问题。u统计结论无意义,专业结论有意义,统计结论无意义,专业结论有意义,检查设计是否合理、样本含量是否足够。检查设计是否合理、样本含量是否足够。第六节 假设检验与区间估计的联系参数估计与假设检验都是统计推断的重要内容。参数估计是根据样本统计量估计总体参数的真值;假设检验是根据样本统计量来检验对总体参数的检验假设是否成立。 一、区间估计与假设检验的主要区别一、区间估计与假设检验的主要区别1.区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验
21、以假设总体参数值为基准,不仅有双侧检验也有单侧检验;2.区间估计立足于大概率,通常以较大的把握程度(置信水平)1-去保证总体参数的置信区间。而假设检验立足于小概率,通常是给定很小的显著性水平去检验对总体参数的先验假设是否成立。二、区间估计与假设检验的联系1.区间估计与假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风险。2.对同一问题的参数进行推断,二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。区间估计问题可以转换成假设问题,假设问题也可以转换成区间估计问题。区间估计中的置信区间对应于假设检验中的接受
22、区域,置信区间以外的区域就是假设检验中的拒绝域。因此,利用置信区间可以进行假设检验。练习1、两样本比较时,分别取以下检验水准,哪一个的第二类错误最小 A.=0.05 B.=0.01 C.=0.10 D.=0.20 E.=0.022、在假设检验中,P值和 的关系为 A.P值越大, 值就越大 B.P值越大, 值就越小 C. P值和 值均可由研究者事先设定 D. P值和 值都不可以由研究者事先设定 E. P值的大小与 值的大小无关 3、假设检验中的第二类错误是指A.拒绝了实际上成立的H0 B.不拒绝实际上成立的H0C.拒绝了实际上成立的H1 D.不拒绝实际上不成立的H0 E.拒绝时所犯的错误4、统计
23、推断的内容是A用样本指标推断总体指标 B检验统计上的“假设”CA、B均不是 DA、B均是是非题1进行两均数差别的假设检验时,当P0.05时,则拒绝H0;当P0.05时,则接受H0,认为两总体均数无差别。答案:错误。当答案:错误。当P P 0 0.0505,拒绝,拒绝H H0 0时,我们是依据时,我们是依据这一小概率来下结论的。而当这一小概率来下结论的。而当P P 0 0.0505时,我们对两总时,我们对两总体均数无差别这一结论无任何概率保证,因此不能贸体均数无差别这一结论无任何概率保证,因此不能贸然下无差别的结论。正确的说法是,按所取检验水准然下无差别的结论。正确的说法是,按所取检验水准,接受
24、接受H H1 1的统计证据不足,或尚不能认为两总体均的统计证据不足,或尚不能认为两总体均数有差别。数有差别。 2通常单侧检验较双侧检验更为灵敏,更易检验出差别,应此宜广泛使用。答案:错误。根据专业知识推断两个总体是否有差答案:错误。根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,当两种可能都存别时,是甲高于乙,还是乙高于甲,当两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或者研究者仅关心其中一种可能时,可选用单于乙,或者研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较为稳妥。单侧检验,应以侧。一般来讲,
25、双侧检验较为稳妥。单侧检验,应以专业知识为依据,它充分利用了另一侧的不可能性,专业知识为依据,它充分利用了另一侧的不可能性,故检出率高,但应慎用。故检出率高,但应慎用。3只要增加样本含量到足够大,就可以避免I和II型错误。答案:错误。因为通过假设检验推断出的结论具有概率性,因此出现错误判断的可能性就一定存在,无论用任何方法也不能消除这一可能。但是,我们可以使错误判断的可能性尽量地小,比如样本含量越大,犯I和II类错误的可能性越小。 4、若两样本均数比较的假设检验结果P值远远小于0.01,则说明差异非常大。错。错。P P 值的大小只能说明差异是否有统计学意义,值的大小只能说明差异是否有统计学意义
26、,同样的差异,例数越多,同样的差异,例数越多,P P 值越小。值越小。5 5、对同一参数的估计,、对同一参数的估计,99%99%可信区间比可信区间比90%90%可信可信区间好。区间好。错。可信区间的优劣要通过两点衡量:区间的可信错。可信区间的优劣要通过两点衡量:区间的可信度;区间的宽度。因此不能笼统的通过区间可信度度;区间的宽度。因此不能笼统的通过区间可信度的大小来评价优劣。的大小来评价优劣。简答题1 简述可信区间在假设检验问题中的作用。可信区间不仅能回答差别有无统计学意义,而且可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准定的概率即检验水准的前提下进行计算,而假设检的前提下进行计算,而假设检验能够获得一较为确切的概率验能够获得一较为确切的概率P P 值。故将二者结合起值。故将二者结合起来,才是对假设检验问题的完整分析。来,才是对假设检验问题的完整分析。2 2、简述假设检验中、简述假设检验中P P 的含义的含义指从指从H H0 0 规定的总体随机抽得等于及大于(或等于规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。及小于)现有样本获得
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 岭南师范学院《峨眉武术2》2023-2024学年第二学期期末试卷
- 四川长江职业学院《升学与就职指导》2023-2024学年第二学期期末试卷
- 上海工商职业技术学院《跨国公司管理》2023-2024学年第二学期期末试卷
- 四川省泸州市泸县一中2025年高三5月选考模拟考试物理试题含解析
- 景德镇艺术职业大学《小学教育专业导论与职业生涯规划》2023-2024学年第二学期期末试卷
- 沙洲职业工学院《科技英语翻译》2023-2024学年第二学期期末试卷
- 深圳大学《合唱》2023-2024学年第二学期期末试卷
- 四川化工职业技术学院《道路桥梁工程施工技术》2023-2024学年第二学期期末试卷
- 宁波诺丁汉大学《园艺生态学》2023-2024学年第二学期期末试卷
- 二零二五版销售提成合同书
- 伤寒论全398条全文-顺序
- 超市投资预算表
- 2024年贵州路桥集团有限公司招聘笔试参考题库附带答案详解
- 2024年南昌市面向社会政府专职消防文员招聘笔试参考题库附带答案详解
- 2024年湖南省各市州湘能农电服务有限公司招聘笔试参考题库含答案解析
- 肿瘤放疗与免疫治疗联合模式探索
- 三年级下册面积单位换算练习200道及答案
- 热分析技术应用
- 《游园》(教案)-高中语文统编版必修下册
- 《劳动用工常见风险》课件
- 正大天虹方矩管镀锌方矩管材质书
评论
0/150
提交评论