南方医大医学统计学讲义05假设检验与t检验_第1页
南方医大医学统计学讲义05假设检验与t检验_第2页
南方医大医学统计学讲义05假设检验与t检验_第3页
南方医大医学统计学讲义05假设检验与t检验_第4页
南方医大医学统计学讲义05假设检验与t检验_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章假设检验与t检验一、假设检验的概念统计推断包括两大方面的内容,其一为参数估计(如总体均数的估计),另一方面,即假设检验(hypothesistest)。假设检验过去亦称显著性检验(significancetest)。其基本原理和步骤用以下实例说明。例为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。某医生在一山区随机抽查了25名健康成年男子,求得其脉搏的均数为74.2次/分,标准差为6.0次/分。根据大量调查,已知健康成年男子脉搏均数为72次/分;能否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏均数?本例可用下图表示。显然,本例其目的是判断是否μ>μ0。从所给条件看,样本均数X与已知总体均数μ0不等,造成两者不等的原因有二:①非同一总体,即μ#μ0;②同一总体即μ=μ0,两个均数不相等的原因在于抽样误差。假设检验的目的就是要判断造成上面两个均数不等的原因是哪一个。也就是说,是解决样本均数代表性如何的问题。上例是,样本均数比已知总体均数大,有可能是由于抽样误差引起,也有可能是由于所调查的样本人群的生活环境、生活习惯、遗传或其他原因所致,如何判断呢,这就需要利用统计学方法----假设检验方法。假设检验也是统计分析的重要组成部分。(提问:统计分析包括参数估计和假设检验)下面我们以例题所提出的问题学习假设检验的基本步骤,同时学习样本均数与总体均数比较的t检验。假设检验一般都是有“名”的,比如t检验,大家要知道假设检验的命名通常是以所要计算的统计量来命名的,如t检验、F检验、X2检验等。后面有进一步介绍。二、假设检验的基本步骤建立检验假设

(一)建立假设假设有两种:一种是检验假设,常称无效假设,用H0表示。这种假设的含义是假设两个指标(样本指标与总体指标、或两个样本指标)是相等的,它们的差别是由于抽样误差引起的。另一种是备择假设,常称对立假设,常用H1表示,是与H0相对立的假设,假设两个指标不相等,它们的差别不是由于抽样误差引起的,若无效假设被否决则该假设成立。在建立检验假设时,应当注意:①检验假设是针对总体而言,而不是针对样本;②H0和H1是相互联系、对立的假设,后面的结论是根据HO和H1作出的,因此两者不是可有可无,而是缺一不可;③H0为无效假设,其假定通常是:某两个(或多个)总体参数相等,或某两个总体参数之差等于0;H1的内容反映出检验的单双侧。若H1假设为μ>μ0或μ<μ0,则此检验为单侧检验(one-sidedtest)。它不仅考虑有无差异,而且还考虑差异的方向。如上例研究者只关心山区成年男子的脉搏数是否高于一般;若H1为μ#μ0,则此检验为双侧检验(two-sidedtest)。例如研究者对山区成年男子的脉搏数高于一般和低于一般同样关心。单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果,拟用单侧检验。在尚不能从专业知识判断两种结果谁高准低时,则用双侧检验。一般认为双侧检验较保守和稳妥。现以样本均数的比较为例,用符号表示如下:样本均数所代表的未知总体µ与已知总体均数µ0的比较

目的

H0H1双侧检验

是否µ#µ0

µ=µ0µ#µ0

是否µ>µ0

µ=µ0

µ>µ0单侧检验

是否µ<µ0

µ=µ0

µ<µ0两样本均数所代表的未知总体均数µ1与µ2的比较

目的

H0

H1双侧检验

是否µ1#µ2

µ1=µ2

µ1#µ2

是否µ1>µ2

µ1=µ2µ1>µ2单侧检验

是否µ1<µ2

µ1=µ2µ1<µ2(二)确定检验水准(sizeofatest),代号α,过去称显著性水准(significancelevel),是一个接受或拒绝H0的概率标准,是预先规定的概率值,它确定了小概率事件标准。在实际工作中一般取α=0.05。但α的取值并非一成不变,可根据不同研究目的给予不同设置,如方差齐性检验、正态性检验等常取α等于0.10、0.20,甚至更高。(三)选定检验方法,计算检验统计量应根据研究目的、变量或资料类型、设计方案、检验方法的适用条件等选择检验方法,并计算统计量(teststatistic)。如两均数比较可选用t检验,(当样本含量较大,如n>100时可用u检验;两样本方差比较可选用F检验、率的比较可选用u检验或x2检验。

(四)确定P值从假设检验的整个逻辑推理过程可看出,P的含义是指从由H0规定的总体中随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值(如t或u)的概率,可以简单地理解P的含义是H0成立的概率。(五)作出统计推断根据计算出的检验统计量,查相应的界值表即可得概率P。如上例,算得t=1.833,查表14-16,t界值表,先从横标目找到自由度υ=24一行,1.833在界值1.711与2.064之间,相对应纵标目的单尾P值分别为0.05与0.025,得本例0.025<P<0.05;余类推。将获得的事后概率P,与事先规定的概率——检验水准α进行比较而得出结论。一般来说,推断的结论应包含统计结论和专业结论两部分。统计结论只说明有统计学意义(statisticalsignificance)或无统计学意义(statistical

significance),而不能说明专业上的差异大小。它必须和专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。若P≤α,则结论为按所取的α检验水准,拒绝H0,接受H1,差别有统计学意义(统计结论),可认为……不同或不等(专业结论)。如例题得到0.025<P<0.05,按所取检验水准0.05,则拒绝H0,接受H1,有统计学意义,可认为该山区健康成年男子脉搏均数高于一般健康成年男子。若P>a,则结论为按α检验水准,不拒绝H。,无统计学意义(统计结论),还不能认为……不同或不等(专业结论)。P>α过去称“无显著性”,在文献中常用NS(non-significant/no-significant。)表示,也就是人们常说的“阴性结论”。注意:①虽然否定之否定为肯定,但不拒绝H0不等于完全接受H。,此时,尚没有足够的证据认为H。成立。从决策的观点:可认为暂时“接受”它,或“阴性待观察”。②下结论时,对H0只能说:拒绝(reject)或不拒绝(notreject);而对H1只能说:接受H1,除此之外的其它说法均不妥当。三.计量资料的假设检验假设检验的具体方法,通常以选定的检验统计量来命名。如检验统计量t和u分别对应于t检验(t-test,亦称Student’st-test)和u检验(u-test,亦称Z-test)。假设检验方法的选择应根据不同的资料类型和性质,研究的目的等来确定。实际应用时,应弄清各种检验方法的用途、适用条件和注意事项。前面我们学过,统计资料可分为计量资料、计数资料和等级资料三种,这三种不同类型的资料都有其相应的假设检验方法:计量资料:常用t检验(u检验)、F检验(方差分析)等;计数资料:X2检验等;等级资料:秩和检验。我们首先学习计量资料的假设检验。同样是计量资料,还有不同的检验方法,这主要是要根据具体的资料内容的研究目的来确定。一般来说,两均数比较用t检验,而两个以上均数的比较就必须用方差分析了。t检验的应用条件:当样本含量n较小时(如n<50=,理论上要求样本取自正态总体,两小样本均数比较时还要求两样本总体方差相等。但在实际应用时,与上述条件略有偏离,只要其分布为单峰近似对称分布,则对结果亦影响不大。u检验的应用条件:样本含量n较大,一般要求n>50。其实,u检验和t检验都属同类,其方法步骤也基本相同,不同的地方仅在于确定P值时界值的选择。(一)样本均数与总体均数比较的t检验下面我们以例题提出的问题为例,学习假设检验的一般步骤方法、掌握样本均数与总体均数比较的t检验的过程。在例题中,某医生在一山区随机抽查了25名健康成年男子,其脉搏的均数为74.2次/分,标准差为6.0次/分,这是一个样本。而已知的一般健康成人脉搏均数72次/分可作为总体均数。这是一个样本均数与已知总体均数比较的问题,故选用t检验方法。(有的同学会问,不是说总体均数一般为未知的吗?是的,但医学上也有一些数据比较稳定、经过长时间研究应用的常数,如医学正常值、理论值、标准值,这些有时可作为总体均数来应用。)①建立检验假设,确定检验水准H0:µ=µ0,即山区成年男子平均脉搏数与一般成年男子相等H1:µ>µ0,即山区成年男子平均脉搏数高于一般成年男子②确定检验水准取α=0.05③选定检验方法,计算检验统计量因该例为计量资料且n=25<50,故选用样本均数与总体均数比较的t检验。已知X=74.2次/分,S=6.0次/分,按下式计算统计量:t=(X-µ)/sx=1.833④确定P值按自由度υ=n-1=25-1=24查t界值表得:单侧t0.05,24=1.711;

t0.01,24=2.492t0.05,24=1.711<t<t0.01,24故单侧0.01<P<0.05。⑤统计推断,下结论因0.01<P<0.05,按α=0.05的水准拒绝H0,接受H1,差别有统计学意义。可认为该山区健康成年男子脉搏数高于一般成年男子。这个例题是一个单侧t检验,就是说研究者只关心山区健康成年男子脉搏数是否高于一般成年男子,并不认为相反结果会成立。但是医学上的大部分研究都必须关心到正反两种结果,如一种新疗法与传统疗法的疗效比较等,所以,除非有确实必要或专业知识的要求,我们一般都要用双侧检验。双侧检验和单侧检验的区别在于①建立假设时的叙述;②确定P值时查表是用单侧或是双侧(二)配对资料的t检验有以下两种不同的配对资料:①将实验对象配成对子,分别给予不同的处理,以推断两种处理是否有区别;②对同一实验对象,比较其处理前后的差别,以推断某种处理有无作用,如临床上病人治疗前后某个指标的对比。(三)两样本均数的t检验又称成组t检验,适用于完全随机设计两样本均数的比较。完全随机设计是分别从两个研究总体中随机抽取样本,对这\t"/kecheng/2013/_blank"/yishi/两个样本均数进行比较,以推断它们所代表的总体是否一致。其他的还有两大样本比较的u检验、两几何均数比较的t检验等。这些检验思路、方法基本相同,只不过是计算统计量的公式不同而已。四.假设检验应注意的问题(1)要有严密的研究设计,这是假设检验的前提。组间应具可比性,也就是除对比的主要因素(如用新药和用安慰剂)外,其它可能影响结果的因素(如年龄,性别,病程,病情轻重等),在对比组间应尽可能相同或相近;应保证样本是从同质总体中随机抽取。(2)不同变量或资料应选用不同的检验方法。应根据分析目的、资料(变量)类型和分布、设计方案、样本含量大小等选用适当的检验方法。如:配对设计的计量资料采用配对t检验,而完全随机的两样本定量(变量)资料,若为小样本(即任一组n<50)且方差齐,则选用两小样本t检验;若方差不齐,则选用近似t'检验(Cochran&Cox法或Satterthwaite法);若为大样本(每组n>50),则可选用大样本u检验。(3)正确理解“显著性”一词的含义。差别有统计学意义,过去称差别有“显著性”,不能理解为差异大。假设检验的结\t"/kecheng/2013/_blank"医学招聘网果并不指差异的大小,只能反映两者是否相同或不同,因此一般采用“有无统计学意义”一词表达。差异的大小只能根据专业知识予以确定。(4)作结论不能绝对化。因统计结论具有概率性质,不宜用“肯定”,“一定”,“必定”等词。在报告结论时,最好应列出检验统计量的值,尽量写出P值的确切范围(并注明单侧还是双侧),如写成0.025<P<0.05,以便读者与同类研究进行比较。(5)

统计“显著性”与医学/临床/生物学“显著性”(statisticalvsmedical/clinical/biologicalsignificance)。统计“显著性”对应于统计结论,而医学/临床/生物学“显著性”对应于专业结论。假设检验是为各专业服务的,统计结论必须和专业结论有机的相结合,才能得出恰如其分、符合客观实际的最终结论。若统计结论和专业结论一致,则最终结论就和这两者均一致(即均有或均无意义);若统计结论和专业结论不一致,则最终结论需根据实际情况加以考虑。当统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在严重的偏倚(偏性),那么最终结论则没有意义。例如:有人欲比较A、B两种降压药物的降压效果,随机抽取了\t"/kecheng/2013/_blank"高血压病人各100名,分别测定两组病人服药后舒张压的改变值,得两组舒张压改变值之差的平均数为0.11kPa。作两大样本u检验得u=6.306,P《0.001,有统计学意义。但因A、B两组\t"/kecheng/2013/_blank"高血压病人服药后舒张压改变值之差较小,仅0.11kPa,不足有临床意义的差值0.67kPa,故最终结论并无实际意义。相反,统计结论无意义,而专业结论被认为有意义,那就应当检查设计是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论