第三章 总体均数的估计与检验课件_第1页
第三章 总体均数的估计与检验课件_第2页
第三章 总体均数的估计与检验课件_第3页
第三章 总体均数的估计与检验课件_第4页
第三章 总体均数的估计与检验课件_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章总体均数的估计与假设检验第三章总体均数的估计与检验一、均数的抽样误差与标准误抽样研究(samplingstudy):在总体中随机抽取足够数量的具有代表性的部分观察单位构成的样本进行的研究。统计推断(statisticalinference):通过样本来获取有关总体信息的过程。抽样误差(samplingerror):由个体变异产生的,抽样造成的样本统计量与总体参数的差异。第三章总体均数的估计与检验一、均数的抽样误差与标准误例3-1

若某市1999年18岁男生身高服从均数为167.7cm,标准差为5.3cm的正态分布。从该正态分布N(167.7,5.3)cm总体中随机抽样,每次样本含量=10人,共有样本=100个,得到每个样本均数及标准差如下图所示第三章总体均数的估计与检验一、均数的抽样误差与标准误图n=10

=167.7cm

=5.3cmX1,X2,X3,

Xi,

100个第三章总体均数的估计与检验一、均数的抽样误差与标准误100个样本均数:新的变量值,样本均数服从正态分布。100个样本均数的均数为167.70cm,标准差为1.73cm。标准误(standarderror,SE):样本统计量(均数)的标准差。标准误反映样本均数间的离散程度,也反映了样本均数与相应总体均数间的差异,可说明了均数抽样误差的大小第三章总体均数的估计与检验一、均数的抽样误差与标准误

当样本含量n固定,均数标准误的大小与标准差的大小成正比;而当标准差

或S为定值时,均数标准误则与样本含量n的平方根成反比。即可通过增加样本含量n来减少均数的标准误,从而降低抽样误差第三章总体均数的估计与检验

二、t分布

1、t分布的概念若某一随机变量X服从总体均数为

,总体标准差为

的正态分布N(

,

),则通过u变换()可将一般的正态分布转化为标准正态分布N(0,1)即u分布。同理,若多个样本均数服从总体均数为

,总体标准差为的正态分布N(

,),则通过同样方式的u变换()也可将其转换为标准正态分布N(0,1)即u分布。在实际工作中,由于未知,用代替,则不再服从标准正态分布,而服从t分布。第三章总体均数的估计与检验不同自由度下的t分布图第三章总体均数的估计与检验二、t分布

t分布由英国统计学家WSGosset于1908年以“Student”笔名发表,故又称Studentt分布(Student'st-distribution)。t分布主要用于总体均数的区间估计及t检验等。第三章总体均数的估计与检验二、t分布

2、t分布的图形与特征

t分布是一簇曲线。当自由度

不同时,曲线的形状不同。当

时,t分布趋近于标准正态分布,当自由度

较小时,与标准正态分布差异较大。第三章总体均数的估计与检验二、t分布

t分布有如下特征:

1)单峰分布,以0为中心,左右对称;

2)自由度

越小,则越大,t值越分散,t分布的峰部越矮而尾部翘得越高;

3)随着自由度的增大,当

逼近

,因逼近,t分布逼近u分布,故标准正态分布是t分布的特例第三章总体均数的估计与检验二、t分布

统计学家编制了不同自由度

下t值与概率关系的t界值表。t值表:横标目为自由度

,纵标目为概率(P或

)。当

确定时,对应的t(临)界值(criticalvalue)或t分位数。单尾概率(one-tailedprobability):一侧尾部面积双尾概率(two-tailedprobability):两侧尾部面积之和在相同自由度时t值增大,概率P减小;在相同值时,双尾概率P为单尾概率P的两倍。如双尾

=单尾=1.812。第三章总体均数的估计与检验三、总体均数的估计1、可信区间的概念参数估计:指用样本指标值(统计量)推断总体指标值(参数)。参数估计:点(值)估计(pointestimation)

区间估计(intervalestimation)

点估计:用样本统计量直接作为总体参数的估计值。如用估计

、S估计

等。其方法虽简单,但未考虑抽样误差的大小。第三章总体均数的估计与检验三、总体均数的估计区间估计:按预先给定的概率(1

),以样本统计量及其标准误确定的包含未知总体参数的可能范围。可信区间或置信区间(confidencebound/confidenceinterval,CI):该可能范围;可信度/置信度(水平/系数)(confidencelevel):。预先给定的概率1

,常取95%或99%。

可信限/置信限(confidencelimit,CL):可信区间的两个数值。有可信下限和上限之分。可信区间并不包含可信区间上下限两个值,故用圆括弧()表示其开区间。

第三章总体均数的估计与检验三、总体均数的估计2、总体均数可信区间的计算单一总体均数可信区间两总体均数之差可信区间

1)单一总体均数的可信区间(1)

未知:按t分布。第三章总体均数的估计与检验三、总体均数的估计均数的双侧可信区间为:或 均数的单侧可信区间为:

>

< 第三章总体均数的估计与检验三、总体均数的估计在例3-1中抽得第15号样本的均数168.44(cm),标准差5.16(cm),试求其总体均数的95%可信区间。本例n=10,按式(3-2)算得样本均数的标准误为:

cm

即可信区间为(164.75,172.13)cm第三章总体均数的估计与检验三、总体均数的估计(2)

已知或

未知但n足够大(如n>50)时:按u分布。

已知:即

未知但n较大:即

第三章总体均数的估计与检验三、总体均数的估计例3-2在例3-1中抽得第15号样本的均数

(cm),标准差(cm),求其总体均数的95%可信区间。本例n=10,按公式(3-2)算得样本均数的标准误为

(cm)

=n

1=10

1=9,

取双尾0.05,查附表2的t界值表得:第三章总体均数的估计与检验三、总体均数的估计

即(164.35,169.55)cm故该地18岁男生身高均数的95%可信区间为(164.35,169.55)cm。第三章总体均数的估计与检验三、总体均数的估计单侧可信区间则为:

>

< 2)两总体均数之差的可信区间从总体标准差相等,但总体均数不等的两个正态总体N(

1,

)和N(

2,

)进行随机抽样。若两样本的样本含量、均数、标准差分别用、、和、、表示,则两总体均数之差()的双侧可信区间为:

第三章总体均数的估计与检验三、总体均数的估计

两均数之差的标准误得到两总体均数之差的单侧可信区间为

第三章总体均数的估计与检验三、总体均数的估计

第三章总体均数的估计与检验三、总体均数的估计第三章总体均数的估计与检验三、总体均数的估计3.可信区间的确切涵义正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间.在算得的100个可信区间中,平均约有95个可信区间包含了总体均数,而另外5个不包括。可信区间的确切含义指的是,有1

(如95%)的可能认为所计算出的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为1

第三章总体均数的估计与检验三、总体均数的估计4.均数可信区间与参考值范围的区别表3-2均数的可信区间与参考值范围的区别区别点均数的可信区间参考值范围意义按预先给定的概率,确定的未知参数的“正常人”的某项指标的波动范围。可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:该可信区间有多大(如当

=0.05时为95%)的可能性包含了总体均数。均数的可能范围个体值的波动范围计算公式

未知:正态分布:

已知或

未知但n>50:偏态分布:PX

P100

X

用途估计总体均数判断观察对象的某项指标正常与否

第三章总体均数的估计与检验四、t检验和u检验

样本均数或均数间的差异原因有两种:第一种可能是总体均数不同,第二种可能是总体均数相同,但差别仅仅是抽样造成的。统计学假设检验:检验假设计算检验统计量检验统计量确定概率P值根据P值作出推断。第三章总体均数的估计与检验四、t检验和u检验t检验的应用条件:1)样本含量n较小时(如n<50),样本随机地取自正态总体;2)两样本总体方差相等,方差齐性

第三章总体均数的估计与检验四、t检验和u检验1、单样本t检验(onesample/groupt-test)

样本均数代表的未知总体均数

和已知总体均数

0(一般为理论值、标准值或经过大量观察所得的稳定值等)的比较。其检验统计量按下式计算:

第三章总体均数的估计与检验四、t检验和u检验例3-5

某医生测量了36名从事某作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事该作业工人血红蛋白是否低于正常成年男性的平均值140g/L。

(1)建立检验假设,确定检验水准

H0:

=

0=140g/L,即从事某作业的男性工人平均血红蛋白含量与正常成年男性相等

H1:

0=140g/L,即从事某作业的男性工人平均血红蛋白含量低于正常成年男性

=0.05第三章总体均数的估计与检验四、t检验和u检验(2)计算检验统计量本例n=36,=130.83g/L,S=25.74g/L,=140g/L。

=n

1=36-1=35(3)确定P值,作出推断结论以

=35,查附表2,t界值表,故单尾概率0.025<P<0.05。按

=0.05水准,拒绝H0,接受H1,有统计意义。可认为从事该作业的男性工人平均血红蛋白含量低于正常成年男性。第三章总体均数的估计与检验四、t检验和u检验2、配对t检验(paired/matchedt-testfordependentsamples)

配对t检验又称成对t检验,适用于配对设计的定量(变量)资料。配对设计情形:

1)两个同质受试对象分别接受两种不同的处理;

2)同一受试对象分别接受两种不同的处理;

3)同一受试对象(一种)处理前后。第三章总体均数的估计与检验四、t检验和u检验两个同质受试对象分别接受两种不同的处理,其检验统计量如下:

d为每对数据的差值,为差值的样本均数,为差值的标准差,为差值样本均数的标准误,n为对子数。第三章总体均数的估计与检验四、t检验和u检验(1)建立检验假设,确定检验水准

H0:

d=0,即两种方法的测定结果相同

H1:

d≠0,即两种方法的测定结果不同

=0.05(2)计算检验统计量本例n=10,

d=2.724,

d2=0.8483

第三章总体均数的估计与检验四、t检验和u检验

第三章总体均数的估计与检验四、t检验和u检验(3)确定P值,作出推断结论查附表2,t界值表得P<0.001。按

=0.05水准,拒绝H0,接受H1,有统计学意义。可认为两种方法对脂肪含量的测定结果不同,哥特里-罗紫法测定结果较高。第三章总体均数的估计与检验四、t检验和u检验3、两样本t检验成组t检验。1)总体方差相等情形

第三章总体均数的估计与检验四、t检验和u检验表3-4肥胖儿童和正常儿童血液中LPO含量(

mol/mL)肥胖组X1(n1=30)9.8410.2910.359.5210.929.5010.5410.469.108.828.2410.648.768.799.227.359.878.939.068.408.959.129.869.129.679.878.119.629.318.46对照组X2(n2=30)8.037.548.077.417.318.987.807.336.917.327.927.646.418.947.597.127.726.887.417.107.056.627.727.956.898.557.738.216.838.36第三章总体均数的估计与检验四、t检验和u检验(1)建立检验假设,确定检验水准

H0:

1=

2,即肥胖组和对照组LPO总体平均含量相等

H1:

1

2,即肥胖组和对照组LPO总体平均含量不等

=0.05

第三章总体均数的估计与检验四、t检验和u检验(2)计算检验统计量

=n1+n2

2=2(n

1)=2(30

1)=58(3)确定P值,作出推断结论

=58查附表2,t界值表,得P<0.001。按

=0.05水准,拒绝H0,接受H1,有统计学意义。可认为肥胖组和对照组LPO总体平均含量不等,肥胖与脂质代谢有关,肥胖组儿童血中脂质过氧化物(LPO)较高。第三章总体均数的估计与检验四、t检验和u检验2)总体方差不等情形进行两小样本均数的比较,若两总体方差不等即,没有理由将两方差合并求方差。此时,可采用数据变换或下述近似t检验(separatevarianceestimationt-test)

t'检验

第三章总体均数的估计与检验四、t检验和u检验(1)Cochran&Cox法(1950)

其检验统计量为t',用下述公式计算。因t'分布较复杂,故常利用t计算其临界值。第三章总体均数的估计与检验四、t检验和u检验(2)Satterthwaite法(1946)Cochran和Cox法是对临界值校正,而Satterthwaite法则是对自由度校正。t'代替t值,最终结果查附表2,t界值表。1第三章总体均数的估计与检验四、t检验和u检验t=t’(3)Welch法(1947):该法也是对自由度进行校正。t=t’第三章总体均数的估计与检验四、t检验和u检验例3-8在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜唐苹胶囊的对照组20例病人和用阿卡波糖胶囊的试验组20例病人,其8周时糖化血红蛋白HbA1c(%)下降值如表3-5。问用两种不同药物的病人其HbA1c下降值是否不同?第三章总体均数的估计与检验四、t检验和u检验

由于对照组方差是试验组方差的3.77倍,经本章第七节两样本方差齐性的F检验,认为两组的总体方差不等,故采用近似t检验。

第三章总体均数的估计与检验四、t检验和u检验(1)建立检验假设,确定检验水准H0:

1=

2,即对照组和试验组病人HbA1c下降值的总体均数相等H1:

1

2,即对照组和试验组病人HbA1c下降值的总体均数不等

=0.05(2)计算检验统计量第三章总体均数的估计与检验四、t检验和u检验

(3)确定P值,作出推断结论。查t界值表t0.05/2,19=2.093。按公式(3-20)第三章总体均数的估计与检验四、t检验和u检验

由t

=0.965<t

0.05/2=2.093得P>0.05。按

=0.05水准,不拒绝H0,无统计学意义。还不能认为用两种不同药物的病人其HbA1c下降值不同。第三章总体均数的估计与检验四、t检验和u检验

对例3-8,如按Satterthwaite法,则第三章总体均数的估计与检验四、t检验和u检验以

=28.4

28、t=0.965查附表2的t界值表得0.20<P<0.40。结论同前。4.Welch法近似t检验Welch法(1947)也是对自由度进行校正。其校正按公式(3-22)计算第三章总体均数的估计与检验四、t检验和u检验对例3-8,如按Welch法,则以

=29.4

29、t=0.965查附表2的t界值表得0.20<P<0.40。结论同前。

第三章总体均数的估计与检验四、t检验和u检验4、u检验

u检验(u-test)亦称Z-test。适用于总体标准差已知时,但当样本含量(实为自由度)较大时,t分布与标准正态分布很接近,此时便可使用u检验。检验统计量u的计算不但比t简单,而且u界值与自由度无关,最终结果的P值两者也相差不大。因此,只要记住几个常用的u界值,即可获得P值的粗略范围,并可得出结论。第三章总体均数的估计与检验四、t检验和u检验1.单样本u检验(one-sampleu-test)

适用于当n较大(如n>50)或

0已知时。检验统计量如下

(n较大时)

(

0已知时)

第三章总体均数的估计与检验四、t检验和u检验2.两样本的u检验(two-sampleu-test)适用于两样本含量较大(如n1>50且n2>50)时。检验统计量如下

第三章总体均数的估计与检验五、两均数的等效检验前述两样本t检验,其目的是推断两总体均数是否不等。如果得到P>

,则不拒绝H0,还不能认为两总体均数不等。此时不能作出两总体均数相等的结论,其原因在于假设检验主要是围绕H0进行的,不拒绝H0只表明证据不足。第三章总体均数的估计与检验五、两均数的等效检验

根据t检验公式,样本含量n愈小,标准误则愈大,愈易得到P>

。因此,要推断两总体均数是否相等或相差很小,需借助等效检验(equivalencetest)。第三章总体均数的估计与检验五、两均数的等效检验等效检验在医学研究中应用较广,常用于新药临床试验的评价中。如判断国家四类新药中仿制品与原制品的疗效是否相同或相近,判断新开发剂型与原剂型的疗效是否相同或相近;判断两种检测方法的测量结果是否相同或相近;判断两种预防措施的效果是否相同或相近等等。第三章总体均数的估计与检验五、两均数的等效检验1、等效检验的基本步骤1)

给定等效界值

,建立检验假设,确定检验水准第三章总体均数的估计与检验五、两均数的等效检验2)

计算检验统计量由于规定故取。若,则按公式(3-26)计算。第三章总体均数的估计与检验五、两均数的等效检验3)

确定P值,作出推断结论.

将算得的负t值取绝对值,根据相应自由度

,查附表2的t界值表,获得相应双尾P值。若,则拒绝H0,接受H1,有统计学意义,可认为两总体均数等效。第三章总体均数的估计与检验五、两均数的等效检验

例3-9为研究某新药对高血脂患者胆固醇的降低作用是否同于标准药物,随机将202例高血脂患者分为新药试验组和标准药物对照组,测得各组治疗前后胆固醇(mmol/L)降低的平均值和标准差如表3-6。若等效界值

=0.52mmol/L,问新药和标准药物的疗效是否相同?第三章总体均数的估计与检验五、两均数的等效检验(1)建立检验假设,确定检验水准H0:mmol/L,即两药物不等效H1:mmol/L,即两药物等效

=0.05(2)计算检验统计量因(mmol/L)<

=0.52mmol/L,故按公式(3-26)计算如下:第三章总体均数的估计与检验五、两均数的等效检验(3)确定P值,作出推断结论以、

=200查附表2的t界值表,得双尾P<0.001。按

=0.05水准,拒绝H0,接受H1,有统计学意义。可认为新药和标准药物对照降低胆固醇的疗效相同。第三章总体均数的估计与检验五、两均数的等效检验2、应用等效检验的注意事项1)

值的选定在等效检验中非常重要,须在等效试验前根据专业知识予以确定。必要时,可结合成本效益分析予以确定。研究者可把专业上或公认有临床实际意义的差值作为等效界值

。如血压

值为0.67kPa(5mmHg),胆固醇

值为0.52mmol/L(20mg/dl),白细胞

值为0.5

109/L(500个/mm3)。当难以确定时,可用0.2~0.5倍标准差作为参考。第三章总体均数的估计与检验五、两均数的等效检验2)等效检验和一般假设检验即“差别检验”的基本思想一致,表3-7以两样本比较的t检验为例加以说明。第三章总体均数的估计与检验五、两均数的等效检验

通常等效检验采用两个同时进行的单侧检验去判断无效假设是否成立,即双向单侧检验(twosimultaneousone-sidetest),该方法由Schuirmann提出。假定试验药总体均数为

T,对照药总体均数为

C,且

T

C的等效区间为[

,

],则判断试验药和对照药是否等效,也就是用的信息推论该等效区间是否包含

T

C。因此,应分别对其下限

和上限

进行两次单侧t检验。第三章总体均数的估计与检验六、假设检验的基本步骤及注意事项假设检验(hypothesistest)。假设检验过去称显著性检验(significancetest)。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量(teststatistic),最后获得P值(P-value)来判断。当P小于或等于预先规定的概率值

(如0.05),就是小概率事件。根据小概率事件原理:小概率事件在一次抽样中发生的可能性很小,如果它发生了,则有理由怀疑原假设H0,认为其对立面H1成立,该结论冒

(如5%)的错误风险。第三章总体均数的估计与检验六、假设检验的基本步骤及注意事项1、假设检验的基本步骤

1)建立检验假设,确定检验水准

(1)

=

0:称检验假设(hypothesisundertest

tobetested),常称无效假设,又称零/原假设(nullhypothesis)。用H0表示。

(2)

0:称备择假设,常称对立假设(alternativehypothesis)。用H1或HA表示。须注意:检验假设是针对总体而言,而不是针对样本;第三章总体均数的估计与检验六、假设检验的基本步骤及注意事项(3)

:称检验水准(sizeofatest),过去称显著性水准(significancelevel)。它属于I型错误的范畴(详后)。

是预先规定的概率值,它确定了小概率事件标准。在实际工作中常取

=0.05。第三章总体均数的估计与检验六、假设检验的基本步骤及注意事项2)计算检验统计量应根据变量或资料类型,设计方案,统计推断的目的,方法的适用条件等选择检验统计量。如检验统计量t,t’,u,F等。3)确定P值,作出推断结论从假设检验的整个逻辑推理过程可看出,P的含义是指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值(如t或u)的概率。第三章总体均数的估计与检验六、假设检验的基本步骤及注意事项一般来说,推断的结论应包含统计结论和专业结论两部分。统计结论只说明有统计学意义(statisticalsignificance)或无统计学意义(nostatisticalsignificance),而不能说明专业上的差异大小。它必须同专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。第三章总体均数的估计与检验六、假设检验的基本步骤及注意事项2、I型错误和II型错误1)I型错误(typeIerror):拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,前面所讲的检验水准,就是预先规定的允许所犯I型错误概率的最大值。I型错误概率大小也用

表示。

如规定

=0.05,当拒绝H0时,则理论上100次检验中平均有5次发生这样的错误。

2)II型错误(typeIIerror):“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用

表示。

只取单尾,

值的大小一般未知,须在知道两总体差值

(如

1

2等),

及n时,才能算出。第三章总体均数的估计与检验六、假设检验的基本步骤及注意事项表3-10可能发生的两类错误客观实际假设检验的结果拒绝H0“接受”H0H0成立I型错误(

)推断正确(1

)H0不成立推断正确(1

)II型错误(

)即H1成立第三章总体均数的估计与检验六、假设检验的基本步骤及注意事项3、假设检验应注意的问题1)要有严密的研究设计这是假设检验的前提。组间应均衡,具有可比性,也就是除对比的主要因素(如临床试验用新药和对照药)外,其它可能影响结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论