医学科研中的统计学方法:假设检验与t检验_第1页
医学科研中的统计学方法:假设检验与t检验_第2页
医学科研中的统计学方法:假设检验与t检验_第3页
医学科研中的统计学方法:假设检验与t检验_第4页
医学科研中的统计学方法:假设检验与t检验_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验与t检验▲某事发生了:是由于碰巧?还是由于必然的原因?统计学家运用假设检验来处理这类问题。假设检验的基本原理和步骤

样本1同一总体差异抽样误差引起

样本2总体甲样本1

差异本质不同引起(本质不同)总体乙样本21.假设检验的基本原理及思想不能用抽样误差来解释反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。概率论(小概率时间):如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是“不会发生的”。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。

假设检验的原理/思想(1)建立假设检验假设或者称无效假设(nullhypothesis),用H0表示,H0假设是假设两总体均数相等。备择假设(alternativehypothesis),用H1表示。

H1是与H0相反的假设,假设两总体均数不相等。2、假设检验的步骤(2)确定检验水准检验水准(

)就是我们用来区分大概率事件和小概率事件的标准,是人为规定的。当某事件发生的概率小于

时,则认为该事件为小概率事件,是不太可能发生的事件。通常

取0.05或0.01。(3)计算统计量

根据资料类型与分析目的选择适当的公式计算出统计量,比如计算出u值或t值。

(4)确定概率值(P)将计算得到的u值或t值与查表得到u

或t

,ν,比较,得到P值的大小。根据u分布和t分布我们知道,如果|u|>u

或|t|>u

,则P<

;如果|u|<u

或|t|<u

,则P>

。(5)作出推断结论(统计学结论,专业结论)如果p>

,认为在检验假设H0成立的条件下,得到等于或大于现有统计量u值或t值的可能性大于

,不属于小概率事件,则不拒绝H0,差别无统计学意义,结论是不认为两总体均数不相等。如果p<

,我们认为在检验假设H0成立的条件下,得到等于或大于现有统计量u值或t值的可能性小于

,可判断为小概率事件,则拒绝H0,接受H1,差别有统计意义,结论是两总体均数不相等,或者某一总体均数大于(或小于)另一总体均数。两均数比较一、单样本t检验二、配对样本均数t检验三、两独立样本均数t检验四、方差不齐时两样本均数t’检验五、μ检验六、t检验中的注意事项七、假设检验中的两类错误t

分布WilliamSealeyGosset(1876.6—1937.10)图4-2不同自由度下的t分布图t

值表(附表2,p195)纵坐标:自由度,υ横坐标:概率,p,即曲线下阴影部分的面积;

表中的数字:相应的|t|界值。一、单样本t检验

(onesamplet-test)自由度ν=n-1

例5-1根据大量调查,已知健康成年男子脉搏的均数为72次/分钟。某医生在某山区随机调查了25名健康成年男子,求得其脉搏均数74.2次/分钟,标准差为6.5次/分钟,能否据此认为该山区成年男子的脉搏数高于一般地区。

1.建立检验假设

H0:μ=μ0,即该山区健康成年男子脉搏数与一般地区相同。H1:μ>μ0,即该山区健康成年男子脉搏数高于一般地区。2.建立检验水准

α=0.05。3.计算统计量

4.确定P值自由度ν=n-1=25-1=24,查t

界值表(附表2,p195)得:本例中,t=1.692,介于两者之间,则

0.05<P<0.105.做出推断结论不能拒绝H0,差异无统计学意义。

尚不能认为该山区健康成年男子脉搏数高于一般地区。1、配对资料(三种情况)(1)一批实验对象某种处理前后(2)一批实验对象两种处理方法(3)实验对象经过配对后的实验结果

二、配对样本均数t检验

(pairedsamplet-test)

例5-2应用克矽平治疗矽肺患者10名,治疗前后血红蛋白的含量如表5-1所示,问该药是否引起血红蛋白含量的变化?

表5-1治疗矽肺患者血红蛋白量(克%)

编号治疗前治疗后治疗前后差数d

1113140272150138-123150140-1041351350512813576100120207110147378120114-69130138810123120-3ν=n-13、公式:2、目的:判断不同的处理间是否有差别?即:差值的总体均数为01.建立检验假设H0:μd=0,假设该药不影响血红蛋白的变化,即治疗前后总体差数为0。H1:μd≠0,假设该药影响血红蛋白的变化,即治疗前后总体差数不为0。

2.确定检验水准

α=0.05.

3.计算t值4.确定P值自由度ν

=10-1=9,查t

临界值(附表2)得:

0.20<P

<0.405.结论按α=0.05水准不拒绝H0,差异无统计学意义。根据目前资料尚不能认为克矽平对血红蛋白含量有影响。

三、两独立样本均数t或t’

检验

(twoindependentsampletort’-test)▲目的:由两个样本均数的差别推断两样本所取自的总体中的总体均数间有无差别?

例5-3

某克山病高发区测得11例急性克山病患者与该地13名健康人的血磷值(mg%)如表5-2所示,判定两组均数差异有否统计学意义。

表5-2患者与健康者的血磷测定值(mg%)

患者编号X1健康者编号X2

14.7312.3426.4022.5032.6031.9843.2441.6756.5351.9865.1863.6075.5872.3383.7383.7394.3294.57105.78104.82113.73115.78124.17134.14

t检验的应用条件1、正态性2、方差齐性

方差齐性检验两独立样本均数比较的t检验,要求相应的两总体方差相等,即方差具有齐性。为此,我们要对两样本的方差作统计学检验。方差齐性的检验用F检验,统计量F值的计算公式为:

求得F值后,其自由度分别为:

df1=n1-1;df2=n2-1查附表3,作方差齐性检验,若P>0.05则用t检验P<0.05则用t'检验两独立样本均数t检验

(twoindependentsamplet-test)ν=n1+n2-2t

检验计算公式方差不齐时两样本均数t

检验

(twoindependentsamplet

test)tα’界限值计算公式

此处df1=n1-1,df2=n2-1.α可取0.05或0.01。当α确定后,可查t

界值表求得tα,df1及tα,df2,将它代入上式即可求得tα’(双侧用tα/2’).若t

’>tα’,则P<α,反之P>α.

例5-3

某克山病高发区测得11例急性克山病患者与该地13名健康人的血磷值(mg%)如表5-2所示,判定两组均数差异有否统计学意义。

表5-2患者与健康者的血磷测定值(mg%)

患者编号X1健康者编号X2

14.7312.3426.4022.5032.6031.9843.2441.6756.5351.9865.1863.6075.5872.3383.7383.7394.3294.57105.78104.82113.73115.78124.17134.14

(一)先作方差齐性检验

1.H0:σ12=σ22,设两总体方差相等H1:σ12≠σ22,设两总体方差不等

α=0.052.计算F值3.df1=N1-1=12,df2=N2-1=10查附表3(方差分析表,方差齐性检验用)F0.05(12,10)=3.37

因为F小于F0.05(12,10)所以P>0.05,接受H0。认为因为两总体方差的差异无统计学意义,故用t检验。

1.H0:μ1=μ2

,即克山病患者与当地健康者的血磷值的均数相同。H1:μ1≠

μ2

,即克山病患者与当地健康者的血磷值的均数不相同。

2.α=0.05.

3.计算t

4.自由度

ν=n1+n2-2=11+13-2=22查附表2可得:0.01<P<0.02,按α=0.05水准拒绝H0,差异有统计学意义。可以认为克山病患者血磷的平均值高于当地健康人的血磷平均值。例5-5由X线片上测得两组病人的R1值(肺门横径右侧距,cm),算得结果如下,试检验肺癌病人与矽肺0期病人的R1值的均数间差异是否明显。肺癌病人:

矽肺0期病人:

(一)先作方差齐性检验

1.H0:σ12=σ22,设两总体方差相等H1:σ12≠σ22,设两总体方差不等

α=0.052.计算F值3.df1=N1-1=9,df2=N2-1=49查附表3(方差分析表,方差齐性检验用)F0.05(9,49)=2.39

因为F大于F0.05(9,49)所以P<0.05,拒绝H0。认为因为两总体方差的差异有统计学意义,故不能用t检验而要用t

检验。

五、μ检验

与μ0.05=1.96,μ

0.01=2.58

进行比较两大样本均数的比较例5-6某地抽查了25—29岁正常人群的红细胞数,其中:男性156人,得均数为4.65(×1012/L),标准差为0.55(×1012/L);女性104人,得均数为4.22(×1012/L),标准差为0.44(×1012/L)。问该人群男、女红细胞数有无差别?1.建立检验假设和检验标准

H0:μ1=μ2

,即该地男、女红细胞数相同,

H1:

μ1≠

μ2,

该地男、女红细胞数不相同。

α=0.05.2.计算μ值3.μ0.05=1.96

μ0.01=2.58

因为μ=6.97>μ0.01,所以P<0.01,差异有统计学意义(P<0.01),故拒绝H0,认为该地男、女间红细胞数有显著差别,男高于女。六、均数假设检验的注意事项1.假设检验结论正确的前提

作假设检验用的样本资料,必须能代表相应的总体,同时各对比组具有良好的组间均衡性。这要求有严密的实验设计和抽样设计,如样本是从同质总体中抽取的一个随机样本,试验单位在干预前随机分组,有足够的样本量等。2.必须根据实验设计的不同,选择不同假设检验方法譬如,资料性质不同,设计类型不同,样本大小不同,选用配对t检验还是两独立样本t检验,选用大样本还是小样本检验,这些都涉及到最后进行统计处理时使用不同公式。3.双侧检验与单侧检验的选择

需根据研究目的和专业知识予以选择。单侧检验和双侧检验中的t值计算过程相同,只是t界值不同,对同一资料作单侧检验更容易获得显著的结果。单双侧检验的选择,应在统计分析工作开始之前就决定,若缺乏这方面的依据,一般应选用双侧检验。4.假设检验的结论不能绝对化

假设检验统计结论的正确性是以概率作保证的,作统计结论时不能绝对化。在报告结论时,最好列出概率P的确切数值或给出P值的范围,如写成0.02<P<0.05,同时应注明采用的是单侧检验还是双侧检验,以便读者与同类研究进行比较。当P接近临界值时,下结论应慎重。5.正确理解P值的统计意义

P-值是无效假设成立的前提下,检验统计量大于等于当前值的概率。当无效假设成立时,拒绝无效假设就是假阳性。假阳性称为第一类错误,犯第一类错误的概率=PP-值小,表明无效假设成立的前提下,“不大可能”出现当前的情形(以及更不利于无效假设的情形),但它们居然出现了!?于是,拒绝无效假设。P-值大,表明无效假设成立的前提下,“颇有可能”出现当前的情形(以及更不利于无效假设的情形),现在它们出现了,毫不奇怪,没理由拒绝无效假设。不拒绝无效假设的话,是不是认为无效假设是对的?当备择假设成立时,不拒绝无效假设就是假阴性.假阴性称为第二类错误。给定α、样本量和实际差距,犯第二类错误的概率β可以计算。1-β称为检验的功效(power),它是给定α、样本量时识别实际差距的概率。不拒绝无效假设时,存在两种情形:(1)实际上无差异(正确)(2)实际上有差异,因功效低而未察觉(假阴性)需当即计算功效,若功效较高,方可认为无差异;若功效较低,可能存在差异而未能察觉。欲提高功效,主要靠加大样本量6.统计分析不能代替专业分析。假设检验结果“有”或“无”统计学意义,主要说明抽样误差的可能性大小。在分析资料时还必须结合临床医疗,预防医学特点,来加以分析。例如,某两种药物降低血压相差5毫米汞柱,经检验认为有统计学意义,但这种差异在临床却没有什么意义。某药物的疗效观察经统计学检验认为无统计学意义(尤其当其t值小于t0.05但很接近t0.05时)也应考虑多方面的因素,一方面可能此药物的疗效确实无统计学意义,另一方面可能观察例数太少或选择病例不当等等。

总之,不能用统计分析来代替专业分析,当然,也不能认为统计分析可有可无

七、假设检验中两类错误假设检验是针对H0,利用小概率事件的原理对总体参数做出统计推论。无论拒绝H0还是接受H0,都可能犯错误。

表5-3假设检验的2类错误当H0为真时,检验结论拒绝H0接受H1,这类错误称为第一类错误或Ⅰ型错误,亦称假阳性错误检验水准,就是预先规定的允许犯Ⅰ型错误概率的最大值,用α表示Ⅰ型错误(typeⅠerror)Ⅱ型错误(typeⅡerror)当真实情况为H0不成立而H1成立时,检验结论不拒绝H0反而拒绝H1,这类错误称为第二类错误或Ⅱ型错误,亦称假阴性错误

概率大小用β表示,只取单侧,一般未知,在已知两总体差值d(如μ1-μ2)、和n时,才能算出设H0:

=

0,H1:

<

0

H0实际上是成立的,但由于抽样误差的存在,偶然得到较大的值(绝对值)以及u值(绝对值)使得,按α=0.05的检验水准,拒绝H0,接受H1,结论为

<

0

此时犯Ⅰ型错误,其最大可能概率值为

确实小于

0,即H0不成立,H1成立,由于抽样的偶然性,得到较小的值(绝对值)以及u值(绝对值)使得,检验结论不拒绝H0。此时犯Ⅱ型错误,其概率为β

Ⅰ型错误与Ⅱ型错误示意图(以单侧u检验为例)以样本均数与总体均数比较的u检验举例

愈小,

愈大;相反,

愈大,

愈小同时减小Ⅰ型错误

和Ⅱ型错误

,唯一的方法就是增加样本含量n

1-β称为检验效能(powerofatest),也称把握度意义为,当两总体确有差别,按检验水准α,假设检验能发现其差别(拒绝H0)的能力。和β一样,1-β只取单侧。Ⅰ型错误与Ⅱ型错误示意图(以单侧u检验为例)TypeⅠversusTypeⅡErrorsinHypothesisTestingWhenH0istruethenH1

isfalse.IfweacceptH0wehavedonetherightthing.IfwerejectH0wehavemadeanerror.ThistypeofmistakeiscalledaTypeⅠErrors.DEFINITION1:P(TypeⅠErrors)=theprobabilityofrejectingatruenullhypothesis.WhenH0isfalsethenH1

istrue.IfweacceptH0wehavemadeanerror.IfwerejectH0wehavedonetherightthing.ThistypeofmistakeiscalledaTypeⅡErrors.DEFINITION2:P(TypeⅡErrors)=theprobabilityofacceptingafalsenullhypothesis.

II类错误的概率β

值的两个规律:1.当样本量一定时,α

愈小,则

β

愈大,反之…;2.当α

一定时,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论