第十一章-卡方检验_第1页
第十一章-卡方检验_第2页
第十一章-卡方检验_第3页
第十一章-卡方检验_第4页
第十一章-卡方检验_第5页
已阅读5页,还剩116页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实例1已知北方农村儿童前囟门闭合月龄为14.1月。某研究者从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否与一般儿童不同?问题1:研究目的是什么?问题2:用什么方法解决?实例2:某军区总医院欲研究A、B、C三种降血脂药物对家兔血清肾素血管紧张素转化酶(ACE)的影响,将26只家兔随机分为四组,均喂以高脂饮食,其中三个试验组,分别给予不同的降血脂药物,对照组不给药。一定时间后测定家兔血清ACE浓度(u/ml),如表1,问四组家兔血清ACE浓度是否相同?问题1:研究目的是什么?问题2:用什么方法解决?例11.1

某研究者欲比较甲、乙两药治疗小儿上消化道出血的效果,将90名患儿随机分为两组,一组采用甲药治疗,另一组采用乙药治疗,一个疗程后观察结果,见表11.1。问两药治疗小儿上消化道出血的有效率是否有差别?表11.1甲、乙两药治疗小儿上消化道出血的效果

问题1:本例资料类型?(此表称为?)问题3:研究目的是什么?问题4:用什么方法解决?问题2:本例设计类型?第十一章检验卡方检验是英国统计学家K.Pearson于1900年提出的,以卡方分布和拟合优度为理论依据,一种用途较广的假设检验方法。

英国生物计量学派KarlPearson(1857-1936)现代统计学之父完全随机设计下两个或多个样本率(或构成比)配对设计下两组频数分布线性趋势卡方检验推断两变量间有无相关关系等。用途第一节独立样本列联表资料的卡方检验第二节配对设计资料的卡方检验第三节拟合优度的卡方检验第四节线性趋势卡方检验第五节四个表的确切概率法本章内容第一节完全随机设计(独立样本)列联表资料的检验在抽样研究中,由于个体间存在变异,必然存在着抽样误差,率(或构成比)的抽样误差与均数的抽样误差概念相同。

例11.1

某研究者欲比较甲、乙两药治疗小儿上消化道出血的效果,将90名患儿随机分为两组,一组采用甲药治疗,另一组采用乙药治疗,一个疗程后观察结果,见表11.1。问两药治疗小儿上消化道出血的有效率是否有差别?表11.1甲、乙两药治疗小儿上消化道出血的效果

?研究目的:表11.1甲、乙两药治疗小儿上消化道出血的效果

两组的有效率不同有两种可能:1.两药的总体有效率无差别,两样本率的差别仅由抽样误差所致。2.两种药物的有效率确有不同。(1)建立检验假设H0:π1=π2两药的有效概率相同H1:π1≠π2两药有效概率不同检验水准

=0.05(2)计算检验统计量一、χ2检验基本思想一、卡方检验的基本思想表11.1中,27、18、40、5是整个表的基本数据,是实际观察得到的,其余数据都是从这四个基本数据相加而得的,这种资料是两组两分类资料,称为四格表(fourfoldtable),亦称2×2表(2×2table)。(画黑板)表两独立样本率比较的四格表无效假设H0为π1=π2,即两种药物治疗小儿消化道出血的有效率相同,两样本的有效率的差别仅有抽样误差所致。由于此时总体情况未知,故用样本合计有效率对总体有效率进行估计,即H0为π1=π2=74.44%,在此基础上,可以推算每个格子的期望频数,称为理论频数,用符号T表示;从样本观察到的频数称为实际频数,用符号A表示。若H0成立,则理论上:甲药组有效人数为:甲药组无效人数为:乙药组有效人数为:乙药组无效人数为:

为相应行的合计

为相应列的合计n为总例数。

表11.1甲、乙两药治疗小儿上消化道出血的效果

检验的基本公式:从基本公式可以看出,统计量值反映了实际频数和理论频数的吻合程度。值与什么有关?1.与A与T的差别/吻合程度有关。2.与格子数,严格地说是自由度有关。由统计量的公式(11.2)可以看出,,格子数越多,非负数之和,则卡方值越大,即卡方值的大小除了与A与T的差别大小有关外,还与格子数量有关。因而考虑卡方值大小的同时,应同时考虑格子数的多少。引入自由度v。式中,k为格子数,s为估计的参数个数,R为行数,C为列数。如本例中,4个格子,估计甲乙两药的有效率,则k=4,s=2,v=4-1-2=(2-1)(2-1)=1。检验的基本公式:一定自由度下,如果假设检验H0(π1=π2)成立,则实际频数和理论频数之差一般不会相差太大,值相应也不会太大;反之,实际频数和理论频数之差相差很大,则值相应也会很大,大到什么程度认为不是抽样误差造成的而是两个不同总体呢?值近似服从自由度为v分布

分布是一种连续型随机变量的概率分布。设有v个相互独立的标准正态分布随机变量Z1,Z2,Zv,的分布称为自由度为v的分布,记为。分布的形状依赖于自由度v的大小,当自由度v>1时,随着v的增加,曲线逐渐趋于对称。v趋于度∞时分布逼近正态分布。各种自由度的分布右侧尾部面积为时的临界值记为,列于附表9。

检验的基本公式:一定自由度下,如果假设检验H0(π1=π2)成立,则实际频数和理论频数之差一般不会相差太大,值相应也不会太大;反之,实际频数和理论频数之差相差很大,则值相应也会很大,大到什么程度认为不是抽样误差造成的而是两个不同总体呢?

当P≤

,则有理由认为无效假设不成立,继而拒绝H0,作出统计推断。

二、2×2列联表资料的检验。

(一)2×2列联表资料检验的步骤现以例11.1说明2×2列联表资料检验的步骤①建立假设H0:π1=π2H1:π1≠π2②确定检验水准α=0.05③计算统计量值

④确定P值

自由度=(行数-1)

(列数-1)=(2-1)

(2-1)=1,查界值表得P<0.01。⑤下结论因为P<0.01,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为两药治疗小儿上消化道出血的有效率有差别,其中乙药的有效率高于甲药。

(二)四格表的专用公式

a、b、c、d分别为四格表中的四个实际频数,n为总例数。本例:

(三)四格表统计量的连续性校正1.当n≥40,且T≥5时,不须校正,直接用基本公式(11.2)或专用公式(11.5)计算。2.任一格子的1≤T<5,且n≥40时,需计算校正值,或使用四格表的确切概率法。3.任一格子的T<1或n<40时,需改用四格表确切概率法。

例11.2

某研究欲比较甲、乙两药治疗下呼吸道感染的疗效,将65例下呼吸道感染者随机分为两组,进行随机双盲试验,结果见表11.3。两组纳入分析的病例数分别为32和33人。问两药治疗下呼吸道感染的有效率有无差别?表11.3两药治疗下呼吸道感染的效果①建立假设H0:π1=π2H1:π1≠π2②确定检验水准α=0.05③计算统计量值本例,而n>40,故应计算校正的卡方值。

④确定P值

自由度=(行数-1)

(列数-1)=(2-1)

(2-1)=1,查界值表得P>0.05。⑤下结论因为P>0.05,按α=0.05的水准,还不拒绝H0,即差异没有统计学意义。即还不能认为两药治疗下呼吸道感染的有效率有差别。注意:如果本例不校正,直接用公式(11.5)计算值,,则P<0.05,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。结论相反。例某医师用甲、乙两疗法治疗单纯消化不良,结果如下表,问两种疗法的治愈率有无差别?表两种疗法对单纯消化不良的治愈率比较

①建立假设H0:π1=π2H1:π1≠π2②确定检验水准α=0.05③计算统计量值④确定P值

υ=(2-1)x(2-1)=1,查界值表得P>0.05。⑤下结论因为P>0.05,按α=0.05的水准,不拒绝H0,差异无统计学意义。尚不能认为甲、乙两疗法对小儿单纯性消化不良的治愈率不等。

完全随机设计四格表资料χ2检验适用条件当n≥40且Tmin

≥5时,χ2检验基本公式或四格表专用公式;当n≥40,1≤Tmin<5时,需对χ2值进行校正;当n<40或Tmin<1时,改用四格表确切概率计算法。(χ2检验所得概率P≈α时)完全随机设计四格表资料χ2检验适用条件例:两组人群尿棕色阳性率比较组别阳性数阴性数合计阳性率%铅中毒病人2973680.56对照组9283724.32合计83357352.05完全随机设计四格表资料χ2检验适用条件例:组别男性女性合计实验组3565100对照组4060100合计75125200完全随机设计四格表资料χ2检验适用条件例:肝硬化与再障性贫血血清中抗血小板抗体阳性率(%)组别观察例数阳性例数阳性率%肝硬化3538.57再障20540.00合计55816.67组别观察例数阳性例数阴性例数阳性率%肝硬化353328.57再障2051540.00合计5584714.55(2.9)三、R×C列联表资料的检验。当基本数据的行数或列数大于2时,统称为行

列表或R

C表。R

C表的检验主要用于多个样本率(或构成比)的比较。行

列资料检验的专用公式n为总例数,A为每个格子的实际频数,nR为与A同行的行合计,nC为与A同列的列合计。

(一)多个样本率的比较例11.3某研究者欲比较A、B、C三种方案治疗轻、中度高血压的疗效,将年龄在50~70岁的240例轻、中度高血压患者随机等分为3组,分别采用三种方案治疗。一个疗程后观察疗效,结果见表11.4。问三种方案治疗轻、中度高血压的有效率有无差别?表11.4三种方案治疗轻、中度高血压的效果①建立假设H0:π1=π2=π3H1:三种方案治疗轻、中度高血压的有效率不等或不全等②确定检验水准α=0.05③计算统计量值

④确定P值υ=(3-1)

(2-1)=2,查界值表得P<0.01。⑤下结论因为P<0.01,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为三种方案治疗轻、中度高血压的有效率不等或不全等例某市重污染区、一般污染区和农村的出生婴儿的致畸情况如下表,问三个地区的出生婴儿的致畸率有无差别?表某市三个地区出生婴儿的致畸率比较

①建立假设H0:π1=π2=π3H1:π1,π2,π3之间不等或不全等。②确定检验水准α=0.05③计算统计量值

④确定P值υ=(3-1)

(2-1)=2,查界值表得P<0.01。⑤下结论因为P<0.01,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为三个地区的出生婴儿的致畸率有差别。

例为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的原则下,将条件相似的53名产妇随机分成三组,分别按三种不同剂量服用该药,镇痛效果如下表。试分析该药不同剂量的镇痛效果有无差别?表某药不同剂量的镇痛效果

①建立假设H0:三种剂量的镇痛效果相同H1:三种剂量的镇痛效果不同或不全相同②确定检验水准α=0.05③计算统计量值

④确定P值υ=(3-1)

(2-1)=2,查界值表得P<0.05。⑤下结论因为P<0.05,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为三种剂量的镇痛效果不同或不全相同。

(二)两个或多个构成比的比较例11.4为了解新型农村合作医疗对于农村贫困居民住院服务利用的影响,在经济条件相似的甲、乙两个国家级贫困县(其中甲县2006年已开展新型农村合作医疗,乙县2006年尚未开展)分别进行抽样调查,得到2006年应住院者未住院原因,见表11.5。问甲、乙两县应住院者未住院原因构成比是否不同?

表11.5甲、乙两县应住院者未住院原因构成比(%)

①建立假设H0:甲、乙两县应住院者未住院原因总体构成比相同同

H1:甲、乙两县应住院者未住院原因总体构成比不同②确定检验水准α=0.05③计算统计量值

④确定P值υ=(2-1)

(4-1)=3,查界值表得P>0.05。⑤下结论因为P>0.05,按α=0.05的水准,还不拒绝H0,差异没有统计学意义。即尚不能认为甲、乙两县应住院者未住院原因总体构成比分布不同。例1986年某地城市和农村20至40岁已婚妇女避孕方法情况如下表,试分析该地城市和农村避孕方法的总体分布有无差别?

表某地城市和农村已婚妇女避孕方法情况

①建立假设H0:城市和农村已婚妇女避孕方法的总体分布相同H1:城市和农村已婚妇女避孕方法的总体分布不全同②确定检验水准α=0.05③计算统计量值

④确定P值υ=(2-1)

(4-1)=3,查界值表得P<0.01。⑤下结论因为P<0.01,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为城市和农村已婚妇女避孕方法的总体分布不同

例某医院研究急性白血病患者与慢性白血病患者的血型构成情况,其资料如下表,问两组血型构成比是否不同?表急性与慢性白血病患者的血型构成

①建立假设H0:急性与慢性白血病患者的构成比相同。H1:急性与慢性白血病患者的构成比不相同。②确定检验水准α=0.05③计算统计量值

④确定P值υ=(2-1)

(4-1)=3,查界值表得P>0.05。⑤下结论因为P>0.05,按α=0.05的水准,不拒绝H0,差异无统计学意义。尚不能认为急性与慢性白血病患者的构成比不相同。

行×列表检验时的注意事项

计算

2值时,只能用绝对数,不能用相对数

2检验要求理论频数不宜太小,一般认为行×列表中不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。关于单向有序行列表的统计处理。当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们某两者间有差别。

适用条件及注意事项举例

独立样本RXC列联表χ2检验

磷霉素不同制剂对皮肤软组织感染的疗效制剂观察人数痊愈人数未愈人数痊愈率%软膏66471971.21油膏25101540.00粉剂2031594478.33合计2942167773.46适用条件及注意事项举例

独立样本RXC列联表χ2检验

某省三个地区花生的黄曲霉毒素污染率的比较地区检验的样品数合计污染率%未污染污染甲地6232979.3乙地30144431.8丙地821027.3合计44398347.6两组呼吸系统感染病人疾病构成分析用药分组各种疾病的例数

合计急支慢支肺炎支扩支哮实验组333235376对照组333223575合计6664588151独立样本RXC列联表χ2检验

适用条件及注意事项举例表2慢性咽炎两种药物疗效资料药物疗效合计有效率%有效无效兰芩口服液4144591.1银黄口服液24113568.6合计65158081.2表9-6三种不同治疗方法治疗慢性支气管炎疗效组别疗效合计有效无效A35540B201030C72532合计6240102理论频数太小有三种处理办法增加样本例数以增大理论频数。删去上述理论频数太小的行或列。将太小理论频数所在行或列与性质相近的邻行邻列中的实际频数合并,使重新计算的理论频数增大。单向有序行列表的统计处理当效应按强弱(或优劣)分为若干个级别,比如分为-、±、+、++、+++、++++等6个等级,在比较各处理组的效应有无差别时,宜用第12章的秩和检验法。如作

2检验只说明各处理组的效应在构成比上有无差异。多个样本率的两两比较当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们某两者间有差别。两两比较的方法较多,大致分为三类:

①调整水准后进行两两比较(本教材介绍此法);②

2分割;

③估计两率之差的置信区间。

例为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的原则下,将条件相似的53名产妇随机分成三组,分别按三种不同剂量服用该药,镇痛效果如下表。试分析该药不同剂量的镇痛效果有无差别?表某药不同剂量的镇痛效果

①建立假设H0:三种剂量的镇痛效果相同H1:三种剂量的镇痛效果不全相同②确定检验水准α=0.05③计算统计量值

④确定P值υ=(3-1)

(2-1)=2,查界值表得P<0.05。⑤下结论

因为P<0.05,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为三种剂量的镇痛效果不全相同。

对于比较多组独立样本的卡方检验,拒绝H0只能说各组总体率不全相同,即多组中至少有两组的有效率是不同的,但并不是多组有效率彼此间均不相同。若要明确哪两组间不同,还须进一步作多组间的两两比较。

两两比较的可能数量:

两两比较时新检验水准:

本例为三种剂量的镇痛效果进行比较。因为经假设检验,拒绝H0,接受H1,差异有统计学意义。即可认为三种剂量的镇痛效果不全相同。然后,可以进行三种剂量的镇痛效果的两两比较。

两两比较的可能数量:

两两比较时新检验水准:

表不同剂量有效率之间的两两比较注:表中“-”表示差别没有统计学意义,“*”表示差别有有统计学意义第二节配对设计资料的检验一、配对22列联表资料的检验(McNemar检验)配对四格表资料作比较的目的是通过单一样本数据推断两种处理的结果有无差别。常用于判断两种检验方法、两种培养方法等的差别。

第二节配对设计资料的χ2检验配对四格表资料设有132份食品标本,每份一分为二,分别用两种方法做沙门菌检验,结果如下,试比较两法的阳性结果是否有差别?

表9-8两法检验结果比较甲乙合计阳性阴性阳性801090阴性311142合计11121132标本编号甲法乙法分类1++2+-3-+4--5++6+-7--….….….132--配对设计资料的原始记录形式第二节配对设计资料的χ2检验甲乙合计阳性阴性阳性80(a)10(b)90(n1)阴性31(c)11(d)42(n2)合计111(m1)21(m2)132(n固定值)表9-8两法检验结果比较由上表可看出:由此可见,在配对四格表中,a、d在比较两种属性的阳性率有无差异时不起作用,故只需比较甲+乙-的对子数b与甲-乙+的对子数c之间的差别来反映两种属性的阳性率的差异,则无效假设H0为B=C,即b、c代表的总体相等,b、c对应的理论频数为。

将这两个格子的实际频数和理论频数代入卡方统计量的基本公式中(式11.2):

即配对设计四格表检验公式为:上式又称McNemar检验。

当b+c<40时,需做连续性校正,公式如下:注意:a、d反映的甲、乙两种属性一致的情况。由于a、d两个格子不能反映差异,因此,当a、d比较大,b、c比较小时,若得到差异有统计学意义,需结合两样本率差异的大小得出专业结论。

有28份白喉病人的咽喉涂抹标本,把每份标本分别接种在甲、乙两种白喉杆菌培养基上,结果如下表,问两种白喉杆菌培养基的效果有无差别?

表甲、乙两种白喉杆菌培养基的培养结果甲培养基乙培养基合计+—+11(a)9(b)20-1(c)7(d)8合计121628

①建立假设H0:B=CH1:B≠C②确定检验水准α=0.05③计算统计量值本例b=9,c=1,b+c<40,故计算校正值。④确定P值υ=(2-1)

(2-1)=1,查界值表得P<0.05。

⑤下结论因为P<0.05,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为甲、乙两种白喉杆菌培养基的培养效果不同,甲培养基阳性率较高。

例11.6

有某研究者欲比较心电图和生化测定诊断低钾血症的价值,分别采用两种方法对79名临床确诊的低钾血症患者进行检查,结果见下表。问两种方法的检测结果是否不同?

表两种方法诊断低钾血症的结果

①建立假设H0:B=CH1:B≠C②确定检验水准α=0.05③计算统计量值本例b=25,c=4,b+c=29<40,故计算校正值。④确定P值υ=(2-1)

(2-1)=1,查界值表得P<0.01。

⑤下结论因为P<0.01,按α=0.05的水准,拒绝H0,接受H1,差异有统计学意义。即可认为两种方法的检测结果不同。由于心电图检测的阳性率为88.62%,生化测定方法的阳性率为62.03%,故心电图检测的阳性率高于生化测定方法的阳性率。

二、配对设计的R

R表资料的检验在配对四格表中,分类变量只有2个取值,即二分类,但在实际工作中,分类变量具有R

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论