卡方检验(正式)_第1页
卡方检验(正式)_第2页
卡方检验(正式)_第3页
卡方检验(正式)_第4页
卡方检验(正式)_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、华中科技大学公卫学院流行病与卫生统计系12检验Chi-squared test第第7章章蒋红卫蒋红卫Email: JHWCCC21CN.COM23概念回顾概念回顾p在总体率为在总体率为的二项分布总体中做的二项分布总体中做n1和和n2抽抽样样,样本率样本率p1和和p2与与的差别的差别,称为称为率抽样误差率抽样误差。p在总体率为在总体率为1和和2的不同总体中抽样,得的不同总体中抽样,得p1和和p2,在,在n5,可通过率的,可通过率的u检验推断是否检验推断是否1=2。p二项分布的两个样本率的检验同样可用二项分布的两个样本率的检验同样可用2检检验验。 u2121ppSpp 4 目的:目的: 推断两个总

2、体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别 多个样本率的多重比较多个样本率的多重比较 两个分类变量之间有无关联性两个分类变量之间有无关联性 频数分布拟合优度的检验。频数分布拟合优度的检验。 检验统计量:检验统计量:2 应用:应用:计数资料计数资料5基本概念基本概念例例1 某院比较异梨醇(试验组)和氢氯塞嗪某院比较异梨醇(试验组)和氢氯塞嗪(对照组)降低颅内压的疗效,将(对照组)降低颅内压的疗效,将200名患者名患者随机分为两组,试验组随机分为两组,试验组104例中有效的例中有效的99例例,对对照组照组96例中有效的例

3、中有效的78例例,问两种药物对降低颅问两种药物对降低颅内压疗效有无差别?内压疗效有无差别?6表表 200名颅内高压患者治疗情况名颅内高压患者治疗情况编号编号年龄年龄性别性别治疗组治疗组 舒张压舒张压体温体温疗效疗效137男A11.2737.5有效245女B12.5337.0有效343男A10.9336.5有效459女B14.6737.8无效20054男B16.8037.6无效如何整理此类资料?如何整理此类资料?如何分析此类资料?如何分析此类资料?7四格表(四格表(fourfold table)资料的基本形式)资料的基本形式 实际频数实际频数(actual frequency)是指各分类是指各分

4、类实际发生或未发生计数值,记为实际发生或未发生计数值,记为A。a=99b=5104c=75d=219617426200单元格单元格8NnnTCRRC 理论频数理论频数(theoretical frequency)是指按是指按某某H0假设计算各分类理论上的发生或未假设计算各分类理论上的发生或未发生计数值,记为发生计数值,记为T。式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计疗法疗法有效人数有效人数无效人数无效人数合计合计有效率有效率试验组试验组99(99(90.4890.48) )5(5(13.5213.52) )10410495.295.2对照组对照组75

5、(75(83.5283.52) ) 21(21(12.4812.48) )969678.178.1合计合计174174262620020087.087.09p残差残差 设设A代表某个类别的观察频数,代表某个类别的观察频数,T代表基于代表基于H0计算出的期望频数,计算出的期望频数,A与与T之差之差(A-T)被被称为残差称为残差p残差可以表示某一个类别观察值和理论值的残差可以表示某一个类别观察值和理论值的偏离程度,但残差有正有负,相加后会彼此偏离程度,但残差有正有负,相加后会彼此抵消,总和仍然为抵消,总和仍然为0。为此可以将残差平方后。为此可以将残差平方后求和,以表示样本总的偏离无效假设的程度求和

6、,以表示样本总的偏离无效假设的程度p类似于方差的计算思想,类似于方差的计算思想,22)()0()(TATAXxi 10Pearson 2检验的基本公式检验的基本公式p残差大小是一个相对的概念,残差大小是一个相对的概念,相对于期望频数为相对于期望频数为10时,时,20的残差非常大;可相对于期的残差非常大;可相对于期望频数为望频数为1000时时20就很小了。就很小了。因此又将残差平方除以期望因此又将残差平方除以期望频数再求和,以标准化观察频数再求和,以标准化观察频数与期望频数的差别。频数与期望频数的差别。p卡方统计量,卡方统计量,1900年由英国年由英国统计学家统计学家K. Pearson首次提出

7、。首次提出。Karl Pearson (1857 1936)1)(1()(22 列数列数行数行数 TTA11p从卡方的计算公式可见,当观察频数与期从卡方的计算公式可见,当观察频数与期望频数望频数完全一致完全一致时,时,卡方值为卡方值为0;p观察频数与期望频数越接近,两者之间的观察频数与期望频数越接近,两者之间的差异越小差异越小,卡方值越小卡方值越小;p反之,观察频数与期望频数差别越大,两反之,观察频数与期望频数差别越大,两者之间的者之间的差异越大差异越大,卡方值越大卡方值越大。p当然,卡方值的大小也当然,卡方值的大小也和自由度有关和自由度有关p检验的自由度取决于可以检验的自由度取决于可以自由取

8、值的格子自由取值的格子数目数目,而不是样本含量,而不是样本含量n。p理论上,在理论上,在n40时下式值与时下式值与2分布近似,分布近似,在理论数在理论数5,近似程度较好。,近似程度较好。12l连续型分布:正态分布(连续型分布:正态分布(Normal distribution),学生氏),学生氏t分布分布(Students t-distribution),F分布分布(F distribution)l另一个同样重要的分布另一个同样重要的分布2卡方分布卡方分布(Chi-squared distribution)。l此分布在此分布在1875年,首先由年,首先由F. Helmet所提出,所提出,而且是由

9、正态分布演变而来的,即标准正态而且是由正态分布演变而来的,即标准正态分布分布Z值之平方而得值之平方而得2分布分布13设设Xi为来自正态总体的连续性变量。为来自正态总体的连续性变量。 iiXu21222)( iXui212212)(nniiniXui 称为自由度称为自由度df=n的卡方值。的卡方值。显然,卡方分布具有可加性。显然,卡方分布具有可加性。142/)12/(2222)2/(21)( ef3.847.8112.59P P0.050.05的临界值的临界值2分布的概率密度函数曲线分布的概率密度函数曲线152220.05,10.05/21.96u当当=1时时,16第二节22表卡方检验17两组样

10、本率比较的设计分类:两组样本率比较的设计分类:1.两组两组(独立独立) 样本率的比较样本率的比较 组间数据是相互独立组间数据是相互独立,非配对设计。非配对设计。 22表卡方检验表卡方检验2.配对设计两组样本率的比较配对设计两组样本率的比较 组间数据是相关的,配对设计。组间数据是相关的,配对设计。 配对四格表卡方检验配对四格表卡方检验18两组(不配对)样本率的比较两组(不配对)样本率的比较1)四格表形式)四格表形式2)四格表不配对资料检验的专用公式)四格表不配对资料检验的专用公式二者结果等二者结果等价价各组样各组样本例数本例数是固定是固定的的组别组别阳性数阳性数阴性数阴性数合计合计率率%甲组甲组

11、a ab ba+ba+b=n=n1 1a/na/n1 1乙组乙组c cd dc+dc+d=n=n2 2c/nc/n2 2合计合计a+ca+cb+db+dN N( (a+ca+c)/N)/N)()()()(dbdccabaNbcad 22 TTA22)( 19例例1(续)(续)2086.122617496104200)7552199(22 H0:1=2 即试验组与对照组降低颅内压的即试验组与对照组降低颅内压的总体有效率相等总体有效率相等H1:12=0.05。以以=1查附表查附表8的的2界值表得界值表得P 40 ,此时有,此时有 1 T 5时,需计算时,需计算Yates连续性校正连续性校正 2值值

12、 T 1,或,或n40时,应改用时,应改用Fisher确切概率确切概率法直接计算概率法直接计算概率24(1) 校正公式的条件:校正公式的条件: 1T5,同时同时N40,用校正公式计算用校正公式计算(2) 连续校正连续校正(continuity correction)公式:公式:(3) 当当T1,或或N0.05。按。按=0.05检验水准,不拒绝检验水准,不拒绝H0,无统计学意,无统计学意义,尚不能认为两种药物治疗脑血管疾病的义,尚不能认为两种药物治疗脑血管疾病的有效率不等。有效率不等。 28正方观点正方观点: 卡方统计量抽样分布的连续性和平滑性得卡方统计量抽样分布的连续性和平滑性得到改善,可以降

13、低到改善,可以降低I I类错误的概率;类错误的概率; 校正结果更接近于校正结果更接近于FisherFisher确切概率法;确切概率法; 校正是有条件的。校正是有条件的。反方观点反方观点:经连续性校正后,经连续性校正后,P P值有过分保守之嫌;值有过分保守之嫌;连续性校正卡方检验的连续性校正卡方检验的P P值与值与FisherFisher确切确切概率法的概率法的P P值没有可比性,这是因为值没有可比性,这是因为FisherFisher确切概率法建立在四格表确切概率法建立在四格表双边固定双边固定的假定下,的假定下,而实际资料则是而实际资料则是单边固定单边固定的四格表。的四格表。29 就应用而言,无

14、论是否经过连续性校正,就应用而言,无论是否经过连续性校正,若两种检验的结果一致,无须在此问题若两种检验的结果一致,无须在此问题上纠缠。但是,当两种检验结果相互矛上纠缠。但是,当两种检验结果相互矛盾时,如例盾时,如例2,就需要谨慎解释结果了。,就需要谨慎解释结果了。 为客观起见,建议将两种结论同时报告为客观起见,建议将两种结论同时报告出来,以便他人判断。当然,如果两种出来,以便他人判断。当然,如果两种结论一致,如均为结论一致,如均为有或无统计学意义有或无统计学意义,则只报道非连续性检验的结果即可。则只报道非连续性检验的结果即可。30 配对设计:通常为配对设计:通常为同源配对同源配对。对同一观察。

15、对同一观察对象分别用两种方法处理,观察其阳性与对象分别用两种方法处理,观察其阳性与阴性结果。阴性结果。 基本用途:常用于比较基本用途:常用于比较两种检验方法两种检验方法或或两两种培养基种培养基的阳性率是否有差别。的阳性率是否有差别。 数据形式:数据形式:配对四格表形式配对四格表形式。31例例3 3 某实验室采用两种方法对某实验室采用两种方法对5858名可疑名可疑红斑狼疮患者的血清抗体进行测定,问:红斑狼疮患者的血清抗体进行测定,问:两方法测定结果阳性检出率是否有差别?两方法测定结果阳性检出率是否有差别?测定结果为:阳性、阴性(共测定结果为:阳性、阴性(共116116标本,标本,5858对)对)

16、 方法(方法(X X)乳胶凝集法乳胶凝集法 免疫荧光法免疫荧光法 对子例数对子例数 1111 3333 2 2 1212结结果果32 上述配对设计实验中,就每个对子而言,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有两种处理的结果不外乎有四种可能四种可能: :两种检测方法皆为阳性数两种检测方法皆为阳性数( (a a) );两种检测方法皆为阴性数两种检测方法皆为阴性数( (d d) );免疫荧光法为阳性,乳胶凝集法为免疫荧光法为阳性,乳胶凝集法为 阴性数阴性数( (b b) );乳胶凝集法为阳性,免疫荧光法为乳胶凝集法为阳性,免疫荧光法为 阴性数阴性数( (c c) )。其中,其中,

17、a a, , d d 为两法观察结果一致的两种情况,为两法观察结果一致的两种情况, b b, , c c为两法观察结果不一致的两种情况。为两法观察结果不一致的两种情况。33 34 按照配对设计的思路进行分析,则首先应按照配对设计的思路进行分析,则首先应当求出当求出各对的差值各对的差值,然后考察样本中差值,然后考察样本中差值的分布是否按照的分布是否按照HH0 0假设的情况假设的情况对称分布。对称分布。 按此分析思路,最终可整理出如前所列的按此分析思路,最终可整理出如前所列的配对四格表。配对四格表。 主对角线主对角线上两种检验方法的结论上两种检验方法的结论相同相同,对,对问题的解答问题的解答不会不

18、会有任何贡献有任何贡献 斜对角线斜对角线上两种检验方法的结论上两种检验方法的结论不相同不相同,显示显示了检验方法间的差异了检验方法间的差异3536H0:b=c =(12+2)/2=7( (两法总体两法总体阳性阳性率相等率相等) )H1:b c (两方法总体两方法总体阳性阳性率不等)率不等) =0.05本例本例b+c=12+2=1440,用校正公式,用校正公式本例本例2=5.793.84,P0.05。在。在=0.05水准水准,拒绝,拒绝HH0 0,接受,接受HH1 1,有统计学意义。认为,有统计学意义。认为两方法的检测率不同,乳胶凝集法的阳性检两方法的检测率不同,乳胶凝集法的阳性检测率测率22.

19、41%低于免疫检测率低于免疫检测率39.66%。179521212121222 ,.)()(cbcb37McNemarMcNemar检验检验只会利用非主对角线单元格只会利用非主对角线单元格上上的信息,即它只关心的信息,即它只关心两者不一致两者不一致的评价情况,的评价情况,用于比较两个评价者间存在怎样的倾向。因此用于比较两个评价者间存在怎样的倾向。因此,对于一致性较好的大样本数据,对于一致性较好的大样本数据,McNemarMcNemar检验可能会失去实用价值。检验可能会失去实用价值。例如对例如对1 1万个案例进行一致性评价,万个案例进行一致性评价,99959995个个都是完全一致的,在主对角线上

20、,另有都是完全一致的,在主对角线上,另有5 5个分个分布在左下的三角区,显然,此时一致性相当的布在左下的三角区,显然,此时一致性相当的好。但如果使用好。但如果使用McNemarMcNemar检验,此时反而会检验,此时反而会得出两种评价有差异的结论来。得出两种评价有差异的结论来。1053810539超几何分布超几何分布 (非(非 2检验检验 的范畴)的范畴)40n,或1T, 或P时, 10540例例4 4 某医师为研究乙肝免疫球蛋白预防胎儿某医师为研究乙肝免疫球蛋白预防胎儿宫内感染宫内感染HBVHBV的效果,将的效果,将3333例例HBsAgHBsAg阳性孕阳性孕妇随机分为预防注射组和非预防组,

21、结果见表妇随机分为预防注射组和非预防组,结果见表7-47-4。问两组新生儿的。问两组新生儿的HBVHBV总体感染率有无差总体感染率有无差别?别? 1054142 在四格表周边合计数固定不变的条件下,在四格表周边合计数固定不变的条件下,计算表内计算表内4 4个实际频数变动时的各种组合之概个实际频数变动时的各种组合之概率率Pi;再按检验假设用单侧或双侧的累计概;再按检验假设用单侧或双侧的累计概率率P,依据所取的检验水准,依据所取的检验水准做出推断。做出推断。 43 (1) (2) (3) (4) (5) 0 22 1 21 2 20 3 19 4 18 9 2 8 3 7 4 6 5 5 6 ad

22、-bc= -198 ad-bc= -165 ad-bc= -132 ad-bc =-99 ad-bc= -66 (6) (7) (8) (9) (10) 5 17 6 16 7 15 8 14 9 13 4 7 3 8 2 9 1 10 0 11 ad-bc= -33 ad-bc=0 ad-bc=33 ad-bc=66 ad-bc= 99 1 1各组合概率各组合概率Pi的计算的计算 在四格表周边合计在四格表周边合计数不变的条件下,表内数不变的条件下,表内4 4个实际频数个实际频数 a,b,c,d 变变动的组合数共有动的组合数共有“周边合计中最小数周边合计中最小数+1+1”个。个。如例如例7-4

23、7-4,表内,表内4 4个实际频数变动的组合数共个实际频数变动的组合数共有有9+1=109+1=10个,依次为:个,依次为:44各组合的概率各组合的概率P Pi i服从超几何分布,其和为服从超几何分布,其和为1 1。计算公式为计算公式为() ()!()!()! ! ! ! !iabcdacbdPa b c d n!45 2 2累计概率的计算累计概率的计算 ( ( 单、双侧单、双侧检验不同检验不同) )464748495051例例5 5 某单位研究胆囊腺癌、腺瘤的某单位研究胆囊腺癌、腺瘤的P P5353基基因表达,对同期手术切除的胆囊腺癌、腺因表达,对同期手术切除的胆囊腺癌、腺瘤标本各瘤标本各1

24、010份,用免疫组化法检测份,用免疫组化法检测P P5353基基因,资料见表因,资料见表7-67-6。问胆囊腺癌和胆囊腺。问胆囊腺癌和胆囊腺瘤的瘤的P P5353基因表达阳性率有无差别?基因表达阳性率有无差别?52530H:21,1H:21,05. 0 本例本例 a+b+c+d=10,由表,由表7-77-7可看出,四格表内各可看出,四格表内各种组合以种组合以i=4和和i=5的组合为中心呈的组合为中心呈对称分布对称分布。 *为现有样本54(1 1)计算现有样本的)计算现有样本的DD* *和和P P* *及各组合下四格表的及各组合下四格表的D Di i。 本例本例DD* *=50=50,P P*

25、*=0.02708978=0.02708978。(2 2)计算满足)计算满足DDi i5050条件的各组合下四格表的概率条件的各组合下四格表的概率P Pi i。(3 3)计算同时满足)计算同时满足DDi i5050和和P Pi iP P* *条件的四格表的累条件的四格表的累 计概率。本例为计概率。本例为P P7 7和和P P8 8,(4 4)计算双侧累计概率)计算双侧累计概率P P。 P P0.050.05,按,按 =0.05=0.05检验水准不拒绝检验水准不拒绝H H0 0,尚不,尚不能认为胆囊腺癌与胆囊腺瘤的能认为胆囊腺癌与胆囊腺瘤的P P5353基因表达阳性率不等基因表达阳性率不等。02

26、86. 000154799. 002708978. 087 PP057. 0)(287 PPP5556 确切概率法的原理具有确切概率法的原理具有通用性通用性,对于四格表,对于四格表以外的情况也适用,如行乘列表、配对、配以外的情况也适用,如行乘列表、配对、配伍表格均可伍表格均可 对于较大的行乘列表,确切概率法的对于较大的行乘列表,确切概率法的计算量计算量将很大将很大,有可能超出硬件系统可以支持的范,有可能超出硬件系统可以支持的范围围 此时可以采用计算统计学中的此时可以采用计算统计学中的其他统计计算其他统计计算技术技术加以解决,如加以解决,如BootstrapBootstrap方法等方法等57当比

27、较组行或列分类数当比较组行或列分类数2 2,称为行,称为行列表,即列表,即R RC C表。表。研究者感兴趣的问题有研究者感兴趣的问题有:( :(2检验的目的)检验的目的)1.1.多组多组( (独立样本独立样本) )样本率样本率差别有无统计意义差别有无统计意义? ?2.2.两组两组( (独立样本独立样本) )构成比构成比( (分布分布) )有无统计意义有无统计意义? ?3.3.两个分类变量分布两个分类变量分布是否独立是否独立( (有关联有关联)?)?58自由度自由度=(行数(行数-1)(列数(列数-1)等价等价)1(22 CRnnAN TTA22)( 59疗法疗法有效有效无效无效合计合计有效率有

28、效率%物理组物理组199199(186.2186.2)7 720620696.696.6药物组药物组164164181818218290.190.1外用组外用组118118262614414481.981.9合计合计481481515153253290.490.4 例例6 6 某医师研究物理疗法、药物治疗和外用膏药三某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见下表。种疗法治疗周围性面神经麻痹的疗效,资料见下表。问三种疗法的有效率有无差别?问三种疗法的有效率有无差别? 表表7-8 7-8 三种疗法有效率的比较三种疗法有效率的比较60HH0 0: 1 1= =

29、2 2 = = 3 3 =90.4=90.4(三(三组总体组总体有效有效率相等)率相等)HH1 1:三:三组总体率不等或不全等组总体率不等或不全等=0.05=0.052222199726532(.1)21.04206 481206 51144 5122220.05,20.01,221.045.99,21.049.21结论结论: :在在=0.05=0.05水准,拒绝水准,拒绝H0H0,P P0.01,0.01,认为认为三组疗法有效率不等或不全等。三组疗法有效率不等或不全等。注意注意: :此结果不能得到各两两组比较的结论。此结果不能得到各两两组比较的结论。21213 )( 04.21)151144

30、26.512067481206199(5322222 21. 904.21,99. 504.2122,01. 0222,05. 02 61二、两组和多组构成比的比较二、两组和多组构成比的比较例例7 7 某医师在研究血管紧张素某医师在研究血管紧张素I I转化酶转化酶(ACE)(ACE)基因基因I/DI/D多态(分多态(分3 3型)与型)与2 2型糖尿病肾病型糖尿病肾病(DN)(DN)的关系时,将的关系时,将249249例例2 2型糖尿病患者按有无糖尿病肾病分为两组,型糖尿病患者按有无糖尿病肾病分为两组,资料见表资料见表7-97-9。问两组。问两组2 2型糖尿病患者的型糖尿病患者的ACEACE基因

31、型基因型总体分布有无差别?总体分布有无差别?糖尿病糖尿病ACEACE基因型基因型合计合计DDDDIDIDI I I I有肾病有肾病42(37.8)42(37.8)48(43.3)48(43.3)21(18.9)21(18.9)111111无肾病无肾病30(21.7)30(21.7)75(52.2)75(52.2)36(26.1)36(26.1)138138合计合计72(28.9)72(28.9)120(48.2)120(48.2)57(22.9)57(22.9)249249表表9 9 两组两组型糖尿病患者型糖尿病患者ACEACE基因分布比较基因分布比较6263三、双向无序分类资料的关联性检验三

32、、双向无序分类资料的关联性检验 R RC C表中两个分类变量皆为无序分类变量的表中两个分类变量皆为无序分类变量的行行列表资料,又称为双向无序列表资料,又称为双向无序R RC C表资料。表资料。目的:目的:检验两事物分类检验两事物分类( (行分类和列分类行分类和列分类) )是否是否独立独立, ,从而说明两事物分类是否有关系。从而说明两事物分类是否有关系。 需要注意的是需要注意的是: :双向无序分类资料为两个或多个样本,做差双向无序分类资料为两个或多个样本,做差别检验(例别检验(例7 7););若为单样本,做关联性检验。若为单样本,做关联性检验。64统计分析统计分析:1.1.回答两事物的分类回答两

33、事物的分类是否独立是否独立( (有关系有关系) ) Pearson 2检验检验2.2.如有关如有关, ,关系关系密切程度密切程度如何如何, ,度量指标度量指标: : 列联系数列联系数(Contingency coefficient)(Contingency coefficient)列联系数列联系数C C取值范围在取值范围在0 01 1之间。愈接近于之间。愈接近于0 0,关系愈不密切;愈接近于关系愈不密切;愈接近于1 1,关系愈密切。,关系愈密切。 )(122 CRnnAN 22 nC65两事物独立的两事物独立的假定假定: : 行或列各分类的构成比相同行或列各分类的构成比相同, ,或在或在 A

34、A事物不同事物不同水平下水平下,B,B事物不同分类的作用事物不同分类的作用( (构成构成) )相等相等. .高血压高血压(B)(B)RHRH血型血型(A)(A)RHRH血型血型(A)(A)+ +- -+ +- -有有50(50)50(50)50(50)50(50)0(50)0(50)100(50)100(50)无无50(50)50(50)50(50)50(50)100(50)100(50)0(50)0(50)合计合计10010010010010010010010066例例 8 8 测得某地测得某地58015801人的人的ABOABO血型和血型和MNMN血型结血型结果如表果如表7-107-10,

35、问两种血型系统之间是否有关联?,问两种血型系统之间是否有关联?表表10 10 某地某地58015801人的血型人的血型 67 H0:两种血型系统分类无关联:两种血型系统分类无关联 (即(即行或行或列列构成比构成比相等)相等) H1:两种血型系统分类有关联:两种血型系统分类有关联 (即(即行或行或列列构成比不构成比不等)等) =0.0561314162131268434832145118234315801222 )(.).( 1883016213580116213. C结论结论:两种血型系统分类有关联。列联系数两种血型系统分类有关联。列联系数为为0.1883。两种血型系统间虽然有关联性,。两种血

36、型系统间虽然有关联性,但关系不太密切。但关系不太密切。 68当比较组当比较组k3时,时,2值有统计意义,可分解值有统计意义,可分解多个四格表了解各样本率两两间的差别。多个四格表了解各样本率两两间的差别。要进一步推断哪两两总体率有差别,若直接要进一步推断哪两两总体率有差别,若直接用四格表资料的用四格表资料的 检验进行多重比较,将会加检验进行多重比较,将会加大犯大犯类错误的概率。类错误的概率。多重比较的方法:多重比较的方法:2分割法;分割法;ScheffeScheffe可信区间法;可信区间法;SNKSNK法。法。69检验水准检验水准年龄组年龄组 治愈治愈 好转好转 无效无效组组1 1组组2 2组组

37、k k年龄组年龄组 治愈治愈 好转好转 无效无效组组1 1组组2 2年龄组年龄组 治愈治愈 好转好转 无效无效组组1 1组组3 3年龄组年龄组 治愈治愈 好转好转 无效无效组组1 1组组k k其目的是保证检验假设中其目的是保证检验假设中I I型错误型错误的概率不变。的概率不变。因分析目的不同,主要有两类多重比较形式:因分析目的不同,主要有两类多重比较形式:多个实验组间的两两比较多个实验组间的两两比较实验组与同一个对照组的比较实验组与同一个对照组的比较检验水准检验水准70分析目的为分析目的为k k个实验组间,任意两个率均进个实验组间,任意两个率均进行比较时,须进行行比较时,须进行k(k-1)/2

38、次独立的四格表次独立的四格表 检验,再加上总的行检验,再加上总的行列表资料的列表资料的 检验,共检验,共 k(k-1)/2+1次检验假设。次检验假设。故检验水准故检验水准用下式估计用下式估计0125. 012)13(305. 0,12)1( 本例本例kk71分析目的为各实验组与同一个对照组的比较分析目的为各实验组与同一个对照组的比较,而各实验组间不须比较。,而各实验组间不须比较。检验水准检验水准用下式估计用下式估计)1(2 k 722P2P2P6.240.012507.480.006258.210.004176.960.008337.880.005008.490.003587.240.0071

39、48.050.004558.730.003132 P2 P2 P73 例例9 9 对例对例6 6的资料进行两两比较,以推断的资料进行两两比较,以推断是否任两种疗法治疗周围性面神经麻痹的有效是否任两种疗法治疗周围性面神经麻痹的有效率均有差别?率均有差别?1=2, 即任意两对比组的总体有效率相等即任意两对比组的总体有效率相等12,即任意两对比组的总体有效率不等,即任意两对比组的总体有效率不等 =0.05 本例为本例为3 3个实验组间的两两比较个实验组间的两两比较 0125. 012)13(305. 0 74拒绝拒绝HH0 0,接收接收HH1 1拒绝拒绝HH0 0,接收接收HH1 1不拒绝不拒绝HH

40、0 075 例例10 10 对例对例6 6资料的药物治疗组为对照组,资料的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析两物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效率有无差别?试验组与对照组的总体有效率有无差别? T=C, 即各试验组与对照组的总体有效率即各试验组与对照组的总体有效率相等相等 TC,即各试验组与对照组的总体有效率,即各试验组与对照组的总体有效率不等不等 =0.05 本例为各实验组与同一对照组的比较本例为各实验组与同一对照组的比较0125. 0)13(205. 0 76 物理疗法组与药物治疗组比较:物理疗法组与药物治疗组比较:2=6.76, P0

41、.0125, 按按=0.0125检验水准检验水准, , 物理疗法组与药物物理疗法组与药物治疗组拒绝治疗组拒绝H0,H0,接受接受H1H1,可认为物理疗法组,可认为物理疗法组与药物治疗组的总体有效率有差别;与药物治疗组的总体有效率有差别; 外用膏药组与药物治疗组不拒绝外用膏药组与药物治疗组不拒绝H0H0,尚,尚不能认为两总体有效率有差别。不能认为两总体有效率有差别。 结合例结合例7 7资料,物理疗法的有效率高于药资料,物理疗法的有效率高于药物治疗。物治疗。77基本公式基本公式不配对四不配对四格表和校格表和校正公式正公式配对四格配对四格表公式表公式一一 . . 公式公式TTA22)( )()()()(22dbdccabaNbcad )()()()2/(22dbdccabaNNbcad cbcb 22)1( 78p目的目的: : 比较组间率和构比较组间率和构成比的差别成比的差别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论