第七章、卡方检验

上传人：5*** IP属地：湖北上传时间：2021-11-16 格式：PPT 页数：74 大小：21.51MB 积分：28 举报 版权申诉

已阅读5页，还剩69页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、 1卡方分布的基本知识卡方分布的基本知识普通四格表资料卡方检验普通四格表资料卡方检验配对四格表资料卡方检验配对四格表资料卡方检验行行*列表资料卡方检验列表资料卡方检验多个样本率间的多重比较多个样本率间的多重比较有序分组资料的线性趋势检验有序分组资料的线性趋势检验2设随机变量设随机变量u1，u2，uk，相互独立，且都服从标准正态，相互独立，且都服从标准正态分布分布N (0，1)。那么，我们将。那么，我们将k个独立标准正态变量的平方个独立标准正态变量的平方和称为和称为卡方变量，它卡方变量，它满足自由度为满足自由度为的卡方分布，记为：的卡方分布，记为：2221222221212. .( )xxxXu

2、uuuX 如果随机变量如果随机变量X满足以下概率密度函数，满足以下概率密度函数，则称其满足自由度为则称其满足自由度为的卡方分布的卡方分布22221()22 Xf XXe221u自自由由度度，222122uu自自由由度度，222155uu自自由由度度，+ +1022110iu自自由由度度，3522135iu自自由由度度，其其频频数数分分布布仍仍然然为为偏偏态态22 取取近近似似正正态态分分布布222 21 , 1N当当确定后，卡方分布曲线下右侧尾部的面确定后，卡方分布曲线下右侧尾部的面积为积为a a时，横轴上相应的卡方值，记为时，横轴上相应的卡方值，记为 2 2a,a,，如下图如下图;实际应用

3、时，可根据实际应用时，可根据由附表由附表8查得查得如果如果 2 2 2 2a,a,，曲线下面积小于，曲线下面积小于a a；反之则；反之则大于大于a a 2(a a, )a1875年，年，F. Helmet得出：来自正态总体的样本方得出：来自正态总体的样本方差的分布服从卡方分布：差的分布服从卡方分布：因此卡方分布可用于总体方差的区间估计：因此卡方分布可用于总体方差的区间估计：卡方分布也可用于样本方差与总体方差比较的假卡方分布也可用于样本方差与总体方差比较的假设检验设检验222(1)(1)nSn 222220.9750.025(1)(1)95% ，总总体体方方差差的的可可信信区区间间，nSnS从

4、一正态总体中抽样，样本方差从一正态总体中抽样，样本方差s2并不总等于总并不总等于总体方差体方差2，二者间存在抽样误差；这种抽样误差，二者间存在抽样误差；这种抽样误差存在统计规律存在统计规律根据样本方差的分布规律有：根据样本方差的分布规律有：22220.975,10.025,1220020(1)(1) nnnsns 若若或或则则认认为为总总体体方方差差不不是是1900年年K. Pearson又从检验分布的拟合优度又从检验分布的拟合优度(goodness of fit)中也发现了卡方分布可用于检验中也发现了卡方分布可用于检验资料的实际频数和理论频数是否相符等问题：资料的实际频数和理论频数是否相符等

5、问题： 221 kiiiiATTCarl Pearson or Karl Pearson (1857-1936)Journal BiometrikaPearson product-moment correlation coefficient、Linear regression、Pearsons chi-square test12 在两对遗传因子的试验中，在两对遗传因子的试验中，F2的四种表型见下表，问该结的四种表型见下表，问该结果能否满足果能否满足Mendel关于关于F2的的9:3:3:1规律？规律？假设满足上述规律，则不难求出假设满足上述规律，则不难求出2500株植物中各种表型的株植物中各种

6、表型的理论频数理论频数T将实际频数将实际频数A与对应的理论频数与对应的理论频数T代入公式得：代入公式得： 2421222212601406.25625468.75610468.755156.25 =1406.25468.75468.75156.25 =256.2667 iiiiATT本例中有四个实际频数，其中受到总频数为本例中有四个实际频数，其中受到总频数为2500的限制，因此能够自由取值的仅有的限制，因此能够自由取值的仅有4-1=3个，所个，所以自由度以自由度=3查表得查表得20.05,3=7.81，故在，故在=0.05的水准上拒绝的水准上拒绝H0，接受接受H1；认为该批植物的两种遗传因子不

7、满足；认为该批植物的两种遗传因子不满足9:3:3:1的遗传定律；可能出现连锁遗传的遗传定律；可能出现连锁遗传在课文在课文P96、P126中，详细阐述了如何使用卡方中，详细阐述了如何使用卡方检验推断某现象的频数分布是否满足特定的概率检验推断某现象的频数分布是否满足特定的概率分布分布例如资料是否满足正态分布、二项分布、例如资料是否满足正态分布、二项分布、Poisson等医学研究中常见的概率分布等医学研究中常见的概率分布 24212222=4-1-1()26-10.877410-31.35252830.1229189.6472 =10.877431.352530.12299.6472 =42.95i

8、iiiATT 自自由由度度组组数数计计算算卡卡方方值值需需要要事事先先估估计计总总体体概概率率普通四格表的普通四格表的2检验可用于：检验可用于：两个样本率间的比较两个样本率间的比较两两个二分类变量间关联度分析个二分类变量间关联度分析*21某中药在改变剂型前治疗某中药在改变剂型前治疗152例，治愈例，治愈129例；改变剂例；改变剂型后又观察型后又观察130例，治愈例，治愈101例，改变剂型前后的疗效例，改变剂型前后的疗效是否不同？是否不同？组别组别疗效疗效合计合计(有效率有效率)治愈治愈未愈未愈旧剂型旧剂型12923152(84.9%)新剂型新剂型10129130(77.7%)合计合计23052

9、28222在表格中有两组，每组的结果为二分类结果在表格中有两组，每组的结果为二分类结果（22），这样的表格称为四格表，其通用格式），这样的表格称为四格表，其通用格式表达如下：表达如下：23 a+b c+d abcdac bdN 阳阳性性阴阴性性合合计计分分组组甲甲分分组组乙乙合合计计从表中可见两剂型的治愈率不相同，那么这从表中可见两剂型的治愈率不相同，那么这种差别究竟是由于抽样误差还是由于不同剂种差别究竟是由于抽样误差还是由于不同剂型疗效的确有差别？型疗效的确有差别？不妨假设两剂型的疗效是相同的，那么此时不妨假设两剂型的疗效是相同的，那么此时两种剂型的疗效之差仅仅来源于抽样误差两种剂型的

10、疗效之差仅仅来源于抽样误差24既然假设两剂型的总体疗效相同，可以考虑将既然假设两剂型的总体疗效相同，可以考虑将两组样本资料合并，计算一个两组样本资料合并，计算一个“合计率合计率”，作，作为总体率的估计为总体率的估计两剂型的合计治愈率两剂型的合计治愈率Pc=230/282=81.56%在此合计治愈率的情况下，治疗在此合计治愈率的情况下，治疗152例患者应该例患者应该有有Pc152=124.0例治愈，例治愈，(1-Pc)152 =28.0例例未愈；同理如果治疗未愈；同理如果治疗130例患者，应该有例患者，应该有106.1例有效，例有效，23.9例无效例无效将上述数据称为疗效的理论数将上述数据称为疗

11、效的理论数，据此可推算其，据此可推算其余数据的理论频数余数据的理论频数2526()()()()abcdacaaTabNbdbbTabNacccTcdNbdddTcdN所所对对应应的的列列合合计计值值所所对对应应的的行行合合计计值值总总例例数数所所对对应应的的列列合合计计值值所所对对应应的的行行合合计计值值总总例例数数所所对对应应的的列列合合计计值值所所对对应应的的行行合合计计值值总总例例数数所所对对应应的的列列合合计计值值所所对对应应的的行行合合计计值值总总例例数数组别组别疗效疗效合计合计治愈治愈(理论治愈理论治愈)未愈未愈(理论未愈理论未愈)旧剂型旧剂型129(124.0)23(28.0)1

12、52新剂型新剂型101(106.1)29(23.9)130合计合计2305228227从表中可见，疗效的理论数（根据假设两总体从表中可见，疗效的理论数（根据假设两总体疗效相同得到）与实际人数存在差别疗效相同得到）与实际人数存在差别如果我们的假设成立的话，这种差别属于抽样如果我们的假设成立的话，这种差别属于抽样误差，应该不会很大；反之，如果这种差别很误差，应该不会很大；反之，如果这种差别很悬殊，则因该怀疑原假设不成立悬殊，则因该怀疑原假设不成立如何评价如何评价“悬殊悬殊”与与“不悬殊不悬殊”？28卡方检验基本公式卡方检验基本公式：理论数与实际数间的差距可为正亦可为负，因此需要理论数与实际数间的差

13、距可为正亦可为负，因此需要对二者之差取平方，而后再累加对二者之差取平方，而后再累加如前所述，比较两组数据变异程度，直接比较标准差如前所述，比较两组数据变异程度，直接比较标准差是不合理的，因为两组数据的均数可能差距甚大或单是不合理的，因为两组数据的均数可能差距甚大或单位不同位不同例如：例如：A=303，T=300，A-T=3； A=33，T=30，A-T=3；因此仅有；因此仅有(A-T)2尚不足以说明二者间不吻合的尚不足以说明二者间不吻合的程度，需要对程度，需要对A与与T间的差距作间的差距作“标准化标准化”或或“相对相对化化”29222()()ATT 实实际际频频数数理理论论频频数数理理论论频频

14、数数如何对如何对A与与T间的差距作间的差距作“相对化相对化”或或“标准标准化化”？最直观的方法就是将离差的平方除于一个频最直观的方法就是将离差的平方除于一个频数数实际频数实际频数A或理论频数或理论频数T最终将其除于最终将其除于T可有以下几点解释：可有以下几点解释：为了避为了避免免A=0时除式没有意义的情况，时除式没有意义的情况，实际频数实际频数A即使在样本含量相同的情况下，仍将随不同抽即使在样本含量相同的情况下，仍将随不同抽样改变；而样改变；而T无此问题，比无此问题，比A稳定，用其作为分稳定，用其作为分母更稳健也更具代表性母更稳健也更具代表性30此外，卡方计算公式中每项均非负，因此卡方此外

15、，卡方计算公式中每项均非负，因此卡方值的大小不仅取决于值的大小不仅取决于A与与T间的相对差距，还取间的相对差距，还取决于累加项数的多少决于累加项数的多少因此需对累加项数作调整，引入因此需对累加项数作调整，引入“自由度自由度”的的概念概念在列联表资料中（四格表也是一种列联表），在列联表资料中（四格表也是一种列联表），自由度可以简单地表达为自由度可以简单地表达为(行数行数-1)(列数列数-1)，即，即(R-1)(C-1)；其含义为；其含义为列联表中除行、列合计值列联表中除行、列合计值外可以自由取值的格子个数（或总自由度外可以自由取值的格子个数（或总自由度-行合行合计自由度计自由度-列合计自由度）列

16、合计自由度）31如果假设成立，实际数与理论数的差距应该较如果假设成立，实际数与理论数的差距应该较小，按照上式计算的卡方值因该接近小，按照上式计算的卡方值因该接近0，如果卡，如果卡方值远离方值远离0则应该拒绝原假设则应该拒绝原假设卡方值满足卡方分布，求得相应卡方值的曲线卡方值满足卡方分布，求得相应卡方值的曲线下面积就可以得到下面积就可以得到P值，进而作结论值，进而作结论可见卡方检验的基本原理就是分析实际频数与可见卡方检验的基本原理就是分析实际频数与根据假设构建的理论频数间的吻合程度（拟合根据假设构建的理论频数间的吻合程度（拟合度）度）32H0：两总体率相同：两总体率相同 H1：两总体率不同：两总

17、体率不同a a=0.05 2=(A-T)2/T计算卡方值为计算卡方值为2.428自由度自由度v=(R-1)(C-1)=1,即四个格子中可自由取即四个格子中可自由取值的个数；本例中，由于行列的合计值固定，值的个数；本例中，由于行列的合计值固定，所以四个格子中只有一个可自由取值，故所以四个格子中只有一个可自由取值，故v=1查表得：查表得： 2 20.05,10.05,1=3.84，所以，所以P0.05，在，在a a=0.05的水准上不拒绝的水准上不拒绝H0，尚不认为两种剂型的治，尚不认为两种剂型的治愈率不同愈率不同33如前所述，卡方分布是连续的；然而如前所述，卡方分布是连续的；然而理论数的取值却是

18、不连续的；因此本理论数的取值却是不连续的；因此本章节的公式章节的公式7-1是对卡方的近似公式，是对卡方的近似公式，其使用效能受到理论数大小的制约其使用效能受到理论数大小的制约34由离散型资料按卡方检验公式式算得的卡方值均有由离散型资料按卡方检验公式式算得的卡方值均有偏大的趋势（使得我们偏向于拒绝原假设），尤其偏大的趋势（使得我们偏向于拒绝原假设），尤其是当自由度是当自由度=1 而且理论数较小时，偏差较大而且理论数较小时，偏差较大Frank Yates（1934）提出对四格表卡方值进行连）提出对四格表卡方值进行连续性矫正续性矫正矫正后的卡方值记为矫正后的卡方值记为 2c352210.5kiici

19、iATT当理论频数当理论频数T有有T5，而且而且n40时，卡方公时，卡方公式不需要校正，直接使用式不需要校正，直接使用当理论频数当理论频数T有有1T5，而且而且n40时，需时，需要校正，或者用精确概率法计算概率值要校正，或者用精确概率法计算概率值当理论频数当理论频数T有有T1，或者或者n40时，只可时，只可用精确概率法计算概率值用精确概率法计算概率值36原始卡方公式需要计算理论数，略显麻烦原始卡方公式需要计算理论数，略显麻烦在四格表资料中，可以使用专用公式，省略计算理在四格表资料中，可以使用专用公式，省略计算理论数的过程论数的过程专用公式如下：专用公式如下： 22 a+b c+dabcdac

20、bdNadbcnabcdacbd 37若有若有1T5，而且，而且n40时，该专用公式同样需时，该专用公式同样需要校正要校正38 22/ 2adbcnnabcdacbd 将病情相似的淋巴系统肿瘤患者随机分成两组，分别作将病情相似的淋巴系统肿瘤患者随机分成两组，分别作单纯化疗与复合化疗，缓解情况见下表，问两疗法的缓单纯化疗与复合化疗，缓解情况见下表，问两疗法的缓解情况是否不同？解情况是否不同？化疗化疗方法方法缓解情况缓解情况合计合计缓解缓解(理论缓解理论缓解)未缓解未缓解(理论未缓解理论未缓解)单纯化疗单纯化疗2(4.8)10(7.2)12复合化疗复合化疗14(11.2)14(16.8)28合计合

21、计16244039四格表卡方检验的校正四格表卡方检验的校正在上表中最小的理论数应该是在上表中最小的理论数应该是“单纯化疗单纯化疗” “缓解缓解”所对应，因为它所对应的行、列合计值最小；所对应，因为它所对应的行、列合计值最小；2所对所对应的理论数为应的理论数为4.8，小于，小于5，而且例数不小于，而且例数不小于40，所，所以本题应该作校正以本题应该作校正校正后卡方值为校正后卡方值为2.624（未校正时为（未校正时为3.889），故尚不），故尚不认为两方案缓解情况不同认为两方案缓解情况不同40什么是配对设计？什么是配对设计？常见配对设计的情况是那些？常见配对设计的情况是那些？41同一批样品用两种不

22、同的方法处理，处理同一批样品用两种不同的方法处理，处理的结果为二分类资料的结果为二分类资料观察对象根据配对条件配成对子，同一对观察对象根据配对条件配成对子，同一对子中的不同个体分别接受不同的处理，处子中的不同个体分别接受不同的处理，处理的结果为二分类资料理的结果为二分类资料42例例7-3：某实验室分别用乳胶凝集法和免疫荧光法：某实验室分别用乳胶凝集法和免疫荧光法对对58名可疑系统红斑狼疮患者血清中抗核抗体进名可疑系统红斑狼疮患者血清中抗核抗体进行测定，结果见下表，问两种方法的检测结果有行测定，结果见下表，问两种方法的检测结果有无差别无差别：43 乳胶法乳胶法免疫法免疫法份数份数 11 2

23、 12 33在本例题中每份标本被一分为二（两份标本实质上在本例题中每份标本被一分为二（两份标本实质上是一样的），同时接受两种方法检测；这样抗核抗是一样的），同时接受两种方法检测；这样抗核抗体检出情况差别完全取决于不同的方法，而与受检体检出情况差别完全取决于不同的方法，而与受检者的基本情况无关者的基本情况无关所以本例为配对设计，目的是通过样本资料判断两所以本例为配对设计，目的是通过样本资料判断两方法的总体阳性概率是否有差别方法的总体阳性概率是否有差别44我们将上述表格稍作改变，得到如下四格表：我们将上述表格稍作改变，得到如下四格表：该四格表与前面所介绍的普通四个表有所不同；普通该四格表与前面所介

24、绍的普通四个表有所不同；普通四格表的四格表的“行行”为分组因素，为分组因素，“列列”为分组的结局，为分组的结局，而在配对四个表中，而在配对四个表中，“行行”中既包含分组因素，同时中既包含分组因素，同时也有该因素的结局，也有该因素的结局，“列列”也同样也同样，所以这种四格表，所以这种四格表称为配对四格表称为配对四格表免疫法免疫法乳胶法乳胶法合合计计 11 12 23 2 33 35 合合计计 13 45 5845对含量为对含量为n的一份随机样本同时按照两个二的一份随机样本同时按照两个二项分类属性，进行交叉分类形成的四格表项分类属性，进行交叉分类形成的四格表属性属性A分类分类属性属性B

25、分类分类合合计计阳阳性性阴阴性性阳阳性性 a c a+c 阴阴性性 b d b+d 合合计计 a+b c+d n4647在配对设计的四格表中，如果要了解不同的在配对设计的四格表中，如果要了解不同的处理方案的结局是否有别（例如两种检测方处理方案的结局是否有别（例如两种检测方法的阳性率是否有别）并不需要用到所有四法的阳性率是否有别）并不需要用到所有四格中的数据格中的数据免疫法免疫法中的阳性率为中的阳性率为(11+12)/58；乳胶法；乳胶法中的中的阳性率为阳性率为(11+2)/58；可见两者都阴性可见两者都阴性的的33份份标本对二者阳性率的差别没有影响，而且二标本对二者阳性率的

26、差别没有影响，而且二者都阳性者都阳性的的11份份标本也对结果没有影响（两标本也对结果没有影响（两种方法结果一致的对二者的率差没有影响），种方法结果一致的对二者的率差没有影响），导致两者阳性率的差别主要来源于培养结果导致两者阳性率的差别主要来源于培养结果不一致不一致的的14份份样本样本(122)48假设假设122的主要原因是抽样误差导致，那么两的主要原因是抽样误差导致，那么两方法的总体阳性率就是一致的方法的总体阳性率就是一致的所以其假设主要针对所以其假设主要针对12与与2，即，即H0为为B=C，两种，两种方法的抗核抗体阳性检出率相等方法的抗核抗体阳性检出率相等如果如果H0成立，则二者检测结果不一

27、致的两个格成立，则二者检测结果不一致的两个格子理论数都应该是子理论数都应该是(b+c)/2所以卡方检验的公式变为：所以卡方检验的公式变为：49将数据代入上述公式中，因为将数据代入上述公式中，因为12+2小于小于40，故需要校正，校正卡方值，故需要校正，校正卡方值为为5.79因为因为5.793.84，故，故P0.05，在，在a a0.05的水准上拒绝的水准上拒绝H0，认为两法的，认为两法的阳性检出率不同阳性检出率不同50 2222222/ 2/ 2=/ 2/ 2 =111401=cbbccbcATTbcbcbcbcbcbcMcNemarbc 行行数数列列数数；当当时时需需要要校校正正，校校正正公

28、公式式如如下下：，上上述述检检验验也也称称为为检检验验本法一般用于本法一般用于样本含量不太大样本含量不太大的资料。因为的资料。因为它仅考虑了两法结果不一致的两种情况它仅考虑了两法结果不一致的两种情况(b, c)，而未考虑样本含量而未考虑样本含量n和两法结果一致的两种和两法结果一致的两种情况情况(a, d)。所以，当。所以，当n很大且很大且a与与d的数值很的数值很大（即两法的一致率较高），大（即两法的一致率较高），b与与c的数值相的数值相对较小时，即便是检验结果有统计学意义，对较小时，即便是检验结果有统计学意义，其实际意义往往也不大其实际意义往往也不大51如果有超过如果有超过2组，每组的结局超过

29、组，每组的结局超过2种分类，种分类，就构成了就构成了RC列联表；四格表是最简单的列联表；四格表是最简单的列联表列联表完全随机设计的列联表资料的卡方检验原理完全随机设计的列联表资料的卡方检验原理与四格表的相同，只不过组数或结局增多了与四格表的相同，只不过组数或结局增多了而已而已52例例7-6：某医师研究物理疗法、药物治疗和外用膏药三：某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效，资料见下表。种疗法治疗周围性面神经麻痹的疗效，资料见下表。问三种疗法的有效率有无差别？问三种疗法的有效率有无差别？53其检验思想同四格表卡方检验：先假设三其检验思想同四格表卡方检验：先假设三种

30、种疗法的总体疗效相同疗法的总体疗效相同，将三组的治疗情况合，将三组的治疗情况合并作为并作为总有效率的总有效率的估计值，而后可以据此计估计值，而后可以据此计算算各处理方案的各处理方案的理论有效与无效人数，如果理论有效与无效人数，如果假设成立的话它们间的差别应该很小，卡方假设成立的话它们间的差别应该很小，卡方值应该不大，否则就有理由认为它们不是来值应该不大，否则就有理由认为它们不是来源于同一总体源于同一总体H0:三疗法有效率相同三疗法有效率相同；H1:三疗法有效率三疗法有效率不不全全相同相同54请注意，对立假设包括多种情况：例如请注意，对立假设包括多种情况：例如三组间互不相同、三组间互不相同、某两

31、组间相同且都与第三组不同某两组间相同且都与第三组不同；所以如果拒绝原假设，；所以如果拒绝原假设，还需要对三组进行还需要对三组进行多重比较多重比较(卡方分割卡方分割)才可以最终下结才可以最终下结论论卡方检验的公式既可以使用基本公式卡方检验的公式既可以使用基本公式 2=(A-T)2/T；也可以通过下列公式减少计算量：也可以通过下列公式减少计算量：55221 ;(-1)(1)ijijijijAnAnnn nn 式式中中为为实实际际频频数数，与与为为该该实实际际数数对对应应的的行行、列列的的合合计计值值，为为总总例例数数；自自由由度度行行数数列列数数需要说明一点：该公式也可以用于普通四格需要说明

32、一点：该公式也可以用于普通四格表，它的结果与四格表专用公式表，它的结果与四格表专用公式(未校正未校正)计计算结果完全相同算结果完全相同将表中数据代入：将表中数据代入：查表得：查表得： 2 20.05,20.05,2=5.99，所以，所以P0.05，在，在a a=0.05的水准上拒绝的水准上拒绝H0，认为三种疗法的总，认为三种疗法的总体有效率不全相同体有效率不全相同5622221997265321 =21.04481 20651 20651 144(-1)(1)2 行行数数列列数数例例7-7：某医师在研究血管紧张素：某医师在研究血管紧张素I转化酶转化酶(ACE)基因基因I/D多态（分多态（分3型

33、）与型）与2型糖尿病肾病型糖尿病肾病(DN)的关系时，的关系时，将将249例例2型糖尿病患者按有无糖尿病肾病分为两组，型糖尿病患者按有无糖尿病肾病分为两组，资料见下表。问两组资料见下表。问两组2型糖尿病患者的型糖尿病患者的ACE基因型总基因型总体分布有无差别？体分布有无差别？57 组别组别DDIDII合计合计 DN组组42（37.8）48（43.3）21（18.9）111 无无DN组组30（21.7）72（52.2）36（26.1）138 合计合计72（28.9）120（48.2） 57（22.9）249请注意，本例题中只有两组观察对象，因此备择假设请注意，本例题中只有两组观察对象，因此备择假

34、设为为“两组患者的基因构成不同两组患者的基因构成不同”H0:两组患者的基因构成相同两组患者的基因构成相同 H1:两组患者的基因构成不同两组患者的基因构成不同a a=0.05代入公式得：代入公式得：在在a=0.05的水准上，拒绝的水准上，拒绝H0，接受，接受H1，认为两组患，认为两组患者的总体基因构成不同者的总体基因构成不同58 2222424836=249+-1 =7.91111 72111 120138 57= 2-13-1 =2 同四格表资料一样，同四格表资料一样，RC表的表的 2分布是建立在大样本的假定上的，分布是建立在大样本的假定上的，要求总例数不可过少，不能有要求总例数不可过少，不能

35、有1/5以上的格子理论频数小于以上的格子理论频数小于5，且不，且不能有一个格子的理论频数小于能有一个格子的理论频数小于1如果出现上述情况，可以考虑：增大样本量；如果出现上述情况，可以考虑：增大样本量；根据专业知识根据专业知识合理地合理地合并相邻的组别；删除理论数太小的行列合并相邻的组别；删除理论数太小的行列；改用其它方法分析，；改用其它方法分析，例如确切概率法例如确切概率法当多个样本率（或构成比）作当多个样本率（或构成比）作 2检验，结论为拒绝零假设时，只能检验，结论为拒绝零假设时，只能认为各总体率（或总体构成比）之间总的有差别，不能说明两两之认为各总体率（或总体构成比）之间总的有差别，不能

36、说明两两之间有差别；两组间的比较可采用间有差别；两组间的比较可采用 2分割的方法分割的方法 59多个样本率比较的资料若经卡方检验的结论为拒绝多个样本率比较的资料若经卡方检验的结论为拒绝H0 ，接受，接受H1 时，意味着总体率间不全相同，须用时，意味着总体率间不全相同，须用卡方分割法把卡方分割法把 RC表分成多个独立的四格表进行两表分成多个独立的四格表进行两两比较，但必须重新规定检验水准，其目的是为保两比较，但必须重新规定检验水准，其目的是为保证检验假设中证检验假设中I型错误型错误的概率不变。的概率不变。三组作两两比较需要比较三次，如果每次的显著性三组作两两比较需要比较三次，如果每次的显著性水

37、准均为水准均为0.05，则三次比较后的显著性水准为，则三次比较后的显著性水准为1-0.953=0.14，远大于原先的预期，所以要重新确认，远大于原先的预期，所以要重新确认a a，使得经过三次比较后一类错误仍为使得经过三次比较后一类错误仍为0.05因分析目的不同，因分析目的不同，k个样本率两两比较的个样本率两两比较的次数不同，故重新规定的检验水准的估次数不同，故重新规定的检验水准的估计方法亦不同；通常有两种情况计方法亦不同；通常有两种情况任意两个实验组间的比较，以及多个实任意两个实验组间的比较，以及多个实验组同一个相同的对照间的比较验组同一个相同的对照间的比较6212=k+a aa a实验组与同

38、一个对照组的比较实验组与同一个对照组的比较分析目的分析目的为各实验组与同一个对照组的比较，而为各实验组与同一个对照组的比较，而各实验组间不须比较；其检验水准各实验组间不须比较；其检验水准用下用下式估计式估计632(1)=ka aa a 6465对比组对比组结果结果理疗理疗 vs. 药物药物有差别有差别理疗理疗 vs. 膏药膏药有差别有差别药物药物 vs. 膏药膏药尚不认为有别尚不认为有别*40Fisher如如果果两两两两比比较较的的四四格格表表的的理理论论数数较较小小，则则应应该该校校正正；如如果果过过小小，或或总总例例数数小小于于，宜宜采采用用精精确确概概率率法法前以述及，前以述及， 2

39、检验是基于大样本假定，四格表检验是基于大样本假定，四格表时，如果总例数小于时，如果总例数小于40或任意一格子理论数或任意一格子理论数小于小于1，大样本假定不成立，则不能用，大样本假定不成立，则不能用 2检验检验另外，有些情况下虽然满足卡方检验的使用另外，有些情况下虽然满足卡方检验的使用条件，但是计算的卡方值与卡方界值十分接条件，但是计算的卡方值与卡方界值十分接近近(P十分接近十分接近a a)此时也可以考虑使用确切概率此时也可以考虑使用确切概率法法该方法是由该方法是由Ronald Fisher提出，直接计算概提出，直接计算概率值；因此严格说来，它并不属于卡方检验，率值；因此严格说来，它并不属于卡方检验，而是独立于卡方检验而是独立于卡方检验例例74：将：将33名名HBsAg阳性孕妇随机分为乙肝免疫球蛋阳性孕妇随机分为乙肝免疫球蛋白预防组与非预防组，观察两组新生儿的乙肝感染率，白预防组与非预防组，观察两组新生儿的乙肝感染率，问两组感染率

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第七章、卡方检验

文档简介

温馨提示

最新文档

评论

第七章、卡方检验

文档简介

温馨提示

最新文档

评论

相关文档