最新卡方检验解释_第1页
最新卡方检验解释_第2页
最新卡方检验解释_第3页
最新卡方检验解释_第4页
最新卡方检验解释_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卡方检验解释医学统计学- e-mail: 主讲内容第一第一 概述概述基本思想基本思想第二第二 2 22 2表卡方检验表卡方检验第三第三 配对四格表卡方检验配对四格表卡方检验第四第四 r rc c表卡方检验表卡方检验第五第五 fisherfisher确切概率检验确切概率检验第六第六 多个样本率的多重比较多个样本率的多重比较第七有序分组资料的线性趋势检验第七有序分组资料的线性趋势检验 2卡方检验概述p136 研究目的:率研究目的:率 or 构成比构成比的假设检验(大样本率或的假设检验(大样本率或 小样本率)小样本率) 资料类型:计数资料资料类型:计数资料 基本思想:基本思想: 检验中的检验中的 是

2、希腊字母,称为卡方是希腊字母,称为卡方检验,是一种用途较广的计数资料的假设检验方法,检验,是一种用途较广的计数资料的假设检验方法,属于非参数检验的范畴,主要是比较两个及两个以属于非参数检验的范畴,主要是比较两个及两个以上样本率上样本率( 构成比)以及两个分类变量的关联性分构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。的吻合程度或拟合优度问题。22检验的应用 检验两个样本率之间差别的显著性; 检验多个样本率或构成比之间差别的显著性; 检验两个双向无序分类变量是否存在关联; 配对计数资料的比较。2

3、一、两独立样本率检验一、两独立样本率检验(一)(一)两独立样本率资料的四格表形式 例例7-1 为研究肿瘤标志物癌胚抗原(为研究肿瘤标志物癌胚抗原(cea)对肺癌的诊断价值,随机抽取对肺癌的诊断价值,随机抽取72例确诊为肺癌的例确诊为肺癌的患者为肺癌组,患者为肺癌组,114例接受健康体检的非肺癌患例接受健康体检的非肺癌患者为对照组。用者为对照组。用cea对其进行检测,结果呈阳性对其进行检测,结果呈阳性反应者病例组中反应者病例组中33例,对照组中例,对照组中10例。问两组人例。问两组人群的群的cea阳性率有无差异?阳性率有无差异? 表表7-1 cea对两组人群的诊断结果对两组人群的诊断结果* *

4、括号内为理论频数。 本例资料经整理成表本例资料经整理成表7-1形式,即有形式,即有两个处理组,每个处理组的例数由发生数两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有和未发生数两部分组成。表内有33、39、10、104 四个基本数据,其余数据均由此四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。四个数据推算出来的,故称四格表资料。(二)(二) 检验的基本思想检验的基本思想2处处理理组组 发发生生数数 未未发发生生数数 合合计计 甲甲 a b a+b 乙乙 c d c+d 合合 计计 a+c b+d n 表表7-2 四格表资料的基本形式四格表资料的基本形式 基本思

5、想:可通过基本思想:可通过 检验的基本公式检验的基本公式来理解。来理解。22(), ()(1)a tt行数-1 列数式中,式中,a为实际频数(为实际频数(actual frequency),), t为理论频数(为理论频数(theoretical frequency)。)。2 理论频数理论频数 是根据检验设是根据检验设 ,且,且用合并率用合并率 来估计而定的。来估计而定的。 t012:h (72)acacabcdn11()() (73)aab acttn21()() (74)ccd acttn理论频数由下式求得:理论频数由下式求得: r crcn ntn式中,式中,trc 为第为第r 行行c 列

6、的理论频数列的理论频数 nr 为相应的行合计为相应的行合计 nc 为相应的列合计为相应的列合计 检验统计量检验统计量 值反映了实际频数与值反映了实际频数与理论频数的吻合程度。理论频数的吻合程度。 若检验假设若检验假设h0:1=2成立,四个格子的实际成立,四个格子的实际频数频数a 与理论频数与理论频数t 相差不应该很大,即统计量相差不应该很大,即统计量 不应该很大。如果不应该很大。如果 值很大,即相对应的值很大,即相对应的p 值很值很小,若小,若 ,则反过来推断,则反过来推断a与与t相差太大,超相差太大,超出了抽样误差允许的范围,从而怀疑出了抽样误差允许的范围,从而怀疑h0的正确性,的正确性,继

7、而拒绝继而拒绝h0,接受其对立假设,接受其对立假设h1,即,即12 。p22 由公式(由公式(7-1)还可以看出:)还可以看出: 值的大小还取决于值的大小还取决于 个数的多少(严格地说是自由度个数的多少(严格地说是自由度的大小)。由于各的大小)。由于各 皆是正值,故自由度皆是正值,故自由度愈大,愈大, 值也会愈大;所以只有考虑值也会愈大;所以只有考虑了自由度了自由度的影响,的影响, 值才能正确地反映实际频数值才能正确地反映实际频数a和理论和理论频数频数t 的吻合程度。的吻合程度。 检验的自由度取决于可以自由取值的格检验的自由度取决于可以自由取值的格子数目,而不是样本含量子数目,而不是样本含量n

8、 n。四格表资料只。四格表资料只有两行两列,有两行两列,=1=1,即在周边合计数固定的情,即在周边合计数固定的情况下,况下,4 4个基本数据当中只有一个可以自由个基本数据当中只有一个可以自由取值。取值。 22()a tt2()a tt222(1) 建立检验假设,确定检验水平。建立检验假设,确定检验水平。h0:1=2h1:12=0.05。(三)(三) 假设检验假设检验(2)求检验统计量值)求检验统计量值 1172 43/18616.6t ,1272 16.655.4t 2143 16.626.4t,2211426.487.6t。 1) 12)(12( 22222(33 16.6)(3955.4)

9、(1026.4)(10487.6)16.655.426.487.611112()34.3216.416.655.426.487.6四格表资料检验的专用公式四格表资料检验的专用公式22()()()()()ad bc na b a c b d c d2186(33 104 10 39)234.1072 43 143 114( (四四) )四格表资料检验的校正公式四格表资料检验的校正公式 22(0.5)ca tt22()2()()()()cn|ad -bc|-n=a+b c+d a+c b+d 分布是一连续型分布,而四分布是一连续型分布,而四格表资料属离散型分布,由此计算格表资料属离散型分布,由此计

10、算得的得的 统计量的抽样分布亦呈离散统计量的抽样分布亦呈离散性质。为改善性质。为改善 统计量分布的连续统计量分布的连续性,则进行连续性校正。性,则进行连续性校正。222四格表资料 检验公式选择条件: 40, 5nt2 ,不校正的理论或专用公式; ,校正公式; ,直接计算概率 (fisher)。40, 15nt40 1nt或 连续性校正仅用于连续性校正仅用于 的四格表资料,当的四格表资料,当 时,一般不作校正。时,一般不作校正。 212 例例7-2 将将116例癫痫患者随机分例癫痫患者随机分为两组,一组为两组,一组70例接受常规加高压氧例接受常规加高压氧治疗(高压氧组),另一组治疗(高压氧组),

11、另一组46例接受例接受常规治疗(常规组),治疗结果见表常规治疗(常规组),治疗结果见表7-3。问两种疗法的有效率有无差别?问两种疗法的有效率有无差别? 表7-3 两种疗法治疗癫痫的效果 治疗结果 治疗方法 有效 无效 合计 有效率(%) 高压氧组 66(62.8) 4(7.2) 70 94.3 常规组 38(41.2) 8(4.8) 46 82.6 合 计 104 12 116 89.7 012112:, :, 0.05hh 本例 ,故用四格表资料 检验的校正公式22116, 4.8nt但2 ,查 界值表得 。按 检验水准不拒绝 ,尚不能认为组有效率不等。 1210. 005. 0 p05.

12、00h2(66 84 38116 2)11622.9270 46 104 12c 本资料若不校正时,本资料若不校正时, 结论与之相反。结论与之相反。24.080.05p,(四)卡方检验的连续性校正问题s赞成依据是:这样做可使卡方统计量抽样分布的连续性和平滑性得到改善,可以降低i类错误的概率,连续性校正后的卡方检验,其结果更接近于fisher确切概率法。不过,校正也不是无条件的,它只适合于自由度为1时,样本含量较小,如n40,或至少有一个格子的理论频数太小,如t5的情形。(四)卡方检验的连续性校正问题s反对依据是:经连续性校正后,p值有过分保守之嫌。此外,fisher确切概率法建立在四格表双边固

13、定的假定下,而实际资料则是单边固定的四格表,连续性校正卡方检验的p值与fisher确切概率法的p值没有可比性。就应用而言,无论是否经过连续性校就应用而言,无论是否经过连续性校正,若两种检验的结果一致,无须在正,若两种检验的结果一致,无须在此问题上纠缠。但是,当两种检验结此问题上纠缠。但是,当两种检验结果相互矛盾时,如例果相互矛盾时,如例7-27-2,就需要谨,就需要谨慎解释结果了。慎解释结果了。为客观起见,建议将两种结论同时报为客观起见,建议将两种结论同时报告出来,以便他人判断。当然,如果告出来,以便他人判断。当然,如果两种结论一致,如均为或,则只报道两种结论一致,如均为或,则只报道非连续性检

14、验的结果即可。非连续性检验的结果即可。第第二二节节、两相关样本率检验两相关样本率检验(mcnemar检验)检验) 配对四格表资料的配对四格表资料的 检验检验2与计量资料推断两总体均数是否与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,是否有差别也有成组设计和配对设计,即即四格表资料四格表资料和和配对四格表资料配对四格表资料。 例例7-3某抗癌新药的毒理研究中,将某抗癌新药的毒理研究中,将78只大鼠按性别、窝别、体重、年龄等因只大鼠按性别、窝别、体重、年龄

15、等因素配成素配成39对,每个对子的两只大鼠经随机对,每个对子的两只大鼠经随机分配,分别接受甲剂量和乙剂量注射,试分配,分别接受甲剂量和乙剂量注射,试验结果见表验结果见表7-4。试分析该新药两种不同剂。试分析该新药两种不同剂量的毒性有无差异。量的毒性有无差异。 表表7-4 某抗癌新药两种剂量的毒理实验结果某抗癌新药两种剂量的毒理实验结果 乙剂量 甲剂量 死亡() 生存() 合 计 死亡() 6(a) 12(b) 18 生存() 3(c) 18(d) 21 合 计 9 30 39 上述配对设计实验中,就每个对子而上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有言,两种处理的结果不外乎有四

16、种可能四种可能:两只大鼠均死亡(甲两只大鼠均死亡(甲乙乙)数数(a);两只均生存(甲两只均生存(甲乙乙)数数(d);其中一只死亡(甲其中一只死亡(甲乙乙 )数数(b);其中一只死亡(甲其中一只死亡(甲乙乙)数数 (c)。其中,其中,a, d 为两法观察结果一致的两种情况,为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况为两法观察结果不一致的两种情况。cbcb22)(, 1 cbcbc22) 1(, 1= 检验统计量为检验统计量为h0: 总体四格表中甲乙 的对子数与甲乙的对子数出现频率相同 (两剂量毒性相同) ; h1: 总体四格表中甲乙 的对子数与甲乙的对子数出现频率不同

17、 (两剂量毒性不同) ; =0.05 已知样本四格表中,b=12,c=3,因 b+c=15,故将其代入公式 9-13,有 查附表 8,20.025,15.02,20.05,13.84,得 0.025p0.05,按=0.05 水准拒绝 h0,接受 h1,可以认为两种剂量的毒性有差异,甲剂量组的死亡率较高(因 bc) 。 27. 4312) 1321(22c注意:注意: 本法一般用于样本含量不太大的资料。因本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况为它仅考虑了两法结果不一致的两种情况(b, c),而未考虑样本含量而未考虑样本含量n和两法结果一致的两种情和两法结果一致的

18、两种情况况(a, d)。所以,当。所以,当n很大且很大且a与与d的数值很大的数值很大(即两法的一致率较高),(即两法的一致率较高),b与与c的数值相对较的数值相对较小时,即便是检验结果有统计学意义,其实际小时,即便是检验结果有统计学意义,其实际意义往往也不大。意义往往也不大。第第三三节节r c表 检验 2行行列表资料列表资料 多个样本率比较时,有r行2列,称为r 2表; 两个样本的构成比比较时,有2行c列,称2c表; 多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为r c表。检验统计量检验统计量22(1)(1)(1)rcann n行数列数一、多个样本率的比较一、多个样本率的

19、比较 例7-4用a、b、c三种不同方法分别处理新生儿脐带,发生感染的情况见表7-6,试比较3种不同方法的脐带感染率有无差异。 表9-6 三种脐带处理方法的脐带感染情况 脐带感染 处理组 感染 未感染 合计 感染率(%) a 76 3143 3219 2.36 b 15 2409 2424 0.62 c 2 762 764 0.26 合计 93 6314 6407 1.45 二、两组构成比的比较 例7-5为研究某种新药对尿路疼痛的止痛效果,将有尿路疼痛的患者144例随机分为两组,每组72例,一组服该新药(治疗组),另一组服安慰剂(对照组)。两组患者尿路疼痛的原因见表7-7,问两组患者尿路疼痛原因

20、的分布有无差异? 表7-7 两组患者尿路疼痛原因的分布 尿路疼痛原因 分 组 尿路感染 器械损伤 其它 合计 治疗组 34 29 9 72 对照组 29 35 8 72 合 计 63 64 17 144 2. 求检验统计量和自由度。将表 9-7 数据代入公式 9-14,有 22222234299293582144(1)1.027263726472 177263726472 17(21)(31)2 3. 确定 p 值,下结论。查2界值表,20.5,21.39, 20.5,21.018,所以,p0.50,以0.05水准不拒绝 h0,即尚不能认为两组患者尿路疼痛原因的分布有差异。 三、多组构成比的比

21、较例例7-6 在某项疼痛测量研究中,给160例手术后疼痛的患者提供四种疼痛测量量表,即直观模拟量表(vas),数字评估量表(nrs),词语描述量表(vds),面部表情疼痛量表(fps),患者首选的量表以及患者的文化程度见表7-8,问患者首选疼痛量表与文化程度是否有关? 表7-8 不同文化程度患者首选疼痛量表的类型 首选测痛量表 文化程度 v as vds nrs fps 合计 高中以下 3(3.5) 16(18.7) 18(19.7) 44(39.0) 81 高中 0(1.6) 10(8.6) 9(9.0) 18(17.8) 37 高中以上 4(1.8) 11(9.7) 12(10.2) 15

22、(20.2) 42 合计 7 37 39 77 160 四、 r c表 检验的条件21行列表中的各格t1,并且1t5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种: 增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。注意注意:不同年龄组可以合并,但不同血型就不能合并。改用双向无序rc表的fisher确切概率法(可用sas软件实现)。第四节、fisher确切概率检验 确切概率检验是由fisher 1

23、934年提出的一种用于两个独立样本率比较的方法,故又称fisher确切概率法。有人认为,当样本量n和理论频数t太小时,如n40而且t5,或t1,或n20,应该用确切概率检验。这一观点所基于的理论是,当样本量太小时,二项分布的正态逼近性较差,因而不宜用基于正态分布的检验。提出上述条件的另外一种考虑是确切概率法的计算量偏大,但随着计算工具的大大改进,确切概率法的应用不一定限于上述条件。例7-4 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染hbv的效果,将33例hbsag阳性孕妇随机分为预防注射组和非预防组,结果见表7-4。问两组新生儿的hbv总体感染率有无差别? 组别组别阳性阳性阴性阴性合计合计感染

24、率感染率(%) 预防注射预防注射组组4182218.18 非预防组非预防组5 61145.45 合计合计9243327.27基本思想 在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按检验假设用单侧或双侧的累计概率,依据所取的检验水准做出推断。1各组合概率的计算 在四格表周边合计数不变的条件下,表内4个实际频数,变动的组合数共有“周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有个,依次为: (1)(2)(3)(4)(5)0221212203194189 28 37 46 55 6(6)(7)(8)(9)(10)51761671581491

25、34 73 82 9110011 1计算现有样本四格表的和及各组合下四格表的,见表7-5。本例、。 2计算满足条件的各组合下四格表的概率。 3计算同时满足和条件的四格表的累计概率。本例 满足条件,累计概率为 1234510pppppp、 、 、 、 、1210. 01054321ppppppps教材批p143 本例,宜用四格表资料的fisher确切概率法直接计算累计概率。检验步骤为: :,即两组新生儿hbv的总体感染率相等 :,即两组新生儿hbv的总体感染率不等21210h1hibcaddiipabcd四格表组合四格表组合102292-1980.00000143212183-1650.0000

26、9412322074-1320.00197656431965-990.018447855*41856-66*0.08762728*651747-337616380871529339814110660.0912039010913011990.01289752bcaddiip第五节 多个样本率间的多重比较 当多个样本率比较的表资料检验,推断结论为拒绝,接受时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间有差别。要进一步推断哪两两总体间有差别,若直接用四格表资料的检验进行多重比较,将会加大犯类错误的概率。 1多个实验组间的两两比较 , ,k 为样本率的个数。 12+k=2)1(2k

27、kk2、实验组与同一个对照组的比较 ) 1(2k第六节 双向无序分类资料的关联性检验 例例 7-8 测得某地测得某地5801人的人的abo血型和血型和mn血型血型结果如表,问两种血型系统之间是否有关联?结果如表,问两种血型系统之间是否有关联?abo血型血型mn血型血型合计合计mnmno4314909021823a3884108001598b4955879502032a计合计1451166626845801步骤 1、建立检验假设 2、计算检验统计量 3、求出p值,作结论 注意:若须进一步分析关系的密切程度时,可计算pearson列联系数22cn第七节 有序分组资料的线性

28、趋势检验 例7-11 某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系,将278例尸解资料整理成表7-13,问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势?表表7-13 7-13 年龄与冠状动脉硬化的关系年龄与冠状动脉硬化的关系年龄年龄( (岁岁) )(x)(x)冠状动脉硬化等级冠状动脉硬化等级(y)(y)合计合计+ +2020707022224 42 298983030272724249 93 3636340401616232313137 7595950509 92020151514145858合计合计122122898941412626278278步骤 1、建立检验假设 2、计算检

29、验统计量 3、求出p值,作结论 注意:基本思想是: 首先计算表资料的值,然后将总的值分解成线性回归分量与偏离线性回归分量。若两分量均有统计学意义,说明两个分类变量存在相关关系,但关系不是简单的直线关系;若线性回归分量有统计学意义,偏离线性回归分量无统计学意义时,说明两个分类变量不仅存在相关关系,而且是线性关系。 nonzero correlation 8 63.3895 .0001 chi-square 1 71.4325 .0001data ex7_11; input r c f ;cards;1 1 701 2 221 3 41 4 22 1 272 2 242 3 92 4 33 1 1

30、63 2 233 3 133 4 74 1 94 2 204 3 154 4 14;proc freq; weight f; tables r*c /cmh1;run;注意注意 双向有序属性不同的表资料 表资料中两个分类变量皆为有序的,但属性不同,如表7-13。对于该类资料,若研究目的为分析不同年龄组患者疗效之间有无差别时,可把它视为单向有序表资料,选用秩转换的非参数检验;若研究目的为分析两个有序分类变量间是否存在相关关系,宜用等级相关分析或pearson积矩相关分析(见第九章);若研究目的为分析两个有序分类变量间是否存在线性变化趋势,宜用本节所介绍的有序分组资料的线性趋势检验。summary 1、研究目的:率研究目的:率 or 构成比构成比的假设检验(大样本率或的假设检验(大样本率或 小样本率)小样本率) 2、资料类型:计数资料资料类型:计数资料 3、基本思想:基本思想: 根本思想就是在于比较理论频数和实际频数的根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。吻合程度或拟合优

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论