医学统计学卡方检验_第1页
医学统计学卡方检验_第2页
医学统计学卡方检验_第3页
医学统计学卡方检验_第4页
医学统计学卡方检验_第5页
已阅读5页,还剩135页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学卡方检验第一页,共一百四十页,2022年,8月28日《中华医学杂志》对来稿统计学处理的有关要求第二页,共一百四十页,2022年,8月28日卡方检验(chi-squaretest)χ2检验是现代统计学的创始人之一,英国人Karl.Pearson于1900年提出的一种具有广泛用途的统计方法。可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。第三页,共一百四十页,2022年,8月28日卡方检验基本思想用卡方值的大小来衡量实际频数和理论频数之间的吻合程度。在零假设H0

成立的条件下,实际频数与理论频数相差不应该很大,即x2值不应该很大。若实际计算出的x2值较大,说明实际频数和理论频数吻合程度小,相差大,则有理由怀疑H0的真实性,从而拒绝H0,接受H1。第四页,共一百四十页,2022年,8月28日x2检验单个样本构成比的x2检验——拟合优度检验独立样本四格表的x2检验行×列的x2检验配对设计分类资料的x2检验多维分类资料的x2检验第五页,共一百四十页,2022年,8月28日x2检验单个样本构成比的x2检验——拟合优度检验独立样本四格表的x2检验行×列的x2检验配对设计分类资料的x2检验多维分类资料的x2检验第六页,共一百四十页,2022年,8月28日在中医药科研中,经常遇到同一个样本中两个或多个构成比比较的问题,在满足卡方检验的要求条件下,可用卡方检验来分析实际频数的比率是否符合理论比率。第七页,共一百四十页,2022年,8月28日【例1】为探索高血压患者中医证型构成,调查原发性高血压患者3578例,中医证型构成见表。问原发性高血压患者中医证型内部构成是否相同?第八页,共一百四十页,2022年,8月28日AT第九页,共一百四十页,2022年,8月28日X2=392.514V=5-1=4P=1-CDF.CHISQ(392.514,4)=0.000第十页,共一百四十页,2022年,8月28日第十一页,共一百四十页,2022年,8月28日SPSS软件操作第1步:定义变量第十二页,共一百四十页,2022年,8月28日第2步:输入原始数据第十三页,共一百四十页,2022年,8月28日第3步:定义频数选择数据→加权个案例数→加权个案(频数变量)第十四页,共一百四十页,2022年,8月28日第4步:x2检验选择分析→非参数检验→卡方中医证型→检验变量列表第十五页,共一百四十页,2022年,8月28日第5步:结果解读结果解读:x2=392.514,p=0.000,说明原发性高血压患者中医证型内部构成不相同。第十六页,共一百四十页,2022年,8月28日注意事项进行拟合优度x2

检验,一般要求有足够的样本含量,理论频数不小于5。理论频数小于5时,需要合并计算。第十七页,共一百四十页,2022年,8月28日x2检验单个样本构成比的x2检验独立样本四格表的x2检验行×列的x2检验配对设计分类资料的x2检验多维分类资料的x2检验第十八页,共一百四十页,2022年,8月28日四格表的卡方检验,也是通过计算代表实际频数A与理论频数T之间的吻合程度的卡方值来进行检验的。理论频数T采用两组的合并情况来计算。第十九页,共一百四十页,2022年,8月28日【例2】某医院把慢性支气管炎患者376名,随机分为2组,分别用中西医结合法和西医法治疗,结果见表。问两种疗法治疗慢性支气管炎病人的治愈率是否有差别?第二十页,共一百四十页,2022年,8月28日理论值T的计算345/376(总的治愈率)*276=253.24276-253.24=22.76345/376(总的治愈率)*100=91.76100-91.76=8.24第二十一页,共一百四十页,2022年,8月28日卡方值的计算卡方值的影响因素:1、格子数2、实测值与理论值的差距第二十二页,共一百四十页,2022年,8月28日专用公式的推导T11=(a+c)/(a+b+c+d)*(a+b)T12=(b+d)/(a+b+c+d)*(a+b)T21=(a+c)/(a+b+c+d)*(c+d)T22=(b+d)/(a+b+c+d)*(c+d)第二十三页,共一百四十页,2022年,8月28日专用公式的推导第二十四页,共一百四十页,2022年,8月28日SPSS软件操作第1步:定义变量第二十五页,共一百四十页,2022年,8月28日第2步:输入原始数据第二十六页,共一百四十页,2022年,8月28日第3步:定义频数选择数据→加权个案频数→加权个案(频数变量)第二十七页,共一百四十页,2022年,8月28日第4步:x2检验(1)选择分析→交叉表交叉表对话框:组别和疗效分别进入行和列第二十八页,共一百四十页,2022年,8月28日输出4种卡方检验结果:

1、pearson卡方

2、卡方值的校正值

3、似然比卡方,一般用于对数线性模型。

4、fisher的精确检验

5、线性趋势检验第二十九页,共一百四十页,2022年,8月28日输出2种相关系数:

1、pearson相关系数

2、spearman相关系数列联系数:分析行与列之间的关联程度第三十页,共一百四十页,2022年,8月28日Kappa:一致性检验风险:计算相对危险度(RR)和比数比(OR)。McNemar:优势性检验。CMH多维卡方检验第三十一页,共一百四十页,2022年,8月28日第4步:x2检验(2)选择统计量按钮在交叉表:统计量对话框:勾上卡方第三十二页,共一百四十页,2022年,8月28日第4步:x2检验(3)选择单元格按钮在交叉表:单元显示对话框:勾上观察值、百分比:行、列第三十三页,共一百四十页,2022年,8月28日第5步:结果解读(1)结果解读:中西医组的治愈率为98.2%,西医组的治愈率为74.0%。第三十四页,共一百四十页,2022年,8月28日第5步:结果解读(2)结果解读:x2=56.772,p=0.000两种疗法治疗慢性支气管炎病人的治愈率的差别有统计学意义第三十五页,共一百四十页,2022年,8月28日四格表x2检验结果的选择1)当n≥40,所有理论值≥

5时,用pearson卡方检验。2)当n≥40,但有理论频数1≤理论值<5时,用连续校正的卡方检验;或者确切概率法。3)n<40或有理论值<1,或P≈α时,用确切概率法。第三十六页,共一百四十页,2022年,8月28日卡方检验的校正公式第三十七页,共一百四十页,2022年,8月28日【例3】某中医院比较两药治疗某病的效果,所得结果见表。问甲乙两药疗效有无差别?第三十八页,共一百四十页,2022年,8月28日校正公式第三十九页,共一百四十页,2022年,8月28日SPSS软件操作第1步:定义变量第四十页,共一百四十页,2022年,8月28日第2步:输入原始数据第四十一页,共一百四十页,2022年,8月28日第3步:定义频数选择数据→加权个案频数→加权个案(频数变量)第四十二页,共一百四十页,2022年,8月28日第4步:x2检验(1)选择分析→交叉表交叉表对话框:组别和疗效分别进入行和列第四十三页,共一百四十页,2022年,8月28日第4步:x2检验(2)选择统计量按钮在交叉表:统计量对话框:勾上卡方第四十四页,共一百四十页,2022年,8月28日第4步:x2检验(3)选择单元格按钮在交叉表:单元显示对话框:勾上观察值、期望值、百分比:行第四十五页,共一百四十页,2022年,8月28日第5步:结果解读(1)结果解读:甲药组的有效率为92.9%,乙药组的有效率为64.3%。第四十六页,共一百四十页,2022年,8月28日第5步:结果解读(2)结果解读:有2个格子的期望值小于5,不符合卡方检验的条件。第四十七页,共一百四十页,2022年,8月28日第5步:结果解读(3)结果解读:四格表中有期望值小于5,选连续校正的卡方。x2=3.621,p=0.057?P(exact)=0.031?第四十八页,共一百四十页,2022年,8月28日四格表x2检验结果的选择1)当n≥40,所有理论值≥

5时,用pearson卡方检验。2)当n≥40,但有理论频数1≤理论值<5时,用连续校正的卡方检验;或者确切概率法。3)n<40或有理论值<1,或P≈α时,用确切概率法。第四十九页,共一百四十页,2022年,8月28日【例4】某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表。问两组新生儿的HBV总体感染率有无差别?第五十页,共一百四十页,2022年,8月28日SPSS软件操作第1步:定义变量第五十一页,共一百四十页,2022年,8月28日第2步:输入原始数据第五十二页,共一百四十页,2022年,8月28日第3步:定义频数选择数据→加权个案频数→加权个案(频数变量)第五十三页,共一百四十页,2022年,8月28日第4步:x2检验(1)选择分析→交叉表交叉表对话框:组别和感染结果分别进入行和列第五十四页,共一百四十页,2022年,8月28日第4步:x2检验(2)选择统计量按钮在交叉表:统计量对话框:勾上卡方第五十五页,共一百四十页,2022年,8月28日第4步:x2检验(3)选择单元格按钮在交叉表:单元显示对话框:勾上观察值、期望值、百分比:行第五十六页,共一百四十页,2022年,8月28日第5步:结果解读(1)结果解读:预防注射组的感染阳性率为4/22,非预防组的感染阳性率为5/11。第五十七页,共一百四十页,2022年,8月28日第5步:结果解读(2)结果解读:四格表中有期望值小于5,总例数小于40。第五十八页,共一百四十页,2022年,8月28日第5步:结果解读(3)结果解读:选Fisher的精确检验p(exact)=0.121第五十九页,共一百四十页,2022年,8月28日x2检验单个样本构成比的x2检验独立样本四格表的x2检验行×列的x2检验配对设计分类资料的x2检验多维分类资料的x2检验第六十页,共一百四十页,2022年,8月28日行×列卡方检验计算公式n为总例数;R和C分别为行数和列数;A为第R行、第C列位置上的实际频数;nR为实际频数所在行的行合计;nC为实际频数所在列的列合计。第六十一页,共一百四十页,2022年,8月28日【例5】某中医师将某病患者随机分为三组,分别用新药、传统药物和安慰剂治疗,结果见表。问三种方法治疗该病的有效率是否有差别?AnCnR第六十二页,共一百四十页,2022年,8月28日第六十三页,共一百四十页,2022年,8月28日SPSS软件操作第1步:定义变量第六十四页,共一百四十页,2022年,8月28日第2步:输入原始数据第六十五页,共一百四十页,2022年,8月28日第3步:定义频数选择数据→加权个案频数→加权个案(频数变量)第六十六页,共一百四十页,2022年,8月28日第4步:x2检验(1)选择分析→交叉表交叉表对话框:组别和疗效分别进入行和列第六十七页,共一百四十页,2022年,8月28日第4步:x2检验(2)选择统计量按钮在交叉表:统计量对话框:勾上卡方第六十八页,共一百四十页,2022年,8月28日第4步:x2检验(3)选择单元格按钮在交叉表:单元显示对话框:勾上观察值、期望值、百分比:行第六十九页,共一百四十页,2022年,8月28日第5步:结果解读(1)结果解读:新药组的有效率为88.9%,传统药物组的有效率为86.7%,安慰剂组的有效率为70.9%。第七十页,共一百四十页,2022年,8月28日第5步:结果解读(2)结果解读:x2=13.238,p=0.001第七十一页,共一百四十页,2022年,8月28日进一步的两两比较P<0.017才有统计学意义!!第七十二页,共一百四十页,2022年,8月28日【例6】某中医院用三种治疗方法治疗413例糖尿病患者,资料见表。为避免中医不同证型对疗效比较的影响,分析3种疗法治疗的病人按3种中医分型的构成比有无差别?第七十三页,共一百四十页,2022年,8月28日第七十四页,共一百四十页,2022年,8月28日SPSS软件操作第1步:定义变量第七十五页,共一百四十页,2022年,8月28日第2步:输入原始数据第七十六页,共一百四十页,2022年,8月28日第3步:定义频数选择数据→加权个案频数→加权个案(频数变量)第七十七页,共一百四十页,2022年,8月28日第4步:x2检验(1)选择分析→交叉表交叉表对话框:组别和中医分型分别进入行和列第七十八页,共一百四十页,2022年,8月28日第4步:x2检验(2)选择统计量按钮在交叉表:统计量对话框:勾上卡方第七十九页,共一百四十页,2022年,8月28日第4步:x2检验(3)选择单元格按钮在交叉表:单元显示对话框:勾上观察值、期望值、百分比:行第八十页,共一百四十页,2022年,8月28日第5步:结果解读(1)结果解读:各组的中医分型构成比。第八十一页,共一百四十页,2022年,8月28日第5步:结果解读(2)结果解读:x2=4.020,p=0.403第八十二页,共一百四十页,2022年,8月28日【例7】某医院肝胆外科在手术中,观察了222例胆结石患者,其发病部位与结石类型的资料见表,分析其发病部位与结石类型间有无关系?第八十三页,共一百四十页,2022年,8月28日行变量和列变量均为无序分类变量。可分析行、列两变量之间有无关联,关联的密切程度。可进行多个样本率或构成比的比较。第八十四页,共一百四十页,2022年,8月28日关联性分析第八十五页,共一百四十页,2022年,8月28日列联系数的意义|rp|<0.4,关联程度低0.4≤|rp|<0.7,关联程度中等|rp|≥0.7,关联程度高第八十六页,共一百四十页,2022年,8月28日SPSS软件操作第1步:定义变量第八十七页,共一百四十页,2022年,8月28日第2步:输入原始数据第八十八页,共一百四十页,2022年,8月28日第3步:定义频数选择数据→加权个案频数→加权个案(频数变量)第八十九页,共一百四十页,2022年,8月28日第4步:x2检验(1)选择分析→交叉表交叉表对话框:结石部位和结石类型分别进入行和列第九十页,共一百四十页,2022年,8月28日第4步:x2检验(2)选择统计量按钮在交叉表:统计量对话框:勾上卡方和相关系数第九十一页,共一百四十页,2022年,8月28日第4步:x2检验(3)选择单元格按钮在交叉表:单元显示对话框:勾上观察值、百分比:行、列第九十二页,共一百四十页,2022年,8月28日第5步:结果解读(1)结果解读:行与列均为无序变量,行、列百分比均有各自专业意义。第九十三页,共一百四十页,2022年,8月28日第5步:结果解读(2)结果解读:x2=64.059,p=0.000第九十四页,共一百四十页,2022年,8月28日第5步:结果解读(3)结果解读:rp=0.473,p=0.000两者有关联,但关联度不高。第九十五页,共一百四十页,2022年,8月28日行×列表卡方检验注意事项同四格表资料一样,R×C表的卡方分布是建立在大样本的假定上的,要求总例数不可过少,不能有1/5以上的格子理论频数小于5,且不能有一个格子的理论频数小于1。如果出现上述情况,可以考虑:增大样本量;根据专业知识合理地合并相邻的组别;删除理论数太小的行列;改用其它方法分析,例如确切概率法或似然比卡方检验。第九十六页,共一百四十页,2022年,8月28日当多个样本率(或构成比)作卡方检验,结论为拒绝零假设时,只能认为各总体率(或总体构成比)之间总的有差别,不能说明两两之间有差别;两组间的比较需进一步做多个样本率或构成比的两两比较,即多重比较。

行×列表卡方检验注意事项第九十七页,共一百四十页,2022年,8月28日行×列表卡方检验注意事项R×C表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同等4类。通常情况下只有双向无序的资料(例如多个样本率的比较、多个样本构成比的比较)可以使用R×C列联表卡方检验。右上表格使用卡方检验分析不同疗法间疗效是否有别,右下表格分析不同的血型分类结果是否有关联(不同的血型分类是否相互独立);它们都属于双向无序的列联表,都可使用卡方检验分析疗法疗效合计有效率(%)有效无效物理疗法199720696.60药物治疗1641818290.11外用膏药1182614481.94合计4815153290.41ABO血型MN血型合计MNMNO4314909021823A3884108001598B4955879502032A计1451166626845801第九十八页,共一百四十页,2022年,8月28日行×列表卡方检验注意事项单向有序R×C表有两种形式。一种是表中的分组变量(如年龄)是有序的,而指标变量(如传染病的类型)是无序的,其研究目的通常是分析不同年龄组各种传染病的构成情况,可用行列表资料的χ2检验进行分析;而如果指标变量为二分类,如右上表,想分析是否随工龄增加患病率也增加可以考虑线性趋势检验;另一种情况是表中的分组变量(如疗法)为无序的,而指标变量(如疗效按等级分组)是有序的,如右下表,其研究目的为比较不同疗法的疗效,宜用秩和检验进行分析。药物种类疗效合计治愈好转无效A1650470B452130C20251560合计408040160工龄患病人数未患病人数合计<1151521~6941002~232012244~351561916~2487114第九十九页,共一百四十页,2022年,8月28日行×列表卡方检验注意事项双向有序属性相同的R×C表表中的两分类变量皆为有序且属性相同。实际上是2×2配对设计的扩展,即水平数≥3的诊断试验配伍设计,如用两种检测方法同时对同一批样品的测定结果。其研究目的通常是分析两种检测方法的一致性,此时宜用一致性检验(或称Kappa检验)对比法测定结果核素法测定结果合计正常减弱异常正常

582363减弱142750异常891734合计675327147第一百页,共一百四十页,2022年,8月28日行×列表卡方检验注意事项双向有序属性不同的R×C表

R×C表中两分类变量皆为有序的,但属性不同,如下表;对于该类资料,①若研究目的为分析不同年龄组患者混浊度之间有无差别时,可把它视为单向有序R×C表资料,选用秩和检验;②若研究目的为分析两有序分类变量间是否存在相关关系,宜用等级相关分析;③若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用线性趋势检验。年龄晶状体混浊程度合计++++++20~

215674432630~1311016329540~148128132408合计4942962391029第一百零一页,共一百四十页,2022年,8月28日行×列表资料假设检验方法选择双向无序的行×列表:pearson卡方、关联度分析;单向有序的行×列表:Ridit分析、秩和检验;双向有序属性相同的行×列表:McNemar检验(优势性检验)、一致性检验、关联度分析;双向有序属性不同的行×列表:秩和检验、Ridit分析、等级相关、线性趋势检验等。第一百零二页,共一百四十页,2022年,8月28日x2检验单个样本构成比的x2检验独立样本四格表的x2检验行×列的x2检验配对设计分类资料的x2检验多维分类资料的x2检验第一百零三页,共一百四十页,2022年,8月28日配对设计包括:①同一批样品用两种不同的处理方法。②两个评估者对研究对象进行逐一评估。③观察对象根据配对条件配成对子,同一对子内两个体分别接受不同的处理。观察结果均分为k个相同的类别,资料可归纳整理成k×k的表格形式,又称为方表。这样的资料又称为方表资料。第一百零四页,共一百四十页,2022年,8月28日第一百零五页,共一百四十页,2022年,8月28日对于配对设计的分类资料,若研究目的为分析两种方法(即行变量和列变量)之间的相关关系(包括是否有关联、关联程度及一致性),应选用关联度分析及一致性检验(Kappa检验);若研究目的为分析两种方法间是否存在差异则应用优势性检验(McNemar检验)。第一百零六页,共一百四十页,2022年,8月28日【例8】用两种方法检查60名乳腺癌患者,检查结果如表。请对两种检查方法进行分析。第一百零七页,共一百四十页,2022年,8月28日优势性检验公式X2=(b-c)2/(b+c)n>=40X2=(|b-c|-1)2/(b+c)n<40第一百零八页,共一百四十页,2022年,8月28日一致性检验Kappa分析第一百零九页,共一百四十页,2022年,8月28日SPSS软件操作第1步:定义变量第一百一十页,共一百四十页,2022年,8月28日第2步:输入原始数据第一百一十一页,共一百四十页,2022年,8月28日第3步:定义频数选择数据→加权个案频数→加权个案(频数变量)第一百一十二页,共一百四十页,2022年,8月28日第4步:x2检验(1)选择分析→交叉表交叉表对话框:甲法和乙法分别进入行和列第一百一十三页,共一百四十页,2022年,8月28日第4步:x2检验(2)选择统计量按钮在交叉表:统计量对话框:勾上卡方、相关系数、Kappa、McNemar第一百一十四页,共一百四十页,2022年,8月28日第4步:x2检验(3)选择单元格按钮在交叉表:单元显示对话框:勾上观察值、期望值、百分比:行、总计第一百一十五页,共一百四十页,2022年,8月28日第5步:结果解读(1)结果解读:两种方法交叉的例数关系。甲法阳性率65.0%,乙法阳性率48.3%。第一百一十六页,共一百四十页,2022年,8月28日第5步:结果解读(2)结果解读:配对设计选用优势性检验结果,p=0.031。甲组的阳性率高于乙组的阳性率。第一百一十七页,共一百四十页,2022年,8月28日第5步:结果解读(3)结果解读:关联性rp=0.395,p=0.001

一致性kappa=0.406,p=0.004第一百一十八页,共一百四十页,2022年,8月28日Kappa的意义<0.02差0.02~轻微0.20~尚可0.40~中等0.60~好0.80-1.00几乎完全一致第一百一十九页,共一百四十页,2022年,8月28日【例9】下表为外侧半月板撕裂的膝关节镜诊断(金标准)与MRI(核磁共振成像)诊断的结果,试对两种诊断方法进行分析。第一百二十页,共一百四十页,2022年,8月28日SPSS软件操作第1步:定义变量第一百二十一页,共一百四十页,2022年,8月28日第2步:输入原始数据第一百二十二页,共一百四十页,2022年,8月28日第3步:定义频数选择数据→加权个案频数→加权个案(频数变量)第一百二十三页,共一百四十页,2022年,8月28日第4步:x2检验(1)选择分析→交叉表交叉表对话框:MRI诊断和关节镜诊断分别进入行和列第一百二十四页,共一百四十页,2022年,8月28日第4步:x2检验(2)选择统计量按钮在交叉表:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论