第九讲卡方检验_第1页
第九讲卡方检验_第2页
第九讲卡方检验_第3页
第九讲卡方检验_第4页
第九讲卡方检验_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中医药统计学与软件

曹治清

成都中医药大学管理学院数学与统计教研室

czq9771@163.com第八章R

C表资料的分析一.

2检验的基本思想

2检验的基本思想是衡量实际频数(actualfrequency)和理论频数(theoreticalfrequency)之间的偏离度。检验统计量的意义和算法可用基本公式来说明:式中Arc表示R×C表中第r行(r=1,2,…,R)第c列(c=1,2,…,C)位置上的实际频数,简称实际数,简记为A;Trc表示与Arc相应(同位置)的理论频数(频数期望值),简称理论数,简记为T。第一节四格表的

2检验2第八章R

C表资料的分析理论数是根据检验假设H0来确定的,H0为比较的各组处理效果相同,均等于合计的处理效果,据此推出第r行第c列位置上理论数的计算公式为:式中nr表示第r行的行合计,nc表示第c列的列合计;

n表示总合计。

【例8-1】某中医院收治367例胃脘痛患者,随机分成两组,分别用新研制的中药胃金丹和西药治疗,结果如表10.1,探讨两种药物疗效有无差别。3第八章R

C表资料的分析组别有效无效合计有效率胃金丹A11=a=271A12=b=5276(a+b)98.19%西药组A21=c=74A22=d=26100(c+d)74.00%合计345(a+c)31(b+d)376(n)91.76%4第八章R

C表资料的分析胃金丹组占据部分两组合计有效率0.7340×0.9176=0.6735假设两种药物的疗效相同,那么我们期望全部观察值中胃金丹组的理论有效率是67.35%.总的观察数是376,而胃金丹组的期望有效数就是.0.6735×376=253.24西药组的有效理论数T21=100×345/376=91.76;同理,合计无效率为31/376=8.24%,T12=22.76,T22=8.24。5第八章R

C表资料的分析表8.1为成组设计(即完全随机设计)的四格表,表中的基本数据A11,A12,A21,A22分别取271,5,74,26。本例系两样本率比较,先假设两种药物的疗效相同,均等于合计的有效率345/376=91.76%;据此,胃金丹组的有效理论数T11=276×345/376=253.24,西药组的有效理论数T21=100×345/376=91.76;同理,合计无效率为31/376=8.24%,T12=22.76,T22=8.24从式(8.3)可以看出

2值反映了实际数和理论数吻合的程度。如果检验假设H0成立,则实际数与理论数之差不会很大,

2值应较小,出现大

2值的概率P是很小的,按小概率事件不可能发生原理,一般应该不会发生。若根据试验结果算出H0成立的

2值为小概率(P≤检验水准α),就怀疑H0成立,因而拒绝H0;若P>α,则没有理由拒绝H0。

2与P值的对应关系(即分布的规律)可查附表6,

2界值表。6第八章R

C表资料的分析二.四格表的

2检验1.四格表的模式:

df=(2-1)×(2-1)=1行属性列属性合计甲乙Iaba+bIIcdc+d合计a+cb+dn=a+b+c+d7第八章R

C表资料的分析基本公式专有公式校正公式专有公式的校正n≥40,T≥5n<40且1<T<5

四格表

2检验统计量的计算公式8第八章R

C表资料的分析2.四格表的

2检验对例8.1求解本例H0:即两组疗效相同;H1:即两疗效不相同。α=0.05。=56.77按自由度df=1查附表2,

2界值表,

20.05(1)=3.84,因

2>

20.05(1),P<0.05,按α=0.05水准拒绝H0,认为两药治愈率不同。9第八章R

C表资料的分析【例8-2】甲组用活血温经汤,乙组用通塞脉1号治疗,问两药的疗效有无差别组别有效人数无效人数合计通塞脉1号26733活血温经汤36238合计62971解H0:两组疗效相同;H1:两组疗效不同

n>40,最小理论数T12=9×33/71=4.18因有理论数1<T<5,用校正卡方

10第八章R

C表资料的分析查

2界值表,得P>0.05,不拒绝H0,两种疗法效果无统计学差异,不能认为两法疗效不同3.四格表的

2检验注意的问题⑴自由度为1的四格表,在总样本例数n≥40,有理论频数1≤T<5时,用不校正的

2值查

2界值表,所得概率偏低,误差较大,必须校正⑵用专有公式计算

2值,要先计算最小理论数。自由度df=1时,u20.05/2=

20.05(1)(即1.962

=3.84),u20.01/2=

20.01(1)(即2.57582

=6.63),故n较大时的两样本率比较,既可用u检验,又可用

2检验11第八章R

C表资料的分析⑶分类资料在划分阳性、阴性时信息量损失太大,而且划分界限不同,得出的统计结论也可能不同。在资料的划分归类时,必须结合专业知识,具备充分的理由才能确定某一划分界限。如果有明确的专业规定,例如:舒张压在90mmHg以上列为高血压,SGPT大于40单位列为异常,也可将定量资料转为分类资料进行处理(4)

四格表

2检验法不宜用于数据中有零的资料,此时误差很大,宜改用确切概率法第二节四格表的确切概率法当①总样本含量n<40时;或者②用其它假设检验方法所得概率接近检验水准时;或者③四格表中有实际频数为0或有理论数T<1时,都无法用

2检验,常用以超几何分布为前提的确切概率法(exacttest)

12第八章R

C表资料的分析【例8-3】

研究某药改善周围血管闭塞性病变患者的皮肤微循环状况,以安慰剂作对照,将37个病例随机分到2组,试分析该药的疗效。组别改善无效合计改善率(%)用药组1552075.0安慰剂组3141717.6合计18193748.613第八章R

C表资料的分析H0:某药无效,H1:某药有效。样本含量n=37<40,宜采用四格表确切概率法。双侧确切概率P=0.001,单侧确切概率P=0.001,故拒绝H0,认为该药能够改善周围血管闭塞性病变患者的皮肤微循环状况。

【SPSS操作】四格表数据合为一列输入为变量x的值,变量m、n以值1、2分别代表数据所在的行或列。选择Data→WeightCases命令,把x选入FrequencyVariable框进行加权。选择Analyze→DescriptiveStatistics→Crosstable命令,选m进入Rows[s]框,n进入Column[s]框,击Statistics按钮,指定Chi-squarer,击Continue→OK按钮,得到14第八章R

C表资料的分析由n=38<40,宜用Fisher'sExactTest。双侧确切概率P=0.003,单侧确切概率P=0.001,故拒绝H0,认为该药能够改善周围血管闭塞性病变患者的皮肤微循环状况15第八章R

C表资料的分析第三节R

C表资料的分析1.R

C表资料分析方法选择的思路2.双向无序R

C表资料的独立性检验双向无序R×C表,即行列皆无序的表。R×C表资料,在没有小于5的理论频数且总例数很大时,用

2检验法,可以推断样本率或构成比间的差异,也可推断行与列的属性间有无关系16第八章R

C表资料的分析【例8-5】某医院将用三种治疗方法治疗199例消化性溃疡住院病人,资料如表9-10。为避免中医不同证型对疗效比较的影响,试分析三种疗法治疗的病人按中医分型构成比有无差别生胃宁素715293788中药组412161951表9-10三组消化性溃疡住院病人四种证型的构成组别肝胃不和胃阴不和脾胃虚寒寒热夹杂合计西药组35153760合计1432609319917第八章R

C表资料的分析解H0:三组的中医分型构成比相同;H1:三组的中医分型构成比不同df=(3-1)×(4-1)=6,查

2界值表,

20.05(6)

=12.59,P>0.05。不能认为三种疗法治疗的病人按中医分型构成比有差别18第八章R

C表资料的分析R×C表的分析,要注意以下几点

1.

2检验要求理论数T不太小一般认为R×C表中不宜有20%以上格子的T<5,不能有T<1。理论数太小时的处理办法:⑴最好增加样本例数以增大理论数。⑵删去理论数太小的行和列。⑶将太小理论数所在行或列的实际数与性质相近的邻行邻列合并,使重新计算的理论数增大。须知,后两法可能会损失信息,也会损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作为常规方法。⑷不满足

2检验条件的R×C表资料,最好计算确切概率19第八章R

C表资料的分析2.R×C表的确切概率法步骤⑴确定一个统计量,例如

2值⑵列出行合计与列合计固定的全部可能的R×C表,对于每一个表计算统计量和P值;⑶凡统计量大于原始表的统计量值的那些R×C表的P值之和,即为确切概率P值,一般用统计软件完成SPSS,Analyze→Dsecriptivestatistic→Crosstabs,击Statistics按钮,指定Chi-square及Exact:MonteCarlo(确切概率:蒙特卡洛法)

3.

2检验拒绝H0,只能说明有差异,不能说明优劣20第八章R

C表资料的分析4.实验分组变量无序,指标变量有序时,宜用秩和或检验Ridit分析。但当实验分组变量有序,指标分组变量无序时,仍可用双向无序R×C表分析方法5.多个样本率或构成比的

2检验拒绝H0时,只能认为各总体率或构成比之间总的来说有差别,不能说明它们彼此间都有差别,可进一步用

2分割法作多个样本率间的“两两比较”。3.双向有序属性不同R

C表资料的分析处理双向有序且属性不同的R×C表资料时,常常希望弄清两有序变量之间是否存在线性相关关系或是否存在线性变化趋势,故需选用定性资料的相关分析或线性趋势检验。21第八章R

C表资料的分析【例8.7】老年环混浊度与眼底动脉硬化级别关联眼底动脉硬化级别老年环混浊程度合计-++++++++++正常7(3.25)830(1.67)3(2.75)21I级16372131087IIA级1230278885IIB级420128(4.44)1256III级0(0.46)0(1.13)2(0.77)1(0.24)0(0.39)3合计3995642033252就上表资料,推断老年环的混浊度与眼底动脉硬化级别是否有关联?如有关联,关系的密切程度如何?22第八章R

C表资料的分析⑴关联性分析H0:老年环的混浊度与眼底动脉硬化级别无关;H1:老年环的混浊度与眼底动脉硬化级别有关。α=0.05。可用Corerelation法检验双向有序且属性不同的R×C表中,行列属性的线性关系。可以用Pearson

2检验统计量。⑵线性趋势检验H0:眼底动脉硬化级别与老年环的混浊度无线性关系,H1:眼底动脉硬化级别与老年环的混浊度存在线性关系,仍然使用Corerelation法检验SPSS11.5统计软件:以混浊程度(标签老年环的混浊程度)、硬化级别(标签眼底动脉硬化级别)及例数为变量名,建立25行3列的数据文件L8-5.sav以后,23第八章R

C表资料的分析输出结果:Chi-SquareTests给出

2=22.654,双侧P=0.0311,由SymmetricMeasur给出Pearson列联系数P=0.210,可以认为低度相关:OrdinalbyOrdinalSpearmanCorrelation(有序对有序等级相关系数)=0.222,近似概率=0.000,单侧检验拒绝H0.可以认为老年环混浊度组患者眼底动脉硬化级别两个变量间存在线性关系,眼底动脉硬化级别越高,老年环混浊程度越深。24双向有序且属性相同的R×C表有R=C,称为方表(squaretable)。在诊断检验中,对水平数≥3的配伍设计问题,进行一致性(agreement)或吻合性检验,通常使用McNemar检验和Kappa检验甲评估的类别乙评估的类别合计12…k1x11x12…x1cm12x21x22…x2cm2………………kxc1xc2…xccmc合计n1n2…ncn4.双向有序属性相同R

C表资料的分析第八章R

C表资料的分析25第三节McNemar检验Kappa检验

一、McNemar检验1.McNemar检验的意义第八章R

C表资料的分析McNemar检验用来检验配对方表中关于对角线两侧的计数值是否对称,如果不对称,则表示两个评估结果不一致的部分在一个方向的改变较另一个大。其检验假设为:H0:xij=xji,对于所有的i<j,方表中关于对角线两侧的计数值对称,即两者吻合

df=k(k-1)/2

26第八章R

C表资料的分析k=2的方表即配对设计的四格表(配对四格表).P1291)配对四格表:两分类变量配对设计时,例如,同一对象接受两种处理,同一血样经甲乙两法化验,或同一患者经治疗前后两次检查等,每一对象的计数情况有四种可能:即甲(+)乙(+),甲(+)乙(-),甲(-)

乙(+),甲(-)

乙(-)。对于这类配对设计资料排成的四格表,称之为配对四格表,以区别不反映配对关系的四格表。这种表资料可进行独立性检验(用Pearson卡方检验)、优势性检验(McNemar检验)、一致性检验(Kappa检验

)。2.配对四格表资料的McNemar检验(优势性检验)27第八章R

C表资料的分析2)①配对四格表资料的独立性

2

检验H0为配对的两种属性相互独立,彼此无关。目的是推断配对的两种属性(因素)是否有关。独立性的对立面就是相关,配对四格表的独立性检验即行列属性的相关性检验。在配对两法相关即不独立时,可认为差异无统计意义。在配对两法无相关即独立时,可认为差异有统计意义。统计量仍用四格表的2检验公式,如两种属性有关,可进而确定关系的密切程度。②配对四格表资料的优势性McNemar检验H0为行与列效果相同McNemar检验的统计量:P130公式(8-12)、(8-13)【例8-6】用表8-9B资料检验:①新法和老法是否独立;②新法是否优于老法。28第八章R

C表资料的分析3.左右两侧比较的

2检验体内有些器官可分为左右两部分,在自然的正常状态下,左右大多是对称的,可是由于解剖、生理、病理等原因,某些改变在同一个体左右两侧对称器官的反应可能不相同。左右两侧比较可使用

2检验。如以a、b分别代表左右两侧的实际频数,则:

2=(a-b)2/(a+b),df=1【例8-7】

某医院神经科对近三年收治的96例内囊出血病人的发生部位进行分析,发生于左侧者55例,右侧者4l例,试问内囊出血是否好发在左侧?H0:左发生率=右发生率,H

1:左发生率>右发生率。

2=(a-b)2/(a+b)=(55-41)2/(55+41)=2.042P>0.1,可认为内囊出血左右两侧发生率无差别。29医药工作检查同一患者、同一X片、同一病理切片可能判断不一致。第八章R

C表资料的分析二、Kappa检验1.Kappa检验的意义2.Kappa的值Kappa检验称一致性检验,Kappa值简记为K

30PA为实际观察到的一致率;Pe为期望一致率,称期望率,即两次检查结果由于偶然机会所造成一致率第八章R

C表资料的分析31估计其抽样误差大小的统计量为Kappa值的标准误,用符号sK表示Kappa值在-1至1之间,K值愈接近1,表明一致程度愈好。K=1说明两次判断的结果完全一致,K=-1说明完全不一致,K=0说明两次检查结果很不一致。K≥0.75可说明已经达到相当满意的一致程度,K<0.4可说明一致程度不够理想第八章R

C表资料的分析32Landis和Koch对四格表提出K判断表Kappa值一致性程度<0弱0.00~0.20轻0.21~0.40尚好0.41~0.60中度0.61~0.80高度0.81~1.00极强【例8-8】

对100例肠结核患者同时作临床诊断和X线诊断,推断两种方法诊断结果是否吻合;推断两种方法诊断结果是否一致;推断两种方法诊断结果间有无相关关系。样本K值是否来自为零总体,H0:μK=0

第八章R

C表资料的分析33【DPS操作】双向有序且属性相同3×3方表,按表输入数据,选分类数据统计菜单“McNemar检验及Kappa检验”命令

X线诊断临床诊断合计检出可疑未检出检出22121347可疑461323未检出651930合计322345100第八章R

C表资料的分析34McNemar检验卡方=10.13450df=3p=0.017457Po=0.4700Pe=0.3383Kappa值=0.1990标准误=0.0690U=2.8853p=0.002095%的置信区间0.06380.334299%的置信区间0.02130.3767Fleiss等的近似标准误=0.0742895%的置信区间0.05340.344699%的置信区间0.00770.3904第八章R

C表资料的分析35McNemar检验H0:临床诊断和X线诊断结果吻合;卡方=10.13450、P=0.0175<0.05,可以认为两医生读片诊断结果不吻合Kappa检验H0:临床诊断和X线诊断的结果不具有一致性;

Kappa值=0.1990,U=2.8853、P=0.0020,可认为两种方法诊断结果一致。

【例8-9】

用168个血吸虫病肝纤维化病例进行回代检验,结果专家诊断为气虚血瘀的78例,判别模型诊断为气虚血瘀的82例,判别模型和专家诊断同诊断为气虚血瘀的72例。第八章R

C表资料的分析36专家诊断判别模型诊断合计气虚血瘀非气虚血瘀气虚血瘀72678非气虚血瘀108090合计8286168McNemar检验卡方=0.5625df=1p=0.4533Po=0.9048Pe=0.5009Kappa值=0.8092标准误=0.0771U=10.5004p=0.0000第八章R

C表资料的分析37McNemar检验H0:两种诊断结果吻合;卡方=0.5625、P=0.4533,可以认为两诊断结果吻合。Kappa检验H0:两种诊断结果不一致;

Kappa值=0.8092,

U=10.5004、P=0.0000,可认为两种方法诊断结果一致。

【例8.11】复方鱼腥草片合剂治疗老年性慢性支气管炎100例,第一疗程有效率为60%;第二疗程有效率为75%。本例为两疗程疗效比较,为配对资料,这100例可有四种情况:①两疗程均有效50例;②第一疗程有效但第二疗程无效25例;③第一疗程无效而第二疗程有效10例;④第一、二疗程均无效15例。第八章R

C表资料的分析38第一疗程第二疗程合计有效无效有效501060无效35540合计8515100McNemar检验卡方=12.80000df=1p=0.000347Po=0.5500Pe=0.5700Kappa值=-0.0465标准误=0.0814U=-0.5717p=0.7162第八章R

C表资料的分析39McNemar检验H0:两种诊断结果吻合;卡方=0.5625、P=0.4533,可以认为两诊断结果吻合。Kappa检验H0:两种诊断结果不一致;

Kappa值=0.8092,

U=10.5004、P=0.0000,可认为两种方法诊断结果一致。

【例8.11】复方鱼腥草片合剂治疗老年性慢性支气管炎100例,第一疗程有效率为60%;第二疗程有效率为75%。本例为两疗程疗效比较,为配对资料,这100例可有四种情况:①两疗程均有效50例;②第一疗程有效但第二疗程无效25例;③第一疗程无效而第二疗程有效10例;④第一、二疗程均无效15例。第八章R

C表资料的分析40McNemar检验H0:两个疗程的疗效与一个疗程的疗效相同;卡方=12.8000、P=0.0003,可以认为可以认为两个疗程的疗效高于一个疗程。Kappa检验H0:两个疗程的疗效与一个疗程的疗效不一致;Kappa值=-0.0465

U=-0.5717

、P=0.7162,不能认为两个疗程的疗效与一个疗程不一致。第八章R

C表资料的分析41第八章R

C表资料的分析第五节多样本率的两两比较引言:多个样本率(或构成比)的卡方检验,结论为拒绝H0时,只能认为各总体率(或构成比)之间总的来说有差别,常需要进一步作两两分析.首先介绍Bonferroni法调整检验水准作两两比较.1.多个实验组与同一个对照组比较(公式见P133(8-22))【例8-10】考察三种治疗精神抑郁症的药物疗效,均与同一个安慰剂作对照,实验结果如下,分析各种药物的疗效.42第八章R

C表资料的分析效果安慰剂药物1药物2药物3合计改善不变或恶化822121821915155664合计30303030120三种药物治疗抑郁症的效果双向无序RC表,卡方=12.05,df=3,P<0.01,按0.05水准可以认为不同药物治疗抑郁症的效果有不同.SPSS可以操作.比较改善无效合计安慰剂82230药物1121830合计204060药物1与安慰剂比较43第八章R

C表资料的分析2.2*k表k组间的两两比较(公式见P134(8-23))【SPSS操作】四格表数据合为一列输入为变量x的值,变量m、n以值1、2分别代表数据所在的行或列。选择Data→WeightCases命令,把x选入FrequencyVariable框进行加权。选择Analyze→DescriptiveStatistics→Crosstable命令,选m进入Rows[s]框,n进入Column[s]框,击Statistics按钮,指定Chi-squarer,击Continue→OK按钮,得到44df=k-1第六节同一样本多个构成比的比较第

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论