第九章 卡方检验_第1页
第九章 卡方检验_第2页
第九章 卡方检验_第3页
第九章 卡方检验_第4页
第九章 卡方检验_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章卡方检验第一页,共三十三页,2022年,8月28日卡方检验的用途卡方(x2)检验是一种用途较广的假设检验方法。可用于:1.推断多个总体率(也适用于两个率)或总体构成比之间有无差别2.判断两种属性或两个变量之间是否独立3.资料分布的拟合性检验第二页,共三十三页,2022年,8月28日第一节频数分布拟合优度2检验goodnessoffit2testforfrequencydistribution一、χ2分布

χ2分布是一种连续型随机变量的概率分布。第三页,共三十三页,2022年,8月28日图9-1不同自由度下2分布图第四页,共三十三页,2022年,8月28日附表8卡方界值表第五页,共三十三页,2022年,8月28日二、拟合优度检验医学工作中,常需要判定某事物的频数分布是否符合某一理论分布,如果符合就可以将它按此理论分布分析和处理资料。例如,判定资料符合正态分布后,就可以对它按正态分布原理来研究它。正态性检验就是解决这一问题,但只适合用于正态分布。

2检验则广泛适用于二项分布和Poisson分布等常见的分布类型,其基本思想是以2值来反映实际数与理论数的吻合程度,这里的理论数按某分布的公式计算,在图形上是与实际散点与理论曲线的吻合程度,因而称之为拟合优度检验。第六页,共三十三页,2022年,8月28日拟合优度检验步骤1.建立检验假设

H0:研究的总体分布等于给定的理论分布

H1:研究的总体分布不等于给定的理论分布2.计算统计量

A表示频数,T表示理论频数,则大样本时统计量为:3.确定概率P值,做出推断结论第七页,共三十三页,2022年,8月28日例9-1随机抽取某地男孩120名,测其身高(cm)如下:128.1 144.4 150.3 146.2139.7….144.5 142.4经计算,120例男孩身高均数为139.48,标准差为7.30。试以检验水平=0.05,检验当地12岁男孩身高是否服从正态分布。H0:资料X~N(139.48,7.302)α=0.05H1:资料X不服从N(139.48,7.302)第八页,共三十三页,2022年,8月28日例120名男孩身高的频数分布及拟合优度检验统计量组段观察频数A概率P(X)理论频数T(A-T)2/T(1)(2)(3)(4)=(3)×n(5)122.0~50.024082.89001.54053126.0~80.064637.75570.00769130.0~100.1293915.52631.96698134.0~220.1932523.18980.06104138.0~330.2153625.84331.98198142.0~200.1790821.48980.10328146.0~110.1111113.33310.40827150.0~60.051436.17170.00477154.0~50.017762.13093.86289合计1201.000-9.93733第九页,共三十三页,2022年,8月28日分析=组数-拟合分布的参数个数-1=9-2-1=6第十页,共三十三页,2022年,8月28日拟合优度检验注意事项第十一页,共三十三页,2022年,8月28日第二节独立样本22列联表资料的2检验例9-2处理有效数无效数合计有效率%洛赛克64218575.29雷尼替丁51338460.71合计1155416968.05两种药物治疗消化道溃疡4周后疗效第十二页,共三十三页,2022年,8月28日四格表资料及理论值在例9-2中这四个格子的数据是基本的,其余数据都是由这四个数据推算出来的,称之为四格表(fourfoldtable)。不妨假设H0

为两率相等,且等于两样本合并的阳性率Pc=68.05%,按合计率推算,本例第一行第一列理论上的阳性数为:6421_ab5133¯cd8568.05%=57.84此结果称为理论频数,记为T11,由上述计算过程可推出其它理论数为:

T12=27.16,T21=57.16,T22=26.84

则格子中理论频数和实际频数分别相对应:64(57.84)21(27.16)51(57.16)33(26.84)第十三页,共三十三页,2022年,8月28日(一)22列联表2检验的基本思想经上述推导,两样本率的差别就演绎为实际数与理论数之间的差别。即,两样本率相差越大,则实际数与理论数的差别就越大。实际数与理论数的差值A–T服从2分布,在H0的条件下,上述差值是随机误差,统计量为:如果检验假设不成立,则实际数与理论数的差别会很大,2值就大,此时若P检验水准,就怀疑假设,因而拒绝H0;反之不拒绝H0。第十四页,共三十三页,2022年,8月28日(二)22列联表2检验的步骤1.建立假设,确定检验水准按α=0.05水平拒绝H0,认为两药的总体有效率不等,洛赛克的有效率高。

第十五页,共三十三页,2022年,8月28日(三)四格表资料χ2检验的专用公式如例9-2中第十六页,共三十三页,2022年,8月28日四格表2检验条件及校正

1)

要求样本n40且所有T52)

当n40但有1T5时,用校正2检验(corrected2test);

3)

当n

40或有T1时,用确切概率法。第十七页,共三十三页,2022年,8月28日例9-3例9-3

将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见表9-4。问两疗法的总体缓解率是否不同?表9-4两种疗法缓解率的比较组别属性合计缓解率%缓解未缓解单纯化疗2(4.8)10(7.2)1216.7复合化疗14(11.2)14(16.8)2850.0合计

16244040.0本例n=40,但有T22=4.8<5,所以须用校正公式:2=2.624<20.05=3.84,则P>0.05不拒绝H0按=0.05检验水准,尚不能认为两种疗法的总体缓解率不同。第十八页,共三十三页,2022年,8月28日第三节独立样本R×C列联表资料的

2检验分组属性y1y2…yc合计1A11A12…A1Cn12A21A22…A2Cn2………………RAR1AR2…ARCnR合计m1m2…mcn样本R×C列联表(一)基本思想和统计量第十九页,共三十三页,2022年,8月28日(二)多个率比较组别阴性数阳性数合计阳性率1n11n12n1p12n21n22n2p2Rnr1nr2nrprR个率的比较第二十页,共三十三页,2022年,8月28日例9-4查表知,P<0.005,所以拒绝H0,认为三种疗效有差别。组别效果合计有效率%有效无效A药3554087.50B药20103066.67C药7253221.88合计624010260.78三种不同治疗慢性支气管炎的疗效H0:三种疗效无差别,=0.05比较三种不同治疗慢性支气管炎的疗效,问三种效果有无差别?第二十一页,共三十三页,2022年,8月28日(三)多个频率分布(构成比)的比较组别A型B型O型AB型合计儿童30383212112成年193019977合计49685121189表9-7儿童急性白血病患者与成年人急性白血病患者血型分布例9-5H0:两组血型构成比相同。儿童急性白血病患者与成年人急性白血病患者血型分布无显著性差异。第二十二页,共三十三页,2022年,8月28日(四)多个率之间两两比较—2分割法行×列表资料的2检验只能得出总的结论:即各总体率或构成比之间总的来说有差别,但不能说它们彼此之间都有差别。若要进一步解决此问题,可用2分割法(partitionsof2method)。在例9-4中要把表9-6资料分割成3个四格表,分别进行2检验。这样会增大犯第Ⅰ型错误的概率。解决的办法是修正检验水平:第二十三页,共三十三页,2022年,8月28日如例9-4的2分割法组别效果合计有效率%χ2P有效无效A组3554087.504.4190.036B组20103066.67A组3554087.5031.5000.000C组7253221.88B组20103066.6712.6360.000C组7253221.88表明A组与B组疗效无显著性差异。第二十四页,共三十三页,2022年,8月28日(五)RC列联表2检验要注意的问题1.适用条件不能有理论数T<1,并且1<T<5的格子数不超过总格子数的四分之一。条件不足时有三种处理方法:(1)增大样本例数使理论数变大;(2)将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论数增大。(3)用Fisher确切概率计算法。第二十五页,共三十三页,2022年,8月28日第四节配对设计资料的2检验将n份标本每份一分为二,分别用不同方法处理,推断不同处理的有无差别?甲法乙法合计+-+abn1-cdn2合计m1m2n一、二分类情形—2×2列联表McNemar检验:第二十六页,共三十三页,2022年,8月28日例9-6设有132份食品标本,把每份标本一分为二,分别用两种检验方法作沙门菌检验。结果如下:问两种检验的结果有无差别?甲法乙法合计+-+80(a)10(b)90-

31(c)11(d)42合计

111

21132结论:可认为甲、乙两种方法检验的结果不同。H0:两结果一致两种检验结果的比较第二十七页,共三十三页,2022年,8月28日二、多分类情形—R×R列联表例9-7

对150名冠心病患者用两种方法检查室壁收缩运动的情况,结果如下,试比较两种方法测定结果有无差别?甲法测定结果乙法测定结果合计正常减弱异常正常6032

65(n1)减弱0429

51(n2)异常8917

34(n3)合计

68(m1)

54(m2)

28(m3)150P>0.05,尚不能认为两种方法测定结果有差别。第二十八页,共三十三页,2022年,8月28日第五节四格表的Fisher确切概率法本法的基本思想是:在四格表周边合计不变的条件下,获得某个四格表的概率为步骤:(1)求实际表格的阳性率的差d=∣p1-p2∣(2)依次增减格子中的A值,组合各种不同的理论四格表,并求理论表的∣p1-p2∣(3)按P(i)公式求出每个理论表的概率P(i)值(4)双侧检验时,对理论表∣p1-p2∣≥d的P(i)求和,作为P

单侧检验时,对理论表∣p1-p2∣≥d的符合要求的一侧P(i)求和,作为P第二十九页,共三十三页,2022年,8月28日Fisher确切概率法适用于下列情况:1.样本量n<402.理论频数小于13.2检验后的概率P接近检验水准第三十页,共三十三页,2022年,8月28日例9-8将23名精神抑郁症患者随机分到两组,分别用甲、乙两药治疗,结果如下。试问疗效是否不同?解:本例n<40组别有效无效合计有效率%甲药组7(a)5(b)1258.3乙药组3(c)8(d)1127.3合计10132343.5

H0:两药有效率相等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论