分类变量资料的统计推断_第1页
分类变量资料的统计推断_第2页
分类变量资料的统计推断_第3页
分类变量资料的统计推断_第4页
分类变量资料的统计推断_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二节第二节分类变量资料的统计推断分类变量资料的统计推断三、三、2 检验检验(chi-square test)u推断两个总体率或构成比之间有无差别;推断两个总体率或构成比之间有无差别;u推断多个总体率或构成比之间有无差别推断多个总体率或构成比之间有无差别;u配对资料比较的配对资料比较的2 检验检验u推断两个分类变量之间有无关联性以及频推断两个分类变量之间有无关联性以及频数分布的拟和优度检验。数分布的拟和优度检验。2 2 检验的基本思想检验的基本思想A A、B B两种疗法的疗效比较两种疗法的疗效比较设设H H0 0:1 1=2 2, H, H1 1:1 12 2, =0.05, =0.05若若H

2、 H0 0成立成立, ,两组合计治愈率两组合计治愈率=20.0%=20.0% 未治愈率未治愈率=80.0%=80.0%疗法疗法 治愈人数治愈人数未愈人数未愈人数合计合计治愈率治愈率(%)(%)A A 1111(20)(20) 8989(80)(80)10010011.011.0B B 3131(22)(22) 7979(88)(88)11011028.028.0合计合计 42 4216816821021020.020.0 理论上:理论上: A A组治愈例数为组治愈例数为100(42/210)=20100(42/210)=20 未愈例数为未愈例数为100(168/210)=80100(168/2

3、10)=80 B B组治愈例数为组治愈例数为110(42/210)=22110(42/210)=22 未愈例数为未愈例数为110(168/210)=88110(168/210)=88 A A为实际频数为实际频数( (actual frequency) ) T T为理论频数为理论频数( (theoretical frequency) )TTA22nnnTCRRC11CRu2 2 检验的基本思想检验的基本思想 2 2值反映了实际频数与理论频数的吻合值反映了实际频数与理论频数的吻合程度程度, ,若检验假设若检验假设H H0 0成立成立, ,实际频数与理论频实际频数与理论频数的差值会小数的差值会小,

4、,则则2 2值也会小值也会小; ;反之反之, ,若若H H0 0不不成立成立, ,实际频数与理论频数的差值会大,则实际频数与理论频数的差值会大,则2 2值也会大值也会大;2 2值大到超过某个界值时值大到超过某个界值时, ,则则拒绝拒绝H H0 0, ,接受接受H H1 1。但因。但因2 2值大小还取决于自值大小还取决于自由度的大小,由度的大小,因此因此, ,根据样本计算得到的根据样本计算得到的2 2值应与值应与 比较比较, ,当当2 2 时时, P, P, ,则则拒绝拒绝H H0 0, ,接受接受H H1 1; ;当当2 2 时时,P,P,则不则不拒绝拒绝H H0 0。2,2,2,四格表资料的

5、四格表资料的2 2检验检验u2 2检验基本公式检验基本公式 u四格表资料四格表资料2 2检验专用公式检验专用公式 应用条件:应用条件:n40n40且所有且所有T5T5 dbcadcbanbcad22TTA22u四格表资料四格表资料2 2检验的校正公式检验的校正公式 应用条件:应用条件: n40n40但有但有1T1T5 5 u四格表四格表FisherFisher确切概率法:确切概率法: 应用条件:应用条件:n n4040,或,或T T1 1 TTA225 . 0dbcadcbannbcad222 H H0 0:1 1=2 2, H, H1 1:1 12 2, , =0.05 =0.05 66.

6、922TTA66. 942168110100210)89317911(222dbcadcbanbcad =(2-1)(2-1)=1, =(2-1)(2-1)=1, 查查2 2界值表得界值表得 2 2 , ,得得P0.005P0.005。按按=0.05=0.05水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1,差异有统计学意,差异有统计学意义。义。B B疗法治愈率高于疗法治愈率高于A A疗法。疗法。11CR88. 721 ,005. 021 ,005. 0两种药物对小儿单纯性消化不良的疗效比较两种药物对小儿单纯性消化不良的疗效比较药物药物有效有效无效无效合计合计有效率有效率(%)(%)甲

7、甲2626(28.2828.28) 7 7(4.184.18)333378.778.7乙乙3636(33.1833.18) 2 2(4.674.67)383897.497.4合计合计6262 9 9717187.387.375.25 .022TTA75. 2962383371)271367226(2222dbcadcbannbcad配对四格表资料的配对四格表资料的2 2检验检验配对四格表资料的基本结构配对四格表资料的基本结构 b+cb+c4040 =1=1 b+cb+c4040 =1=1甲法甲法乙法乙法合计合计+ +- -+ +a ab ba+ba+b- -c cd dc+dc+d合计合计a+

8、ca+cb+db+dn ncbcb22cbcb221表表4-3 4-3 两种方法的检测结果两种方法的检测结果甲试剂甲试剂乙试剂乙试剂合计合计+ +- -+ + 80 801010 90 90- - 31 311111 42 42合计合计1111112121132132 H H0 0:B=C,H:B=C,H1 1:BC,=0.05:BC,=0.05 =1,=1,2 2 ,P P0.0050.005。按。按=0.05=0.05水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1,认为甲乙,认为甲乙两种试剂的检出率不同,两种试剂的检出率不同,乙试剂高于甲试乙试剂高于甲试剂。剂。 76.10311

9、0)3110(222cbcb88. 721 ,005. 0u行行列表资料的列表资料的2 2检验检验 多个样本率比较时,有多个样本率比较时,有R R行行2 2列,称为列,称为 R R2 2表;表; 两个样本的构成比比较时,有两个样本的构成比比较时,有2 2行行C C列列, , 称为称为2 2C C表表; ; 多个样本的构成比比较,有多个样本的构成比比较,有R R行行C C列列, , 称为称为R RC C表。表。u行行列表资料列表资料2 2检验的用途检验的用途 多个样本率比较多个样本率比较 两个或多个构成比比较两个或多个构成比比较 双向无序分类资料的关联性检验双向无序分类资料的关联性检验行行列表资

10、料列表资料2 2检验公式检验公式TTA22122CRnnAn11列列数数行行数数基本公式基本公式专用公式专用公式 例例8.5 某医院将急性病毒性肝炎某医院将急性病毒性肝炎254例随机分为三组,分别用三种方案例随机分为三组,分别用三种方案治疗,结果见表。治疗,结果见表。问三种疗法的有问三种疗法的有效率是否相同?效率是否相同?表表8-8 8-8 三种方案治疗肝炎的有效率比较三种方案治疗肝炎的有效率比较组别组别有效有效无效无效合计合计有效率有效率(%)(%)西药西药5151494910010051.0051.00中药中药35354545808043.7543.75中西医结合中西医结合59591515

11、747479.7379.73合计合计14514510910925425457.0957.09 H H0 0:1 1=2 2=3 3 H H1 1:1 1、2 2、3 3不等或不全等不等或不全等 =0.05=0.0581.22110974151091004914510051254222221213 查查2 2界值表得界值表得 P P0.005,0.005,按按=0.05=0.05水准水准, ,拒绝拒绝H H0 0, ,接接受受H H1 1, ,差异有统计学意义,可认为三种差异有统计学意义,可认为三种疗法治疗慢性支气管炎的有效率有差疗法治疗慢性支气管炎的有效率有差别。别。60.1021 ,005.

12、 0 例例8.6 某研究人员收集了亚洲、欧洲某研究人员收集了亚洲、欧洲和北美洲人的和北美洲人的ABO血型资料,结果见血型资料,结果见表。表。问不同地区人群问不同地区人群ABO血型分类构血型分类构成比是否相同?成比是否相同?表表8.7 8.7 三个地区人群的血型构成比较三个地区人群的血型构成比较地区地区A AB BABABO O合计合计亚洲亚洲321321369369959529529510801080欧洲欧洲25825843432222194194517517北美洲北美洲4084081061063737444444995995合计合计987987518518154154933933259225

13、92H H0 0: :三个不同人群血型构成的总体构成比三个不同人群血型构成的总体构成比相同相同H H1 1: :三个不同人群血型构成的总体构成比三个不同人群血型构成的总体构成比不同或不全相同不同或不全相同 =0.05=0.05 38.2971995933444108051836910809873212592222261413 查查2 2界值表得界值表得 P P0.005,0.005,按按=0.05=0.05水准水准, ,拒绝拒绝H H0 0, ,接接受受H H1 1, ,差异有统计学意义,可认为三个差异有统计学意义,可认为三个不同人群血型构成的总体构成比不同不同人群血型构成的总体构成比不同或不

14、全相同或不全相同. . 55.1826,005. 0u行行列表资料列表资料2 2检验检验注意事项注意事项行行列表中各格的列表中各格的理论频数不应小理论频数不应小于于1,1,并且并且1T1T5 5的格子数不宜超过的格子数不宜超过1/51/5。出现上述情况时出现上述情况时, ,可以:可以: 最好是增加样本含量最好是增加样本含量, ,使使T T增大增大; ; 根据专业知识,考虑能否根据专业知识,考虑能否删去删去T T太太小的行或列,或将小的行或列,或将T T太小的行或列与太小的行或列与性质相近的邻行或邻列性质相近的邻行或邻列合并合并; ; 改用改用FisherFisher确切概率法。确切概率法。u行

15、行列表资料列表资料2 2检验注意事项检验注意事项多个样本率比较多个样本率比较, ,若所得统计推断结论若所得统计推断结论为为拒绝拒绝H H0 0,接受,接受H H1 1,只能认为,只能认为各总体率各总体率之间总的有差别之间总的有差别,要推断两两之间的差,要推断两两之间的差别,应进一步做多个样本率的多重比较别,应进一步做多个样本率的多重比较如:如:2 2分割法和分割法和bonferronibonferroni法法 。2 2检验并不是适用于所有的行检验并不是适用于所有的行列表列表资料。资料。uR RC C表的分类及其检验方法的选择表的分类及其检验方法的选择双向无序双向无序R RC C表表若研究目的为

16、了比较多个样本率若研究目的为了比较多个样本率( (或多个构成比或多个构成比),),可用可用2 2检验。检验。若研究目的为分析两个变量之间有若研究目的为分析两个变量之间有无关联及其关联的密切程度无关联及其关联的密切程度, ,可用可用2 2检验以及检验以及PearsonPearson列联系数。列联系数。单向有序单向有序R RC C表表分组变量有序分组变量有序( (如年龄如年龄) ),而指标变量无,而指标变量无序序( (如某种传染病的类型如某种传染病的类型) ),研究目的是,研究目的是比较不同年龄间构成情况有无区别,可比较不同年龄间构成情况有无区别,可用用2 2检验。检验。 分组变量无序分组变量无序

17、( (如疗法如疗法),),而指标变量有而指标变量有序序( (如疗效按等级分组如疗效按等级分组),),研究目的是比研究目的是比较不同疗法的疗效较不同疗法的疗效, ,宜用宜用非参数检验非参数检验。表表8.8 三组重症肝炎患者疗效比较三组重症肝炎患者疗效比较组别组别治愈治愈有效有效无效无效死亡死亡合计合计A A组组1919515149492121140140B B组组1717353545451010107107C C组组2828595915155 5107107合计合计64641451451091093636354354双向有序属性相同的双向有序属性相同的R RC C表表表表8.98.9两种方法检查

18、心室壁收缩运动测定结果的符合情况两种方法检查心室壁收缩运动测定结果的符合情况 研究目的是要考察两种测定方法的测定结果之间是研究目的是要考察两种测定方法的测定结果之间是否具有一致性否具有一致性, ,应采用应采用KappaKappa检验检验。对比法对比法冠心病人数冠心病人数核素法核素法: :正常正常减弱减弱异常异常合计合计正常正常58582 23 36363减弱减弱1 142427 75050异常异常8 89 917173434合计合计676753532727147147表表8.10 8.10 年龄与冠状动脉硬化的关系年龄与冠状动脉硬化的关系年龄年龄( (岁岁) )冠状动脉硬化等级冠状动脉硬化等级(Y)(Y)合合计计- -+ + + +20207070

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论