




已阅读5页,还剩83页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第八章 卡方检验,卫生统计学教研室,复习: 率的抽样误差与标准误,样本率(p)和总体率()的差异称为率的抽样误差(sampling error of rate) ,用率的标准误(standard error of rate)度量。,如果总体率未知,用样本率p估计,如果总体率未知,用样本率p估计,3,正态近似法:当n足够大,且频率p和(1-p)都不太小时,如np和n(1-p)5时,p的抽样分布近似正态分布,可用正态分布法求总体概率的100(1-)置信区间。 这时用频率的标准误SP代替平均值的标准误 。,复习:总体率的可信区间,4,1、 单样本资料的Z检验(样本率与总体率的比较) 如果二项分布的或1不太小,当n足够大时,一般n和n(1)均大于5时,在n次随机试验中某事件发生次数X及发生频率P的分布近似正态分布。 因此,样本率和总体率之间、两个样本率之间差异的判断可用Z检验。,复习:二项分布频率资料的Z检验,5,对于假设 H0: =0, H1: 0 H0成立时,检验统计量 如果根据样本算得的Z值偏大,有理由拒绝H0,6,样本不太大时,需要做连续性校正,7,2、 两组独立样本频率的Z检验,8,本章主要内容,第一节 独立样本四格表资料的2检验 第二节 多个独立样本RC列联表资料的2检验 第三节 配对设计资料的2检验 第四节 22列联表的确切概率法 第五节 2分布和拟合优度检验,第八章 卡方检验,2检验(Chi-square test)是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法。该检验以2分布和拟合优度检验为理论依据。,10,1、推断两个或两个以上总体率(或构成比)之间有无差别? 2、两个变量间有无相关关系(关联度分析) 3、拟合优度检验 (goodness of fit test),X2检验的应用,11,第一节 独立样本四格表资料的x2检验 22列联表(contingency table),12,主要内容,四格表x2检验的基本思想,1.,13,例8-1,例8-1 将病情相似的169名消化道溃疡患者随机分成两组,分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见表8-1。 问:两种药物治疗消化道溃疡的愈合率有无差别? 表8-1 两种药物治疗消化道溃疡4周后疗效,14,(一)22列联表x2检验的基本思想,表8-2 独立样本资料的四格表,表8-2 两种药物治疗消化道溃疡4周后疗效,15,x2检验的基本公式,16,X2分布是一种连续型随机变量的概率分布,图8-1 不同自由度X2分布的概率密度曲线 (X2界值表见475页),17,设有k个相互独立的标准正态分布随机变量Z1、Z2Z ,则Z12+Z22+Z2的分布服从自由度为的x2分布,记为x2(v)。 是指上式中包含的独立变量的个数。 当趋于时, x2分布逼近正态分布。各种自由度的x2分布右侧尾部面积为时的临界值记为x2(,v),18,(二) 22列联表x2检验的基本步骤,1、建立检验假设,确定检验水准 H0:12 即两种药物治疗消化道溃疡的愈合率相同 H1:12 即两种药物治疗消化道溃疡的愈合率不同 =0.05 2、计算统计量 计算理论频数 计算x2统计量,19,3、确定P值,做出推断结论 v=(2-1)(2-1)=1 查X2界值表得, 本例, 故P0.05 按照=0.05水准,拒绝H0,接受H1,两样本率的差别具有统计学意义,可以认为洛赛克的愈合率(75.29%)高于雷尼替丁(60.71%)。,20,(三) 22列联表x2检验的专用公式,21,22列联表x2检验的校正公式,当n 40 ,且T 5时,用基本公式或专用公式: 当n 40 ,且某格子出现1 T5时,用校正公式: 如果样本例数不是很大,计算时应先估计表中最小的T值。,22,例8-2,例8-2 将病情相似的淋巴系肿瘤患者随机分两组,分别作单纯化疗与复合化疗,问两疗法总体缓解率是否不同? 表8-3 两种疗法缓解率的比较,23,例8-2的检验步骤,1、建立检验假设,确定检验水准 H0:12 ,即两法总体缓解率相同 H1:12 ,即两法总体缓解率不同 =0.05 2、计算统计量 由于n=40,且有一格1 T115,宜用校正公式,24,3、确定P值,做出推断结论 v=(2-1)(2-1)=1 查X2界值表得, 本例, 故P 0.10 按照=0.05水准, 不拒绝H0,差别无统计学意义。尚不能认为两种治疗方案的总体缓解率不同。 如果公式未进行校正, 则P 0.05,拒绝H0 ,结论相反。,25,(四) 22列联表x2检验的注意事项,1、x2校正公式仅用于v=1的四格表资料,对v2的多组样本分布,一般不作校正。 2、当n40,或T1,校正x2值也不恰当,可用Fisher确切检验。 3、本节两个例题均强调两组患者“病情相似”,这一点非常重要,只有在两组对象其它方面“同质”的前提下才能比较两个频率,才能进行22列联表的x2检验。,26,26,小 结,1、2检验的基本思想,(1) n 40,且T 5时,用2 检验基本公式和专用公式,(2) n 40,但有1 T5时,用四格表2检验校正公式,(3) n 40,或T1时,改用fisher确切概率法,2、四格表资料2检验,通常规定:,3、注意:若三者结果不同,以精确概率的结果为准 4、熟记:20.05(1) =3.84 20.01(1) = 6.63。,(4)连续性校正仅用于1的四格表资料。,27,思考,如果是单侧检验,应怎样借助卡方界值表确定P值? 若检验水准为0.05,则查尾部概率为0.10的卡方界值。,28,第二节 多个独立样本RC列联表资料的x2检验,(一) RC列联表资料x2检验的基本思想 设有一个定性变量,具有C个可能的“取值”,现有R个独立的样本分布,这样的数据形式称为RC列联表。 原理同前,公式可进行等价转换,29,A每个格子的实际频数 , ni_Aij对应的行合计, miAij对应的列合计。,30,(二)多个独立样本频率的比较,例8-3 用三种不同治疗方法治疗慢性支气管炎的疗效,观察结果见表8-5,试比较3种疗法治疗慢性支气管炎的疗效。,31,检验步骤:,1、建立检验假设,确定检验水准 H0:1=2 =3,三种治疗方法的疗效相同 H1:3种治疗方法的疗效不全相等 =0.05,32,2、计算检验统计量,33,3、确定p值,做出推断,自由度v=(3-1)(2-1)=2, 查界值表, , 本例, 因而P 0.005,在=0.05水准上拒绝H0,接受H1,差别有统计学意义。可以认为三种药物的治疗效果不全相同。,34,(三)多个独立样本频率分布的比较,例8-4 试分析儿童急性白血病患者与成年人急性白血病患者的血型分布如表8-6所示,问血型分布有无差别?,35,分 析,1、资料类型:分类变量资料(计数资料) 2、设计类型:两独立样本完全随机设计 3、检验方法:x2检验,36,检验步骤:,1、建立检验假设,确定检验水准 H0:儿童急性白血病患者与成年人急性白血病患者的血型分布相同 H1:儿童急性白血病患者与成年人急性白血病患者的血型分布不相同 =0.05,37,2、计算检验统计量,38,3、确定p值,做出推断,自由度v=(2-1)(4-1)=3, 查界值表, , 本例, 因而P 0.75,在=0.05水准上不拒绝H0,差别没有统计学意义。尚不能认为儿童急性白血病患者与成年人急性白血病患者的血型分布不同。,39,(四)多组间的两两比较,多个率和多个频率分布比较的x2检验,结论为拒绝H0时,仅表示多组中至少有两组是不同的。 若要明确,需作多组间两两比较,即分割RC列联表,对每两个率之间有无统计学意义做出结论。 检验水准进行校正(bonferroni调整法) = /m(比较次数) m=k(k-1)/2 若多个实验组与同一对照组进行比较,比较次数为k-1,则= /k-1,40,1、建立检验假设,确定检验水准 H0:任意两个对比组的总体有效率相等 H1:任意两个对比组的总体有效率不相等 a=0.05 本例为3个实验组间的两两比较,检验水准为 = 0.05/3=0.0167 2、计算检验统计量 3、确定P值,作出推断结论,41,0.0167,0.0167,0.0167,42,(五) RC列联表x2检验注意事项,1、要求:理论频数T不宜太小, 一般不宜有1/5以上的格子理论频数小于5,或不宜有一个理论频数小于1,否则可能偏性,易犯第一类错误。,43,理论频数不满足时解决方法,(1)增加样本含量(最好) (2)结合专业知识,将理论频数太小的行或列与性质相近的邻行或邻列合并。可能会损失信息,甚至出假象。 例如:不同年龄组可以合并,但不同血型就不能合并。 (3)改用RC表的Fisher确切概率法(可用SAS、spss软件实现),44,2. 当多个样本率比较的检验,统计推论为拒绝检验假设,只认为总体率之间总的来说有差别,但不能说明每两两之间有差别,若要对每两个率或构成比进行比较,须分别进行比较,并调整检验水平。,RC表2检验的应用注意事项(补充),2019/8/31,45,可编辑,RC表2检验的应用注意事项(补充),3.多组比较时,若效应有强弱的等级,如+,+,+,最好采用后面的非参数检验方法。2检验只能反映其构成比有无差异,不能比较效应的平均水平。 4.行列两种独立属性皆有序时,可考虑趋势检验或等级相关分析。,47,5. 以上介绍的2统计量称为Pearsons 2 statistic, 2P . 统计学中还有一种2统计量,称为似然比2统计量(likelihood ratio 2 statistic, 2L). 计算公式为:,当n很大时,两者一致;n小时两者近似. 两者都是2 精确分布的近似. 2L的应用要比2P广,处理多维表时优势更大。,48,第三节 配对设计资料的2检验 一、配对22列联表资料的2检验,例8-5 设有132份食品标本,把每份标本一分为二,分别用两种检验方法做沙门菌检验,检验结果如表。 试比较两种检验方法的阳性结果是否有差别?,49,50,计数资料配对设计的应用: 可用于两种检验方法、培养方法、诊断方法的比较。 特点: 对样本中各观察单位分别用两种方法处理,观察两种处理方法的某两分类变量的计数结果。,51,52,变量1(甲法)的阳性率为n1/n=(a+b)/n 变量2(乙法)的阳性率为n2/n=(a+c)/n 则两种方法阳性率的差别为 (a+b)/n -(a+c)/n=(b+c)/n 可见,阳性率的比较只与b、c有关,而与a、d无关。,53,当两种处理方法无差别时,对总体应当有 B=C 即两总体率相等 1=2 由于在抽样研究中,抽样误差是不可避免的,样本中的b和c往往不等,即样本率不相等,为此,需进行假设检验。,54,假设两种检验方法阳性率相同条件下,b与c两个格子理论频数都应该是(b+c)/2 当b+c40 时,有,55,检验统计量(McNemar test),56,(1) 建立检验假设,确定检验水准。 H0:1=2 即两种检验方法的阳性率相同 H1:12 即两种检验方法的阳性率不同 =0.05。,(二)配对22列联表X2检验 假设检验步骤,57,2、计算检验统计量 本例,b+c=10+31=4140,58,3、确定p值,做出推断,自由度v=(2-1)(2-1)=1, 查 界值表, , 本例, 因而P 0.005,在=0.05水准上拒绝H0,接受H1,差别有统计学意义。 可以认为两种检验方法的阳性率结果有差别。由于甲法阳性率为68.20%,乙法阳性率为84.09%,可以认为乙法阳性率高于甲法阳性率。,59,上述方法称为McNemar检验,将(b+c)视为固定值,在此条件下推断,无需考虑一致数a、d的大小,因而这类方法在统计学中称为条件推断方法。,60,二、配对RR列联表资料的2检验,61,例8-6 对150名冠心病患者用两种方法检查室壁收缩运动的情况,见表8-10,试分析两种方法测定结果的概率分布是否相同。 表8-10 两种方法检查室壁收缩运动情况,62,表8-9 配对设计资料的RR列联表,R为类别数,ni和mi为第i行合计和第i列合计。H0成立时,T服从自由度为R-1的x2分布。是McNemar的推广,63,对例8-6 两种方法检查心室壁运动资料 1. 建立检验假设,确定检验水准: H0: 两变量的概率分布相同, H1: 两变量的概率分布不同, =0.05 2. 选定检验方法,计算检验统计量: 配对多分类2检验:,64,65,3. 确定P值,作出统计推断。 查附表8: 2 界值表得20.05(2)=5.99, 2 =1.600.05. 在=0.05水准上不拒绝H0无效假设,差别没有统计学意义。 专业结论: 尚不能认为两种方法检查室壁运动分级的概率分布不相同。,66,完全随机设计与配对设计四格表资料的比较,67,第四节 列联表的确切概率法,例8-7 将23名精神抑郁症患者随机分到两组,分别用两种药物治疗,结果见表,问两种药物的治疗效果是否不同? 表8-11 两种药物治疗精神抑郁症的疗效比较,68,理论依据:超几何分布。 条件:,费歇尔确切概率法(Fishers exact probability ),由R.A.fisher(1934年)提出。是一种直接计算概率的假设检验。非2检验的范畴,而作为小样本四格表资料检验方法的补充。,四格表资料的Fisher确切概率法,69,(一)Fisher确切概率法的基本思想,在四格表边缘合计固定不变的条件下,利用公式直接计算表内四个格子数据的各种组合的概率,然后计算单侧或双侧累计概率,并与检验水准a比较,做出是否拒绝H0的结论。,70,分析步骤,表8-11 两种药物治疗精神抑郁症的疗效比较,1. 建立检验假设,确定检验水准: H0:, 1=2,两种药物治疗效果相同 H1: 12,两种药物治疗效果不相同 =0.05。 2. 选定检验方法,计算概率Pi: 本例n40,用 Fishers exact test.,71,在边缘合计不变条件下重新组合格子频数。(即保证各组样本量不变、合计率不变) 计算每种组合的概率p,72,每种组合下各药的有效率及差值 p1- p2,73,3. 确定P值,作出统计推断。 双侧检验:所有| p1- p2 |0.3106的组合的概率P之和 0.1124+.023797+.002115+.000058+.063458+.009519+.000577+.000001 =0.21380.05 在=0.05水准上差别无统计学意义。 专业结论:两种药物对精神抑郁症患者的疗效无显著差别。,74,按检验假设取单侧时的累计概率计算: 若建立检验假设为: H0:, 1=2, H1: 12;=0.05。 因有p1- p2=0.583-0.273=0.3106,将所有每种组合下各药的有效率的差值0.3106的组合概率相加而得到单侧累积概率为:(上侧尾部概率) 0.114224+0.023797+0.002115+0.000058=0.1400.05。 在=0.05水准上差别无统计学意义。 尚不能认为甲药疗效优于乙药。,如果进行单侧检验,75,第五节 2检验用于拟合优度检验,76,拟合优度检验,目的:根据样本的频率分布检验其总体分布是否等于某给定的理论分布(检验一种随机变量是否符合某种特定分布)。,77,例8-8 随机抽取12岁男孩120名,身高(cm)如下,检验水准为0.05. 试检验该资料是否服从正态分布?(a=0.10),78,经计算: 用样本均数和标准差作为总体
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 园林公司面试试题及答案
- 知识产权对企业构建竞争优势的影响试题及答案
- 理清思路的专利代理考试试题及答案
- 激光技术常识考题分析试题及答案
- 药物经济学模型的构建与应用试题及答案
- 激光器的种类与应用分析试题及答案
- 药剂学中的先进制药技术试题及答案
- 文献检索试题及答案超星
- 系统规划与管理师考试的职业素质与能力要求深入分析试题及答案
- 牛奶厂前处理试题及答案
- 山东中医药大学中医学(专升本)学士学位考试复习题
- 农夫山泉产品陈列手册(共45页).ppt
- 【原创】《“备-教-学-评”目标一致性的实施策略》讲座PPT
- 企业集团财务管理综合练习计算
- 【北师大版】六年级下册数学教学设计-总复习《数的认识》(1)
- 行政事业单位财务管理制度范文
- 机房专用精密空调巡检维护
- 养老机构服务高质量115项明细
- 动、静平衡原理及平衡方法
- 船舶首制船设计任务书doc
- 创业路演路演(PPT课件)
评论
0/150
提交评论