卫生统计学卡方检验.ppt_第1页
卫生统计学卡方检验.ppt_第2页
卫生统计学卡方检验.ppt_第3页
卫生统计学卡方检验.ppt_第4页
卫生统计学卡方检验.ppt_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Dec 1,2009,率或构成比的比较及 分类变量资料的关联性分析,第 九 章,Dec 1,2009,第一节 样本率和总体率的比较,一、直接计算概率法,例91 根据以往经验,新生儿染色体异常率一般为1,某医院观察了当地400名新生儿,只有l例染色体异常,问该地新生儿染色体异常率是否低于一般?,Dec 1,2009,H0:=0.01 H1:0.05,按=0.05水准尚不能拒绝H0,尚不能认为该地新生儿染色体异常率低于一般。,Dec 1,2009,二、正态近似法,当n较大,总体率 既不接近0也不接近1,n和n (1)均大于5,二 项分布近似正态分布,利用正态分布的原理,计算检验统计量u值作假设检验

2、。,Dec 1,2009,例92 已知一般人群中慢性支气管炎患病率为9.7% ,现调查了500名吸烟者,其中有95人患慢性支气管炎,试推断吸烟人群中慢性支气管炎患病率是否比一般人群高?,Dec 1,2009,H0:=0 H1:0 单侧=0.05 本例n=500,X=95,p=0.19,0=0.097, 得:,因单u0.05=1.64, uu0.05, p0.05,按=0.05水准, 拒绝H0,接受H1,Dec 1,2009,第二节 完全随机设计两个样本率比较的u检验,条件:当n较大,n11、n1(1-1) 、n22、n2(1-2)均大于等于5时,当n较小时,则可以利用校正的u检验:,Dec 1

3、,2009,例93 考察某市2000年城乡居民的卫生服务需求,以近两周病患病情况作为调查指标。分别在城区和农村进行了抽样调查,其中城区调查了660人,有90人近两周患病,农村调查了640人,有140人近两周患病,问两组人群的两周患病率是否相同?,Dec 1,2009,H0:1=2 H1:12 =0.05 X1=90,n1=660,X2=140, n2=640 p1=90/660=0.1364, p2=140/640=0.2188,因为u0.05/2=1.96,uu0.05/2,P0.05,所以拒绝H0。,Dec 1,2009,第三节 完全随机设计两样本率 比较的2检验,U 检 验,2 检 验,

4、两个率(或两类构成)是否相等,两个或多个两类构成(或率)或 两个或多个多类构成总体的构成比(或率)或行变量和列变量是否独立,满足正态性条件,无正态性要求,Dec 1,2009,例94 叙述见例93,将上述资料整理成表格如下:,表91 某市2000年城乡居民的两周患病率,Dec 1,2009,2检验的基本思想,一、四格表资料的2检验,Dec 1,2009,基本步骤,H0:城乡居民的两周总体患病率相同,即12,H1:城乡居民的两周总体患病率不同,即12, 0.05,1、建立假设,Dec 1,2009,2、实际频数与理论频数的差值服从 2分布:,计算2值的基本公式:,(R1)(C1),3、查表,判断

5、结果,下结论。,Dec 1,2009,A: actual value 实际数 T: theoretical value 理论数,Dec 1,2009,如何求各个格子的理论数T?,H0: 12 理论数T为假设的总合计率已知的条件下,所估计的理论频数,在目前的情况下,将样本现有的合计患病率作为总合计率的最佳估计,即17.69%,Dec 1,2009,城区理论两周患病频数为 17.69%660=230 660/1300=116.77 城区理论两周非患病频数为82.31%660=1070 660/1300=543.33 农村理论两周患病频数为 17.69% 640=230 640/1300=113.2

6、3 农村理论两周非患病频数为82.31%640=1070 640/1300=526.77,理论频数TRC的计算公式为: TRCnRnC/n,Dec 1,2009,H0:该市城乡居民的两周总体患病率相同,1=2 H1:该市城乡居民的两周总体患病率率不同,12 =0.05,查附表12可知,=1时, ,本例 ,按照=0.05的检验水准,拒绝H0假设,接受H1假设。即该市城乡居民的总体两周患病率不同。根据现有资料看出,农村的患病率高于城区。,Dec 1,2009,基本思想,当H0为真时,一般情况下,两样本率不会相差太大,相应的理论频数(T) 和实际频数(A)相差也不会太大,当T和A相差较大时,超出了实

7、际误差范围,就有理由怀疑H0的成立。,Dec 1,2009,Dec 1,2009,2分布曲线图的特点,1 与u、t、F分布一样, 2 分布是一个连续型的分布,只有一个参数决定它的形状; 2 越大,曲线趋于对称, , 2 分布趋向正态分布; 3 卡方图形的面积分布有规律性, 记为自由度为时, 2 分布曲线下右侧尾部面积为时2 的界值; 4 2 值反映了理论频数和实际频数的吻合程度;,Dec 1,2009,二、四格表的专用公式,对于四格表资料,通过推导可将式94转换 成四格表的专用公式:,Dec 1,2009,表92 某市2000年城乡居民的两周患病率,Dec 1,2009,分类资料为间断的,不连

8、续分布。故计算的2值不连续,对于四格表资料来说,当n40,且有1T5时,求出的概率可能偏小,因此需进行连续性校正:,三、四格表资料校正,1.2值的校正,x1、x2xkN(,2),Dec 1,2009,2、四格表2检验的条件,(1)当n40,且每个格子的理论频数T5 时,可用基本公式:,Dec 1,2009,注:对于两个率的比较,2检验和检验是等价的,22。,(3)T1或n40时,需用确切概率法。,(2)当总合计数n40,而有1T5 时,用校正公式或确切概率法。校正公式:,Dec 1,2009,例95 某医院用两种药物治疗小儿支气管哮喘, 结果见下表,试比较两组有效率有无差别?,表93 两组有效

9、率比较,Dec 1,2009,1、建立检验假设 H0:1=2 H1:12 =0.05,=1,2、计算检验统计量 因本例n40且有一个格子的1T5,需要用校正公式。,3、得出P值,作出统计推断 本例20.05,尚不能拒绝H0,还不能认为两种药物的疗效有差别。,Dec 1,2009,四、确切概率法,有理论频数T1或总例数n40,或者2检验所得到的P值接近检验水准时,则应采用直接计算概率法(exact probability/Fishers exact method)进行检验。,确切概率法的基本思想是:在周边合计数不变的条件下,表中的实际频数有多种组合,利用公式计算各种组合的概率,然后计算单侧或双侧

10、概率,与检验水准做比较,作出统计推断。,n!,Dec 1,2009,双侧检验:将现有样本概率记为Pr,则所有概率小于等于Pr的四格表的概率和即为确切概率法的结果。 单侧检验:则将相应方向上所有概率小于等于Pr的四格表的概率相加即可,如果12 ,将Pr上方所有概率小于等于Pr的四格表的概率相加。,Dec 1,2009,例题,Dec 1,2009,确切概率法解题示意,Dec 1,2009,配对四格表资料示意,第四节 配对四格表资料,Dec 1,2009,例97 120份痰液标本,每份分别接种在甲乙两种培养基中,观察结核杆菌的生长情况,结果为甲培养基阳性率为70%,乙培养基阳性率为60%,共同阳性率

11、为45%。试比较两种培养基的效果有无差别?,Dec 1,2009,表96 甲乙两种培养基的培养结果,Dec 1,2009,1、建立检验假设 H0:两种方法检验的阳性率相同,即总体B=C H1:两种方法检验的阳性率不同,即总体BC =0.05 2、计算检验统计量 在H0成立的条件下,b、c的理论频数 ,代入公式95有,Dec 1,2009,当b+c40时,当b+c40时,本例b+c40,代入上式得2=3.00,查界值表得: 20.05,1 =3.84, 2=3.00 0.05,不拒绝H0假设,尚不能认为两种方法检出细菌的阳性率不同。,3、得出P值和结论,Dec 1,2009,第五节 行列表资料的

12、2检验 (多组率或构成比比较),基本公式:,专用公式:,Dec 1,2009,一、多组率的比较,例98 某医生用三种方案治疗老年慢性支气管炎,结果见表97,问三种方案的总体疗效是否相同?(假设三组影响慢性支气管炎的其它因素齐同),表97 三种不同方案治疗慢性支气管炎的疗效,Dec 1,2009,1、建立检验假设 H0:三种方法的有效率相等 H1:三种方法的有效率不等或不全相等 =0.05,2、计算理论值和检验统计量,=(3-1)(2-1)=2,3、确定P值,作出统计推断 查2界值表,得P0.05,拒绝H0,可以认为三种方法有效率不等或不全相等。,Dec 1,2009,二、多个构成比比较,例99

13、 某医院研究胃溃疡和十二指肠溃疡患者与健康输血员血型构成有无不同,资料见表98,问其血型分布是否相同?,表98 胃、十二指肠溃疡患者与健康输血员血型构成,Dec 1,2009,1、建立检验假设 H0:胃、十二指肠溃疡患者与健康输血员的血型总体构成相同 H1:胃、十二指肠溃疡患者与健康输血员的血型总体构成不相同 =0.05,2、计算检验统计量,3、确定P值,作出统计推断,Dec 1,2009,注意事项,适用条件:不能有1,并且15的格子数不超过总格子数的1/5。,条件不满足时,没有相应的校正公式, 需作以下处理:,(1) 增大样本含量 (2) 删去理论数太小的行或列 (3) 合并相邻的理论数小的

14、行或列(性质相近),Dec 1,2009,三、单向有序资料,分组变量无序,结果变量为有序的资料称单向有序资料。,在比较各处理组的效应有无差别时,可用CMH(Cochran-Mantel-Hanenszel)方法计算行平均分检验统计量进行分析,也可以进行秩和检验,Ridit分析等。,Dec 1,2009,例910 某医生用三种药物治疗某种疾病,结果分四个等级,结果见下表,问三种药物的总体疗效有无差别?,表99 三种药物疗效比较结果,Dec 1,2009,四、多个率的多重比较,1、校正检验水准 如果所要比较的有k个组,则任意两组做检验的次数为C=K(K-1)/2。原来假设检验水准为,两两比较的水准

15、为=/C。如果此时例数较少不宜用检验,则应计算确切概率 。,Dec 1,2009,2、Scheff可信区间法,pA、pB分别是两个比较组的样本率,nA、nB为两比较组的样本含量,K为组数,为总卡方值。如果此可信区间包含0,则可以认为pA、pB无差别,反之,有差别,Dec 1,2009,3、SNK法,Dec 1,2009,第六节 定性资料的关联性分析,一、四格表资料的相关分析,表9-10 甲乙两种培养基的培养结果,Dec 1,2009,(一)rn的计算及假设检验,假设检验: H0:两种方法培养结核杆菌的结果无关 H1:两种方法培养结核杆菌的结果有关 =0.05,P0.05。按=0.05的水准,尚

16、不能拒绝H0,因此不能认为两种方法培养结核杆菌的结果有关,Dec 1,2009,KAPPA值计算公式,pa为观察一致率,公式:,pe为期望一致率,公式:,其中k为等级数,Aii为表格中从左上角到右下角的对角线上的实际数,ni+和n+i分别是第i行和第i列的合计,N为总合计。,Dec 1,2009,k值是总体K值的点估计 0K 1 Kappa值的判定: k0.75, 一致性好 0.4 k0.75,中度一致 K0.4, 一致性差,Dec 1,2009,(二)Kappa值的统计推断,1.Kappa标准误:,2.总体Kappa的可信区间:,3.样本Kappa值与总体Kappa值等于0的统计学检验:,Dec 1,2009,两种检验结果一致性(相关性)检验,为了检验CT与核磁共振对胆囊癌在诊断上的一致性,某医生用两种方法共检测了100例胆囊癌患者(后经病理诊断证实),诊断结果如下,问CT与核磁共振对胆囊癌诊断上的一致性(相关性)如何?,Dec 1,2009,Dec 1,2009,Dec 1,2009,二、RC列联表资料的关联性分析,例9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论