计数资料的统计推断.ppt_第1页
计数资料的统计推断.ppt_第2页
计数资料的统计推断.ppt_第3页
计数资料的统计推断.ppt_第4页
计数资料的统计推断.ppt_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类变量资料的统计推断 熊伟 第二节 分类变量资料的统计推断 一.率的抽样误差和标准误 l率的抽样误差:由于随机抽样造成的样本率和总 体率之间以及各样本率之间存在的差异。 l率的抽样误差用率的标准误来表示: 二.总体率的估计: 一、点值估计:p 二、区间估计: 按照一定的概率(可信度)估计总体率()所在的范 围(区间)。 1、近似正态分布法: 条件:np且n(1p)均大于5,此时样本率p近似正态 分布,可用正态分布曲线下的区间面积规律来估计。 公式: 例1: 某医院用复方当归注射液静脉滴注治疗脑动脉硬化症 188例,其中显效83例,试估计复方当归注射液显效率的 95%和99的可信区间。 n=188, p=83/188=0.4415 95CI为: 99CI为: 2、查表法: n50,p或1-p接近于0或1,np或n(1-p )5时,可用查表法。 例:从某校随机抽取26名学生,发现 有4名感染沙眼,试 求该校沙眼感染率的 95可信区间。 本例n26 x4,查附表得其95CI为( 0.04,0.35)。 三.样本率与总体率比较的u检验: 应用条件:样本含量足够大;样本率p或者1-p均不 太小时,此时样本率的分布近似正态分布 样本率与总体率的比较 两样本率的比较: (一)样本率和总体率的比较 例2:根据以往经验,一般胃溃疡患 者有20%发生胃出血症状。现某医院观 察65岁以上溃疡病人304例,有31.6%发 生胃出血症状,问老年胃溃疡患者是否 较容易胃出血? :=0.2 :0.2 单侧 ,拒绝 ,接受 ,差别有统 计学意义。可认为老年人胃溃疡出血率较一 般胃溃疡患者更易出血。 (二)两个率的比较的u检验 例3:某医院观察65岁以上溃疡病人100例,有 20例发生胃出血症状,观察20-65岁的胃溃疡患者 100例有12例发生胃出血症状。问老胃溃疡患者是 否较中年患者容易胃出血? H0:12 H1:12 单=0.05 本例:n1=100,x1=12,p1=0.12; n2=100,x2=20,p2=0.2 合并率 查u界值表,得P0.05,按双侧=0.05水平不拒绝H0,差别 无统计学意义,尚不能认为老年患者和中年患者的胃溃疡出 血率有差别。 第三节 卡方检验 2检验(Chi-square test),英国人K . Pearson( 1857-1936)是现代统计学的创始人之一,于1900年提 出的一种具有广泛用途的统计方法,可用于 两个或多个率间的比较 构成比的比较 计数资料的关联度分析 拟合优度检验等等。 本章仅限于介绍两个和多个率或构成比比较的2 检验。 一、卡方检验的基本思想(1) 疗疗法死亡生存 合计计病死率(%) 盐盐酸苯乙双胍26 (a)178 (b) 204(a+b) 12.75 (p1) 安慰剂剂 2 (c) 62 (d) 64(c+d) 3.13 (p2) 合 计计 28 (a+c.)240(b+d.) 268(a+b+c+d=n) 10.45 (pc) 例1 两种疗疗法的心血管病病死率的比较较 22表或四格表(fourfold table) 实际频数实际频数 A A (actual(actual frequency) frequency) ( ( a a、b b、c c、d d) ) 理论频数理论频数T T( ( theoretical frequency)theoretical frequency)(HH 0 0 : : 1 1 = = 2 2 =p=p c c ):): a a的理论频数的理论频数 (a+b)pc= (a+b)(a+c.)/ n=nRnC/n =21.3 b b的理论频数的理论频数 (a+b)(1-pc)= (a+b)(b+d.)/ n =nRnC/n =182.7 c c的理论频数的理论频数 (c+d)pc= (c+d)(a+c)/ n =nRnC/n =6.7 d d的理论频数的理论频数 (c+d)(1-pc)= (c+d)(b+d.)/ n =nRnC/n =57.3 疗疗法死亡生存合计计 盐盐酸苯乙双胍26 (21.3)178 (182.7)204 安慰剂剂2 (6.7)62 (57.3) 64 合 计计28 240268 四格表资料的卡方检验的自由度为1 卡方检验的自由度的计算公式: 一、卡方检验的基本思想(2) 各种情形下,理论与实际偏离的总和即为卡方值( chi-square value),它服从自由度为的卡方分布。 卡方检验检验 的基本思想:检验检验 A与T之间间的差异,如果A与T之间间 差异越大,则计则计 算出来的2值值就越大,查查2界值值表得出的P值值就越小 ,如果小于了0.05,则则拒绝绝H0假设设。 3.847.8112.59 P0.05的临界值 2分布(chi-square distribution) 2检验的基本公式 上述基本公式由Pearson提出,因此软 件上常称这种检验为Peareson卡方检验,下 面将要介绍的其他卡方检验公式都是在此 基础上发展起来的。它不仅适用于四格表 资料,也适用于其它的“行列表”。 二、四格表专用公式(1) 为了不计算理论频数T, 可由基本公式推导出,直接由 各格子的实际频数(a、b、c、d)计算卡方值的公式: 二、四格表专用公式(2) 2(1) u2 2.194924.82(n40,所有T5时) 疗疗法死亡生存 合计计病死率(%) 盐盐酸苯乙双胍26 (a)178 (b) 204(a+b) 12.75 (p1) 安慰剂剂 2 (c) 62 (d) 64(c+d) 3.13 (p2) 合 计计 28 (a+c.)240(b+d.) 268(a+b+c+d=n) 10.45 (pc) 三、连续性校正公式(1) 2分布是一连续型分布,而行列表资料属离散型分布 ,对其进行校正称为连续性校正(correction for continuity),又称Yates校正(Yates correction)。 当n40,而1T5时,用连续性校正公式 当n40或T1时,用Fisher精确检验(Fisher exact test ) 校正公式: 三、连续性校正公式(2) 因为1T5,且n40时,所以应用连续性校正2检验 四、配对四格表资料的2检验 例5.某研究室用甲、乙两种血清学方法检查410例确诊的鼻咽癌 患者,得结果如下表,问两种方法的检出率有无差别? 两种血清学检验结果 乙法 合 计 甲法 261(a) 110 (b) 371 8(c) 31 (d) 39 合计 269 141 410 配对四格表资料的2检验也称 McNemar检验(McNemars test) H0:两种方法的总体检查率相同,即BC H1:两种方法的总体检查率不同,即BC =0.05 配对四格表资料的2检验公式推导 五、行列(RC)表资料的2检验 前述四格表,即22表,是最简单的一 种RC表形式。因为其基本数据有R行C列, 故通称行列表或RC列联表( contingency table),简称RC表。 RC表的计算举例 例3.将133名尿路感染患者随机分为3组,分别接受甲乙丙三种 疗法,一个疗程后观察其疗效,结果如下,问3种疗法的尿培 养阴转率有无差别。 疗法 阴转人数 阳性人数 合计 阴转率() 甲 30 14 44 68.2 乙 9 36 45 20.0 丙 32 12 44 72.7 合计 71 62 133 53.4 基本公式 通用公式 RC表的2检验通用公式 代入基本公式 可推导出: 自由度=(行数1)(列数1) RC表的计算举例 例3.将133名尿路感染患者随机分为3组,分别接受甲乙丙三种 疗法,一个疗程后观察其疗效,结果如下,问3种疗法的尿培 养阴转率有无差别。 疗法 阴转人数 阳性人数 合计 阴转率() 甲 30 14 44 68.2 乙 9 36 45 20.0 丙 32 12 44 72.7 合计 71 62 133 53.4 1、建立假设,确定检验水准 H0:3种疗法的阴转率相同,即123 H1:3种疗法的阴转率不全相同,即1,2,3不同或不全相同 0.05 2、计算统计量 3、确定P值,做出统计推断 查2界值表,得P0.005,按0.05水准拒绝H0,接受H1,差别 有统计学意义,故认为3种疗法对尿路感染疗效不全相同。 例4.随机选择239例胃、十二指肠疾病患者和187例健康输血 员,其血型分布见下表,问胃、十二指肠疾病患者与健康输 血员血型分布有无差别。 分组 A B AB O 合计 胃、十二指肠 疾病患者 47 66 20 106 239 健康输血员 52 54 19 62 187 合计 99 120 39 168 426 1、建立假设,确定检验水准 H0:胃、十二指肠疾病患者与健康输血员血型分布的构成比相同 H1:胃、十二指肠疾病患者与健康输血员血型分布的构成比不同 0.05 2、计算统计量 3、确定P值,做出统计推断 查2界值表,得P0.05,按0.05水准,不拒绝H0,差别 无统计学意义,尚不能认为胃、十二指肠疾病患者与健康 输血员血型分布的构成比不同。 RC表2检验的应用注意事项 1. 对RC表,若较多格子(1/5)的理论频数小于5 或有一个格子的理论频数小于1,则易犯第一类错误。 出现某些格子中理论频数过小时怎么办? (1)增大样本含量(最好!) (2)删去该格所在的行或列(丢失信息!) (3)根据专业知识将该格所在行或列与别的行或列合并 。(丢失信息!甚至出假象) RC表2检验的应用注意事项 2.多组比较时,若效应有强弱的等级,如+,+,+,最好 采用后面的非参数检验方法。2检验只能反映其构成比有无 差异,不能比较效应的平均水平。 3.行列两种属性皆有序时,可考虑趋势检验或等级相关分析 。 4、当多个样本率(或构成比)比较的卡方检验,结论为拒绝H0 假设,只能认为各总体率(或总体构成比)之间总的说来有差 别,但不能说明它们彼此之间都有差别,或某两者间有差别。 若想进一步了解哪两者的差别有统计学意义,可用2分割 法。 2分割法是利用2值的可加性原理,把RC表分割为若 干个分割表,这些分割表的自由度之和等于原RC表的自由度 ,其2值之和十分接近原表的2值。分割的方法是按最近的原则 ,把阳性率(或构成比)相差不大的样本分割出来,计算其2值 。当差别无统计学意义时,就把它们合并为一个样本,再把它 与另一较接近的样本比较,如此进行下去直至结束。 例3.将133名尿路感染患者随机分为3组,分别接受甲乙丙三种 疗法,一个疗程后观察其疗效,结果如下,问3种疗法的尿培 养阴转率有无差别。 疗法 阴转人数 阳性人数 合计 阴转率() 甲 30 14 44 68.2 乙 9 36 45 20.0 丙 32 12 44 72.7 合计 71 62 133 53.4 对于例3:3种疗法尿路感染患者的阴转率的分析结果 作进一步的两两比较。 由于甲、丙疗法的阴转率差异最小,将它们分割出来 ,见下表。 甲疗法与丙疗法的疗效比较 疗法 阴转人数 阳性人数 合计 阴转率( ) 甲 30 14 44 68.2 丙 32 12 44 72.7 合计 62 26 88

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论