第八讲计数资料推断_第1页
第八讲计数资料推断_第2页
第八讲计数资料推断_第3页
第八讲计数资料推断_第4页
第八讲计数资料推断_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计数资料的统计推断第八讲计数资料统计推断内容l 假设检验:二项分布u检验 , 2检验l率差或率比的区间估计一、计数资料假设检验-u检验pspu0由临床经验得知,一般溃疡病患者的胃出血率为20%,现某医师观察65岁以上溃疡病人250例,其中80例发生胃出血症状,问老年患者胃出血率与一般患者是否不同?u检验应用条件: 当n较大,np和n(1-p)均大于5时,可利用样本率p的分布近似正态分布-H0:=0 ,即老年患者胃出血率与一 般患者相同H1:0 ,即老年患者胃出血率与一般患者不同 =0.05本例 0=20%,n=250,x=800295. 0250)32. 01 (32. 0)1 (32. 02

2、5080nppSnxpp07. 40295. 020. 032. 0ulP 0.001,按=0.05,拒绝H0,接受H1,可认为老年患者胃出血率与一般患者不同,老年溃疡病患者更容易出现胃出血。 l老年溃疡病患者出血率的95%可信区间:0.262 0.378l一般出血率:0.20(二)两样本率比较u检验 目的是推断两样本所来自两总体率是否相等。 u检验应用条件: 当n较大,np和n(1-p)均大于5时,可利用样本率p的分布近似正态分布其u检验公式为:22211121)1 ()1 (2121nppnppssppupppp 例:为比较工人和农民的高血压患病率,分别调查了5059岁男性工人和5059岁

3、男性农民1281人和387人,其高血压患者分别为386人(患病率30.1%)和65人(患病率16.8%)。问工人与农民的高血压患病率有无不同?H0:1=2, 两者高血压患病率相同H1:12 ,两者高血压患病率不同=0.05 本例 x1=386,n1=1281 ,p1=30.1%;x2=65,n2=387 ,p2=16.8% 023. 0387832. 0168. 01281699. 0301. 0)-1 (n)-1 (222111nppppSEdiff将有关数据代入u检验公式 P 0.001,按=0.05,拒绝H0,接受H1,可认为5059岁男性工人和 5059岁男性农民高血压患病率不同,工人

4、患病率高于农民。率差95%可信区间:0.088 - 0.17878. 5023. 0168. 0301. 02121ppsppulKarlPearson,18571936,生卒于伦敦,公认为统计学之父。 1879年毕业于剑桥大学数学系;曾参与激进的政治活动,还出版几本文学作品,并且作了三年的实习律师。1884年进入伦敦大学学院 ,教授数学与力学,从此在该校工作一直到1933年。 lK Pearson 最重要的学术成就,是为现代统计学打下了坚实基础。KPearson 在1893-1912年间写出18篇在进化论上的数学贡献的文章,而这门“算术”,也就是今日的统计。许多统计名词如标准差,成分分析,卡

5、方检验都是他提出。 2检验的主要应用 l推断两个或两个以上总体率或构成比有无差别;l两分类变量间有无相关的假设检验(独立性);l拟合优度检验(理论分布与实际分布的吻合情况检验)。 (一) 2 检验主要类型l四格表资料的2检验lR X C表资料的2检验l列联表资料的2检验l2X2列联表的2检验处理组处理组 发生数发生数 未发生数未发生数 合计合计 甲甲 a b a+b 乙乙 c d c+d 合合 计计 a+c b+d n 以四格表资料为例 例4、在二乙基亚硝胺诱发大白鼠鼻咽癌的实验中,一组单纯用亚硝胺向鼻腔灌注,另一组在鼻注的基础上加肌注维生素B12,问两组发癌率有无差别? 表5 两组大白鼠发癌

6、率的比较 73.2%(71) 92.9%(42) (样本率不等)推断总体率两总体率相等两总体率不等P值小概率事件拒绝H0不拒绝H02 检验的基本思想 建立假设 H0:两组发癌率相等, H1:两组发癌率不等, =0.05*两组的总体发癌率相等,均等于合并发癌率 = 91 /113 =80.53%l为反映所有格子的吻合情况,所有差值求和,(A-T)=0 (正负抵消),差值和可定义为(A -T)2 ;l相对比例保持不变,T值越大, (A-T)2值越大,为消除其影响,差值定义为: (A-T)2/Tl在样本量足够大时,该值服从于自由度为=(行数-1)(列数-1) 的2 分布。 即2检验公式: 2 = (

7、A-T)2/Tl在无效假设成立时: 2值一般不会很大,出现大的2值的概率P是很小的,若P( 检验水准),则没有理由拒绝它。Pearson Chi-square distribution2 分布与P值l2 值反映了实际频数与理论频数的差值大小l2 值的大小与p值呈反比关系,即2 值越大,P值越小; 反之亦然。l2 值达到界值点,就有理由认为成立的可能性不大,是小概率事件,因而拒绝H0 。对于四格表资料: 0.052 =3.841、四格表资料2 检 验计算结果 本例2 值=6.48,自由度为1,查2 界值表,得p40时, 选用一般计算公式l当1T40时, 需计算校正公式l当T1或n1表示Vitb1

8、2 为危险因素。l以OR值为例,其中OR服从对数正态分布,则有:d1c1b1a1V,VuORlnORlnORln实例分析 (二)、2X2列联表(配对设计) 1、资料特点与分析目的l资料的特点:双向有序的四格表资料-有时被称为配对计数资料。l分析目的: A:两法检验结果有无关系(四格表2检验) B:两法检验有无差别(专用公式)。2、假设检验(1):相关分析检验目的:两法检验结果有无关系。 H0:两法检验结果无关系 H1:两法检验结果有关系 =0.05 2值=38.85,=1确定P值: 查卡方界值表,得P0.005, 按照=0.05的水准,拒绝H0,而接受H1,可认为两法检验结果有关。 3、假设检

9、验(2):差别分析检验目的:两法检验结果有无差别 H0:两总体b=cH1:两总体bc=0.05 确定P值: 查卡方界值表,得P40时,公式可简化为: 1,)()(22cbcbChi-Square Tests38.848b1.00036.6701.00037.1281.000.000.00038.7531.000.000c410Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestLinear-by-LinearAssociationMcNemar TestN of Valid CasesValuedf

10、Asymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. The minimum expected count is13.41.b. Binomial distribution used.c. 5、率差的95%可信区间l可定义p1-p2=(b-c)/n l则率差的95%可信区间为:l上例两法总体率差值的95%可信区间为(0.20 0.30)。 diff212diffSEupp,n)

11、cb( cbn1=SE-2X2列联表资料的分析特点l对此类资料可以做两方面的分析: 相关分析:采用一般的四格表公式 差别分析:采用专用公式l对上例结果:两类检验方法结果是有关的,且有差别,甲法好于乙法。(三)、多个样本率比较 l多个率间比较的行X列表(RXC)的 2 检 验。l应用条件:不能有1/5格子的理论频数小于5,或最小理论频数小于1。 实例演示 例5 某医师研究物理疗法、药物疗法和外用膏药三种疗法治疗周围性神经麻痹的疗效,问三种疗法的有效率有无差别? 分析三种疗法的有效率?表6 三种疗法的有效率比较1、建立假设H0:三种疗法有效率相等,H1:三种疗法的有效率不等或不全等=0.05 2、

12、确定P值与结论l =17.91, =(3-1)(2-1)=2 l查卡方界值表,得P0.05。l后把乙丙两组合并,再与甲组比较,作2检验, 2=17.83,=1,得P值0.05,说明二、三组与第一组有差别。 实例演示注意事项 l 行X列表2检验应用条件:要求理论频数不宜太小,对于行X列表不宜1/5以上格式的理论频数小于5,或有一个理论频数小于1。l若不满足,可采用方法:增加样本例数以增加理论频数;删除上述理论频数太少行或列;将理论频数太小性质行或列相近实际频数合并。确切概率法(四)特殊行X列表资料的分析 主要是两类有序行X列表资料l对于单向有序资料的组间差别检验时应采用秩和检验,此时的2检验只能

13、说明各组在效应的构成比上有无差别;l对于双向有序、属性不同资料,2检验用于两个多分类变量间的线性相关分析。1、双向有序资料-列联表 l特点:双向有序、行变量和列变量属性不同的资料。l分析目的:2检验用于相关性分析。 实例分析建立假设: H0:矽肺期次与肺门密度级别之间无关系 H1:矽肺期次与肺门密度级别之间有关系=0.05确定P值与下结论: 2值=163.01, =(3-1)(3-1)=4。查卡方界值表,得P0.005, 按照=0.05的水准,拒绝H0,而接受H1,可认为矽肺期次与肺门密度级别之间有关 。.766.04613.680.000492GammaOrdinal by OrdinalN

14、 of Valid CasesValueAsymp.Std. ErroraApprox. TbApprox. Sig.a. 2、行、列变量的属性分为:双向无序、单向有序、双向有序属性相同和双向有序属性不同4类。A、对于双向无序资料:若比较多个样本率(或构成比),可用行列表资料卡方检验;若分析两个分类变量之间有无关联性以及关系的密切程度时,可用行列表卡方检验以及Pearson列联系数进行分析。 B、单向有序资料 l分组变量(如年龄)有序,而结果变量(如传染病的类型)无序,分析不同组结果构成情况,可用行列表卡方检验进行差别分析。l分组变量(如疗法)无序,而结果变量(如疗效按等级分组)有序,比较不同

15、组别疗效,应用秩和检验。C、双向有序、属性相同资料 l两个分类变量皆为有序且属性相同。如用两种检测方法同时对同一批样品的测定结果。其研究目的通常是分析两种检测方法的一致性,此时宜用一致性检验或称Kappa检验。D、双向有序、属性不同资料 l若分析不同年龄组患者疗效之间有无差别时,可把它视为单向有序表资料,选用秩转换的非参数检验;l若分析两个有序分类变量间是否存在相关关系,宜用等级相关或Pearson相关分析;l若分析两个有序分类变量间是否存在线性变化趋势,宜用线性趋势检验。(五)、其它类型的2 检验-拟合优度检验1、结 果 2 = (A-T)2/T=51.1, P0.05。 因此拒绝0,接受

16、H1 ,说明心肌梗死的发生有季节性的差别。三、误用卡方检验的实例分析实例10实例11实例12例13、某检验法在病毒感染诊断上的应用,表13摘自该文附表Chi-Square TestsChi-Square Tests9.271a2.0109.2252.0108.9311.0031981Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)0 cells (.0%) have expected count less than 5. Themini

17、mum expected count is 184.01.a. 例14 将116例癫痫患者随机分为两组,一组70例接受常规加高压氧治疗(高压氧组),另一组46例接受常规治疗(常规组),治疗结果见表。问两种疗法有效率有无差别?两种疗法治疗癫痫的效果 本例 ,故用四格表资料 检验的校正公式22116, 4.8nT但22(66 84 38116 2)11622.9270 46 104 12c 本资料若不校正时, 24.080.05P,检验效能及计算l检验效能:1- lPe, ne分别为干预组的率与例数; Pc, nc分别为对照组的率与例数。l本例检验效能:0.41uppppppnnnnucceececece)1 ()1 ()(*2l某医生用两种方法治疗肺癌,出院后随访24个月。甲疗法治疗46例,生存22例;乙疗法治疗58例,生存35例。试分析该资料?例题二l某研究所研制出甲乙两种隔离服,用于预防传染病。在某医院随机抽取11名医生穿甲隔离服,30

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论