




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章卡方检验CHI-SQUARETEST计数资料统计分析(卡方检验)第一节率的抽样误差与可信区间第二节率的统计学推断一、样本率与总体率比较的u检验二、两个样本率比较的u检验第三节卡方检验一、卡方检验的基本思想二、四格表专用公式三、连续性校正公式四、配对四格表资料的χ2检验五、行×列(R×C)表资料的χ2检验计数资料的统计学推断第一节率的抽样误差与可信区间
一、率的抽样误差与标准误二、总体率的可信区间一、率的抽样误差与标准误
样本率(p)和总体率(π)的差异称为率的抽样误差(samplingerrorofrate),用率的标准误(standarderrorofrate)度量。如果总体率π未知,用样本率p估计标准误的计算观察某医院心率异常病人320人,其中按起博器者80人,接受该疗法的人数占为25.0%,试估计按起博器率的标准误。
二、总体率的可信区间当n足够大,且np和n(1-p)均大于5时,p的抽样分布逼近正态分布。其可信区间为:双侧:(p-uα/2
Sp,p+uα/2Sp)(u0.05/2=1.96)单侧:
p-uαSp
或
p+uαSp
(u0.05=1.645)试估计p=0.25,Sp=0.0242的总体率双侧95%可信区间。解:
u0.05/2=1.96,
(p-uα/2Sp,p+uα/2Sp)=(0.25-1.96×0.0242,0.25+1.96×0.0242)=(0.203,0.297)即总体率的95%可信区间为20.3%~29.7%。注意:如果计算获得的可信区间下限小于0%,上限大于100%,则将下限直接定为0%,上限直接定为100%。
第二节率的统计学推断
一、样本率与总体率比较u检验二、两个样本率的比较u检验一、样本率与总体率比较的u检验u检验的条件:np
和n(1-p)均大于5时二、两个独立样本率比较的u检验表5-1两种疗法的心血管病病死率比较疗法死亡生存合计病死率(%)盐酸苯乙双胍26(X1)178
204(n1)
12.75(p1)安慰剂2(X2)62
64(n2)
3.13(p2)合计28240
268
10.45(pc)u检验的条件:n1p1
和n1(1-p1)与n2p2
和n2(1-p2)均>5小结
1.样本率也有抽样误差,率的抽样误差的大小用σp或Sp来衡量。
2.率的分布服从二项分布。当n足够大,π和1-π均不太小,有nπ≥5和n(1-π)≥5时,近似正态分布。
3.总体率的可信区间是用样本率估计总体率的可能范围。当p分布近似正态分布时,可用正态近似法估计率的可信区间。
4.根据正态近似原理,可进行样本率与总体率以及两样本率比较的u检验。率的u检验能解决以下问题吗?
率的反应为生与死、阳性与阴性、发生与不发生等二分类变量,如果二分类变量为非正反关系(如治疗A、治疗B);反应为多分类,如何进行假设检验?率的u检验要求:n足够大,且nπ≥5和n(1-π)≥5。如果条件不满足,如何进行假设检验?
第三节卡方检验
χ2检验(Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。本章仅限于介绍两个和多个率或构成比比较的χ2检验。一、卡方检验的基本思想(1)疗法死亡生存合计病死率(%)盐酸苯乙双胍26(a)178(b)204(a+b)
12.75(p1)安慰剂2(c)62(d)
64(c+d)
3.13(p2)合计28(a+c.)240(b+d.)268(a+b+c+d=n)
10.45(pc)表5-1两种疗法的心血管病病死率的比较2×2表或四格表(fourfoldtable)实际频数A
(actualfrequency)(a、b、c、d)的理论频数T(theoreticalfrequency)(H0:π1=π2=π):a的理论频数=(a+b)×pc=(a+b)×[(a+c.)/n]=nRnC/n=21.3b的理论频数=(a+b)×(1-pc)=(a+b)×[(b+d.)/n]=nRnC/n=182.7c的理论频数=(c+d)×pc=(c+d)×[(a+c)/n]=nRnC/n=6.7d的理论频数=(c+d)×(1-pc)=(c+d)×[(b+d.)/n]=nRnC/n=57.3一、卡方检验的基本思想(2)各种情形下,理论与实际偏离的总和即为卡方值(chi-squarevalue),它服从自由度为ν的卡方分布。3.847.8112.59P=0.05的临界值χ2分布(chi-squaredistribution)χ2检验的基本公式上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行×列表”。二、四格表专用公式(1)
为了不计算理论频数T,
可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:二、四格表专用公式(2)2(1)~u2
=2.19492=4.82(n>40,所有T5时)三、连续性校正公式(1)
χ2分布是一连续型分布,而行×列表资料属离散型分布,对其进行校正称为连续性校正(correctionforcontinuity),又称Yates校正(Yates'correction)。⑴当n≥40,而1≤T<5时,用连续性校正公式⑵当n<40或T<1时,用Fisher精确检验(Fisherexacttest)校正公式:三、连续性校正公式(2)因为1<T<5,且n>40时,所以应用连续性校正χ2检验四、配对四格表资料的χ2检验配对四格表资料的χ2检验也称McNemar检验(McNemar'stest)H0:b,c来自同一个实验总体(两种剂量的毒性无差异);H1:b,c来自不同的实验总体(两种剂量的毒性有差别);α=0.05。配对四格表资料的χ2检验公式推导五、行×列(R×C)表资料的χ2检验R×C表的χ2检验通用公式几种R×C表的检验假设H0R×C表的计算举例R×C表χ2检验的应用注意事项
1.对R×C表,若较多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。 出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最好!)(2)删去该格所在的行或列(丢失信息!)(3)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象)
R×C表χ2检验的应用注意事项
2.多组比较时,若效应有强弱的等级,如+,++,+++,最好采用后面的非参数检验方法。χ2检验只能反映其构成比有无差异,不能比较效应的平均水平。
3.行列两种属性皆有序时,可考虑趋势检验或等级相关分析。
第四节趋势检验<11-2-4-6-8-12合计患病1725303228123未患病53113230154137110797合计54120225184169138920第五节多个四格表的联合分析abe=a+bcdf=c+dg=a+ch=b+dn表6-11两年龄组吸烟与肺癌年龄吸烟量病例组对照组合计>=1<1<40>=158100158<>=1504191<1111380491第六节四格表FISHER精确概率检验P=(a+b)!(c+d)!(a+c)!(b+d)!/a!b!n!d!n!
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025公基考题及解析(230题)
- 2025年福建省房屋租赁合同范本
- 2025电线电缆购销合同范本
- 上海市五年级试卷及答案
- 肇庆市实验中学高中历史二教案:第课大萧条与罗斯福新政
- 2025年事业单位标准劳动合同
- 2025年度网络广告服务合同协议书
- 电子元器件在智能电网中的应用考核试卷
- 糕点行业商业模式探索与创新实践考核试卷
- 建筑材批发商市场竞争策略的适应性调整考核试卷
- 第四单元“家国情怀”(主题阅读)-2023-2024学年五年级语文下册阅读理解(统编版)
- 汇川技术在线测评题库
- 《神笔马良》课本剧剧本
- 手术室不良事件
- 2024年大学试题(宗教学)-道教文化笔试历年真题荟萃含答案
- 矿用自动抑爆装置应用技术规范
- 2024年四川省公务员录用考试《行测》试题及答案
- 慢性心力衰竭患者的药物治疗与查房护理
- 多元智能理论与学科融合
- 医务人员手卫生规范课件2
- 女性宝妈健康知识讲座
评论
0/150
提交评论