版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章分类资料的统计推断统计推断用样本信息推论总体特征的过程。包括:参数估计:
运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。主要内容一、率(或构成比)的抽样误差和标准误二、总体率(或构成比)的估计三、总体率(或构成比)的假设检验
1.率(或构成比)的Z检验
2.x2检验
一、率的抽样误差与标准误
样本率(p)和总体率(π)的差异称为率的抽样误差(samplingerrorofrate),用率的标准误(standarderrorofrate)度量。如果总体率π未知,用样本率p估计二、总体率的估计点估计——样本率代替总体率区间估计——根据样本率推算总体率可能所在的范围
率的置信区间1、查表法当n≤50,尤其是p接近0或1时,可直接查表得到。例:从某地随机抽取31名初中生,发现有9名近视,试求该地初中生近视发生率的95%置信区间。
查表得:(14%,48%)例:某地抽查了10名居民的乙肝表面抗原(HBsAg)携带情况,阴性者8人,求该县人群HBsAg阴性率的95%置信区间。注:附表中只列出x≤n/2的部分,当x>n/2时,可以用n-x查表,再以100%减去查得的区间即可。因8>10/2,故以n-x=2查表,得3%~56%,再用100%分别减去,得出区间:(44%,97%)2、正态近似法当n足够大,且np
和n(1-p)均大于5时,p的抽样分布逼近正态分布。其可信区间为:双侧:(p-Zα/2
Sp,p+Zα/2
Sp)(Z0.05/2=1.96)单侧:p-Zα
Sp
或
p+Zα
Sp
(Z0.05=1.645)试估计p=0.585,Sp=0.048的总体率双侧95%可信区间。解:
(p-Zα/2
Sp,p+Zα/2
Sp)=(0.585-1.96×0.048,0.585+1.96×0.048)=(0.491,0.679)即总体率的95%可信区间为49.1%~67.9%。注意:如果计算获得可信区间下限小于0%,上限大于100%,则将下限直接定为0%,上限直接定为100%。三、样本率与总体率比较的Z检验Z检验的条件:nπ
和n(1-π)均大于5时四、两个独立样本率比较的Z检验表5-1两种疗法的心血管病病死率比较疗法死亡生存
合计病死率(%)安慰剂26(X1)178204(n1)12.75(p1)盐酸苯乙双胍2(X2)6264(n2)3.13(p2)合计2824026810.45(pc)Z检验的条件:n1p1
和n1(1-p1)与n2p2
和n2(1-p2)均>5小结1.样本率也有抽样误差,率的抽样误差的大小用σp或Sp来衡量。
2.率的分布服从二项分布。当n足够大,π和1-π均不太小,有nπ>5和n(1-π)>5时,近似正态分布。
3.总体率的可信区间是用样本率估计总体率的可能范围。当p分布近似正态分布时,可用正态近似法估计率的可信区间。
4.根据正态近似原理,可进行样本率与总体率以及两样本率比较的Z检验。率的Z检验能解决以下问题吗?
率的反应为生与死、阳性与阴性、发生与不发生等二分类变量,如果二分类变量为非正反关系(如治疗A、治疗B);反应为多分类,如何进行假设检验?率的Z检验要求:nπ>5且n(1-π)>5,如果条件不满足,如何进行假设检验?
五、卡方检验χ2检验(Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。(一)卡方检验的基本思想(1)疗法死亡生存
合计病死率(%)安慰剂26(a)178(b)204(a+b)12.75(p1)盐酸苯乙双胍2(c)62(d)64(c+d)3.13(p2)合计28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)表5-1两种疗法的心血管病病死率的比较2×2表或四格表(fourfoldtable)实际频数A
(actualfrequency)
理论频数T(theoreticalfrequency):a的理论频数=(a+b)×[(a+c.)/n]=nRnC/n=21.3b的理论频数=(a+b)×[(b+d.)/n]=nRnC/n=182.7c的理论频数=(c+d)×[(a+c)/n]=nRnC/n=6.7d的理论频数=(c+d)×[(b+d.)/n]=nRnC/n=57.3(一)卡方检验的基本思想(2)
各种情形下,理论与实际偏离的总和即为卡方值(chi-squarevalue),它服从自由度为ν的卡方分布。3.847.8112.59P=0.05的临界值χ2分布(chi-squaredistribution)χ2检验的基本公式
上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验。它不仅适用于四格表资料,也适用于其它的“行×列表”。(二)四格表专用公式(1)
为了不计算理论频数T,
可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:(二)四格表专用公式(2)
2(1)~z2
=2.19492=4.82(n>40,所有T
5时)(三)连续性校正公式(1)
χ2分布是一连续型分布,而行×列表资料属离散型分布,对其进行校正称为连续性校正(correctionforcontinuity),又称Yates校正(Yates'correction)。⑴当n≥40,而1≤T<5时,用连续性校正公式⑵当n<40或T<1时,用Fisher精确检验(Fisherexacttest)(三)连续性校正公式(2)因为1<T<5,且n>40时,所以应用连续性校正χ2检验(四)配对四格表资料的χ2检验配对四格表资料的χ2检验也称McNemar检验(McNemar'stest)H0:b,c来自同一个实验总体(两种剂量的毒性无差异);H1:b,c来自不同的实验总体(两种剂量的毒性有差别);α=0.05。配对四格表资料的χ2检验公式推导(五)行×列(R×C)表资料的χ2检验行×列表也称R×C表,包括2×2、R×2、2×C、R×C表等。四格表为其中最简单的一种形式,本节主要讨论行数大于2或列数大于2的行×列表资料的χ2检验,用于多个样本率或构成比的比较。它的基本原理和检验步骤与四格表χ2检验相似,可用χ2检验的基本公式进行计算。R×C表的χ2检验通用公式几种R×C表的检验假设H0R×C表的计算举例R×C表χ2检验的应用注意事项1.对R×C表,若较多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。 出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最好!)(2)删去该格所在的行或列
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关于毕业学生实习报告四篇
- 经股肱桡尺动脉介入治疗对比-袁晋青
- 北京小学科学教师学年工作总结大全
- 儿童临时监护协议书(2篇)
- 办公场地出租合同模板
- 深圳商铺租赁合同书
- 赠送别克商务轿车协议书
- 厂房租赁协议合同书范本
- 扬州地下停车位出租协议
- 八年级道德与法治下册第二单元理解权利义务第四课公民义务第2框依法履行义务教案新人教版
- 2019电子保单业务规范
- 学堂乐歌 说课课件-2023-2024学年高中音乐人音版(2019) 必修 音乐鉴赏
- 幕墙工程材料组织、运输装卸和垂直运输方案
- 灌溉用水循环利用技术
- 泌尿科一科一品汇报课件
- 2024年江西省三校生高职英语高考试卷
- 中国古代文学智慧树知到期末考试答案章节答案2024年广州大学
- 重庆市南岸区2022-2023学年五年级上学期期末语文试卷
- 现浇钢筋混凝土整体式肋梁楼盖结构-课程设计
- 服务器维保应急预案
- 烟花爆竹经营
评论
0/150
提交评论