分类资料统计推断_第1页
分类资料统计推断_第2页
分类资料统计推断_第3页
分类资料统计推断_第4页
分类资料统计推断_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于分类资料统计推断第一张,PPT共四十页,创作于2022年6月一、率的抽样误差与标准误 抽样研究所得的率同样存在抽样误差,描述其大小的指标是率的标准误(standard error of proportion),其计算公式如下: 第二张,PPT共四十页,创作于2022年6月二、总体率的估计和率的u检验 1、总体率的估计: 总体率的估计有两种方法,一是正态分布法,二是查表法。正态分布法 适用于样本较大,且p和/或1-p都不太小,如np和n(1-p)都大于5时。计算公式为:查表法 适用于小样本。利用样本含量n和阳性数x查“百分率的可信区间”表获得。第三张,PPT共四十页,创作于2022年6月例1

2、 检查居民800人粪便中蛔虫阳性200人,阳性率为25 %,试求当地居民粪便蛔虫阳性率的95 % 可信区间和99 % 可信区间。 公式: 其中, 即: 阳性率的95 % 可信区间为: ( 0.22 , 0.28 ) 或 ( 22 % , 28 % ) 同理可得阳性率的99 % 可信区间。 第四张,PPT共四十页,创作于2022年6月2、 率的u检验 (1)样本率与总体率比较 样本率与总体率(一般为理论值、标准值或经大量观察所得的稳定值等)比较的目的,是推断样本所代表的未知总体率与已知总体率0是否相等。 可选方法有直接计算概率法(用于偏离 0.5 较远,且阳性数 X 较小作单侧检验时)和正态近似

3、法。这里着重介绍正态近似法。 当或 1不太小,而n 足够大时,如n和n(1)大于 5 时,即可按正态近似法做假设检验。检验统计量为 u 值,计算公式如下:式中 n 为样本例数,X 为样本阳性数,样本率 p = X/n ;0 为总体率;0.5 为连续性校正数,当 n 较大时可以省去,而X n 0.5 时不宜采用校正数。 第五张,PPT共四十页,创作于2022年6月 例2 以往经验脑梗塞患者治疗三周的生活能力改善率为30 % ,某医院用新疗法治疗38例的三周生活能力改善率为50 % ,能否认为新疗法的改善率与以往不同? 此为样本率与总体率比较:且n p和 n(1-p) 都大于5,故用u检验。 设

4、= 0.05 计算统计量u值: 本例X n0.5 ,因此不宜用校正系数,故 = 2.69 确定P值,作结论: 查t界值表中,= 时,u 0.01 = 2.5758 , u 0.005 = 2.8070 , 因而 0.01 P 0.005 , 则 P, 拒绝H0, 接受H1, 可以认为新疗法的改善率与以往不同,新疗法的改善率高于以往。 第六张,PPT共四十页,创作于2022年6月 (2)两个样本率比较 式中P0为合并阳性率,P0 =(X1 + X2)/(n 1 + n 2 ) 检 验 统 计 量 计 算 公 式 如 下 : 第七张,PPT共四十页,创作于2022年6月 例3 某中药研究所试用某种

5、草药预防流感,观察用药组和对照组(未用药组)的流感发病率,结果如下表,问两组的流感发病率是否不同? 表1 用药组和对照组的流感发病率 此为两大样本率的比较,可用u检验。 第八张,PPT共四十页,创作于2022年6月 假设检验过程: 设 = 0.05 计算统计量u值: = 2.031 确定P值,作结论: 查t界值表中,= 时,u 0.05 = 1.96 , u 0.01 = 2.5758 , 因而 0.05 P0.01 , 则P, 拒绝H0, 接受H1, 可以认为两组发病率不同,用药组发病率低于对照组,说明该草药有预防流感的作用 第九张,PPT共四十页,创作于2022年6月三、2 检验2检验(C

6、hi-square test)用途极广,这里仅介绍它在分类变量资料中用于推断两个或两个以上总体率(或构成比)之间有无差别或有无关联的分析方法。 第十张,PPT共四十页,创作于2022年6月1、2检验的基本思想 例4:某医生用国产呋喃硝胺治疗十二指肠球部溃疡,以甲氰咪胍作对照组,结果如表5,问两种方法治疗效果有无差别? 表2. 两种药物治疗十二指肠球部溃疡的效果 Chi-square test第十一张,PPT共四十页,创作于2022年6月 设 = 0.05 计算统计量2值: 2值的基本公式为: 式中A为实际频数,即所获资料中的基本数据;T为理论频数,是根据检验假设H0推算得到的, ,其中,n R

7、为同行合计,n C为同列合计,n为总例数。 2检验的基本思想体现在2值的基本公式中,即当H0成立时,实际频数 A就与理论频数 T很接近,此时2值不会太大;反之,如若A与T相差较大,就会计算得到一个较大的2值,当其超出一定范围时,就有理由认为H0不成立。因此,实际上2值反映了实际频数与理论频数的吻合程度。 Pearson卡方值第十二张,PPT共四十页,创作于2022年6月2、四格表资料的2检验 四格表资料即基本数据只有四个,为两行两列,如两个率的比较。 检验统计量专用计算公式为: ,=(R-1)(C-1) 式中a , b , c , d 分别代表四个实际频数,n 为总例数;为自由度,R为行数,C

8、为列数。 fourfold table第十三张,PPT共四十页,创作于2022年6月 (1)四个表资料2检验实例 : 例4:某医生用国产呋喃硝胺治疗十二指肠球部溃疡,以甲氰咪胍作对照组,结果如表5,问两种方法治疗效果有无差别?表2. 两种药物治疗十二指肠球部溃疡的效果 第十四张,PPT共四十页,创作于2022年6月假设检验过程: 设 = 0.05 计算统计量2值: 确定P值,作结论: 查2界值表中,= 1 时, 20.05,1 = 3.84 , 20.01,1 = 6.63 , 因而 0.05 P 0.01 , 即 P, 因而拒绝 H0 , 接受 H1 , 可以认为两组溃疡愈合率差别显著,呋喃

9、硝胺的愈合率高于甲氰咪胍。第十五张,PPT共四十页,创作于2022年6月(2)四格表资料2检验应用注意: 当n40,且任意T5时,可 四格表专用公式。 当n40,且任意1T5时,应 ,其计算公式为: 例5. 某医生欲比较胞磷胆碱与脑益嗪治疗脑动脉硬化的疗效,观察结果如表3,问两种药物的疗效有无差别? 表3. 两种药物治疗脑动脉硬化的疗效 表3显示有一个理论频数T 5,因此应用校正2检验。 当n40或任意T1时,应改用确切概率法。 直接使用计算校正2值第十六张,PPT共四十页,创作于2022年6月(3)四格表资料2检验与 u 检验的关系 例6 以例3资料作2检验,整理如表4:表4 用药组和对照组

10、的流感发病率的比较 即两大样本率比较的2检验与 u 检验是等价的。 = 4.125 = u 2 (2.031)2第十七张,PPT共四十页,创作于2022年6月例7 某市对医院空气消毒监测,市级医院65个抽样点中52个合格,合格率80 .00% ,乡镇医院53个抽样点中22个合格,合格率41.51 % 。问城乡医院空气消毒合格率是否不同?表5 城乡医院空气消毒合格率的比较 采用2检验 = 18.50 第十八张,PPT共四十页,创作于2022年6月 例8 某医生用两种疗法治疗某病,结果如表6 ,问可否认为新疗法优于传统疗法?表6 两种疗法治疗某病治愈率比较 = 7.47 第十九张,PPT共四十页,

11、创作于2022年6月3、行列表(RC表)资料的2检验 行列表资料即基本数据在四个以上,如多个率的比较,其基本数据为R行2列;两组构成比的比较,其基本数据为2行C列;多组构成比的比较,其基本数据为R行C列。 检验统计量计算公式为: ,=(R-1)(C-1) 其应用条件是 T 5 的格子数不超过 1/5 和没有任意格的 T1 。如果出现上述情况应作如下处理: 根本办法是增加观察例数,使各格基本数据增大;将T较小的行或列与性质相近的行或列作合理的合并。 ROWCOLUMN第二十张,PPT共四十页,创作于2022年6月 例9 某地在流行性脑脊髓膜炎流行期间进行了带菌调查,结果如表7,问不同人群带菌率是

12、否不同? 表7 某地流行性脑脊髓膜炎流行期不同人群带菌率 采用RC表资料2检验。 第二十一张,PPT共四十页,创作于2022年6月 设 H0:四个人群带菌率相同,即 H1:四个人群带菌率不同或不全相同 = 0.05 计算统计量2值 = 18.17 确定P值,作结论: 查2界值表, 按=(R-1)(C-1)求得= 3, ,因而P 0.005 。按=0.05水准,拒绝H0 ,可以认为不同人群带菌率不同或不全相同。 第二十二张,PPT共四十页,创作于2022年6月 例10 两个医院合作进行脑梗塞疗效试验中,各医院受试病例的脑梗塞部位如表8所示,问两所医院病例的梗塞部位的分布(构成比)是否不同? 表8

13、 甲乙两医院病例的脑梗塞部位的分布 采用RC表资料2检验。 第二十三张,PPT共四十页,创作于2022年6月 设 H0:两所医院病例的梗塞部位的总体分布(构成比)相同 H1:两所医院病例的梗塞部位的总体分布(构成比)不同 = 0.05计算统计量2值 =14.29确定P值,作结论: 查2界值表, 按=(R-1)(C-1)求得= 2, ,因而P 40 时可以略去。 对同一个(或同一对)观察对象研究两种分类方法(或两种处理)结果间是否有关联时,检验统计量公式为:需注意,此时公式应用条件同前。上述两种情况分析目的不同,其检验假设亦不同。 How第二十七张,PPT共四十页,创作于2022年6月 例12为

14、了研究两种培养基分离空肠弯曲杆菌的效果,将每份粪便标本分别接种于甲乙两种培养基共做50份培养结果如表10。 表10 两种培养基培养50份标本培养结果 表11 两种培养基培养50份标本培养结果 此为同一标本用两种方法培养的配对设计,应列为22双向交叉分类表(即22列联表),如表11 。表中每一格表示同一份标本两种培养基结果不同组合的实际对子数。 应注意,若将表10数据归纳为下表的形式,是不能明确反映出同一标本两种培养结果的异同,而只是单独列出了每种培养基的培养结果,这就将配对设计归纳成了每组50份标本的两个独立的样本了,这是不恰当的 。第二十八张,PPT共四十页,创作于2022年6月两种方法检出

15、结果差别的检验设 或 b = c 或 bc = 0.05计算统计量:确定P值,作结论: 经查2界值表中,= 1 时, 20.05,1 = 3.84 , 因而 P 0.05 , 即 P, 因而不能拒绝 H0 , 还不能认为两种培养基的检出率不同。第二十九张,PPT共四十页,创作于2022年6月两种方法检出结果关联性检验设 H0:两种培养基的培养结果无关联 H1:两种培养基的培养结果有关联 = 0.05计算统计量:确定P值,作结论: 经查2界值表中,= 1 时, 20.005,1 = 7.88 , 因而 P0.005 , 即 P, 因而拒绝 H0 , 可以认为两种培养基的检出率有关联。从表内数据看

16、检出结果一致率为(20+21)/50 = 82% 。第三十张,PPT共四十页,创作于2022年6月例13 某研究室用甲乙两种血清学方法检查410例确诊的鼻咽癌患者,得结果如表12,问两种检验结果间有无联系?有无差别? 表12 两种血清学方法检验结果 相关性分析:2 = 38.85, = 1,查 2界值表得P0.005,可以认为两种血清学方法检验结果间有联系。 差别性检验: 2 = 86.44, = 1,查 2界值表得P0.005,可以认为两种血清学方法检出率不同,甲法阳性检出率较高。第三十一张,PPT共四十页,创作于2022年6月 例14 为了解巨细胞病毒感染情况,某医师分别采集了302对母亲

17、与婴儿血清,并测定其IgM抗体,结果如表13。问母婴间血清IgM抗体检出是否相关?母婴间血清IgM抗体检出率有无差别? 表13 302对母婴血清IgM抗体检测结果 本例,Tmin=1.025,故而在分析“是否相关”时采用四格表资料校正2检验得:2=142.318,=1,则P0.10,尚不能认为母婴间血清IgM抗体检出率有差别。 第三十二张,PPT共四十页,创作于2022年6月(2)RC列联表资料的2检验 同一观察对象(或同一组观察人群)分别按两种分类变量的不同水平分组,若所分水平多于2个时,就可将观察结果归纳成 RC列联表,如例15中表14。其形式与前述RC表资料类似,但其研究设计和分析目的是

18、不同的。 RC列联表资料的2检验的分析目的是检验两个分类变量间有无关联,其检验统计量的计算仍用行列表专用公式,即:第三十三张,PPT共四十页,创作于2022年6月 例15 某医师为研究肥胖程度与发胖年龄间的关系,观察了438名肥胖儿童青少年,结果如下表: 表14 438名肥胖儿童青少年肥胖程度和发胖年龄 其检验假设为:Ho:肥胖程度与发胖年龄无关联 H 1:肥胖程度与发胖年龄有关联本例, 2 = 40.95, =(4-1)(3-1)= 6,查 2界值表得2 0.005,6 = 18.55 , 则P0.005,可以认为肥胖程度与发胖年龄间有关联性。第三十四张,PPT共四十页,创作于2022年6月

19、例16 观察依沙酰胺治疗皮肤真菌感染效果的临床试验,结果如表15。试分析该病的疗效是否与病程有关? 表15 依沙酰胺治疗皮肤真菌感染疗效 当获得两个变量间有关联时,若需进一步说明相关的密切程度,可计算列联系数,其计算公式为:P值在0-1之间,P越接近于1,关联性越强,即关系越密切;P越接近于0,则关联性越弱。本例 2 = 24.64 ,P0.005,Pearson列联系数=0.232。病 程痊愈好转无效合 计5年 29 2610 65合 计24014649435第三十五张,PPT共四十页,创作于2022年6月例17 某矿职工医院探讨矽肺不同期次患者的胸片肺门密度变化,把492名患者的资料归纳如表16。问矽肺患者肺门密度的增加与矽肺的期次有无关系?表16 不同期次矽肺患者肺门密度级别分布 本例, 2 = 163.01, =(3-1)(3-1)= 4,查 2界值表得P0.005,可以认为矽肺患者肺门密度的增加与矽肺的期次有关联性。 为进一步说明相关的密切程度,计算列联系数 P,结果为P = 0.499。表明二者有中度相关关系。但

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论