卡方检验(研).ppt_第1页
卡方检验(研).ppt_第2页
卡方检验(研).ppt_第3页
卡方检验(研).ppt_第4页
卡方检验(研).ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/7/9,1,卡方检验,Chi-square test,第十章,胡利人 广东医学院 流行病与卫生统计学教研室 ,2020/7/9,2,2检验是英国统计学家Pearson于1900年提出的一种应用范围很广的统计方法.,Karl Pearson,2020/7/9,3,卡方检验的用途 推断两个或多个总体率或构成比之间有无差别 两个分类变量间有无相关关系 多个率的趋势检验 频数分布的拟合优度检验,2020/7/9,4,2 检验的基本思想,【例10-1】为比较西药与中药治疗慢性支气管炎的疗效,某医师将符合研究标准的110例慢性支气管炎患者随机分为两组,西药组86例,中药组24例。服药一个疗程后,

2、观察患者的疗效,问两种药有效率是否有差别?,2020/7/9,5,分析思想: 假设两疗法相同,则两疗法的平均显效率=53/110= 48.18 理论上西药组 显效人数8648.18%=41.44 无效人数8641.44=44.56; 中药组 显效人数2448.18=11.56 无效人数2411.56=12.44。,41.44 44.56 11.56 12.44,2020/7/9,6,实际频数与理论频数存在差异,如该差异如果为抽样误差的许可范围,则两治疗组的显效率一致,否则,则两组的显效率不是来自同一总体,即两治疗组有效率不同。,41.44 44.56 11.56 12.44,41.44 44.

3、56 11.56 12.44,41.44 44.56 11.56 12.44,2020/7/9,7,实际数与理论数相差的程度(或者说吻合的程度)又如何衡量呢?,2020/7/9,8,实际频数与理论频数的差异可以表示为 值反映了实际频数与理论频数吻合的程度(差别的程度)。,2020/7/9,9,值服从自由度为的卡方分布,2020/7/9,10,2020/7/9,11,如果检验假设H0成立,则实际数与理论数之差一般不会很大,2值应很小,2值对应的的概率P则比较大,反之亦然。因此若P ,就怀疑假设H0,因而拒绝它;若P ,则尚无理由拒绝它,2020/7/9,12,第一节 22表的卡方检验,基本数据的

4、行数和列数均为2者,称为22表资料或四格表资料;基本数据的行数或列数大于2者,称为RC列联表资料或行列表资料。,2020/7/9,13,2 检验( Pearson 卡方检验)基本公式: 上式中A 为实际频数,T 为理论频数,TRC 为第R 行C 列的理论频数,为相应的行合计,为相应的列合计,一、完全随机设计 检验,2020/7/9,14,由计算公式,代入理论数,四格表的专用计算公式:,2020/7/9,15,2020/7/9,16,【检验步骤】 1. 建立检验假设,确定检验水准 H0:西药和中药的显效率相同,即1=2 H1:西药和中药的显效率不同,即12 = 0.05,2020/7/9,17,

5、2. 计算检验统计量2 值,,,,,2020/7/9,18,查2界值表,得2 0.05,1=3.84, 2 2 0.05,1,P 0.05,按 = 0.05水准,拒绝H0 ,接受H1,差异有统计学意义,可以认为两组的显效率不等 ,中药组显效率高于西药组,3. 确定P值,作出统计推断,2020/7/9,19,四格表资料2检验专用公式,2020/7/9,20,四格表资料2值的校正,2020/7/9,21,四格表资料2检验的条件 当 n40 且所有 T5 时,用普通的2检验 当 n40 但有 1T5 时,用校正的2检验 当n40或有T1时,不能用2检验,改用确切概率法,2020/7/9,22,【例1

6、0-2】 2006年某医院用红花注射液加丹参注射液与丹参注射液治疗急性脑梗患者40人,结果见表10-3。,表10-3 不同药物治疗急性脑梗患者有效率比较,2020/7/9,23,计算检验统计量2 值,,,,,2020/7/9,24,查2界值表,得2 0.05,1=3.84, 2 2 0.05,1,P 0.05,按 = 0.05水准,拒绝H0 ,接受H1,差异有统计学意义,可以认为两药的有效率不等,确定P值,作出统计推断,2020/7/9,25,表10-3 不同药物治疗急性脑梗病人有效率比较,2020/7/9,26,配对设计2检验,【例10-3】 某疾控中心采用IgM-PA法和ELISA法对12

7、5份可疑病例血清测定麻疹IgM抗体,IgM-PA法阳性率为64,ELISA法阳性率为60,两种方法一致阳性率为57.6。为比较两方法的测定阳性率是否有差异,将资料整理为表10-4,并用四格表2检验进行分析,2020/7/9,27,2020/7/9,28,2020/7/9,29,甲法的检出率 乙法的检出率 两检出率之差,比较两种方法的检出率是否有差别,只需考察检查结果不一致的两个格子,2020/7/9,30,若H0成立,两种方法不一致的两个格子理论频数都应该是 由2检验基本公式 化简, 2统计量为:,2020/7/9,31,若b+c40, 校正公式为:,2020/7/9,32,【检验步骤】 1.

8、 建立检验假设,确定检验水准 H0:两种方法检测的阳性率相同,即B=C H1:两种方法检测的阳性率不同,即BC = 0.05,配对四格表资料的2检验也称McNemar检验,2020/7/9,33,2. 计算检验统计量2 值,,,,,2020/7/9,34,查2界值表,得20.05,1=3.84, 2 0.05,按 = 0.05水准,不拒绝H0 ,差异无统计学意义,尚不能认为两种方法的检测结果有差别,3. 确定P值,作出统计推断,2020/7/9,35,表10-6 三种药物治疗糖尿病的疗效比较,行列(RC)表资料的 2 检验,2020/7/9,36,RC表2 检验的通用式 RC表资料的卡方检验可

9、用于: 多个样本率的比较 两组构成比的比较 多组构成比的比较,2020/7/9,37,表10-6 三种药物治疗糖尿病的疗效比较,2020/7/9,38,【检验步骤】 1. 建立检验假设,确定检验水准 H0:三种药物治疗糖尿病的疗效相同,即1=2 =3 H1: 1、2 、3不同或不全相同 = 0.05,2020/7/9,39,2. 计算检验统计量2 值,,,,,2020/7/9,40,查2界值表,得2 0.05,2=5.99, 2 2 0.05,2,P 0.05,按 =0.05水准,拒绝H0 ,接受H1 ,差异有统计学意义,可认为3种药物治疗气阴两虚型老年型糖尿病的有效率不同或不全相同,3. 确

10、定P值,作出统计推断,2020/7/9,41,表的 检验的两两比较 常用的方法:将多个样本率(或构成比)拆分为若干个22(或2C)表进行检验。为减小犯I类错误的概率,需要调整检验水准a。计算方法: 式中,k为比较的样本组数。,或,2020/7/9,42,3种中药治疗气阴两虚型老年型糖尿病有效率之间的两两比较结果见表10-7,2020/7/9,43,【例10-5】 某医师研究蒙族与汉族血型的分布情况,随机抽取蒙族150人,汉族200人,分别检测其血型,数据整理见表10-8,问两民族血型分布有无差异?,2020/7/9,44,表10-8 蒙族与汉族的血型分布,民族,合计,2020/7/9,45,【

11、检验步骤】 1. 建立检验假设,确定检验水准 H0: 蒙族与汉族血型分布的构成相同 H1: 蒙族与汉族血型分布的构成不同 = 0.05,2020/7/9,46,2. 计算检验统计量2 值,,,,,2020/7/9,47,查2界值表,得2 0. 05,3=7.81, 2 0.05,按 =0.05水准,不拒绝H0 ,差异无统计学意义,尚不能认为蒙族与汉族血型分布的构成不同,3. 确定P值,作出统计推断,2020/7/9,48,RC表2 检验的注意事项 计算时采用绝对数 T不能太小,不能有1/5以上格子的T5,或有1格子的T1 增加样本含量,使理论频数增大 删去T太小格子所对应的行或列 将T太小的行

12、或列与性质的相近邻行或邻列合并,2020/7/9,49,关于单向有序行列表,在比较各处理组的效应有无差别时,应该用秩和检验或Ridit检验 多个样本率(或构成比)比较的2检验,若结论为拒绝H0,只能认为各总体率或总体构成比之间总的来说有差别,但不能说明各组之间都有差别,如需知道各组之间是否不同,还要进行进一步两两比较,2020/7/9,50,单向有序分类资料的比较,对于单向有序的多分类资料, 表的 检验仅比较各组的构成比是否相同,没有利用等级信息, 因此,在对等级资料进行统计比较时,常用秩和检验或Ridit分析。,2020/7/9,51,条件: 理论依据:超几何分布 (非 检验 的范畴),第五

13、节 Fisher确切概率法,2020/7/9,52,原理: 在四格表周边合计数不变的条件下,依次增减样本四格表中某一格的值可得各种组合的四格表,直接计算各种事件发生的概率。,计算公式为:,2020/7/9,53,【例10-9】 某医师为观察中西药结合治疗慢性寻麻疹的疗效,将27例慢性寻麻疹患者随机分成两组,分别给予中西药结合治疗和西药治疗,结果见下表,2020/7/9,54,1. 建立检验假设,确定检验水准 H0:中西药结合和西药的有效率相等, H1:中西药结合和西药的有效率不等,,2020/7/9,55,2. 计算概率 计算样本 ,本例样本 85.7%46.2%39.5% 计算在四格表的周边

14、合计不变的条件下,变动四个基本数据a、b、c、d,列出所有各种组合的四格表(所列出的四格表个数等于最小周边合计数加1个)的 及相应的概率P,2020/7/9,56,选用行合计与列合计均为最小的那个格子,从0开始,依次增加1,直到该格子的观测频数等于最小周边合计数。 直接计算表内四个数据的各种组合之概率,再计算等于及大于样本的 各四格表的累计概率,双侧检验取两侧累计概率,单侧检验只取一侧累计概率。,2020/7/9,57,2020/7/9,58,2020/7/9,59,2020/7/9,60,3. 确定P值,作出统计推断 按 水准,拒绝H0,接受H1,差异有统计学意义,可认为中西药结合组与西药组

15、的有效率不同,中西药结合组疗效较高。,2020/7/9,61,第四节 线性趋势检验,【例10-8】 某医师在对某工厂职工冠心病调查中,欲研究冠心病与眼底动脉硬化之间的关系,共调查593人,资料整理为表10-11。,2020/7/9,62,2020/7/9,63,【分析】 若研究目的是分析不同眼底动脉硬化分级与冠心病诊断结果有无差别时,可将它视为单向有序表,选用秩和检验; 若研究目的是分析两个有序分类变量间是否存在相关关系,适合用等级相关分析或积差相关分析,详见第十二章; 若研究目的是分析两个有序分类变量间是否存在线性变化趋势,就要用到下面所介绍的有序分组资料的线性趋势检验(test for l

16、inear trend)。,2020/7/9,64,对双向有序属性不同的RC表资料,通过 分解推断其相关是否为线性相关。 其基本思想是:首先计算RC表 的值,然后将总的 值分解成线性回归分量与偏离线性回归分量。若两分量均有统计学意义,表明两分类变量存在相关关系,但关系不是简单的直线关系;若线性回归分量有统计学意义,偏离线性回归分量无统计学意义时,表明两分类变量不仅存在相关关系,而且是线性关系。,2020/7/9,65,2020/7/9,66,2020/7/9,67,2020/7/9,68,【检验步骤】 1. 建立检验假设,确定检验水准 H0:眼底动脉硬化分级与冠心病诊断结果之间无线性关系 H1:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论