医学统计学课件-08卡方检验_第1页
医学统计学课件-08卡方检验_第2页
医学统计学课件-08卡方检验_第3页
医学统计学课件-08卡方检验_第4页
医学统计学课件-08卡方检验_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2检验,卡方检验,2检验(Chi-square test)是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。 本章仅限于介绍两个和多个率或构成比比较的2检验。,第一节 四格表资料的2 检验,目的:推断两个总体率(构成比)是 否有差别 要求:两样本的两分类个体数排列成四 格表资料,例1 为了解某中药治疗原发性高血压的疗效,将70名高血压患者随机分为两组。试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果如表1,问该药治疗原发性高血压是否有效?,表1

2、两种疗法治疗原发性高血压的疗效 22表或四格表(fourfold table),四格表资料的基本形式,实际频数A (actual frequency): a、b、c、d 理论频数T( theoretical frequency)(H0:1=2=): a的理论频数 (a+b)pc= (a+b)(a+c.)/ n=nRnC/n b的理论频数 (a+b)(1-pc)= (a+b)(b+d.)/ n =nRnC/n c的理论频数 (c+d)pc= (c+d)(a+c)/ n =nRnC/n d的理论频数 (c+d)(1-pc)= (c+d)(b+d.)/ n =nRnC/n,A:实际频数(actual

3、 frequency) T:理论频数(theoretical frequency) TRC :第R 行C 列的理论频数 nR :相应的行合计,nC :相应的列合计,检验统计量2 值反映了实际频数与理论频数的吻合程度。 若检验假设H0:1=2成立,四个格子的实际频数A 与理论频数T 相差不应该很大,即统计量2 不应该很大。如果2 值很大,即相对应的P 值很小,若 P,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即12 。,卡方检验的基本思想,自由度愈大,2 值也会愈大;所以只有考虑了自由度的影响,2 值才能正确地反映实际频数A和理

4、论频数T 的吻合程度。,检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。,2分布(chi-square distribution),3.84,7.81,12.59,P0.05的临界值,一、2检验的通用公式,上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行列表”。,表1 两种疗法治疗原发性高血压的疗效,(1) 建立检验假设,确定检验水平。 H0:1=2 即试

5、验组与对照组的总体有效率相等 H1:12 即试验组与对照组的总体有效率不等 =0.05。,假设检验步骤,(2)求检验统计量值,T11 =44(41/70)=25.8 T12=44(29/70)=18.2 T21=26(41/70)=15.2 T22 = 26(29/70)=10.8,P 0.005,按=0.05水准,拒绝H0 ,接受H1 ,可以认为两组治疗原发性高血压的总体有效率不等,即可认为该中药治疗原发性高血压有效。,(3) 确定P 值,作出推断结论,二、四格表资料检验的专用公式,2分布是一连续型分布,而四格表资料属离散型分布,由此计算得的 2统计量的抽样分布亦呈离散性质。为改善2 统计量

6、分布的连续性,则需行连续性校正(correction for continuity)。,三、四格表资料检验的校正公式,Frank Yates,四格表资料检验的校正公式,2 连续性校正仅用于 =1 的四格表资料,当2 时,一般不作校正。,四格表资料2 检验公式的选择:,专用或通用公式 校正公式 Fisher确切概率法,例2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将58例脑血管疾病患者随机分为两组,结果见表。问两种药物治疗脑血管疾病的有效率是否相等?,即两种药物治疗脑血管疾病的有效率相等,即两种药物治疗脑血管疾病的有效率不相等,2.计算检验统计量,3.确定P 值,作出推断结论 不拒

7、绝 ,尚不能认为两种药物治疗脑血管疾 病的有效率不相等,1.建立假设,设定检验水准,四、四格表资料的Fisher确切概率法,当四格表资料中出现n40 或T 1,需改用四格表资料的Fisher确切概率法。该法是一种直接计算概率的假设检验方法,其理论依据是超几何分布(hypergeometric distribution)。四格表的确切概率法不属于检验的范畴,但常作为四格表资料假设检验的补充。,基本思想:在四格表边缘合计固定不变的条件下,利用公式直接计算表内四个格子数据的各种组合的概率Pi,然后计算单侧或双侧累计概率P,并与检验水准比较,作出是否拒绝H0的结论。,各组合的概率Pi服从超几何分布,其

8、和为1。,例3 某研究者为研究乙肝免疫球蛋白预防白兔胎儿宫内感染HBV的效果,将17例HBsAg阳性白兔随机分为预防注射组和非预防组,观察两组所产出的新生白兔HBV感染情况,结果见表9-3。问两组新生白兔的HBV总体感染率有无差别?,1.建立检验假设并确定检验水准,,即两组新生白兔HBV的总体感染率相等,,即两组新生白兔HBV的总体感染率不相等,2.计算概率,根据公式计算各种组合的四格表概率,结果见表4。例如实际观察到的四格表资料的概率为,表4 各种组合的四格表计算的概率,3.双侧累计概率P值为 P = P (1) + P (2) + P (7) + P (8) + P (9) =0.0003

9、70 + 0.011847 + 0.041464 + 0.002962 + 0.000041=0.057 所得P 值,在 检验水准下,不拒绝 , 还不能认为预防注射组与非预防组的新生白兔 HBV的总体感染率不等。,第二节配对四格表资料的 2 检验,与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料。,例4 现有198份痰标本,每份标本分别用A、B两种培养基培养结核菌,问A、B两种培养基的阳性培养率是否不等?,表5 A、B两种培养基的培养结果,上述配对设计实验中,就每个对子而言,两种处理的结果

10、不外乎有四种可能:, A、B两种检测方法皆为阳性数(a); A、B两种检测方法皆为阴性数 (d); A法为阳性、B法为阴性数 (b); A法为阴性、B法为阳性数 (c)。,其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。,基本公式:,校正公式:,检验统计量(McNemar test),1.建立检验假设并确定检验水准 :B=C,即两种培养基的阳性培养率相等 :BC,即两种培养基的阳性培养率不相等 2.计算检验统计量 本例b+c40,用非校正公式计算得 3.确定P值,作出推断结论 P 0.05,不拒绝 ,尚不能认为两种培养基的阳 性培养率不同,注意:,本法一

11、般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b, c),而未考虑样本含量n和两法结果一致的两种情况(a, d)。所以,当 n 很大且 a 与 d 的数值很大(即两法的一致率较高),b 与 c 的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。,第三节,行列表资料的2检验,行列表资料,多个样本率比较时, 有 R 行 2 列,称为 R 2表; 两个样本的构成比比较时, 有 2 行 C 列,称 2C 表; 多个样本的构成比比较, 有 R 行 C 列,称为 R C 表。,一、行列表资料检验统计量,例5 某医院用3种方案治疗急性肝炎254例,观察结果如下,问3种

12、方案治疗急性肝炎的有效率是否不同。,表6 3种方案治疗急性肝炎的效果,1. 建立检验假设并确定检验水准 ,即3种治疗方案的有效率相等 :3种治疗方案的有效率不全相等 2. 计算检验统计量,3.确定P 值,作出推断结论 查界值表得P 0.05 ,在 的检验水准 下,拒绝H0,接受H1,可以认为三种疗法的有 效率有差别。,例6 某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料,结果见表7,问不同地区人群ABO血型分类构成比是否不同。,表7 三个不同地区血型样本的频数分布,1.建立检验假设并确定检验水准 H0:不同地区人群血型分布总体构成比相同 H1:不同地区人群血型分布总体构成比不相

13、同 2.计算检验统计量 3.确定P值,作出推断结论 查 界值表得P0.05,认为三个不同地区的人群血型分布 总体构成比有差别。,根据重复检验的次数重新规定检验水准: I型错误的概率不变。 检验水准的估计方法: 根据分析目的而定,二、多个样本率间多重比较,1.多个实验组间的两两比较 分析目的为k 个实验组间,任两个率均进行比 较,检验水准 可用下式估计: 式中 ,k 为样本率的个数,2.实验组与同一个对照组的比较 分析目的为各实验组与同一个对照组比较,而各实验组间不需要比较。检验水准 可用下式估计: 式中k为样本率的个数。,例7 对例5中表6的资料进行两两比较,以推断是否任两种疗法治疗急性无黄疸

14、型病毒肝炎的有效率均有差别? 本研究目的为三个实验组间的两两比较,检验水 用公式估计得,1.建立检验假设并确定检验水准 : ,即任两组的总体有效率相等 : ,至少两组的总体有效率不相等 2.计算检验统计量 本研究的目的为三个实验组间的两两比较,分别计算任两对比组的检验统计量值结果见下表。,3.确定P 值,作出推断结论( ),表9 3种疗法有效率的两两比较,行列表资料中各格的理论频数不应小于1,并且 的格子数不宜超过格子总数的1/5。若出现上述情况,可通过增加样本含量,或根据专业知识考虑列或将理论频数太小的行或列与性质相近的邻行或邻列合并等方式解决。,三、行列表资料 检验应用注意事项,多个样本率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的有差别,但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间有差别,需做多个样本率的多重比较。,行列表资料卡方检验与分类变量的顺序无关,对于有序的RC 表资料不宜用卡方检验。单向有序表资料,宜选用秩转换的非参数检验;分析两个有序分类变量间是否存在相关关系,宜用等级相关分析。,小 结,1. 检验是用于分析分类变量数据的假设检验方法,该方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论