卡方检验方法_第1页
卡方检验方法_第2页
卡方检验方法_第3页
卡方检验方法_第4页
卡方检验方法_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、12掌握内容:掌握内容: 几种常见设计类型资料的卡方检验几种常见设计类型资料的卡方检验熟悉的内容熟悉的内容卡方检验的适用范围卡方检验的适用范围了解内容了解内容1 1四格表资料的四格表资料的FisherFisher精确概率法精确概率法3用样本信息推论总体特征的过程。用样本信息推论总体特征的过程。包括:包括:参数估计参数估计: : 运用统计学原理,用从样本计算出运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估来的统计指标量,对总体统计指标量进行估计。计。假设检验:假设检验:又称显著性检验,是指由样本间存又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着在的差别

2、对样本所代表的总体间是否存在着差别做出判断。差别做出判断。4 统计描述统计描述统计推断统计推断应应 用用计量资料计量资料 频数分布频数分布集中趋势集中趋势离散趋势离散趋势统计图表统计图表抽样误差、抽样误差、标准误标准误 t u F检验检验正常值范围正常值范围区间估计区间估计计数资料计数资料相对数及相对数及其标准化其标准化统计图表统计图表标准误标准误 2检验检验率的区间率的区间估计估计人口统计人口统计疾病统计疾病统计相关与回归相关与回归 r b统计图表统计图表 t检验检验 5在总体率为在总体率为的二项分布总体中做的二项分布总体中做n1和和n2抽样抽样,样本率样本率p1和和p2与与的差的差别别,称

3、为率抽样误差。称为率抽样误差。已知已知0 nP5, n(1-P)5ppu06例为了解铅中毒病人是否有尿棕色素增加现象,例为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见下表,问铅中毒病人与对照人群的尿棕色素结果见下表,问铅中毒病人与对照人群的尿棕色素阳性率差别有无统计学意义?阳性率差别有无统计学意义?表两组人群尿棕色素阳性率比较表两组人群尿棕色素阳性率比较组别组别阳性数阳性数阴性数阴性数合计合计阳性率阳性率(%)铅中毒病人铅中毒病人2973680.56对照组对照组9283724.32合计合计3835735

4、2.057 2检验检验(Chi-square test)是现代统计学的是现代统计学的创始人之一,英国人创始人之一,英国人K . Pearson(1857-1936)于)于1900年提出的一种具有年提出的一种具有广泛用途的统计方法。广泛用途的统计方法。8 2 检验的用途检验的用途用途较为广泛的假设检验方法用途较为广泛的假设检验方法, ,本章仅介绍用本章仅介绍用于于分类计数资料分类计数资料的假设检验,用于检验两个的假设检验,用于检验两个(或多个)率或构成比之间差别是否有统计(或多个)率或构成比之间差别是否有统计学意义,配对学意义,配对 2 2检验检验配对计数资料的差检验检验配对计数资料的差异是否有

5、统计学意义。异是否有统计学意义。9检验实际频数检验实际频数(A)(A)和理论频数和理论频数(T)(T)的差别的差别是否由抽样误差所引起的。也就是由样是否由抽样误差所引起的。也就是由样本率(或样本构成比)来推断总体率或本率(或样本构成比)来推断总体率或构成比。构成比。10表表7-1 两种药物治疗胃溃疡有效率的比较两种药物治疗胃溃疡有效率的比较 目的:推断是否目的:推断是否1 1= =2 2?11本例资料经整理成下表形式,本例资料经整理成下表形式,即有两个处理组,每个处理即有两个处理组,每个处理组的例数由发生数和未发生组的例数由发生数和未发生数两部分组成。表内有数两部分组成。表内有 四个基本数据,

6、其余数据四个基本数据,其余数据均由此四个数据推算出来的,均由此四个数据推算出来的,故称故称四格表资料四格表资料。12 表表7-1 完全随机设计两样本率比较的四格表完全随机设计两样本率比较的四格表 处理组处理组属性属性合计合计阳性阳性阴性阴性1 A11 (T11) A12 (T12)n1(固定值固定值)2 A21 (T21) A22 (T22)n2(固定值固定值)合计合计 m1 m2n13衡量衡量理论频数理论频数与实际频数的差别与实际频数的差别RCRCRCTTA22)(ARC是位于是位于R行行C列交叉处的实际频数,列交叉处的实际频数, TRC是位于是位于R行行C列交叉列交叉处的理论频数。处的理论

7、频数。 ( ARC - TRC )反映实际频数与理论频数的差)反映实际频数与理论频数的差距,除以距,除以TRC 为的是考虑相对差距。所以,为的是考虑相对差距。所以, 2 2 值反映了实际频值反映了实际频数与理论频数的吻合程度,数与理论频数的吻合程度, 2 2 值大,说明实际频数与理论频值大,说明实际频数与理论频数的差距大。数的差距大。 2 2 值的大小除了与实际频数和理论频数的差的值的大小除了与实际频数和理论频数的差的大小有关外,还与它们的行、列数有关。即自由度的大小。大小有关外,还与它们的行、列数有关。即自由度的大小。=(行(行-1)(列(列-1)14理论频数的计算理论频数的计算nnnTCR

8、RCn nR R是是A ARCRC所在行的合计,所在行的合计, n nC C是是A ARCRC所在列所在列的合计,是两个样本例数的合计的合计,是两个样本例数的合计15 理论频数理论频数 是根据检验假设是根据检验假设 且用合并率且用合并率 来估计来估计 而定的。而定的。 T012:H cp 如本例,无效假设是如本例,无效假设是A药组与药组与B药组的总体药组的总体有效率相等,均等于合计的阳性率有效率相等,均等于合计的阳性率66.67%(110/165)。那么理论上,)。那么理论上,A药组的药组的85例中例中阳性人数应为阳性人数应为85(110/165)=56.67,阴性人数,阴性人数为为85(55

9、/165)=28.33;同理,;同理,B药组的药组的80例中例中阳性人数应为阳性人数应为80(110/165)=53.33,阴性人数,阴性人数为为80(55/165)=26.67。 162检验的基本公式) 1)(1(1)()(222CRTTATTA 上述上述基本公式基本公式由由PearsonPearson提出,因此软提出,因此软件上常称这种检验为件上常称这种检验为PearesonPeareson卡方检验,卡方检验,下面将要介绍的其他卡方检验公式都是在下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的表资料,也适用于

10、其它的“行行列表列表”。1722 分布是一种连续型分布分布是一种连续型分布(Continuous distribution),v 个相个相互独立的标准正态变量互独立的标准正态变量(standard normal variable) 的平方和称为的平方和称为 变量,其分布即为变量,其分布即为 分布;自由度分布;自由度(degree of freedom)为为v 。2,.3,2,1,0)2()2(21)(2212222ef218 分布是一种连续型分布分布是一种连续型分布(Continuous (Continuous distribution)distribution),v v 个相互独立的标准正态

11、变量个相互独立的标准正态变量(standard normal variable) (standard normal variable) 的平方和称为的平方和称为 变量,其分布即为变量,其分布即为 分布;分布;自由度自由度(degree of freedom)(degree of freedom)为为v v 。v=1v=4v=6v=9), 2 , 1(iui19分布的形状依赖于自由度分布的形状依赖于自由度 的大小:的大小: 当自由度当自由度2时,曲线呈时,曲线呈“L”型;型; 随着随着 的增加,曲线逐渐趋于对称;的增加,曲线逐渐趋于对称; 当自由度当自由度 时,曲线逼近于正态时,曲线逼近于正态曲

12、线。曲线。20如果假设检验成立,如果假设检验成立,A与与T不应该相差不应该相差太大。太大。理论上可以证明理论上可以证明 (A-T)2/T服从服从x2分分布,计算出布,计算出x2值后,查表判断这么大的值后,查表判断这么大的x2是否为小概率事件,以判断建设检验是否为小概率事件,以判断建设检验是否成立。是否成立。212220.05,10.05/21.96u在在=1,22自由度一定时,自由度一定时,P值越小,值越小, x2值越大,值越大,反比关系。反比关系。当当P 值一定时,自由度越大,值一定时,自由度越大, x2越大。越大。 =1时,时, P=0.05, x2 =3.84 P=0.01, x2 =6

13、.63 P=0.05时,时, =1, x2 =3.84 =2, x2 =5.9923第一节第一节 四格表资料四格表资料2检验检验B1B2合计合计A1aba+bA2cdc+d合计合计a+cb+dn=a+b+c+d一般四格表的基本形式一般四格表的基本形式24 表表7-1 完全随机设计两样本率比较的四格表完全随机设计两样本率比较的四格表 处理组处理组属性属性合计合计阳性阳性阴性阴性1 A11 (T11) A12 (T12)n1(固定值固定值)2 A21 (T21) A22 (T22)n2(固定值固定值)合计合计 m1 m2n25)()()()(22dbcadcbanbcad n40,T5 为了不计算

14、理论频数为了不计算理论频数T, 可由基本公式推导出可由基本公式推导出 ,直接由各格子的实际频数(,直接由各格子的实际频数(a、b、c、d)计)计 算卡方值的公式:算卡方值的公式:(四格表专用公式)基本公式:;1)()()()()()()()()()()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaaTTA271建立检验假设建立检验假设 : ,两总体率不等,两总体率不等 : ,两总体率相等,两总体率相等 0H211H2105. 0检验统计量检验统计量2值反映了实际频数与理论频值反映了实际频数与理论频数的

15、吻合程度数的吻合程度。28 若检验假设若检验假设H0:1=2成立,四个格子的成立,四个格子的实际频数实际频数A 与理论频数与理论频数T 相差不应该很相差不应该很大,即统计量大,即统计量2 2 不应该很大。如果不应该很大。如果2 2 值很大,即相对应的值很大,即相对应的P 值很小,若值很小,若 P,则反过来推断则反过来推断A与与T相差太大,超出了相差太大,超出了抽样误差允许的范围,从而怀疑抽样误差允许的范围,从而怀疑H0的正的正确性,继而拒绝确性,继而拒绝H0,接受其对立假设,接受其对立假设H1,即,即12 。29 2计算检验统计量计算检验统计量 (1)当总例数)当总例数n40 且所有格子的理论

16、频数且所有格子的理论频数T5时:用检验的基本公式或四格表资料检验的专时:用检验的基本公式或四格表资料检验的专用公式;用公式;基本公式基本公式TTA22)(专用公式专用公式 )()()()(22dbcadcbanbcad30(2)当总例数)当总例数 n40 且有一个格子且有一个格子1T5时时:用校正公式;或改用四格表资料的用校正公式;或改用四格表资料的Fisher确切确切概率法。概率法。TTAc22)5 . 0()()()()(222b+da+cc+da+bn|ad-bc|-=nc31 2分布是一连续型分布,而四格表资料分布是一连续型分布,而四格表资料属离散型分布,由此计算得的属离散型分布,由此

17、计算得的 2统计量统计量的抽样分布亦呈离散性质。为改善的抽样分布亦呈离散性质。为改善 2统统计量分布的连续性,则需行连续性校正计量分布的连续性,则需行连续性校正(correction for continuity)。 2 连续性校正仅用于连续性校正仅用于 =1 的四格表资的四格表资料,当料,当2 时,一般不作校正。时,一般不作校正。32(3)当)当n40,或,或T5时:用时:用检验的基本公式或四格表资料检验的专用公检验的基本公式或四格表资料检验的专用公式式: 2= = 23.1210.10010.10010690.22090.22021510.174103) 查查 2

18、界值表(附表界值表(附表7)确定)确定P值,值, P0.05,得出结论。,得出结论。按按0.05水准,水准,不拒绝不拒绝H0,可以认为两组人群对该可以认为两组人群对该抗生素的耐药率的差异无统计学意抗生素的耐药率的差异无统计学意义。义。40 例例2某矿石粉厂生产一种矿石粉时,在数天某矿石粉厂生产一种矿石粉时,在数天内即有部分工人患有职业性皮肤炎。后随机抽内即有部分工人患有职业性皮肤炎。后随机抽取取15名工人穿新防护服,其余仍穿原用的防护名工人穿新防护服,其余仍穿原用的防护服,一个月后检查两组工人的皮肤炎患病情况,服,一个月后检查两组工人的皮肤炎患病情况,资料见下表,问两组的患病率差别有无统计学资

19、料见下表,问两组的患病率差别有无统计学意义?意义?表穿新旧防护服工人的皮肤炎患病比较表穿新旧防护服工人的皮肤炎患病比较防护服种类防护服种类皮肤炎症皮肤炎症合计合计阳性数阳性数阴性数阴性数新新1(3.84)14 (11.16)15旧旧10(7.16)18 (20.84)28合计合计11324341本例本例n40,因有一格子的理论数,因有一格子的理论数5,因而要,因而要用校正用校正 2 检验。检验。H0:两组工人皮肤炎总体患病率相等,即两组工人皮肤炎总体患病率相等,即 1 = 2H1:两组工人皮肤炎总体患病率不等,即两组工人皮肤炎总体患病率不等,即 1 2=0.05校正校正 2值为值为94.284

20、.20)5 .0|84.2018(|16.7)5 .0|16.710(|16.11)5 .0|16.1114(|84.3)5 .0|84.31(|2222242以以=1查界值表,按查界值表,按 检验水检验水准不拒绝准不拒绝 ,接受,接受 ,尚不能认为穿不同防护,尚不能认为穿不同防护服的两组工人的皮肤炎患病率的差别有统计学服的两组工人的皮肤炎患病率的差别有统计学意义;意义;205. 0P0H1H05. 0注意:本例若不作连续性校正,则,注意:本例若不作连续性校正,则,得得33. 4205. 0P,可见两者是有区别的。,可见两者是有区别的。43注意:注意:两样本率比较的资料,既可用两样本率比较的资

21、料,既可用 检验也检验也可用可用 检验来推断两总体率是否有差别,且在检验来推断两总体率是否有差别,且在不校正的条件下两种检验方法是等价的,对同一不校正的条件下两种检验方法是等价的,对同一份资料有份资料有。u222u小结小结 T5,用四格表专用公式用四格表专用公式n 40 1T5,用连续性校正公式用连续性校正公式 T1,用确切概率法。用确切概率法。n40,用确切概率法。用确切概率法。45第三节第三节 配对四格表资料的配对四格表资料的 2检验检验与计量资料推断两总体均数是否有与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)计

22、数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设是否有差别也有成组设计和配对设计,即计,即四格表资料四格表资料和和配对四格表资配对四格表资料料。46 将含量为将含量为n n的随机样本同时按照两的随机样本同时按照两个二项分类的属性进行交叉分类,形个二项分类的属性进行交叉分类,形成成2 2行行2 2列的交叉分类表,如表列的交叉分类表,如表8-68-6,目,目的是检验两种属性间的阳性率是否相的是检验两种属性间的阳性率是否相同同变量1变量2合计阳性阴性阳性 a b阴性 c d合计(固定值)1m2m 表表8-6 配对四格表资料表配对四格表资料表1n2nn47变量变量1的阳性率变量的阳性率变量

23、2的阳性率的阳性率 可见,两个变量阳性率的比较只和可见,两个变量阳性率的比较只和b、c有关,而有关,而与与a、d无关。无关。 nn1nbanm1变量变量1的阳性率的阳性率 nca变量变量2的阳性率的阳性率 nbancancb48前面是两个独立样本,行合计是事先固前面是两个独立样本,行合计是事先固定的定的;而这里的;而这里的“两份样本两份样本” 互不独互不独立,样本量都是立,样本量都是n,是固定的,是固定的,而行合,而行合计与列合计却是事先不确定的。计与列合计却是事先不确定的。49配对四格表资料的配对四格表资料的 2检验的专用公式检验的专用公式 b+c40 b+c40cbcb22)(cbcb22

24、)1(50两种白喉杆菌培养基结果比较两种白喉杆菌培养基结果比较甲培养基甲培养基乙培养基乙培养基合计合计14(a)2(b)16 9(c)3(d)12合计合计23528配对四格表资料的配对四格表资料的51配对四格表资料的 1. H0:两种培养基阳性率相同,总体两种培养基阳性率相同,总体BC; H1:两种培养基阳性率不同,总体两种培养基阳性率不同,总体BC。 0.05。 2.计算统计量:计算统计量: 23.273.84 3.按按 0.05水准,不拒绝水准,不拒绝H0 , 可以认为甲乙可以认为甲乙两法血清学检出阳性率无显两法血清学检出阳性率无显著性差异著性差异5253 RC表的2检验通用公式54几种几

25、种RC表的检验假设表的检验假设H0551.多个样本率的比较多个样本率的比较例例 某医院用某医院用3种方案治疗急性无黄疸型病毒肝炎种方案治疗急性无黄疸型病毒肝炎254例,观察结果见表,问例,观察结果见表,问3种疗法的有效率是否种疗法的有效率是否不同。不同。 表8-6 3种方案治疗肝炎的疗效 组别 有效 无效 合计 有效率(%) 西药组 51 49 100 51.00 中药组 35 45 80 43.75 中西药结合组 59 15 74 79.73 合计 145 109 254 57.09 56检验步骤:检验步骤:H H0 0:3 3种治疗方案的有效率相等种治疗方案的有效率相等H H1 1:3 3种治疗方案的有效率不全相等种治疗方案的有效率不全相等 =0.05=0.05 ) 110974151457459109804514580351091004914510051(2542222222 ) 10279. 03244. 02322. 01056. 02203. 01794. 0 (254 81.22 = (3-1)(2-1) = 2 57P P 0.05 0.05 ,在,在=0.05=0.05的检验水准下,的检验水准下,拒绝拒绝H H0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论