两组两分类资料检验ppt课件_第1页
两组两分类资料检验ppt课件_第2页
两组两分类资料检验ppt课件_第3页
两组两分类资料检验ppt课件_第4页
两组两分类资料检验ppt课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、两组两分类资料检验两组两分类资料检验内容内容卡方检验入门卡方检验入门1配对设计两样本率比较的配对设计两样本率比较的2检验检验2行列表资料的分析行列表资料的分析3确切概率法确切概率法4检验分类资料服从某个分布检验分类资料服从某个分布v设从总体设从总体A中随机抽取一个样本,样本量为中随机抽取一个样本,样本量为n,其,其资料分布如下:资料分布如下:检验分类资料服从某个分布检验分类资料服从某个分布举例:举例:v某医生收治在某地某医生收治在某地50个患者,其血型分别如下:个患者,其血型分别如下:v知该地域的普通人群的血型分布如下:知该地域的普通人群的血型分布如下:v问题:患病人群的血型能否属于该地域普通

2、人群问题:患病人群的血型能否属于该地域普通人群的血样分布的血样分布血型血型ABABO人数1510817血型血型ABABO概率0.250.50.10.15实例实例血型血型ABABO概率0.250.50.10.15理论数T12.525107.522222220.050(15 12.5)(1025)12.525(810)(177.5)21.93107.57.81=7.81H=7.81H检验统计量界值,拒绝行列表资料的检验行列表资料的检验v卡方检验是以卡方分布为根底的一种常用假设检卡方检验是以卡方分布为根底的一种常用假设检验方法,主要用于分类变量,它根本的无效假设验方法,主要用于分类变量,它根本的无效

3、假设是:是:vH0H0:行分类变量与列分类变量无关联:行分类变量与列分类变量无关联vH1H1:行分类变量与列分类变量有关联:行分类变量与列分类变量有关联v=0.05=0.05v统计量统计量 ,其中,其中AiAi是样本资料的计是样本资料的计数,数,TiTi是在是在H0H0为真的情况下的实际数为真的情况下的实际数( (期望值期望值) )。221()kiiPiiATT卡方检验卡方检验 在H0为真时,实践察看数与实际数之差AiTi 应该比较接近0。所以在H0为真时,检验统计量 服从自在度为k-1的卡方分布。 即: ,回绝H0。 上述卡方检验由此派生了不同运用背景的各种问题的检验,特别最常用的是两个样本

4、率的检验等。由于该原理的运用范围很广,但本次课程只学惯用于推断两个分类变量能否相互关联。22,Pv221()kiiPiiATT方法原理方法原理方法原理方法原理v实际频数实际频数v基于基于H0H0成立,两样本所在总体无差别的前提下计成立,两样本所在总体无差别的前提下计算出各单元格的实际频数来算出各单元格的实际频数来nnnTCRRC方法原理方法原理v残差残差v设设A A代表某个类别的察看频数,代表某个类别的察看频数,E E代表基于代表基于H0H0计算计算出的期望频数,出的期望频数,A A与与E E之差被称为残差。之差被称为残差。v残差可以表示某一个类别察看值和实际值的偏离残差可以表示某一个类别察看

5、值和实际值的偏离程度,但残差有正有负,相加后会彼此抵消,总程度,但残差有正有负,相加后会彼此抵消,总和依然为和依然为0 0。为此可以将残差平方后求和,以表示。为此可以将残差平方后求和,以表示样本总的偏离无效假设的程度。样本总的偏离无效假设的程度。方法原理方法原理 另一方面,残差大小是一个相对的概念,相对于另一方面,残差大小是一个相对的概念,相对于期望频数为期望频数为1010时,时,2020的残差非常大;可相对于期的残差非常大;可相对于期望频数为望频数为10001000时时2020就很小了。因此又将残差平方就很小了。因此又将残差平方除以期望频数再求和,以规范化察看频数与期望除以期望频数再求和,以

6、规范化察看频数与期望频数的差别。频数的差别。这就是我们所说的卡方统计量,在这就是我们所说的卡方统计量,在19001900年由英国统年由英国统计学家计学家PearsonPearson初次提出,其公式为:初次提出,其公式为:22211()()kkiiiiiiiiAEAnpEnp方法原理方法原理 从卡方的计算公式可见,当察看频数与期望频数完全一致时,卡方值为0; 察看频数与期望频数越接近,两者之间的差别越小,卡方值越小; 反之,察看频数与期望频数差别越大,两者之间的差别越大,卡方值越大。 当然,卡方值的大小也和自在度有关。方法原理方法原理v卡方分布卡方分布 v显然,卡方值的大小不仅与显然,卡方值的大

7、小不仅与A A、E E之差有关,还与之差有关,还与单元格数自在度有关单元格数自在度有关chi-square3 8 .1 93 6 .1 83 4 .1 73 2 .1 63 0 .1 52 8 .1 42 6 .1 32 4 .1 22 2 .1 12 0 .1 01 8 .0 91 6 .0 81 4 .0 71 2 .0 61 0 .0 58 .0 46 .0 34 .0 22 .0 1.0 0概 率.1 2.1 0.0 8.0 6.0 4.0 20 .0 0操作步骤操作步骤1. 1. 建立检验假设和确定检验水准建立检验假设和确定检验水准H0H0:运用含氟牙膏和普通牙膏儿童龋患率相等:运用

8、含氟牙膏和普通牙膏儿童龋患率相等H1H1:运用含氟牙膏和普通牙膏儿童龋患率不等:运用含氟牙膏和普通牙膏儿童龋患率不等2. 2. =0.05=0.053.3.计算检验统计量计算检验统计量2 2值值82. 267.6167.615533.3833.384533.12333.12313067.7667.767022222操作步骤操作步骤4. 4. 确定确定P P值和作出推断结论值和作出推断结论查附表查附表8 8,2 2界值表,得界值表,得p0.05p0.05。按。按 = 0.05 = 0.05水水准,不回绝准,不回绝H0H0,尚不能以为运用含氟牙膏比运用,尚不能以为运用含氟牙膏比运用普通牙膏儿童的龋

9、患率低。普通牙膏儿童的龋患率低。对于四格表,卡方的计算公式又可进展简化,以方对于四格表,卡方的计算公式又可进展简化,以方便手工计算便手工计算对计算机而言并无实践价值对计算机而言并无实践价值tabi a b c d, chi2tabi a b c d, chi2操作步骤操作步骤v值得指出,成组设计四格表资料的值得指出,成组设计四格表资料的2 2检验与前面检验与前面学习过的两样本率比较的双侧学习过的两样本率比较的双侧u u检验是等价的。假检验是等价的。假设对同一资料作两种检验,两个统计量的关系为设对同一资料作两种检验,两个统计量的关系为2= u22= u2。其对应的界值也为平方关系。两者的运。其对

10、应的界值也为平方关系。两者的运用条件也是根本一致的,延续性校正也根本相互用条件也是根本一致的,延续性校正也根本相互对应。对应。卡方检验假设的等价性卡方检验假设的等价性v两组儿童的龋齿率一样两组儿童的龋齿率一样v两组发生率的比较两组发生率的比较v实践数据的频数分布和实际假设一样实践数据的频数分布和实际假设一样v实际分布与实践分布的检验实际分布与实践分布的检验v运用不同的牙膏并不会影响龋齿的发生两个分运用不同的牙膏并不会影响龋齿的发生两个分类变量间无关联类变量间无关联v两变量的相关分析两变量的相关分析四格表四格表2 2值的校正值的校正v英国统计学家英国统计学家YatesYates以为,以为,2 2

11、分布是一种延续型分布是一种延续型分布,而四格表资料是分类资料,属离散型分布,分布,而四格表资料是分类资料,属离散型分布,由此计算的由此计算的2 2值的抽样分布也该当是不延续的,值的抽样分布也该当是不延续的,当样本量较小时,两者间的差别不可忽略,应进当样本量较小时,两者间的差别不可忽略,应进展延续性校正在每个单元格的残差中都减去展延续性校正在每个单元格的残差中都减去0.50.5v假设假设n 40 n 40 ,此时有,此时有 1 T 1 T 5 5时,需计算时,需计算YatesYates延续性校正延续性校正2 2值值vT 1T 1,或,或n40n40时,应改用时,应改用FisherFisher确切

12、概率法直接确切概率法直接计算概率计算概率四格表四格表2值的校正值的校正确切概率法确切概率法分析实例分析实例 留意:确切概率法不属于2检验的范畴,但常作为2检验运用上的补充。分析实例分析实例1 1建立检验假设和确立检验水准建立检验假设和确立检验水准H0H0:新药组与对照组疗效相等,即:新药组与对照组疗效相等,即 1 = 1 = 2 2H1H1:新药组与对照组疗效不等,即:新药组与对照组疗效不等,即 1 1 2 22 2计算概率和确定计算概率和确定P P值值本例本例n = 36 40n = 36 40,不满足,不满足2 2检验的运用条件,宜检验的运用条件,宜采用四格表确切概率法。采用四格表确切概率

13、法。方法原理方法原理v在四格表周边合计不变的条件下,在相应的总体在四格表周边合计不变的条件下,在相应的总体中进展抽样,四格表中出现各种陈列组合情况的中进展抽样,四格表中出现各种陈列组合情况的概率概率v本例即本例即2828、8 8、2222、1414坚持不变的条件下,假设坚持不变的条件下,假设H0H0成立,计算出现各种四格表的概率成立,计算出现各种四格表的概率!)!()!()!()!(ndcbadbcadcbaP方法原理方法原理v 然后将其中小于等于现有样本概率的概率值相加,即为P值:v 本例中P值=P(0)+ P(6)+P(7)+P(8)=0.03610.05配对设计两样本率比较的配对设计两样

14、本率比较的2检检验验方法原理方法原理 例例6.9 6.9 用用A A、B B两种方法检查已确诊的乳腺癌患两种方法检查已确诊的乳腺癌患者者140140名,名,A A法检出法检出9191名名(65%)(65%),B B法检出法检出7777名名(55%)(55%),A A、B B两法一致的检出两法一致的检出5656名名(40%)(40%),问哪种,问哪种方法阳性检出率更高?方法阳性检出率更高?方法原理方法原理 显然,本例对同一个个体有两次不同的丈量,从设计的角度上讲可以被了解为本身配对设计 按照配对设计的思绪进展分析,那么首先该当求出各对的差值,然后调查样本中差值的分布能否按照H0假设的情况对称分布

15、 按此分析思绪,最终可整理出如前所列的配对四格表方法原理方法原理v留意留意v主对角线上两种检验方法的结论一样,对问题的主对角线上两种检验方法的结论一样,对问题的解答不会有任何奉献解答不会有任何奉献v另两个单元格才代表了检验方法间的差别另两个单元格才代表了检验方法间的差别v假设检验步骤如下:假设检验步骤如下:vH0H0:两法总体阳性检出率无差别,即:两法总体阳性检出率无差别,即B = CB = CvH1H1:两法总体阳性检出率有差别,即:两法总体阳性检出率有差别,即B B C C方法原理方法原理vmcci 56 35 21 28 本卷须知本卷须知vMcNemarMcNemar检验只会利用非主对角

16、线单元格上的信息,检验只会利用非主对角线单元格上的信息,即它只关怀两者不一致的评价情况,用于比较两即它只关怀两者不一致的评价情况,用于比较两个评价者间存在怎样的倾向。因此,对于一致性个评价者间存在怎样的倾向。因此,对于一致性较好的大样本数据,较好的大样本数据,McNemarMcNemar检验能够会失去适用检验能够会失去适用价值。价值。v例如对例如对1 1万个案例进展一致性评价,万个案例进展一致性评价,99959995个都是完个都是完全一致的,在主对角线上,另有全一致的,在主对角线上,另有5 5个分布在左下的个分布在左下的三角区,显然,此时一致性相当的好。但假设运三角区,显然,此时一致性相当的好

17、。但假设运用用McNemarMcNemar检验,此时反而会得出两种评价有差别检验,此时反而会得出两种评价有差别的结论来。的结论来。行列表资料的分析行列表资料的分析分析步骤分析步骤v建立假设建立假设vH0H0:三种不同类型关节炎的疗效一样:三种不同类型关节炎的疗效一样vH1H1:三种不同类型关节炎的疗效不全一样:三种不同类型关节炎的疗效不全一样v求出统计量求出统计量v下结论下结论几点遗留问题几点遗留问题v能否该当进展两两比较?能否该当进展两两比较?v这又是一个打嘴仗的问题,虽然有人提出用卡方这又是一个打嘴仗的问题,虽然有人提出用卡方分割等方法来检验,但同样也有学者对这种做法分割等方法来检验,但同

18、样也有学者对这种做法嗤之以鼻嗤之以鼻v实践上,随着统计学的开展,这个问题已被超越,实践上,随着统计学的开展,这个问题已被超越,可以运用对分类数据的建模方法,如可以运用对分类数据的建模方法,如logisticlogistic模模型等对此问题加以解答型等对此问题加以解答几点遗留问题几点遗留问题v假设是有序资料该怎样处置假设是有序资料该怎样处置v传统的卡方检验是无法对次序信息加以利用的传统的卡方检验是无法对次序信息加以利用的v单向有序:秩和检验单向有序:秩和检验v双向有序:实践上调查的是两变量间的关联性双向有序:实践上调查的是两变量间的关联性相关性,可以运用专门的关联性目的分析相关性,可以运用专门的

19、关联性目的分析v目前对卡方检验还有一些扩展方法,如目前对卡方检验还有一些扩展方法,如CMHCMH卡方,卡方,可以处置此类问题可以处置此类问题几点遗留问题几点遗留问题v行列表卡方检验的适用条件行列表卡方检验的适用条件v实际频数不宜太小,普通以为不宜有实际频数不宜太小,普通以为不宜有1/51/5以上格子以上格子的实际频数小于的实际频数小于5 5或有一个格子的实际频数小于或有一个格子的实际频数小于1 1v不太理想的方法不太理想的方法v与临近行或列中的实践频数合并与临近行或列中的实践频数合并v删去实际频数太小的格子所对应的行或列删去实际频数太小的格子所对应的行或列v最理想的方法最理想的方法v添加样本含量以增大实际频数但是能够吗添加样本含量以增大实际频数但是能够吗v确切概率法确切概率法一点补充一点补充v确切概率法的原理具有通用性,对于四格表以外确切概率法的原理具有通用性,对于四格表以外的情况也适用,如行乘列表、配对、配伍表格均的情况也适用,如行乘列表、配对、配伍表格均可可v对于较大的行乘列表,确切概率法的计算量将变对于较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论