医学统计学卡方检验课件_第1页
医学统计学卡方检验课件_第2页
医学统计学卡方检验课件_第3页
医学统计学卡方检验课件_第4页
医学统计学卡方检验课件_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学χ2检验卫生部“十二五”规划教材1学习交流PPT医学统计学χ2检验卫生部“十二五”规划教材1学习交流PPT

是现代统计学的创始人之一,英国统计学家KarlPearson于1900年提出的一种具有广泛用途的假设检验方法。常用于推断两个总体率(或构成比)之间有无差别。χ2

检验2学习交流PPT是现代统计学的创始人之一,英国统计学家KarlPea四格表资料的检验χ23学习交流PPT四格表资料的检验χ23学习交流PPT实际频数(actualfrequency,A):a、b、c、d理论频数(theoreticalfrequency,T)基本思想4学习交流PPT实际频数(actualfrequency,A):a、b、c假设H0:πA=πB=π,即A组与B组治疗的总体有效率相等A组:理论有效者=(a+b)×(a+c)/n;

理论无效者=(a+b)×(b+d)/nB组:理论有效者=(c+d)×(a+c)/n;

理论无效者=(c+d)×(b+d)/nTRC为第R行第C列的理论频数,nR为相应行的合计,nC为相应列的合计。5学习交流PPT假设H0:πA=πB=π,即A组与B组治疗的总体有效率相等A

χ2值反映了实际频数与理论频数的吻合程度。若假设成立,实际频数与理论频数的差值较小,χ2值也较小;若假设不成立,实际频数与理论频数的差值较大,χ2值也较大。6学习交流PPTχ2值反映了实际频数与理论频数的吻合程度。6学习交流PPχ2检验的自由度自由度取决于可以自由取值的基本格子数,而不是样本含量。

χ2值的大小取决于的个数多少,即自由度的大小。ν愈大,χ2值也越大。对于四格表资料(ν=1),计算一个理论值TRC后,其他3个理论值可用周边合计数减去相应的理论值T得出。7学习交流PPTχ2检验的自由度自由度取决于可以自由取值的基本格子数χ2检验的自由度χ2检验,根据自由度ν和检验水α准查表得χ2界值。当ν确定后,χ2分布曲线下右侧尾部的面积为α时,横轴上相应的χ2值记作。当ν确定后,χ2值越大,P值越小。8学习交流PPTχ2检验的自由度χ2检验,根据自由度ν和检验水α准查表得χ2两样本率比较时,当总例数n≥40且所有格子的T≥5时,可用四格表资料的专用公式计算四格表资料χ2检验的专用公式9学习交流PPT两样本率比较时,当总例数n≥40且所有格子的T≥5时【例】某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治疗71例,有效52例,乙药治疗42例,有效39例。问两种药物的有效率是否有差别?10学习交流PPT【例】某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治⑴设H0:π1=π2,即两药有效率相同;H1:

π1≠π2

α=0.05⑵n>40,Tmin>5⑶,则P<0.05,拒绝H0,接受H1,故认为甲、乙两药的疗效不同,乙药疗效要好于甲药。11学习交流PPT⑴设H0:π1=π2,即两药有效率相同;H1:π1≠

χ2分布是一种连续性分布,而计数资料属离散性分布,由此得到的统计量也是不连续的。为改善χ2统计量分布的连续性,英国统计学家YatesF建议将实际频数和理论频数之差的绝对值减去0.5以作校正。四格表资料χ2检验的校正公式12学习交流PPTχ2分布是一种连续性分布,而计数资料属离散性分布,由此在实际工作中,对于四格表资料,通常规定:四格表资料χ2检验的校正公式T≥5,且n≥40时,直接计算χ2值,用基本公式或专用公式;1≤T<5,且n≥40时,用连续性校正公式(continuitycorrection),或四格表资料的Fisher确切概率法;T<1或n<40,用四格表资料的Fisher确切概率法。13学习交流PPT在实际工作中,对于四格表资料,通常规定:四格表资料χ2检验的【例】某医生研究比较A、B两种药物对急性细菌性肺炎的疗效,甲药治疗42例,有效40例,乙药治疗22例,有效16例。问两种药物的疗效差别有无统计学意义?用校正公式,χ2=4.79;错用基本公式,χ2=6.69。14学习交流PPT【例】某医生研究比较A、B两种药物对急性细菌性肺炎的疗效,甲四格表资料的Fisher确切概率法当T<1或n<40,四格表资料χ2检验结果可能会有偏性,需采用Fisher确切检验进行分析。该法由R.A.Fisher提出,且直接计算概率,因此也叫Fisher确切概率检验(Fisher’sexactprobabilitytest)。15学习交流PPT四格表资料的Fisher确切概率法当T<1或n<40,Fisher确切概率法的基本思想在四格表周边合计数固定不变的条件下,利用超几何分布(hypergeometricdistribution)公式直接计算表内四个格子数据的各种组合的概率,然后计算单侧或双侧累计概率,并与检验水准比较,作出是否拒绝H0的结论。“!”为阶乘符号,n!=1×2×…×n,0!=1,∑Pi=1。16学习交流PPTFisher确切概率法的基本思想在四格表周边合计数固定【例】某医生用新旧两种药物治疗某病患者27人,治疗结果见表。问两种药物的疗效有无差别?组别治愈数未愈数合计治愈率(%)旧药2141612.5新药381127.3合计5222718.5⑴设H0:π1=π2,即两药疗效相同;H1:

π1≠π2

α=0.05⑵计算各组合概率在四格表周边合计数不变的条件下,共有“周边合计数中最小数+1”中组合。17学习交流PPT【例】某医生用新旧两种药物治疗某病患者27人,治疗结果见表。⑶确定P值,作出结论原样本四格表对应的概率为P3=0.245262,小于或等于P3的四格表为i=1,2,3,6,故双侧检验P值为

P=P1+P2+P3+P6=0.370>0.05,不拒绝H0。

左侧概率为P=P1+P2+P3=0.316,右侧概率为P=P3+P4+P5+P6=0.929,故单侧检验P值为0.316。18学习交流PPT⑶确定P值,作出结论原样本四格表对应的概率为P3=0配对四格表资料的检验χ219学习交流PPT配对四格表资料的检验χ219学习交流PPT计数资料的配对设计常用于两种检验方法、培养方法、诊断方法的比较。

特点是对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果,整理为一致:a(+)和d(-);不一致:b(甲+,乙-)和c(甲-,乙+)。概述20学习交流PPT计数资料的配对设计常用于两种检验方法、培养方法、诊断配对四格表资料的χ2检验,又称为McNemartest检验。由于该检验只考虑了不一致的情况(b与c),而未考虑样本含量n及一致结果(a与d)。因此,当n很大且两法一致率较高(即a与d数值较大),b与c的数值相对较小时,即使检验结果有统计学意义,但实际意义并不大。概述21学习交流PPT配对四格表资料的χ2检验,又称为McNemartest检验【例】用两种血清学方法对100例肝癌患者进行检测,有关检测结果见表。问两种血清学方法检测结果有无差别?甲法乙法合计+-+503282-15

318合计6535100⑴H0

:b=c,两种方法检出率相同;H1

:b≠c;α=0.05⑵⑶,则P<0.05,拒绝H0

,接受H1

22学习交流PPT【例】用两种血清学方法对100例肝癌患者进行检测,有关检测结R×C列联表资料的检验χ223学习交流PPTR×C列联表资料的检验χ223学习交流PPT行×列表资料的χ2检验,用于多个样本率的比较、两个或多个构成比的比较。

基本数据为:

⑴多个样本率比较时,有R行2列;

⑵两个样本构成比比较时,有2行C列;

⑶多个样本构成比比较时,有R行C列。概述24学习交流PPT行×列表资料的χ2检验,用于多个样本率的比较、两个或【例】某研究者欲比较甲、乙、丙3家医院住院病人院内感染情况,随机抽查同一时期各医院住院病人院内感染情况结果见表。试比较三家医院院内感染率有无差别。25学习交流PPT【例】某研究者欲比较甲、乙、丙3家医院住院病人院内感染情况,⑴设H0:三家医院院内感染率相同;H1:

感染率不同;

α=0.05⑶,则P<0.05,拒绝H0,接受H1,故可认为甲、乙、丙三家医院院内感染率总体有差别。⑵26学习交流PPT⑴设H0:三家医院院内感染率相同;H1:感染率不同;⑶多个样本率间多重比较进行多个样本率比较时,如果拒绝H0,多个样本率间差异有统计学意义,表明至少有某两个率之间有差异。为了获得哪两个率之间有差异,需要进行多个率的两两比较。27学习交流PPT多个样本率间多重比较进行多个样本率比较时,如果拒绝H多个样本率间多重比较采用Bonferroni法进行多个样本率的两两比较,步骤如下:对需要比较的行×列表资料进行χ2分割,变成多个四格表;对每个四格表进行χ2检验;采用(α‘=α/比较次数)计算调整的水准,其中α为事先确定的水准;以α‘调整作为检验检验水准,作出结论。28学习交流PPT多个样本率间多重比较采用Bonferroni法进行多个样本率【例】某医院用三种穴位针刺治疗急性腰扭伤,结果见表。试比较三种穴位针刺效果有无差别。穴位治愈数未愈数合计后溪穴801898人中穴202040腰痛穴243862合计12476200穴位治愈数未愈数合计后溪穴801898人中穴202040合计10038138穴位治愈数未愈数合计后溪穴801898腰痛穴243862合计10456160穴位治愈数未愈数合计人中穴202040腰痛穴243862合计445810229学习交流PPT【例】某医院用三种穴位针刺治疗急性腰扭伤,结果见表。试比较三⑶,故可认为后溪穴与人中穴、后溪穴与腰痛穴治愈率之间有统计学意义,而人中穴与腰痛穴治愈率之间无统计学意义。⑴设H0:任意两个对比组的总体治愈率相等;H1:

总体治愈率不等;

α=0.05⑵30学习交流PPT⑶若把人中穴针刺治疗急性腰扭伤设为对照组,另两组为试验组,则⑴设H0:各试验组与对照组的总体治愈率相等;H1:

总体治愈率不等;

α=0.05⑵⑶,故可认为后溪穴与人中穴治愈率之间有统计学意义,而腰痛穴与人中穴治愈率之间无统计学意义。31学习交流PPT若把人中穴针刺治疗急性腰扭伤设为对照组,另两组为试验行×列表χ2检验注意事项a、若有1/5以上的格子出现1≤T<5,则增大样本含量,以达到增大理论频数的目的;结合专业,删去理论频数太小的格子对应的行或列;结合专业,将理论频数太小的行或列与性质相近的行或列合并;用双向无序R×C表资料的Fisher确切概率法。32学习交流PPT行×列表χ2检验注意事项a、若有1/5以上的格子出现1≤T行×列表χ2检验注意事项b、多个样本率比较,若统计推断为拒绝H0,接受H1,只能认为各总体率或构成比之间总的来说有差别。若要进一步了解哪两者之间有差别,可用卡方分割法,或者调整检验水准。c、对于单向有序的R×C表资料,在比较各处理组的效应有无差别时,应该用秩和检验。33学习交流PPT行×列表χ2检验注意事项b、多个样本率比较,若统计推断为拒医学统计学χ2检验卫生部“十二五”规划教材34学习交流PPT医学统计学χ2检验卫生部“十二五”规划教材1学习交流PPT

是现代统计学的创始人之一,英国统计学家KarlPearson于1900年提出的一种具有广泛用途的假设检验方法。常用于推断两个总体率(或构成比)之间有无差别。χ2

检验35学习交流PPT是现代统计学的创始人之一,英国统计学家KarlPea四格表资料的检验χ236学习交流PPT四格表资料的检验χ23学习交流PPT实际频数(actualfrequency,A):a、b、c、d理论频数(theoreticalfrequency,T)基本思想37学习交流PPT实际频数(actualfrequency,A):a、b、c假设H0:πA=πB=π,即A组与B组治疗的总体有效率相等A组:理论有效者=(a+b)×(a+c)/n;

理论无效者=(a+b)×(b+d)/nB组:理论有效者=(c+d)×(a+c)/n;

理论无效者=(c+d)×(b+d)/nTRC为第R行第C列的理论频数,nR为相应行的合计,nC为相应列的合计。38学习交流PPT假设H0:πA=πB=π,即A组与B组治疗的总体有效率相等A

χ2值反映了实际频数与理论频数的吻合程度。若假设成立,实际频数与理论频数的差值较小,χ2值也较小;若假设不成立,实际频数与理论频数的差值较大,χ2值也较大。39学习交流PPTχ2值反映了实际频数与理论频数的吻合程度。6学习交流PPχ2检验的自由度自由度取决于可以自由取值的基本格子数,而不是样本含量。

χ2值的大小取决于的个数多少,即自由度的大小。ν愈大,χ2值也越大。对于四格表资料(ν=1),计算一个理论值TRC后,其他3个理论值可用周边合计数减去相应的理论值T得出。40学习交流PPTχ2检验的自由度自由度取决于可以自由取值的基本格子数χ2检验的自由度χ2检验,根据自由度ν和检验水α准查表得χ2界值。当ν确定后,χ2分布曲线下右侧尾部的面积为α时,横轴上相应的χ2值记作。当ν确定后,χ2值越大,P值越小。41学习交流PPTχ2检验的自由度χ2检验,根据自由度ν和检验水α准查表得χ2两样本率比较时,当总例数n≥40且所有格子的T≥5时,可用四格表资料的专用公式计算四格表资料χ2检验的专用公式42学习交流PPT两样本率比较时,当总例数n≥40且所有格子的T≥5时【例】某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治疗71例,有效52例,乙药治疗42例,有效39例。问两种药物的有效率是否有差别?43学习交流PPT【例】某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治⑴设H0:π1=π2,即两药有效率相同;H1:

π1≠π2

α=0.05⑵n>40,Tmin>5⑶,则P<0.05,拒绝H0,接受H1,故认为甲、乙两药的疗效不同,乙药疗效要好于甲药。44学习交流PPT⑴设H0:π1=π2,即两药有效率相同;H1:π1≠

χ2分布是一种连续性分布,而计数资料属离散性分布,由此得到的统计量也是不连续的。为改善χ2统计量分布的连续性,英国统计学家YatesF建议将实际频数和理论频数之差的绝对值减去0.5以作校正。四格表资料χ2检验的校正公式45学习交流PPTχ2分布是一种连续性分布,而计数资料属离散性分布,由此在实际工作中,对于四格表资料,通常规定:四格表资料χ2检验的校正公式T≥5,且n≥40时,直接计算χ2值,用基本公式或专用公式;1≤T<5,且n≥40时,用连续性校正公式(continuitycorrection),或四格表资料的Fisher确切概率法;T<1或n<40,用四格表资料的Fisher确切概率法。46学习交流PPT在实际工作中,对于四格表资料,通常规定:四格表资料χ2检验的【例】某医生研究比较A、B两种药物对急性细菌性肺炎的疗效,甲药治疗42例,有效40例,乙药治疗22例,有效16例。问两种药物的疗效差别有无统计学意义?用校正公式,χ2=4.79;错用基本公式,χ2=6.69。47学习交流PPT【例】某医生研究比较A、B两种药物对急性细菌性肺炎的疗效,甲四格表资料的Fisher确切概率法当T<1或n<40,四格表资料χ2检验结果可能会有偏性,需采用Fisher确切检验进行分析。该法由R.A.Fisher提出,且直接计算概率,因此也叫Fisher确切概率检验(Fisher’sexactprobabilitytest)。48学习交流PPT四格表资料的Fisher确切概率法当T<1或n<40,Fisher确切概率法的基本思想在四格表周边合计数固定不变的条件下,利用超几何分布(hypergeometricdistribution)公式直接计算表内四个格子数据的各种组合的概率,然后计算单侧或双侧累计概率,并与检验水准比较,作出是否拒绝H0的结论。“!”为阶乘符号,n!=1×2×…×n,0!=1,∑Pi=1。49学习交流PPTFisher确切概率法的基本思想在四格表周边合计数固定【例】某医生用新旧两种药物治疗某病患者27人,治疗结果见表。问两种药物的疗效有无差别?组别治愈数未愈数合计治愈率(%)旧药2141612.5新药381127.3合计5222718.5⑴设H0:π1=π2,即两药疗效相同;H1:

π1≠π2

α=0.05⑵计算各组合概率在四格表周边合计数不变的条件下,共有“周边合计数中最小数+1”中组合。50学习交流PPT【例】某医生用新旧两种药物治疗某病患者27人,治疗结果见表。⑶确定P值,作出结论原样本四格表对应的概率为P3=0.245262,小于或等于P3的四格表为i=1,2,3,6,故双侧检验P值为

P=P1+P2+P3+P6=0.370>0.05,不拒绝H0。

左侧概率为P=P1+P2+P3=0.316,右侧概率为P=P3+P4+P5+P6=0.929,故单侧检验P值为0.316。51学习交流PPT⑶确定P值,作出结论原样本四格表对应的概率为P3=0配对四格表资料的检验χ252学习交流PPT配对四格表资料的检验χ219学习交流PPT计数资料的配对设计常用于两种检验方法、培养方法、诊断方法的比较。

特点是对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果,整理为一致:a(+)和d(-);不一致:b(甲+,乙-)和c(甲-,乙+)。概述53学习交流PPT计数资料的配对设计常用于两种检验方法、培养方法、诊断配对四格表资料的χ2检验,又称为McNemartest检验。由于该检验只考虑了不一致的情况(b与c),而未考虑样本含量n及一致结果(a与d)。因此,当n很大且两法一致率较高(即a与d数值较大),b与c的数值相对较小时,即使检验结果有统计学意义,但实际意义并不大。概述54学习交流PPT配对四格表资料的χ2检验,又称为McNemartest检验【例】用两种血清学方法对100例肝癌患者进行检测,有关检测结果见表。问两种血清学方法检测结果有无差别?甲法乙法合计+-+503282-15

318合计6535100⑴H0

:b=c,两种方法检出率相同;H1

:b≠c;α=0.05⑵⑶,则P<0.05,拒绝H0

,接受H1

55学习交流PPT【例】用两种血清学方法对100例肝癌患者进行检测,有关检测结R×C列联表资料的检验χ256学习交流PPTR×C列联表资料的检验χ223学习交流PPT行×列表资料的χ2检验,用于多个样本率的比较、两个或多个构成比的比较。

基本数据为:

⑴多个样本率比较时,有R行2列;

⑵两个样本构成比比较时,有2行C列;

⑶多个样本构成比比较时,有R行C列。概述57学习交流PPT行×列表资料的χ2检验,用于多个样本率的比较、两个或【例】某研究者欲比较甲、乙、丙3家医院住院病人院内感染情况,随机抽查同一时期各医院住院病人院内感染情况结果见表。试比较三家医院院内感染率有无差别。58学习交流PPT【例】某研究者欲比较甲、乙、丙3家医院住院病人院内感染情况,⑴设H0:三家医院院内感染率相同;H1:

感染率不同;

α=0.05⑶,则P<0.05,拒绝H0,接受H1,故可认为甲、乙、丙三家医院院内感染率总体有差别。⑵59学习交流PPT⑴设H0:三家医院院内感染率相同;H1:感染率不同;⑶多个样本率间多重比较进行多个样本率比较时,如果拒绝H0,多个样本率间差异有统计学意义,表明至少有某两个率之间有差异。为了获得哪两个率之间有差异,需要进行多个率的两两比较。60学习交流PPT多个样本率间多重比较进行多个样本率比较时,如果拒绝H多个样本率间多重比较采用Bonferroni法进行多个样本率的两两比较,步骤如下:对需要比较的行×列表资料进行χ2分割,变成多个四格表;对每个四格表进行χ2检验;采用(α‘=α/比较次数)计算调整的水准,其中α为事先确定的水准;以α‘调整作为检验检验水准,作出结论。61学习交流PPT多个样本率间多重比较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论