医学统计学 卡方检验_第1页
医学统计学 卡方检验_第2页
医学统计学 卡方检验_第3页
医学统计学 卡方检验_第4页
医学统计学 卡方检验_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学

MedicalStatistics2检验(卡方检验)Chi-squaretest上两次课小复习t检验方差分析均数的比较计量资料

计数资料?卡方(

2

)检验率的比较?KarlPearsonand2

1857~1936,现代统计学之父剑桥大学学数学,海德堡大学学物理学和哲学,柏林大学学罗马法1884-1933年:伦敦大学学院,数学与力学,学术成就:卡方(χ2)检验Pearson相关系数导出一般化的次数曲线体系提出了“标准差”及其符号σ与韦尔登、高尔顿一起创办了《生物统计》42检验方法四格表资料(独立样本)的2检验配对设计资料的2检验RC表资料的2检验确切概率法5卡方检验:概述卡方检验是以卡方分布为理论基础的一种常用假设检验方法,主要用于分类变量;性质:计数资料的假设检验方法;作用:比较>=2样本率(构成比)有无差别;P1(%)P2(%)(样本率不等)推断总体率两总体率相等H0两总体率不等H1P值小概率事件拒绝H0不拒绝H02检验的基本思想

卡方检验的基本公式:A:实际频数T:理论频数基本思想:

2值反映的是在检验假设H0前提下实际频数与理论频数的偏离程度(吻合程度、拟合度、一致性)卡方检验的统计量:28方法原理从卡方的计算公式可见,当观察频数与期望频数完全一致时,卡方值为0;观察频数与期望频数越接近,两者之间的差异越小,卡方值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,卡方值越大。当然,卡方值的大小也和自由度有关2检验的自由度

指可以自由取值的基本格子数

自由度一定时,其2值的概率分布也就确定。根据自由度和检验水准查表10-13可得2界值,若2值≥20.05(),则可按=0.05的检验水准拒绝H0;若2值<20.05(),则还不能拒绝H0。一、两个独立样本(率、构成比)的比较四格表资料的2

检验用途:检验两个样本的总体频率分布是否相同四格表资料检验的专用公式,式中a,b,c,d为四格表的实际频数两种药物治疗消化道溃疡疗效药物愈合未愈合合计愈合率(%)奥美拉唑64218575.29雷尼替丁51338460.71合计1155416968.05两个独立样本资料的四格表组别愈合未愈合合计奥美拉唑aba+b雷尼替丁cdc+d合计a+cb+dn=a+b+c+d四格表?表格的基本数据分布在a,b,c,d四个格子中,称之为四格表(2×2列联表)问题:两种药物治疗消化道溃疡的愈合率有无差别?=两个样本频率分布的总体分布是否相等?=这两个样本是否来自同一个总体?表.两种药物治疗消化道溃疡疗效药物愈合未愈合合计愈合率(%)奥美拉唑64(a)21(b)85(a+b)75.29雷尼替丁51(c)33(d)84(c+d)60.71合计115(a+c)54(b+d)169(n)68.05例1.两种药物治疗消化道溃疡疗效四格表资料2检验的基本步骤建立检验假设,确定检验水准H0:两种药物治疗消化道溃疡的愈合率相同H1:两种药物治疗消化道溃疡的愈合率不同α=0.052.计算检验统计量当n≥40且所有的T≥5时,用2

检验的基本公式和四格表专用公式3.确定P值,作出推断自由度=(2-1)(2-1)=1,检验水准=0.05,查χ2界值表,

χ20.05,1=3.84,本例χ2=4.13,P<0.05,在α=0.05水平上拒绝H0,两样本频率的差异具有统计学意义。奥美拉唑的样本治疗愈合率为75.29%雷尼替丁的样本治疗愈合率为60.71%

结论:奥美拉唑的愈合率比雷尼替丁的愈合率高=4.13例2.为了解吲达帕胺片治疗原发性高血压的疗效,将70名高血压患者随机分成两组,实验组(吲达帕胺片+辅助治疗),对照组(安慰剂+辅助治疗),观察结果见表。试分析吲达帕胺片治疗原发性高血压的有效性。表2.两种疗法治疗原发性高血压的疗效组别有效无效合计有效率(%)对照组20(25.8)a24(18.2)b44(a+b)45.45实验组21(15.2)c5(10.8)d26(c+d)80.77合计41(a+c)29(b+d)70(n)58.57

解:本例为两个样本率比较的资料,表中的a,b,c,d是该表的4个基本数据,因此用四格表资料的2检验方法进行分析。

建立检验假设并确定检验水准H0:π1=π2,即试验组与对照组的总体有效率相等H1:π1≠π2,即试验组与对照组的总体有效率不等α=0.052.计算检验统计量2用四格表资料2检验的专用公式计算检验统计量2

2=(20×5-24×21)2×70/44×26×41×29=8.403.确定P值以ν=1查2分布界值表,得P<0.005,按α=0.05水准,拒绝H0,接受H1。可以认为吲达帕胺片治疗原发性高血压有效。校正公式:四格表资料2检验的校正

分布是一种连续性分布,而分类变量资料属离散性分布,由此得到的统计量也是不连续的。为改善2统计量分布的连续性,英国统计学家YatesF建议将实际频数和理论频数之差的绝对值减去0.5以作校正。若n>40,此时有1<T5时,需计算Yates连续性校正2值c2=∑(|A-T|-0.5)2/T;c2=(|ad-bc|-n/2)2n/(a+b)(c+d)(a+c)(b+d)例.为比较胞磷胆碱与神经节苷脂治疗脑血管疾病的疗效,将58例患者随机分成两组,临床试验结果见表。问两组药物的疗效有无差异?解:建立检验假设并确定检验水准H0:两种药物治疗脑血管疾病的有效率相同H1:两种药物治疗脑血管疾病的有效率不同Α=0.05药物分组有效无效合计胞磷胆碱23.74.328神经节苷脂25.34.730合计49958表.资料理论频数的计算2.计算检验统计量理论频数:T11=28×49/58=23.7,T12=28×9/58=4.3T21=30×49/58=25.3,T22=30×9/58=4.7本例n=58,但有2个格子理论频数分别为4.3和4.7,均为1<T5,需用校正公式计算2Tij=ni.nj./nc2

=(|25×6-3×24|-58/2)2×58/49×9×28×30=0.373.确定P值,作出判断结论以ν=1查2界值表得P>0.05水准,不拒绝H0,尚不能认为两种药物治疗脑血管病的有效率不同。24在实际工作中,对于四格表资料,通常规定(1)T≥5,且N≥40时,直接计算值,不用校正;(2)1≤T<5,且N≥40时,用连续性校正检验;(3)T<1或N<40,不能用卡方检验,用直接计算概率的方法。配对设计两样本率比较

的χ2检验方法原理例1.用A、B两种方法检查已确诊的乳腺癌患者140名,A法检出91名(65%),B法检出77名(55%),A、B两法一致的检出56名(40%),问哪种方法阳性检出率更高?显然,本例对同一个个体有两次不同的测量,从设计的角度上讲可以被理解为自身配对设计按照配对设计的思路进行分析,则首先应当求出各对的差值,然后考察样本中差值的分布是否按照H0假设的情况对称分布按此分析思路,最终可整理出如前所列的配对四格表28注意主对角线上两种检验方法的结论相同,对问题的解答不会有任何贡献另两个单元格才代表了检验方法间的差异1、建立假设检验:H0:两法总体阳性检出率无差别,即B=CH1:两法总体阳性检出率有差别,即BCα=0.05292、计算检验统计量当20<b+c≤40时,用2=(|b+c|-1)2/b+c3、确定P值,作出推断本例自由度ν=1,查2界值表,20.05,1=3.84,可知P>0.05。在α=0.05水平上不拒绝H0,虽然A法阳性检出率为91/140=65%,B法阳性检出率为77/140=55%,尚不能认为A法和B法的阳性检出率有区别。2=(35-21)2/35+21=3.5例2.现有205份咽喉涂抹标本,把每份标本依同样的条件接种于甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,观察结果如表,问两种培养基的培养阳性率有无区别。乙种培养法

甲种培养法合计+-+362460-10135145合计46159205分析:本例分析目的是比较两种培养方法阳性率的差异。能否将两法的阳性率46/205与60/205用两个样本率的比较卡方检验进行分析?分析:本例中甲法和乙法培养的样本是相同的样本。比较两法阳性率有无差别,要着眼于两法结果不一致的部分,即检验H0:总体B=C,即甲种培养法培养阳性且乙种培养法培养阴性的例数与甲种培养法培养阴性且乙种培养法培养阳性例数相等,H1:总体B≠C1、建立假设检验:H0:两法培养法培养阳性率无差别,即B=CH1:两法培养法培养阳性率有差别,即BCα=0.052、计算检验统计量本例b+c=34≤40但>20,用2=(|b+c|-1)2/b+c=(|24+10|-1)2/24+10=4.971,v=13、确定P值,作出推断结论查2界值表,得0.01<P<0.05,按α=0.05水准,拒绝H0,接受H1,差别有统计学意义。结论:乙培养法的阳性率高于甲培养法(2=4.97,P=0.0258)

行Χ列表资料的分析

(多组率或构成比的比较)行Χ列表(RΧC列联表)?四格表只有2行(row,R)2列(column,C),只能对2个率进行比较。在医学研究中经常需要同时比较多个率或构成比,如三种不同治疗方法治疗急性肝炎的有效率,不同疾病血型分布(构成)有无差别等。由于R数或C数超出了2,我们把这样的资料称为行Χ列表资料。R×C列联表检验的统计量Oij为实际频数,Eij为理论频数,Oi.为第i行的行和,O.j是第j列的列和;ij为第i行第j列的数据,n为总例数。Aij为列联表中的i行和第j列中的实际频数,ni

和nj分别为相应行和列的周边合计数。df=(行数-1)(列数-1)=(R-1)(C

-1)例:某医院用三种方案治疗急性肝炎254例,观察结果见下表,问三种方案治疗急性肝炎的有效率是否相同?表.三种方案治疗急性肝炎的效果药物例数有效无效有效率(%)A药100514951.00B药80354543.75C药74591579.73合计25414510957.09本例为三个样本率的比较,是3Χ2表资料建立检验假设并确定检验水准H0:三种治疗方案的有效率相同H1:三种治疗方案的有效率不同α=0.052.计算检验统计量

=254×(512/100×145+492/100×109+352/80×145+452/80×109+592/74×145+152/74×109-1)=254×(0.1794+0.2203+0.1056+0.2322+0.3244+0.0279-1)=22.81

ν=(3-1)(2-1)=23.确定P值,作出统计推断查卡方界值表得P<0.05,在α=0.05的检验水准下,拒绝H0,接受H1,可以认为三种疗法的有效率有差别。例:某医院研究鼻咽癌患者与眼科病人的血型构成情况有何不同,收集到的数据如下表,问两组患者血型构成有无差别?1.建立检验假设并确定检验水准H0:两组患者中血型构成比相同H1:两组患者中血型构成比不同α=0.05表.鼻咽癌患者与眼科病人的血型构成比较分组ABOAB合计鼻咽癌患者336565100眼科病人5414525125合计8720108102252.计算检验统计量

=225Χ(332/100Χ87+62/100Χ20+562/100Χ108+52/100Χ10+542/125Χ87+142/125Χ20+522/125Χ108+52/125Χ10-1)=5.710v=3,查卡方界值表,得0.01<P<0.25,按α=0.05水准不拒绝H0,差别无统计学意义。多个样本率间多重比较(自学)行Χ列表卡方检验的注意事项行Χ列表各个格子中理论频数不宜太小,一般认为不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1。不太理想的办法与邻近行或列中的实际频数合并删去理论频数太小的格子所对应的行或列最理想的办法增加样本含量以增大理论频数(但是可能吗)确切概率法四格表资料的确切概率法

Fisher确切概率法(Fisher’sexactprobability)确切概率法不属于2检验的范畴,但常作为2检验应用上的补充。独立样本2×2列联表的卡方检验中,要求n不小于40,T不小于5。但实际中获得的资料不满足这个要求,例如:某医师将32名抑郁症患者随机分为两组,分别用两种药物治疗,结果如下:当2×2列联表出现以下情况时,需用确切概率法计算概率 1,样本含量n<40; 2、理论频数T<1; 3、卡方检验后所得概率P接近检验水准表.两种药物治疗抑郁症的效果组别有效无效合计有效率(%)甲药751258.3乙药381127.3合计10132343.546方法原理在四格表周边合计固定不变的条件下,计算表内4个实际频数变动时的各种组合的概率P。本例即12、11、10、13保持不变的条件下,若H0成立,计算出现各种四格表的概率式中a,b,c,d为四格表中的四个频数,n为总例数。在四格表边缘合计固定不变的条件下4个实际频数变动的组合数等于(边缘合计中最小值+1)47分析实例表.两种药物治疗抑郁症的效果组别有效无效合计有效率(%)甲药7(a)5(b)1258.3乙药3(c)8(d)1127.3合计10132343.5本例的边缘合计中最小值为10,所有可能的组合数为11(10+1)48分析1.建立检验假设和确立检验水准H0:甲药与乙药疗效相同,即1=2H1:甲药与乙药疗效不同,即1

22.计算概率和确定P值本例n=36<40,不满足2检验的应用条件,宜采用四格表确切概率法。计算概率Pi,在边缘合计不变的条件下,计算所有组合四格表的概率Pi。表.各种组合的四格表计算的确切概率四格表序号i药物有效无效PlP甲-P乙lPi1甲药0120.0000.90910.0000乙药1010.90912甲药1110.08330.73490.0006乙药920.81823甲药2100.16670.56060.0095乙药830.72734甲药390.25000.38640.0635乙药740.63645甲药480.33330.21220.1999乙药650.54556甲药570.41670.03780.3198乙药560.45457甲药660.50000.13640.2665乙药470.36368甲药750.58330.31060.1142乙药380.27279甲药840.66670.48490.0238乙药290.181810甲药930.75000.65910.0021乙药1100.090911甲药1020.83330.83330.0001乙药0110.0000P8=12!11!10!13!/7!5!3!8!23!=0.11423.确定P值,作出推断P8=0.1142是实际观察到的四格表资料的概率,而统计检验的P值应为所有有利于拒绝H0的四格表所对应的概率之和。要想拒绝H

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论