卡方检验1课件学习资料_第1页
卡方检验1课件学习资料_第2页
卡方检验1课件学习资料_第3页
卡方检验1课件学习资料_第4页
卡方检验1课件学习资料_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章χ2

检验(1)

chi-squaretest1学习目标1.掌握χ2检验的主要用途;2.熟悉χ2检验的基本思想;3.熟悉χ2检验分布和拟合优度检验;4.掌握独立样本2х2资料χ2检验专用公式、校正公式条件2χ2检验的主要用途x2检验(chi-squaretest)是以x2分布为理论依据,用途颇广的假设检验方法。可用于:两个或多个样本率的比较;两个或多个样本构成比的比较;两个分类变量间关联性的检验;有序分组资料的线性趋势检验;频数分布的拟合优度检验。3一、检验的基本思想分布的概念检验的基本思想

P

值的确定检验的基本检验步骤4

分布的拓展与应用

1875年,F.Helmet得出:来自正态总体的样本方差的分布服从分布;1900年K.Pearson又从检验分布的拟合优度(goodnessoffit)中也发现了这一相同的分布,可用于检验资料的实际频数和理论频数是否相符等问题。卡方检验基本思想分布的概念6

分布的密度函数7卡方检验基本思想分布的概念

分布曲线8卡方检验基本思想分布的概念分布曲线9

分布的形状依赖于自由度ν的大小:①当自由度ν≤2时,曲线呈“L”型;②随着ν的增加,曲线逐渐趋于对称;③当自由度ν→∞时,曲线逼近于正态曲线。

④当ν=1时,分布与标准正态分布(Z分布)一致。卡方检验基本思想分布的概念分布特点102.检验的基本思想(以两个样本率的比较为例)例9-2将病情相似的169名消化道溃疡患者随机分成两组,分别用洛赛克和雷尼替丁治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?卡方检验基本思想11四格表(Fourfoldtable)在上例中,的数据是基本的,其余数据都是由以上四个数据计算出来的。这四个数叫实际频数,简称实际数(actualfreqency,A)6421513312

对于洛赛克组的64人,按照合并愈合率Pc=68.05%治疗的话,理论上:64×68.05%=57.84人愈合,用T11表示,未愈合:T12=85-57.84=27.16对于雷尼替丁组:愈合:T21=115-57.84=57.16未愈合:T22=54-27.16=26.84理论频数(theoreticalfreqency,T)Tij表示第i行第j列的理论数。计算公式为:

ni表示i行的合计数mj表示j列的合计数13经推导:

★实际数与理论数的差别等价于两样本率的差别,因此,★对实际数与理论数差值的假设检验等价于对两样本率差值的假设检验1415由χ2的计算可见,χ2检验的基本思想是:Χ2值反映了实际数与理论数相吻合的程度。如果检验假设H0成立,则A=T,现A≠T可能原因(1)抽样误差造成(2)来自不同总体若为(1),则A与T差别不会很大,出现大的Χ2值的可能性很小,当p≤α,就怀疑假设H0,因而拒绝;反之,当

p>α,则无理由拒绝。16分类资料χ2检验的自由度问题:对于χ2值,不可能出现负值,χ2值的大小会随着格子数的增加而增大,因此应当消除格子数不同对χ2值的影响。

在周边合计固定不变的情况下,可以自由取值的格子数。υ=(行数-1)(列数-1)本例中四格表的自由度为υ=(2-1)(2-1)=1

17

分布的分位数(Percentile)当ν确定后,分布曲线下右侧尾部的面积为

时,横轴上相应的值,记为,如下图。实际应用时,可根据ν由界值表(percentagepointsofthedistribution)查得。卡方检验基本思想分布的概念183、查χ2界值表,确定P值,作出结论

查P482附表8

根据自由度和事先确定的检验水准,查得对应的χ2界值。作出判断结论,

χ2值越大,概率P越小,P越小越有理由拒绝H0,越有理由认为有统计学意义。19(1)建立检验假设H0:π1=π2两药的愈合率相同H1:π1≠π2两药愈合率不同检验水准

=0.05(2)计算检验统计量20自由度

=(2-1)(2-1)=1(3)确定p值,结论:查附表8,

=1对应的临界值,P<0.025。按

=0.05拒绝H0,两样本频率的差别具有统计学意义。可以认为,洛赛克的愈合率高于雷尼替丁的愈合率。21对于四格表资料,四格表专用公式

22

当n≥40时,如果有某个格子出现1≤T<5,一般需用校正公式23(1)建立检验假设H0:π1=π2,两法总体缓解概率相同H1:π1≠π2两法总体缓解概率不同检验水准

=0.05例9-3将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见表9-4,问两疗法的总体缓解率是否不同?24组别属性合计缓解率(%)缓解未缓解单纯化疗2(4.8)10(7.2)12(固定值)16.7复合化疗14(11.2)14(16.8)28(固定值)50.0合计16244040.0表9-4两组疗法的缓解率比较252)计算检验统计量

=(2-1)(2-1)=13)确定P值:

P>0.1,高于检验水准

,不能拒绝H0,差别无统计学意义,尚不能认为两种治疗方案的总体缓解概率不同。

26特别注意:

当四格表出现T<1或n<40时,校正

2值也不恰当,这时必须用四格表的确切概率计算法。

27

四格表χ2检验的条件

(1)当n≥40且每格T≥5时,用基本公式或四格表专用公式;(2)当n≥40但有1≤T<5时,用校正公式;(3)当n<40或有T<1时,不能应用χ2检验,改用确切概率法。28五、频数分布拟合优度的检验由于Pearson值能反映实际频数和理论频数的吻合程度,所以检验可用于推断频数分布的拟合优度(goodnessoffit),即推断某现象频数分布是否符合某理论分布,且应用广泛。如正态分布,二项分布,Poisson分布,负二项分布等均可应用检验进行推断。

(Testaboutgoodnessoffitforthefrequencydistribution)

29H0:本资料服从×××分布;H1:本资料不服从×××分布;(1)先假设H0成立,按特定分布的规律(概率函数)计算理论频数,进而计算值。(2)若值小,可认为现有资料服从某一分布;若值大,尚不能认为现有资料服从某一分布。自由度=K-参数个数-1K:组段数参数个数:正态分布和二项分布有2个参数,poisson分布有1个30例9-1对数据作正态分布拟合优度检验。120名男孩身高的测量值,均数=139.48cm;标准差=7.30cm检验的假设:H0:总体分布等于均数为139.48cm,标准差为7.30cm的正态分布H1:总体分布不等于该正态分布

=0.0531表9-1120例男孩身高测量值频数分布表及拟合优度检验统计量的计算组段(1)实际频数A(2)Φ(X1)(3)Φ(X2)(4)P(X)(5)T=n×P(X)(6)(A—T)2/T(7)122.0―50.008320.032040.024082.89001.54053126.0―80.032400.097040.064637.75570.00769130.0―100.097040.226420.1293915.52631.96698134.0―220.226420.419670.1932523.18980.06104138.0―330.419670.635030.2153625.84331.98188142.0―200.635030.814110.1790821.48980.10328146.0―110.814110.925220.1111113.33310.40827150.0―60.925220.976650.051436,17170.00477154.0―50.976650.994410.017762.13093.86289合计120————9.9373332

表9-1中第3列、第4列正态分布函数值可通过对作标准正态变换后查正态分布表或利用相应的SAS程序得到,第5列为第4列与第3列的差值,第6列理论频数T等于总例数120与各组段概率的乘积,第7列各数之和即检验统计量

2值。

33计算统计量:推断结论:自由度=10-1-2=7,查附表8,得到P>0.50,可以认为该样本服从正态分布。

计算TI时的参数有2个(均数和标准差)34例调查者欲观察某克山病区克山病患者的空间分布,将该区划分为279个取样单位,统计各取样单位历年累计病例数,资料见下表第(1)、(2)栏,问此资料是否服从Poisson分布?本例,,均数与方差相近,可试拟合Poisson分布。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论