第六章总体率的区间估计和假设检验课件_第1页
第六章总体率的区间估计和假设检验课件_第2页
第六章总体率的区间估计和假设检验课件_第3页
第六章总体率的区间估计和假设检验课件_第4页
第六章总体率的区间估计和假设检验课件_第5页
已阅读5页,还剩125页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学主讲程琮泰山医学院预防医学教研室ccta0509@医学研究生用1第1章绪论医学统计学主讲程琮泰山医学院预防医学教研Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollegeMEDICALSTATISTICS2第1章绪论6章总体率的区间估计和假设检验Theteachingplan

formedical医学统计学教授,硕士生导师。男,1959年6月出生。汉族,无党派。1982年12月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。1994年7月,上海医科大学公共卫生学院研究生毕业,获医学硕士学位。2003年12月晋升教授。现任预防医学教研室副主任。主要从事《医学统计学》、《预防医学》,《医学人口统计学》等课程的教学及科研工作,每年听课学生600-1000人。自2000年起连续10年,为硕士研究生开设《医学统计学》、《SPSS统计分析教程》、《卫生经济学》等课程,同时指导研究生的科研设计、开题报告及科研资料的统计处理与分析。发表医学统计学及预防医学的科研论文50多篇。代表作有“锌对乳癌细胞生长、增殖与基因表达的影响”,,“行列相关的测度”等。主编、副主编各类教材及专著10部,代表作有《医学统计学》、《SPSS统计分析教程》。获得院级科研论文及科技进步奖8项,院第四届教学能手比赛二等奖一项,院教学评建先进工作者一项。获2004年泰山医学院首届十大教学名师奖。《医学统计学》为校级和省级精品课程。程琮教授简介3第1章绪论6章总体率的区间估计和假设检验医学统计学教授,硕士生导师。男,1959年6月出生。《医学统计学》目录第1章绪论第2章定量资料的统计描述第3章总体均数的区间估计和假设检验第4章方差分析第5章定性资料的统计描述第6章

总体率的区间估计和假设检验第7章二项分布与Poisson分布第8章秩和检验第9章直线相关与回归第10章实验设计第11章调查设计第12章统计表与统计图4第1章绪论6章总体率的区间估计和假设检验《医学统计学》目录第1章绪论4第1章绪论6章总体第6章总体率的区间估计和假设检验目录第二节率的u检验第三节卡方检验第四节四格表确切概率法第一节率的抽样误差与区间估计5第1章绪论6章总体率的区间估计和假设检验第6章总体率的区间估计和假设检验目录第二节率掌握:率的抽样误差的概念及意义。熟悉:总体率的区间估计的概念、意义及其计算方法。掌握:率的u检验的概念、意义。熟悉:率的u检验的适用条件及计算方法。掌握:卡方检验的概念及意义;检验的分类、适用条件及计算方法。熟悉:行列表卡方检验的适用条件及计算方法。了解:行列表卡方检验的注意事项及行列表分割法了解:四格表确切概率法应用条件。第六章学习要求6第1章绪论6章总体率的区间估计和假设检验掌握:率的抽样误差的概念及意义。第六章学习要求6第1章绪第六章总体率的区间估计和假设检验课件第六章总体率的区间估计和假设检验课件总体率的区间估计

㈠正态分布法

样本含量n足够大,np与n(1-p)均≥5时,二、总体率的区间估计9第1章绪论6章总体率的区间估计和假设检验总体率的区间估计二、总体率的区间估计9第1章绪论6章总表(补充)np与n(1-p)均≥5时

样本含量大小估计10第1章绪论6章总体率的区间估计和假设检验表(补充)np与n(1-p)均≥5时

样本含量大小估计10Forexample例6.2求例6.1当地居民粪便蛔虫阳性率的95%可信区间和99%的可信区间。95%的可信区间为:25%±1.96×1.53%即(22.00%,28.00%)99%的可信区间为:25%±2.58×1.53%即(21.05%,28.95%)11第1章绪论6章总体率的区间估计和假设检验Forexample例6.2求例6.1当地居民粪便蛔虫当样本含量较小(如n≤50),np或n(1-p)<5时,样本率的分布呈二项分布,总体率的可信区间可据二项分布的理论求得。例6.3某医院用某药治疗脑动脉硬化症22例,其中显效者10例。问该药总显效率的95%可信区间为多少?本例n=22,X=10,查附表7(201页),得此两数相交处的数值为24~68,即该药总显效率的95%可信区间为(24%,68%)。(二)查表法12第1章绪论6章总体率的区间估计和假设检验当样本含量较小(如n≤50),np或n(1-p)<5时,样本第二节率的u检验应用条件:样本含量n足够大,np与n(1-p)均≥5。见补充表6a。此时,样本率p也是以总体率为中心呈正态分布或近似正态分布。13第1章绪论6章总体率的区间估计和假设检验第二节率的u检验应用条件:样本含量n足够大,np与n(1表(补充)样本含量大小估计14第1章绪论6章总体率的区间估计和假设检验表(补充)样本含量大小估计14第1章绪论6章总体一、样本率与总体率比较的u检验此检验也称为单样本率的u检验。u值的计算公式为:15第1章绪论6章总体率的区间估计和假设检验一、样本率与总体率比较的u检验此检验也称为单样本率的u检验Forexample例6.5根据以往经验,一般胃溃疡病患者有20%(总体率)发生胃出血症状。现某医生观察65岁以上胃溃疡病人152例,其中48例发生胃出血,占31.6%(样本率)。问老年胃溃疡病患者是否较一般胃溃疡病患者易发生胃出血。16第1章绪论6章总体率的区间估计和假设检验Forexample例6.5根据以往经验,一般胃溃疡病检验步骤(1)建立检验假设:H0:π=π0=0.2,即老年胃溃疡出血率与一般胃溃疡出血率相同。H1:π>π0=0.2,即老年胃溃疡出血率高于一般胃溃疡出血率。单侧α=0.05(2)计算u值

本例p=0.316,π=0.2,n=152,代入公式得17第1章绪论6章总体率的区间估计和假设检验检验步骤(1)建立检验假设:17第1章绪论6章总体率计算结果(3)判断:u=3.58>u0.05=1.64(单侧),P<0.05。在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。(4)结论:老年人胃溃疡病患者更易发生胃出血。18第1章绪论6章总体率的区间估计和假设检验计算结果(3)判断:u=3.58>u0.05=1.64适用条件为:两样本的np和n(1-p)均大于5。计算公式为;二、两样本率比较的u检验合并样本率Pc:19第1章绪论6章总体率的区间估计和假设检验适用条件为:两样本的np和n(1-p)均大于5。二、两样本率Forexample例6.6某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发生率,其结果见表6-1。问两组流感发生率有无差别?20第1章绪论6章总体率的区间估计和假设检验Forexample例6.6某中药研究所试用某种草下表为:两样本率比较的调查数据21第1章绪论6章总体率的区间估计和假设检验下表为:两样本率比较的调查数据21第1章绪论6章计算结果本例:n1=100,p1=14%,n2=120,p2=25%,pc=20%,1-pc=80%,Pc=20%。代入公式:判断:u=2.031>u0.05=1.96,故p<0.05。在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。结论:两组流感发生率有差异。22第1章绪论6章总体率的区间估计和假设检验计算结果本例:n1=100,p1=14%,n2=120,p第三节χ2检验χ2检验(chi-squaretest)或称卡方检验,是一种用途较广的假设检验方法,主要用于计数资料的检验。用途:(1)单样本率或构成比的检验。(2)两样本率或构成比的检验。(3)多样本率或构成比的检验。(4)两分类配对计数资料的检验。(5)多分类配对计数资料的检验。(6)两变量关联性检验。(7)两变量线性趋势检验。(8)变量分布的拟合度检验,等等。23第1章绪论6章总体率的区间估计和假设检验第三节χ2检验χ2检验(chi-squaretesχ2检验的主要方法四格表检验:主要用于两样本率或比的检验。行列表检验:主要用于多样本率或比的检验。分层四格表或行列表检验:主要用于流行病学研究病因学及危险度的检验。24第1章绪论6章总体率的区间估计和假设检验χ2检验的主要方法四格表检验:主要用于两样本率或比的检验χ2检验的主要公式基本公式:包括四格表及行列表公式。需要计算理论数T值。专用公式:包括四格表及行列表公式。但不需要计算理论数T值,使用更加方便。25第1章绪论6章总体率的区间估计和假设检验χ2检验的主要公式基本公式:包括四格表及行列表公式。需要一、四格表资料的检验四格表资料的检验:主要用于两个样本率(或构成比)的假设检验。一般制成表6-2的计算格式(以阳性和阴性为例)。26第1章绪论6章总体率的区间估计和假设检验一、四格表资料的检验四格表资料的检验:26第1章绪论6章表6-2四格表资料卡方检验模式表27第1章绪论6章总体率的区间估计和假设检验表6-2四格表资料卡方检验模式表27第1章绪论6章X2检验的基本公式为理论频数T:条件:n>40,T>=528第1章绪论6章总体率的区间估计和假设检验X2检验的基本公式为理论频数T:条件:n>40,T>=四格表检验专用公式省去计算T值:29第1章绪论6章总体率的区间估计和假设检验四格表检验专用公式省去计算T值:29第1章绪论6章例6.7表6-3用药组和对照组流感发病率的比较第1行第1列的理论数:30第1章绪论6章总体率的区间估计和假设检验例6.7表6-3用药组和对照组流感发病率的比较第1行两种方法计算结果基本公式:专用公式:31第1章绪论6章总体率的区间估计和假设检验两种方法计算结果基本公式:专用公式:31第1章绪论6章结果判断χ2临界值:χ20.05,1=3.84,(请牢记)

请记住:χ20.01,1=6.63,卡方分布与u分布的关系:χ2=u2

本例:χ2=4.125>χ20.05,1=3.84。结论:两组差别有统计学意义。与前面u检验的结论相同。32第1章绪论6章总体率的区间估计和假设检验结果判断χ2临界值:χ20.05,1=3.84,(请牢记)四格表卡方值的校正

应用条件(1)任一格的1≤T<5,且n≥40时,需计算校正值。(2)任一格的T<1或n<40时,用确切概率计算法。注意:校正后卡方值变小,结果更保守基本公式专用公式33第1章绪论6章总体率的区间估计和假设检验四格表卡方值的校正应用条件基本公式专用公式3例6.8某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结果如表6-4,问两疗法的治愈率是否相等?表6-4两组治愈率比较34第1章绪论6章总体率的区间估计和假设检验例6.8某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结计算结果及判断本例:χ2=2.74<χ20.05,1=3.84。差异无统计学意义。本例若对χ2值不校正,χ2=4.06,得P<0.05,差异有统计学意义。两者的结论正好相反。35第1章绪论6章总体率的区间估计和假设检验计算结果及判断本例:χ2=2.74<χ20.05,1=3.二、配对四格表资料的检验条件:用于配对分类资料的假设检验。若b+c≤40,需计算X2

校正值若b+c>40,公式为:36第1章绪论6章总体率的区间估计和假设检验二、配对四格表资料的检验条件:用于配对分类资料的假设检验二、配对四格表资料的检验37第1章绪论6章总体率的区间估计和假设检验二、配对四格表资料的检验37第1章绪论6章总体率的区例6.9有28份白喉病人的咽喉涂抹标本,把每份标本分别接种在甲、乙两种白喉杆菌培养基上,观察两种白喉杆菌生长情况,“+”号表示生长,“-”号表示不生长,结果如表6-5。问两种白喉杆菌培养基的效果有无差别?表6-5甲、乙两种白喉杆菌培养基的培养结果38第1章绪论6章总体率的区间估计和假设检验例6.9有28份白喉病人的咽喉涂抹标本,把每份标本分别本例检验步骤如下:(1)建立检验假设

H0:总体B=C,即两种白喉杆菌培养基的效果相同H1:总体B≠C,即两种白喉杆菌培养基的效果不同α=0.05(2)计算卡方值本例b=9,c=1,b+c<40,39第1章绪论6章总体率的区间估计和假设检验本例检验步骤如下:(1)建立检验假设39第1章绪论6章本例检验步骤如下:(3)确定P值本例χ2=4.90>χ2

=3.84,P<0.05。(4)推断结论在α=0.05的水准上,拒绝H0,接收H1,差异有统计学意义。(5)结论:可以认为甲、乙两种白喉杆菌培养基的效果有差别,甲培养基培养效果优于乙培养基。40第1章绪论6章总体率的区间估计和假设检验本例检验步骤如下:(3)确定P值本例χ2=4.90>χ2三、行×列表的检验

行×列表(R×C表)的检验:(1)主要用于多个样本率或构成比的比较;(2)有序分类资料的关联性检验。式中:n为总例数,A为每格子的实际频数,nR、nC分别为与某格子实际频数(A)同行、同列的合计数。41第1章绪论6章总体率的区间估计和假设检验三、行×列表的检验行×列表(R×C表)的检验:式中:n为(一)多个样本率的比较

例6.10某市重污染区、一般市区和农村的出生婴儿的致畸情况如表6-6,问三个地区的出生婴儿的致畸率有无差别?42第1章绪论6章总体率的区间估计和假设检验(一)多个样本率的比较例6.10某市重污染区、一般市计算X2值(3)确定P值本例υ=(3-1)(2-1)=2,查界值表,χ20.05,2=5.99。(4)推断结论在α=0.05的水准上,拒绝H0,接受H1,差异有统计学意义。可认为三个地区出生婴儿的致畸率有差别。43第1章绪论6章总体率的区间估计和假设检验计算X2值(3)确定P值本例υ=(3-1)(2-1(二)多个构成比的比较例6.11某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,资料如表6-7,问两组病人血型构成有无差别?44第1章绪论6章总体率的区间估计和假设检验(二)多个构成比的比较例6.11某医院研究鼻咽癌患者与眼科计算卡方值(3)确定P值本例υ=(2-1)(4-1)=3,查界值X20.05,3=7.81。(4)推断结论在α=0.05的水准上,接受H0,差异无统计学意义。故尚不能认为鼻咽癌患者与眼科病人的血型构成有差别。45第1章绪论6章总体率的区间估计和假设检验计算卡方值(3)确定P值本例υ=(2-1)(4-1)=(三)双向有序分类资料的关联性检验例6.12某工厂在冠心病调查中研究冠心病与眼底动脉硬化的关系,共调查588人,资料如表6-8,问冠心病与眼底动脉硬化有无关系?46第1章绪论6章总体率的区间估计和假设检验(三)双向有序分类资料的关联性检验例6.12某工厂在冠心(3)确定P值:υ=(3-1)(3-1)=4,查χ2界值表,χ20.05,4=9.49,本例χ2=53.18>χ2=9.49,P<0.05。(4)推断结论在α=0.05的水准上,拒绝H0,接受H1,差异有统计学意义。可以认为冠心病诊断结果与眼底动脉硬化分级有关系。计算卡方值47第1章绪论6章总体率的区间估计和假设检验(3)确定P值:υ=(3-1)(3-1)=4,查χ2界值表,计算列联系数(Pearson法)r值。如果卡方检验P小于0.05时,说明两变量有关联性。关联性的大小可以用列联系数r表示。r值在0~1之间。0表示完全独立,1表示完全相关,r愈接近0,说明几乎没有关系,r愈接近1,说明关系愈密切。公式如下:48第1章绪论6章总体率的区间估计和假设检验计算列联系数(Pearson法)r值。如果卡方检验P小于0.列联系数(Pearson法)r值的判断标准(补充)列联系数通常的判断标准:(1)r≥0.7为高度相关;(2)0.4≤r<0.7为中度相关;(3)0.2≤r<0.4为低度相关;(4)r<0.2为弱相关;49第1章绪论6章总体率的区间估计和假设检验列联系数(Pearson法)r值的判断标准(补充)列联系数通计算列联系数(Pearson法)r值。本例:计算列联系数r值如下:结论:由于r值=0.30,两变量为低度相关。50第1章绪论6章总体率的区间估计和假设检验计算列联系数(Pearson法)r值。本例:计算列联系数r行×列表资料卡方检验的注意事项(1)理论数不宜太小,一般不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。对理论数太小有三种处理方法:(1)最好增加样本含量以增大理论频数;这是根本的较好的方法。(2)删去理论频数太小的行和列;此法不太好。(3)将理论频数较小的行或列与邻行或邻列合并以增大理论频数。此法会受到条件限制。如不同单位的行或列就不能合并。51第1章绪论6章总体率的区间估计和假设检验行×列表资料卡方检验的注意事项(1)理论数不宜太小,一般不行×列表资料的检验的注意事项(2)当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间不全相等,但不能认为彼此间都不相等。若要比较彼此间的差别,可用下述的行×列表的分割法。对于行×列表单向等级资料(单向有序资料)组间的比较,宜用第八章秩和检验,如作卡方检验法只说明各处理组的效应在构成比上有无差异,而不能说明组间整体效应的差异。52第1章绪论6章总体率的区间估计和假设检验行×列表资料的检验的注意事项(2)当多个样本率(或构成比)四、行×列表的分割法χ2分割的目的是进行多个率之间的两两比较。分割法是利用χ2值的可加性原理,把原R×C表分割为若干个分割表,这些分割表的自由度之和等于原R×C表的自由度,其值之和十分接近原表的值。分割的方法是按最相近的原则,把阳性率(或构成比)相差不大的样本分割出来,计算其χ2值。当差异无统计学意义时,就把它合并为一个样本,再把它与另一较相近的样本比较,如此进行下去直到结束。53第1章绪论6章总体率的区间估计和假设检验四、行×列表的分割法χ2分割的目的是进行多个率之间的两两比较例6.13对例6.10三个地区的出生婴儿的致畸率的分析结果作进一步的两两比较54第1章绪论6章总体率的区间估计和假设检验例6.13对例6.10三个地区的出生婴儿的致畸率的分析结第四节四格表的确切概率法(Fisher’sexacttest)当四格表有理论频数T小于1,或n<40时,可以用四格表的确切概率法(Fisher’sexacttest),直接计算概率。本法的基本思想是:在四格表周边合计不变的情况下,变动四格表内的频数,获得多个四格表。再计算各个四格表的概率。公式为:55第1章绪论6章总体率的区间估计和假设检验第四节四格表的确切概率法(Fisher’sexact例6.14抽查两批食品的卫生状况,作大肠杆菌检查,检查结果见表6-10。

试分析:两批食品的卫生状况有无差别?56第1章绪论6章总体率的区间估计和假设检验例6.14抽查两批食品的卫生状况,作大肠杆菌检查,检查结【分析】此例题的总例数为22,小于40。应用精确概率法进行检验。由于样本含量过小,下结论要非常慎重。57第1章绪论6章总体率的区间估计和假设检验【分析】此例题的总例数为22,小于40。应用精确概率法进行检用Fisher精确法计算P值表6-10中甲批食品阳性率P1=0.4167,乙批食品阳性率P2=0.1000,两者之差|p1-p2|=0.3167。在周边合计数不变的条件下,可能还有其它组合的四格表,其阳性率之差≥0.3167,所有这些比当前四格表更极端的情况都应考虑进去,因为这些极端情况在H0条件下都有可能发生。58第1章绪论6章总体率的区间估计和假设检验用Fisher精确法计算P值表6-10中甲批食品阳性率表6-11中|p1-p2|≥0.3167的四格表为序号(0)、(1)、(5)、(6)的情形,按公式(6.16)求得序号(1)的概率为59第1章绪论6章总体率的区间估计和假设检验表6-11中|p1-p2|≥0.3167的四格表为表6-11确切概率计算表(四格表周边合计数不变)60第1章绪论6章总体率的区间估计和假设检验表6-11确切概率计算表(四格表周边合计数不变)60第余仿此,P(0)=0.0124,P(5)=0.0405,P(6)=0.0028,因此所求概率为:

推断结论按α=0.05的水准,不拒绝H0,差异无统计学意义。还不能认为两批食品卫生状况有差别。P=P(0)+P(1)+P(5)+P(6)=0.0124+0.1061+0.0405+0.0028=0.161861第1章绪论6章总体率的区间估计和假设检验余仿此,P(0)=0.0124,P(5)=0.0405,课后作业及思考题(1)一、作业将书上例题做2-3遍。查阅中华系列杂志:找到卡方检验的科研数据5-10个。同学分小组讨论:各种卡方检验的公式、意义及应用条件。讨论卡方检验的各种注意事项及其意义。62第1章绪论6章总体率的区间估计和假设检验课后作业及思考题(1)一、作业62第1章绪论6章总体率课后作业及思考题(2)二、思考题解释名词:率的抽样误差率的标准误总体率的可信区间率的u检验χ2检验四格表χ2检验行×列表χ2检验列联表列联表列联系数写出率的u检验的公式、意义及应用条件。写出χ2检验的公式、意义及应用条件。率的u检验与χ2检验有何异同点?在处理资料时如何灵活掌握和应用?63第1章绪论6章总体率的区间估计和假设检验课后作业及思考题(2)二、思考题63第1章绪论6章总体课后作业及思考题(3)行×列表χ2检验的应用条件是什么?应注意什么问题?列联表χ2检验与行×列表χ2检验的特点、意义及区别是什么?列联系数的特点及意义是什么?列联系数与直线相关中相关系数的异同点是什么?64第1章绪论6章总体率的区间估计和假设检验课后作业及思考题(3)行×列表χ2检验的应用条件是什么?应注THANKYOUFORLISTENINGTHEEND65第1章绪论6章总体率的区间估计和假设检验THANKYOUFORLISTENINGTHE医学统计学主讲程琮泰山医学院预防医学教研室ccta0509@医学研究生用66第1章绪论医学统计学主讲程琮泰山医学院预防医学教研Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollegeMEDICALSTATISTICS67第1章绪论6章总体率的区间估计和假设检验Theteachingplan

formedical医学统计学教授,硕士生导师。男,1959年6月出生。汉族,无党派。1982年12月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。1994年7月,上海医科大学公共卫生学院研究生毕业,获医学硕士学位。2003年12月晋升教授。现任预防医学教研室副主任。主要从事《医学统计学》、《预防医学》,《医学人口统计学》等课程的教学及科研工作,每年听课学生600-1000人。自2000年起连续10年,为硕士研究生开设《医学统计学》、《SPSS统计分析教程》、《卫生经济学》等课程,同时指导研究生的科研设计、开题报告及科研资料的统计处理与分析。发表医学统计学及预防医学的科研论文50多篇。代表作有“锌对乳癌细胞生长、增殖与基因表达的影响”,,“行列相关的测度”等。主编、副主编各类教材及专著10部,代表作有《医学统计学》、《SPSS统计分析教程》。获得院级科研论文及科技进步奖8项,院第四届教学能手比赛二等奖一项,院教学评建先进工作者一项。获2004年泰山医学院首届十大教学名师奖。《医学统计学》为校级和省级精品课程。程琮教授简介68第1章绪论6章总体率的区间估计和假设检验医学统计学教授,硕士生导师。男,1959年6月出生。《医学统计学》目录第1章绪论第2章定量资料的统计描述第3章总体均数的区间估计和假设检验第4章方差分析第5章定性资料的统计描述第6章

总体率的区间估计和假设检验第7章二项分布与Poisson分布第8章秩和检验第9章直线相关与回归第10章实验设计第11章调查设计第12章统计表与统计图69第1章绪论6章总体率的区间估计和假设检验《医学统计学》目录第1章绪论4第1章绪论6章总体第6章总体率的区间估计和假设检验目录第二节率的u检验第三节卡方检验第四节四格表确切概率法第一节率的抽样误差与区间估计70第1章绪论6章总体率的区间估计和假设检验第6章总体率的区间估计和假设检验目录第二节率掌握:率的抽样误差的概念及意义。熟悉:总体率的区间估计的概念、意义及其计算方法。掌握:率的u检验的概念、意义。熟悉:率的u检验的适用条件及计算方法。掌握:卡方检验的概念及意义;检验的分类、适用条件及计算方法。熟悉:行列表卡方检验的适用条件及计算方法。了解:行列表卡方检验的注意事项及行列表分割法了解:四格表确切概率法应用条件。第六章学习要求71第1章绪论6章总体率的区间估计和假设检验掌握:率的抽样误差的概念及意义。第六章学习要求6第1章绪第六章总体率的区间估计和假设检验课件第六章总体率的区间估计和假设检验课件总体率的区间估计

㈠正态分布法

样本含量n足够大,np与n(1-p)均≥5时,二、总体率的区间估计74第1章绪论6章总体率的区间估计和假设检验总体率的区间估计二、总体率的区间估计9第1章绪论6章总表(补充)np与n(1-p)均≥5时

样本含量大小估计75第1章绪论6章总体率的区间估计和假设检验表(补充)np与n(1-p)均≥5时

样本含量大小估计10Forexample例6.2求例6.1当地居民粪便蛔虫阳性率的95%可信区间和99%的可信区间。95%的可信区间为:25%±1.96×1.53%即(22.00%,28.00%)99%的可信区间为:25%±2.58×1.53%即(21.05%,28.95%)76第1章绪论6章总体率的区间估计和假设检验Forexample例6.2求例6.1当地居民粪便蛔虫当样本含量较小(如n≤50),np或n(1-p)<5时,样本率的分布呈二项分布,总体率的可信区间可据二项分布的理论求得。例6.3某医院用某药治疗脑动脉硬化症22例,其中显效者10例。问该药总显效率的95%可信区间为多少?本例n=22,X=10,查附表7(201页),得此两数相交处的数值为24~68,即该药总显效率的95%可信区间为(24%,68%)。(二)查表法77第1章绪论6章总体率的区间估计和假设检验当样本含量较小(如n≤50),np或n(1-p)<5时,样本第二节率的u检验应用条件:样本含量n足够大,np与n(1-p)均≥5。见补充表6a。此时,样本率p也是以总体率为中心呈正态分布或近似正态分布。78第1章绪论6章总体率的区间估计和假设检验第二节率的u检验应用条件:样本含量n足够大,np与n(1表(补充)样本含量大小估计79第1章绪论6章总体率的区间估计和假设检验表(补充)样本含量大小估计14第1章绪论6章总体一、样本率与总体率比较的u检验此检验也称为单样本率的u检验。u值的计算公式为:80第1章绪论6章总体率的区间估计和假设检验一、样本率与总体率比较的u检验此检验也称为单样本率的u检验Forexample例6.5根据以往经验,一般胃溃疡病患者有20%(总体率)发生胃出血症状。现某医生观察65岁以上胃溃疡病人152例,其中48例发生胃出血,占31.6%(样本率)。问老年胃溃疡病患者是否较一般胃溃疡病患者易发生胃出血。81第1章绪论6章总体率的区间估计和假设检验Forexample例6.5根据以往经验,一般胃溃疡病检验步骤(1)建立检验假设:H0:π=π0=0.2,即老年胃溃疡出血率与一般胃溃疡出血率相同。H1:π>π0=0.2,即老年胃溃疡出血率高于一般胃溃疡出血率。单侧α=0.05(2)计算u值

本例p=0.316,π=0.2,n=152,代入公式得82第1章绪论6章总体率的区间估计和假设检验检验步骤(1)建立检验假设:17第1章绪论6章总体率计算结果(3)判断:u=3.58>u0.05=1.64(单侧),P<0.05。在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。(4)结论:老年人胃溃疡病患者更易发生胃出血。83第1章绪论6章总体率的区间估计和假设检验计算结果(3)判断:u=3.58>u0.05=1.64适用条件为:两样本的np和n(1-p)均大于5。计算公式为;二、两样本率比较的u检验合并样本率Pc:84第1章绪论6章总体率的区间估计和假设检验适用条件为:两样本的np和n(1-p)均大于5。二、两样本率Forexample例6.6某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发生率,其结果见表6-1。问两组流感发生率有无差别?85第1章绪论6章总体率的区间估计和假设检验Forexample例6.6某中药研究所试用某种草下表为:两样本率比较的调查数据86第1章绪论6章总体率的区间估计和假设检验下表为:两样本率比较的调查数据21第1章绪论6章计算结果本例:n1=100,p1=14%,n2=120,p2=25%,pc=20%,1-pc=80%,Pc=20%。代入公式:判断:u=2.031>u0.05=1.96,故p<0.05。在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。结论:两组流感发生率有差异。87第1章绪论6章总体率的区间估计和假设检验计算结果本例:n1=100,p1=14%,n2=120,p第三节χ2检验χ2检验(chi-squaretest)或称卡方检验,是一种用途较广的假设检验方法,主要用于计数资料的检验。用途:(1)单样本率或构成比的检验。(2)两样本率或构成比的检验。(3)多样本率或构成比的检验。(4)两分类配对计数资料的检验。(5)多分类配对计数资料的检验。(6)两变量关联性检验。(7)两变量线性趋势检验。(8)变量分布的拟合度检验,等等。88第1章绪论6章总体率的区间估计和假设检验第三节χ2检验χ2检验(chi-squaretesχ2检验的主要方法四格表检验:主要用于两样本率或比的检验。行列表检验:主要用于多样本率或比的检验。分层四格表或行列表检验:主要用于流行病学研究病因学及危险度的检验。89第1章绪论6章总体率的区间估计和假设检验χ2检验的主要方法四格表检验:主要用于两样本率或比的检验χ2检验的主要公式基本公式:包括四格表及行列表公式。需要计算理论数T值。专用公式:包括四格表及行列表公式。但不需要计算理论数T值,使用更加方便。90第1章绪论6章总体率的区间估计和假设检验χ2检验的主要公式基本公式:包括四格表及行列表公式。需要一、四格表资料的检验四格表资料的检验:主要用于两个样本率(或构成比)的假设检验。一般制成表6-2的计算格式(以阳性和阴性为例)。91第1章绪论6章总体率的区间估计和假设检验一、四格表资料的检验四格表资料的检验:26第1章绪论6章表6-2四格表资料卡方检验模式表92第1章绪论6章总体率的区间估计和假设检验表6-2四格表资料卡方检验模式表27第1章绪论6章X2检验的基本公式为理论频数T:条件:n>40,T>=593第1章绪论6章总体率的区间估计和假设检验X2检验的基本公式为理论频数T:条件:n>40,T>=四格表检验专用公式省去计算T值:94第1章绪论6章总体率的区间估计和假设检验四格表检验专用公式省去计算T值:29第1章绪论6章例6.7表6-3用药组和对照组流感发病率的比较第1行第1列的理论数:95第1章绪论6章总体率的区间估计和假设检验例6.7表6-3用药组和对照组流感发病率的比较第1行两种方法计算结果基本公式:专用公式:96第1章绪论6章总体率的区间估计和假设检验两种方法计算结果基本公式:专用公式:31第1章绪论6章结果判断χ2临界值:χ20.05,1=3.84,(请牢记)

请记住:χ20.01,1=6.63,卡方分布与u分布的关系:χ2=u2

本例:χ2=4.125>χ20.05,1=3.84。结论:两组差别有统计学意义。与前面u检验的结论相同。97第1章绪论6章总体率的区间估计和假设检验结果判断χ2临界值:χ20.05,1=3.84,(请牢记)四格表卡方值的校正

应用条件(1)任一格的1≤T<5,且n≥40时,需计算校正值。(2)任一格的T<1或n<40时,用确切概率计算法。注意:校正后卡方值变小,结果更保守基本公式专用公式98第1章绪论6章总体率的区间估计和假设检验四格表卡方值的校正应用条件基本公式专用公式3例6.8某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结果如表6-4,问两疗法的治愈率是否相等?表6-4两组治愈率比较99第1章绪论6章总体率的区间估计和假设检验例6.8某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结计算结果及判断本例:χ2=2.74<χ20.05,1=3.84。差异无统计学意义。本例若对χ2值不校正,χ2=4.06,得P<0.05,差异有统计学意义。两者的结论正好相反。100第1章绪论6章总体率的区间估计和假设检验计算结果及判断本例:χ2=2.74<χ20.05,1=3.二、配对四格表资料的检验条件:用于配对分类资料的假设检验。若b+c≤40,需计算X2

校正值若b+c>40,公式为:101第1章绪论6章总体率的区间估计和假设检验二、配对四格表资料的检验条件:用于配对分类资料的假设检验二、配对四格表资料的检验102第1章绪论6章总体率的区间估计和假设检验二、配对四格表资料的检验37第1章绪论6章总体率的区例6.9有28份白喉病人的咽喉涂抹标本,把每份标本分别接种在甲、乙两种白喉杆菌培养基上,观察两种白喉杆菌生长情况,“+”号表示生长,“-”号表示不生长,结果如表6-5。问两种白喉杆菌培养基的效果有无差别?表6-5甲、乙两种白喉杆菌培养基的培养结果103第1章绪论6章总体率的区间估计和假设检验例6.9有28份白喉病人的咽喉涂抹标本,把每份标本分别本例检验步骤如下:(1)建立检验假设

H0:总体B=C,即两种白喉杆菌培养基的效果相同H1:总体B≠C,即两种白喉杆菌培养基的效果不同α=0.05(2)计算卡方值本例b=9,c=1,b+c<40,104第1章绪论6章总体率的区间估计和假设检验本例检验步骤如下:(1)建立检验假设39第1章绪论6章本例检验步骤如下:(3)确定P值本例χ2=4.90>χ2

=3.84,P<0.05。(4)推断结论在α=0.05的水准上,拒绝H0,接收H1,差异有统计学意义。(5)结论:可以认为甲、乙两种白喉杆菌培养基的效果有差别,甲培养基培养效果优于乙培养基。105第1章绪论6章总体率的区间估计和假设检验本例检验步骤如下:(3)确定P值本例χ2=4.90>χ2三、行×列表的检验

行×列表(R×C表)的检验:(1)主要用于多个样本率或构成比的比较;(2)有序分类资料的关联性检验。式中:n为总例数,A为每格子的实际频数,nR、nC分别为与某格子实际频数(A)同行、同列的合计数。106第1章绪论6章总体率的区间估计和假设检验三、行×列表的检验行×列表(R×C表)的检验:式中:n为(一)多个样本率的比较

例6.10某市重污染区、一般市区和农村的出生婴儿的致畸情况如表6-6,问三个地区的出生婴儿的致畸率有无差别?107第1章绪论6章总体率的区间估计和假设检验(一)多个样本率的比较例6.10某市重污染区、一般市计算X2值(3)确定P值本例υ=(3-1)(2-1)=2,查界值表,χ20.05,2=5.99。(4)推断结论在α=0.05的水准上,拒绝H0,接受H1,差异有统计学意义。可认为三个地区出生婴儿的致畸率有差别。108第1章绪论6章总体率的区间估计和假设检验计算X2值(3)确定P值本例υ=(3-1)(2-1(二)多个构成比的比较例6.11某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,资料如表6-7,问两组病人血型构成有无差别?109第1章绪论6章总体率的区间估计和假设检验(二)多个构成比的比较例6.11某医院研究鼻咽癌患者与眼科计算卡方值(3)确定P值本例υ=(2-1)(4-1)=3,查界值X20.05,3=7.81。(4)推断结论在α=0.05的水准上,接受H0,差异无统计学意义。故尚不能认为鼻咽癌患者与眼科病人的血型构成有差别。110第1章绪论6章总体率的区间估计和假设检验计算卡方值(3)确定P值本例υ=(2-1)(4-1)=(三)双向有序分类资料的关联性检验例6.12某工厂在冠心病调查中研究冠心病与眼底动脉硬化的关系,共调查588人,资料如表6-8,问冠心病与眼底动脉硬化有无关系?111第1章绪论6章总体率的区间估计和假设检验(三)双向有序分类资料的关联性检验例6.12某工厂在冠心(3)确定P值:υ=(3-1)(3-1)=4,查χ2界值表,χ20.05,4=9.49,本例χ2=53.18>χ2=9.49,P<0.05。(4)推断结论在α=0.05的水准上,拒绝H0,接受H1,差异有统计学意义。可以认为冠心病诊断结果与眼底动脉硬化分级有关系。计算卡方值112第1章绪论6章总体率的区间估计和假设检验(3)确定P值:υ=(3-1)(3-1)=4,查χ2界值表,计算列联系数(Pearson法)r值。如果卡方检验P小于0.05时,说明两变量有关联性。关联性的大小可以用列联系数r表示。r值在0~1之间。0表示完全独立,1表示完全相关,r愈接近0,说明几乎没有关系,r愈接近1,说明关系愈密切。公式如下:113第1章绪论6章总体率的区间估计和假设检验计算列联系数(Pearson法)r值。如果卡方检验P小于0.列联系数(Pearson法)r值的判断标准(补充)列联系数通常的判断标准:(1)r≥0.7为高度相关;(2)0.4≤r<0.7为中度相关;(3)0.2≤r<0.4为低度相关;(4)r<0.2为弱相关;114第1章绪论6章总体率的区间估计和假设检验列联系数(Pearson法)r值的判断标准(补充)列联系数通计算列联系数(Pearson法)r值。本例:计算列联系数r值如下:结论:由于r值=0.30,两变量为低度相关。115第1章绪论6章总体率的区间估计和假设检验计算列联系数(Pearson法)r值。本例:计算列联系数r行×列表资料卡方检验的注意事项(1)理论数不宜太小,一般不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。对理论数太小有三种处理方法:(1)最好增加样本含量以增大理论频数;这是根本的较好的方法。(2)删去理论频数太小的行和列;此法不太好。(3)将理论频数较小的行或列与邻行或邻列合并以增大理论频数。此法会受到条件限制。如不同单位的行或列就不能合并。116第1章绪论6章总体率的区间估计和假设检验行×列表资料卡方检验的注意事项(1)理论数不宜太小,一般不行×列表资料的检验的注意事项(2)当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间不全相等,但不能认为彼此间都不相等。若要比较彼此间的差别,可用下述的行×列表的分割法。对于行×列表单向等级资料(单向有序资料)组间的比较,宜用第八章秩和检验,如作卡方检验法只说明各处理组的效应在构成比上有无差异,而不能说明组间整体效应的差异。117第1章绪论6章总体率的区间估计和假设检验行×列表资料的检验的注意事项(2)当多个样本率(或构成比)四、行×列表的分割法χ2分割的目的是进行多个率之间的两两比较。分割法是利用χ2值的可加性原理,把原R×C表分割为若干个分割表,这些分割表的自由度之和等于原R×C表的自由度,其值之和十分接近原表的值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论