版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于分类资料统计推断第1页,讲稿共40页,2023年5月2日,星期三一、率的抽样误差与标准误
抽样研究所得的率同样存在抽样误差,描述其大小的指标是率的标准误(standarderrorofproportion),其计算公式如下:
第2页,讲稿共40页,2023年5月2日,星期三二、总体率的估计和率的u检验
1、总体率的估计:
总体率的估计有两种方法,一是正态分布法,二是查表法。★正态分布法适用于样本较大,且p和/或1-p都不太小,如np和n(1-p)都大于5时。计算公式为:★查表法适用于小样本。利用样本含量n和阳性数x查“百分率的可信区间”表获得。第3页,讲稿共40页,2023年5月2日,星期三例1检查居民800人粪便中蛔虫阳性200人,阳性率为25%,试求当地居民粪便蛔虫阳性率的95%可信区间和99%可信区间。
公式:其中,即:
阳性率的95%可信区间为:
(0.22,0.28)或(22%,28%)同理可得阳性率的99%可信区间。第4页,讲稿共40页,2023年5月2日,星期三2、率的u检验
(1)样本率与总体率比较样本率与总体率(一般为理论值、标准值或经大量观察所得的稳定值等)比较的目的,是推断样本所代表的未知总体率π与已知总体率π0是否相等。可选方法有直接计算概率法(用于π偏离0.5较远,且阳性数X较小作单侧检验时)和正态近似法。这里着重介绍正态近似法。当π或1—π不太小,而n足够大时,如nπ和n(1—π)大于5时,即可按正态近似法做假设检验。检验统计量为u值,计算公式如下:式中n为样本例数,X为样本阳性数,样本率p=X/n;π0为总体率;0.5为连续性校正数,当n较大时可以省去,而︱X—nπ︱≤0.5时不宜采用校正数。第5页,讲稿共40页,2023年5月2日,星期三
例2以往经验脑梗塞患者治疗三周的生活能力改善率为30%,某医院用新疗法治疗38例的三周生活能力改善率为50%,能否认为新疗法的改善率与以往不同?
此为样本率与总体率比较:且np和n(1-p)都大于5,故用u检验。
设
α=0.05
计算统计量u值:
本例︱X—nπ︱≤0.5,因此不宜用校正系数,故=2.69
确定P值,作结论:查t界值表中,υ=∞时,u0.01=2.5758,u0.005=2.8070,因而0.01>P>0.005,则P<α,拒绝H0,接受H1,可以认为新疗法的改善率与以往不同,新疗法的改善率高于以往。第6页,讲稿共40页,2023年5月2日,星期三(2)两个样本率比较
式中P0为合并阳性率,P0=(X1+X2)/(n1+n2)检验统计量计算公式如下:
第7页,讲稿共40页,2023年5月2日,星期三
例3某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发病率,结果如下表,问两组的流感发病率是否不同?表1用药组和对照组的流感发病率此为两大样本率的比较,可用u检验。
第8页,讲稿共40页,2023年5月2日,星期三
假设检验过程:
设
α=0.05计算统计量u值:
=2.031确定P值,作结论:查t界值表中,υ=∞时,u0.05=1.96,u0.01=2.5758,因而0.05>P>0.01,则P<α,拒绝H0,接受H1,可以认为两组发病率不同,用药组发病率低于对照组,说明该草药有预防流感的作用第9页,讲稿共40页,2023年5月2日,星期三三、χ2检验χ2检验(Chi-squaretest)用途极广,这里仅介绍它在分类变量资料中用于推断两个或两个以上总体率(或构成比)之间有无差别或有无关联的分析方法。
第10页,讲稿共40页,2023年5月2日,星期三1、χ2检验的基本思想例4:某医生用国产呋喃硝胺治疗十二指肠球部溃疡,以甲氰咪胍作对照组,结果如表5,问两种方法治疗效果有无差别?表2.两种药物治疗十二指肠球部溃疡的效果Chi-squaretest第11页,讲稿共40页,2023年5月2日,星期三设
α=0.05
计算统计量χ2值:
χ2值的基本公式为:
式中A为实际频数,即所获资料中的基本数据;T为理论频数,是根据检验假设H0推算得到的,,其中,nR为同行合计,nC为同列合计,n为总例数。χ2检验的基本思想体现在χ2值的基本公式中,即当H0成立时,实际频数A就与理论频数T很接近,此时χ2值不会太大;反之,如若A与T相差较大,就会计算得到一个较大的χ2值,当其超出一定范围时,就有理由认为H0不成立。因此,实际上χ2值反映了实际频数与理论频数的吻合程度。Pearson卡方值第12页,讲稿共40页,2023年5月2日,星期三2、四格表资料的χ2检验
四格表资料即基本数据只有四个,为两行两列,如两个率的比较。检验统计量专用计算公式为:
,[υ=(R-1)(C-1)]
式中a,b,c,d分别代表四个实际频数,n为总例数;υ为自由度,R为行数,C为列数。fourfoldtable第13页,讲稿共40页,2023年5月2日,星期三
(1)四个表资料χ2检验实例:例4:某医生用国产呋喃硝胺治疗十二指肠球部溃疡,以甲氰咪胍作对照组,结果如表5,问两种方法治疗效果有无差别?表2.两种药物治疗十二指肠球部溃疡的效果
第14页,讲稿共40页,2023年5月2日,星期三假设检验过程:
设
α=0.05
计算统计量χ2值:
确定P值,作结论:查χ2界值表中,υ=1时,χ20.05,1=3.84,χ20.01,1=6.63,因而0.05>P>0.01,即P<α,因而拒绝H0,接受H1,可以认为两组溃疡愈合率差别显著,呋喃硝胺的愈合率高于甲氰咪胍。第15页,讲稿共40页,2023年5月2日,星期三(2)四格表资料χ2检验应用注意:①当n>40,且任意T≥5时,可四格表专用公式。②当n>40,且任意1<T<5时,应,其计算公式为:例5.某医生欲比较胞磷胆碱与脑益嗪治疗脑动脉硬化的疗效,观察结果如表3,问两种药物的疗效有无差别?表3.两种药物治疗脑动脉硬化的疗效
表3显示有一个理论频数T<5,因此应用校正χ2检验。③当n<40或任意T<1时,应改用确切概率法。直接使用计算校正χ2值第16页,讲稿共40页,2023年5月2日,星期三(3)四格表资料χ2检验与u检验的关系
例6以例3资料作χ2检验,整理如表4:表4用药组和对照组的流感发病率的比较
即两大样本率比较的χ2检验与u检验是等价的。
=4.125=u2≈(2.031)2第17页,讲稿共40页,2023年5月2日,星期三例7某市对医院空气消毒监测,市级医院65个抽样点中52个合格,合格率80.00%,乡镇医院53个抽样点中22个合格,合格率41.51%。问城乡医院空气消毒合格率是否不同?表5城乡医院空气消毒合格率的比较采用χ2检验=18.50第18页,讲稿共40页,2023年5月2日,星期三
例8某医生用两种疗法治疗某病,结果如表6,问可否认为新疗法优于传统疗法?表6两种疗法治疗某病治愈率比较=7.47第19页,讲稿共40页,2023年5月2日,星期三3、行×列表(R×C表)资料的χ2检验
行×列表资料即基本数据在四个以上,如多个率的比较,其基本数据为R行×2列;两组构成比的比较,其基本数据为2行×C列;多组构成比的比较,其基本数据为R行×C列。检验统计量计算公式为:,[υ=(R-1)(C-1)]其应用条件是T<5的格子数不超过1/5和没有任意格的T<1。如果出现上述情况应作如下处理:①根本办法是增加观察例数,使各格基本数据增大;②将T较小的行或列与性质相近的行或列作合理的合并。ROWCOLUMN第20页,讲稿共40页,2023年5月2日,星期三
例9某地在流行性脑脊髓膜炎流行期间进行了带菌调查,结果如表7,问不同人群带菌率是否不同?
表7某地流行性脑脊髓膜炎流行期不同人群带菌率采用R×C表资料χ2检验。
第21页,讲稿共40页,2023年5月2日,星期三
设H0:四个人群带菌率相同,即
H1:四个人群带菌率不同或不全相同α=0.05
计算统计量χ2值
=18.17
确定P值,作结论:
查χ2界值表,按υ=(R-1)(C-1)求得υ=3,,因而P<0.005。按α=0.05水准,拒绝H0,可以认为不同人群带菌率不同或不全相同。
第22页,讲稿共40页,2023年5月2日,星期三
例10两个医院合作进行脑梗塞疗效试验中,各医院受试病例的脑梗塞部位如表8所示,问两所医院病例的梗塞部位的分布(构成比)是否不同?
表8甲乙两医院病例的脑梗塞部位的分布采用R×C表资料χ2检验。第23页,讲稿共40页,2023年5月2日,星期三
设H0:两所医院病例的梗塞部位的总体分布(构成比)相同
H1:两所医院病例的梗塞部位的总体分布(构成比)不同α=0.05计算统计量χ2值=14.29确定P值,作结论:查χ2界值表,按υ=(R-1)(C-1)求得υ=2,,因而P<0.005。按α=0.05水准,拒绝H0,可以认为两所医院病例的梗塞部位的分布(构成比)不同,因而可比性较差。第24页,讲稿共40页,2023年5月2日,星期三
例11某市和某两县进行地方性甲状腺肿普查,查出各型患者如表9,问三地间地方性甲状腺肿的型别构成是否不同?表9不同地区地方性甲状腺肿的型别分布检验方法同例10。
需注意,当的结论为差异显著时,只能认为各总体率(或总体构成比)之间总的说来有差别,而不能说明其彼此间都有差别,或某两者之间有差别。若要进一步分析此问题,需作χ2分割检验。第25页,讲稿共40页,2023年5月2日,星期三4、列联表资料的χ2检验
列联表资料是指对同一组观察资料分别用两种方法分类或处理,将所得的结果归纳成双向交叉排列表的资料。其中,2×2列联表为对同一个(或同一对)观察对象比较两种分类方法(或两种处理)结果有无差别和研究两种分类方法(或两种处理)结果间是否有关联;R×C列联表是检验两个变量间有无关联。分析目的不同,则检验方法不同,即所用检验统计量公式不同,检验假设亦有所不同。contingencytable第26页,讲稿共40页,2023年5月2日,星期三(1)2×2列联表资料的χ2检验
对同一个(或同一对)观察对象比较两种分类方法(或两种处理)结果有无差别时,检验统计量公式为:式中分子上的1为连续性校正数,若b+c>40时可以略去。
对同一个(或同一对)观察对象研究两种分类方法(或两种处理)结果间是否有关联时,检验统计量公式为:需注意,此时公式应用条件同前。上述两种情况分析目的不同,其检验假设亦不同。How第27页,讲稿共40页,2023年5月2日,星期三
例12为了研究两种培养基分离空肠弯曲杆菌的效果,将每份粪便标本分别接种于甲乙两种培养基共做50份培养结果如表10。
表10两种培养基培养50份标本培养结果表11两种培养基培养50份标本培养结果
此为同一标本用两种方法培养的配对设计,应列为2×2双向交叉分类表(即2×2列联表),如表11。表中每一格表示同一份标本两种培养基结果不同组合的实际对子数。应注意,若将表10数据归纳为下表的形式,是不能明确反映出同一标本两种培养结果的异同,而只是单独列出了每种培养基的培养结果,这就将配对设计归纳成了每组50份标本的两个独立的样本了,这是不恰当的。第28页,讲稿共40页,2023年5月2日,星期三两种方法检出结果差别的检验设
或b=c或b≠c
α=0.05计算统计量:确定P值,作结论:经查χ2界值表中,υ=1时,χ20.05,1=3.84,因而P>0.05,即P>α,因而不能拒绝H0,还不能认为两种培养基的检出率不同。第29页,讲稿共40页,2023年5月2日,星期三两种方法检出结果关联性检验设H0:两种培养基的培养结果无关联H1:两种培养基的培养结果有关联
α=0.05计算统计量:确定P值,作结论:
经查χ2界值表中,υ=1时,χ20.005,1=7.88,因而P<0.005,即P<α,因而拒绝H0,可以认为两种培养基的检出率有关联。从表内数据看检出结果一致率为(20+21)/50=82%。第30页,讲稿共40页,2023年5月2日,星期三例13某研究室用甲乙两种血清学方法检查410例确诊的鼻咽癌患者,得结果如表12,问两种检验结果间有无联系?有无差别?
表12两种血清学方法检验结果
相关性分析:χ2=38.85,υ=1,查χ2界值表得P<0.005,可以认为两种血清学方法检验结果间有联系。差别性检验:χ2=86.44,υ=1,查χ2界值表得P<0.005,可以认为两种血清学方法检出率不同,甲法阳性检出率较高。第31页,讲稿共40页,2023年5月2日,星期三
例14为了解巨细胞病毒感染情况,某医师分别采集了302对母亲与婴儿血清,并测定其IgM抗体,结果如表13。问母婴间血清IgM抗体检出是否相关?母婴间血清IgM抗体检出率有无差别?
表13302对母婴血清IgM抗体检测结果
本例,Tmin=1.02<5,故而在分析“是否相关”时采用四格表资料校正χ2检验得:χ2=142.318,υ=1,则P<0.005,可以认为母婴间血清IgM抗体含量有相关。在“有无差别”的分析中,χ2=2.50,υ=1,P>0.10,尚不能认为母婴间血清IgM抗体检出率有差别。第32页,讲稿共40页,2023年5月2日,星期三(2)R×C列联表资料的χ2检验
同一观察对象(或同一组观察人群)分别按两种分类变量的不同水平分组,若所分水平多于2个时,就可将观察结果归纳成R×C列联表,如例15中表14。其形式与前述R×C表资料类似,但其研究设计和分析目的是不同的。R×C列联表资料的χ2检验的分析目的是检验两个分类变量间有无关联,其检验统计量的计算仍用行×列表专用公式,即:第33页,讲稿共40页,2023年5月2日,星期三
例15某医师为研究肥胖程度与发胖年龄间的关系,观察了438名肥胖儿童青少年,结果如下表:
表14438名肥胖儿童青少年肥胖程度和发胖年龄
其检验假设为:Ho:肥胖程度与发胖年龄无关联H1:肥胖程度与发胖年龄有关联本例,χ2=40.95,υ=(4-1)(3-1)=6,查χ2界值表得χ20.005,6=18.55,则P<0.005,可以认为肥胖程度与发胖年龄间有关联性。第34页,讲稿共40页,2023年5月2日,星期三例16观察依沙酰胺治疗皮肤真菌感染效果的临床试验,结果如表15。试分析该病的疗效是否与病程有关?
表15依沙酰胺治疗皮肤真菌感染疗效
当获得两个变量间有关联时,若需进一步说明相关的密切程度,可计算列联系数,其计算公式为:P值在0-1之间,P越接近于1,关联性越强,即关系越密切;P越接近于0,则关联性越弱。本例χ2=24.64,P<0.005,Pearson列联系数=0.232。病程痊愈好转无效合计<1个月792481111个月--30131443个月-5年1028330215>5年29261065合计24014649435第35页,讲稿共40页,2023年5月2日,星期三例17某矿职工医院探讨矽肺不同期次患者的胸片肺门密度变化,把492名患者的资料归纳如表16。问矽肺患者肺门密度的增加与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论