07定性资料的分析_第1页
07定性资料的分析_第2页
07定性资料的分析_第3页
07定性资料的分析_第4页
07定性资料的分析_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章

定性资料的分析

样本率与总体率的比较两样本率的比较

多个率的比较

构成比的比较

配对设计两样本率的比较

两事件数的比较

定性资料假设检验的正确应用7.1样本率与总体率的比较

推断样本是否来自某已知总体

正态近似检验:np>5n(1-p)>5

可信区间估计:不符合上述条件(二项分布原理)样本率与总体率比较的正态近似检验0p例7.1据临床经验,一般的胃溃疡病患者有20%会出现胃出血症状。某医院观察了304例65岁的胃溃疡病患者,其中有96例发生胃出血,占31.58%,问老年患者是否较一般患者易出血?检验假设:

H0:=0,

老年胃溃疡病患者的胃出血率等于20%;H1:>0,

老年胃溃疡病患者的胃出血率大于20%。

单侧=0.05。

P<0.01,按=0.05水准拒绝H0,接受H1。认为老年胃溃疡病患者的胃出血率大于20%。

7.2两样本率的比较目的:推断两总体率是否相等

两样本率比较的u检验(utest)两样本率比较的2检验(chi-squaretest)两样本率比较的u检验当n1p1、n2p2、n1(1p1)、n2(1-p2)均大于5时,采用正态近似法,其中:pc=(X1+X2)/n

如果n较小,则可以用校正的u检验

而当n很小时(比如n≤40时),用确切概率法

两样本率比较的u检验例7.2

某医院肿瘤科3年来共治疗乳腺癌患者n=131例,每例均观察满5年,其中单纯手术治疗组观察n1=84例,存活x1=57例,存活率p1=67.9%,联合治疗(手术+术后化疗)组观察n2=47例,存活x2=39例,存活p2=83.0%,问两组存活率有无差别?本例中,已知:n1=84,X2=57,p2=67.9%n2=47,X2=39,p2=83.0%n1p1、n2p2、n1(1p1)、n2(1-p2)均大于5,

pc=(X1+X2)/(n1+n2)=(39+57)/(47+84)=0.733H0:两总体存活率相等,即1=2;H1:两总体存活率不等,即12。

=0.05。用正态近似检验,检验统计量u为:

P>0.05,按=0.05水准,不拒绝H0,差别无统计学意义。故尚不能认为单纯手术疗法与联合疗法对乳腺癌患者治疗效果有差别。

两样本率比较的2检验读作

chi2:卡方2检验(chi-squaretest)是现代统计学的创始人KarlPearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法。例7.2四格表(fourfoldtable)表1中间阴影部分的四个数据为基本数据,其余数据均由此四个数据派生出来,故称此种资料为四格表(fourfoldtable)资料。四格表资料比较的是两种处理的效果。每种处理只产生两种相互对立的结果,如生与死,有效与无效,患病与未患病,阳性与阴性,检出与未检出,等等。第一步:建立检验假设H0:两总体存活率相等,即1=2;H1:两总体存活率不等,即12。第二步:确定检验水准

=0.05(双侧检验)第三步:计算检验统计量

式中:A为实际频数(actualfrequency)

T为理论频数(theoreticalfrequency)要计算2统计量,必须先计算H0条件下的理论频数T

:在H0成立的条件下,即两样本来自同一总体,则可以用合计的存活率73.3%(即96/131)作为总体存活率的点估计;用合计的死亡率26.7%(即35/131)作为总体死亡率的点估计;。四格表的理论频数由下式求得

:式中:TRC为第R行C列的理论频数,

nR为相应的行合计,

nC为相应的列合计。

结合本例:第四步:确定P值,下结论由于四格表资料为双边固定形式,即假设行合计与列合计均固定,所以四格表的自由度ν=1a+1b-1c-1d+1由2界值表查得20.05,1=3.84,即理论上如果H0成立,则2有95%的可能在0~3.84之间,2>3.84的可能性只有0.05,是一小概率事件。本例2=3.52<3.84得P>

0.05。按=0.05水准不拒绝H0,差别无统计学意义。故尚不能认为单纯手术疗法与联合疗法对乳腺癌患者治疗效果有差别。基本思想概括若H0成立,则四个格子的实际频数A与理论频数T之差异纯系抽样误差所致,故一般不会很大,2值也就不会很大;在一次随机试验中,出现大的2值的概率P

是很小的。因此,若根据实际样本资料求得一个很小的P,且P≤

(检验水准),根据小概率原理,就有理由怀疑H0的真实性,因而拒绝它;若P>,则没有理由拒绝H0

四格表资料2检验专用公式

由于2分布是一种连续性分布,附表3中2界值是根据此连续性分布的理论公式计算出来的,但两个或多个率比较的原始数据却属定性资料,是不连续的,故式(7.5)只是一个近似计算公式。计算出来的2值往往偏大,相应的P值偏小,从而人为地增加了范第一类错误的机会。为纠正这种偏性,可采用校正2,用C2表示。四格表资料2检验的校正2检验的条件:n≥40且所有T≥5

2校正的条件:n≥40但有l≤T<5

当n和T过小,如T<1或n<40时因近似程度太差,不宜用2检验,而应改用确切概率法。四格表资料2检验的应用条件四格表资料2检验的校正公式H0:1=2;

H1:12。

=0.05。

本例a格的理论频数最小,T11=1216/41=4.68<5,n>40,故考虑用校正公式计算2值。按

=1查附表3,2界值表,得P>0.05,按

=0.05水准不拒绝H0,差异无统计学意义。故根据本资料尚不能认为两种疗法的总体缓解率有差别。u检验与2检验的关系两样本率比较时,如为双侧检验,则u检验和四格表2检验是等价的,即自由度为1的2=u2;校正u检验和四格表校正2检验也是等价的,应用条件亦相同。若为单侧检验,则用u检验较为方便。多(R)个率的比较,其基本数据有R行2列,构成R×2表,用以表述R个率的基本数据。R×2表的2检验用于推断R个样本率各自所代表的总体率是否相等。7.3多个样本率的比较

多个样本率的比较的公式

式中,A为第R行第C列对应的实际频数,nR为第R行的行合计,

nC为第C列的列合计,n为总样本含量。

例7.4某地调查了1995~1998四个年度中小学女生的贫血状况,

见表7.4,问各年度间学生贫血率有无差别?H0:四个年度学生的贫血检出率相等;H1:四个年度学生的贫血检出率不等或不全相等。

=0.05。ν=(4-1)×(2-1)=3。查附表3,2界值表,得P<0.005。按

=0.05水准拒绝H0,接受H1,差异有统计学意义。故可认为该地四个年份中小学女生贫血检出率不相等多个率的多重比较

当多个样本率比较的2检验,结论为拒绝H0时,只能认为各总体率之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别。若要进一步比较哪些率之间有差别,应进行多重比较。

构成比的比较

构成比(proportion)又称构成指标,表示某一事物内部各组成部分所占的比重或频率,常以百分数表示,计算公式为:

构成比有两个特点:各部分构成比的合计为1或100%事物内部某一部分的构成比发生变化时,其他部分也会相应发生变化多(R)个率的比较,构成R×2表如有R个都分为C类的构成比(R≥2,C≥3),则其基本数据有R行C列,组成R×C表,又称行×列表2×2表、R×2表是行×列表的特殊情形对多(R)个构成比检验的目的是推断各样本分别代表的总体构成比是否相同,用2检验。基本思想:首先假设各样本所代表的总体构成比相同,均等于合计的构成比,据此,可算得每个格子的理论频数(见表7.6括号内数据)。如果检验假设是真实的,则每一格子的理论频数与实际频数一般均不会相差很大,即2值一般不会很大;若根据样本信息算得一个很大的2值,则有理由怀疑H0的成立,进而拒绝它。

例7.6某市对城、郊区小学三~四年级学生营养状况进行了抽样调查,资料如表7.6试考察该地城、郊儿童营养状况的构成比有无差别?H0:城郊儿童营养状况的构成比相同;

H1:城郊儿童营养状况的构成比不同。

=0.05。按

=(3-1)(2-1)=2查附表3,2界值表,得P<0.05,按=0.05水准拒绝H0,接受H1,差异有统计学意义,可认为该市城郊两地儿童营养类型构成比不同。7.5配对设计两样本率的比较

配对四格表资料2检验的目的是通过对单一样本数据的分析,推断两种处理的结果有无差别。配对设计是医学研究中常用的设计方法之一,二分类结果资料的配对研究常用于比较两种检验方法、两种培养方法、两种提取方法等的差别。

配对设计的特点是对同一样本的每一份检品分别用甲、乙两种方法处理,观察其阳性与阴性例数。

当b+c>40时:直接计算2当20<b+c≤40时:计算2C当b+c≤20时:计算确切概率配对2检验的应用条件例7.8用两种检验方法对某食品作沙门氏菌检验,结果如表7.9,试比较两种方法的阳性结果是否有差别。H0:两种检验方法的结果相同,即总体B=C;H1:两种检验方法的结果不同,即总体BC。=0.05。按

=1查2界值表,P<0.005。在=0.05水准上拒绝H0,接受H1,差异有统计学意义。可认为两法检验结果不同,荧光抗体法阳性结果高于常规培养法。7.8两事件数的比较

一般认为单位时间、空间或人群间某独立事件的发生服从Poisson分布,由第4.4节可知,当样本事件数大于50时,Poisson分布近似正态分布。因此,两事件数的比较可利用正态近似原理,采用u检验,目的是推断两个样本所代表的总体计数有无差别。例7.12分别用甲、乙两种培养基对同一水样作细菌培养,每份水样均取1ml,各培养8次,得细菌个数如下:甲培养基分别为7,5,6,7,4,5,3,6;乙培养基分别为9,8,8,10,7,7,7,9。试比较两种培养基的效果有无差别?H0:两培养基效果相同,1=2;H1:两培养基效果不同,1≠2。=0.05。据题意,本例为观察单位相同(均为1ml水样)的有重复试验,且重复次数亦相同(n1=n2=8)。故以式(7.19)求u值。因,故P<0.05,按=0.05水准拒绝H0,接受H1,差异有统计学意义,两种培养基效果不同。结合资料可认为乙培养基培养效果较好。例7.13某车间在改革生产工艺前,测取三次粉尘浓度,每升空气中分别有38、39、36颗粉尘;改革生产工艺后,测取两次,分别有25、18颗粉尘。问工艺改革前后粉尘颗粒有无差别?

H0:工艺改革前后

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论