第11章 计数资料的统计推断课件_第1页
第11章 计数资料的统计推断课件_第2页
第11章 计数资料的统计推断课件_第3页
第11章 计数资料的统计推断课件_第4页
第11章 计数资料的统计推断课件_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第11章计数资料的统计推断第11章计数资料的统计推断第11章计数资料的统计推断学习目标1.掌握率的抽样误差、率的标准误的概念,计数资料的x2检验的方法及应用条件2.熟悉率的标准误的计算和用途3.了解率的u检验的方法和应用条件第11章计数资料的统计推断主要内容一、率(或构成比)的抽样误差和标准误二、总体率(或构成比)的估计:点估计、区间估计三、总体率(或构成比)的假设检验

1.率(或构成比)的检验

2.x2检验四、假设检验的注意事项第11章计数资料的统计推断统计推断用样本信息推论总体特征的过程。包括:参数估计:

运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。第11章计数资料的统计推断第1节率的抽样误差与标准误第11章计数资料的统计推断

由于抽样引起样本率和总体率或样本率与样本率之间的差异称为率的抽样误差。当总体率接近0.5,n>50时,样本率的分布趋向正态分布,此时率的标准误性质与均数的标准误相同。率的标准误是表示抽样误差大小的指标,用σP表示,计算公式为:

式中σP

为率的标准误,为总体率,n为样本例数,当总体率不知时可用样本率作总体率的估计值,公式为:式中Sp为率的标准误,P为样本率,n为样本例数。第11章计数资料的统计推断

例如:某市血液中心对2196名无偿献血者进行HbsAg检查,结果有138人检出HbsAg阳性,阳性率6.28%,求标准误,代入公式:

第11章计数资料的统计推断率的标准误的应用表示抽样误差的大小

率的标准误小,说明抽样误差小,表示样本率与总体率越接近,用样本率推断总体率的可靠性越大。反之,率的标准误越大,表示样本率离总体率较远,用样本率推断总体率的可靠性小。医学文献上常用P±SP表示资料的可靠性。例如,上例样本率的可靠性可表示为6.28%±0.52%。用以估计总体率的可信区间

当样本含量足够大,且样本率P和(1-P)均不太小,如nP与n(1-P)均≥5时,样本率的分布近似正态分布,可用正态分布规律估计总体率的可信区间。公式为:总体率95%可信区间=P±1.96Sp

总体率99%可信区间=P±2.58Sp第11章计数资料的统计推断

如上例无偿献血者HBsAg阳性率为6.28%,标准误为0.52%,则所有无偿献血者HBsAg总体率的95%和99%可信区间为:总体率95%可信区间=6.28%±1.96×0.52%=

5.26%~7.30%

总体率99%可信区间=6.28%±2.58×0.52%=4.94%~7.62%用于率的假设检验:见计数资料的假设检验(如率的u检验)。两率差异的假设检验。第11章计数资料的统计推断第2节率的u检验第11章计数资料的统计推断总体率(或构成比)的假设检验当两个样本率不同时,有两种可能:(1)P1,P2所代表的总体率相同,由于抽样误差的存在,造成的不同,这种差别在统计上叫差别无统计学意义。(2)P1,P2所代表的总体率不同,即两个样本来不同的总体,其差别有统计学意义。现在就是要用统计学的方法进行判断到底属于那种情况。第11章计数资料的统计推断

样本率与总体率或样本率与样本率进行比较时,也要考虑差异是否由抽样误差所致,大样本时,样本率的频数分布近似正态分布,故可用u检验,其假设检验的原理、步骤及方法与均数的u检验相同。样本率与总体率的比较计算公式如下:

式中P为样本率,σP为总体率的标准误,

π0为已知的总体率,n为样本含量。率的u检验第11章计数资料的统计推断

例11.5某病的年发病率对全国人口来说为8.72%。现在某县回顾一年,抽样调查了120人,有16人发该病。问该县该病的发病率是否高于全国该病的发病率?建立假设:H0:π=π0

,H1:π

≠π0

α=0.05

计算u值:u=

确定P值:本例1.79<1.96,故P>0.05,差异无显著性。判断结果:按α=0.05水准,拒绝H0,接受H1,可以认为某县该病的发病率与全国该病的发病率没有差别。第11章计数资料的统计推断两个样本率的比较计算公式如下:

式中P1、P2为样本率,SP1-P

2

为两样本率之差的标准误,PC为合并样本率,n1和n2

分别为两样本含量,X1和X2分别为两样本的某类发生数。

第11章计数资料的统计推断例11.6

某医师用某新药治疗类风湿关节炎,结果见右表,问两组治疗效果有无差别?建立假设:H0:π1=π2

H1:π1

≠π2

α=0.05

计算u值:确定P值:查u界值表,u0.001=3.29,现u>u0.001,差异有极显著性

判断结果:按α=0.05

,拒绝H0,接受H1

,可以认为两组有效率的差别有统计学意义,治疗组治疗效果比对照组好。

某新药治疗类风湿关节炎的疗效观察人数有效倒数有效率%治疗组14812785.81

对照组753648.00

合计22316373.09第11章计数资料的统计推断第3节卡方检验第11章计数资料的统计推断x2检验是一种用途较广的假设检验方法,它主要用于计数资料的统计处理,如用来检验两个率或多个率、两个或多个构成比之间的差别等。例如:调查1990年某山区不同年龄组蛔虫感染情况,见下表,问两组的蛔虫感染率有无差别?某山区不同年龄组蛔虫感染率比较组别感染人数未感染人数合计

1~14666(a)126(b)79215岁以上1288(c)497(d)1782

合计19546202574

表中a、b、c、d四个格子的数据是整个表的基本数据,其余数据是从这四个数据推算出来的,这种资料称为四格表资料,或称为2×2列联列表,是卡方检验方法中检验两种资料差异显著性的基本工作表。第11章计数资料的统计推断卡方检验的四种计算方法x2检验的基本公式:

四格表专用公式:行×列表公式:配对资料的x2检验:第11章计数资料的统计推断卡方检验的基本公式

x2检验的基本公式:

检验的基本思想:公式中A为实际观察值,T为理论值,它是根据检验假设来确定的,假设各样本率或比所属总体的率或比相同(H0)。如果这一假设成立,则各样本率或比就应该比较接近,实际数和理论数就不会相差太大,计算的x2值就比较小;反之计算的x2值就大。因此,x2值反映了实际数与理论数吻合的程度,但是x2值的大小,除决定于A-T的差值外,还取决于格子数(严格说是自由度)的多少,因为各格的(A-T)2/T

都是正值,故格子数越多,x2值也越大。只有排除了这种影响,x2值才能正确反映A和T的吻合程度,所以在查x2值表时必须考虑自由度的大小。第11章计数资料的统计推断检验步骤:建立假设:H0:π1=π2H1:π1

≠π2

α=0.05

计算各格子理论数:

TRC式中为行与列的格子内理论数,nR为相应行的合计数,nC为相应列的合计数。第1行第1列格子的T:

第1行第2列格子的T:

T

12=208-13.21=194.79

表11-3-2两组抗-HCV阳性率比较

组别+-合计

性乱者18(13.21)190(194.79)208

献血员2(6.79)105(100.21)107

合计20295315第11章计数资料的统计推断

第2行第1列格子的T:

T21=20-13.21=6.79

第2行第2列格子的T:T22=107-6.79=100.21

因为表中每行每列的合计是固定的,只要求得其中一格理论数,其余三格可利用同行或同列的合计数相减而求出。计算x2值:确定P值:υ

=(行数-1)(列数-1)=(2-1)(2-1)=1

x20.05,1=3.84,x20.01,1=6.63

本例3.84<5.46<6.63,故0.05<P<0.01,差异有极显著性判断结果:按α=0.05

水准,拒绝H0

,接受H1

,可以认为两组抗-HCV阳性率有差别,性乱者抗-HCV阳性率高于献血员。第11章计数资料的统计推断四格表专用公式公式为:

式中a、b、c、d分别代表四个格子的实际数,现仍以例为例11.7

,见表11-3-2,代入公式:

计算结果与基本公式一致。第11章计数资料的统计推断

应用基本公式和四格表资料专用公式的条件是n≥40,且T≥5。当n≥40,但1≤T<5时,应使用校正公式,否则会使卡方值偏大而造成结论错误。

校正公式:四格表校正公式第11章计数资料的统计推断建立假设:H0:π1=π2H1:π1

≠π2

α=0.05

计算各格子理论数(见表中):计算x2值:本例有两个格子的理论数小于5,且n>40,故应用校正公式:确定P值:

υ=(2-1)(2-1)=1,x20.05,1=3.843.62<3.84,故P>0.05差异无显著性判断结果:按α=0.05

,不拒绝H0,还不能认为甲、乙两零售点猪肉表层沙门菌带菌率不同。本例如不进行校正,x2=5.49,P<0.05,得出相反结论。例11.8某地对甲、乙两零售点的猪肉进行抽查,检查其表层沙门氏菌带菌情况如下表。试问甲、乙两零售点的猪肉表层沙门菌带菌率有无差别?甲、乙两零售点猪肉表层沙门菌的带菌率采样地点阳性例数阴性例数合计带菌率(%)甲两零售点226287.14甲两零售点591435.71

合计7354216.67第11章计数资料的统计推断配对资料的卡方检验

和计量资料一样,计数资料也可采用配对的方式进行比较,此时可用配对资料的x2检验。计算公式:

当b+C≥40时:

当b+C<40时:第11章计数资料的统计推断

例11.9某研究室用甲、乙两种血清学方法检查410例确诊的鼻咽癌患者,结果见下表。问两种方法检验结果或检出率间有无差?

两种血清学检验结果

乙法

+-

+

261110371

-83139

合计269141410从表中可看出结果有四种情况:a:两组均阳性的对子数为(++)b:甲法阳性,乙法阴性的对子数为(+-)c:甲法阴性,乙法阳性的对子数为(-+)d:两组均均阴性的的为(--)a和d是两种结果相同部分b和c为不相同部分,可用b与c的差别来比较两总个率有无差别。合计甲法

+-+ab

-cd第11章计数资料的统计推断检验步骤:建立假设:H0:b=c

H1:b≠cα=0.05计算x2值:本例b+c>40,不用校正公式:确定P值:υ=(2-1)(2-1)=1,

x20.05,1=3.84,x20.01,1=6.63

x2

>x20.01,1,P<0.01

差异有极显著性判断结果:按α=0.05,拒绝H0,接受H1,可认为甲、乙两种血清学阳性检出率有差别。第11章计数资料的统计推断行×列表资料的卡方检验

上面所述的四格表是x2检验中最简单的一种形式,当资料的基本数据的行数或列数大于2时,通称行×列表,简记R×C,主要用于多个率或比的比较。为了省去计算理论数的麻烦,可用行×列表的专用公式:第11章计数资料的统计推断建立假设:

H0:π1=π2=π3=π4H1:π1

≠π2

≠π3

≠π4

α=0.05

计算x2值:

确定P值:υ=(R-1)(C-1)=(4-1)(2-1)=3

x20.05,3=7.811.84<7.81,得P>0.05。无显著性差异

例11.11某医院研究急性白血病患者与慢性白血病患者的血型构成情况,其资料如下表,试问两组血型构成比是否相同?

急性与慢性白血病患者的血型构成

血型急性组慢性组合计

A5843101B492776O593392AB18826

合计184111

295

判断结果:

在α=0.05水准上,不拒绝H0

,尚不能认为急性白血病患者与慢性白血病患者血型的构成不同。

第11章计数资料的统计推断行×列表卡方检验注意事项

在行×列表中,如果有1/5以上格子的理论数小于5,或有任一格子理论数小于1时,不能直接用基本公式或专用公式,可用以下方法处理:

扩大样本含量;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论