计数资料的统计描述课件_第1页
计数资料的统计描述课件_第2页
计数资料的统计描述课件_第3页
计数资料的统计描述课件_第4页
计数资料的统计描述课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计数资料的统计描述计数资料的统计描述主要内容一、常用相对数二、应用相对数的注意事项三、动态数列四、常用疾病统计指标五、计数资料的统计推断计数资料的统计描述年龄工人管理人员农民商业服务无知识分子总计182000305209261018045222871024701115024503428521534436126504325451337036628343510347857248301114112239171143214231424360344253122283621145114383110218400020002合计2071411022085372061401按某种属性分类,然后清点每类的数据。如按年龄(2岁一组)与职业整理。计数资料的数据整理计数资料的统计描述为什么引入相对数?

绝对数的局限性。计数资料的统计描述相对数的概念:两个有联系的(数值)指标之比。相对数的种类:比:1.构成比

2.相对比

3.率重要区别:分子、分母计数资料的统计描述率(rate):说明某现象或某事物发生的频率或强度。率=(实际发生数/可能发生总数)×比例基数

比例基数:100%、1000‰、10000/万、

100000(1/10万)等。如:发病率、死亡率、发生率、阳性率、患病率等。

注意:不受其它指标的影响;各率相互独立,其之和不为1(如是则属巧合);一、常用相对数(relativenumber)指标计数资料的统计描述某地某年四种常见心血管病死亡率计数资料的统计描述构成比(proportion):说明某一事物内部,各组成部分所占的比重。也叫百分比。构成比=(某部分观察单位数/各组成部分观察单位总数)×100%

如:教研室16人中高级职称有4人,占20%。

注意:各组成部分的构成比之和为100%某一部分比重增大,则其它部分相应减少。常用相对数(relativenumber)指标计数资料的统计描述相对比(relativeratio):是A、B两个有关指标之比,说明A是B的若干倍或百分之几,通常用倍数或分数表示。如:男:女、医生:护士、教师:学生注意:1.A、B可以相同,也可以不同

2.A、B可以是绝对数,也可以是相对数常用相对数(relativenumber)指标计数资料的统计描述率与构成比率构成比概念发生的频率或强度各组成部分所占的比重强调点随机发生事件各部分的构成资料获得较难容易特点不一定合计为100%计数资料的统计描述

年龄组⑴

受检人数⑵白内障例数⑶

患者年龄构成比(%)⑷

患病率(%)⑸=(3)/(2)40~50~60~70~≥80合计5604412961492268129135971915.1828.7930.1321.654.2412.1429.2545.6165.1086.36

1468448100.0030.52率与构成比的例子计数资料的统计描述1.不能以构成比代替率。2.计算相对数的分子不宜过小。小则直接叙述。3.进行率的对比分析时,应予注意资料可比性。两个率要在相同的条件下进行。研究方法相同、研究对象同质、观察时间相等、地区、民族、年龄、性别等。4.正确求平均率。例:若P1=x1/n1;P2=x2/n2;P3=x3/n3

P=(x1+x2+x3)/n1+n2+n3)(正确)

P=(P1+P2+P3)/3(错误)5.假设检验:遵循随机抽样原则,进行差别显著性检验。二、应用相对数的注意事项计数资料的统计描述例子

例1.在进行某遗传病的研究中,一研究人员发现,在该病患者中,有90%是第一个孩子,由此可见该病的遗传与出生顺序有关---更容易遗传给第一个孩子。这个结论是否正确,为什么?例2.该县为提高医疗卫生的服务水平,对卫生人员进行培训,但是,经过1年培训,与培训前相比,该县孕产妇的死亡率却升高,统计学检验差异有显著性。如何解释?培训前:2000孕产妇100/10万(死亡2人)

培训后:2010孕产妇149/10万(死亡3人)计数资料的统计描述概念:按照一定的时间顺序,将某事物的统计指标依次排列起来,以便于观察和比较该事物在时间上的发展变化趋势。常用指标:1.绝对增长量:说明事物在一定时期内所增长的绝对数量(累计增长量、逐年增长量)。2.定基比发展速度:统一某个时间的指标作基数,其它各时间的指标与之相比3.环比发展速度:以前一个时间的指标作基数,相邻的后一个指标与之相比。三、动态数列计数资料的统计描述四、常用疾病统计指标1.发病率2.患病率3.某病病死率4.治愈率5.有效率计数资料的统计描述1.发病率(incidencerate)概念:表示在观察期内,可能发生某种疾病的一定人群中新发生该病的频率。计算公式:某病发病率=×K在通常情况下,发病率的分母泛指一般平均人口数。意义:发病率是反映某病在人群中发生频率大小的指标,常用于衡量疾病的发生,研究疾病发生的因果关系和评价预防措施的效果。计数资料的统计描述2.患病率(prevalencerate)概念:表示在某时点检查时可能发生某病的一定人群中患有某病的频率。计算公式:

其中某病病例数包括新病例和旧病例,凡患该病的一律统计在内。同一人不应同时成为同一疾病的两个病例。这一指标最适用于病程较长的疾病的统计研究,用于衡量疾病的存在,反映某病在一定人群中的流行规模或水平,估计医疗设施的需求量。计数资料的统计描述3.某病病死率(casefatality)概念:在规定的观察时间内,某病患者中因该病而死亡的频率。计算公式:某病病死率=上式分母中患病情况不同,指标的概念也不同。如住院病人的病死率,分母为出院人数。某一地区某病病死率的分母则包括该地区所有患该病的病人。故医院的病死率不能代表地区的病死率。计数资料的统计描述治愈率概念:接受治疗的病人中治愈的频率。治愈率=(治愈病人数/受治病人数)×100%有效率概念:接受治疗的病人中治疗有效的频率有效率=(治愈有效病人数/受治病人数)×100%注意比较时:明确的标准;可比性。4.治愈率、有效率计数资料的统计描述率的抽样误差与可信区间率的统计学推断1.样本率与总体率比较的u检验2.两个样本率比较的u检验卡方检验1.卡方检验的基本思想2.四格表专用公式3.连续性校正公式4.配对四格表资料的χ2检验5.行×列(R×C)表资料的χ2检验五、计数资料的统计学推断计数资料的统计描述(一)率的抽样误差与可信区间

1.率的抽样误差与标准误

2.总体率的可信区间计数资料的统计描述1.率的抽样误差与标准误

样本率(p)和总体率(π)的差异称为率的抽样误差(samplingerrorofrate),用率的标准误(standarderrorofrate)度量。如果总体率π未知,用样本率p估计计数资料的统计描述标准误的计算计数资料的统计描述2.总体率的可信区间

总体率的可信区间(confidenceintervalofrate):根据样本率推算总体率可能所在的范围计数资料的统计描述(二)率的统计学推断1.样本率与总体率比较u检验2.两个样本率的比较u检验计数资料的统计描述1、样本率与总体率比较的u检验u检验的条件:np

和n(1-p)均大于5时计数资料的统计描述2.两个独立样本率比较的u检验表5-1两种疗法的心血管病病死率比较疗法死亡生存

合计病死率(%)盐酸苯乙双胍26(X1)178204(n1)12.75(p1)安慰剂2(X2)6264(n2)3.13(p2)合计2824026810.45(pc)u检验的条件:n1p1和n1(1-p1)与n2p2和n2(1-p2)均>5计数资料的统计描述小结

1.样本率也有抽样误差,率的抽样误差的大小用σp或Sp来衡量。

2.率的分布服从二项分布。当n足够大,π和1-π均不太小,有nπ≥5和n(1-π)≥5时,近似正态分布。

3.总体率的可信区间是用样本率估计总体率的可能范围。当p分布近似正态分布时,可用正态近似法估计率的可信区间。

4.根据正态近似原理,可进行样本率与总体率以及两样本率比较的u检验。计数资料的统计描述率的u检验能解决以下问题吗?

率的反应为生与死、阳性与阴性、发生与不发生等二分类变量,如果二分类变量为非正反关系(如治疗A、治疗B);反应为多分类,如何进行假设检验?率的u检验要求:n足够大,且nπ≥5和n(1-π)≥5。如果条件不满足,如何进行假设检验?

计数资料的统计描述(三)卡方检验

χ2检验(Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。本章仅限于介绍两个和多个率或构成比比较的χ2检验。计数资料的统计描述1.卡方检验的基本思想(1)疗法死亡生存

合计病死率(%)盐酸苯乙双胍26(a)178(b)204(a+b)12.75(p1)安慰剂2(c)62(d)64(c+d)3.13(p2)合计28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)表5-2两种疗法的心血管病病死率的比较实际频数A(actualfrequency)(a、b、c、d)的理论频数T(theoreticalfrequency)(H0:π1=π2=π):a的理论频数=(a+b)×pc=(a+b)×[(a+c.)/n]=nRnC/n=21.3b的理论频数=(a+b)×(1-pc)=(a+b)×[(b+d.)/n]=nRnC/n=182.7c的理论频数=(c+d)×pc=(c+d)×[(a+c)/n]=nRnC/n=6.7d的理论频数=(c+d)×(1-pc)=(c+d)×[(b+d.)/n]=nRnC/n=57.计数资料的统计描述1.卡方检验的基本思想(2)

各种情形下,理论与实际偏离的总和即为卡方值(chi-squarevalue),它服从自由度为ν的卡方分布。计数资料的统计描述χ2检验的基本公式

上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行×列表”。计数资料的统计描述2.四格表专用公式(1)

为了不计算理论频数T,可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:计数资料的统计描述2.四格表专用公式(2)

2(1)~u2

=2.19492=4.82(n>40,所有T

5时)计数资料的统计描述3.连续性校正公式(1)

χ2分布是一连续型分布,而行×列表资料属离散型分布,对其进行校正称为连续性校正(correctionforcontinuity),又称Yates校正(Yates'correction)。⑴当n≥40,而1≤T<5时,用连续性校正公式⑵当n<40或T<1时,用Fisher精确检验(Fisherexacttest)校正公式:计数资料的统计描述3.连续性校正公式(2)因为1<T<5,且n>40时,所以应用连续性校正χ2检验计数资料的统计描述4.配对四格表资料的χ2检验计数资料的统计描述配对四格表资料的χ2检验也

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论