第三章定性资料的统计描述(7版)_第1页
第三章定性资料的统计描述(7版)_第2页
第三章定性资料的统计描述(7版)_第3页
第三章定性资料的统计描述(7版)_第4页
第三章定性资料的统计描述(7版)_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章定性变量的统计描述郑辉烈ncuwstj@aliyun.com第一节定性变量的频率分布定性变量的资料经过分类汇总整理的频数表称为频率分布表。定性变量从形式上可分为多分类变量和二分类变量。一、多分类变量的频率分布例3-1某课题组为了解城乡居民慢性病的患病情况,于2010年对某地区城乡25个社区的居民进行了调查。课题组对调查数据通过核查整理,将1381例被访者和284例慢性病患者按职业分组制成频数表(表3-1),用频率指标表示其频率分布。1)频率分布表2)频率分布图——百分条图或圆图百分条图2)频率分布图——百分条图或圆图圆图二、二分类变量的频率分布对于例3-1中的资料,试用频率指标表示被访者是否患病的分布,以及不同职业被访者是否患病的分布。1)频率分布表2)频率分布图——直条图单式直条图2)频率分布图——直条图复式直条图第二节常用的相对数指标相对数指标有三种类型:

频率型指标—频率(frequency)

强度(intensity)

相对比(relativeratio)。相对数应与绝对数结合使用。一、频率型指标频率型指标是最常见的,通常近似地反映某一事件发生的机会大小,即频率。如患病率、治愈率等。计算公式:分子是分母的一部分;无量纲,在0~1范围内取值;K是比例基数,通常取为100%,或1000‰、10000/万和100000/10万等,根据习惯用法来决定。二、强度强度型指标通常是指单位时间内某事件发生的频率。比例基数K同上。如人时发病率的分子是新发生的事件数,分母是人时数(观察人数乘以时间)的总和,多用于大人群长时间随访的资料。或例3-2某企业2003年有2839名职工,该企业每年都对职工进行体检,这一年新发生高血压病人5例,2003年的高血压发病率?例3-3为探讨EB病毒与鼻咽癌发病的关系,研究者在某市进行了EB病毒抽样调查,共检查25~70岁居民41471人,其中38550人EB病毒抗体阴性,2921人阳性。以EB病毒抗体阴性和阳性者形成两个组,进行了为期12年的队列研究,两组分别随访了437579人年和20477人年,EB病毒抗体阴性组共发生鼻咽癌54例,阳性组57例。试计算两组的人时(或人年)发病率。EB病毒阴性人群的人时发病率为:EB病毒阳性人群的人时发病率为:三、相对比相对比型指标是指两个有关联的指标A与B之比,通常以倍数或百分数表示,简称为“比”(ratio)。它表示相对于B的一个(或十个、百个、千个等)单位,A有多少个单位。A和B可以是绝对数、相对数和平均数,A和B的量纲可以不同,也可相同,但A和B互不包含。计算方法:最常见的相对比是人口学中的男女性别比;在医疗卫生工作中,反映卫生资源的指标如每千人口的医生数、每千人口的病床数、每医生的门诊工作量等都是相对比。流行病学中的相对危险度RR=P1/P0和优势比OR=病例组的优势/对照组的优势=(a/b)/(c/d)=(ad)/(bc)都是相对比指标例3-4根据例3-3的计算可得:P0=12.34/10万人年,P1=278.36/10万人年,试计算EB阳性组人群与阴性组人群鼻咽癌发病的相对危险度?RR=P1/P0=278.36/12.34=22.561)准确理解相对数的含义,防止概念混淆;2)频率型指标的解释要紧扣计算指标时的总体范围(分母)及指标描述的属性(分子);3)计算相对数时分母应有足够数量;如果资料的总例数过少,计算的偏差可能会很大。在动物实验中,如果有周密的设计和严格的质量控制,数量可相对少一些。四、应用相对数时的注意事项4)正确地合并估计频率(或强度)型指标当分组的资料需要合并起来估计频率或强度时,应将计算各组所用的分子相加作为合并估计的分子,将各组的分母相加作为合并估计的分母。不可将分组的频率或强度取平均数作为合并的频率或速率。5)相对数间的比较要具备可比性主要应注意以下几个方面:(1)观察的对象是否同质,研究的方法(如检测手段、抽样方法)是否相同,观察的时间是否一致等;(2)对比不同时期的资料时应注意客观条件是否相同;(3)观察对象重要属性的分布是否相同,如若不同,则要采用标准化法或多因素分析方法来校正比较组间观察对象属性分布不同对研究结果的影响。6)对相对数的统计推断在随机抽样的情况下,从样本估计值推断总体的相对数应当考虑抽样误差,因此原则上需要进行参数估计和假设检验。但是,对相对比的统计推断非常困难;对强度型指标的统计推断也不太容易;而对频率分布作统计推断的理论和技术却比较成熟。第三节医学人口统计常用指标一、医学人口统计资料的来源(一)日常工作记录(报告单、卡、册)(二)统计报表(三)人口调查:普查和抽样调查二、描述人口学特征的常用指标(一)人口总数(万人)指一个国家或地区在某一特定时间的人口数,一般采用一年的中点进行统计。表Ⅰ各人口普查年我国人口城乡和性别分布(二)人口学特征指标人口学的基本特征包括性别、年龄、文化职业等,其中最常用来描述人口结构的是年龄和性别。将人口的性别、年龄分组数据,以年龄为纵轴,人数或百分比为横轴,左侧为男,右侧为女绘制而成的图形称之为人口金字塔。

人口金字塔的形状是长期以来人口的出生、死亡、迁入、迁出而形成,一般变化缓慢,但相隔数十年其也会有明显的变化。人口金字塔常用的人口学特征统计指标见表3-5。三、生育和人口死亡的常用指标(一)有关生育的常用指标测量生育水平的统计指标测量人口再生育的统计指标1)测量生育水平的统计指标2)测量人口再生育的统计指标自然增长率(NIR):粗出生率(CBR)与粗死亡率(CDR)之差,即NIR=CBR-CDR。粗再生育率(GRR):是指每个妇女一生平均生育的女儿数,GRR=总和生育率×女婴占出生婴儿的比例。净再生育率(NRR):在粗再生育率的基础上扣除了母亲一代所生的女儿中0~49岁的死亡数,剩下的即为真正能取代母亲一代的女儿数。(二)死亡统计指标测量死亡水平的指标反映死因构成及死因顺位的指标常用的人口死亡统计指标表3-7人口死亡统计指标指标分子分母基数类型粗死亡率同年内死亡人数年平均人口数×1年1000‰强度型(近似)年龄别死亡率同年年龄组死亡人数同年年龄组平均人口数×1年1000‰强度型(近似)婴儿死亡率同年<1周岁死亡人数同年活产儿总数1000‰频率型(近似)新生儿死亡率同年<28天死亡人数同年活产儿总数1000‰频率型(近似)围生儿死亡率同年围生期死胎数+死产数+<7天死亡人数同年围生期死胎数+死产数+活产数1000‰频率型(近似)5岁以下儿童死亡率同年5岁以下儿童死亡数同年活产儿总数1000‰相对比孕产妇死亡率同年孕产妇死亡数同年活产儿总数10万/10万相对比死因别死亡率同年内某原因死亡人数同年平均人口数×1年10万/10万强度型(近似)某病病死率同年某病死亡人数同年患该病总数100%频率型(近似)死因构成比同年某死因死亡数同年内死亡总数100%频率型(近似)死因构成及死因顺位举例第四节疾病统计常用指标疾病统计资料的来源疾病报告和报表资料医疗卫生工作记录疾病专题调查资料一、疾病和死因分类国际疾病分类(InternationalClassificationofDiseases,ICD)现在使用ICD的第10次修订本:ICD-10

二、疾病统计指标第五节粗率的标准化法一、标准化法的意义和基本思想

当两组个体的年龄,性别,病情等变量在组内的分布存在差异时,则粗死亡率,粗发病率,粗治愈率等不能直接进行比较。此时,必须消除这种内部构成上的差异,才能进行比较。通过选择一个“标准”,消除比较组间影响比较结果的内部构成的差异,使组间具有可比性,从而能将组间指标的差异归因于组别的不同(即归因于研究因素的作用),而不是其它非研究因素在组内的分布不同所导致。二、标准化率的计算

标准化率(standardizedrate)亦称调整率(adjustedrate),标准化率不能反映率的实际水平,它只表明相互比较资料的相对水平。常用的标准化率的计算方法有两种:即直接法和间接法。1.直接标准化法标准人口的确定:(1)任选两组观察对象之一,作为共同标准。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论