常用流行病学研究方法_第1页
常用流行病学研究方法_第2页
常用流行病学研究方法_第3页
常用流行病学研究方法_第4页
常用流行病学研究方法_第5页
已阅读5页,还剩212页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

预防医学,第四章 常用流行病学研究方法,案例 1,1959年至1961年间,西欧诸国特别是西德与英国,新生儿短肢畸形明显增加,形成了一次先天性短肢畸形的流行。流行期间,估计新发病例高达万例,遗留数千残疾儿童。什么原因导致了这一震惊世界的灾难性事件,众说纷纭产妇孕期病原微生物感染?产妇孕期某种化学物质中毒?遗传?经流行病学调查,认定孕妇妊娠 期间服用反应停是罪魁祸首,流行病学家是如何确定因果关系的?,案例 2,流感来袭,人们对该病的治疗有不同观点崇尚中医者认为吃点连花清瘟颗粒效果就不错相信西医者则认为达菲加水杨酸类药物治疗效果更好,西药比中药治疗效果好吗?,学习目的,通过本章的学习,要求学生能够:熟悉流行病学研究设计的基本内容,以及现况研究、队列研究、病例对照研究、随机对照临床试验的实施方法;解释现况研究、队列研究、病例对照研究、随机对照临床试验的设计要点并能举例说明;定义本章涉及的所有概念;了解各种流行病学研究方法的样本含量计算方法、单因素统计分析方法及临床疗效评价的最新进展。,自由人类文明史以来,人类一直面临着疾病为何发生、如何预防等因果判断问题。在没有任何生物学实验技术的年代,通过对多个对象的观察获得简单的经验性的结论成为当时解答上述问题唯一可行的方法流行病学研究方法的雏形。,没有解决生物现象的或然性问题,无法辨别两事物间的伴随现象和复杂的因果关联,易产生错误判断。,几百年来,逻辑学的完善、广义因果律的出现、辩证唯物主义科学技术方法论的形成、数理统计学的发展皆为流行病学研究方法的形成提供了理论基础。,历经近200年的思考和探索,流行病学家终于根据上述理论,结合人类的生物学特征,提出了一套了解疾病分布规律、探讨因果关联的研究方法,使得以人群为基础的流行病学研究方法更科学、更具说服力;使得流行病学思想得以被广泛接受、学科得以确立。,20世纪中期开始,为适应多病因论的需求,在统计学的帮助下,流行病学群体研究方法又有了突飞猛进的发展。混杂因子、效应修饰因子的处理技术不断完善,解决了在多个病因存在的条件下生物现象的或然性问题及巧合现象,因果判断的能力进一步提升。既便没有实验室证据,流行病学的研究结果也会是真理性的。,在医学研究中,流行病学研究方法主要用于了解事件的分布特征、判断两个及两个以上事件之间是否有关联及关联性质和关联程度。如今,流行病学的群体研究方法已被医学各领域广泛应用,成为医学各学科不可或缺的研究方法。,第一节,流行病学研究设计的基本内容,各种研究方法的设计内容大体相同,无论进行何种流行病学研究,均应有系统的研究思路和可操作性的工作方案,一、查阅有关文献提出研究目的,研究的设计者需根据掌握的信息提出此次研究将说明的科学问题研究目的是什么。这是研究设计的首要前提,之后的所有设计思路都应围绕着这一前提而展开。,研究目的应该是具体的,可望又可及的,二、根据研究目的确定研究内容,确定研究内容时应注意:,三、结合具体条件选择研究方法,经过认真思考,设计者要在综合分析了右侧的问题后,在几类流行病学研究方法中选择既能实现研究目的又力所能及的研究方法用于本次研究。,哪些研究方法能回答本次研究所提出的问题?,根据现有的人力物力和条件你能采用哪种方法?,这些方法中哪种是回答该问题最适宜的方法?,四、按照研究方法确定研究对象,确定研究对象时要考虑,什么时间获取研究对象,什么方式获取研究对象,什么地点获取研究对象,抽样调查?,普查?,抽样方法?,样本含量?,四、按照研究方法确定研究对象,常用名词:目标人群(target population):研究结果能够适用和推论到的人群源人群(source population):目标人群中适合研究的人群,即能够产生合格的研究对象的人群。研究对象(study participants):来自源人群的直接用于研究的个体,由样本获得的研究结果能否推论至源人群乃至目标人群,都与研究对象的代表性有关。,五、根据研究内容设计调查表格,自评表:由被调查者根据要求自己填写调查表 他评表:调查者向调查对象提问或采集某些数据 后由调查者填写注意:调查者进行询问时,一般使用“标准化”调查,对所有调查对象应用同样的方式提出同样的问题。应尽量避免使用专业术语和使人反感的词句,问题不能带暗示。问句的措词要求明确、易懂,一个问题不可出现多种理解或不知如何回答的情况。,五、根据研究内容设计调查表格,备考项目:调查日期、调查员签名,调查对象的 调查表的内容 姓名、性别、住址、电话号码等 分析项目:研究依赖于该类项目的统计分析而产 生研究结果 注意:为便于计算机分析,调查表多采用编码调查表,在每个分析项目的右边画出方格,格内填写编码。也可将问题的各种可能答案罗列在调查表上,填表者从中选择一个最佳答案或多种答案。另一种方式是对问题的回答不加任何限制,连续变量,如身高、体重、血压等,均应采用该方式填写调查表。,六、控制研究过程保证研究质量,研究质量的高低取决于测量仪器的稳定性、调查对象的配合程度、调查者的工作能力和科学态度。应做到:调查开始之前培训调查员:要对调查材料保密、要有高度的工作责任心和实事求是的科学态度,还要有娴熟的业务技能。收集资料的方法一旦确定不得随意变动建立检查和监督机制组织者应具有良好的组织协调能力,七、理顺分析思路得出正确结论,先仔细检查原始资料的完整性和准确性:有漏项要补充,有错误无法纠正的应予以剔除。理清统计分析思路:如何利用最适合的统计学方法说明最关键的医学问题绝不是一个单纯的统计学问题,需要依赖于统计学、逻辑学和医学三方面知识的完美结合。,总之,在研究的设计过程中,设计者面临着诸多抉择。只有时刻保持清晰的思路才能做出正确的判断,将研究引向成功。,第二节,描述性研究,一、概述,描述性研究(descriptive study)又称描述流行病学(descriptive epidemiology)描述流行病学可回答:事件存在于什么时间、什么地点、什么人群、数量多少?,是将专门调查或常规记录所获得的资料,按照不同地区、不同时间和不同人群特征分组,以展示该人群中疾病或健康状况的分布特点的一种观察性研究。,一、概述,描述性研究的资料来源: 现况研究专门设计的调查研究 生态学研究 个案调查 暴发调查 死亡报告 出生登记常规记录资料 出生缺陷监测 药物不良反应监测 疾病监测,二、现况研究,(一)现况研究的概念,现况研究是应用普查或抽样调查的方法收集特定时间、特定人群中疾病、健康状况及有关因素的资料,并对资料的分布特征加以描述。,二、现况研究,因为现况研究所获得的资料是在某一时间横断面上收集的,故又称横断面研究(cross sectional study)。又因它得到的率一般是在特定时间、特定人群中的患病率,因而又有患病率研究(prevalence study)之称。注意:现况研究强调在一定时间内完成,若调查的时间跨度过大,会给调查结果的解释带来困难。现况研究多适用于对病程较长、患病率较高的疾病进行研究。该方法虽然不能得到疾病的发病率,但利用间隔一年的两次现况研究获得的患病率之差可计算发病率。,二、现况研究,(二)现况研究的用途为病因研究提供线索了解疾病和病因的分布状况为疾病防制工作提供依据 评价预防疾病、促进健康的策略和措施的效果。早期发现病人:通过筛检可早期发现病人,实现早诊断、早期治疗的第二级预防的目的。确定机体各项指标的正常值范围,二、现况研究,(三)现况研究的种类1.普查(census) 普查分为以了解人群中某病的患病率、健康状况等为目的的普查和以早期发现病人为目的的筛检(screening)。注意:工作目的是早发现早诊断病人必须采用普查除有特殊需要流行病学研究一般都首选抽样调查方法,在特定时间对特定范围内人群中的每一成员进行的调查,二、现况研究,2.抽样调查(sampling survey)注意:样本代表性是抽样调查能否成功的关键所在随机抽样和样本含量适当是保证样本代表性的两个基本原则,按一定的概率从总体中随机抽取有代表性的一部分人(样本)进行调查,以样本统计量估计总体参数,称为抽样调查。,二、现况研究,随机抽样的含义:样本含量适当是指:,在一个有N个观察单位的总体中,若抽取n个单位组成随机样本,则每个单位被抽到的概率均应为n/N。,将样本的随机误差控制在允许范围之内时所需的最小样本含量。,二、现况研究,抽样调查的优点:工作量小,既可节省时间和人力、物力,又可集中力量将调查工作做得更细致,是现况研究最常用的方法。抽样调查的局限性:若疾病患病率很低、变异程度很大,则需很大样本含量方可实现对抽样误差的控制,若样本扩大到接近总体的75%时,不如直接进行普查更有意义。,二、现况研究,(1)常用的抽样方法单纯随机抽样(simple random sampling):也称简单随机抽样单纯随机抽样是所有抽样方法中最简单、最基本的方法。,该方法要求从总体N个对象中,利用抽签、随机数字表等方法抽取n个对象组成一个样本。,二、现况研究,优点:简便、易学。局限性:当总体较大时,不仅编号、抽样变得十分繁琐,而且抽到的个体分散,导致资料收集十分困难。由于这一缺陷,单纯随机抽样方法在大型流行病学调查中的应用受到了限制。,二、现况研究,系统抽样(systematic sampling):又称机械抽样具体方法:设总体单位数为N,需要调查的样本数为n,抽样比例K=N/n,抽样间隔为K1。即以K个单位为一组,用单纯随机抽样的方法抽出该组中一个单位,把它作为起点,之后每间隔K1个单位抽取一个单位进入样本。,是按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。,二、现况研究,例如:某人群有2万人,决定抽取1千个人组成样本,则K=20000/1000=20,抽样间隔20119,应从120号中按照单纯随机抽样的方法抽取1个号码作为起点,之后每隔19个号码抽取一个单位。注意:假如总体各单位的排列有某种规律,而该规律与研究结果有关,若利用该排列抽样,可使样本产生偏倚。例如:全班同学由矮到高排好队,按1/3比例做系统抽样,调查身体发育情况。若恰巧抽样起点是队列中的第一名,之后每间隔两人抽一人,该样本的平均身高应低于全班平均身高。,二、现况研究,优点:若研究总体已具备某种排序或编号,系统抽样与单纯随机抽样相比可省去编号和抽样的烦恼,是一种更简单的抽样方法。局限性:该方法同样具有当总体较大时,抽到的个体分散,资料难以收集的缺陷,也不适于大型流行病学研究。,二、现况研究,分层抽样(stratified sampling)例如:某地区要调查乙型肝炎表面抗原携带率,若不同职业间乙型肝炎表面抗原携带率差别很大,就可以按照职业将人群分成若干层,然后按照事先计算的样本含量在每层中随机抽取所需的调查对象。,将调查的总体按照某种特征分成若干层,然后在每层中进行随机抽样的方法。,二、现况研究,优点:可将一个内部变异很大的总体分成一些内部变异较小的层,并保证总体中每一层都有相应比例的个体被抽到,所以抽样误差较其它抽样方法小。局限性:该方法的抽样基础没有脱离单纯随机抽样或系统抽样,因而同样具有当总体较大时,抽到的个体分散,资料难以收集的缺陷,也不适于大型流行病学研究。注意:分层变量应是导致总体内部变异的主要因素层中的抽样方法可用简单随机抽样或系统抽样,二、现况研究,整群抽样(cluster sampling)例如:某市有30所中学,共有3万在校生,欲从中抽取3千学生组成样本调查其近视眼患病率,只需随机抽取约3所学校即满足样本含量。抽到的学校,全部学生均进行视力检查。,将总体分成若干群组,以群组为抽样单位进行随机抽样,被抽到的群组中的全部个体均作为调查对象,这种抽样方法称为整群抽样。,二、现况研究,优点:便于组织,也易被调查对象所接受。局限性:抽样误差较大,为减少抽样误差,采用整群抽样时通常要比其它方法增加1/2的样本含量。,整群抽样要求抽样单位的人口数不能相差太大,否则需先合并或拆分,然后抽样。,二、现况研究,多级抽样(multistage sampling):,将上述抽样方法综合运用即多级抽样。根据需要,每个阶段的抽样都可以采用上述4种方法中的任意一种,原则是优势互补。,流行病学调查可采用先分层后整群的抽样方法,这种组合方式即利用了分层抽样误差最小的优点又兼顾了整群抽样易于组织的长处。国家组织的大规模调查多采用按行政区域逐级进行整群抽样的方法,这样既易于组织实施又覆盖面大。,二、现况研究,(2)抽样调查样本含量的估计现况研究中,抽样调查的目的是以样本统计量估计总体参数所在的范围,因而要采用做参数估计时的样本含量计算方法。注意:样本含量过大既造成浪费又难以保证研究质量样本含量过小则抽样误差过大使样本失去代表性,抽样研究中,样本所包含的研究对象的数量称为样本含量。,二、现况研究,计数资料样本含量的估计方法:用以样本率估计总体率的样本含量计算公式。当总体率接近0.5(比如0.20.8)时,可按正态近似原理,采用下式计算样本含量: 式中:n为所需样本含量p为总体率的估计值,q=1pd为允许误差,即允许抽样率与总体率之间的差别可以有多大,一般用p的百分比估计为第一类错误的概率, 为确定后的u值,可查u值表获得,二、现况研究,流行病学现况研究中常用的抽样条件是:允许误差d = 0.1p0.05u0.05=1.962此时上式可简化为:例题:某地欲了解其50岁以上人口中高血压病的患病率,估计该人口的患病率p=25%,设为0.05,允许误差为0.1p,样本含量为:,二、现况研究,若总体率很低时,如肿瘤、某种出生缺陷,可按下式估计样本含量,也可参照泊松分布可信限表估计样本含量。,二、现况研究,计量资料样本含量的估计方法用以样本均数估计总体均数的样本含量的计算公式 式中:n和 同前式为估计的总体标准差为允许误差,即允许的样本均数与总体均数的误差,二、现况研究,例题:拟用抽样调查了解某地健康成人白细胞计数的平均水平,希望误差不超过100/mm。已知健康成人白细胞计数的标准差约1000/ mm,如定为0.05需查多少人?注意:简单随机抽样、系统抽样、分层抽样的样本含量皆按式计算整群抽样需扩大50样本含量以减少抽样误差,二、现况研究,(四)现况研究资料的收集1.资料来源 现况研究可收集的信息多种多样,主要来自:研究对象的各种特征:疾病、健康状况、行为特征、心理特征、遗传学特征、人口学特征等。研究对象所处的自然环境社会环境。,二、现况研究,2.获取信息的方式 询问 信函获取信息的方式 各种医学检查 常规记录资料:疾病登记、体检记录、医疗记录 或其它现有的档案资料。,二、现况研究,(五)现况研究的资料分析和结果解释在进行资料分析前要做以下工作:,原始资料,查漏补缺纠正错误,按疾病或健康状况归类,二、现况研究,1.统计描述描述资料的人口学基本特征:年龄、性别、民族、职业等构成,以介绍该资料所代表的总体。描述不同空间、不同特征人群中某事件或多个事件的分布特征:此项工作的目的是找出某事件在不同地区、不同特征人群中分布的差异,为进一步分析提供线索。交待无应答率注意:一般认为调查对象的“无应答”率超过15%,将会出现无应答偏倚,影响结果的真实性。,二、现况研究,2.统计分析注意:现况研究的结论是事件之间在时间横断面上是否存在统计学关联。这是推断因果关联的基础。,在了解事件分布特征的基础上,要依赖各种推理方法,科学地对资料加以分类、比较,以确认在两事件或多个事件之间确实存在关联。,二、现况研究,无论采用哪种统计方法,都要事先估计所有变量之间谁可能是因、谁可能是果,理清分析思路,确定统计分析方案,并在分析的过程中不断修正分析思路。,第三节,分析性研究,分析性研究(analytical study)也称分析流行病学(analytical epidemiology)分析流行病学主要有病例对照研究和队列研究两类方法。这两种研究方法的目的都是检验病因假设,估计危险因素的作用程度。,是进一步在有选择的人群中观察可疑病因与疾病和健康状况之间关联的一种研究方法。,一、队列研究,(一)队列研究的概念,队列研究(cohort study)是将一个范围明确的人群按是否暴露于某可疑因素或暴露程度分为不同的亚组,追踪各组的结局并比较其差异,从而判定暴露因素与结局之间有无关联及关联程度大小的一种观察性研究方法。,队列研究原理示意图,暴露组,非暴露组,一、队列研究,cohort原意是指古罗马军团中的一个分队。流行病学借用该词表示一组具有某个共同特征的研究对象。队列研究的研究对象:暴露队列和非暴露队列无论是暴露队列还是非暴露队列,都必须是在研究开始时没有出现研究结局,但有可能出现该结局的人。队列研究属于观察法队列研究是先确认研究对象暴露与否,再追踪其是否发病,研究方向是纵向的、前瞻性的,是由“因”至“果”的。,一、队列研究,固定队列(fixed cohort)前瞻性观察中,若研究对象同时(某一固定时间或一个短时期之内)进入队列、没有新成员的加入并且直至观察终止基本没有成员的退出,在观察期内队列保持着相对固定。动态人群(dynamic population)若观察中原有的队列成员可以不断退出,新的观察对象可以随时加入,队列成员在不断变化。,一、队列研究,(二)队列研究的用途检验病因假设:队列研究检验病因假设的能力较强,主要用途是探讨某种因素与某疾病或多种疾病的关联。例如当研究吸烟与肺癌关联的假设时,同时还可以研究吸烟与心脏病、慢性支气管炎的关联等多个假设。描述疾病的自然史:队列研究可以经过前瞻性的随访,观察到人群从暴露到发生疾病直至出现各种结局的全貌,包括亚临床阶段的变化与表现。,一、队列研究,(三)队列研究的类型因研究对象进入队列时间及观察终止时间不同,队列研究可分为三种类型: 前瞻性队列研究队列研究的类型 历史性队列研究 双向性队列研究,队列研究方法示意图,(摘自李立明主编流行病学第五版),一、队列研究,1.前瞻性队列研究(prospective cohort study)也称同时性或即时性队列研究(concurrent cohort study)前瞻性队列研究是队列研究的基本形式。该方法可以直接获得暴露与结局的第一手资料,因而信息准确,不易产生信息偏倚。但因该研究需长时间随访,费时、费力,在应用的广度方面受到了限制。,研究对象的分组根据研究开始时研究对象的暴露状况而定。此时结局尚未出现,需要追踪观察一定时间才能得到,其性质是前瞻性的。,一、队列研究,2.历史性队列研究(historical cohort study)也称非同时性队列研究(non-concurrent cohort study)或回顾性队列研究(retrospective cohort study)该方法虽收集暴露资料和判断结局在同时完成但是前瞻性的该方法的资料收集和分析可在较短时间内完成,若有完整的历史记录,可达到事半功倍的效果。,研究对象的分组是根据研究开始时已掌握的研究对象的既往暴露资料而做出,研究开始时结局已经出现,并可从历史资料中获得。,一、队列研究,3.双向性队列研究也称混合性队列研究,历史资料积累的时间太短达不到疾病的潜隐期时,需继续观察一段时间以满足研究的要求。这种在历史性队列研究之后继续观察一段时间的研究称双向性队列研究。,一、队列研究,(四)研究对象的选择队列研究的现场应具备以下条件应有足够数量的符合条件的研究对象领导重视群众乐于接受人口流动性较小,一、队列研究,1.暴露组的选择特殊暴露人群:由于生活或工作的原因,使得一部分人暴露于某种特殊因素。研究该特殊因素的致病作用时,只能以该因素的特殊暴露人群为研究对象。一般人群:若研究的暴露因素是一般人群经常接触的因素,如生活嗜好、饮食习惯、遗传特征等,此时可从一般人群中获得暴露组。有组织的团体:如医学会会员,工会会员,机关、社会团体、学校或部队成员等。选择这些人中的暴露者进入暴露组可以利用他们的组织系统收集随访资料。,一、队列研究,2.对照组的选择注意:按照求异法的原则,除研究因素之外,其它与结局有关的因素在暴露组与非暴露组间皆应均衡可比。,对照组应是暴露组来源的人群中非暴露者的全部或其随机样本,一、队列研究,(1)内对照内对照与暴露组来自同一人群,较易实现比较组间的均衡。,研究人群内部如果包含暴露与非暴露两种人群,就可将其中暴露于所研究因素者作为暴露组,非暴露者作为对照组。这种对照组称为内对照。,一、队列研究,(2)外对照特殊暴露人群,尤其是职业方面的特殊暴露人群,多具有某些与普通人群不同的特征,使用外对照时要格外注意比较组间的可比性问题。,当选择特殊暴露人群做暴露组时,该人群内部往往找不出非暴露者,常需在该人群之外寻找对照组,称外对照。,一、队列研究,(3)总人口对照优点:免去了选择、随访对照组的工作,节省人力、物力。局限性:很难实现比较组间的均衡此类资料常采用标准化的方法以实现均衡,能均衡的变量个数有限,因而在检验因果关联时应慎用总人口对照,研究结论也应慎重对待。,以该地区全人群的发病(或死亡)资料与暴露组进行比较。,一、队列研究,(4)多重对照,从上述对照的形式中选择两组或两组以上对照,以加强结果的说服力。,一、队列研究,(五)样本含量的估计队列研究与病例对照研究相同,也是比较某指标在样本之间的差异有无统计学意义,因而使用的样本含量估计公式一样。只是,队列研究比较的是结局的发生率,因而p0 和 p1分别为非暴露组和暴露组结局的发生率,其它再无区别。即: 该公式也可简化为:,一、队列研究,因队列研究可以计算RR,估计p1时可用RR:,队列研究的随访过程中失访在所难免。为避免失访造成样本含量不足,应适当扩大样本含量。例如将计算出来的样本含量扩大10作为实际样本量。,一、队列研究,(六)资料的收集1.基线资料(baseline information)的收集:经查阅档案、访问、体检以及环境检测等方式获得以下几方面的信息:暴露于研究因素的信息:据此划分暴露组与非暴露组,或不同暴露水平的比较组。与结局有关的其它信息:在分组过程中对其在组间的均衡性加以充分考虑。人口学资料:如年龄、性别、婚姻状况、文化程度、家庭人口、人口迁移等情况。,一、队列研究,2.随访和结局资料的收集(1)结局变量(outcome variable)结局是队列研究的观察终点,对其判断应有严格而统一的标准。 若结局是某疾病的发生,就应该按照公认的诊断标准判断结局。若结局是某实验室检测指标,则要以标准化的实验室操作技术加以测定,并确定达到结局的标准。,结局变量也简称结局,是观察人群中出现的预期结果事件。,一、队列研究,(2)随访 面谈 电话访问随访的方法 自填问卷 定期体检 环境与疾病的监测及有关记录随访方法一旦确定,无特殊情况在整个随访过程中应保持不变。,一、队列研究,观察终点(end-point):研究对象出现了预期的结局就达到了观察终点之后将不再对其继续随访。未达到观察终点而脱离随访的情况称为失访。观察终止时间:观察终止时间是研究的随访工作截止时间注意:终止时间应该以潜伏期或潜隐期为依据,在此原则上尽量缩短观察期,以节约人力、物力,减少失访。,一、队列研究,(七)资料分析及结果解释随访结束以后,对资料进行整理、归类,在此基础上,做统计学描述和推断。1.统计描述:统计描述性分析的目的阐明研究人群的代表性和比较组之间的均衡性介绍研究对象的失访情况,以使读者对该研究随访资料的质量有一个大体估计。,一、队列研究,2.统计推断(1)资料的基本整理模式: 队列研究资料整理表 式中a/n1和c/n0分别为暴露组的发病率和非暴露组的发病率。,一、队列研究,(2)率的计算:根据资料的特点,队列研究可计算两种率累积发病率(cumulative incidence)若研究对象为固定队列可计算累积发病率或死亡率。即用观察开始时的人口数作分母,以整个观察期内的发病例数作分子,计算某病的累积发病率(死亡率)。计算公式为:,一、队列研究,发病密度(incidence density)通常,队列研究随访时间比较长,很难要求研究对象静止不动实现所谓固定队列的要求。研究对象之间观察时间长短不一。此时以观察开始时的总人数为分母计算发病率显然是不合适的。为合理地利用随访资料,可用观察人时做分母计算队列的发病频率,称发病密度,或人时率。计算公式为:,一、队列研究,计算人时的时间单位依观察期不同而定,周、月、年皆可。 观察人时数=观察人数观察时间常用的人时计算方法有三种:精确法:以个人为单位计算人时近似法:如果研究样本太大可用平均人数乘以观察时间得到总人时数。平均人数一般取相邻两年年初人口的平均数或年中人口数。该法计算简单,但精确性较差。寿命表法:将观察当年(当月、当周)进入或退出队列的个人视为观察了1/2个人年。该法的计算过程比精确法简单,计算结果比近似法精确。,一、队列研究,(3)标化比:当遇到结局发生率低、暴露组人数少,达不到计算发生率要求的情况时,可以将全人口发病(死亡)率作为标准,算出该暴露人群的理论(预期)发病(死亡)人数。将暴露组实际发病(死亡)人数(O)做分子,理论发病人数(E)做分母计算比值,即得标化发病(死亡)比。标化死亡比的英文缩写是SMR(standardized mortality ratio)。SMR是相对比,表示实际死亡数是理论死亡数的多少倍。,一、队列研究,(4)估计暴露与发病的关联强度,队列研究可直接计算研对象的结局发生率,并依此估计暴露与疾病发生之间的关联强度。,一、队列研究,相对危险度(relative risk,RR):RR也叫危险比(risk ratio)或率比(rate ratio),是暴露组发病率(或死亡率)与非暴露组发病率(或死亡率)的比值。 Ie:暴露组的发病率 I0:非暴露组的发病率,一、队列研究,RR是暴露组与非暴露组发病概率之比,数值范围从0到无限大的正数,含义为:暴露于某因素者发生疾病的概率是不暴露于某因素者的多少倍。当RR=1时表示暴露组发病概率与非暴露组发病概率相等,暴露与疾病无关;当RR1时说明暴露组发病概率大于非暴露组发病概率,暴露增加了发生疾病的危险;当RR1时说明暴露组发病概率小于非暴露组发病概率,暴露减少了发生疾病的危险RR值越大,因素与疾病的关联强度越大。,一、队列研究,RR是总体参数的一个点估计值,需估计总体的可信区间(confidence interval,C.I.) 。当样本RR值不等于1,但其95%的可信区间包含了1时,说明总体的RR值有可能是1,因素和疾病之间可能无关联。其可信区间计算方法有Miettinen法和Woolf法。,一、队列研究,Miettinen法估计RR值的95%的可信限的计算公式为: u为正态离差值:计算RR值的95%可信限时,u1.96,RR值的90%可信限,u=1.645,一、队列研究,Woolf法计算RR值可信限的公式为: RR自然对数的方差为:Var(lnRR)=1/a+1/b+1/c+1/d,一、队列研究,归因危险度(attributable risk,AR):也叫特异危险度或超额危险度(excess risk)。因为它是暴露组发病率与对照组发病率的差值,还可称之为率差(rate difference)。 AR=Ie I0=(a/n1 )(c/n0)AR表示暴露人群与非暴露人群比较,所增加的发病(死亡)率。对暴露人群而言,消除了这个暴露因素就可减少这个数量的发病概率。,一、队列研究,归因危险度百分比(AR%):又称病因分值EF(etiologic fraction),是指暴露人群因某因素暴露所致的某病发病或死亡占该人群该病全部发病或死亡的百分比。计算公式为: 根据已知的RR也可计算AR%:,一、队列研究,人群归因危险度(population attributable risk,PAR):PAR是人群中某病发病(死亡)率与非暴露人群该病发病(死亡)率的差值,表示总人群因暴露于某因素而导致的某病发病(死亡)率。 PAR=ItI0It为全人群的发病(死亡)率,I0为非暴露组的发病(死亡)率。,一、队列研究,人群归因危险度百分比(PAR%):指总人群因暴露于某因素所致的某病发病或死亡占总人群该病全部发病或死亡的百分比,也称人群病因分值(population etiologic fraction,PEF)。用估计的人群暴露率和已知的RR,也可计算PAR: Pe是总人群对某因素的暴露率。,一、队列研究,PAR和PAR%既与RR和AR有关又与总人群的暴露率有关,RR、AR和AR%都特指暴露因素对暴露者的危害;而PAR和PAR%则说明暴露对一个具体人群的危害程度,以及消除这个因素后可能使发病率或死亡率减少的程度。,一、队列研究,下表给出了吸烟与心血管病和吸烟与肺癌关系的队列研究资料吸烟者死于肺癌和心血管病的RR和OR(1/10万人年) (根据李立明主编流行病学第五版改编),一、队列研究,由表可见: 吸烟死于肺癌的危险是非吸烟者的10.7倍,即RR为10.7;而该值在吸烟与心血管疾病的队列研究中仅为1.7;表明吸烟与肺癌的关联强度远大于与心血管疾病的关联强度。因为心血管疾病的死亡率远高于肺癌,所以,吸烟人群若原本不吸烟就可减少136.46/10万人年的心血管疾病死亡率,但只能减少45.43/10万人年的肺癌死亡率。由此可见AR更具有公共卫生学意义。,一、队列研究,该例: 说明吸烟者中发生的肺癌有90.6%是由吸烟引起的。已知非吸烟者的肺癌年死亡率为0.0469,全人群的肺癌年死亡率为0.2836,带入公式得: PAR = ItI0 = 0.28360.0469 = 0.2367从计算结果可知,虽然吸烟导致肺癌的AR%达90.6%,但因人群中只有部分人吸烟,其PAR%仅为83.5%,即,若全人群都不吸烟,将减少83.5%的肺癌死亡率。,一、队列研究,(八)队列研究的优点和局限性1.优点研究结局是亲自观察获得,一般较可靠。是由“因”至“果”观察,符合因果关系的时间顺序,论证因果关系的能力较强。可计算暴露组和非暴露组的发病率,能直接估计暴露因素与发病的关联强度。一次调查可观察多种结局。,一、队列研究,2.局限性不宜用于研究发病率很低的疾病,否则需要的研究对象数量过大,费用过高。观察时间长,易发生失访偏倚。耗费的人力、物力和时间较多。设计的要求高,实施复杂。在随访过程中,未知变量引入人群,或人群中已知变量的变化等都可使结局受到影响,使分析复杂化。,二、病例对照研究,(一)病例对照研究(case-control study)的概念,选择患有和未患有某特定疾病的人群分别作为病例组和对照组,调查各组人群过去暴露于某种或某些可疑危险因素的比例或水平,通过比较各组之间暴露比例或水平的差异,判断暴露因素是否与研究的疾病有关联及其关联程度大小的一种观察性研究方法。若病例组有暴露史的比例或暴露的程度显著高于对照组,且其差异有统计学意义,则可认为这种暴露与疾病存在关联。,病例对照研究原理示意图,二、病例对照研究,暴露(exposure):例如:接触过某种化学物质,具备性别、年龄或职业的某种特征等。,研究对象曾经接触过某些因素或具备某些特征。这些因素或特征称为暴露因素。,二、病例对照研究,病例对照研究的特点:只是客观地收集研究对象的暴露情况,而不给予任何干预措施,属于观察性研究。可追溯研究对象既往可疑危险因素暴露史,其研究方向是回顾性的,是由“果”至“因”的,因而,病例对照研究验证因果关系的能力有限,一般只能初步检验病因假设,而难以证实因果关联。该研究按有无疾病分组,研究因素可根据需要任意设定,因而可以观察一种疾病与多种因素之间的关联。,二、病例对照研究,(二)病例对照研究的用途初步检验病因假设:在有病因假设的前提下,病例对照研究将可疑病因作为研究因素,其研究结果可以初步检验病因假设是否成立。这是病例对照研究最常见的用途。提出病因线索:病例对照研究也可广泛筛选有关因素,经过分析,提出病因线索。评价防制策略和措施的效果:在病例与对照之间比较接受某措施者所占的比例,若病例组接受某预防措施者明显少于对照组,或病例组中根本就没有人接受过该预防措施者,则可提示预防措施的效果是明显的。,二、病例对照研究,(三)病例对照研究的种类 非匹配病例对照研究 病例对照研究 个体匹配 匹配病例对照研究 频数匹配,二、病例对照研究,1.非匹配病例对照研究,在病例和对照人群中分别选取一定数量的研究对象,仅要求对照数量等于或多于病例数量,除此之外再无其它规定。,二、病例对照研究,2.匹配病例对照研究采用匹配的目的:提高研究效率(study efficiency),即每位研究对象提供的信息量增加,所需样本含量减少;控制混杂因素,以避免研究中存在混杂偏倚。,匹配也称配比(matching),是以对研究结果有干扰作用的某些变量为匹配变量,要求对照组与病例组在匹配变量上保持一致的一种限制方法。,二、病例对照研究,(1)频数匹配(frequency matching)离散变量要求各类别的构成比基本相同:例如病例组与对照组成员的性别构成比基本相同;连续变量可划定多个组段,要求各组段在病例组与对照组中的构成比基本相同:例如以5岁为一个年龄组,病例组与对照组中各年龄组所占比例基本相同。,该方法要求匹配变量所占比例在病例组与对照组之间基本相同。,二、病例对照研究,(2)个体匹配(individual matching)1个病例可匹配一个或一个以上对照,表示为11、12、13、1M。11匹配也可称配对(pair matching)。在每对病例与对照中匹配变量匹配到什么程度才可视为一致取决于变量的性质和实际需要。离散变量可以完全匹配,连续变量可划定某个范围,要求病例与对照的匹配变量都在这一范围内。,以病例和对照的个体为单位进行匹配叫个体匹配。,二、病例对照研究,匹配病例对照研究的注意事项:匹配变量必须是已知的混杂因素,或有充分的理由怀疑为混杂因素,否则不应匹配。某个变量被匹配之后,与匹配变量直接或间接相关的其他变量也将随之被匹配。若这些无意中被匹配的变量恰好是研究因素其原本与疾病之间的关联将被掩盖。一旦对某个变量做了匹配,它与其他变量对疾病的交互作用将不能分析。匹配增加选择对照的难度把不必要的项目列入匹配,企图使病例与对照尽量一致,就可能徒然丢失信息,增加工作难度,反而降低了研究效率,这种情况称为匹配过度(over-matching)。,二、病例对照研究,(四)研究对象的选择,该类研究多用抽样调查,要求无论病例还是对照均应为其总体的随机样本。,二、病例对照研究,1.病例的选择 (1)选择病例时应考虑的问题疾病的诊断标准:病例应有明确的得到公认的诊断标准,有时诊断标准中还要有疾病分期、分型的相应标准。病例的确诊时间:新发病例可提供更真实的信息应作为研究对象的首选病例的代表性:病例要在病情、疾病分型、人口学特征、社会环境、生活环境等方面代表总体。辩证地看待病例对照研究中的总体问题:总体的范围越大,收集病例越困难。通常只能划定一个有限总体,并将研究结论推论至该总体。限制:为更好地处理干扰因素,在选择研究对象时可以对某些特征加以限制。因匹配不当给研究结果带来的偏倚同样可出现在限制中。,二、病例对照研究,(2)病例的来源来源于医院的病例:该类病例为某一所或若干所医院在一定时期内诊断的全部病例或其随机样本,称为以医院为基础的(hospital-based)。优点:由医院来源的病例具有易收集、配合好、信息质量高。局限性:一是到某医院就医的病例在住址、病情、职业、经济水平、病种等方面可能是有特征的,而这些特征又往往与病因有着千丝万缕的联系。因而,以医院为基础的病例对照研究其结论只能推论至到该医院就医的人群(有限总体)。二是容易发生选择偏倚。,二、病例对照研究,来源于社区的病例:该类病例是在某一地区内,通过普查、疾病统计或医院资料汇总得到的全部病例或其随机样本,称为以社区为基础的(community-based)。优点:由社区获得的病例,其研究结论可推及该社区人群。若该社区人群在与疾病有关的诸多特征方面能代表更大的人群,则研究结论还可进一步外延。局限性:但进行社区来源的病例对照研究时病例较难获得,除非有疾病筛检、队列研究、疾病监测等发现的病例可以直接利用,否则费时、费力,不要作为首选的病例来源。,二、病例对照研究,2.对照的选择(1)选择对照时应考虑的问题确认对照的标准:对照应是经过与病例相同的诊断技术确认的不患所研究疾病的人代表性:对照应是产生病例的人群中全体未患该病者的一个随机样本对照与病例的可比性:要求除了研究因素之外所有与疾病发生有关的因素在病例与对照之间均有可比性对照应不患有与所研究因素有关的其他疾病可同时选择两种以上对照:设立多组其他疾病的对照可加强研究结果的说服力,二、病例对照研究,(2)对照的来源:根据实际需要,对照多有以下来源:同一或多个医疗机构中诊断的其他疾病病例;社区人口中的非该病病例;病例的邻居中的非该病病人;病例的配偶、同胞、亲戚;病例的同事。,二、病例对照研究,不同来源的对照说明不同的问题:前两种对照是为了实现“对照代表病例来源的人群中未患所研究疾病者”的原则邻居对照可能有助于控制社会经济地位和居住环境等因素的混杂作用同胞对照可以均衡遗传因素的混杂作用配偶或同事对照则主要用于排除生活环境或工作环境的影响,二、病例对照研究,(五)样本含量的估计病例对照研究是比较某指标在样本之间的差异有无统计学意义。病例对照研究多是研究某病与多个变量之间的关联,比较的指标既有暴露剂量也有暴露率。此时,多以暴露率估计样本含量。因为计数资料所需样本含量一般大于计量资料,满足了暴露率的样本含量也就同时满足了暴露剂量的样本含量。,二、病例对照研究,1.非匹配病例对照研究计数资料样本含量的估计 该类研究的样本含量计算公式如下: 或n为病例组或对照组人数为假设检验第I类错误的概率为假设检验第类错误的概率u和u分别为和时正态分布百分位数p0为估计的研究因素在对照组中的暴露率p1为估计的研究因素在病例组中的暴露率,二、病例对照研究,p1也可由RR或OR值计算得来,公式如下:式中:,二、病例对照研究,例题:拟进行一项胃内幽门螺杆菌感染与胃癌关系的病例对照研究。估计胃内幽门螺杆菌感染者发生胃癌的相对危险度为2.0,人群胃内幽门螺杆菌感染率约为20%,设=0.05(双侧),=0.10,估计样本含量。 已知:p0=0.20、估计OR=2.0,则: n20.2670.733(1.96+1.282)2/(0.333-0.2)2232(人) 即病例组和对照组各需要调查232人。,二、病例对照研究,2.匹配病例对照研究计数资料样本含量的估计:个体匹配后,将病例与对照暴露情况不一致的对子数进行比较才有意义,基于这一原理,Schlesselman推荐的计算公式如下:,式中: m为需要结果不一致的对子数 其他符号的含义与前式相同 p的计算方法改为: 需要的总对子数M为:,二、病例对照研究,(六)资料的收集 研究对象一经确定,就应按事先考虑好的研究内容收集资料。注意:病例对照研究中应以同样的方式收集病例与对照的资料,例如相同的调查表、相同的态度、相同的提问方式、相同的调查环境等,以避免出现信息偏倚。,二、病例对照研究,(七)资料分析和结果解释,调查研究获得的资料要先经核查、整理等前期工作后方可进入统计分析阶段。,二、病例对照研究,1.统计描述 表明本研究所选择的研究对象代表了哪种 特征的有限总体;(1)统计描述的目的 说明本研究的比较组间是否实现了求异法 所要求的均衡。,二、病例对照研究,(2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论