流行病学正文部分-第6版队列研究_第1页
流行病学正文部分-第6版队列研究_第2页
流行病学正文部分-第6版队列研究_第3页
流行病学正文部分-第6版队列研究_第4页
流行病学正文部分-第6版队列研究_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 队列研究队列研究(cohort study )是分析流行病学(analytical epidemiology )研究中的重要方法之一,它通过直接观察危险因素暴露状况不同的人群的结局来探讨危险因素与所观察结局的关系。与之类似的名称还有前瞻性研究(prospectivestudy) 、发生率研究(incidence study ) 、随访研究(follow-up study )及纵向研究( longitudinal study )等。队列研究与病例对照研究相比,其检验病因假设的效能优于病例对照研究。因此,队列研究在流行病学病因研究中应用广泛。第一节 概述一、概念队列研究是将人群按是否暴露于

2、某可疑因素及其暴露程度分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局频率的差异,从而判定暴露因子与结局之间有无因果关联及关联大小的一种观察性研究( observational study ) 方法。这里观察的结局主要是与暴露因子可能有关的结局。暴露( exposure )是指研究对象接触过某种待研究的物质(如重金属)、具备某种待研究的特征(如年龄、性别及遗传等)或行为(如吸烟)。暴露在不同的研究中有不同的含意,暴露可以是有害的,也可以是有益的,但都是需要研究的。队列(cohort)原意是指古罗马军团中的一个分队,流行病学家加以借用,表示一个特定的研究人群组。根据特定条件的不同,流行病学

3、中的队列一般有两种情况:一是指特定时期内出生的一组人群,叫出生队列(birth cohort) ;另一种是泛指具有某种共同暴露或特征的一组人群,一般即称之为队列或暴露队列( exposure cohort ) ,如某个时期进入某工厂工作的一组人群。根据人群进出队列的时间不同,队列又可分为两种:一种叫固定队列(人群)( fixed cohort ) ,是指人群都在某一固定时间或一个短时期之内进入队列,之后对他们进行随访观察,直至观察期终止,成员没有因为结局事件以外的其他原因退出,也不再加入新的成员,即在观察期内保持队列的相对固定。另一种叫动态队列(人群)( dynamic cohort ) ,即

4、在某队列确定之后,原有的队列成员可以不断退出,新的观察对象可以随时加入。如图4-1 所示,在所观察的队列人群中,其中A、C、D、E、F 组成的队列称为固定队列,而由A、B、C、 D、 E、F、G、H、I、J、K组成的队列则称为动态队列。危险因素(risk factor),又称为危险因子,泛指能引起某特定不良结局 (outcome)(如疾病)发生,或使其发生的概率增加的因子,包括个人行为、 生活方式、环境和遗传等多方面的因素。图4-1随访队列示意图二、基本原理队列研究的基本原理是在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究

5、对象分成不同的组,如暴露组和非暴露组, 高剂量暴露组和低剂量暴露组等, 随 访观察一段时间,检查并登记各组人群待研究的预期结局的发生情况(如疾病、 死亡、或其他健康状况),比较各组结局的发生率,从而评价和检验危险因素与 结局的关系。如果暴露组某结局的发生率明显高于非暴露组,则可推测暴露与结局之间可能存在因果关系。具结构模式见图 4-2。在队列研究中,所选研究对象 必须是在开始时没有出现所研究的结局, 但在随访期内有可能出现该结局(如疾 病)的人群。暴露组与非暴露组必须有可比性,非暴露组应该是除了未暴露于某 因素之外,其余各方面都尽可能与暴露组相同的一组人群。根据队列研究的基本 原理可以分析出队

6、列研究的一些基本特点。1 .属于观察法 队列研究中的暴露不是人为给予的,不是随机分配的,而 是在研究之前已客观存在的,这是队列研究区别于实验研究的一个重要方面。2 .设立对照组队列研究必须在研究设计阶段设立对照组以资比较。对照 组可与暴露组来自同一人群,也可以来自不同的人群。3 .由因“及果”在队列研究中,一开始(疾病发生之前)就确立了研究对 象的暴露状况,而后探求暴露因素与疾病的关系,即先确知其因,再纵向前瞻观察其果,这一点与实验研究方法是一致的。4 .能确证暴露与结局的因果联系由于研究者掌握了研究对象的暴露状况并随访了结局的发生,且结局是发生在确切数目的暴露人群中, 所以能据此准确 地计算

7、出结局的发生率,估计暴露人群发生某结局的危险程度,因而能判断其因 果关系。图4-2队列研究的结构模式图三、研究目的1 .检验病因假设由于队列研究检验病因假设的能力较强,因此深入检验病因假设是队列研究 的主要用途和目的。一次队列研究可以只检验一种暴露与一种疾病之间的因果关 联(如吸烟与肺癌),也可同时检验一种暴露与多种结局之间的关联(如可同时 检验吸烟与肺癌、心脏病、慢性支气管炎等的关联)。2 .评价预防效果有些暴露有预防某结局发生的效应,如大量的蔬菜摄入可预防肠癌的发生, 戒烟可减少吸烟者发生肺癌的危险等,对这种暴露因素的随访研究实际上就是对 其预防效果的评价。但这里的预防措施(如蔬菜摄入和戒

8、烟)不是人为给予的, 而是研究对象的自发行为。这种现象被称为 人群的自然实验(population natural experiment ) ”。3 .研究疾病的自然史临床上观察疾病的自然史(natural history of disease )只能观察单个病人从 起病到痊愈或死亡的过程;而队列研究可以观察人群从暴露于某因素后,疾病逐渐发生、发展,直至结局的全过程,包括亚临床阶段的变化与表现,这个过程多 数伴有各种遗传和环境因素的影响,队列研究不但可了解个体疾病的全部自然 史,而且可了解全部人群疾病的发展过程。4 .新药的上市后监测新药上市前虽然经过了三期临床试验,但由于三期临床试验的样本量

9、和观察 时间总是有限的,且观察人群是特定的,有些药物的不良反应可能没有被发现。 在药物应用于临床以后的一段时间内,进行严格的新药上市后监测可认为是较三 期临床试验样本量更大和观察时间更长的队列研究。四、研究类型队列研究依据研究对象进入队列时间及终止观察的时间不同,分为前瞻性 (prospective )队列研究、历史性(historical )队列研究和双向性(ambispective ) 队列研究三种。三种队列研究方法示意如图4-3 o4图4-3队列研究类型示意图(一)前瞻性队列研究前瞻性队列研究是队列研究的基本形式。研究对象的分组是根据研究对象现 时的暴露状况而定的,此时研究的结局还没有出

10、现,需要前瞻观察一段时间才能 得到。这样的设计模式即称为前瞻性或即时性(concurrent)队列研究。在前瞻 性队列研究中,由于研究者可以直接获取关于暴露与结局的第一手资料,因而资料的偏倚较小,结果可信;其缺点是所需观察的人群样本很大,观察时间长、花 费大,因而影响其可行性。(二)历史性队列研究研究对象的分组是根据研究开始时研究者已掌握的有关研究对象在过去某个时点的暴露状况的历史材料作出的; 研究开始时研究的结局已经出现, 不需要 前瞻性观察,这样的设计模式称为历史性或非即时性( non-concurrent )队列研 究。在历史性队列研究中,虽然研究是现在开始的,但研究对象是在过去某个时

11、点进入队列的;暴露与结局虽然跨时较长,但资料搜集及分析却可以在较短时期 内完成;尽管搜集暴露与结局资料的方法是回顾性的,但究其性质而言仍属前瞻性观察,仍是从因到果的。因此,该法是一种深受欢迎的快速的队列研究方法, 具有省时、省力、出结果快的特点。缺点是因资料积累时未受到研究者的控制, 所以内容上未必符合要求。(三)双向性队列研究也称混和型队列研究,即在历史性队列研究的基础上,继续前瞻性观察一段 时间,它是将前瞻性队列研究与历史性队列研究结合起来的一种设计模式, 因此 兼有上述二类的优点,且相对地在一定程度上弥补了各自的不足。(四)不同研究类型的选用原则考虑到上述不同类型队列研究的优缺点, 因此

12、,在实施队列研究前,应根据 具体情况审慎选择。1 .前瞻性队列研究 选择前瞻性队列研究时,应重点考虑:(1)应有明确 的检验假设,检验的因素必须找准;(2)所研究疾病的发病率或死亡率应较高, 如不低于5%; (3)应明确规定暴露因素,并且应有把握获得观察人群的暴露资6料; (4) 应明确规定结局变量,如发病或死亡,并且要有确定结局的简便而可靠的手段; (5) 应有把握获得足够的观察人群,并将其清楚地分成暴露组与非暴露组; (6) 大部分观察人群应能被长期随访下去,并取得完整可靠的资料;(7) 应有足够的人、财、物力支持该项工作。2. 历史性队列研究选择历史性队列研究时,除应考虑前瞻性队列研究中

13、所考虑的各点外,还应考虑是否有足够数量的、完整可靠的、在过去某段时间内有关研究对象的暴露和结局的历史记录或档案材料。如医院的病历、个人的医疗档案、及工厂和车间的各种记录等。在具备条件的情况下,历史性队列研究备受关注。 3. 双向性队列研究当基本具备进行历史性队列研究的条件下,如果从暴露到现在的观察时间还不能满足研究的要求,还需继续前瞻性观察一段时间时, 则选用双向性队列研究。第二节 研究实例二硫化碳(CS 2)职业中毒引起的精神病、中枢神经系统疾患及多发性神经炎等,早在19世纪末即有报道。20世纪中叶,研究者发现 CS2中毒与脑、肾 等器官的动脉粥样硬化有关。然而,CS2长期低剂量的暴露与冠心

14、病的关系却一 直没有明确结论。20 世纪 60 年代, 芬兰职业卫生研究所的Hernberg 和 Tolonen教授开展的5 年前瞻性队列研究最后确定了两者之间的因果关系。一、确定研究因素本次确定的研究因素是长期低剂量的CS2的暴露。有关长期低剂量 CS2暴露与冠心病的关系已开展了大量的死因回顾调查、现况研究、病例对照研究和历史性队列研究,其研究假设已基本确定。在此基础上,拟通过前瞻性队列研究进行最后确证。长期低剂量 CS2暴露的定义是在有CS2暴露(但不至引起急性中毒)的车间工作至少5 年以上。二、确定研究结局由于轻型冠心病的临床表现是非特异性的,利用心电图的轻微改变和轻度心绞痛等症状进行判

15、断也很难准确估计非致死性冠心病的发生率,而用心肌梗死作为主要研究结局指标则具有特异性的特点。为了对结局作出全面评价,作者还同时观察了血压、心电图、心脏大小等指标及心绞痛病史。三、确定研究现场和研究人群本研究选择的研究现场是1942年在芬兰建立的一个粘纤厂。暴露人群的选 择条件是:年龄25至64岁,在1942年至1967年间至少在该工厂有5年CS2 暴露史,研究开始时依然存活且没有患冠心病的所有工人,结果 343人入选暴 露组;以年龄相差不超过3岁,出生地区相同,工种的体力消耗相当为配比条件, 在同一城市的造纸厂随机选择了 343名男性工人(暴露组全为男性)为对照组, 开始了为期5年的前瞻性队列

16、研究。四、资料收集不同资料采用不同的方法收集。 姓名、性别、年龄、工种及工作年限、吸烟、 业余时间的体力活动情况等通过询问获得;用药情况、既往车间CS2的浓度等通过查阅档案记录获得;而血糖、血脂、血清胆固醇水平、血压、心电图、心脏 大小、体重及车间CS2浓度的动态变化等,均通过实验检测的方式获得。为了 保证资料的可靠性,各种检测仪器均事先校准,采用国际通用的检查方法和判断 标准,并贯彻始终。五、资料整理与分析本研究资料的分析以 CS2暴露与心肌梗死发生的关系为中心,首先对可能 影响结果的两组的可比性进行分析。 虽然在对象选择时已按年龄、出生地及工作 的劳动强度进行了配比,在资料分析时, 又对两

17、组人群每天吸烟量、业余时间体 力活动量、体重及用药情况等进行了比较,结果显示两组有良好的可比性。5年间,暴露组发生14例致死性心肌梗死,11例发生一次心肌梗死后存活 下来,非暴露组总共发生7例心肌梗死,有4例存活下来。结果提示 CS2暴露 组发生心肌梗死的相对危险度为 3.57 ,两组致死性心肌梗死的发生率和总的心 肌梗死的发生率差异均有统计学意义(表 4-1)。同时还分析了 CS2在不同临床 类型冠心病的发生中的作用(表 4-2)。表4-1暴露组和对照组的心肌梗死发病率及相对危险度发病数5年累积发病率()RRRR 95%致死性144.084.691.3416.47(343 人)非致死性113

18、.212.740.868.69257.293.571.528.37对照组致死性30.87(343 人)非致死性41.17合计72.04(改编自 Tolonen 1975 )表4-2 CS2与不同临床类型冠心病的相对危险度与特异危险度比较相对危险度特异危险度致死性心肌梗死4.693.21非致死性心肌梗死2.742.04总心肌梗死3.575.25心绞痛1.911.6心电图异常1.46.1(改编自 Tolonen 1975 )六、结论研究结果证实了长期低剂量(2030Ppm ) CS2暴露与冠心病的关系,据此, 芬兰当局于1972年将CS2的车间容许浓度降至10Ppm。CS2所致的冠心病,以致死性心

19、肌梗死表现突出, 心绞痛及心电图异常等也 有不同程度的表现。第三节研究设计与实施一、确定研究因素由于队列研究是一项费时、费力、费钱的研究,且一次只能研究一个因素, 因此,队列研究中研究因素的确定是至关重要的。研究因素(暴露因素)通常是 在描述性研究和病例对照研究的基础上确定的。在研究中要考虑如何选择、定义 和测量暴露因素。一般应对暴露因素进行定量,除了暴露水平以外,还应考虑暴露的时间,以估计累积暴露剂量。同时还要考虑暴露的方式,如间歇暴露或连续 暴露、直接暴露或间接暴露、一次暴露或长期暴露等。暴露的测量应采用敏感、 精确、简单和可靠的方法。除了要确定主要的暴露因素外,还应确定同时需要收集的其他

20、相关因素,包括各种可疑的混杂因素及研究对象的人口学特征,以利于对研究结果作深入分析。二、确定研究结局结局变量也叫结果变量,简称为结局,是指随访观察中将出现的预期结果事件, 也即研究者希望追踪观察的事件。结局就是队列研究观察的自然终点( naturalend ) 。研究结局的确定应全面、具体、客观。结局不仅限于发病、死亡,也有健康状况和生命质量的变化;既可是终极的结果(如发病或死亡),也可是中间结局(如分子或血清的变化);结局变量既可是定性的,也可是定量的,如血清抗体的滴度、尿糖及血脂等。结局变量的测定,应给出明确统一的标准,并在研究的全过程中严格遵守。考虑疾病的诊断标准时要注意一种疾病往往有多

21、种表现,轻型和重型,不典型和典型,急性和慢性等区别。因此,妥善的解决办法是,既按国际或国内统一的标准判断结局,又按自定标准判断,准确记录下其他可疑症状或现象供以后分析时分HA参考。队列研究的优点之一是一次可以同时收集到多种结局资料,研究一因多果的关系, 故在队列研究中除确定主要研究结局外,还可考虑同时收集多种可能与暴露有关的结局,提高一次研究的效率。三、确定研究现场与研究人群(一)研究现场由于队列研究的随访时间长,因此,队列研究的现场选择除要求有足够数量的符合条件的研究对象外,还要求当地的领导重视,群众理解和支持,最好是当地的文化教育水平较高,医疗卫生条件较好,交通较便利。能选择符合这些条件的

22、现场,将使随访调查更加顺利,所获资料将更加可靠。当然,也要考虑现场的代表性。(二)研究人群研究人群包括暴露组和对照组,暴露组中有时还有不同暴露水平的亚组。根据研究目的和研究条件的不同,研究人群的选择有不同的方法。1. 暴露人群(exposure population )的选择暴露人群即暴露于待研究因素的人群。根据研究的方便与可能,通常有下列四种选择。(1) 职业人群如果要研究某种可疑的职业暴露因素与疾病或健康的关系,必须选择相关职业人群作为暴露人群。另外, 由于职业人群有关暴露与疾病的历史记录往往较为全面、真实和可靠,故如果做历史性队列研究,也常选择职业人群为暴露人群。如实例中研究CS2与冠心

23、病的关系就选择了粘纤厂的工人。(2) 特殊暴露人群特殊暴露人群是研究某些罕见的特殊暴露的唯一选择,如选择原子弹爆炸的受害者,接受过放射线治疗的人,以研究射线与白血病的关系。由于对某些职业暴露和某些特殊暴露的危险作用多半不是一开始就认识到的,一旦认识到了,大多都采取了防护措施以减少暴露,所以一般不易或不允许进行前瞻性队列研究,而常使用历史性队列研究。(3) 一般人群即某行政区域或地理区域范围内的全体人群,选择其中暴露于欲研究因素的人做暴露组。在一般人群中选择暴露组,通常考虑两点:不打算观察特殊人群发病的情况,而着眼于一般人群及今后在一般人群中的防治,使研究结果具有普遍意义;所研究的因素和疾病都是

24、一般人群中常见的,不必要或没有特殊人群可寻,特别是在研究一般人群的生活习惯或环境因素时。美国Framingham 地区的心脏病研究就是一个很好的例子。(4) 有组织的人群团体该类人群可看作是一般人群的特殊形式,如医学会会员,工会会员,机关、社会团体、学校或部队成员等。选择这样的人群的主要目的是利用他们的组织系统,便于有效地收集随访资料。而且他们的职业和经历往往是相同的,可增加其可比性。如 Doll 和 Hill 选择英国医师会员以研究吸烟与肺癌的关系,就是一个例证。2. 对照人群(control population )的选择设立对照是分析流行病学的基本特征之一,其目的是为了比较,为了更好地分

25、析暴露的作用。因此,选择对照组的基本要求是尽可能保证其与暴露组的可比性,即对照人群除未暴露于所研究的因素外,其他各种影响因素或人群特征(年龄、性别、民族、职业、文化程度等)都应尽可能地与暴露组相同,即具有可比性。做到对照组与暴露组有良好的可比性是很不容易的,关键在于选择恰当的对照人群。选择对照人群的常用形式有下列四种:(1) 内对照(internal control ) 即先选择一组研究人群,将其中暴露于所研究因素的对象作为暴露组,其余非暴露者即为对照组。也就是说在选定的一群研究对象内部既包含了暴露组,又包含了对照组。这样做的好处是,选取对照比较省事,并可以无误地从总体上了解研究对象的发病率情

26、况。当研究的暴露变量不是定性变量,而是定量变量时,可按暴露剂量分成若干等级。如果高剂量暴露可增加疾病危险性,则以最低暴露水平的人群为对照组。例如饮用水中的氟,蔬菜中的硝酸盐,人的血压值等,均可以这样做。(2) 外对照( external control ) 当选择职业人群或特殊暴露人群作为暴露人群时,往往不能从这些人群中选出对照,而常需在该人群之外去寻找对照组,故名外对照。如以放射科医生为研究射线致病作用的暴露对象时,可以不接触射线或接触射线极少的五官科医生为外对照。选用外对照的优点是随访观察时可免受暴露组的影响,即暴露组的“污染 ”, 缺点是需要费力去另外组织一项人群工作。(3) 总人口对照

27、(total population control ) 这种对照可认为是外对照的一种,但也可看作不设对照,因为它实际上并未与暴露组平行地设立一个对照组,而是利用整个地区的现成的发病或死亡统计资料,即以全人口率为对照。如利用全国的或某省(区)、市、县的统计资料作比较。它的优点是,对比资料容易得到,缺点是资料比较粗糙,往往不十分精确或缺乏欲比较的详细资料,人群可比性差。另外,对照中可能包含有暴露人群。在实际应用时,并不以暴露组和总人口的发病率直接作比较,而是采用标化比,如标准化死亡比(SMR) ,即用暴露组的发病或死亡人数与用总人口率算出的期望发病或死亡数字求标化比。在用特殊暴露人群或职业人群做暴

28、露组时,计算标化比更为便捷,且意义明显。比值大于1 ,说明暴露导致或促进了结局的发生;比值小于1 ,说明暴露预防或减少了结局的发生;比值等于1 ,则暴露与疾病没有关系。另外,在利用总人口作对照时,尽量应用与暴露人群在时间、地区及人群构成上相近的总人群为对照,以减少偏倚。(4) 多重对照(multiple controls ) 或叫多种对照,即同时用上述两种或两种以上的形式选择多组人群作对照,以减少只用一种对照所带来的偏倚,增强结果的可靠性。但多重对照无疑增加了研究的工作量。四、确定样本量(一)计算样本量时需考虑的问题1 . 抽样方法队列研究往往需要从实际人群中抽取一定数量的样本12(sampl

29、e),而很少将全部符合条件的对象都包括进来。队列研究中抽取样本的 方法与现况研究相同。而选择不同的抽样方法,将有不同的样本量估计方法。2 .暴露组与对照组的比例 一般说来,对照组的样本量不宜少于暴露组的 样本量,通常是等量的。如果某一组样本太少,将使合并标准差增大,因而会要 求总样本量增大。3 .失访率队列研究通常要追踪观察相当长一段时间,这期间内研究对象的失访几乎是难免的。因此在计算样本量时,需要预先估计一下失访率,适当扩大样本量,防止在研究的最后阶段因失访导致样本量不足而影响结果的分析。假设失访率为10%,则可按计算出来的样本量再加10%做为实际样本量。(二)影响样本量的因素1 . 一般人

30、群(对照人群)中所研究疾病的发病率po在暴露组发病率pi>po,且pi-P0 一定的条件下,po越接近0.5,则所需样本量就越大。2 .暴露组与对照组人群发病率之差用pi表示暴露组人群的发病率,用一般人群发病率po代替对照组人群发病率,d = pi-po为两组人群发病率之差,d 值越大,所需样本量越小。如果暴露组人群发病率pi不能获得,可设法取得其相对危险度(RR)的值,由式pi = RR父po可求得pi。3 .要求的显著性水平 即检验假设时的第I类错误(假阳性错误) a值。要 求假阳性错误出现的概率越小,所需样本量越大。通常取c(=o.o5或o.oi ,取o.oi 时所需样本量较取o.

31、o5时大。4 .效力 效力(power)又称把握度(i-B), B为检验假设时出现第II类错 误的概率,而i-B为检验假设时能够避免假阴性的能力,即效力。若要求效力 (i-B)越大,即B值越小,则所需样本量越大。通常取B为o.io,有时用o.2o。(三)样本量的计算在暴露组与对照组样本等量的情况下,可用下式计算出各组所需的样本量。2zj2pq z/Rq。 pan22式(4-i)pi - po式中pi与po分别代表暴露组与对照组的预期发病率,p为两个发病率的平均值, q=i-p , za和zb (上面公式中为小写)为标准正态分布下的面积,可查表求得。例如,用队列研究探讨孕妇暴露于某药物与婴儿先天

32、性心脏病之间的联系。已知非暴露孕妇所生婴儿的先天性心脏病发病率(P0)为0.007 ,估计该药物暴 露的RR为2.5,设口=0.05 (双侧),后0.10,求调查所需的样本量。z =1.96,z- =1.282, Pc =0.007, qn =0.993- 0 0P1 =RR p0 =2.5 0.007 =0.0175,q1 =0.98251p =- 0.007 0.0175)=0.0123,q =0.9877将上述数据代入式4-1:, ,21.96,2 0.0123 0.9877 1.282 . 0.0175 0.9825 0.007 0.993n =2 =23100.0175 -0.007

33、即暴露组与非暴露组各需2310人。如果考虑失访的可能性,尚需在此基础上增加 10%的样本量,即两组各实 际需要样本数量为n = 2310 X(1 + 0.1) = 2541人。如果抽样方法不是单纯随机 抽样,还需适当增加样本量。另一种样本量的便捷方法是查表法,只要已知a、伊P0和RR四个基本数据,即可从某些参考书的相应附表上查出。五、资料的收集与随访(一)基线资料的收集在研究对象选定之后,必须详细收集每个研究对象在研究开始时的基本情 况,包括暴露的资料及个体的其他信息,这些资料一般称为基线资料或基线信息。 这些信息一方面可作为判定暴露组与非暴露组的依据,也为今后仔细分析影响研 究结局的因素提供

34、保证。基线资料一般包括待研究的暴露因素的暴露状况,疾病与健康状况,年龄、性别、职业、文化、婚姻等个人状况,家庭环境、个人生活 习惯及家族疾病史等。获取基线资料的方式一般有下列四种:(1)查阅医院、工厂、单位及个人健康保险的记录或档案;(2)访问研究对象或其他能够提供信息 的人;(3)对研究对象进行体格检查和实验室检查;(4)环境调查与检测。(二)随访研究对象的随访(follow up)是队列研究中一项十分艰巨和重要的工作,随 访的对象、内容、方法、时间、随访者等都直接与研究工作的质量相关;因此, 应事先计划、严格实施。1. 随访对象与方法所有被选定的研究对象,不论是暴露组或对照组都应采用相同的

35、方法同等地进行随访,并坚持追踪到观察终止期。有时还须对失访者进行补访。未能追访到的,应尽量了解其原因,以便进行失访原因分析。同时可比较失访者与继续观察者的基线资料,以估计可能导致的偏差。随访方法包括对研究对象的直接面对面访问、电话访问、自填问卷、定期体检,环境与疾病的监测,医院医疗与工作单位的出勤记录的收集等。随访方法的确定应根据随访内容、随访对象、及投入研究的人力、物力等条件来考虑。应该强调的是,对暴露组和对照组应采取相同的随访方法,且在整个随访过程中,随访方法应保持不变。2. 随访内容一般与基线资料内容一致,但随访收集的重点是结局变量,其具体项目视研究目的与研究设计而不同。将各种随访内容制

36、成调查表在随访中使用,并贯彻始终。有关暴露状况的资料也要不断收集,以便及时了解其变化。3. 观察终点观察终点(end-point )就是指研究对象出现了预期的结果,达到了这个观察终点,就不再对该研究对象继续随访。这里强调的是出现预期结果, 如观察的预期结果是冠心病,但某对象患了高血压,不应视为已达观察终点,而应继续当作对象进行追踪。如果某对象猝死于脑卒中,尽管已不能对其随访,但仍不作为到达终点对待,而应当看作是一种失访,在资料分析时作失访处理。一般情况下,观察终点可以是疾病或死亡,但也可是某些指标的变化,如血清抗体的出现,尿糖转阳及血脂升高等,根据研究的要求不同而不同。对观察终点结果的判断应在

37、设计中订出明确的标准,规定明确的判断方法,这种规定自始至终不能改变,即使是实际医疗工作中已有所改变,但在本研究中也不能改变,以免造成疾病错分的误差。发现终点的方法要敏感、可靠、简单、易被接受。4. 观察终止时间观察终止时间是指整个研究工作截止的时间,也即预期可以得到结果的时间,终止时间直接决定了观察期的长短,而观察期长短是以暴露因素作用于人体至产生疾病结局的时间,即潜隐期为依据的,另外,还应考虑所需的观察人年数。要在考虑上述两个因素的基础上尽量缩短观察期,以节约人力、 物力, 减少失访。观察时间过短,可能得不出预期的结果;但追踪时间越长,失访率越高,消耗越大,结果可能也受影响。5. 随访的间隔

38、如果观察时间较短,在观察终止时一次搜集资料即可。但如果观察时间较长,则需多次随访,其随访间隔与次数将视研究结局的变化速度、研究的人力、物力等条件而定。一般慢性病的随访问隔期可定为12年。如Framingham 心血管病研究每二年随访一次,历时24 年。6. 随访者 根据随访内容的不同,调查员可以是普通的询问调查者,也可以是实验室的技术人员,临床医生等,但随访调查员必须认真进行培训。研究者可以参加随访,但最好是不亲自参与,因为研究者随访易于带来主观的偏倚,而不知情的局外人士反而能够获取更客观的信息。六、质量控制队列研究费时、费力、消耗大,加强实施过程,特别是资料收集过程中的质量控制显得特别重要,

39、一般的质量控制措施包括下列几点:1. 调查员的选择调查员应有严谨的工作作风和科学态度,诚实可靠是调查员应具备的基本品质,一般应具有高中或大学毕业文化程度。另外,调查员的年龄、性别、种族、语言、社会经济地位等最好与研究对象相匹配,应具有调查所需的专业知识。2. 调查员培训调查员的工作作风、科学态度、调查技巧与技术,临床医生和实验技术人员的经验等都将直接影响调查结果的真实性和可靠性。因此, 在资料收集前,应对所有参加调查者进行严格的培训,掌握统一的方法和技巧,并要进行考核。3. 制定调查员手册由于队列研究所涉及的调查员多,跨时长,因此编一本调查员手册,内列全部操作程序,注意事项及调查问卷的完整说明

40、等是十分必要的。4. 监督 常规的监督措施包括:(1) 由另一名调查员作抽样重复调查;(2)人工或用计算机及时进行数值检查或逻辑检错;(3) 定期观察每个调查员的工作; (4) 对不同调查员所收集的变量分布进行比较;(5) 对变量的时间趋势进行分析; (6) 在访谈时使用录音机录音等。应注意将监督结果及时反馈给调查员。第四节 资料的整理与分析资料分析前,首先应对资料进行审查,了解资料的正确性与完整性。对有明显错误的资料应进行重新调查、修正或剔除;对不完整的资料要设法补齐。在此基础上,先对资料做描述性统计,即描述研究对象的组成、人口学特征、随访时间及失访情况等,分析两组的可比性及资料的可靠性,然

41、后才作推断性分析,分析两组率的差异,推断暴露的效应及其大小。一、基本整理模式根据统计分析的要求,队列研究的资料一般整理成表 4-3的模式。式中a/ni 和c/no分别为暴露组的发病率和非暴露组的发病率,是统计分析的关键指标。表4-3队列研究资料归纳整理表暴露组aba+b=n1a/n1非暴露组cdc+d=n0c/n0合计a+c=m 1b+d=m 0a+b+c+d=t二、人时的计算队列研究由于跨时间较长,观察对象经常处于动态之中,队列内对象被观察 的时间可能很不一致,因此以人为单位计算率就不合理。 较合理的办法是加入时 间因素,以人时来计算观察对象的暴露经历。在对队列研究资料进行分析之前, 应计算

42、不同组(暴露组与对照组、不同年龄组、不同性别组等)的观察人时(person time)数,常用的人时单位是人年(person year)。常用的人年计算方法有下列 三种。1 .以个人为单位计算暴露人年(精确法)该法结果精确,但资料处理较麻烦,特别是在手工计算时。以某研究中的三个研究对象为例说明其计算方法 (见 表 4-4 和 4-5)表4-4 3例研究对象的出生日期与进出研究时间出生日期进入研究时间11947.04.221986.08.201997.10.15 (失访)21955.05.101981.12.121994.01.02 (出现终点结局)31962.12.131990.03.0220

43、01.02.02 (观察结束时仍健在)表4-5 3例研究对象的人年计算年龄组对象1对象2日,19474221955510196212132581.12.1285.05.0990.03.0292.12.126.19共3年4个月27天共2年9个月10天合3.41人年合2.78人年3085.05.1090.05.0992.12.1397.12.1210.00共5人年共5人年3586.08.2087.04.2190.05.1094.01.0297.12.1301.02.027.46共8个月共3年7个月22天共3年1个月20天合0.67人年合3.65人年合3.14人年4087.04.2292.04.21

44、5.00共5人年4592.04.2297.04.215.00共5人年97.04.2297.10.150.4850共5个月24天合0.48人年合计86.08.2097.10.1581.12.1294.01.0290.03.0201.02.0234.13共11.15人年共12.06人年共10.92人年从表4-5结果可知,虽然总的观察对象只有 3名,且进出研究的时间不一, 但其观察经历可合并成一个总的统一的人时单位,即34.13人年。2 .用近似法计算暴露人年如果不知道每个队列成员进入与退出队列的具体时间(精确到大),就不能用上述方法直接计算暴露人年数;另外,如果对暴 露人年计算的精确性要求不高时,

45、也没有必要应用精确法计算。此时,都可应用近似法计算暴露人年,即用平均人数乘以观察年数得到总人年数,平均人数一般取相邻两年的年初人口的平均数或年中人口数。该法计算简单,但精确性较差。假设某队列研究从1996年8月10日开始,开始观察人数为30054人,至 2000年2月10日结束,结束时的人数为30023人,资料详列于表4-6,以说明 其计算方法。表中35岁年龄组的人年数=(9836+9847 ) /2+ (9847+9857 ) /2+ (9857+9843 ) /2+(6/12)>(9843+9840 ) /2=34464 (人年),余类推。表4-6近似人年计算法(岁)观察人数年数19

46、96.8.101997.8.101998.8.101999.8.102000.2.103598369847985798439840344644512593125681257812566125624400855647625763676437623762126714合计30054300513007830032300231051863.用寿命表法计算人年利用简易寿命表方法也可以计算人年。该法计算简单,并有一定的精确度。常用的计算方法是规定观察当年内进入队列的个人均 作1/2个人年计算,失访或出现终点结局的个人也作1/2个人年计算。其观察人年数计算式如下:1 , 一、Lx = Ix+二 Nx-DxWx

47、式(4-2)2" = Ix + Nx-Dx-Wx式(4-3)式中Lx为x时间内的暴露人年数,Ix为x时间开始时的观察人数,Nx为x 时间内进入队列的人数,Dx为x时间内出现终点结局的人数, Wx为x时间内失 访的人数。试以表4-7的资料为例,说明其计算方法。表4-7寿命表法计算人年实例(第x年)(Ix)(Nx)(Dx)(Wx)(Lx)129031238642928.5229541156762970.532987429182994.543002358342998.55299507182982.5合计3814874.51L1 =I1 2 N1 -D1 -W1=2903 + (123 -

48、8 - 64)/ 2 = 2928.5 人年I2=I1 N1-D1 -W1=2903+123 -8 -64 =2954L2 = 2954 + (115 - 6 - 76) / 2 = 2970.5 人年依次类推,合计得14874.5人年三、率的计算结局事件的发生率的计算是队列研究资料分析的关键,根据观察资料的特 点,可选择计算不同的指标。(一)常用指标1 .累积发病率(cumulative incidence)如果研究人群的数量较大且比较 稳定,则无论其发病强度大小和观察时间长短,均可用观察开始时的人口数作分母,以整个观察期内的发病(或死亡)人数为分子,计算某病的累积发病率。累 积发病率的量值

49、变化范围为01 ,报告累积发病率时必须说明累积时间的长短, 否则,其流行病学意义不明。2 .发病密度(incidence density )如果队列研究观察的时间比较长,就很 难做到研究人口的稳定。如研究对象进入队列的时间可能先后不一;在观察截止前,可能由于迁移它处,其他原因死亡或其他原因退出,造成各种失访;研究对 象出现终点结局的时间不同等原因均可造成每个对象被观察的时间不一样。此时以总人数为单位计算发病(死亡) 率是不合理的,因为提早退出研究者若能坚持 到随访期结束,则仍有发病可能。此时需以观察人时为分母计算发病率,用人时 为单位计算出来的率带有瞬时频率性质称为发病密度。最常用的人时单位是

50、人 年,以此求出人年发病(死亡)率。发病密度的量值变化范围是从0到无穷大。3 .标化比 当研究对象数目较少,结局事件的发生率比较低时,无论观察 的时间长或短,都不宜直接计算率,而是以全人口发病(死亡)率做为标准,算 出该观察人群的理论发病(死亡)人数,即预期发病(死亡)人数,再求观察人 群实际发病(死亡)人数与此预期发病(死亡)人数之比,得到标化发病(死亡) 比。最常用的指标为标化死亡比(standardized mortality ratio, SMR),这一指 标在职业病流行病学研究中常用。标化比虽然是在特殊情况下用来替代率的指标,但实际上不是率,而是以全人口的发病(死亡)率作为对照组计算

51、出来的比, 其流行病学意义与后叙的效应指标类似。例如,某厂3040岁组工人有500名,某年内有2人死于肺癌,已知该年 全人口 3040岁组肺癌的死亡率2%,求其SMR。式(4-4)c研究人群中的观察死亡 数(O )SMR"以标准人口死亡率计算 出的预期死亡数(E )已知 O = 2 , E = 500 X2% = 1SMR = = 2 1即某厂3040岁年龄组工人死于肺癌的危险达到相应一般人群的2倍。如果某单位的历年人口资料不能得到,而仅有死亡人数、原因、日期和年龄,则可改算标化比例死亡比(standardized proportional mortality ratio, SPMR

52、 )。 其计算方法是以全人口中某病因死亡占全部死亡的比例乘以某单位实际全部死 亡数而得出某病因的预期死亡数,然后计算实际死亡数与预期死亡数之比。例如,某厂某年3040岁年龄组工人死亡总数为100人,其中因肺癌死亡 5人,全人口中该年3040岁组肺癌死亡占全死因死亡的比例为 2.2%,则55SPMR =2.27100 2.2%2.2即某厂3040岁年龄组肺癌死亡的危险为一般人群的2.27倍。(二)显著性检验由于队列研究多为抽样研究,当发现两组率有差别时,首先要考虑抽样误差 导致的可能,需要进行统计学显著性检验。1. U检验 当研究样本量较大,p和1-p都不太小,如np和n(1-p)均大于5 时,

53、样本率的频数分布近似正态分布, 此时可应用正态分布的原理来检验率的差 异是否有显著性,即用U检验法来检验暴露组与对照组之间率的差异。式(4-5)式中Pi为暴露组的率,Po为对照组的率,n1为暴露组观察人数,n0为对照组的观察人数,pc为合并样本率,Pc =X1 *Xo ,其中Xi和Xo分别为暴露组和nno对照组结局事件的发生数。求出 u值后,查u界值表得P值,按所取的检验水 准即可作出判断。2.其他检验方法 如果率比较低,样本较小时,可改用直接概率法、二项 分布检验或泊松(Poisson)分布检验;当率稍大和样本稍大时,率的显著性检 验可以利用大家熟悉的四格表资料的卡方检验;对SMR或SPMR

54、的检验,实际是对所得结果值偏离1的检验,其检验方法可用72检验或计分检验(score test), 详细方法可参阅有关书籍。四、效应的估计流行病学的主要效应测量指标是相对危险度与归因危险度,即暴露组与对照组之间的危险度比和危险度差。队列研究的最大优点就在于它可以直接计算出研 究对象的结局的发生率,因而也就能够直接计算出RR和AR,从而可直接评价暴露的效应。1.相对危险度(relative risk, RR ) RR 也叫危险度比(risk ratio, RR ), 是暴露组的危险度(测量指标是累积发病率) 与对照组的危险度之比。暴露组与 对照组的发病密度之比称为率比(rate ratio, RR )。危险度比和率比都是反映暴 露与发病(死亡)关联强度的最有用的指标,RR = -e = . 1式(4-6)Io cn0式中Ie和I0分别代表暴露组和对照组的率。RR表明暴露组发病或死亡的危险是 对照组的多少倍。RR值越大,表明暴露的效应越大,暴露与结局关联的强度越 大。表4-8列出了一个常用的判断标准。表4-8 相对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论