统计学:队列研究的设计与分析_第1页
统计学:队列研究的设计与分析_第2页
统计学:队列研究的设计与分析_第3页
统计学:队列研究的设计与分析_第4页
统计学:队列研究的设计与分析_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

队列研究的设计与分析

(thedesign&analysisofcohortstudy)要求:1.掌握相对危险度和归因危险度的意义、计算以及置信区间的估计;掌握暴露人年数、人年发病率、发病概率和累计发病概率的意义、区别与计算。2.了解队列研究的设计和注意问题。3.理解相对危险度的假设检验方法、M-H分层分析方法。流行病学调查分析方法

流行病学调查中常要了解暴露于某种因素(factor)对疾病的发生有无影响及其影响程度。研究者可以通过不同调查来收集资料:一种是在部分人发生疾病后,对病人(case)和非病人(又称对照:control)调查其暴露于某危险因素的情况,这种调查称为病例—对照研究(case-controlstudy);另一种是按照是否暴露于某种因素而分成两组后分别随访观察他们的疾病发生情况,这种调查称为队列研究(cohortstudy)。病例—对照研究和队列研究都是因果关系研究方法队列研究过程合格对象暴露组疾病非疾病非暴露组疾病非疾病调查方向因果关系研究方法第一节队列研究的基本概念

队列研究(cohortstudy)是对不同暴露水平的对象进行追踪观察,确定其疾病发生情况,从而分析暴露因素与疾病发生之间的因

果关系。

1954年Doll、Hill和Peto在长达20多年的追踪观察研究中报道了英国男性和女性医生吸烟与肺癌及其它疾病发病风险关系。一、队列研究的定义与实例1.前瞻性队列研究在研究开始,确定研究对象的暴露水平,然后随访各暴露水平人群的疾病发生情况。例17-1

为探讨EB(疱疹)病毒与鼻咽癌发病的关系,广东省中山市1986年进行了EB病毒普查,共检查25~70岁居民41471人,其中38550人EB病毒抗体阴性,2921人阳性。EB病毒抗体阴性和阳性者分成两个队列(两个暴露水平),分别随访了437579人年和20477人年,EB抗体阴性队列共发生鼻咽癌54例,阳性队列57例。前瞻性与回顾性的队列研究2.历史性队列研究

在研究特殊人群时,常回顾性地收集历史档案,然后随访不同暴露水平人群的疾病发生情况。例17-2Lee和Fraumeni报告了蒙大拿铜冶炼厂工人呼吸系统肿瘤发生情况的研究,研究收集8045名1956年以前曾在该厂工作1年以上工人的出生日期和地点、社会保险号、工厂内工作时间和工种,以及死亡时间和地点。随访到1963年为止,共有1877名工人死亡,722名工人失访。3.疾病过程的随访研究

在临床试验中常随访接受不同治疗措施的某疾病患者,观察和比较他们的生存情况。这类研究的目的主要是比较接受不同治疗措施患者的生存情况。例将符合手术治疗适应症的21例乳腺癌患者随机分为两组,一组10例单纯接受手术治疗,另一组11例在手术后还接受化疗,随访3年。二、队列研究的中常用指标1.暴露人年的计算

观察的人数和时间的总和称为人时数。例如,若对10人追踪观察(暴露)了5年,就是观察(暴露)了50人年;若对1人追踪观察(暴露)了50年,也是观察(暴露)了50人年。病例号诊断日期随访情况人年数11963.7.141972.1.22死于肝癌8.521964.2.71974.5.16随访情况良好,以后失去联系10.331963.10.25从未随访过不计41962.5.151976.4.24死于车祸1451964.1.2到调查日(1988.6.1)仍存活,未发生肝癌24.45名乙型肝炎病人的诊断、随访记录和人年数2.人时发病率(强度型)计算如果以年为计时单位,人年发病率P(也称发病密度,是强度型指标):例如:中山市为期12年的EB病毒抗体阴性随访队列中,男性55~59岁年龄组共随访22879人年,有4例鼻咽癌在随访期间发病,其人年发病率为:

表示在为期12年的研究中,平均每十万人年约发生17.48个鼻咽癌病人,或鼻咽癌的年发病率为17.48/10万。3.发病概率(频率型)

当随访人口比较稳定,观察时间较短,失访人数极少时,发病概率q为:其中,N表示队列研究的总人数,d表示随访期内新发病例数。发病概率反映某一时点的人群发病的可能性大小,若有失访,可用下式校正:其中,N0为期初观察对象的人数,c为观察期内的失访人数。4.累积发病概率

当随访时间较长,随访人口变动大,失访增多时,采用累积发病率来计算人群中发病率的大小:定群寿命表法。例17-5

中山市EB病毒抗体阴性队列的每年年初随访人数、年发病人数和失访人数见表,试计算5年的累积发病概率。

中山市EB病毒抗体阴性队列鼻咽癌累积发病概率Qk(1/105)年份i期初人数N0发病数d失访数c0校正数N0-c0/2发病概率qi1-qi累积发病概率Qk19883648651943638913.7499986.2613.741989362873320361278.3099991.7022.041990359642280358255.5899994.4227.621991356822436354655.6499994.3633.261992352442568349635.7299994.2838.98三、队列研究中疾病与暴露关联的指标1.相对危险度(relativerisk,RR)设暴露队列的人时发病率为P1,非暴露队列的人时发病率为P0,相对危险度为:

表示暴露与某危险因素的人群中,发病风险是非暴露人群发病风险的多少倍。例17-3

续例17-1,EB病毒抗体阳性人群的随访总暴露人年数为20477人年,鼻咽癌57例,人年发病率P1=57/20477=278.36/105(人/人年);阴性人群的随访总暴露人年数为437579人年,鼻咽癌54例,人年发病率P0=54/437579=12.34/105(人/人年)。则相对危险度为:即,EB病毒感染人群发生鼻咽癌的风险是非感染人群发生鼻咽癌风险的22.56倍。说明EB病毒感染与鼻咽癌发病有密切关系。2.归因危险度(attributablerisk,AR)

表示暴露于某危险因素的人群中,发病风险与非暴露人群发病风险相比较的绝对差值,反映暴露危险因素造成发病增加的绝对量。或者说人群中有多少发病率可以归因于该暴露危险因素。归因危险度比率(attributableriskpercent,ARP)在例17-3中,归因危险度比率为:

归因危险度比率表示在暴露人群中,有多大比例的疾病发生是由该暴露危险因素引起的,它提示如果消除了该危险因素,发病率下降的比率会是多少。本例中,如果能控制EB病毒感染,则观察人群中鼻咽癌发病率会减少95.57%。3.人群归因危险度(populationattributablerisk,PAR)

是指整个人群中暴露于某危险因素所引起的发病率增高部分(也称病因学成数)。P为整个人群中发病率,P0为非暴露人群发病率。人群归因危险度比率(population

attributableriskpercent,PARP)例如,中山市肿瘤发病登记系统结果显示,中山市30~70岁居民的鼻咽癌发病率为

P=63.42/105(人/人年),非暴露人群发病率P0=12.34/105(人/人年),人群归因危险度比率为:说明如果能完全控制EB病毒感染,中山市居民的鼻咽癌发病率将减少80.54%。四、队列研究设计中应注意的问题1.暴露人群的选择2.对照人群的选择3.终结指标的选择4.样本含量估计第二节暴露队列与非暴露队列的比较

描述不同暴露水平对疾病发生或死亡的效应比较。例17-6

续例17-3,将资料整理成四格表:中山市EB病毒抗体阳性与阴性队列的鼻咽癌发病率比较一、相对危险度的假设检验和区间估计随访人数发病数暴露人年数人年发病率(/10万)抗体阳性5720477278.36抗体阴性5443757912.34合计11145805624.23相对危险度的RR假设检验对例17-6两队列的发病率作假设检验H0:RR=1.0(两队列的鼻咽癌发病率差异无显著性)H1:RR≠1.0(两队列的鼻咽癌发病率差异有显著性)α=0.05队列发病数暴露人年数人年发病率(/10万)暴露d1N1P1非暴露d0N0P0合计DNP相对危险度RR的95%置信区间—Miettinen法二、Mantel-Haenszel分层分析

各队列的比较,目的在于描述不同暴露水平对疾病发生或死亡的效应。在分析危险因素与疾病关系时,常受到混杂因素(confounder)的影响,分析时若忽略这个问题,将会导致结果的偏倚。看表17-4,混杂的“虚假”性。设C表示混杂因素(C+和C-两层),E表示暴露水平(E+暴露与E-非暴露) C+C-合并CE+E-E+E-E+E-发病8040558545未发病8440404844RR111.26(χ2=3.91,P<0.05)

结果显示,如果按混杂因素C分成C+和C-两层分别进行分析,两者相对危险度RR=1,即疾病与暴露无关,而如果C不分层,有RR>1,经检验,疾病与暴露有关具有统计学意义。这就是混杂因素C带来的结果!RRM-H分层分析方法分层分析的基本思想是:按各层四格表分别估计预期死亡数,再汇总估计总的相对危险度并进行假设检验。例17-7

下表列出不同年龄组英国男性医生肺癌死亡率与吸烟水平的资料,试探讨肺癌死亡与不同吸烟水平的关系。英国男性医生肺癌死亡率与吸烟水平的资料年龄组吸烟预期死亡数E的方差不吸烟合计N1d1EVN0d0Nd35~2310221.340.4411266034368255~633321.540.36190708240265~520175.801.00107806279775~3950119.861.768561480612合计385862218.543.56151071

该资料按年龄分层,每层构成暴露(吸烟)队列与非暴露(不吸烟)队列是否死于肺癌的四格表。算法步骤及结果

结果表明,在调整年龄因素影响后,吸烟者死于肺癌的危险性是不吸烟者的5.21倍。如果年龄不分层,直接用总随访人群的死亡率估计相对危险度,则不分层的结果

结果表明,在调整年龄因素影响后,吸烟者死于肺癌的危险性是不吸烟者的5.21倍。如果年龄不分层,直接用总随访人群的死亡率估计相对危险度,则M-H分层分析相对危险度的RR假设检验H0:RR=1.0(两队列的死亡率差异无显著性)H1:RR≠1.0(两队列的死亡率差异有显著性)

两队列的肺癌死亡率差异无统计学差异。

数据分析结果看,两队列的肺癌死亡率差别还是较大的(RR=8.61),由于不吸烟组的肺癌死亡数太少,抽样误差大,检验效能低,造成无统计学意义。三、剂量-反应关系分析(dose-responserelationship)

讨论多个不同暴露水平对致病或致死的相关性分析,此处的“剂量”可以是:年龄、某元素含量、接触等级等等。例17-8

蒙大拿铜冶炼厂工人砷暴露的年份(称为剂量)与呼吸系统肿瘤死亡数资料见表,试分析呼吸系统肿瘤的死亡率与砷暴露年份有无统计学关系。砷暴露年份0.0~0.91.0~4.95.0~14.915+合计(0)(1)(2)(3)观察死亡数51171334115观察人年数56105769672231161682640死亡率(/10万)90.90

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论