队列研究新版_第1页
队列研究新版_第2页
队列研究新版_第3页
队列研究新版_第4页
队列研究新版_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章队列研究探讨疾病的病因、危险因素及预后因素等是流行病学在医学研究中的重要应用之一。通过描述性研究,可以初步获得研究对象的各种特性,但此时疾病的影响因素与结局是同时观测的,因此需要采用分析性研究方法加以探讨。队列研究(cohortstudy)是分析性研究的重要方法之一,它可以直接观测暴露于不同危险因素或不同特性人群的结局,从而探讨危险因素与疾病发生或结局之间的关系。第一节概述一、概念队列研究是指将某一特定人群按是否暴露于某可疑因索或按不同竑露水平分为亚组,追踪观测一定的时间,比较两组或各组发病率或死亡书的差异,以检查该因素与某疾病有无因果关联及关联强度大小的一种观测性研究方法。二、研究目的{一)检查病因假设由于队列研究是由因及果的研究,能确证暴錤与疾病的关系,因此检查病因假设是队列研究的重要目的和用途。一次队列研究可以只检查一种接露与一种疾病之间的因果关联(如吸烟与肺癌),也可检查一种秘錤与多种结局之间的关联(如可同时检查吸烟与肺癌、心脏病、慢性支气忏炎等的关联)。 * '(二)评价防止效果有些域鋸有防止某结局发生的效应,即具有防止效果。如大蒜的摄入可防止消化道肿瘤如I?癌的发生,戒烟可减少吸烟者肺癌发生的危险等。这里的防止措施(如大蒜摄人和戒烟)即暴露因素不是人为给予的,而是研究对象的自发行为。通过这种人群的“自然实验”(naturalexperiment)也可以评价某因素的防止效果。(三)研究疾病自然史临床上只能通过观测单个病人从发病到痊愈或死亡的过程来了解疾病的自然史。在队列研究开始时,研究前研究对象只是具有某种暴谣而不患有相应的疾病,因此可以观测人群中不同个体缺露于某因素后,疾病逐渐发生、发展,直至结局的全过程,涉及亚临床阶段的变化与表现,M时还可以观测到各种自然和社会因素对疾病进程的影响。队列研究不但可了解个体疾病的自然史,并且可了解疾病在人群中的发生发展过程。三、研究类型(一)前瞻性队列研究(prospectivecohortstudy)研究对象的拟定与分组是根据研究开始时研究对象的暴露状况而定的,研究结局的获得®要随访观测一段时间后才干获得,这是队列研究的基本形式。前啲性队列研究的鍛大优点就是研究者可以直接获取关于暴露与结局的第一手资料,因而资料的偏倚较小,结果可信;其缺陷是随访观测的时间往往很长,所®观测的人群样本很大,需要花费很大,因而影响其现场可行性。{二)历史性队列研究(historicalcohortstudy)历史性队列研究也称回顾性队列研究。研究工作从现在开辦,但研究对象是在过去某个时间进人队列,即观测或随访的起点是过去某个时间,研究对象的拟定与分组是根据过去某时点进人队列时的接露悄况。研究的结局在研究开始时也许已经发生,但资料收集是从暴餺到结局的方向进行的。在历史性队列研究中,研究对象的分组以及研究结局的获得都来源于研究者研究开始时所常捉的有关历史资料,因此有时不溢要进行随访观测,对于一些从暴露到出现结局耑要很长时间的疾病研究,可以在较短时期内完毕,具有省时、省力、出结果快的特点,W而合用于长诱导期和K潜伏期的疾病,也经常用于具有特殊缺露的职业人群研究。但M这种研究经常缺少影响絲露与疾病关系的混杂因素资料,影响暴露组和对照组的可比性。(三)历史前瞻性队列研究(historicalprospectivecohortstudy)假如在历史性队列研究之后,继续进行随访观测,称历史前瞻性队列研究,这种研究同时具有历史性队列研究和前胳性队列研究的性质,一定限度上填补了互相的局限性。一般应用在研究开始时暴辦和暴鋸引起的快速效应(如肝功能损害、出生崎形、流产、不育等)已经发生,而与祕餺有关的长期影响(如肿瘤)尚未出现,茁要进一步的观测,闪此适于评价对人体健康同时具有短期效应和长期作用的暴露因尜。一、率的计算结局事件的发生率的计算是队列研究资料分析的重点,根据观测资料的特点,可选择计箅不同的指标。(一)常用指标尜积发病率(cumulative incidence,CI)当研究人群的数量比较多,人口比较稳定,资料比较整齐的时候,无论其发病强度大小和观测时间长短,均可用观测开始时的人口数作分母,以幣个观测期内的发病(或死亡)人数为分子,计箅某病的累积发病率(或粜积死亡率)。尜积发病率的M:值变化范围为0〜1,其流行病学意义有赖于对累积时间长度的说明。某观测期内发病人数 “”同期的麵人口数发病密度(incidence density,ID)当观测的人口不稳定,观测对象进人研究的时间先后不一,以及各种因素导致失访,研究对象出现终点结局的时间不同等因素均可导致每个对象被观测的时间不同样。假如观测期间为8年,而存的对象也许只被观测了1年、4年、7年或儿年几个月不等,因此资料变得很不整齐。此时以总人数为单位计算发病(死亡)率是不合理的,闪为提早退出研究者若能坚持到随i方期结朿,则仍有发病也许。此时浓以观测人时(persontime)即观测人数与观测时间的乘积为分母计箅发病率。以人时为中.位计箅出来的率带有瞬时频率性质,即表达在一定期间内发生某病新病例的速率,称为发病密度。iii常用的人时单位是人年(personyear),以此求出人年发病(死亡)率。关于人年的计箅请参阅相关的记录书。发病密度=魅臟观麵細■发病人数 ,4_o)观测期内的观测对象人年数 3)(二)显著性检查队列研究中暴辦组和非暴滿组两组人群的发病率或死亡韦比较浓作记录学显著性检验。当研究样本世较大,/>和1-/>都不太小,如72P和均大于5时,样本率的频数分布近似[K态分布,此时用正态分布的原理來检查率的差异是否有賊著性,即用L;检查法来检查暴錤纟丨〖与非暴谣纟丨〖之间率的差异。求出U值后,查界值表得P值,按所収的检查水准即可作出判断。假如率比较低,样本较小时,可改用直接概率法、二项分布检验或Poisson分布检查;也可以运用四格表资料的x2检查,具体方法可参阅有关书籍。二、效应的估计 '队列研究的资料一般整理成表4-2模式。表4>2队列研究资料归纳整理表发病未发病合计发病书暴露组aba-\~b—n\a/n\非秘讲组Cdc+c/=«oc/no合计a^bc=rn\b+d=moa+/,+c+c/=Z式中和t/m分别为暴鋸组的发病率和非暴辦组的发病率,是记录分析的重要指标。(一)相对危险度(relative risk,RR) "'是反映狨露与发病(死亡)关联强度的最常用的指标,其本质是率比(rateratio)。RR=jiL=^riL (4-4)ioc/Wo式中/,和/o分别代表竑露组和非秘露组的发病或死亡率。尺尺表达暴露组发病或死亡的危险是非綠露组的多少倍。尺K=1表达两组的发病率或死亡率没有差别;RR>1表达暴满组的发病率或死亡率尚于非秘露组,则该暴露因素为危险因素;RKC1表达暴露组的发病率或死亡率低于非暴餺组,则该暴露因素为保护因素。因此值离1越远,表白暴露的效应越大,犍露与结局关联的强度越大。无论尺尺大于1或小于1,都应进行记录学的显著性检查再下结论。由样本资料计箅出的相对危险度是的一个点估计值,若要估计数值的总体范围,应考虑到抽样误差的存在,需计算其可信区间,通常用95%可信区间。具体计箅方法可用Woolf法计算,该方法是建立在RR方差基础上简朴易行的方法。Var(ln_RR)=*=丄+~^•+丄H\ (4-5)abedInRR的95%可信区间=ln尺尺士1.96/Var(lnRR)其反自然对数即为RR的95%可信区间。 ’(二)归因危险度(attributable risk,AR)又叫特异危险度、率差(ratedifference,RD)和超额危险度(excessrisk),是秘滿绀发病率与非祕麻组发病率相差的绝对值,说明危险特异地归因于暴露因素的限度,即由于暴露因素的存在使暴餺组人群发病率增长或减少的部分。AR=Ie-10=—~ (4-6)由于 RR=导,Ir=RRXI0J0所以 A尺=尺尺父一7。=7。(尺尺一1) .(4-7)同样,归因危险度也是一个样本值,可以计算其95%可信区间。AR的95%可信区间=AK士1.96X.M-f-%Vw丨WoRR与AJ?都是队列研究的重_指标,彼此密切相关,但其公共卫生意义却不同。说明暴露者与非暴露者比较相应疾病危险的倍数,其结果是一个相对数,没有单位;A1?则一般是对人群而言,暴露人群与非暴露人群比较,所增长的疾病发生的比例。假如该録露因素消除,就可减少疾病发生的比例。Ai?是一个有单位的率。兄R具有病因学的意义,Ai?更具有疾病防止和公共卫生学上的意义。以表4-3为例说明两者的区别,从RR看,吸烟对肺癌的作用较大,病因联系较强;从AR看,吸烟对心血管疾病的作用较大,防止所取得的社会效果将更大。表4~3吸烟者与非吸烟者死于不同疾病的M与AR疾病吸烟者(1/10万人年)非吸烟者(1/10万人年)RRAR(1/10万人年)肺癌48.334.4910.843.84心血符疾病294.67169.541.7125.13(引自:Lee,1982)(三)归因危险度比例(attributable riskpercent,AR%)又称为病因分值(etiologicfraction,EF),是指暴露人群中归因于暴獬的发病或死亡部分占所有发病或死亡的比例。’AR°/o=~JIoXlOO°/0 (4-8)或 AR%=^j~1X1Q0% (4-9)(四)人群归因危险度(population attributablerisk,PAR)与人群归因危险度百分比人群归因危险度比例也叫人群病因分值(populationetiologicfraction,PEF),是指总人群发病率中归因于暴餺的部分,而是指PAR占总人群所有发病(或死亡)的比例。尺R和都说明暴露的生物学效应,即暴露的致病作用有多大;而PAR和则说明據露对一个具体人群的危害限度,以及消除这个因素后也许使发病率或死亡率减少的限度,它既与和Ai?有关,又与人群中暴露者的比例有关。除非研究对象两组的暴露比例与人群中的恰好一致,否则,计箅出来的A/?、与PAR和不一致。PA1?和P/U?%的计算式如下:PAR=^I,-10 (4-10)厂代表全人群的率,Z。为非暴露组的率PAi^%=^--~--pX100% (4-11)此外,尸八尺%亦可由下式计箅:PAR%=pfj^^「八丄X100% (4-12)式中P,表达人群中有某种暴露者的比例,从该式可看出PAK%与相对危险度及人群中暴露者的比例的关系。 •例如表4-3中,已知吸烟者肺癌年死亡率为0.4833%。(/,),非吸烟人群肺癌年死亡率为0.0449%。(70),全人群的肺癌年死亡率为0.2836%。(/,),贝lj:TOC\o"1-5"\h\zRR=Ie/Io=0.4483%0/0.0449%。=9.98,说明吸烟.组的肺癌死亡危险是非吸烟组的9.98倍; ‘ •AR=lr-/o=0.4483%0-0.0449%o=0.4034%o,说明假如去除吸烟因素,则可使吸烟组人群肺癌死亡率减少0.4034%。; ’AR°/o=CIg-Jo)//,=(0.4483%0-0.0449%。)/0.4483%。=89.98%,说明吸烟人群中由吸烟引起的肺癌死亡占所有肺癌死亡的比例为89.98%,PAR=It-/0=0.2836%0-0.0449%0~0.2387%0,说明假如去除吸烟因素,则可使全人群中的肺癌死亡率减少0.2387%。; •PAR°/o=CIt~Jo)///X100%=(0.2836%。-0.O449%0)/O.2836%。=84.17%,说明全人群中由吸烟引起的肺癌死亡占所有肺癌死亡的比例为84.17%。(五)标化比.当研究对象数目较少,结局事件的发生率比较低时,无论观测的时间长或短,都不宜直接计箅率。此时可以全人口的发病(死亡)率作为标准,计箅出该观测人群的理论发病(死亡)人数,即预期发病(死亡)人数,再求观测人群中实际发病(死亡)人数与此预期发病人数之比,即得标化发病(死亡)比。最常用的指标为标化死亡比(standardizedmortalityratio,SMR)0有时某单位的历年人口资料不能得到,而仅有死亡人数、因素、FI期和年龄,则可计赏杯化比例死亡比(standardizedproportionalmortalityratio,SPMR)0其计箅方法是以全人口中某病因死亡占所有死亡之比例乘以某单位实际所有死亡数而得出某病闪的预期死亡数,然后计箅实际死亡数与预期死亡数之比。标化比事实上不是率,而是与全人口的发病(死亡)率计算出来的比。例如,某地区已知30〜40岁组居民有600名,某年内有4人死于冠心病,已知该年全人口30〜40岁组冠心病的死亡率2.5%。,求其SMR。H研究人群中观测死亡数(O)一标准人口(全人口)预期死亡数(E) 〜已知0=4,E=600X2.5%0=1.5,则SMR=4/1.5=2.67即某地区30〜40岁年龄组居民死于冠心病的危险达成相应一般人群的2.67倍。五、队列研究的偏倚及其防止偏倚(bias)是流行病学的一个术语,是指研究设计、实行、分析和推断过程中存在的各种对暴獬因素与疾病关系的错误估计,它系统地歪曲了暴餺因素与疾病间的啟实联系,其本质是一种系统误差。同样队列研究在设计、实行和资料分析等各个环节都》了能产生偏倚,因此,在各阶段都应采用措施,防止和控制偏倚的发生。一、常见偏倚的种类(一)选择偏倚(selectionbias)鉍抱负的研究样本人群应当是总体人群的一个无偏样本,假如研究人群在一些重要因素方面与•般人群或待研究的总体人群存在差异,即研究人群(样本)不是-•般同质人群的一个无偏的代表,将会引起选择偏倚。队列研究中选择偏倚常发生于•.最初选定参与研究的对象中有人拒绝参与;在进行历史性队列研究时,有些人的档案丢失了或记录不全;研究对象由志愿者组成,他们往往或是比较健康的,或是有某种特殊倾向或习惯;另夕卜,假如抽样方法不对的,或者执行不严格,则将导致严重的选择偏倚。(二)失访偏倚(withdraw bias)在研究过程中,某些选定的研究对象由于种种因素脱离了观测,研究者无法继续随访他们,这种现象称为失访(kxstfollow-up),因此对研究结果导致的影响称为失访偏倚。这是:队列研究中不可避免的偏倚,由于在一个较长的追踪观测期内,总会有对象迁移、外出、死于非终点疾病或拒绝继续参与观测而退出队列。失访从本质上是破坏了原有样本的代表性,失访对研究结果导致的影响类似于选择偏倚。一项研究的失访率最佳不超过10%,否则应慎重考虑结果的解释和推论。(三)信息偏倚 (informationbias)在获取暴露、结局或其他信息时所出现的系统误差或偏差叫信息偏倚。信息偏倚常是由于使用的仪器不梢确、洵问技巧不佳、检查技术不纯熟、医生诊断水平不髙或诊断标准不明确等导致的。此外,信息偏倚也可来源于记录错误,甚至造假等。TOC\o"1-5"\h\z(四)混杂偏倚(confounding bias)混杂是指所研究因索与结果的联系被其他外部因素所混淆,这个外部因素就叫混杂变址,它是疾病的一个危险因子,又与所研究的因素有联系,它在暴露组与非祕露组的分布是不均衡的。性别、年龄是最常见的混杂因素。 .二、常见偏倚的防止及解决\o"CurrentDocument"(一)选择偏倚 、选择偏倚一旦产生,往往很难消除,因此应采用防止为主的方针。一方面要严格按规定的标准选择对象;对象一旦选定,必须克服困难,坚持随访到底;假如有志愿者加人或有选定的研究对象拒绝参与,则应了解他们的基本情况后,与正常选择参与的人群进行比较,假如两者之间在一些基本特性上没有差异,则可认为导致的选择偏倚很小,否则,将引起的选择偏倚不能忽视。目前对选择偏倚限度的精确估计足困难的,对偏倚的解决亦缺乏有效的办法。(二)失访偏倚重要靠尽也许提高研究对象的依从性。在研究现场和研究对象的选择中就要考虑此问题,并应做好宣传解释工作。对失访者和已随访者的特性做比较分析,从各种途径了解失访者最后的结局,并与已随访者的最后观测结果做比较,以推测失访也许导致的影响。(三)信息偏倚选择精确稳定的测方法、调准仪器、严格实验操作规程、同等地对待每个研究对象、提尚临床诊断技术、明确各项标准、严格按规定执行是防止信息偏倚的電要措施。此外,还应认W•做好调查员培训,提高洵问调奄技巧,统一标准,并进行有关责任心和诚信度的教脊。信息偏倚一旦产生,往往既难发现,也难佔计与解决。常用的办法只是通过对一个随机样本进行取纪的调杳与检测,将两次检测的结果进行比较,以估计信息偏倚的也许与大小。(四)混杂偏倚在研究设计阶段可运用对研究对象作某种限制,以便获得同质的研究样本;在对照选择中采用匹配的办法,以保证两组在一些重要变址上的可比性;在研究对象抽样中,严格遵守随机化的原则等措施,来防止混杂偏倚的产生。混杂偏倚的解决一方面应根据混杂的判断标准来判断混杂存在的也许性,比较分层调整前后的两个效应测量值的大小以估计混杂作用的大小,进而采用分层分析、标准化或多因素分析等方法来解决混杂因素的混杂作用。第六节队列研究的优点及局限性由于研究对象暴露资料的收集在结局发生之前,并且都是由研究者亲自观测得到,所以资料可靠,回忆偏倚相对较小。 ,可以直接获得暴露组和非暴露组人群的发病率或死亡率,直接计算出尺K等反映暴露与疾病关联强度的指标,可以充足而直接地分析暴露的病因作用。由于病因发生在前,疾病发生在后,因果时间顺序明确,加之偏倚较少,又可直接计算各项测M:疾病危险关联的指标,故其检查病因假说的能力较强,一般可证实病因联系。有助于了解人群疾病的自然史。有时还也许获得多种预期以外的疾病的结局资料,分析一种因素与多种疾病的关系,也可以分析多种因素与一种或多种疾病之间的关系。 .二、局限性不适于发病率很低的疾病的病因研究,由于在这种情况下需要的研究对象数M太大,一般难以达成。 '由于随访时间较长,对象不易保持依从性,容易产生失访偏倚。研究花费的人力、物力、财力和时间较多,其组织与后勤工作亦相称艰巨。由于消耗太大,_故对研究设计的规定更严密,.资料收集的难度较大,不易实行。在随访过程中,未知变量引入人群,或人群中已知变娥的变化等,都可使结局受到影响,使分析鉍杂化。布的关系,从而探求病因线索。二、目的一)提供病因线索,产生病因假设通过对人群中某种疾病或健康状况的频率与某因素的暴露状态的研究,可分析该暴露因素与疾病或健康状况之间分布上的关联,提供与疾病或健康状况分布有关的线索,从而为病因学假设的建立提供依据。 *评价干预实验或现场实验的效果在某些情况下,假如不是直接控制危险因素,而是通过综合方式(如健康教育、健康促进等)减少对危险因素的騷露,对此干预措施的评价只®在人群水平上进行,则生态学研究更为合适,通过描述人群中某种(些)干预措施的实行状况及某种疾病或健康状况的频率的变化,作进一步比较和分析,对干预措施进行评价。例如,在某人群中推广低钠盐摄人,然后比较推广前后人均钠盐摄入水平的变化与人均血压值的变化趋势,以评价低钠盐干预的效果。.三)人群中变异较小和难以测定的暴露研究对于个体的暴辦剂量无法测咕的变a,如空气污染与肺癌的关系;在所研究地区变异非常小的变:《,如脂肪摄入域与乳腺癌的关系,生态学研究是唯一可供选择的研究方法。四)监测佔计某种疾病或健康状况的流行趋势,为制定疾病防止与控制的对策和措施提供依据。三、方法一)生态比较研究生态比较研究(ecologicalcomparisonstudy)是生态学研究中应用最广泛的一种方法,观测不同人群或地区某种疾病或健康状况的分布,然后根据同一时间内,不同地区或人群疾病或健康状况分布的差异,探索环境因素与疾病的关系,提出病因假设。生态比较研究更常用来比较不同人群中某因素的平均暴满水平和某种疾病或他康状况频率之间的关系,了解这些人群中暴露因素的频率或水平,比较不同暴露水平的人群中疾病或健康状况的频率,从而为病因探索提供线索;生态比较研究也可应用于评价社会设施、人群干预以及在政策、法令的实行等方面的效果。二)生态趋势研究生态趋势研究(ecologicaltrendstudy)是连续观测平均暴辦水平的变化(或者给予干预)和一个群体中某种疾病或健康状况频率变化的关系,了解其变化趋势,通过比较暴餺水平变化前后疾病或健康状况频率的变化情况,判断该暴餺与某种疾病或健康状况的联系。它足先将一个地区的预定调丧人群按年龄、出生年代等时间变丨it提成不同的群组,然后调仵各人群疾病或健康

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论