流行病现况研究重点归纳总结_第1页
流行病现况研究重点归纳总结_第2页
流行病现况研究重点归纳总结_第3页
流行病现况研究重点归纳总结_第4页
流行病现况研究重点归纳总结_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《流行病学》第五版笔记精华-PAGE1–第二节

现况研究的设计与实施一、明确调查目的和类型:然后根据具体的研究目的来确定采用普查还是抽样调查。二、确定研究对象:如果是普查,在设计时可以将研究对象规定为某个区域内的全部居民,或其中的一部分,如儿童,即≤14岁者。如果是抽样调查,则首先要明确该抽样研究的总体是什么,其次要确定采用何种抽样方法及其抽取多大的样本等。抽样调查选择研究对象的基本原则是保证每一个研究对象是以等同的机率从其总体中选出的,即研究样本要有代表性。三、样本含量和抽样方法:(一)样本含量决定现况研究的样本大小的因素来自多个方面,但其主要是①预期的现患率(P),如现患率越靠近50%,样本含量就越小;反之,则要大些。②对调查结果精确性的要求,即允许误差(d)越大,所需样本就越小。(二)抽样方法抽样分为非随机抽样和随机抽样。随机抽样方法有单纯随机抽样、系统抽样、分层抽样和整群抽样。1、单纯随机抽样(simplerandomsampling):也称简单随机抽样。从总体N个对象中,利用抽签或其他随机方法(如随机数字)抽取n个,构成一个样本。它的重要原则是总体中每个对象被抽到的概率相等。2、系统抽样(systemicsampling):又称机械抽样,是按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。方法:设总体单位数为N,需要调查的样本数为n,则抽样比为n/N,抽样间隔为K=N/n。将每K个单位为一组,然后用随机方法确定每一组的单位号(1,2,3,···,K),最后每隔K个单位抽取一个作为研究对象。优点:①事先不需要知道总体内的单位数。可以根据估计而确定抽样间隔(K);②在人群现场易进行,如可按门牌号间隔K户调查一户;③样本是从分布在总体内部的各部分的单元中抽取的,分布比较均匀,代表性较好。缺点:假如总体各单位的分布有周期性趋势,而抽取的间隔恰好是其周期,则可能产生偏性。3、分层抽样(stratifiedsampling):先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。优点:可以提高总体指标估计值的精确度;所得到的结果准确性更高,组织管理更方便;除了能估计总体的参数值,还可以分别估计各个层内的情况。4、整群抽样(clustersampling):将总体分成若干群组,抽取其中部分群组作为观察单位组成样本的抽样方法。若被抽到的群组中的全部个体均作为调查对象,称为单纯整群抽样(simpleclustersampling);若调查部分个体,称为二阶段抽样(twostagessampling)。特点:①易于组织、实施方便,可以节省人力、物力;②如群间差异越小,抽取的群越多,则精密度越好;③抽样误差较大,故样本量比其他方法要增加1/2。5、多级抽样(multistagesampling):在大型流行病学调查中,常结合使用几种抽样方法。先从总体中抽取范围较大的单元,称为一级抽样单位(如省),再从每个抽得的一级单元中抽取范围较小的二级单元(县),依次类推,最后抽取其中范围更小的单元(如村)作为调查单位。优点:可以充分利用各种抽样方法的优势,克服各自的不足,并能节省人力、物力。缺点:在抽样之前要掌握各级调查单位的人口资料及特点。四、确定收集资料的方法:方法一经确定,就不应变更。一般有两种方法:一是通过测定或检查的方法,如测定血压是否正常等。另一是通过直接用调查表询问研究对象,让其回答或回忆暴露或疾病的情况。五、现况研究中常见的偏倚与质量控制(一)常见偏倚:调查或研究结果与真实情况不符称之为偏倚。原因:①主观选择研究对象,具有随意性。②任意变换抽样方法。③调查对象不合作或因种种原因不能或不愿意参加调查从而降低了应答率,此种现象称为无应答偏倚。若应答率低于10%就较难以以调查结果来估计整个研究对象的状况。④所调查到的对象均为幸存者,无法调查死亡的人,不能全面反映实际情况此种现象又称之为幸存者偏倚。由以上原因导致的偏倚主要是选择偏倚,其最终导致研究样本缺乏代表性而使研究结果不能外推。⑤询问调查对象有关问题时,种种原因回答不准确从而引起偏倚(报告偏倚)或调查对象对过去的暴露史或疾病史等回忆不清,特别是健康的调查对象由于没有疾病的经历,而容易将过去的暴露等情况遗忘,而导致回忆偏倚。⑥调查员有意识地深入调查某些人的某些特征,而不重视或马虎对待其他一些人的这些特征而导致的偏倚,为调查偏倚。⑦资料收集、病患等情况的测量中由于测量工具、检验方法不正确,化验技术操作不规范等导致的系统误差则会介入测量偏倚。(二)质量控制:1.严格遵照抽样方法的要求,确保抽样过程的随机化原则的完全实施;2.提高研究对象的依从性和受检率;3.正确选择测量工具和检测方法;4.组织好研究工作,调查员一定要经过培训,统一标准和认识;5.做好资料的复查、复核等工作;6..选择正确的统计分析方法,注意辨析混杂因素及其影响。

六、调查表与调查员(一)调查表编制方法:步骤:将根据研究目的确定的调查内容归纳为几大项,再将大项分别分为若干个小项,然后将各小项变为具体的问句。注意问题:1、调查表上问题的排列:将调查者易于接受的问题安排在前面,提高被调查者对调查的依从性或应答率。2、调查表上问句的措词:要明确,易懂,尽量避免使用专业术语,不带有导向性,题目也应贴近盲法的原则。如将“大肠癌病例对照调查表”改为“生活与健康调查表”。3、表式:根据要求回答的形式,分为“闭关式”和“开放式”的两种。根据是否采用计算机来作资料处理分为编码调查表和非编码调查表。“闭关式”调查表要求被调查者只能选定其中的一个答案。因此答案的范围就相当于测量的尺度,而这个尺度应包含对这个问题可能出现的所有答案,并且各个备选答案应互斥。“开放式”调查表则适合于那些难以限定答案尺度的问题,如年龄、出生日期等等。4、应有核实被调查者回答问题的正确性项目。如询问年龄,可以同时设置“您今年多大?”和“您是哪年哪月出生?”5、调查表内容中应有调查开始和结束时间等项目记录,以核查调查员在调查时的认真程度。6、预试:进行预试验(预调查)(pilotstudy),以确定调查表的可行性。(二)调查项目(变量)的规定:1、定义研究因素:对研究的任何一个因素或变量,都应有明确的定义。2、设定即要实际可行又要能提供较丰富的信息的测量尺度。测量尺度实际上是某一测量结果的可能范围。分为:①二值尺度(又称0-1变量),如某人是否“有病”或“无病”;某项检测结果的“阳性”与“阴性”等。②列名尺度:无顺序,可分类,类与类之间界线明确。如,血型的分类(A、B、O、AB型)指标等。③序列尺度:有顺序,可分类,但界限不很清楚;如,每日吸烟支数(0支,<5支,<10支,<15支,<20支和≥20支)等变量指标。④区间尺度:有顺序且为连续性。如身高、体重、血压等变量指标属于该类。(三)调查员:要有实事求是的科学态度,具有责任心,严格按照调查表上的问题提出询问,态度要和蔼,坚守中立的态度,不可有任何形式的暗示或导向性语句或示意,熟练掌握流行病学访问调查的技巧等。七、现况研究的资料分析

现以Ferris和Anderson(1962)所进行的一个关于慢性呼吸道疾病与吸烟、空气污染的现况研究资料为例。其中,有关吸烟和慢性呼吸道疾病的资料经整理如表3-2所示。表3-2吸烟与慢性呼吸道疾病的现状调查结果

吸烟不吸烟合计现患病人14238180非病人12,00013,10025,100合计12,14213,13825,280根据表3-2,即可计算出吸烟组和不吸烟组的慢性呼吸道疾病的现患率,其分别为142/12,142=11.69‰和38/13,138=2.89‰;也可按患病和非患病组计算各自的暴露率,即慢性呼吸道疾病患者中吸烟的暴露率为142/180=78.89%;而非病人中吸烟的暴露率则仅为12,000/25,100=47.81%。除此描述外,尚须进行统计学的显著性检验和必要时进行吸烟与慢性呼吸道疾病之间关系的危险度估计分析。(一)显著性检验以表3-2为例:可用χ2检验,以分别说明患病组与非患病组的吸烟暴露率,和不同暴露状态(吸烟、不吸烟)组的现患率有无显著性差别。两个率的显著性检验方法如u检验、Poisson检验等也可根据不同适用条件选用。第三节生态学研究生态学研究(ecologicalstudy):是描述性研究的一种类型,它是在群体的水平上研究某种因素与疾病之间的关系,以群体为观察和分析的单位,通过描述不同人群中某因素的暴露状况与疾病的频率,分析该暴露因素与疾病之间的关系。该研究在收集疾病和健康状态以及某因素的资料时,不是以个体为观察、分析的单位而是以群体为单位的(如国家、城市、学校等),这是其最基本特征。生态学研究提供的信息是不完全的,只是一种粗线条的描述性研究。研究的目的:1、提供病因线索,产生病因假设;2、评估人群干预措施的效果。生态学研究的方法(一)生态比较研究(ecologicalcomparisonstudy):是观察不同人群或地区某种疾病的分布,然后根据疾病分布的差异,提出病因假设。这种研究不需要暴露情况的资料,也不需要复杂的资料分析方法。如描述胃癌在全国各地区的分布,得到沿海地区的胃癌死亡率较其他地区高,从而提出沿海地区环境中如饮食结构等可能是胃癌的危险因素之一。生态比较研究也可应用于评价社会设施、人群干预以及在政策、法令的实施等方面的效果。(二)生态趋势研究(ecologicaltrendstudy):是连续观察不同人群中某因素平均暴露水平的改变和(或)某种疾病的发病率、死亡率变化的关系,了解其变动趋势;通过比较暴露水平变化前后疾病频率的变化情况,来判断某因素与某疾病的联系。如某地在实施了大肠癌序贯筛检等综合防治措施后,10余年的大肠癌死亡率曲线有一个明显的下降趋势,此提示了这一综合措施在降低大肠癌死亡率方面是有效的。生态学研究的优点和局限性(一)优点:1、应用常规资料或现成资料(如数据库)来研究,因而节省时间、人力和物力。2、对病因未明疾病的病医学研究可提供病因线索供深入研究,这是最显著的优点。3、个体的暴露剂量无法测量的唯一可供选择的研究方法。如空气污染与肺癌的关系。4、对于研究因素在一个人群中暴露变异范围小。5、适合于对人群干预措施的评价。6、在疾病监测工作中,可估计某种疾病发展的趋势。(二)局限性:1、生态学谬误(ecologicalfallacy)是生态学研究最主要的缺点,其是由于生态学研究是由各个不同情况的个体“集合”而成的群体(组)为观察和分析的单位,以及存在的混杂因素等原因而造成的研究结果与真实情况不符。正因为这样的原因,故在一般情况下生态学研究中生态学谬误常难以避免。2、混杂因素往往难以控制3、人群(组)中某些变量,特别是有关社会人口学及环境方面的一些变量存在多重共线性问题而影响对暴露因素与疾病之间关系的正确分析。4、生态学研究难以确定两变量之间的因果联系。鉴于生态学研究的特点及其局限性,应用时应注意尽可能集中研究目的,不要设置研究问题太多;选择研究人群时,应尽可能使组间可比,观察分析的单位尽可能地多,每单位内人数尽可能少;资料分析时尽可能用生态学回归分析(不只用相关分析),分析模型中尽可能多纳入一些变量;在对研究结果进行推测时,应尽量与其他非生态学研究结果相比较,并结合对所研究问题的专业知识等等来综合分析和判断。第四章队列研究第一节概述一、概念队列研究(cohortstudy):是将一个范围明确的人群按是否暴露于某可疑因素及其暴露程度分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局的差异,从而判定暴露因子与结局之间有无因果关联及关联大小的一种观察性研究方法。这里观察的结局主要是与暴露因子可能有关的结局。又称前瞻性研究(prospectivestudy)、发生率研究(incidencestudy)、随访研究(follow-upstudy)及纵向研究(longitudinalstudy)。暴露(exposure):是指研究对象接触过某种待研究的物质(如重金属)、具备某种待研究的特征(如年龄、性别及遗传等)或行为(如吸烟)。队列:表示一个特定的研究人群组。根据特定条件的不同,一般有两种情况:一是指特定时期内出生的一组人群,叫出生队列(birthcohort);另一种是泛指具有某种共同暴露或特征的一组人群,一般即称之为队列或暴露队列。根据人群进出队列的时间不同,队列又可分为两种:一种叫固定队列(fixedcohort),是指人群都在某一固定时间或一个短时期之内进入队列,之后对他们进行随访观察,直至观察期终止,成员没有无故退出,也不再加入新的成员,即在观察期内保持队列的相对固定。另一种叫动态人群(dynamicpopulation),是相对固定队列而言的,即在某队列确定之后,原有队列成员可以不断退出,新的观察对象可以随时加入。危险因素(riskfactor),又称为危险因子,泛指能引起某特定结局(outcome)(如疾病)发生,或使其发生的概率增加的因子,包括个人行为、生活方式、环境和遗传等多方面的因素。二、基本原理:在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组,高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并登记各组人群待研究的预期结局的发生情况(如疾病、死亡、或其他健康状况),比较各组结局的发生率,从而评价和检验危险因素与结局的关系。在队列研究中,所选研究对象必须是在开始时没有出现研究结局,但有可能出现该结局(如疾病)的人群。暴露组与非暴露组必须有可比性,非暴露组应该是除了未暴露于某因素之外,其余各方面都尽可能与暴露组相同的一组人群。根据基本原理,可以分析出一些基本特点:1)属于观察法2)设立对照组3)由“因”及“果”4)能确证暴露与结局的因果联系。三、研究目的1.检验病因假设:一次队列研究可以只检验一种暴露与一种疾病之间的因果关联,也可同时检验一种暴露与多种结果之间的关联。2.评价预防效果:有些暴露有预防某结局发生的效应,即出现预防效果。如戒烟可减少吸烟者肺癌发生的危险等,这里的预防措施不是人为给予的,而是研究对象自发行为。这种现象被称为“人群的自然实验”。3.

研究疾病自然史:队列研究可以观察人群从暴露于某因素后,疾病逐渐发生、发展,直至结局的全过程,不但可了解个体疾病的全部自然史,而且可了解全部人群疾病的发展过程。四、研究类型队列研究依据研究对象进入队列时间及终止观察的时间不同,分为:(一)前瞻性(prospective)队列研究:研究对象的分组是根据研究开始时(现时)研究对象的暴露状况而定的。此时,研究的结局还没有出现,还需要前瞻观察一段时间才能得到,称为即时性(concurrent)或前瞻性队列研究。优点:资料的偏倚较小,结果可信;缺点:观察的人群样本大,观察时间长、花费大,影响其可行性。(二)历史性(historical)队列研究:研究对象的分组是根据研究开始时研究者已掌握的有关研究对象在过去某个时点的暴露状况的历史材料作出的;研究开始时研究的结局已经出现,其资料可从历史资料中获得,不需要前瞻性观察,称为非即时性(non-concurrent)或历史性队列研究。优点:省时、省力、出结果快。缺点:历史资料内容上未必符合要求。(三)双向性(ambispective)队列研究:也称混和型队列研究,即在历史性队列研究之后,继续前瞻性观察一段时间,它将前瞻性队列研究与历史性队列研究结合起来,兼有二类的优点,一定程度上弥补了相互的不足。不同研究类型的选用原则:前瞻性队列研究:①应有明确的检验假设,检验的因素必须找准;②所研究疾病的发病率或死亡率应较高,如不低于5‰;③应明确规定暴露因素,并且应有把握获得观察人群的暴露资料;④应明确规定结局变量,如发病或死亡,并且要有确定结局的简便而可靠的手段;⑤应有把握获得足够的观察人群,并将其清楚地分成暴露组与非暴露组;⑥大部分观察人群应能被长期随访下去,并取得完整可靠的资料。应有足够的人、财、物力支持该项工作。历史性队列研究:除考虑前述的①至⑤点外,还应考虑是否有足够数量的完整可靠的在过去某段时间内有关研究对象的暴露和结局的历史记录或档案材料。双向性队列研究:当基本具备进行历史性队列研究的条件下,如果从暴露到现在的观察时间还不能满足研究的要求,还需继续前瞻性观察一段时间时,则选用该研究。第二节设计与实施一、确定研究因素:常称为暴露因素或暴露变量,通常是在描述性研究和病例对照研究的基础上确定的。在研究中要考虑如何选择、规定和测量暴露因素。暴露的测量应采用敏感、精确、简单和可靠的方法。二、确定研究结局:结局变量(outcomevariable)也叫结果变量,简称为结局,指随访观察中将出现的预期结果事件,即研究者希望追踪观察的事件,是观察的自然终点,不是观察期的终止。既可是终极的结果(如发病或死亡),也可是中间结局(如分子或血清的变化)。除研究结局,可同时收集多种可能与暴露有关的结局。

三、确定研究现场:除要求有足够数量的符合条件的研究对象,还要求当地领导重视,群众理解和支持。四、确定研究人群:包括暴露组和对照组:1.暴露人群的选择:暴露人群即对待研究因素有暴露的人群。有四种选择:(1)职业人群:研究某种可疑的职业暴露因素与疾病或健康的关系的选择;另外,由于职业人群有关暴露与疾病的历史记录较为全面、真实,故常做历史性队列研究。(2)特殊暴露人群:研究某些罕见的特殊暴露的唯一选择,如选择原子弹爆炸的受害者,研究射线与白血病的关系。某些职业暴露的危险一旦认识到了,大都采取防护措施以减少暴露,所以不宜前瞻性队列研究,常用历史性队列研究。(3)一般人群:即某行政区域或地理区域范围内的全体人群:①着眼于一般人群及今后在一般人群中的防治;②所研究的因素和疾病都是一般人群中常见的,特别是在研究一般人群的生活习惯或环境因素时。(4)有组织的人群团体:一般人群的特殊形式,如医学会会员,工会会员等。目的是利用他们的组织系统,便于有效地收集随访资料。职业和经历往往相同,可增加其可比性。2、对照人群的选择:基本要求是尽可能与暴露组的可比性,即对照人群除未暴露于所研究的因素外,其它各种影响因素或人群特征(年龄、性别、民族、职业、文化程度等)都应尽可能地与暴露组相同。(1)内对照:即先选择一组研究人群,将其中暴露于所研究因素的对象作为暴露组,其余即为非暴露组;(2)特设对照,也称外对照,选择职业人群或特殊暴露人群作为暴露人群时,在该人群之外去找对照组;(3)总人口对照:利用整个地区的现成的发病或死亡统计资料,对照中可能包含有暴露人群;(4)多重对照:或叫多种对照,即用上述两种或两种以上的形式选择的人群同时作对照。五、确定样本大小:影响样本含量的几个因素1.一般人群(对照人群)中所研究疾病的发病率p0越接近0.5,样本量越大;2.暴露组与对照组人群发病率之差(d=p1-p0)d值越大,样本量越小;3.要求的显著性水平,即检验假设时的第Ⅰ类错误(假阳性错误)α值。α值越小,样本量越大。4.效力:效力(power)又称把握度(1-β),β为检验假设时出现第Ⅱ类错误的概率,而1-β为检验假设时能够避免假阴性的能力。若要求效力(1-β)越大,即β值越小,则所需样本量越大。六、基线资料的收集:收集每个研究对象在研究开始时的基本情况,包括待研究的暴露因素的暴露状况,疾病与健康状况,年龄、性别、职业、婚姻等个人状况,家庭环境、个人生活习惯及家族疾病史等。获取方式:①查阅医院、工厂、单位及个人健康保险的记录或档案;②访问研究对象或其它能够提供信息的人;③对研究对象进行体格检查和实验室检查;④环境调查与检测。七、随访:1、随访方法包括对研究对象的直接面对面访问、电话访问、自填问卷、定期体检,环境与疾病的监测等资料的收集等,应根据随访内容、随访对象、投入研究人力、物力等条件来考虑。在整个随访过程中,随访方法应保持不变。2、观察终点(end-point)就是指研究对象出现了预期的结果,达到了这个观察终点,就不再对该研究对象继续随访。3、观察的终止时间是指整个研究工作截止的时间,也即预期可以得到结果的时间。4、随访的间隔与次数将视研究结局的变化速度、研究的人力、物力等条件而定。一般慢性病的随访间隔期定为1~2年。5、随访者:随访调查员必须进行培训。研究者可参加随访,但最好不亲自参与。八、质量控制:1、调查员的选择:调查员应有严谨作风和科学态度,品质诚实可靠。另外,调查员的年龄、性别、种族、社会经济地位等与研究对象相匹配,有调查的专业知识。2、调查员培训:严格的培训,掌握统一的方法和技巧,并要进行考核。3、制定调查员手册:编一本调查员手册,内列全部操作程序,注意事项等。4、监督:①另一名调查员抽样重复调查;②数值检查或逻辑检错;③定期观察每个调查员工作;④对不同调查员所收集的变量分布进行比较;⑤对变量的时间趋势进行分析;⑥在访谈时使用录音机录音等。资料的整理与分析一、基本整理模式:根据统计分析的要求,队列研究的资料一般整理成下表的模式。病例非病例合计发病率暴露组aba+b=n1a/n1非暴露组cdc+d=n0c/n0合计a+c=m1b+d=m0a+b+c+d=t式中a/n1和c/n0分别为暴露组的发病率和非暴露组的发病率,是统计分析的关键指标。二、人时的计算:常用的人时单位是人年,常用有:1、以个人为单位计算暴露人年(精确法)如样本不太大时,可用此法计算。2、近似法计算暴露人年:不知道每个队列成员进入与退出的具体时间或样本太大时用该法。即平均人数乘以观察年数得到总人年数,平均人数一般取相邻两年的年初人口的平均数或年中人口数。3、寿命表法:观察对象人数较多,难以用精确法计算暴露人年,但又要求有一定的精度时用此法。

三、率的计算(一)常用指标:1、累积发病率(cumulativeincidence):用观察开始时的人口数作分母,以整个观察期内的发病(或死亡)人数为分子,变化范围为0~1,其流行病学意义有赖于对累积时间长度的说明。2、发病密度(incidencedensity):有各种失访及每个对象被观察的时间不一样等使资料不整齐。此时需以观察人时为分母计算发病率,用人时为单位计算出来的率带有瞬时频率性质称为发病密度。最常用的人时单位是人年,以此求出人年发病(死亡)率。发病密度的量值变化范围是从0到无穷大。3、标化比:当研究对象数目较少,结局事件的发生率比较低时,是以全人口发病(死亡)率做为标准,算出该观察人群的理论发病(死亡)人数,即预期发病(死亡)人数,再求观察人群中实际发病(死亡)人数与此预期发病人数之比,即得标化发病(死亡)比。最常用的指标为标化死亡比(standardizedmortalityratio,SMR),标化比实际上不是率,而是以全人口的发病(死亡)率做为对照组而计算出来的比。例如某厂30-40岁组工人有500名,某年内有2人死于肺癌,已知该年全人口30-40岁组肺癌的死亡率2‰,求其SMR。已知O=2,E=500×2‰=1SMR=2/1=2:即某厂30-40岁年龄组工人死于肺癌的危险达到相应一般人群的2倍。如果某单位的历年人口资料不能得到,而仅有死亡人数、原因、日期和年龄,则可改算标化比例死亡比(standardizedproportionalmortalityratio,SPMR)。是以全人口中某病因死亡占全部死亡之比例乘以某单位实际全部死亡数而得出某病因的预期死亡数,然后计算实际死亡数与预期死亡数之比。例如某厂某年30-40岁年龄组工人死亡总数为100人,其中因肺癌死亡5人,全人口中该年30-40岁组肺癌死亡占全死因死亡的比例为2.2%,则SPMR=5/(100*2.2%)=2.27。即某厂30-40岁年龄组肺癌死亡的危险为一般人群的2.27倍。(二)显著性检验:队列研究为抽样研究,发现两组率有差别时,要考虑抽样误差的可能,进行统计学显著性检验。1、U检验:当研究样本量较大,p和1-p都不太小,如np和n(1-p)均大于5时,样本率的频数分布近似正态分布,此时可应用正态分布的原理来检验率的差异是否有显著性,即用U检验法来检验暴露组与对照组之间率的差异。P1为暴露组的率,P0为对照组的率,n1为暴露组观察人数,n0为对照组的观察人数,Pc为合并样本率,其中X1和X0分别为暴露组和对照组结局事件的发生数。求出u值后,查u界值表得P值,按所取的检验水准即可作出判断。2.其他检验方法:如果率比较低,样本较小时,可改用直接概率法、二项分布检验或泊松(Poisson)分布检验;率差的显著性检验可以利用的四格表资料的卡方检验;对SMR或SPMR的检验,实际是所得结果值偏离1的检验,其检验方法可用X2检验或计分检验(scoretest)。

四、效应的估计:队列研究的最大优点就在于它可以直接计算出研究对象的结局的发生率,能直接计算出暴露组与对照组之间的率比和率差,即相对危险度RR(relativerisk)与归因危险度AR(attributablerisk),从而可直接准确地评价暴露的效应。1、相对危险度(RR)也叫危险比(riskratio)或率比(rateratio),是反映暴露与发病(死亡)关联强度的最有用的指标,式中Ie和Io分别代表暴露组和非暴露组的率。RR表明暴露组发病或死亡的危险是非暴露组的多少倍。RR值越大,表明暴露的效应越大,暴露与结局关联的强度越大。RR算出的只是一个点估计值,是一个样本值。若要估计数值的总体范围,应考虑到抽样误差的存在,需计算其可信区间,通常用95%可信区间。常用的有Woolf法和Miettinen法。如Woolf法。lnRR的95%可信区间=其反自然对数即为RR的95%可信区间。2.

归因危险度(AR)又叫特异危险度、率差(ratedifference,RD)和超额危险度(excessrisk),是暴露组发病率与对照组发病率相差的绝对值,它表示危险特异地归因于暴露因素的程度。RR说明暴露者与非暴露者比较增加相应疾病危险的倍数;AR则一般是对人群而言,暴露人群与非暴露人群比较,所增加的疾病发生数量,如果暴露因素消除,就可减少这个数量的疾病发生。前者具有病因学的意义,后者更具有疾病预防和公共卫生学上的意义。以表4-9,从RR看,吸烟对肺癌的作用较大,病因联系较强;从AR看,吸烟对心血管疾病的作用较大,预防所取得的社会效果将更大。表4-9吸烟者与非吸烟者死于不同疾病的RR与AR疾病吸烟者非吸烟者RRAR(1/10万人年)(1/10万人年)(1/10万人年)肺癌50.124.6910.745.43心血管疾病296.75170.321.7126.43

3.

归因危险度百分比(AR%):又称为病因分值EF(etiologicfraction),是指暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。或以表4-9为例计算肺癌的。说明吸烟者中发生的肺癌有90.6%归因于吸烟。4、人群归因危险度(populationattributablerisk,PAR)与人群归因危险度百分比(PAR%)人群归因危险度百分比也叫人群病因分值(populationetiologicfraction,PEF)。PAR是指总人群发病率中归因于暴露的部分,而PAR%是指PAR占总人群全部发病(或死亡)的百分比。RR和AR都说明暴露的生物学效应,即暴露的致病作用有多大;而PAR和PAR%则说明暴露对一个具体人群的危害程度,以及消除这个因素后可能使发病率或死亡率减少的程度,它既与RR和AR有关,又与人群中暴露者的比例有关。PAR和PAR%的计算式如下:PAR=It-I0It代表全人群的率,I0为非暴露组的率。式中Pe表示人群中有某种暴露者的比例,从该式可看出PAR%与相对危险度及人群中暴露者的比例的关系。继续以表4-9的数据资料为例,已知非吸烟者的肺癌年死亡率为0.0469‰(I0),全人群的肺癌年死亡率为0.2836‰(It),则:①PAR=It—I0=0.2836‰—0.0469‰=0.2367‰②从计算结果可知,虽然吸烟导致肺癌的AR%达90.6%,但因人群中只有部分人吸烟,故其PAR%仅为83.5%。5.剂量反应关系的分析:如果某种暴露存在剂量效应关系,即暴露的剂量越大,其效应越大,则该种暴露作为病因的可能性就增大。其分析方法是先列出不同暴露水平下的发病率,然后以最低暴露水平组为对照,计算各暴露水平的相对危险度和率差。必要时,应对率的变化作率的趋势性检验。

偏倚及其防止

一、常见偏倚的种类:1、选择偏倚(selectionbias):发生于研究对象中有人拒绝参加;历史性队列研究中有些人的档案丢失或记录不全;研究对象由较健康志愿者组成;早期病人研究开始时未发现、抽样方法不正确、执行不严格。2、失访偏倚(losttofollow-up)在一个较长的追踪观察期内,总会有对象迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列。失访率最好不超过10%。3、信息偏倚(informationbias)在获取暴露、结局或其他信息时所出现的系统误差或偏差,又称为错分偏倚(misclassificationbias),如判断有病为无病,判断有无暴露等。由于仪器不精确、询问技巧不佳、检验技术不熟练、医生诊断水平不高或标准不明确、记录错误甚至造假等造成。若发生于一组而不发生于另一组,或两组错分的程度不同,则结果可能比实际的相对危险度高或低。前者称为非特异性错分,将后者称为特异性错分。4、混杂偏倚(confoundingbias)混杂是指所研究因素与结果的联系被其它外部因素所混淆,这个外部因素就叫混杂变量.它是疾病的一个危险因子,又与所研究的因素有联系,它在暴露组与对照组的分布是不均衡的。性别、年龄是最常见的混杂因素。二、常见偏倚的预防:1、选择偏倚的防止:预防为主的方针。首先要有一个正确的抽样方法,即严格遵守随机化的原则;严格按规定的标准选择对象;对象一旦选定,坚持随访到底。2、失访偏倚的防止:提高研究对象的依从性。失访率达到20%以上,则研究的真实性值得怀疑。3、信息偏倚的防止:选择精确稳定的测量方法、调准仪器、严格实验操作规程、同等地对待每个研究对象、提高临床诊断技术、明确各项标准、严格按规定执行、做好调查员培训是重要措施。4、混杂偏倚的防止:对研究对象作某种限制以获得同质的样本;在对照选择中采用匹配的办法,在研究对象抽样严格遵守随机化的原则等措施。三、常见偏倚的估计与处理:1、选择偏倚与失访失倚:通过审查研究对象的选择方法、调查研究对象的依从率、比较失访及退出研究者与继续研究者的基本特征等,可初步估计选择偏倚与失访失偏产生的可能性。2.信息偏倚:通过对一个随机样本进行重复的调查与检测,将两次检测的结果进行比较,以估计信息偏倚的可能与大小。3、混杂偏倚:首先应根据混杂的判断标准来判断混杂存在的可能性,比较分层调整前后的两个效应测量值的大小以估计混杂作用的大小。混杂偏倚的处理可采用分层分析、标准化或多因素分析的方法。第五节研究的优缺点一、优点:1、由于研究对象暴露资料的收集在结局发生之前,并且都是由研究者亲自观察得到的,所以资料可靠,一般不存在回忆偏倚。2、可以直接获得暴露组和对照组人群的发病或死亡率,可直接计算出RR和AR等反映疾病危险关联的指标,可以充分而直接地分析暴露的病因作用。3、由于病因发生在前,疾病发生在后,因果现象发生的时间顺序上合理,加之偏倚较少,又可直接计算各项测量疾病危险关联的指标,故其检验病因假说的能力较强,一般可证实病因联系。4、有助于了解人群疾病的自然史。有时还可能获得多种预期以外的疾病的结局资料,分析一因与多种疾病的关系。5、样本量大,结果比较稳定。二、缺点:1、不适于发病率很低的疾病的病因研究,因为在这种情况下需要的研究对象数量太大,一般难以达到。2、由于随访时间较长,对象不易保持依从性,容易产生各种各样的失访偏倚。同时由于跨时太长,研究对象也容易从半途中了解到研究目的而改变他们的态度。3、研究耗费的人力、物力、财力和时间较多,其组织与后勤工作亦相当艰巨。4、由于消耗太大,故对研究设计的要求更严密,资料的收集和分析也增加了一定的难度,特别是暴露人年的计算较繁重。5、在随访过程中,未知变量引入人群,或人群中已知变量的变化等,都可使结局受到影响,使资料的收集和分析复杂化。 病例对照研究(case-controlstudy)一、基本原理:以现在确诊的患有某特定疾病的病人作为病例,以不患有该病但具有可比性的个体作为对照,通过询问,实验室检查或复查病史,搜集既往各种可能的危险因素的暴露史,测量并比较病例组与对照组中各因素的暴露比例,经统计学检验,若两组差别有意义,则可认为因素与疾病之间存在着统计学上的关联。在评估了各种偏倚对研究结果的影响之后,再借助病因推断技术,推断出某个或某些暴露因素是疾病的危险因素,而达到探索和检验疾病病因假说的目的。这是一种回顾性的,由结果探索病因的研究方法,是在疾病发生之后去追溯假定的病因因素的方法。最早的病例对照研究见于1843年Guy向伦敦统计学会所做的分析职业暴露和肺结核发生关系的报告。最早的病例对照研究的概念见于Louis的著作。符合现代病例对照研究概念的研究首推LaneClaypon报告的生殖因素与乳腺癌关系的研究。暴露(exposure)是指研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态。这些因素、特征或状态即为暴露因素。暴露因素也叫研究变量(variable)。二、病例对照研究的类型1、病例与对照不匹配:在设计所规定的病例和对照人群中,分别抽取一定量的研究对象,一般对照数目应等于或多于病例人数。此外没有其它任何限制与规定。2、病例与对照匹配:匹配或称配比(matching)即要求对照在某些因素或特征上与病例保持一致。匹配分为:A:频数匹配(frequencymatching)。匹配的因素所占的比例,在对照组与在病例组一致。如病例组中男女各半,则对照组中也如此。B:个体匹配(individualmatching):指以病例和对照的个体为单位进行匹配。1﹕1匹配又称配对(pairmatching),1﹕2、1﹕3、……1﹕R匹配时,称为匹配。配比的目的,首先在于提高研究效率。其次在于控制混杂因素。所以匹配的特征或变量必须是已知的混杂因子,或有充分的理由怀疑为混杂因子。把不必要的项目列入匹配,企图使病例与对照尽量一致,就可能徒然丢失信息,增加工作难度,结果反而降低了研究效率。这种情况称为配比过度(over-matching)。匹配的变量应当一致到什么程度,取决于变量的性质、实际可能与必要性。如果匹配的因素与暴露有联系,则会低估暴露与疾病的联系。匹配和匹配后按匹配因素进行分层分析,是控制匹配因素的混杂作用的必要途径。病例对照研究的衍生类型:1、巢式病例对照研究:在对一个事先确定好的队列进行随访观察的基础上,再应用病例对照研究(主要是匹配病例对照研究)的设计思路进行研究分析。(1)方法:①

确定某一人群作为研究队列;②

收集队列内每个成员的相关信息和生物标本;③

随访一段预定的时间;④

确定随访期内发生的所研究疾病的全部病例组成;⑤

用危险集抽样为每个病例抽取一定数量的对照组成对照组;⑥

抽取已收集好的两组成员的相关信息和生物标本做必要的化验;⑦做统计分析计算率和OR;⑧获得研究结果并做出结论。(2)类型:前瞻性和回顾性两类。①前瞻性巢式病例对照研究(prospectivenestedcase-controlstudy):在研究开始时根据一定的条件选择某一人群作为队列,然后前瞻性地随访一定的时间确定病例组和对照组,在时间特点为从现在到将来。②回顾性巢式病例对照研究(retrospectivenestedcase-controlstudy):根据研究开始之前的一段特定时间的情况选择某一人群作为研究队列,根据现在的情况确定病例组和对照组,时间上特点为从过去到现在。2.病例-队列研究(case-cohortstudy):又称病例参比式研究(case-basereferencestudy),(1)基本原理:队列研究开始时,在队列中按一定比例随机抽样选出一个有代表性的样本作为对照组,观察结束时,队列中出现的所研究疾病的全部病例作为病例组,与上述随机对照组进行比较。与巢式病例对照研究的不同之处在于:①对照是随机选取,不与病例进行配比。②随机对照组中的成员如发生被研究的疾病,既作为对照,又同时作为病例。③可以同时研究几种疾病,不同的疾病有不同的病例组,但对照组都是同一组随机样本。3、单纯病例研究:(caseonlystudy)为Piegorseh于1994年首先提出,也称病例病例研究,或病例系列研究(caseseriesstudy)。4、病例交叉研究:1991年美国Maclure提出的,基本思想就是比较相同研究对象在急性事件发生前一段时间的暴露情况与未发生事件的某段时间内的暴露情况。如果暴露与少见的事件(或疾病)有关,那么刚好在事件发生前一段时间内的暴露频率应该高于更早时间内的暴露频率。例如,据报道某种药物可以引发猝死,如果该报道正确,则应该可以观察到服用此药物后一段时间内猝死增多,或者说在猝死前几天或几周内应有服药增多的报道。5.病例-时间-对照设计:1995年Suissa提出的。基本思想:采用传统病例对照研究时,疾病严重程度造成的混杂往往不能完全控制。这是因为一般情况下,疾病的严重程度没有精确的测量方法,无法肯定疾病严重程度在病例和对照两组间分布一致。三、病例对照研究的实施:一般步骤:1.提出假设2.制定研究计划3.收集资料4.对收集到的资料进行整理与分析;5.总结并提出研究报告。具体实施如下:(一)提出假设:根据所了解的疾病分布特点和已知的相关因素,广泛查阅文献基础上,提出病因假设。(二)明确研究目的,选择适宜的对照形式。1、如果为广泛地探索疾病的危险因子,可以采用不匹配或频数匹配。2、根据提供研究用的病例的数量。若研究的是罕见病,或能得到的符合规定的病例数很少时,选择个体匹配方法。3、能否以较小的样本获得较高的检验效率。如1﹕R(或1﹕M)的匹配方法,R值不宜超过4。(三)病例与对照的基本来源。有两个,1、医院的现患病人、医院、门诊的病案,及出院记录,称为以医院为基础的;2、社区、社区的监测资料或普查、抽查的人群资料,称为以社区为基础的。1.病例的选择(1)疾病有明确统一、宽严适度的诊断标准。(2)对病例其它特征的规定:如性别、年龄、民族等。控制非研究因素增强可比性。在选择病例时有新发病例、现患病例与死亡病例三种。(3)保证使病例达到有关规定的标准:如要求通过某一级医院或实验室的诊断,或病人必须经过某项检查等。2.对照的选择:对照来源主要有:(1)同一或多个医疗机构中诊断的其他病例;(2)病例的邻居或所在同一居委会的健康人或非该病病人;(3)社会团体人群中的非该病病例或健康人;(4)社区人口中的非病例或健康人群;(5)病例的配偶、亲戚、同事等。对照应当来自于产生病例的人群,能代表产生病例的人群。在医院为基础的病例对照研究中,常常不能识别源人群。此时,总人群的随机样本不一定与源人群的随机样本一致。当使用医院病例时,改进对照系列的一个方法是将对照限制为那些与暴露没有联系迹象的病人。选择对照时必须考虑对照的代表性,对照与病例的可比性,以及可能出现的选择偏倚等。对照的选择应遵循四个目的:①排除选择偏倚;②缩小信息偏倚;③缩小不清楚或不能很好测量的变量引起的残余混杂(准确测量的混杂因素在分析阶段可以控制);④符合真实性要求和逻辑限制的前提下使统计学把握度达到最大。(四)样本含量的估计:⒈影响样本大小的因素:(1)研究因素在对照组中的暴露率P0;(2)预期的该因素引起的相对危险度RR或暴露的比值比OR;(3)希望达到的检验显著性水平,即假设检验第I类错误的概率α;(4)希望达到的检验把握度(1-β),β为统计学假设检验第Ⅱ类错误的概率。⒉估计方法需注意:A、所估计的样本含量并非绝对精确的数值,因为样本含量的估计是有条件的,而这些条件并非是一成不变的。B、应当纠正样本量越大越好的错误看法。样本量过大,常会影响调查工作的质量,增加负担、费用。C、病例组和对照组样本含量相等时效率最高。(五)获取研究因素的信息:1.变量的选定:取决于研究的目的或具体的目标。与目的有关的变量不但绝不可少(如吸烟与肺癌关系的研究中,有关调查对象吸烟或不吸烟的信息),而且应当尽量细致和深入(如还应调查吸烟持续的时间、每日吸烟量、烟的种类等)以获得较多的信息。2.变量的规定:每项变量都尽可能地采取国际或国内统一的标准。3.变量的测量:定性的指标可通过询问而获得是与否,经常、偶尔等信息。通过询问、仪器或实验室检查可获得定量的资料。(六)资料的收集:主要靠询问调查对象填写问卷收集信息资料。有时需辅以查阅档案,采样化验,实地查看或从有关方面咨询获得。无论什么方法,都应实行质量控制。五、实施病例对照研究应注意的问题:1、主要假设的说明、研究目的是否清楚、简明而且可以检验?2、疾病与暴露变量的定义是否清楚明确?3、病例与对照的来源,病例的诊断方法,病例与对照的诊断程序是否一致?是新发病例还是现患病例?病例和对照的排除标准?4、抽样的技术方法与样本大小的估计明确否?病例与对照是否匹配及匹配变量是哪些?5、调查表是否完全?是否足够详尽?是否能够收集到需要的数据?6、调查表经过试用否?其真实性与可靠性是否经过评估?7、调查员、质控员、编码员等的工作手册是否编好?是否需专门培训?8、组织机构、人员、设备、经费是否已落实?方法试剂是否符合标准?结果的真实性与可靠性是否经过考核?9、资料数据的整理、统计处理方法及分析内容明确否?如何控制或调整混杂及其他偏倚?结论的真实性如何?六、数据资料的整理与分析:(一)资料的整理:1.原始资料的核查修正、验收、归档2.原始资料的分组、归纳,或编码输入计算机。(二)数据的分析1.描述性统计(1)描述研究对象的一般特征:描述研究对象人数及各种特征的构成,例如性别、年龄、职业分布等。(2)均衡性检验:为检验病例组与对照组的可比性,比较病例组和对照组某些基本特征是否相似。2.统计性推断病例对照研究中表示疾病与暴露之间联系强度的指标为比值比(oddsratio,又译比数比、优势比、交叉乘积比,简写OR)。所谓比值(odds)是指某事物发生的可能性与不发生的可能性之比。在病例对照研究中病例组的暴露比值为:对照组的暴露比值为:概率的分母中包括未发生事件数,而比值的分母中不包括未发生事件数。因此比值取值在0~∞之间,而概率取值在0~1之间。相对危险度(relativerisk)的本质为率比(rateratio)或危险比(riskratio),即暴露组与非暴露组发病率之比,或发病的概率之比。但是病例对照研究不能计算发病率,所以病例对照研究中只能计算OR。OR的含义与相对危险度相同,指暴露组的疾病危险性为非暴露组的多少倍。OR>1说明疾病的危险度因暴露而增加,暴露与疾病之间为“正”关联;OR<1说明疾病的危险度因暴露而减少,暴露与疾病之间为“负”关联。但是,在不同患病率和不同发病率的情况下,OR与RR是有差别的。疾病率小于5%时,OR是RR的极好近似值。无论以暴露比值和非暴露比值计算,或是以有病比值和无病比值计算,比值比的结果都是一样的,OR恒等于ad/bc。(1)不匹配不分层的资料分析这是病例对照研究资料分析的基本形式。1)

每个暴露因素可整理成表5-5的四格表形式表5-5病例对照研究资料整理表暴露或特征疾病合计病例对照有aba+b=n1无cdc+d=n0合计a+c=m1b+d=m0a+b+c+d=t例如一项关于口服避孕药与心肌梗塞的病例对照研究,结果如表5-6:表5-6口服避孕药(OC)与心肌梗塞(MI)关系的病例对照研究结果

病例对照合计服OC未服OC391142415463268合计1531783312)利用χ2(卡方)检验,检验病例组与对照组两组的暴露率有无统计学的显著差异。χ2=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d)=7.70χ20.01(1)=6.63,本例χ2=7.70>6.63,则p<0.01结论为不能拒绝无效假设,即两组暴露率有统计学很显著差异。3)计算暴露与疾病的联系强度OR。OR=ad/bc=2.204)

Woolf氏logit近似法:如Z>1.96,p<0.05;Z>2.58,p<0.01;Z>3.08,p<0.001。本例,Z=0.7885/0.2874=2.74>2.58,p<0.01。理论上该检验应当与χ2检验的结论(即是否有统计学的显著意义)一致。5)OR的可信区间(confidenceinterval,C.I.)前面计算的OR值是关联程度的一个点估计值,即用一次研究(样本人群)所计算出来的一次OR值。考虑到抽样误差,可按一定的概率(称为可信度)来估计总体OR的范围,即OR的可信区间,其上下限的值为可信限。Woolf自然对数转换法是建立在OR方差的基础上。OR自然对数的方差为:Var(lnOR)=1/a+1/b+1/c+1/d=0.0826。求上述值反自然对数exp(1.3218,0.2252)=3.75,1.25即OR95%C.I.=1.25~3.75(2)不匹配分层资料分析分层分析是把人群根据某特征分为不同层次(流行病学统计学的术语称为“层”),如按性别可分为男女,按年龄可分为20-39岁40-59岁及60岁及以上等,然后分别分析各层中暴露与疾病的关联。借以分层的因素是可能的混杂因素,通过分层可以调整这些因素的干扰。1)

分层资料的整理表5-7病例对照研究分层资料整理表暴露特征i层的发病情况合计病例对照有无aicibidin1in0i合计m1im0iti以表5-4的数据为例,考虑到年龄与口服避孕药有关,也与MI有关,可能是个混杂因素。故可按年龄分层,分为<40岁和≥40岁两层,如下表按年龄分层的结果<40岁≥40岁

服OC未服OC合计服OC未服OC合计病例对照21(a1)17(c1)26(b1)59(d1)47(m11)76(m01)18(a2)7(c2)88(b2)95(d2)106(m12)102(m02)合计38(n11)85(n01)123(n1)25(n12)183(n02)208(n2)OR1=2.80OR2=2.782)

计算各层的OROR1=(26×76)/(59×47)=2.80OR2=(18×95)/(7×88)=2.78两层的ORi均较不分层时OR大。进一步分析在非暴露组年龄与MI的关联,见表年龄与MI的关联

<40岁≥40岁MI对照26598895OR=0.48,χ2=7.27,说明年龄与MI有联系(小年龄有保护)。再分析对照组中年龄与口服避孕药的关联,见表年龄与OC的关联

<40岁≥40岁OC对照1759795OR=3.91,χ2=8.89,说明年龄与口服避孕药也有联系。年龄也不是OC与MI联系的中间环节,故可以认为年龄是研究OC与MI关系时的混杂因素。这种情况下可以用分层分析方法控制年龄的混杂作用。3)

计算总的OR值用Mantel-Haenszel提出的公式:ORMH=∑(aidi/ti)/∑(bici/ti)4)

计算总的卡方值亦用Mantel-Haenszel提出的公式:=[∑ai-∑E(ai)]2/∑V(ai)(3)分级暴露资料的分析:如能获得某暴露不同暴露水平的资料,可用来分析疾病和暴露的剂量反应关系,以增加因果关系推断的依据。1)

将资料整理归纳成列联表为整理方便,该整理表中的a0与b0分别相当于前面四格表中的c与d。表5-11病例对照研究分级资料整理表暴露分级

01234……合计病例对照a0(=c)b0(=d)a1b1a2b2a3b3a4b4…………m1m0合计n0n1n2n3n4……t2)做χ2(卡方)检验1956年Doll和Hill发表的男性吸烟与肺癌关系的研究数据见表5-12。表5-12男性每日吸烟的支数与肺癌的关系每日吸烟支数

01-5-15-合计病例对照合计2(c)27(d)33(a1)55(b1)250(a2)293(b2)364(a3)274(b3)649(m1)649(m0)29(n0)88(n1)543(n2)638(n3)1298(t)OR1.08.1011.5217.93χ2=43.15,自由度ν=3,p<0.0013)计算各分级的OR值通常以不暴露或最低水平的暴露为参照。本例以不吸烟为参照,其余各级OR值分别为8.10,11.52和17.93,随着吸烟量的增加而递增,呈现明显的剂量反应关系(还可用Χ2趋势检验来检验是否确实存在剂量反应关系)。(4)匹配资料的分析成组资料的分析同非匹配资料。本节主要介绍1∶1配对资料的分析。1)

将资料整理成四格表表5-131∶1配对病例对照研究资料整理表对照病例对子数有暴露史无暴露史有暴露史无暴露史对子数acbda+bc+dA+cb+dt以1976年Mack等报告的在洛杉矶所做的外源性雌激素与子宫内膜癌关系的病例对照研究为例。表5-14外源性雌激素与子宫内膜癌配比资料对照病例对子数有暴露史无暴露史有暴露史无暴露史对子数27(a)29(c)3(b)4(d)30(a+b)33(c+d)56(a+c)7(b+d)63(t)(Mack,1975)2)

Χ2(卡方)检验用McNemar公式计算Χ2=(b-c)2/(b+c)(5.13)此公式适用于较大样本,对子数较少时用McNemar校正公式:Χ2=(│b-c│-1)2/(b+c)(5.14)本例Χ2=(│b-c│-1)2/(b+c)=19.53,p<0.0053)

计算OROR=c/b(t≠0)(5.15)本例OR=c/b=9.674)

计算OR的95%可信区间仍用Miettinen公式。5)

ORU,ORL==(2.31,40.41)即OR的95%可信区间的下限为2.31,上限为40.01。(5)归因分值归因分值(attributablefraction,AF)也叫病因分值(etiologicfraction,EF)、归因危险百分比[attributableriskproportion(或percent),ARP]。暴露人群的归因分值记为AFe,AFe=(Ie-Iu)/Ie=(OR-1)/OR(5.16)式中Ie为暴露组发病率,Iu为非暴露组发病率。在病例对照研究中一般不能获得发病率,只能获得OR。AFe指暴露人群内某种疾病的发病中,由该暴露引起的发病占全部发病的比例。也即假如消除该暴露,暴露组发病降低的比例。人群归因分值记为AFP,AFP=(Ip-Iu)/Ip=Pe(OR-1)/1+Pe(OR-1)(5.17)式中Ip为总人群发病率,Iu非暴露组发病率Pe为人群的暴露率(或以对照组的暴露代替)。AFP反映暴露对人群发病的影响,表示该暴露引起的发病占全部发病的比例。也即假如消除该暴露后发病降低的比例。归因分值是具有公共卫生意义的指标,它同时还代表人群中随机抽取一个病例可能因该暴露引起的概率。(三)病例对照研究的功效研究功效(power)也叫做把握度,可以解释为拒绝无效假设的能力,即当无效假设不成立时,该假设被拒绝的概率。以1∶1匹配病例对照研究资料的功效估计为例。例:假定人群中暴露于所研究的危险因素的比例P0=0.30,统计学双侧检验的显著性水平α=0.05,病例与对照各50例。计算该研究有多大的功效发现RR=2。首先计算Z值

(式13.19)功效=1-β=P(Z≤Zβ)(P为概率),计算出Zβ之后,根据标准正态分布查出小于Zβ时的概率,P1与计算样本量时相同。本例:n=50,P0=0.30,α=0.05(双侧检验),Zα=1.96,RR=2

=(P0+P1)/2=(0.3+0.4615)/2=0.3808查正态分布表,当=-0.30时,β=0.62,功效=P=1-β=38%结论:如果该研究选用50个病例和50个对照,在给定的条件下,该研究能检出OR显著地不等于1的概率为38%,如果OR确实≤2,则该研究成功的希望不大。一般认为一项研究的检验效率应在75%以上。七、病例对照研究中的偏倚及其防止(一)选择偏倚(selectionbias):由于选入的研究对象与未选入的研究对象在某些特征上存在差异而引起的误差。常发生于设计阶段。⒈入院率偏倚(admissionratebias)也叫Berkson偏倚。当利用医院病人作为病例和对照时,由于对照是医院的某一部分病人,而不是全体目标人群的一个随机样本,又由于病例只是该医院或某些医院的特定病例,因为病人对医院及医院对病人双方都有选择性,所以作为病例组的病例也不是全体病人的随机样本,所以难免产生偏倚,特别是因为各种疾病的入院率不同导致病例组与对照组某些特征上的系统差异。尽量采用随机选择研究对象,在多个医院选择对象等方法以减少偏倚程度。2、现患病例-新发病例偏倚(prevalence-incidencebias)又称奈曼偏倚(Neymanbias)。调查对象选自现患病例,可能得到很多信息可能只与存活有关,而未必与该病发病有关,从而高估某些暴露因素病因作用。另一种情况,某病的幸存者改变了生活习惯,从而降低了某个危险因素的水平,明确规定纳入标准为新发病例,或有可能做队列研究,同时将暴露程度、暴露时间和暴露结局联系起来做结论可减少偏倚程度。3、出征侯偏倚(detectionsignalbias)也称暴露偏倚(unmaskingbias)。病人常因某些与致病无关的症状而就医,从而提高了早期病例的检出率,致使过高地估计了暴露程度,而产生的系统误差。如果延长收集病例的时间,使其超过由早期向中、晚期发生的时间,则检出病例中暴露者的比例会趋于正常。⒋时间效应偏倚(timeeffectbias)慢性疾病,从开始暴露于危险因素到出现病变往往经历一个较长的时间过程。那些暴露后即将发生病变的人,已发生早期病变而不能检出的人,或在调查中已有病变但因缺乏早期检测手段而被错误地认为是非病例的人,都可能被选入对照组,由此产生的误差。在调查中尽量采用敏感的疾病早期检查技术,开展观察期充分长的纵向调查。(二)信息偏倚(informationbias):又称观察偏倚(observationbias)或测量偏倚(measurementbias),是在收集整理信息过程中由于测量暴露与结局的方法有缺陷造成的系统误差。⒈回忆偏倚(recallbias)由于被调查者记忆失真或不完整造成结论的系统误差。选择不易为人们所忘记的重要指标做调查,并重视问卷的提问方式和调查技术,将有助于减少回忆偏倚。⒉调查偏倚(investigationbias):可能来自于调查对象及调查者双方。病例与对照的调查环境与条件不同,或者调查技术、调查质量不高或差错以及仪器设备的问题等均可产生调查偏倚。采用客观指征、合适的人选参加调查、调查技术培训、复查等方法做好质量控制,检查条件尽量一致、检查仪器应精良、严格掌握试剂的要求等均可望减少偏倚。(三)混杂偏倚(confoundingbias):当研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系。这种现象或影响叫混杂(confounding)或混杂偏倚(confoundingbias),该外来因素叫混杂因素(confoundingfactor)。防止办法:在设计时利用限制的方法,配比的方法;资料分析阶段采用分层分析或多因素分析模型处理。

八、病例对照研究方法的优点与局限性(一)优点:⒈特别适用于罕见病的研究,有时往往是罕见病病因研究的唯一选择,因为病例对照研究不需要太多的研究对象,此时队列研究常常不实际。2.虽有更多的机会发生偏倚和错误的推论,但是相对更省力、省钱、省时间,并且较易于组织实施。3.该方法不仅应用于病因的探讨,而且广泛应用于许多方面,例如疫苗免疫学效果的考核及爆发调查等。4、可以同时研究多个因素与疾病的联系,适宜于探索性病因研究。(二)局限性:⒈不适于研究人群中暴露比例很低的因素,因为需要很大的样本量。⒉选择研究对象时,难以避免选择偏倚。⒊暴露与疾病的时间先后常难以判断。⒋获取既往信息时,难以避免回忆偏倚。实验流行病学研究第一节概述1、实验流行病学(experimentalepidemiology)又称干预研究(interventionstudy)、流行病学实验(epidemiologicalexperiment)研究,是指将来自同一总体的研究人群随机分为实验组和对照组,研究者对实验组人群施加某种干预措施后,随访并比较两组人群的发病(死亡)情况或健康状况有无差别及差别大小,从而判断干预措施效果的一种前瞻性、实验性研究方法。2、实验流行病学研究的基本原则:(一)对照的原则:要求两组研究对象必须具有可比性,即除了是否给予不同干预措施外,其它的基本特征如性别、年龄、居住环境等应尽可能一致。(二)随机的原则:参加实验研究的对象必须随机地分配到实验组或对照组,提高两组的可比性或均衡性。(三)盲法的原则:由于受研究对象和研究者主观因素的影响,在设计、资料收集或分析阶段容易出现信息偏倚,为避免可采用盲法3、实验流行病学研究的分类:(一)按研究场所划分:1.现场试验(fieldtrial):亦称社区随机对照试验是在社区(一定区域内的人群)或现场环境下进行的实验。以尚未患所研究疾病的人群作为研究对象。根据接受干预的基本单位不同,可分为:(1)个体试验(individualtrial)接受处理或某种预防措施的基本单位是未患所研究疾病的个人。常用于在健康人群中推行预防接种、药物预防等措施的效果评价。(2)社区试验(communitytrial)又称为社区干预项目(communityinterventionprogramCIP)、生活方式干预试验(lifestyleinterventiontrial)、以社区为基础的公共卫生试验(community-basedpublichealthtrial)等,是以尚未患所研究疾病的人群作为整体进行试验观察,常用于对某种预防措施或方法进行考核或评价。2.临床试验(clinicaltrial):是在医院或其他医疗照顾环境下进行的实验。接受处理或某种预防措施的基本单位与个体分组试验一样是个人,但不同的是临床试验的研究对象是病人,包括住院和未住院的病人。常用于对某种药物或治疗方法的效果进行检验和评价。该试验中的干预措施不是一级预防,它不能防止疾病的发生,仅能防止疾病的复发或后遗症。(二)按所具备设计的基本特征划分:1.真实验(trueexperiment):具备四个基本特征的实验称为真实验。(1)它是前瞻性研究;(2)必须施加一种或多种干预措施,可以是预防某种疾病的疫苗、治疗某病的药物或其他干预的方法措施等;(3)研究对象必须是来自一个总体的随机抽样人群,并在分组时采取严格的随机分配原则;(4)必须有平行的实验组和对照组,要求在开始实验时,两组在有关各方面必须相当近似或可比。2.类实验(quasi-experiment)又称半实验(semi-experiment),如果一项实验研究缺少其中一个或几个特征,这种实验就称为类实验。可分为两类:(1)不设对照组:但不等于没有对比,对比有:一、自身前后对照,即同一受试验者在接受干预措施前后比较,二是与已知的不给该项干预措施的结果比较。(2)设对照组:虽然设立了对照组,但研究对象的分组不是随机的。第二节现场试验研究一、定义:现场试验是以正常人为研究对象,以个体或群体为研究单位,将研究对象随机分为实验组和对照组,将所研究的干预措施给予实验组人群后,随访观察一段时间并比较两组人群的结局,如发病率、死亡率、治愈率、健康状况改变情况等,对比分析两组之间效应上的差别,从而判断干预措施的效果的一种前瞻性、实验性研究方法。二、原理:社区随机对照试验是一种前瞻性的实验流行病学的研究方法,研究对象是正常人,即未患所研究疾病的人群,选择具有可比性的社区,以社区为单位随机分为实验组和对照组,给实验组施加一种或多种干预措施后,随访追踪一段时间后,得到两组人群的结局资料,比较两组人群效应上的差异,从而判断或评价干预措施的效果。三、研究设计基本原则与步骤:(一)明确研究目的:一般是评价药物或疫苗的预防效果;评估健康教育和行为改变对健康或疾病的影响;;探索生物、社会环境改变对人群健康或疾病的影响。通常一次实验只解决一个问题。(二)研究对象的选择:研究对象是未患所研究疾病的人群。选择研究对象时应制订出严格的选入和排除的标准。选择原则:1.对干预措施有效的人群;2.预期发病率较高的人群;3.干预对其无害的人群;4.能将实验坚持到底的人群;5.依从性(compliance)好的人群。(三)确定实验现场。应考虑以下几个方面:1.实验现场人口相对稳定,流动性小,并要有足够的数量。2.实验研究的疾病在该地区有较高而稳定的发病率。3.评价疫苗的免疫学效果时,应选择近期内未发生该疾病流行的地区。4.实验地区有较好的医疗卫生条件,卫生防疫保健机构比较健全,登记报告制度较完善,医疗机构及诊断水平较好等。5.实验地区(单位)领导重视,群众愿意接受,有较好的协作条件等。(四)样本大小的确定:影响因素:⑴干预措施实施前、后研究人群中研究事件(疾病或死亡)的发生率:干预前人群发生率越高,所需样本量越小;干预后效果越好,所需样本量小。反之,就要大些。⑵第I型(α)错误出现的概率,即出现假阳性错误的概率:α水平由研究者自行确定,通常将α定为0.05,有时也可定为0.01。但要求的显著性水平越高,所需样本量就越大。⑶第II型(β)错误出现的概率,即出现假阴性错误的概率:β水平由研究者自行确定,一般常将β定为0.20、0.10或0.05。1-β称把握度,把握度要求越高,则所需样本量就越大。⑷单侧检验或双侧检验单侧检验比双侧检验所需样本量小。如果实验组的效果不比对照组差时,就用单侧检验;当不能肯定是实验组和对照组哪一组效果好,即可能实验组优于对照组或对照组优于实验组时,则用双侧检验。⑸研究对象分组数量:分组数量越多,则所需样本量越大。(五)随机化分组:方法有:1.简单随机分组(simplerandomization)将研究对象以个人为单位用掷硬币(正、反两面指定为实验组和对照组)、抽签、使用随机数字表,也可采用系统随机化法,即用现成的数据(如研究对象顺序号、身份证号、病历卡号、工号、学号等)交替随机分配到实验组和对照组中去。优点:简单易行,随时可用,不需要专门工具。缺点:当研究对象数量大时,工作量相当大,有时甚至难以做到。2.分层随机分组(stratifiedrandomization)按研究对象特征,即可能产生混杂作用的某些因素(如年龄、性别、种族、文化程度、居住条件等)先进行分层,然后在每层内随机地把研究对象分配到甲(实验组)和乙(对照

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论