




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、六章病例对照研究病例对照研究(case-control study)是分析性流行病学研究最常用的方法,在病因研究 中得到广泛应用。文献最早记载的病例对照研究是WA Guy于1843年发表在Journal of theRoyal Statistical Society第6期的一篇报告,他研究职业性体力活动强度与肺结核的关系。1844年Guy的老师PCA Louis首先叙述了病例对照研究最早的概念。1926年Lane Claypon所做的生殖经历与乳腺癌关系的研究,是第一次十分类似现代概念的病例对照研究。第二次世界大战以后,病例对照研究的理论、方法的研究及应用空前地发展。如Schreck和Leno
2、wiTy(1947)关于包皮环切及性卫生与阴茎癌、Doll和Hill (1950)对吸烟与肺癌、Stewart等(1958)对孕期腹部照射 X线与儿童白血病、 Weicker等(1963)对反应停(Thalidomide) 与先天畸形、Herbst (1970)对孕妇使用己烯雌酚与其女儿阴道腺癌关系的病例对照研究, 都是成功的范例。20世纪中叶以来,Cornfield提出的相对危险度、比值比分析,Woolf和Miettinen的可信限计算法,Mantel和Haensyel的分层分析方法,以及 Cox模型、Logistic回归模型等的应用,极大地丰富了病例对照研究,推动了病因研究和疾病防治工作进
3、程。第一节 第一节基本概念一、病例对照研究的定义根据研究目的,研究开始时选择一定数量患某种疾病的人作为病例组,同时选择一定 数量未患该种疾病的人作为对照组,调查两组过去或最近研究因素暴露情况,包括有无暴露、暴露的质和量,然后比较两组研究因素暴露的程度有无差异。假如病例组某研究因素的暴露比例或暴露程度显著高于对照组,则可认为该研究因素与某种疾病之间存在着联系。病例对照研究中的所谓病例可以是某疾病的患者,或某病原体的感染者,或具有某特征事件的人。对照可以是未患该疾病的其他病人,或健康人。研究因素(interest factors)又称为暴露因素 (exposure factors)。凡接触过某种研
4、究因素 或具备某种特征,都可以称为暴露,如接触过某种物理因素或化学物质,吃过某食品,如服过某药物,具备性别、年龄、身高、肤色、职业、文化、宗教信仰等某种特征,或处于何种 疾病状态或行为等。 病例对照研究中涉及的暴露因素不一定都是危险因素(risk factors ),也可能是属于保护因素(protective factors )。基本设计型的病例对照研究是从研究的疾病(或某特征事件)病例出发,收集过去的 暴露因素,从时间顺序上看是回顾性的,因此又称回顾性研究( retrospective study)。类似 的英文名词尚有 case-reference study、 case-compared
5、 study, 但以 case-control study 最常用。二、特点从结构模式可以看出有以下特点: (一)属观察性研究对两组客观地收集暴露因素,收集的暴露因素是自然存在的,不是研究者人为控制的, 没有干预因素,故而属观察性研究。(二)设立对照组必须设立对照组,目的是为病例组提供一个作比较用的危险因素的暴露率。 (三)从果到因追溯调查研究开始时是已知结果,即掌握了患某病或未患该病的对象,从他们追溯与疾病有关的原因,其调查方向是回顾性的和纵向性的,因此,这种研究方法可以阐明研究因素与疾病先后时间顺序,同时得出结果的速度较快。(四)一般不能确定因果联系病例对照研究收集暴露因素的方法是依据对象
6、回忆或查阅有关记录,不是按从“因”到“果”前瞻观察其发展过程,因此,发现的“联系” 一般不能确定是因果联系。但如果多次病例对 照研究的结果存在“联系的一致性”,则有助于因果假设的验证。基本设计型病例对照研究的结构模式如图6- 1。回顾性收集暴露情况暴露未暴露暴露未暴露对照组病例对照研究的结构模式三、设计类型(一)基本型.按研究目的分型(1)探索性病例对照研究研究时没有形成明确的病因假说,而是进行初步探索,广泛探寻可能的危险因素,以便提出病因假说待以后检验。在研究设计上,对病例和对照不作特殊限制,只要病例组和对照组是相应的人群随机样本,且样本大小适当即可。(2)验证性病例对照研究对描述性研究或探
7、索性病例对照研究后提出的病因假说,再采用对病例和对照作出某些限制的病例对照研究,对有关因素进行深入调查,以检验其病因假说是否成立。.按是否采用配比对照组分型(1)非配比病例对照研究从规定的病例和对照人群中随机抽取一定数量的样本组成病例组和对照组,除要求对照符合对照条件及对照组人数应等于或多于病例组人数外,没有其它规定及限制。(2)配比病例对照研究配比(matching)就是要求对照组某些因素或特征与病例组保持相同。按配比情况分为两种:成组配比病例对照研究( category matching case-control study)又称频数配比病例对照研究(frequency matching
8、case-control study)。要求对照组中 配比的因素所占比例与病例组一致,例如病例组中男女性各半,60岁以上者占1/3,则选择对照组时也需要这样的比例;个体配比病例对照研究( individual matching case-controlstudy)是以病例和对照个体为单位进行配比选择对照的方法。配比对照的个数为1时称为1:1配比或配对(pair matching ),对照数多于1个的称为1:2、1:3、1:R。实际应用中 配比一般不超过1:4,超过1:4时统计效率难以提高,且增加调查难度。(二)杂交型将基本型病例对照研究与队列研究结合起来设计,称为杂交设计( hybrid de
9、sign )。 例如巢式病例对照研究、病例-队列研究等。此处仅介绍巢式病例对照研究。巢式病例对照研究(nested case-control study )又称嵌入式病例对照研究、双向病 例对照研究(ambidirectional case-control study )。其设计原理是在一个实施中的队列 研究内实行一项病例对照研究。以队列研究中发生的病例为“病例”,从同队列内相应暴露危险群组(risk sets )未发病者中随机抽样获得“对照”。一般可为每个病例配 510个对照。巢式病例对照研究的主要特点如下:1、在发病前收集暴露信息,可避免或减少回忆偏倚。因该研究以队列研究为基础,暴 露因素
10、的基线资料,包括有关标本(如血清)均已事先采集备用,届时调出或检验即可,不 必依靠回忆提供。2、减少花费,出结果快。研究的样本较队列小,有关实验检验只针对病例和对照进行,可减少花费。在队列研究观察期,一旦发生足够数量的病例即可完成巢式病例对照研究,可先于队列研究得出结果。3、特别用于产生新的病因假设时的研究。当按原来的病因假设进行队列研究过程中, 又产生了新的病因假设,采用巢式病例对照研究可满足要求。4、一般不适用于非常罕见的疾病,如果需要研究,则须考虑较大的队列研究样本。5、可作因果联系的推断,因其研究程序是从暴露到发病。从设计思路看, 任何一个有暴露史记录的人群, 例如某种职业暴露的人群,
11、 都是可以进行巢式病例对照研究的队列。 更一般地说, 任何病例对照研究, 都可以看成是嵌入某队列人群一项研究。(三)变体型这类病例对照研究设计, 多在选择对照的方式上做了变换, 或在特殊背景下选择对照。例如病例病例对照研究( case-case control study ) 、 累积病例对照研究( cumulative casecontrol study ) 、病例交叉对照研究( case-cross over study ) 、病例双亲对照研究( case-parental study )等等均属于变体型病例对照研究。在本章第二节“设计方法”中,主要叙述基本型病例对照研究设计,一般不涉及变
12、体型。四、用 途(一)病因探索对病因不明的疾病, 采用探索性病例对照研究方法对可疑危险因素进行广泛探索。 例如对胃癌危险因素的研究中,曾对家族遗传因素、精神因素、血型、先前胃部所患疾病、社会经济状况、职业、饮食因素、烟、酒嗜好等因素进行了研究,获得了一些有价值的信息。(二)药物有害作用的研究临床药物的应用, 对病人发挥治疗作用的同时, 也可能产生有害作用 (副作用或毒性作用) 。例如, Herbst 等 1971 年采用探索性病例对照研究调查阴道腺癌的危险因素发现患者的母亲在妊娠头3 个月服用过己烯雌酚治疗是研究因素中联系最为显著的因素, 后经动物实验证实妊娠早期使用己烯雌酚可使雌性子代发生阴
13、道腺癌的危险性增高。(三)疾病预后因素的研究同一疾病可有不同的结局, 如残废与痊愈, 有并发症无并发症等等, 如果把较差的结局作为病例组, 较好的结局作为对照组, 进行回顾性研究, 可以分析产生较差结局的有关因素,从而采取有效措施,改善疾病的预后,或者对影响预后的因素作出正确的解释。(四)检验病因假说对描述性研究或探索性病例对照研究提出的初步病因假说, 可再用验证性病例对照研究进行深入检验。 例如,最初的探索研究, 提出吸烟与肺癌有联系的病因假说,后来围绕吸烟与肺癌的关系经过许多次大型病例对照研究,表明吸烟与肺癌的联系存在一致性。(五)为进一步前瞻性研究提供依据经过验证性病例对照研究确证的病因
14、假说, 是进行前瞻性研究的重要依据。 根据假说中的一个或一组危险因素开展队列研究或实验流行病学研究, 以证实该假说。 例如吸烟是肺癌的主要病因这一假说,由 Doll 与 Hill 做的一项队列研究予以证实。(六)评价防治措施的效果例如, 当预防接种记录资料不全, 无法获得人群接种率时, 可用病例对照研究来评价疫苗的流行病学效果。第二节 第二节设计方法一、 一、 病例的选择(一)病例诊断纳入研究的病例必须正确诊断, 采用的诊断标准尽量是国际通用标准或国内统一的诊断标准。 如肿瘤病例的确诊最好以活组织检查或外科手术为依据。 任何时候都要防止将似是而非的病例纳入研究。(二)对病例其它规定根据研究目的
15、,有时需要对病例的年龄、性别、民族、职业等作出限定,以控制外部因素。 新发病例、 现患病例和死亡病例都可以选为研究病例, 但在提供暴露因素信息的准确性上可能很不相同。新发病例对暴露因素记忆犹新, 信息较可靠,但对发病率低的疾病, 短期内不易获得足够数量的病例。 采用现患病例, 数量易于满足, 但提供的暴露史易受到病程迁延及病后行为方式的影响, 不易判定疾病和研究因素的时间顺序。 死亡病例的暴露因素主要由亲属或他人提供,信息偏倚较大。(三)病例来源1、社区人群的病例样本从社区人群中普查或抽样调查获得的病例,这种病例样本代表好,但不易得到。单位或集团人群的体检提供的病例也是较好的样本,如职工例行体
16、检、新生入校、新兵入伍体检等。2 、医院病例 可用一所医院或多所医院病房或门诊一定时期诊断的全部病例,或从这 些病例中随机抽取的样本作为病例组。从医院获取病例虽较方便节省,但容易产生选择偏倚。二、对照的选择对照组的选择是更为复杂、困难的工作,它关系到病例对照研究结果的成败。(一)对对照组的规定对照的首要条件是未患所研究的疾病或感染者,而且要肯定其不处于潜伏期或隐性感染,防止错误分类。对照在某些特征方面应尽可能与病例组可比,防止混杂偏倚。若选择患其它疾病的病人作对照,可同时选择数种不同疾病的病人组成对照组,但对照所患的疾病绝不可与所研究的疾病有相近的病因,例如,研究肺癌的病因,不能选择肺气肿、支
17、气管炎、 哮喘等患者作对照, 以减少或避免混杂偏倚。 在疾病预后研究中, 则通常是把疾病较好的结 局作为“病例”,把同一种疾病较差的结局作为“对照”。(二)对照的来源对照的来源原则上应与病例的来源一致,如病例来自社区人群,则对照应是从同一人群中经用相同诊断确认为未患该疾病者随机抽取的代表样本,这种对照偏倚较小,但不易获得。如病例选自医院,则从同一医院其他疾病病例中选择对照,这是最常采用的选择病例和对照的方法。也可以用病例的配偶、同胞、亲戚、同班同学或同事作对照。有时可以从多种来源选择对照,如一个对照组来自医院,另一个对照组来自社区人群或病例的邻居。在研究食物中毒的病因时,应在与病例同一餐厅进餐
18、而未发病的人群找对照。三、配比如果选择对照时没有特别限定的条件就叫做非配比,如果限定对照在若干个特征上与 病例一致,就叫做配比( matching),这种对照谓之配比对照( matching control)。配比的目的是控制、消除混杂因素的影响,提高分层分析的效率,改善对相对危险度(比值比)估计的精确性。配比因素是既与研究的疾病有联系,又与研究的暴露因素有联系,而又非中间变量的因素,即混杂因素( confounding factor)。例如,研究饮酒与肺癌的关系, 发现两者存在联系;但这种联系是由于吸烟既与饮酒又与肺癌有关而引起的,并非饮酒与肺癌有因果联系,吸烟起了混杂作用,因此,吸烟应作为
19、配比因素。性别、年龄是最常用的配比因素,因这两个因素对大多数其他因素的影响产生混杂。根据实际研究目的,也可以把血型、血压、身高、体重、职业、婚姻状况、种族、出生地、 住址、经济状况等作为配比因素。充当配比的因素,其影响不能被评价;因此,确定配比因 素时,应当根据研究的疾病而定,并不是越多越好。欲作为病因探索的因素不可作配比因素。如果把不可作配比的因素,或不必作配比的因素都加以配比,这叫做配比过头(overmatching),则不仅会丢失某些重要信息,而且会增加选择配比对照的难度和工作量。有时 配比不当还可能引入新的混杂。在个体配比中,根据配比对照个数分为1:1、1:2、1:R。当R4,配比分析
20、的效率提高不明显,反而增加工作量。一般以采用1:1或1: 2配比为好。配比对照的原则也适用于巢式病例对照研究设计。在巢式病例对照研究中,配予每个病例的对照个数,利用下式估计:从病例对照研究估计的 SD(61)因此,在提出研究从全队列研究基础估计WSD : R当5W RW 10时,该比值略大于(一)提出研究因素的原则 在探索性病例对照研究中,1,认为是比较合适的。四、研究的因素目的是筛选出可疑致病因素或危险因素, 因素时应遵循充分、合理的原则。充分是指考虑的研究因素尽可能包括所有可能有关的因素, 避免遗漏。提出研究因素不是想当然, 而是需要深思熟虑, 可根据其他人已有的研究或自己相关知识的积累来
21、提出。充分还指当提出某项研究因素时,应尽可能从多个角度去研究它的暴露程度,如研究吸烟这一暴露因素,就要调查吸烟持续时间、何时开始吸烟、每日吸烟支 数、吸入深度、吸什么牌号的烟、戒烟年数等等。在提出研究因素时,可能限于认识水平, 致使某些重要可疑因素未被提出,这就有待通过不断调查实践,提高思维水平来解决。合理是指与研究目的无关的因素一项都不提。此外,在一次研究中,也不是因素愈多愈好,要考虑实施调查时所能承受的能力。(二)研究因素的测量对研究因素的暴露状况应有明确的规定,例如,一生中只吸过几支或几十支烟就不能 认为有吸烟史,通常把每天吸1支以上而连续超过1年以上者记为有吸烟史; 又如调查用药 史,
22、应明确规定调查服用过哪些药物。研究因素的测量有定性测量和定量测量。调查某因素的有或无,偶而接触或经常接触等, 这属定性测量。最好是定量测量或分级测量,能获得较为准确的暴露信息,如“每天吸几支烟?”、“每天户外活动多少分钟?”等都属定量测量。“平均每周吃几次肉?” 这也含有定量的意义。 有的因素不易准确定量测定,可采用间接指标,如调查某化学物质职业暴露程度,可按工龄、开始接触的年龄或工种分级记录。如调查饮食营养素的摄入量, 可采用膳食营养调查专门方法。环境污染的暴露, 可直接测量空气中某种化学物质的浓度。五、样本大小的估计(一)估计样本大小的原则病例对照研究样本大小的估计需遵循以下原则:人群(相
23、当于对照人群)中暴露于某因素者所占比例(P0);估计该研究因素引起的相对危险度(RR)或比彳1比(OR);第一型错误概率a ;把握度(1- B )。当这4项数值确定后,即可按相应的计算公式计算或 查样本含量表估计所需病例组和对照组人数。(二)非配比两组人数相等的样本大小估计估计样本大小的公式如下:z、2Pq z . Poq。 Piqi2PlPo式中n为病例组或对照组人数。 z与z分别为 与(6 2值对应的正态分布分位数,可qo 1 Po(6-3)(6-4)从表6-1中查得。P。与Pi分别为对照组与病例组估计的某因素暴露率, q1 1 R, P P0 P1 2- , q 1 P , P1则可用下
24、式计算:P1 OR Po 1 Po OR Po公式(6-2 )可简化为下式:c22 Pqz zn -P1 Po如果是成组配比设计,样本大小估计同此法,但对照组人数可适当增加。表6-1正态分布的分位数表或z (单侧检验)z (单侧和双侧)z(双侧检验)o.oo13.o9o3.29oo.oo22.8783.o9oo.oo52.5762.8o7o.o1o2.3262.576o.o2o2.o582.326o.o251.96o2.242o.o5o1.6451.96oo.1oo1.2821.6450.2000.8421.282计算举例:现拟用非配比病例对照研究方法调查孕妇暴露于某因素与婴儿先天性心脏病 之
25、间的关系,估计孕妇中该因素暴露率为30%假定暴露引起白比值比为2,=0.05(双侧),1-=0.90,需调查多少人?解:p00.3, q01 0.3 07 , OR 2,用上述有关公式计算如下:pi=(2 X 0.3)/(1-0.3+2 X 0.3)=0.46qi=1-0.46=0.54p =(0.3+0.46)/2=0.38q =1-0.38=0.62查表6-1得z =1.96 , z =1.282,再用公式6-2求n: TOC o 1-5 h z . -21.96 .2 0.38 0.62 1.282 .0.3 0.7 0.46 0.54n 2 191(0.46 0.3)即病例组和对照组各
26、需调查191人。如用公式6-4计算,估计n =193人,与上述结果很接近。亦可以根据已知的规定的条件查样本含量表确定样本大小。(一)配比研究的样本大小估计1:1配比样本大小的估计在配比研究中,只有病例与对照暴露情况不一致的对子才有比较的意义,这是估计配比研究样本大小的基本根据,故异于非配比时的计算方法。设m为不一致对子数,则2z /2 z p(1 p)m 2 TOC o 1-5 h z (p 1/2)(6-5)OR RR p1 OR 1 RR(6-6)需要调查的总对子数 M用下式计算:Mm Pe( 6-7 )Pe为配比中暴露不一致的对子出现的概率,用下式计算:Pep0q1p1q0(6-8)则有
27、(6-9)M m/( p0q1 p1q。)计算举例:如采用1:1配比病例对照研究方法研究吸烟与心肌梗塞的关系。如果对照组(或人群)中吸烟率(p0) =0.3,吸烟者患心肌梗塞的危险性为不吸烟者3倍(OR =3),设 =0.05 , 3=0.1 ,单侧检验,则样本大小计算步骤如下:用公式(6-3)求得病例组暴露率p1=(0.3 X3) / ( 1-0.3+3 X 0.3) =0.56 ,用公式(6-6)求得P =3/4,代入公式(6-5 )得301.645/2 1.282 (3/4)(1 3/4)2m(3 4) (12)2代入公式(6-9)得57300.3 0.44 0.56 0.7即需调查57
28、对。此例如采用非配比病例对照研究方法,所需样本大小为n = 60,即病例与对照组各需60人,可见,在同样条件下,配比研究可节约样本含量。1:R配比样本大小的估计可用Schlesselman推荐的简化公式估计:1R pq z z 22pip0(6-10)Pi Rpo/(1 R)(6-11)式中n为病例组样本含量,R为配比对照的数目,则对照组样本含量为 Rn, q 1 Po计算举例:仍以研究吸烟与心肌梗塞的关系为例,已知的条件同上, 采用1:2配比研究方法,其样本大小的计算如下:p1=0.56, p0=0.3, R=2,代入公式(6-10)求得:P1 0.56 2 0.3/(1 2) 0.39,则
29、 q 1 0.39 0.61 ,代入公式(6-11)得:1 1 0.39 0.61 1.645 1.282 2n 22 450.56 0.312人。即需调查45个病例和2X45=90个对照。较1:1配比研究少用病例数配比研究样本大小的估计, 亦可查病例对照研究得样本含量表 确定,参见有关专著。六、资料的收集病例对照研究的资料收集方法主要是利用专门设计的调查表进行面访。因此,调查表的设计是很重要的一个步骤。 有时也可利用调查表采用通讯调查和电话调查方法。查阅医疗记录、报告登记资料、职业史档案等,都可以作为询问调查的补充。某些研究还需要采集个人 的或环境的样品进行实验室检验。在收集资料时要注意,病
30、例和其对照的调查时间愈近愈好,病例和对照接受调查的环境和方法应相同(如病例和配比对照尽量由同一调查员调查、调查员对病例和对照进行询问的方式、程序、态度相同等)。调查全过程要注意进行质量监控,实行某些质量检查, 如Kappa一致性检验等。第三节第三节分析方法一、资料整理(一) 资料质量核查除了在资料收集过程中进行质量控制外,在资料收集完成后,仍须再仔细核查,对资 料不足或错误之处加以弥补或纠正,使之尽可能准确和完整。(二) 资料编码、归纳、建库如不使用计算机处理,则需要设计出整理表,将信息分类计数统计分析。如使用计算 机处理,则先将调查表的各项调查答案编码,输入计算机,建立数据库,利用适当的统计
31、软件统计分析。二、资料分析(一)描述性分析对调查结果一般特征的描述,如描述病例组和对照组的性别、年龄、职业、疾病临床 类型等特征在两组的构成情况,进行均衡性检验,以评价两组的可比性。在恶性肿瘤病例对照研究中,需要描述病例的诊断级别。(二)联系的分析1、1、未分层资料的分析(1)非配比资料的分析1)整理结构模式单因素资料四格表的模式如表6-2。用例数据见表 6-3,是Stewart研究母亲孕期腹部 X线照射史与出生儿童患癌症关系的资料,病例组是患癌症死亡的儿童, 对照是同年出生但没有患癌症的儿童,并同时调查两组儿童的母亲孕期腹部有无X线照射史。表6-2非配比病例对照研究资料分析表暴露因素病例组对
32、照组合计有abn1无cdno合计m1moT表6-3母亲孕期腹部X线照射与儿童患癌关系非配比研究孕期照射X线儿童癌症夕匕亡病例组对照组合计照过17893271未照过112112062327合计1299129925982)联系的假设检验研究的暴露因素如果与该疾病存在统计联系,则病例组暴露率4格表检验公式(公式 6-12或公式(6-12)(6-13)a /日明显高于对照组暴露率b/m0,检验此假设用 6-13),并用表6-3实例数据计算如下。2 (ad bc) 2T仃巾。2校正检验公式为:22(| ad bc| T/2)2Tm1mon1n02实例计算(本例适用非校正检验):2(178 1206 93
33、 1121)2 259829.77校12299 1299 271 2327自由度二1,查 值表,P0.001。 2检验结果表明,孕期腹部 X线照射与儿童患癌症有联系。联系强度的计算联系强度用相对危险度(relative risk, RR)测量。RR为暴露组发病率或死亡率与非暴露组发病率或死亡率之比。但病例对照研究中无暴露组和非暴露组的观察人数,故不能计算发病率或死亡率,因而不能求得RR只能计算比值比(odds ratio, OR)来近似估计RR。从表6-2中看,病例组有暴露的概率为a/m1,无暴露的概率为 c/m1,两者的比值=(a/mi) /( c/m1)二a/c。同理,对照组的比值 二bd
34、。则比值比为:(ac) / (b/d) 二ad/bc。即ad(6-14)combined exposed andOR bc可以证明,如果严格要求对照组是从暴露与非暴露的联合队列(unexposed cohorts)按某一比例 K抽样获得,即对照组的选择独立于暴露时,则 OR与RR是一致的。比值比(OR)的流行病学意义:OR是估计或近似地估计相对危险度的,OR =1,表明研究因素没有特殊的意义。OR1,表明研究因素与研究的疾病呈“正”联系,数值愈大,该因素充当危险因素的可能性愈大。OR1 (在正数范围),表明研究因素与研究的疾病呈“负”联系,数值愈小,该因素充当保护因素的可能性愈大。以表6-3的
35、实例计算,其比值比为:178 1206OR 2.0693 1121表明母亲孕期腹部 X线照射与儿童患癌症呈正联系,是儿童患癌症的危险因素,有此暴露因素的母亲,她们的儿童患癌症的危险性为没有此暴露因素的2倍,这一结果充实了前述2检验结果的流行病学意义。OR可信限的计算 上述OR值是一个点估计值,它不能反映在大量抽样调查时OR值的波动范围,如果用样本 OR值的标准差来估计总体 OR的可信区间就更精确。 Woolf法 计算OR值可信区间的步骤如下。Woolf法计算OR的可信限是基于OR的方差之上的。OR的自然对数方差为:、一、1111(6-15)(6-16)Var (ln OR) a b c dIn
36、OR的95%T信限(CI)的计算公式为lnOR(95%CI) lnOR 1.96, Var(ln OR)取其自然反对数值即为6-3实例计算:OR的95碗信限,以ORl和ORu分别表示其下限和上限。 以表1111Var(ln OR)0.01809178 93 1121 1206ln OR(95%CI ) ln 2.06 1.96 0.018090.7227 0.260.9863, 0.4591取其自然反对数 exp(0.9863,0.4591)=1.58,2.68即 ORl =1.58, ORu =2.68,本例 OR95%CI 为 1.58 2.68。(2)1:1配比资料分析成组配比病例对照研
37、究资料分析方法与非配比资料相同,这里只叙述个体配比资料的分资料整理结构模式 每一个病例与其对照构成 1个配对组(对子),在做资料整 理时每个对子不拆开,根据每个对子的暴露情况,归纳如表6-4模式,应用实例如表6-5所列,这是一项钩端螺旋体感染史与脑动脉炎之间关系的研究。表6-4 1:1配比病例对照研究资料整理模式对照病例合计对子数有暴露史无暴露史有暴露史 无暴露史aba +bcdc +da cb da b c d表6-5钩端螺旋体补体结合反应与脑动脉炎关系1: 1配比研究对照病例对子数抗体阳性抗体阴性抗体阳性抗体阴性41539195843206322)联系的假设检验用McNeme公式X-11计
38、算 值。2 (b c)2b c(6-17)2当(b+c) 40时使用校正公式(6- 18)(619)2 (b c 1)2校正 b c自由度=13)联系强度的计算用下式估计OR:OR cb4) OR可信区间的估计用Miettinen公式(公式6-20)。_(1 1.96/2OR95%CI OR(6-20)现用表6-5所述数据进行计算:2(1 36.11 39, P 0.001OR = 39/1 = 39OR95%CI39(1 1.96 幅)14.29 106.42结果表明,钩端螺旋体补体结合反应阳性(代表有钩体感染史)与脑动脉炎存在联系,且有显著性统计学意义,其OR值95%DI为14.29 10
39、6.42。(3) 1:2配比资料分析1)资料整理结构模式1:2 配比研究中,每个配比组为 3人,他们的暴露情况共有6种组合,其模式见表6-6。其应用实例见表 6-7 ,这是某教研室对某大学40岁以上教职工高血压与冠心病关系的 1:2配比病例对照研究的数据,共调查 56个配比组。表6-6 1:2配比病例对照研究资料结构模式病例两个对照中暴露于危险因素情况两个都暴露1个暴露1个未暴露两个都未暴露暴露 未暴露rstuvw表6-7 某大学40岁以上教职工高血压与冠心病关系的1:2配比病例对照研究病例两个对照中是否启高血压两个都有1个有1个无两个都无后局血压0421无高血压18222)联系的假设检验用O
40、sborn介绍的公式:22 t E(t) S E(s)2V(t)V(s)(6 21) 式中E(t)为 t 的预期值,E(t) = (1/3)( t+v); V(t)为 E的方差,V(t) = (2/9)( t+v);E(s)为 s 的预期值,E(s) = (2/3)( s+u); V(s)为 E(s)的方差,V(s) = (2/9)( s+u)。自由度=13)联系强度的计算仍用Osborn介绍的公式:ORs 2t2u v(6 22)4) OR可信限的估计 可用Miettinen法计算。 现以表6-7为例计算分析如下:E(t) = (1/3)(21+8) = 9.67, V(t) = (2/9)
41、(21+8) = 6.44E(s) = (2/3)(4+1) = 3.33, V(s) = (2/9)(4+1) = 1.1122(21 9.67 4 3.33)2-19.076.44 1.11, P 0.001OR (4 2 21) (2 1 8)4.6OR95%CI4.6(1 1.96 19.071)2.31 9.14从上述分析表明,患高血压与发生冠心病存在着联系,具有统计学显著性意义,比值比95%可信限为 2.319.14。2、分层资料分析(1) (1)资料整理结构模式分层分析是把病例组和对照组按不同特征分解为不同层次,对每一层次进行暴露因素与疾病之间联系的分析,如按性别分为男性和女性两
42、个层次,按年龄分组分为若干层次,按住址分为住城市和农村两层次,等等。分层分析的目的是为了控制混杂因素对联系的干扰。分层实际上是按层分解成若干个4格表,其结构模式见表6-9。其应用实例见表6-8,因为考虑到母亲怀孕次数可能是混杂因素,所以按怀孕次数分为两层(不分层分析见表 6-3)。表6-8非配比病例对照研究分层分析模式暴露因素i层病例组对照组合计有aibini无Cidin0i合计timimi表6-9孕期腹部X线照射与儿童癌症关系按不同胎次分层分析X线照 射a.母亲怀孕一次b.母亲怀孕多次病例组对照组合计病例组 对照合计组有无853612193571504253918166968151511合计
43、 51042793778987216612(2)联系的假设检验利用公式6-12计算各层的值。14.02,P0.00113.89,P 0.0012(85 391 36 425)2 937a层:b层:510 427 121 81622(93 815 57 696)2 1661789 872 150 1511表明各层的暴露与疾病之间的联系均有显著性意义。联系强度的计算利用公式6-14计算各层OR值。a 层:OR = (85 X391)/(36 X425) = 2.17b 层:OR = (93 X815)/(57 X696) = 1.91计算总2值和总的OR值 在分层分析中,当广层 OR一致时(是否一
44、致需要进行 层间比g比一致检验来判断),可计算分层资料的总之值和总or川,如不一致,则不宜计算总 2值和总OR值,而需要计算标化死亡率比(SRR)。计算总 2值用公式6-22,计算总OR值用公式6-23。2 MH自由度=1ORMH式中I为总层数,i 对表6-9资料计算如下:85 391I aidi be I m1im0i nin0ii 1 tii 1 (ti1)t2I aidtii 1 biG / ti为第各该层。236 425 93 815 57 696(6-22 )(6-23)2MH9371661510 427 121 816 789 872 150 1511 22936 9371660
45、166127.77,P 0.00185 391 93 815937166136 425 57 6962.029371661假设检验结果表明,本例分层分析显示孕期 著意义;分层后总 OR =2.02 ,与分层前的粗 度基本上没有产生混杂影响。(5) 总OR值95碗信区间的估计应用X线照射与儿童癌症之间的联系有统计学显 OR =2.06非常接近,说明怀孕次数对联系强Miettinen公式计算较为简单:(6-24 )ORu , ORlORMh1.96Mh )仍以上例计算: iORU , ORL 2.02(1 1.96 27.77)1.56, 2.62即该资料分层分析 ORmh 95%CI为1.56
46、2.62。3、暴露分级资料的分析如果在病例组和对照组同时收集暴露因素暴露程度的分级资料,就可以分析暴露与疾病之间的剂量反应关系;如果存在剂量反应关系,就有助于解释因果联系。表6-10所列数据是Doll和Hill (1956)研究每日吸烟支数与肺癌发生之间的暴露等级关系。表6-10 每日吸烟支数与肺癌发生之间的剂量反应关系每日吸烟支数病例组对照组OR021(c)59(d)1.00140(a1)67(b1)1.685269(a2)303(b2)2.4915379(a3)280(b3)3.80合计709709-表6-10所列每日吸烟支数与肺癌发病之间的联系强度计算:每日吸烟1支以上5支以下的OR =
47、 40 59 / 67 21 = 1.68,同理可算得每日吸烟 5 、215 支的OR分别为2.49和3.80。本资料暴露与疾病之间的联系可采用行列表 检验,2=41.76,自由度=3, P 0.001,表明每日吸烟支数与肺癌发病之间存在极为显著的统计 学意义。表6-10中还表明,随着每日吸烟支数的增加,OR值亦逐渐增大,显示出剂量反应关系,更增强了吸烟与肺癌之间因果联系的说服力。对于暴露分级资料的 OR值变化趋势是2否有统计学显著意义,可进行趋势检验,本例趋势检验,=5.21 ,自由度=1 , P 0.05,2具有显著性意义(行 列表 检验、趋势检验方法参阅有关专著) 。第四节 调查偏倚及其
48、控制在病例对照研究中有三类常见的偏倚,即选择偏倚、信息偏倚和混杂偏倚。一、选择偏倚(一)基本概念在病例对照研究中,当选择研究对象的方法不正确,使选入的对象与未选入的对象之间,某些特征出现系统误差,研究结果偏离实际情况,称为选择偏倚( selection bias)。这种偏倚 一般发生在研究设计阶段。(二)选择偏倚的种类1、入院率偏倚又称Berksons bias。在以医院为基础的病例对照研究中,常发生这种偏倚。由于许多因素的影响, 不同特征的病人入院概率不同,故在医院选择病例作为病例组或对照组,往往不是代表该种疾病患者的随机样本,选择偏倚由此产生。假设某人群有A、B两种病人各有6000例,他们的吸烟率均为 20%,但他们病后入院率却不同:不吸烟者A病入院率为60%, B病却为25%;而吸烟者两病入院率均为40%。这样就出现 A病住院总人数高于B病住院总人数,两病吸烟者住院人数却相同,因而导致住院者中患A病者吸烟率显著高于A病,如以住院患者资料研究吸烟与疾病的关系,就会夸大吸烟与B病的联系。2、现患-新发病例偏倚 又称Neyman
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年微球载体材料合作协议书
- 黑龙江省哈尔滨市东方红中学校2024-2025学年高二下学期第二次月考考试数学试卷
- 2025年酚类项目建议书
- 2025年工商用制冷、空调设备项目合作计划书
- 2025年木材加工及制品项目发展计划
- 培训机构兼职讲师合同服务与支持协议
- 工业废水零排放处理设施运营合同
- 未成年人抚养费年度审计与监管协议
- 智能制造领域数字经济创业企业有限合伙合作协议
- 2025年高纯铟及氧化铟项目合作计划书
- 河南省确山县三里河治理工程
- 水利工程合同工程完工验收工程建设管理工作报告
- photoshop实训指导书
- 多级泵检修及维护(1)
- 涵洞孔径计算
- 测量未知电阻的方法
- 中国民主同盟入盟申请表
- SAP项目用户操作手册CO月结
- 观感质量检查表
- 企业信息登记表
- 孙志刚事件1doc
评论
0/150
提交评论