流行病学研究中的混杂效应控制_第1页
流行病学研究中的混杂效应控制_第2页
流行病学研究中的混杂效应控制_第3页
流行病学研究中的混杂效应控制_第4页
流行病学研究中的混杂效应控制_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、编辑课件流行病学研究中的流行病学研究中的混杂效应控制混杂效应控制北京协和医学院流行病学教研室北京协和医学院流行病学教研室廖苏苏廖苏苏编辑课件混杂效应控制混杂效应控制1、设计阶段控制混杂的策略设计阶段控制混杂的策略n概述:限制、随机分配、匹配概述:限制、随机分配、匹配n匹配的概念匹配的概念n在队列研究和病例对照研究中使用匹配的实例在队列研究和病例对照研究中使用匹配的实例n过度匹配过度匹配2 2、分析阶段控制混杂的技术:、分析阶段控制混杂的技术:分层分析、标化、多因素分析分层分析、标化、多因素分析编辑课件 1. 限制限制(Restriction) : “简化简化”研究对象某些研究对象某些可能起到可

2、能起到“混杂混杂”作用的特征,或者说,让潜在的作用的特征,或者说,让潜在的混杂变量混杂变量变为(近似的)变为(近似的)“常量常量”例如,年龄例如,年龄 2. 随机分配随机分配(Randomized allocation):):用随机用随机分组方法使可能的混杂变量分布在比较组间平衡;分组方法使可能的混杂变量分布在比较组间平衡;只能用于实验研究设计。只能用于实验研究设计。 ( (一一) ) 设计阶段控制混杂效应的策略设计阶段控制混杂效应的策略编辑课件 3. 匹配匹配(matching):):n常在病例对照或队列研究中使用;常在病例对照或队列研究中使用;n在实验研究中按照混杂因素分层后再进行随机分在

3、实验研究中按照混杂因素分层后再进行随机分组(分层随机)也是一种组(分层随机)也是一种“频数匹配频数匹配”。( (一一) ) 设计阶段控制混杂效应的策略(续)设计阶段控制混杂效应的策略(续)编辑课件什么是匹配(什么是匹配(Matching)?)?n匹配是一种抽样设计匹配是一种抽样设计n指从研究对象总体中,以指示系列或指示组指从研究对象总体中,以指示系列或指示组(index series/group)某些)某些可能的混杂因素可能的混杂因素分分布为布为“模板模板”,选择与之比较的研究对象选择与之比较的研究对象(比较(比较组或比较系列,组或比较系列,comparison series/group),)

4、,使两组对象在使两组对象在这些混杂因素上这些混杂因素上相同或近似相同或近似。n在队列研究中就是按暴露组研究对象某些特征选择非在队列研究中就是按暴露组研究对象某些特征选择非暴露组研究对象;暴露组研究对象;n在病例对照研究中就是按照病例组某些特征选择对照在病例对照研究中就是按照病例组某些特征选择对照组;组;编辑课件匹配方法(匹配方法(1)个体匹配(个体匹配(Individual matchingIndividual matching)n把指示组中的把指示组中的一个一个研究对象(研究对象(病例或暴露者病例或暴露者)与比)与比较组中的较组中的一个一个/ /几个几个研究对象(研究对象(非病例或非暴露者非

5、病例或非暴露者)进行匹配;分为:进行匹配;分为:n1:1配对配对(1:1matching; paired matching););n1:n匹配匹配(1:n matching);n即:给每个即:给每个病例(病例(/暴露者)暴露者)选择在一个或多个混杂选择在一个或多个混杂因素上与之相配的因素上与之相配的一个或更多个对照(一个或更多个对照(/非暴露者)非暴露者)。n这是这是分层的特例分层的特例,即每层只有一个病例(,即每层只有一个病例(/暴露者)暴露者)和与之匹配的一个或和与之匹配的一个或n个对照(个对照(/非暴露者)。非暴露者)。编辑课件匹配方法(匹配方法(2)频数匹配(频数匹配(Category

6、 / frequency/ Category / frequency/ stratified matchingstratified matching)n在在不同研究组不同研究组(如:病例组和对照组;或暴(如:病例组和对照组;或暴露组和非暴露组)之间进行匹配;露组和非暴露组)之间进行匹配;n在在一个或多个混杂因素的不同水平一个或多个混杂因素的不同水平上,使上,使比比较组(即非暴露组或对照组)较组(即非暴露组或对照组)的的混杂因素分混杂因素分布频数布频数与与指示组指示组(即暴露组或病例组)(即暴露组或病例组)相同。相同。编辑课件匹配方法(续)匹配方法(续)n匹配实际需要对匹配实际需要对“指示组指示

7、组”和和“比较组比较组”分别分别“抽样抽样”:n个体匹配:选择一个或几个指示组对象后就给他们匹配比较组个体匹配:选择一个或几个指示组对象后就给他们匹配比较组n成组匹配:需要在成组匹配:需要在“指示组指示组”收集完成后,再依据频数分别抽取收集完成后,再依据频数分别抽取“比较组比较组”n两种匹配设计的一般原则(两种匹配设计的一般原则(通过人为的通过人为的“选择选择”使比较组使比较组间在混杂因素构成分布上相似间在混杂因素构成分布上相似)是一样的,但是)是一样的,但是两种匹两种匹配设计的分析方法不同配设计的分析方法不同。n匹配后,研究样本获得的匹配后,研究样本获得的结果结果与研究总体的与研究总体的真实

8、情况(即:真实情况(即:总体中暴露和结局的关系)总体中暴露和结局的关系)一致吗?一致吗? (真的能去除混杂效应的影响吗?)编辑课件匹配实例:匹配实例:下表是在一个下表是在一个200万万人口的人口的研究对象总体研究对象总体中,中,不同不同性别性别人口的人口的暴露暴露和和结局结局分布情况:分布情况: 男性男性(100万)万)女性女性(100万)万) 暴露暴露(90万)万)非暴露非暴露(10万)万)暴露暴露(10万)万)非暴露非暴露(90万)万)年发病率年发病率0.00500.00050.00100.00011 年 发 生年 发 生的的病例数病例数45005010090编辑课件在这个研究对象总体中:

9、在这个研究对象总体中:暴露暴露与与疾病结局疾病结局是否关联?是否关联?n计算计算粗总粗总相对危险度相对危险度(暴露组比非暴露组)(暴露组比非暴露组)n计算计算男性组男性组相对危险度相对危险度(暴露组比非暴露组)(暴露组比非暴露组)n计算计算女性组女性组相对危险度相对危险度(暴露组比非暴露组)(暴露组比非暴露组)n计算结果说明什么?计算结果说明什么?编辑课件假如从这个研究总体中假如从这个研究总体中抽样抽样,用用队列研究队列研究方法探讨方法探讨暴露和疾病暴露和疾病的关联(的关联(1)建立队列的方法(一)建立队列的方法(一)n假定根据样本量估算,我们需要从总体中假定根据样本量估算,我们需要从总体中抽

10、取抽取10%的人做样本的人做样本n如果采用如果采用随机抽样随机抽样的方法从这个总体中抽的方法从这个总体中抽样,抽到的队列研究样本样,抽到的队列研究样本性别、暴露变量性别、暴露变量的构成如何?的构成如何?n如果随访一年,如果随访一年,暴露和疾病的关联测量暴露和疾病的关联测量结结果是什么?果是什么?编辑课件 暴露暴露(10万)万)非暴露非暴露(10万)万) 男性男性(9万)万)女性女性(1万)万)男性男性(1万)万)女性女性(9万)万)1年危险年危险0.00500.00100.00050.00011年中的年中的病例数病例数4501059粗(总)相对危险度粗(总)相对危险度:(460/10万)万)/

11、(14/10万)万)=460/14=男性组男性组相对危险度:相对危险度:10女性组女性组相对危险度:相对危险度:10编辑课件假如从这个研究总体中假如从这个研究总体中抽样抽样,用用队列研究队列研究方法探讨方法探讨暴露和疾病暴露和疾病的关联(的关联(2)建立队列的方法(二):建立队列的方法(二):假如抽样前可以获得总假如抽样前可以获得总体人群的体人群的“暴露暴露”和和“非暴露非暴露”信息信息n暴露队列:暴露队列:从暴露人口中抽取从暴露人口中抽取10%做样本做样本n非暴露队列:非暴露队列:n从非暴露人口中抽取从非暴露人口中抽取10%;而且而且n让非暴露队列在让非暴露队列在性别特征性别特征上与暴露队列

12、相上与暴露队列相匹配匹配。n这是匹配的队列抽样这是匹配的队列抽样 设设 计计 ,匹配的目的是?,匹配的目的是?n结果如何?结果如何?编辑课件男(男(18万)万)女(女(2万)万)全体(全体(2020万)万)暴露暴露非暴露非暴露暴露暴露非暴露非暴露暴露暴露非暴露非暴露病例数病例数4504510146046总人数总人数90000900001000010000100000100000 RR101010匹配抽样设计的队列研究结果:匹配抽样设计的队列研究结果:暴露队列中:暴露队列中:男女比例为男女比例为9 9:1 1非暴露队列中:非暴露队列中:男女比例为男女比例为9 9:1 1匹配的匹配的后果后果编辑课

13、件在在队列研究实例队列研究实例中中匹配抽样对关联测量的影响:匹配抽样对关联测量的影响:n在研究总体中,在研究总体中,性别性别是暴露和疾病关联中的混杂因素(在无病是暴露和疾病关联中的混杂因素(在无病人群中人群中ORef不等于不等于1;非暴露人群中,;非暴露人群中,ORfd不等于不等于1。)。) n随机从总体中抽取研究对象再分成暴露和随机从总体中抽取研究对象再分成暴露和非暴露队列样本,估算的非暴露队列样本,估算的粗的粗的RR值值仍旧带有仍旧带有性别的混杂效应;但是,性别的混杂效应;但是,按照性别进行分层分析后,按照性别进行分层分析后,可以去除性别对暴露和结局关联的混杂效应;可以去除性别对暴露和结局

14、关联的混杂效应;n分别抽取暴露和非暴露组,并对性别分别抽取暴露和非暴露组,并对性别匹配匹配后后,性别性别的混杂作用得以消除(的混杂作用得以消除(粗粗RR=按照性别分层后的按照性别分层后的RR);所以);所以在队列抽样中,对混杂因素进行匹配设在队列抽样中,对混杂因素进行匹配设计后,不用分层分析即可以去除混杂因素造成的偏性计后,不用分层分析即可以去除混杂因素造成的偏性编辑课件假如从这个研究总体中假如从这个研究总体中抽样抽样,用用病例对照病例对照方法探讨方法探讨暴露和疾病暴露和疾病的关联的关联n病例组:病例组:200万人总体中得到的全部万人总体中得到的全部4740位病人;位病人;n对照组:对照组:按

15、照与病例组的性别分布频数匹按照与病例组的性别分布频数匹配配后,从总体中没有病的研究对象中抽取后,从总体中没有病的研究对象中抽取4740位对照。位对照。 编辑课件男性男性女性女性总样本总样本暴露暴露非 暴非 暴露露总计总计暴露暴露非 暴非 暴露露总计总计暴露暴露非 暴非 暴露露总计总计病例病例45005045501009019046001404740对照对照409545545501917119041146264740OR10.0010.005.00频数匹配抽样设计的频数匹配抽样设计的病例对照研究病例对照研究结果:结果:编辑课件在在病例对照研究实例病例对照研究实例中中匹配抽样对关联测量的影响:匹配

16、抽样对关联测量的影响:n在总体中在总体中,性别对暴露因素与疾病的关联,性别对暴露因素与疾病的关联有混杂效应,因此,有混杂效应,因此,暴露效应暴露效应的粗的粗RR()()分层分层RR();提示研究总体中性别对暴();提示研究总体中性别对暴露和疾病的关联有混杂作用,而且是露和疾病的关联有混杂作用,而且是“正正混杂混杂”。n在上述在上述病例对照研究样本病例对照研究样本中,中,按照性别分按照性别分层的两个层的两个RR相等,等于总体中的分层相等,等于总体中的分层RR。然而,样本的然而,样本的粗粗RR()()样本分层样本分层RR()()编辑课件在在病例对照研究实例病例对照研究实例中中匹配抽样对关联测量的影

17、响(续)匹配抽样对关联测量的影响(续)n提示提示研究样本中性别对暴露和疾病的关联有混研究样本中性别对暴露和疾病的关联有混杂效应,但是杂效应,但是“负混杂负混杂”!换言之,!换言之,样本中观察样本中观察到的混杂并非是原来总体中的性别混杂效应的反到的混杂并非是原来总体中的性别混杂效应的反映,而是在匹配过程引入的混杂。映,而是在匹配过程引入的混杂。 nTake-home message (记住)!n在病例对照研究抽样中,如果使用了匹配设计,在分析资料时,必须按照匹配因素进行相应的配对、分层加权或者条件Logistic回归等分析方法才能最终得到真实的暴露效应估计值(OR)编辑课件匹配设计在混杂效应控制

18、中的作用:匹配设计在混杂效应控制中的作用:总结总结n匹配抽样设计本身是否能减少或避免混杂因素对暴匹配抽样设计本身是否能减少或避免混杂因素对暴露与结局变量关联测量上的混杂效应,增加露与结局变量关联测量上的混杂效应,增加关联测关联测量量的真实性(的真实性(validityvalidity) ?n无论是否进行匹配设计,都可能通过恰当的分析方无论是否进行匹配设计,都可能通过恰当的分析方法,得到关联测量的法,得到关联测量的“真实可靠的真实可靠的”结果,结果,只要只要:n研究研究测量测量了所有可能需要考虑的了所有可能需要考虑的潜在混杂变量潜在混杂变量;n并且并且分析中使用分析中使用恰当的分析技术恰当的分析

19、技术(例如分层等)控制(例如分层等)控制这些潜在混杂变量的影响。这些潜在混杂变量的影响。编辑课件匹配设计在混杂效应控制中的作用:匹配设计在混杂效应控制中的作用:总结总结(续)(续)n仅仅有匹配设计仅仅有匹配设计并不都能并不都能直接增加研究结果直接增加研究结果的真实性,甚至在病例对照研究设计中还可的真实性,甚至在病例对照研究设计中还可能引入混杂;能引入混杂;n所以,是否需要匹配,常常考虑的是匹配是所以,是否需要匹配,常常考虑的是匹配是否可以改善研究效率(否可以改善研究效率(efficiency),使数据),使数据分析可以有效地使用分层等技术来控制混杂,分析可以有效地使用分层等技术来控制混杂,从而

20、提高研究的真实性(从而提高研究的真实性(validity)。)。n最终是否进行匹配抽样还要从研究实际的考最终是否进行匹配抽样还要从研究实际的考虑出发的虑出发的编辑课件什么时候需要考虑匹配:什么时候需要考虑匹配:n如果如果匹配变量与结局变量有很强的相关匹配变量与结局变量有很强的相关而而且它是简单的变量,且它是简单的变量,特别是特别是研究对象数研究对象数量很少时量很少时,匹配可能取得很好的效率收益。,匹配可能取得很好的效率收益。n如果如果匹配变量是混杂变量而且是匹配变量是混杂变量而且是多组别多组别的测量值的测量值(例如,多个等位基因位点;(例如,多个等位基因位点;兄弟姐妹关系;职业等),匹配设计对

21、提兄弟姐妹关系;职业等),匹配设计对提高研究效率是非常关键的。高研究效率是非常关键的。 编辑课件匹配可能带来的问题匹配可能带来的问题: :n经过匹配的变量,在研究中无法再研究;经过匹配的变量,在研究中无法再研究;n匹配变量过多,会使得部分病例找不到对照,致匹配变量过多,会使得部分病例找不到对照,致使可用样本数量减少,使研究的效率反而降低。使可用样本数量减少,使研究的效率反而降低。n如果匹配变量不是混杂因素如果匹配变量不是混杂因素但是与暴露无关联但是与暴露无关联,匹配毫无必要但也不会导致偏性。匹配毫无必要但也不会导致偏性。 n在病例对照调查中匹配不当,会引起过度匹配在病例对照调查中匹配不当,会引

22、起过度匹配(overmatching)的问题,掩盖暴露的真实作用)的问题,掩盖暴露的真实作用(产生负混杂偏性)。(产生负混杂偏性)。编辑课件过度匹配(过度匹配(Overmatching)n指对某个指对某个与暴露因素关联与暴露因素关联、但不是(独但不是(独立的)结局变量危险因素的变量立的)结局变量危险因素的变量(理论(理论上,该因素不是一个混杂变量)进行匹配。上,该因素不是一个混杂变量)进行匹配。 n过度匹配的后果是什么?举例:过度匹配的后果是什么?举例:编辑课件20万总体人群的情况:万总体人群的情况:性别不是暴露和疾病关系中的混杂因素性别不是暴露和疾病关系中的混杂因素 男性(男性(10万)万)

23、 女性(女性(10万)万) 全体(全体(20万)万) 暴露暴露非暴非暴露露 暴露暴露非暴露非暴露 暴露暴露非暴露非暴露病人病人99920 111180 1110200非病人非病人890019980 988989820 9889099800合计合计9000010000 1000090000 100000100000RR5.6 5.6 5.6因为:男性总体因为:男性总体中:暴露率为中:暴露率为90%90%;女性总体女性总体中:暴露率中:暴露率10%10%OROREF/EF/非病人非病人= OR= OREF/EF/病人病人=81=81(性别与暴露因素关联)(性别与暴露因素关联)但:但:ORORDF/

24、DF/非暴露非暴露 =OR=ORDF/DF/暴露暴露 =1=1(性别不是疾病危险因素)(性别不是疾病危险因素)编辑课件抽取这个总体中全部抽取这个总体中全部13101310位病人为病例组位病人为病例组再抽取再抽取性别上与病人性别上与病人匹配匹配的的13101310位非病人为对照位非病人为对照进行病例对照研究进行病例对照研究: 男性男性女性女性总样本总样本 暴露暴露非非暴暴露露总计总计暴露暴露非 暴非 暴露露总总计计暴露暴露非暴非暴露露总计总计病例病例99920101911118029111102001310对照对照9161031019292622919453651310总计总计191512320

25、3814034248220555652620 OR5.65.62.1编辑课件过度匹配(续)过度匹配(续)n病例对照研究中过度匹配后,如果分析时病例对照研究中过度匹配后,如果分析时不进行分层或者配对分析,暴露不进行分层或者配对分析,暴露- -结局关联结局关联测量值将产生趋向无效假设的偏性(测量值将产生趋向无效假设的偏性(引入引入总体中不存在的总体中不存在的混杂效应混杂效应)。)。编辑课件过度匹配(续)过度匹配(续)n因为过度匹配使病例和对照在暴露史方面趋向一因为过度匹配使病例和对照在暴露史方面趋向一致。致。 n即便在分析时进行分层或者配对分析,由于过度即便在分析时进行分层或者配对分析,由于过度匹

26、配使病例和对照匹配使病例和对照有更多的对子在暴露史上趋向有更多的对子在暴露史上趋向“一致一致”。这些。这些“暴露史一致暴露史一致”的的“对子对子”在分在分析中不能使用,因此可以分析的对子数减少,所析中不能使用,因此可以分析的对子数减少,所以以过度匹配会降低对关联测量值估计的精度或效过度匹配会降低对关联测量值估计的精度或效率。率。n是否匹配要仔细权衡是否匹配要仔细权衡编辑课件(二)分析中控制混杂的技术(二)分析中控制混杂的技术n(1)个体配对个体配对病例对照设计的分析病例对照设计的分析n(2)频数匹配频数匹配的分层分析和的分层分析和关联测量关联测量指标指标的的Mantel-Haenszel加权调

27、整加权调整n(3)多因素分析模型控制混杂)多因素分析模型控制混杂编辑课件个体匹配个体匹配病例对照研究中病例对照研究中配对资料配对资料的数据表:的数据表: 对照对照有暴露有暴露对照对照无暴露无暴露病例病例有暴露有暴露AB病例病例无暴露无暴露CD(每个格子表示研究对象的每个格子表示研究对象的“对子数对子数”)OR=B/C编辑课件未匹配未匹配/频数匹配频数匹配病例对照研究数据表病例对照研究数据表不分层的粗不分层的粗OR值:值:暴露暴露无暴露无暴露病例病例ab对照对照cdOR=(ad)/(bc)编辑课件分层分析(分层分析(Stratified analysisStratified analysis)n

28、分层分析需按混杂因素(分层分析需按混杂因素(F)分层后,分别估计暴)分层后,分别估计暴露与疾病结局的关联(分层的露与疾病结局的关联(分层的OR或或RR值);值);n使用分层分析法,可以比较分层使用分层分析法,可以比较分层OR或或RR值与不分值与不分层的粗关联测量,以评价层的粗关联测量,以评价F的混杂效应以及效应修的混杂效应以及效应修正作用;正作用;未匹配未匹配/频数匹配频数匹配病例对照研究数据的分析(续)病例对照研究数据的分析(续) 编辑课件分层分析(续)分层分析(续)n如果分层后,如果分层后,各个分层的各个分层的OR或或RR值大致相等值大致相等,但但不等于未分层的不等于未分层的OR或或RR值

29、值(提示分层因素有混杂(提示分层因素有混杂效应),可以用效应),可以用Mantel-Haenszel方法计算调整的方法计算调整的总的暴露总的暴露-结局关联值(调整结局关联值(调整OR或调整或调整RR值)。值)。未匹配未匹配/频数匹配频数匹配病例对照研究数据的分析(续)病例对照研究数据的分析(续) 编辑课件未匹配未匹配/频数匹配频数匹配病例对照研究数据的分层分析数据表病例对照研究数据的分层分析数据表在在F=0层(样本量层(样本量N0)F=0 暴露暴露无暴露无暴露病例病例a0b0对照对照c0d0OR0=(a0d0)/(b0c0)在在F=1层(样本量层(样本量N1)F=1 暴露暴露无暴露无暴露病例病

30、例a1b1对照对照c1d1OR1=(a1d1)/(b1c1)编辑课件 计算计算调整调整OR值值(ORM-H)的公式:)的公式: (ai di / Ni) ORM-H = - (bi ci / Ni) 式中:式中:ai,bi,ci,di为每一层中四格表中的四个数;为每一层中四格表中的四个数;Ni为每层观察总人数;为每层观察总人数;i为层数(为层数(i = 1 , 2 n )。未匹配未匹配/频数匹配频数匹配病例对照研究数据的分层分析(续)病例对照研究数据的分层分析(续)利用利用Mantel-Haenszel方法计算方法计算调整调整OR值值:编辑课件 (1)ORM-H= cOR:F不是混杂因子,不是

31、混杂因子,cOR不存在混杂偏倚;不存在混杂偏倚; RRM-H = cRR:F不是混杂因子,不是混杂因子,cRR不存在混杂偏倚。不存在混杂偏倚。 (2)ORM-H cOR:F是混杂因子,是混杂因子,cOR存存在混杂偏倚;在混杂偏倚; RRM-H cRR:F是混杂因子,是混杂因子,cRR存存在混杂偏倚。在混杂偏倚。编辑课件分层分析的基本步骤:分层分析的基本步骤:1) 初步审阅资料;初步审阅资料;2) 计算粗的比值比或相对危险度计算粗的比值比或相对危险度(cOR 或或 cRR);3) 分层:按怀疑的混杂因子分层,并计算每一层分层:按怀疑的混杂因子分层,并计算每一层 的比值比或相对危险度的比值比或相对

32、危险度(aOR 或或 aRR);4) 比较比较 cOR 和和 aOR (或(或 cRR 和和 aRR););5) (如果各个层的如果各个层的aOR相等但不等于相等但不等于cOR )用)用Mantel-Haenszel法计算调整混杂因子影响后总的法计算调整混杂因子影响后总的ORmh 或或 RRmh;6) 进行进行 X2mh 检验,计算检验,计算ORmh 或或 RRmh 95%可信区间。可信区间。编辑课件多因素分析模型控制混杂效应多因素分析模型控制混杂效应n当用分层的方法同时控制当用分层的方法同时控制多个混杂因子多个混杂因子的的混杂效应时,会出现分层过多的现象,以混杂效应时,会出现分层过多的现象,

33、以至难于实现对混杂的有效调整,此时便需至难于实现对混杂的有效调整,此时便需应用多因素分析的方法来控制混杂因子的应用多因素分析的方法来控制混杂因子的影响。影响。n多因素模型的选择与研究设计和结局变量多因素模型的选择与研究设计和结局变量性质和结局指标选择有关性质和结局指标选择有关编辑课件研究类型研究类型结局变量结局变量/因变量的类型因变量的类型多因素分析技术多因素分析技术经调整的关联经调整的关联测量测量任何类型任何类型连续的生物学连续的生物学参数参数方差分析方差分析(ANOVA););线性回归线性回归(Linearregression)均数的差值均数的差值线性回归系数线性回归系数横断面横断面研究研

34、究有病、无病有病、无病(二值变量)(二值变量)直接调整;直接调整;间接调整;间接调整;Mantel-Haenszel调整;调整;Logistic回归回归患病率比患病率比标化患病率比标化患病率比比值比比值比比值比比值比病 例 对 照病 例 对 照研究研究病例、非病例病例、非病例(二值变量)(二值变量)Mantel-Haenszel调整;调整;Logistic回归回归比值比比值比比值比比值比编辑课件研究类型研究类型结局变量结局变量/因变量的类型因变量的类型多因素分析技术多因素分析技术经调整的关联测量经调整的关联测量队列研究队列研究1、累积发病率、累积发病率(Cumulativeincidence;

35、在随访;在随访研究结束时得到)研究结束时得到)2、累积发病率、累积发病率(Cumulativeincidence;事件发;事件发生时间生时间(Time-to-event)数据)数据)3、发病率、发病率(Incidencerate;每单位人时发病率每单位人时发病率)直接调整;直接调整;间接调整;间接调整;Mantel-Haenszel调整调整Logistic回归;回归;Cox模型;模型;Mantel-Haenszel调整调整Poisson回归回归相对危险度相对危险度标化发病率比标化发病率比比值比比值比比值比比值比风险比(风险比(Hazardratio)率比率比率比率比巢式病例对照巢式病例对照研究

36、研究不同时间的疾病发不同时间的疾病发生状况(事件发生生状况(事件发生时间数据)时间数据)条件条件Logistic回归;回归;C o x 模 型 (模 型 ( w i t hstaggeredentries,处,处理先后进入研究的日理先后进入研究的日历时点变量)历时点变量)比值比比值比风险比风险比编辑课件多元多元Logistic回归分析控制混杂回归分析控制混杂例例1.定群研究资料分析定群研究资料分析弗明汉心血管疾病研究弗明汉心血管疾病研究742名居住在弗明汉年龄为名居住在弗明汉年龄为40-49岁的男性,在各自岁的男性,在各自暴露不同水平的影响因素暴露不同水平的影响因素(详见下表中的详见下表中的7

37、种因素种因素),经,经12年年追踪观察冠心病(追踪观察冠心病(CHD)发病情况。)发病情况。根据此根据此742名受试者每人暴露各项因素的水平和名受试者每人暴露各项因素的水平和CHD发病与否的资料,采用多因素发病与否的资料,采用多因素LOGISTIC回归模型进回归模型进行分析,结果见表行分析,结果见表1。编辑课件表表1.CHD危险因素定群研究危险因素定群研究(12年追踪观察结果年追踪观察结果)变量变量参数参数 i i估计值估计值 i标准误标准误标化标化 i截距截距 0-13.2573 年龄年龄(岁岁) 10.12160.04370.3370胆固醇胆固醇(mg/dl) 20.00700.00250

38、.3034BP(mmHg) 30.00680.00600.1320相对体重相对体重(W/H) 40.02570.00910.3458血红蛋白血红蛋白(g%) 5-0.00100.0098-0.0012吸烟吸烟(0,1,2,3) 60.42230.10310.4952ECG(0,1) 70.72060.40090.1750编辑课件根据表根据表1结果,可建立的结果,可建立的CHD影响因素的影响因素的Logistic回归模型,公式回归模型,公式如下如下:12+ +0.7206x7)(1)计算描述因素与疾病间联系强度指标计算描述因素与疾病间联系强度指标OR值的大小值的大小:例如:胆固醇的例如:胆固醇的

39、 值为值为,根据估计,根据估计OR值的公式计算值的公式计算CHD与与胆固醇的联系强度为:胆固醇的联系强度为:OR=e 3e表明表明扣除模型中包含的其它因素的影响以后扣除模型中包含的其它因素的影响以后,胆固醇每上升,胆固醇每上升1mg/dl,CHD累累积发病危险上升倍。积发病危险上升倍。例如:当例如:当ECG的的 值为值为时,根据估计时,根据估计OR值的公式计算值的公式计算CHD与与ECG异常的联系强度为:异常的联系强度为: OR = e 7 = e 7 X1 / e 7 X 0 = e 7 X (1-0) = e 表明表明扣除模型中包含的其它因素的影响以后,扣除模型中包含的其它因素的影响以后,

40、ECG异常者异常者(=1)CHD发病是发病是正常者正常者(=0)的倍。的倍。编辑课件(2)预测发病风险预测发病风险:例例1:一个原来不吸烟且胆固醇为一个原来不吸烟且胆固醇为230mg/dl的人,如果后来每的人,如果后来每天改为吸烟天改为吸烟1包包(x6=2),胆固醇上升到,胆固醇上升到330mg/dl的话,即的话,即使其他因素的暴露不发生任何不利的改变,其发生冠心使其他因素的暴露不发生任何不利的改变,其发生冠心病病的风险在的风险在12年间也将会增加倍,即:年间也将会增加倍,即:OR=e 3330 62/e 3230 60=e0.0070(330-230)0.42232编辑课件例例2.病例对照研究实例病例对照研究实例一项有关口服避孕一项有关口服避孕(OC)药与心肌梗塞药与心肌梗塞(MI)关系的关系的病例对照研究中,病例对照研究中,MI病例组病例组234人,对照组人,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论