冲撞分层偏倚的识别与控制2017_第1页
冲撞分层偏倚的识别与控制2017_第2页
冲撞分层偏倚的识别与控制2017_第3页
冲撞分层偏倚的识别与控制2017_第4页
冲撞分层偏倚的识别与控制2017_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、冲撞分层偏倚的识别与控制中南大学湘雅公共卫生学院刘爱忠教授乍申雨夫普F CENTRAL SOUTH UNIVERSITY冲撞分层偏倚?误差error偏倚bias混杂 confounding偏倚(bias)研究结果系统地偏离真实值有方向性 正向 负向A混杂偏倚 Confounding: from nonrandom exposure assignment在测量因果关联或给因果关系下结论时,由于不恰当或不完全的分析所弓起的系 统误差。控制:限制,匹配,随机化,分层分析,标准化,多因素分析偏倚(bias)A信息偏倚 Information bias: from imperfect measureme

2、nt测量变量时的系统误差。回忆偏倚,报告偏倚,调查者偏倚,测量偏倚,错误分类偏倚,家庭信 息偏倚控制:统一标准,使用盲法,使用客观指标,调查技巧偏倚(bias)A选择偏倚 Selection bias: from nonrandom subject selection定义或选择硏究对象时的系统误差。检出症候偏倚,入院率偏倚,奈曼偏倚,无应答偏倚,易感性偏倚,排 除偏倚,非同期对照偏倚,迁移性偏倚,不接受测量偏倚,临床资料遗 漏偏倚控制:科学的研究设计,严密的入排标准,随机化,提高应答乍申雨夫普F CENTRAL SOUTH UNIVERSITY2019/6/8Modern Epidemiolo

3、gy, 3rd, Kenneth 丄 Rothman选择偏倚和信息偏倚应该在研究开始前通过好的设计来控制,但也 可以在事后被发现。尽管我们有许多方法来计算不同的偏倚等级以 及估计其对关联强度的影响,但没有办法可以在事后消除选择偏倚 或信息偏倚。混杂偏倚的不同之处在于它可以在资料分析中得到调整。冲撞分层偏倚(collider-stratification bias)是一种特殊类型 的选择偏倚。如入院率偏倚:Berkson发现在人群中患胆囊炎(E )和患糖尿病(D)的风险是独立的,E-D效应为0。假设患胆囊炎(E )和患糖尿 病(D)均会影响入院率(C),贝IJE和D将在“住院”(C)层次上 产生

4、虚假关联。乍申雨夫普F CENTRAL SOUTH UNIVERSITY假设100个人中有10个人患有流感,这100个人从装有50份鸡肉三明 治和50份鸡蛋三明治的盒子中随机拿取一份食用。假设吃了三明治后有55人发热,流感风险0.10.1流感风险10.1此次发热只有两种原因:流感以及鸡蛋三明治被污染。F CENTRAL SOUTH UNIVERSITY识别和控制冲撞分层偏倚? 有向无环图 (directed acyclic graphs, DAGs) ?是指由节点和连接节点(变量)的箭头组成的,所有的变量被箭头 连接的,有方向的路径并且没有形成一个封闭的环的关系图。 DAGs:计算机科学图论中

5、的一个概念。一个图(graph)是由一个点集V (其中有n个节点),以及一个边集E (其中有m个点对(i, J)组成,表示为G二(V, E)这里的边可以是有向边(graph edge),即(i, j) (j,i)是两条方向相反的不同的边。 也可以是无向边,即(i, j) (j,i)是同一条边。若图中的边为有向边,则称该图为有向图(directed graph)。有向图中,如果存在一些有向边a(0), a,a(2)a(K-l), a(k),使得a(K) =a(0),则形成一个环(cycle/ring)有向无环图指的就是不存在环的有向图。DAGs始于20世纪90年代早期,由Pearl和Robins

6、基于逻辑学和机器学习发展起来的。用于描绘变量以及他们之间因果关系方向的形式。Directed指的是能表明变量之间因果关系方向的箭头。Acyclic指的是它不可能始于任何一个变量并跟随者一系列箭 头回到最初的变量。乍申雨夫普F CENTRAL SOUTH UNIVERSITYB一、常用符号1.1单箭头“-和问号" “一”箭头方向即时序关系,反应变量之间可能存在因果关系。“Ef D”表示变量E发生在前,变量D发生在后;变量E是变量D的病因,变量D是变量E的效应。如果E-D的效应是我们拟估计 或研究的,那么在DAGs中,我们可在单箭头上方添加问号“? ”,如图 “ED” ,代表效应的不确定

7、性。/ CENTRAL SOUTH UNIVERSITYB包围的变量,称之为带框变量,代 表着对该变量进行调整。用于表示在对某变量进行调整时, 导致其母变量之间产生新的关联。二、基本术语1、节点表示变量,箭头表示变量间因果关系的方向,一个 箭头代表一个变量对另一变量的直接因果效应(原因f结 果)。2、箭头从变量X发出指向Y,如果中间没有其他变量,X是Y 的母代(parent) , Y是X的子代(child) (X-*Y);如果中 间至少有一个其他变量M, X是Y的祖先(ancestor) , Y是X 的孙代(descendant) (XMY)。3、冲撞变量在一特定路径上,如果该路径的一个变量存

8、在着两个或以上的母 变量或祖先变量,则称该变量为该路径上的冲撞变量/冲撞点( collider)。 a common outcome of two other variables along a path.需要注意的是,某个变量在某条路径上是冲撞点,但在另一条路 径上不一定是冲撞点。MCENTRAL SOUTH UNIVERSITYA > Z < B图2冲撞点示意图4、开放路径(open path)如果一条路径上没有冲撞点,那么这条路径就是开放路径。 反之,如果一条路径上有一个及以上的冲撞点,则该路径 被阻断。(路径:不管箭头的方向如何,由连续的箭头连接)变量间的关联可以通过开放路

9、径传递,也随着路径的阻断 而消失,因此冲撞点是不能传递关联的。即如果暴露与结 局变量处于一条开放路径中,暴露与结局会产生关联,如 果二者间的路径被阻断,则暴露与结局无关。乍申雨夫普W CENTRAL SOUTH UNIVERSITY5、因果路径(causal path)有向无环图中从暴露到结局的因果路径是指箭头从暴露出 发,每一个箭头方向不变,最后指向结局的路径。对某特定研究而言,因果路径是代表该研究中暴露对结局 因果效应的唯一路径。f纤维化一 肺癌6、后门路径(Backdoor path)如果暴露E到结局D的某条路径有一个变量P箭头指向E和D , 那么该路径就是一条从暴露E到结局D的后门路径

10、。如果后门路径中没有冲撞点,那么该后门路径就是一条开 放路径,传递变量间的关联。图2.后门路径有向无环图中的路径可分为因果路径和非因果路径。只有因果路径代表真正的因果关联,包含暴露与结局变量 的开放的后门路径是非因果路径,代表混杂的存在。作为识别混杂因素的工具,有向无环图的主要优点之一就 是有效地识别岀开放的后门路径。由于开放(不包含冲撞点)的后门路径的存在就代表 混杂因素的存在,所以阻断开放的后门路径就能排除 混杂偏倚的影响。乍申雨夫普F CENTRAL SOUTH UNIVERSITY在某特定路径上,若某变量同时存在两(多) 个子变量,则称这个变量为该路径上的混杂变 量,形成开放的后门路径

11、,干扰真正的因果关 联。因此,需要对其调整控制。若某变量同时存在两(多)个母变量,则称这 个变量为该路径上的冲撞变量,阻断路径上关 联的传递。不能对其调整控制,否则会产生新 的虚假关联。乍申雨夫普F CENTRAL SOUTH UNIVERSITY冲撞分层偏倚?假设两个变量X和Y相互独立但都影响第三个变量Z,如 果调整Z,即仅在Z的某一层分析数据,那么该层内X和Y 就会产生一个虚假关联,此时产生的偏倚就称为冲撞分 层偏倚。假设两个变量X和Y同时影响第三个变量C,冲撞变量(C)不会引起其母变 量(X,Y)之间的关联。如果调整C,即仅在C的某一层分析数据,那么该 层内X和Y就会产生一个虚假关联,用

12、虚线“一”表示,此时产生的偏倚就 称为冲撞分层偏倚(collider-stratification bias)。X YEVVED前面的例子:在一般人群中,两种三明治组的流感风险没有差异,三明治 类型和流感是互相独立的。但在发热人群中,两组三明治组的流感风险差 异很大,三明治类型与流感存在关联。Why?“发热”为流感和三明治类型的子变量,符 合冲撞点的定义,本研究中如果对“发热” 分层,仅在发热者中研究流感与三明治的关 联,则会得到二者相关的虚假关联,造成冲 撞分层偏倚。在慢性病的病因学研究中,易发生检出症候偏倚,即某因素的存在导致所 研究疾病相关症候的出现,使其及早就医,以致该人群比一般人群该

13、病的 检出率高,从而得出该因素与该疾病相关联的错误结论。暴露疾病症状结局/“疾病症候”为暴露和结局共同的子变量 ,符合冲撞点(collider)的定义,如果 我们对“疾病症候”这个变量进行分层, 即仅在出现疾病症状的人群中研究暴露与 结局的关系,就会产生冲撞分层偏倚,得到错误的研究结论。由于雌激素治疗可以刺激子宫内膜生长,易导致子宫出血,而子宫内膜癌 也会导致子宫不规则出血,子宫出血为雌激素与子宫内膜癌共同的子变量 ,为冲撞变量。在过去曾子宫出血的女性中估计雌激素治疗对子宫内膜癌的影响时,会产 生冲撞分层偏倚,即检出症候偏差。又例如在分析人群中痴呆与婚姻状况时,假如人群中痴呆和 婚姻状况没有关

14、联,但痴呆和婚姻状况均对居住场所产生影 响,构建DAGs:痴呆f居住场所一婚姻状况,居住场所为冲撞 变量,如果在选择研究对象时选择养老院居民作为样本,可 能在该层面形成婚姻状况与痴呆之间的虚假关联,从而产生 在人群中痴呆与婚姻状况存在关联的错误结论。许多研究者发现,对受暴露和结局影响的变量进行处理,会使暴露和结局 之间在该变量的某一层内产生关联,甚至改变原有关联的方向,使原本有 害的暴露误认为有保护性,从而产生悖论。目前,冲撞分层偏倚被用于解 释“肥胖悖论”:患慢性病(如心血管疾病)的肥胖人群相对于非肥胖人 群显示出更好的生存率。悖论可以部分地归因于冲撞分层偏倚,产生肥胖 对慢性病人群死亡率的

15、虚假保护作用。乍申雨夫普F CENTRAL SOUTH UNIVERSITYHailey R. Banack等使用一项前瞻性队列研究的数据来解释“肥胖悖论”。 建立调整吸烟模型和未调整吸烟模型来评估一般人群中肥胖人群死亡率的 差异,这两种模型都针对年龄,种族,性别和教育进行了调整。模型死亡率比QRR)调整吸烟1.10 (95%CI 1.03,1.18)未调整吸烟1.07 (95%CI 1.00,115)肥胖> 死亡"吸烟符合传统的判断混杂因素的标准,是肥胖与死亡关系的混杂因素 CVD作为肥胖与死亡之间的中介,而U代表导致CVD和死亡率的其他原因。肥胖、吸烟、U均为CVD的母变量

16、,CVD在某些路径上为冲撞变量。如果在研究中加入CVD变量并对其进行调整,则会诱发冲撞分层偏倚。在CVD患者层中,将吸烟作为协变量放入模型中进行调整,在吸烟的CVD患 者中存在肥胖对死亡率的保护作用,但在不吸烟的CVD患者中则不存在这 种作用。这就是前面提到的“肥胖悖论”,即吸烟的混杂效应被夸大,导 致肥胖暴露对结局产生保护。死亡率比(IRR)吸烟| 0.89 (95 % (10.81,0.99)不吸烟1.20 (95%CIL03/1.41) 0F CENTRAL SOUTH UNIVERSITY对混杂变量进行调整和控制可以消除混杂偏倚,从而获得所研究关系的无 偏估计;而对冲撞变量进行调整和控

17、制,则可能诱发冲撞分层偏倚,获得 错误的研究结论。如果研究者将冲撞变量误认为混杂变量而进行调整,会导致冲撞分层偏倚, 即使有好的研究方法,这项研究的结果同样会有问题。如果在有向无环图中调整冲撞点产生了一个新的后门路径,在这种情况 下调整冲撞点就必须同时调整冲撞点的母变量,以确保阻断该新的后门 路径。乍申雨夫普F CENTRAL SOUTH UNIVERSITY乍申雨夫普F CENTRAL SOUTH UNIVERSITYD乍申雨夫普F CENTRAL SOUTH UNIVERSITY如果选择的因素为性别、年龄这些容易被当做混杂变量来处 理的因素时,区分混杂偏倚和冲撞分层偏倚可能存在困难。 尽管

18、冲撞分层偏倚与混杂偏倚都掩盖了研究因素与疾病之间 的真正联系,但从定义上看,两者完全不同。从E到D的包含冲撞变量的路径不是混杂的路径,并且不会在 E和D之间产生关联,然而,对冲撞变量进行不恰当调整会打 开后门路径,使该路径变成混杂路径。混杂偏倚是暴露和结局存在共同原因时,缺乏对暴露和结 局的共同母变量进行调整所造成的偏倚。冲撞分层偏倚是对两个母变量共同的效应变量进行调整而 导致的偏倚,是一种选择偏倚。因此,根据先验专业知识,如通过征询专家意见,文献复 习等方法,绘制出正确的有向无环图,有利于分辨冲撞变 量和混杂变量,防止出现将冲撞变量视为混杂变量进行调 整而导致的冲撞分层偏倚。乍申雨夫普F C

19、ENTRAL SOUTH UNIVERSITY碰撞点?F CENTRAL SOUTH UNIVERSITYF CENTRAL SOUTH UNIVERSITYalcohol, CVD, SES, diet, sex and age?F CENTRAL SOUTH UNIVERSITYTools and programs/projects/tet radhttps:/epi.dife.de/dag乍申雨夫普F CENTRAL SOUTH UNIVERSITY chi胡M Diagram style' classicSEM-like®

20、View mode normalmoral graph correlation graphS Coloring* causal paths< biasing paths* ancestral structure凶 Effect analysisatomic direct effects空 Legend® exposure® outcomeJ ancestor of exposureancestor of outcome ancestor of exposure and outcomeO adjusted variable 一.)unobserved (latent)

21、® other variable® Causal effect identificationAdjustment (total effect) Minimal sufficient adjustment se for estimating the total effect c Xon Y: Z(yJ Testable implicationsThe model implies the following conditional independences:Y丄Z | Ir XExport R code® Model codeI 1 0.663,1.072X E -

22、0.663,-1.072Y 0 -2.115,1.307Z 1 2.115,-1.307I YX I YZ I X乍申雨夫普F CENTRAL SOUTH UNIVERSITYCENTRAL SOUTH UNIVERSITYCHINESE JOURNAL OF EPIDEMIOLOGYISSN: 0254-64S 10:26:12首页I在线投稿I投稿指南I文献检索I编委会成员I流行病学分会I学术活动I联系我们I Englishssue(7): 1035-1038引用本文7向韧戴文杰,館元吴鑫杨艳芳住玲.戴志辉李殊刘爱忠有向无坏囹在因果推断控制混杂因寿中的应用中华痂行病字杂志,2015, 37(

23、7): 1035-1038. Xiang Ren, Dai Wenjie, Xiong Yuan, Wu Xin, Yang Yanfang, Wang Ling, Dai Zhihui, Li Jiao, Liu Aizhcng. Application of directed acyclic graphs in control of confoundingJ, Chinese Journal of Epidemiology. 2016, 37(7): 1035-1038.9'有向无环图在因果推断控制混杂因素中的应用向韧戴文杰点元吴參杨艳芳王玲,載志拝,李松刘爱忠'°

24、;2摘雯观蔡性硏究是流行病字病因研究中戴帛用的万法但在因果推断时混杂因袁彳王征会歪田嶷露与结卮旳真买因果夫联。为了消除混杂,选择殳望调整是夫键所 在。有向无坏图能够将夏杂的因果关系可观化,提供识别混杂的直观方法,将识别泯杂转变成识别最小充分调整隼)一方面有向无坏囹可以选择调整更少的变里,坦加 分析的统计效率;另一方面有向无环图识别的最小充分调整隼可以避开未溺W或有缺失值的变野总之,有向无环囹有助于充分掲示真魁因果关系。关確诃麟圭妙窒頁回无坯理混去凶盍凰杲丟系Application of directed acyclic graphs in control of confoundingXiana

25、 Ren. Dai Wenjie. Xiong Yuan. Wu Xin. Yang Yanfana. Wan a Lina. Dai Zhihui. Li Jiao. Liu Aizhona 滋Abstract: Dbser/ational study is a method mcst comm only used in the etiology skidy of epidemiology, but confoun ders, always distort the true causality oetween exposure and outcome when locaI inferenci

26、n. In odeto eliminate these confounding, the dstermining of variables which need to be adjusted become a key issue. Directea acyclic graph (DAG) could visualize complex causality, provide a simple ana intuitive way to laentiTy tne contounamg. ana convert it into tne Tinamg or the min imal sufficient

27、 adjustment for the control of co nfounding. On the one ha nd, directed acyclic graph can choose less variables, which in crease statistical efficiency of the analysis. On the other hand( it could help avoiding variables that is not measured or with missing values. In a word, the directed acyclic gr

28、aph could (a ci male the reveal of tne real causality efTedively.Key words: Etio ogy sludy Directed acyclic graph Confounder Causalit/有向无环图应用于病因学研究中的混杂控制流行病学进展13卷)有向无环图在流行病学病因推断中的应用现代流行病学第三版17章参考文献:I Judea Pearl. Causal diagrams for empirical research!J. Biometrika, 1995. 82(4):694-695向韧,戴文杰,熊元,等有向无

29、环图在因果推断控制混杂因素中的应用J中华流行病学杂志,2016, 37(7):1035-1038.Xiang R, Dai WJ, Xiong Y, et al. Application of directed acyclic graphs in control of confoundingJ: .Chinese Journal of Epidemiology, 2016,37 (7):1035-10383 Pearl J. An intioduction to causal inferenceC/ Sociological Methods &Research24. 1996:353-

30、379.4 Greenland S, Pearl J, Robins J M Causal diagrams for epidemiologic research.JJ. Epidemiology, 1999, 10(1):37.5 Liu W. Brookhart M A. Schneeweiss S. et al. Implications of M bias in epidemiologic studies: a simulation study.J American Journal of Epidemiology, 2012, 176(10):9386 Stephen R Cole,

31、Robert W Platt. Enrique F Schisterman, et al. Illustrating bias due to conditioning on a collider.jJ. International Journal of Epidemiology, 2010, 39(2):417.7 Horwitz R L Feinstein A R. Alternative analytic methods for case-control studies of estrogens and endometrial cancer.J New England Journal of

32、 Medicine, 1978, 299(20):10898 Greenland S, Neutra R An analysis of detection bias and proposed corrections in the study of estrogens and endometrial cancerfJJ. Journal of Chronic Diseases, 1981. 34(9):433-4389 Joseph Berkson. Limitations of the Application of Fourfold Table Analysis to Hospital Dat

33、a|J. International journal of epidemiology, 2014,43:511-5.10 Pearce N, Richiardi L. Commentary: Three worlds collide: Berkson bias, selection bias and collider bias J. International Journal of Epidemiology, 2014. 43(2):521 4.11| Clarice R. Weinberg. Toward a Clearer Definition of Confounding J Ameri

34、can journal of epidemiology, 1993, 137( 1): 1 &12 Morgenstern J M R. The foundations of confounding in epidemiology!J. Computers & Mathematics with Applications. 1987, 14(9):869-916.13 Greenland S. Quantifying biases in causal models: classical confounding vs collider-stratification bias.|J. Epidemiology, 2003, 14(3):300-306.14 Whitcomb B W. Schisterinan E F, Perkins N J

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论