版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
混杂偏倚的识别与控制
一、混杂偏倚的概念
在病因研究中,当对所关心的某种暴露因素(E)与某种疾病(D)之间的关联进行定量估计时,由于其他因子(F)的影响,致使E和D之间关联的真实性被歪曲,关联强度被放大或缩小,这种歪曲关联真实性的作用被称作混杂作用(confoundingeffect),起到混杂作用的因子被称为混杂因子(confounder或confoundingfactor,F)。♦混杂偏倚本质
√一种人为造成的偏倚√是在研究的设计阶段未对混杂因子加以控制或资料分析时未能进行正确校正所致√是完全可以避免和控制的一种系统误差♦
混杂因子成立的条件(1)必须是所研究疾病的危险因素或保护性因素(2)必须和暴露因素之间存在统计学关联(3)一定不是暴露因素与疾病因果链上的中间变量
二、混杂偏倚产生的机理
例:氡气与肺癌的定群研究
♠以RR值描述暴露于氡气人群与不暴露于氡气人群在肺癌发生频率之间的关联强度。
肺癌患者(D+)未患肺癌者(D–)
暴露于氡气的人群(E)aba+b未暴露于氡气的人群(Ē)cdc+da/(a+b)RR=----------------------c/(c+d)以四格表的数据计算关联强度指标RR值
♦RR值的真实性评价
此RR值是否真实地反映了氡气与肺癌之间的关联强度,完全取决于下述条件:
(1)氡气暴露人群(E)和未暴露人群(Ē)之间在产生肺癌的易感性方面是否可比
(2)导致肺癌的其它危险因素在两组人群之间的分布频率是否可比。“a”例肺癌的归因可能性(来自暴露人群):(A)由氡气所致
(B)由吸烟所致(研究者已知道的致肺癌因素)(C)由其它未知因素所致
“c”例肺癌的归因可能性(来自非暴露人群):
(B)由吸烟所致
(C)由其它未知因素所致
♦对RR值的解读此相对危险度RR在本项研究中包含有三种效应:(A)氡气的致癌效应
(B)吸烟的致癌效应
(C)其它未知因素的致癌效应
♦RR值产生混杂偏倚的条件
(B)吸烟的致癌效应RRS≠1
(C)其它未知因素的致癌效应RRU≠1
♦当吸烟的致癌效应RRS≠1时
下述情况下吸烟可导致该研究产生混杂偏倚:◘研究设计阶段:未保证吸烟者在两人群中的均衡性◘分析阶段:未先将两人群按吸烟和未吸烟分层,然后再按每一层去确定氡气暴露和肺癌之间的关联
该研究中混杂偏倚产生的机理:
是因为导致肺癌产生的另一因素吸烟在两
组人群中分布不均衡。
三、混杂偏倚和混杂因子的判别
♦根据专业知识确定研究中可能存在的混杂
因子
在流行病学研究中,混杂因子可分为两类:
1.人口统计学因子:
年龄、性别、种族、职业、经济收入、文
化水平等人口统计学指标,是经常遇到的
混杂因子。
2.暴露因素以外的其它危险因子:研究中混杂因子广泛存在,表现形式多样,
常常在隐匿中起到混杂作用。
♦利用分层分析进行定量判别-以定群研究为例-分层分析:将研究人群按是否暴露于可疑
混杂因子F分类(最简单可分为暴露与不
暴露两组),然后再做单因素分析。
未分层资料的分析
cRR暴露人群(E)aba+b未暴露人群(Ē)cdc+d患者(D+)非患者(D-)暴露人群(E)a1b1未暴露人群(Ē)c1d1患者(D+)非患者(D-)aRR1aRR2
分层资料的分析
a2b2c2d2患者(D+)非患者(D-)
暴露第三因子F
未暴露第三因子FD+D-
E+a1b1E-c1d1D+D-
E+a2b2E-c2d2D+D-
E+abE-cdcRRaRR1aRR2F+F-
♦用简单公式描述:1.cRR=aRR2或aRR1:
F不是混杂因子,cRR值不存在F的混杂偏倚。2.cRRaRR2或aRR1:
F是混杂因子,cRR值存在F的混杂偏倚。
上述分析也可适用于病例对照的OR值分析。
四、混杂偏倚的方向根据偏倚的产生机理,当混杂因子对暴露与疾病之间的关联产生歪曲时,混杂偏倚具有一定的方向性和大小。其方向可正可负,其作用可大可小,取决于E、F和D之间的关系。
♦正混杂:cRR或cOR被放大,高于真实值
♦负混杂:cRR或cOR被缩小,低于真实值
五、混杂偏倚的控制
(一)在设计阶段进行控制
1.限制。
2.随机分配:随机分配又可细分为简单随机分配
和分层随机分配(stratifiedrandomization)
两种方式。
3.匹配(matching):匹配是最经常用于控制混
杂因子的方法。
♦群体频数匹配
指混杂因子发生的频度在不同组应大致平横;
♦个体匹配
指按一个至数个混杂因子分层,为病例选择同层
的对照,一个病例配的对照数多为1-4个。
♦匹配的好处√可以有效地控制混杂因子的作用,提高研究结果的真实性;√在减少总样本数的情况下得到结论,提高研究的效率。
♦匹配的缺点:(A)难以对匹配掉的混杂因子及交互作用做深入分析;
(B)在病例对照调查中,用匹配的方法控制混杂经常低估暴露对疾病的作用,严重时会引起过度匹配(overmatching)的问题,掩盖暴露的真实作用。
(C)过分苛刻的匹配,会使得部分病例找不到对照,致使信息浪费,使研究的效率反而降低。
(二)在分析阶段控制混杂
1.分层分析:分层分析是按混杂因素分层后,分别就暴露对疾病的关联做分析,可以使用Mantel-Haenszel方法在分析阶段控制混杂因子。-可以评价在各层中暴露与疾病的关联;-可整体估价用分层技术排除混杂后的暴露与疾病总的关联强度。
例:食管癌病因研究—病例对照研究设计
因素病例对照年龄(岁)
25-111535-919045-4616755-7616665-5510675+1331均值60.050.2标准差9.214.3酒精(克/天)
0-2938640-7528080-5187120+4522均值84.944.4标准差48.431.9
食管癌病例组和对照组暴露因素分布
♦对资料进行初步审查
(1)对照组年轻人比重大于病例组
(2)在病例组中,饮酒消耗量的均值大于对照组,且重度饮酒者的比例大于对照组
(3)年龄和饮酒之间呈现轻度的负相关根据上述资料和已往医学知识,即食管癌在年龄大者中多见,推测年龄这一因素可能对判断饮酒与食管癌之间的关联起一定的混杂作用。
饮酒(E)→食管癌(D)
\∕年龄(F)
♦计算未分层时总的比值比cOR
饮酒不饮酒计
食管癌病例96(a)104(b)200(n1)
对照109(c)666(d)775(n0)
计205(m1)770(m0)975(N)cOR=ad/bc=(96x666)/(104x109)=5.64
[(ad-bc)–0.5N]2(N–1)X2=--------------------------------------n0m0n1m1
=108.11df=1,P<0.0001cOR的95%可信限区间估计公式为:
lnORU,lnORL=EXP[lnOR±1.96x(Var(lnOR))1/2]
式中:
Var(lnOR)=1/a+1/b+1/c+1/d
lnORu,lnORL=1.730.34,
即:ORL=4.02,ORu=7.93年龄(岁)组别每日饮酒量aORi80克0-79克25-病例对照19010635-病例对照42651645.0545-病例对照2529211385.6755-病例对照4227341396.3665-病例对照191836882.5875+病例对照50831
♦按可疑的混杂因子年龄分层计算每层比值比aOR
♦比较cOR和aOR
发现cOR与多组aORi有较大不一致,提示年龄可能
起了一定混杂作用。
♦用Mantel-Haenszel方法
计算调整年龄这一混杂因子影响后总的ORmh。
∑(aidi/Ni)
ORM-H=-----------------------∑(bici/Ni)∑(aidi/Ni)ORM-H=-----------------------∑(bici/Ni)(1x106/116)+(4x164/199)+…+(5x31/44)]ORM-H=--------------------------------------------------(0x9/116)+(2x26/199)+…+(8x0/44)]=5.158
♦对分层后总的ORmh=5.158做X2检验
确定这一样本来自OR=1的总体的概率,计算公式为:
(∑ai–∑Ai–1/2)2X2=-----------------------------------[∑Var(ai;OR=1)]
式中:ai为各年龄组中第一小格内的实际观察值Ai为各年龄组中第一小格内理论值,其估计公式为:
m1in1iAi=---------------(1)Ni
Var(ai;OR=1)为来自总体OR=1的样本分层后各层暴露病例数ai的方差,其计算公式为:
m1in1im0in0iVar(ai;OR=1)=-------------------------(2)Ni2(Ni–1)An1-Am1-An0-m1+An1n0m0m1
在特定的无效假设下,即H0:OR=1时,可根据
前述公式(1)计算理论值A:
m1in1iAi=--------------Ni
计算每一层内第一小格理论值Ai的结果如下:
25-岁组:A1=(10x1)/116=0.08635-岁组:A2=(30x9)/199=1.356······75+岁组:A7=(5x31)/44=1.477
每层的方差按述前公式(2)计算Var(a1;OR=1)如下:
25-岁组:Var(a1;OR=1)=(10x106x1x115)/1162X(116-1)=0.079
35-岁组:Var(a2;OR=1)=(30x169x9x190)/1992X(199-1)=1.106·········75+岁组:Var(a7;OR=1)=(5x39x13x31)/442X(44-1)=0.944
每层的Ai值和Var(ai;OR=1)值见下表:年龄(岁)aiAiVar(ai;OR=1)25-10.0860.07935-41.3561.10645-2511.6636.85855-4221.66810.67065-1912.6406.44975+51.4770.9449648.89026.106
代入上述X2公式,得:
(96–48.890–1/2)2X2=--------------------------------=83.2226.106df=1,P<0.0001
ORmh的95%可信限区间估计公式为:
ORu,ORL=ORmh[1±1.96/(x2)1/2]
式中:X2应为未作连续校正的值,该值为:
X2=(96-48.890)2/26.106=85.01;
以此带入[1±1.96/(x2)1/2]计算得:
[1±1.96/(x2)1/2]=0.7874,1.2126
代入上式得:
ORu,ORL=5.1580.7876,5.1581.2126
=3.64,7.31
比较cOR和ORmh,显示两者有较小的差别,表明年
龄起轻微的混杂作用,经分层调整消除年龄的混
杂作用后,食管癌与饮酒之间的关联为:ORmh=5.158,95%可信限为3.64-7.31。
2.多因素分析
-当分析多个因子的混杂效应时,会出现分层过多的现象,以至难于实现对混杂的调整;
-应用多因素分析方法可有效控制混杂因子的影响常用的方法有下述几种。
(1)多元Logistic回归分析和Cox回归分析适用于因变量为二值函数(患病,不患病)的定
群研究病和例对照研究。(2)协方差分析
适用于因变量是一连续变量的资料分析。效应修正作用的识别与描述D+D-
E+a1b1E-c1d1D+D-
E+a2b2E-c2d2aRR1aRR2F+F-效应修正作用概念:外部因子改变了研究因素与疾病的关联强度测量:如果aRR1≠aRR2,存在效应修正作用:如果aRR1=aRR2,不存在效应修正作用:
意义:探讨病因
正交互作用:aRR1>aRR2
负交互作用:aRR1<aRR2年龄(岁)组别每日饮酒量aORi80克0-79克25-病例对照19010635-病例对照42651645.0545-病例对照2529211385.6755-病例对照4227341396.3665-病例对照191836882.5875+病例对照50831
第三因子年龄分层后计算的每层比值比aOR
各层aORi值不太一致,提示年龄可能是效应修正因子通过一致性χ2检验,确定层间差异是否有统计学意义
aORi一致性χ2检验公式为:
•式中理论值Ai(ORmh),是根据ORmh的值通过计算每个年龄组相应的四格表中ai的理论值所获得,其值的计算可按下述公式解一元二次方程:(本例中ORmh=5.158,为调整混杂效应后总的OR值)
25-34岁组:
A1(115–10+A1)=(1–A1)(10–A1)x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025下半年江苏南京市浦口区卫健委所属部分事业单位招聘人员24人高频重点提升(共500题)附带答案详解
- 2025下半年四川绵阳市属事业单位招考和专业考高频重点提升(共500题)附带答案详解
- 2025下半年四川叙永县融媒体中心招聘事业单位工作人员4人高频重点提升(共500题)附带答案详解
- 2025上海电力大学教务处岗位公开招聘2人高频重点提升(共500题)附带答案详解
- 2025上海沪剧艺术传习所事业单位招聘15人历年高频重点提升(共500题)附带答案详解
- 2025上半年青海省事业单位联考及高频重点提升(共500题)附带答案详解
- 2025上半年湖南岳阳市华容县事业单位招考(第三批)拟录人员高频重点提升(共500题)附带答案详解
- 2025上半年安徽省合肥市直事业单位招聘304人历年高频重点提升(共500题)附带答案详解
- 2025上半年四川省雅安市医护类事业单位招聘155人历年高频重点提升(共500题)附带答案详解
- 铁路旅游推广合同
- 红色颁奖典礼公司年会员工表彰大会模板
- 2022-2023学年福建省泉州市惠安县三年级(上)期末数学试卷
- 统编版语文三年级上册2024-2025学年第三单元测试题 (含答案)
- 2024甘肃省安全员C证考试题库
- 2024-2025学年上学期广州初中地理七年级期末模拟卷1
- 八年级地理期末模拟卷(考试版A4)【测试范围:晋教版八上全册】
- 统编版语文2024-2025学年六年级上册语文期末专题训练:字音字形(有答案)
- 2024年文化娱乐产业投资合同3篇
- 机器人课件模板下载
- 《肺癌病人的护理》课件
- 临时工人劳动合同范本(3篇)
评论
0/150
提交评论