




已阅读5页,还剩89页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,流行病学中常见的 偏倚及其控制,Biases and Their Control 吴库生 汕头大学医学院预防医学教研室,2,误差 (error),对事物某一特征的测量值偏离真实值的部分。 随机误差 (random error ) 系统误差 (systematic error ),3,随机误差,指随机抽样所得的均值与总体参数的差异,也称抽样误差。只能减少,不能避免。 可以是测量方法本身的随机变异,也可以是被测定的生物现象的随机变异。 利用统计学技术可估计随机误差的大小,但随机误差无法消除。,4,随机误差的两个特点,样本的观察值都在平均值上下分布,从许多无偏倚样本中得到的观察值均数,假如数量较大,总是趋向于接近总体值; 随机误差的范围可以用可信区间估计,当保持随机方法而加大样本时,样本均值逐渐向总体均值接近。,5,描述性结果的样本变异性,图81,样本A,样本C,样本B,6,在图8-1中,群体高胆固醇率为25%,样本A为40%,样本B为20%,样本C为0%。 增大样本含量,样本的变异性会减少,样本的高胆固醇率对群体的代表性会增大。,9,样本越大,效应估计值的抽样误差越小(95%可信限越小),统计检验能发现的两组间效应差值越小。 样本非常大,两组间差异很小的效应值也会有统计学显著差异,但这很少有生物学或临床意义。,10,系统误差,当对群体的某一特征做一次测量或对某一个体的某一特征做多次测量时,所得均值与总体间的真实性也会产生误差,如果误差向量的方向一致或基本一致时,这种误差称为系统误差。,11,系统误差不是由随机抽样所引起的,而是由某些不能准确定量但较为恒定的因素所引起,其结果导致测量值系统地偏离总体的真实值。,12,举例:用动脉血压计测量某人血压(实际值为80mmHg),各次读数的均值为100mmHg,系统误差和随机误差可用以下图示,随机误差,80,100,舒张压(mmHg),系统误差,发生频次,血压计法测量舒张压值的分布,13,随机误差和系统误差的区别,假设一项研究可以将样本量增至无穷大,如果研究样本无穷大能使误差减小到零,则此误差为随机误差。系统误差不受样本量增加的影响,因此在研究样本无穷大时仍然存在的误差是系统误差; 适当的重复试验或增加样本含量可以减少随机误差,但不能减少系统误差。,14,偏倚(bias),指在流行病学研究中样本人群所测得的某变量系统地偏离了目标人群中该变量的真实值,使得研究结果或推论的结果与真实情况之间出现偏差,这是由系统误差造成的。,15,偏倚的方向,(一)正偏倚和负偏倚: 凡夸大真实效应者为正偏倚。 凡缩小真实效应者为负偏倚。 假如某特征的真实值为,而测得值为。 1.0为零效应; 1为危险效应; 1为保护效应。,16,1.1时: (1) 1时,夸大危险效应,为正偏倚。 (2)1时,缩小危险效应,为负偏倚。 2.1时: (1) 1时,夸大 保护效应,为正偏倚。 (2)1时,缩小保护效应,为负偏倚。,17,(二)趋向无效值偏倚、远离无效值偏倚或颠倒偏倚:无效值指产生零效应的值。例如,对于RR或OR等于1时即无效值。就RR或OR而言: 当1时,若1,则为远离无效值偏倚。 若1,则为趋向无效值偏倚。 当1或1,若和在1的两侧,则为颠倒偏倚。,18,3.举例: (1)RR1.5 RR=2.0时,为远离无效值正偏倚。 (2)RR0.6 RR=0.8时,为趋向无效值负偏倚。 (3)RR=1.2 RR=0.9时,为颠倒负偏倚。,19,1946年,Berkson做最著名的偏倚研究并给予证实,又称为Berkson偏倚。 1976年,Miettinen详细讨论了偏倚的定义,并给出分类框架,分三类 选择偏倚 信息偏倚 混杂偏倚,20,选择偏倚(selection bias ),指被选入到研究中的研究对象与没有被选入者特征上的差异所造成的系统误差。主要产生于研究的设计阶段,在各类流行病学研究中均可能发生,以在病例对照研究与现况研究中为常见。 例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。,21,描述性研究的选择偏倚 主要体现在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某些特定群体(志愿者、因特网利用者等)造成的外部效度(外推)受限问题。 控制方法 尽量采用随机抽样,避免样本选取的偏向 对特定群体的结果在外推上要谨慎等,22,分析性研究的选择偏倚 主要体现 研究对象进入、排除、不参与或失访等与研究暴露或处理因素存在关联,由此增大或减少暴露与疾病、处理与效应的关联,导致效应估计的偏倚。 控制方法 选取具体环节或已选取人群的具体特征 分析研究对象的选取是否同暴露或处理因素有关,23,常见的选择偏倚,1、入院率偏倚(admission rate bias) 亦称伯克森偏倚(Berksons bias),是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同或就诊机会的不同而导致的偏倚。,24,不同疾病在不同医院的就诊或住院率各异,其原因是多方面的,如不同医院的技术专长,患者所患疾病的严重程度,患者的经济状况,以及就诊方便与否等。因此,若在医院内选择研究对象进行流行病学研究时,应注意到可能会出现这种偏倚。,25,用住院病例进行研究时可能没有包括: 抢救不及时死亡的病例 距离医院远的病例 无钱住院的病例 病情轻的病例,26,过敏及代谢性疾病与疲乏的关系,27,呼吸道疾病与骨及运动器官疾病的关系,28,2、现患-新发病例偏倚(Prevalence-incidence bias) 又称奈曼偏倚(Neyman bias),凡因现患病例与新病例的构成不同,只调查典型病例或现患病例的暴露状况,致使调查结果出现的系统误差都属于本类偏倚。,29,在美国弗明汉地区对心血管系统疾病的研究中发现:男性居民在队列研究中,具有高胆固醇水平者,患冠心病的OR 值为2.4,而在病例对照研究中,病例组和对照组却无明显差异(OR =1.16)。 原因:病例对照研究中的现患病例已改变了他们高胆固醇的饮食习惯。,30,3、无应答偏倚(non-respondent bias) 无应答者指调查对象中那些因为各种原因不能回答调查研究工作所提出的问题的人。一项研究工作的无应答者可能在某些重要特征或暴露上与应答者有所区别。如果无应答者超过一定比例,就会使研究结果产生偏倚,即无应答偏倚。,31,安阳县食管癌普查,普查率仅20左右,不能代表总体。 造成无应答的主要原因: 研究对象不了解研究目的;调查内容不当,过于繁琐,涉及隐私;对象不能正理解调查内容(文化低、高龄等);对象病重、外出。,32,研究人员调查美国西北部铁路职工冠心病分布情况。虽然采取各种措施鼓励和要求全体职工参加此项工作,但一般职工只有73.6%,扳道工只有58%自愿参加。初步分析结果表明,一般职工冠心病现患率为43,扳道工为24 ,两者差异有显著性。,33,失访偏倚:是一种无应答,主要发生在前瞻性队列研究和实验研究中。 (1)随访过程中因种种原因拒绝继续留在观察组中。 (2)观察对象在出现预期的结果之前死于其他疾病或事故。 如果暴露组与对照组观察对象均有500人,随访过程中均失访100人,其结果是否可靠?,34,4、志愿者偏倚(volunteer bias ) 志愿者与非志愿者在关心健康、注意饮食卫生及营养食疗、戒烟戒酒、体育锻炼等方面有系统差别。如选择志愿者为对象,而非志愿者常落选,可能会产生偏倚。 例如:观察体育锻炼预防冠心病的效果 实验组为志愿者,非志愿者为对照组。,35,美国疾病控制中心调查参加过内华达州原子武器实验部队中继发白血病的发病情况时,追踪随访了76%的人,其中82%是调查员追踪到的,但有18%是由于宣传的影响而主动与调查员接触的。18%主动报告的研究对象中有4例白血病,而82%调查员随访的对象也只有4例。,36,5、检出征候偏倚(detection signal bias) 亦称为揭露伪装偏倚(unmasking bias),指某因素与某疾病在病因学上虽无关联,担由于该因素的存在而引起该疾病症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群较高的检出率,以致得出该因素与该病相关联的错误结论。,37,有人以病例对照研究发现,子宫内膜癌患者的雌激素比例显著高于对照组,认为子宫内膜癌与服用雌激素密切相关。,38,1978年,Horwitz和Feinstein:口服雌激素与子宫内膜癌的高度关联是虚假的,是一种检出偏倚。 (1)人群中有一定量无症状的子宫内膜癌早期病人。 (2)无症状的子宫内膜癌早期病人如服用雌激素易发生子宫出血而就诊,由此被发现而选入病例组。 (3)对照组为一般住院病人。 结果:雌激素服用率高于对照组。,39,Feinstein从同一医院中随机选取妇科其他良性肿瘤患者为对照进行研究:口服雌激素与子宫内膜癌无关联。,40,6、易感性偏倚(susceptibility bias) 有些因素可能直接或间接影响观察人群或对照人群对所研究疾病的易感性,导致某因素与某疾病间的虚假联系,由此产生的偏倚称为易感性偏倚。 如:当研究某种有毒物质对工人的健康危害时,常发现暴露于有毒物质的工人的死亡率比一般人群还低,这主要是接触该有毒物质的工人,其初始的健康水平要比一般人群要高,其易感性低。,41,健康工人效应 有人开展了一项历史性队列研究,来评价接触木尘对呼吸系统疾病死亡率的影响。研究者选择了家具制造厂的工人作为暴露组,以全体人群作为非暴露组,结果发现家具制造厂工人的呼吸系统疾病的死亡率低于全人群。,42,7、排除偏倚(exclusive bias) 在研究对象的确定过程中,没有按照对等的原则或标准,而自观察组或对照组中排除某些研究对象,这样导致因素与疾病之间联系的错误估计,称为排除偏倚。,43,在一项关于阿司匹林与心肌梗塞关系的病例对照研究中,病例组与对照组均不应包括患慢性关节炎者,亦不应包括慢性胃溃疡病人,因前者倾向于服用此药,而后者倾向于不服用此药。,44,研究利血平与乳腺癌关系时,若病例组(患乳腺癌妇女)含有高血压患者,而对照组没有,即使利血平与乳腺癌无任何关联,结果也可能会显示两者之间在统计学上的联系,因为高血压患者增加了利血平的暴露率。,45,选择偏倚的控制,研究者应充分了解该项研究工作中各种可能的选择偏倚来源,并在研究设计过程中尽量避免; 严格掌握研究对象的纳入与排除标准,使研究对象能较好地代表其所出自的总体; 为了避免存活因素的影响,在进行病例对照研究时,如果病例组选择新诊断的病人,则对照组不应由慢性病病人组成;如果对照所患的慢性病严重地影响暴露,则更不应作为对照;,46,为了避免由于拒绝参加研究而引入选择偏倚,应尽可能地降低拒绝参加人员的比例。有人主张对拒绝参加者做出各种假设分开分析; 在队列研究中随访全部研究对象,或获得尽可能高的应答率,可能预防或减小偏倚。,47,信息偏倚(information bias ),又称观察偏倚(observational bias),指研究中有关研究对象的或来自研究对象的信息是错误的,会产生系统误差。信息偏倚的表现是使研究对象的某种特征被错误分类如暴露者与某因素被错误地认为是非暴露者,某病的患者被认为是非患者。,48,常见的信息偏倚,1、回忆偏倚(recall bias) 指在回忆过去的暴露史或既往史时,因研究对象的记忆失真或回忆不完整,使其准确性或完整性与真实情况间存在的系统误差。,49,小儿白血病母亲怀孕时接受x线的回忆 死于白血病的小儿的母亲增加了暴露于x线的回忆。 病例 医院 对照 社区 认真回忆暴露史 暴露经历易遗忘或不重视,50,回忆偏倚产生的原因,由于调查的因素或事件发生的频率低,未给研究对象留下深刻的印象而被遗忘; 调查事件是很久以前发生的事情,研究对象记忆不清或已经遗忘; 研究对象对调查的内容或事件关心程度不同,因而回忆的认真程度有异,回答问题的多少及准确性也有所不同。,51,2、报告偏倚(reporting bias) 与回忆偏倚不同,报告偏倚是指研究对象因某种原因故意夸大或缩小某些信息而导致的偏倚,因此也称说谎偏倚。 如隐瞒与隐私有关的暴露史 保护调查对象声誉隐瞒不良暴露史 夸大职业暴露,52,3、诊断怀疑偏倚(diagnostic suspicion bias) 如果研究者事先了解研究对象对研究因素的暴露情况,怀疑其已经患某病,或在主观上倾向于应该出现某种阳性结果,于是在作诊断或分析时,倾向于自己的判断。如对暴露者或实验组进行非常细致的检查,而对非暴露者或对照组则不然,从而使研究结果出现偏差。,53,对较长期服用氯霉素的患者,医生反复查血象,甚至进行骨髓象等检查,可较早较多地发现粒细胞减少症、再生障碍性贫血等疾病,而服用其他药物的疾病则不注意血象检查,使以上疾病不能被及时发现,结果是人为夸大了服用氯霉素与粒细胞减少症、再生障碍性贫血等疾病的关联。,54,多见于临床试验、队列研究,特别是在诊断亚临床病例、判断药物的不良反应时最易产生。 研究口服降糖灵治疗2型糖尿病是否导致心血管病死亡率升高 降糖灵组:死亡者均尸体解剖,寻找心血管病的死因。 其他组:(对照组、胰岛素组) 难得解剖,55,4、暴露怀疑偏倚(exposure suspicion bias) 研究者若事先了解研究对象的患病情况或某种结局,主观上认为某病与某因素有关联时,在病例组和对照组中采用不同的方法或使用不同深度和广度的调查方法探索可疑的致病因素,从而导致错误的研究结论,由此引起的偏倚称为暴露怀疑偏倚。,56,在对儿童甲状腺癌过去放射性物质暴露史的调查中发现,在分别为36和22例的两组患儿中,以常规方法调查发现有暴露史者分别为28%和0,而通过深入的调查和询问发现,两组有暴露史者分别达到47%和50%。,57,5、检出偏倚(detection bias) 实验过程中由于实验的仪器和试剂质量不好及操作人员的操作误差造成的偏倚称为检出偏倚。,58,6、诱导偏倚(inducement bias) 在调查过程中,调查者询问技术不当,或者为取得阳性结论,诱导调查对象做某一倾向性的回答,从而使调查到的结果偏离真实情况,由此产生的偏倚称诱导偏倚。,59,信息偏倚的控制,研究者对拟进行的研究要制定明细的资料收集方法和严格的质量控制方法; 尽可能采用“盲法”收集资料; 尽量采用客观指标的信息; 严格调查设计和研究人员的科学态度。,60,收集资料的范围可以适当有意识地扩大些,借以分散调查人员和研究对象对某项因素的注意力,减少某些偏见带来的偏倚。 通过调查知情人或采用相应的调查技术,获取正确信息,避免报告偏倚。 选择一个与暴露史有联系的鲜明的记忆目标帮助其联想记忆或选择新病例作为对象。,61,为了减少错误分类以及改善测量的准确性,研究者们正在越来越多地使用生物学标记物(biological markers)。它们可以用来测量易感性、内暴露(实际进入体内)剂量或生物学效应(剂量)等。,62,混杂偏倚(confounding bias),混杂偏倚指在流行病学研究中,由于一个或多各潜在的混杂因素的影响,掩盖或夸大了研究因素与疾病之间的联系,从而使两者之间的真正联系被错误地估计。,63,混杂因素,亦称外来因素,指与研究因素和研究疾病均有关,若在比较的人群中分布不均,可歪曲研究因素与疾病之间真正联系的因素。,64,混杂因素的基本特征,必须是所研究疾病的独立危险因素,如果不找出或不避开,所得的研究结果可能不是研究因素造成的; 必须与所研究的暴露因素存在统计学联系; 一定不是研究因素与研究疾病因果链上的一个环节或中间变量。,65,重度饮酒与肺癌关系,目前指吸烟是肺癌病因之一,饮酒的人多吸烟。如果研究重度饮酒与肺癌关联的资料,可以看到重度饮酒者肺癌死亡率比不饮酒者高,那么重度饮酒是肺癌的病因吗?,66,在全体观察对象中饮酒与肺癌的关系(模拟资料),率比:60/40 = 1.5,67,在不吸烟者中饮酒与肺癌的关系(模拟资料),率比:10/10 = 1.0,68,在吸烟者中饮酒与肺癌的关系(模拟资料),率比:93/85 = 1.1,69,在不吸烟者中看不到饮酒与肺癌之间的关联,在大量吸烟者中,也看不到饮酒与肺癌之间的关联。吸烟是肺癌的病因之一,又与正在研究的暴露(饮酒)有关联,所以,在这项研究中吸烟是个混杂因素。,70,在研究吸烟与肺癌的关系时,可能的混杂因素有什么呢?,71,判定原则 比较混杂因素调控前后的暴露因素效应估计值,如果存在有意义的差异,就产生了混杂偏倚。 调控的统计方法 设计阶段:标准化率、分层和多变量分析 设计阶段:配比、随机化分配或限制进入,72,混杂偏倚 假关联 继发关联 直接因果关联的歪曲,C,E,D,D,E,F,D,E,F,(1)继发关联,(2)直接因果关联的歪曲,(3)直接因果关联的歪曲,图 混杂偏倚引起假关联,?,?,?,73,1.继发关联(secondary association) 纯粹由混杂偏倚产生的关联 怀疑的病因(暴露)E与疾病D并不存在因果关系,而由于两者(E,D)有共同的原因C,从而继发产生E与D的关联 E与C也可以由于相关(因果方向不明)而产生继发关联,C,E,D,(1)继发关联,?,74,黄色瘤D,喝咖啡E,高血清胆固醇C,吸烟C,胰腺癌D,冠心病E,?,?,例:,继发关联,75,2.直接因果关联的歪曲 怀疑的病因(暴露)E与疾病D既存在直接关联,又存在间接关联(图5,(2)) 或与其他危险(保护)因素F存在相关(图5,(3)) 直接因果关联程度或方向将可能受到混杂干扰,歪曲估计值,D,E,F,D,E,F,?,?,(2)直接因果关联的歪曲,(3)直接因果关联的歪曲,76,HIV感染D,性乱F,静脉吸毒E,?,例:,直接因果关联的歪曲,77,静脉吸毒E与性乱F都是HIV感染D的危险因素,吸毒者易发生多性伴行为,即吸毒同HIV感染既存在直接关联(ED)又存在间接关联(EFD)(图8-3,(2)),吸毒与多性伴没有确定的时间先后而呈双向相关(图8-3,(3)),多性伴F将对吸毒E与HIV感染D的直接因果关联起混杂或歪曲作用。,78,混杂的控制,1、限制 针对某一或某些可能的混杂因素,在设计时对研究对象的入选条件予以限制。控制已知的混杂因素,不能控制未知的混杂因素。,79,利:对研究对象针对潜在的混杂因素实行限制后,可得到同质的研究对象,从而可以防止某些混杂偏倚,有利于对研究因素与疾病之间的关系作出较为准确的估计 弊:研究对象对总体的代表性可能会受到影响,因而研究结论的外推会受到一定的限制,80,2、匹配 在为研究对象选择对照时,使其针对一个或多个潜在的混杂因素与研究对象相同或接近,从而消除混杂因素对研究结果的影响。,81,利:对某一因素进行匹配可以消除掉该因素可能的混杂作用,提高统计效率 弊:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 房屋租赁合同新规
- 物业管理与维护服务合同
- 度建筑项目劳动合同
- 工业机器人技术与应用模拟题含答案
- 建设工程合同管理策略与实践
- 系统集成项目进度管理
- 租赁合同续约补充协议书范文
- 2024年7月份聚丙烯基压阻传感材料线性度协议
- 2025年部编版道德与法治四年级下册第一单元复习课教案
- 联合站管理案例分享会
- (一模)2025年广州市普通高中毕业班综合测试(一)生物试卷(含答案)
- 专题05 首字母填空20篇(名校期末真题)-八年级英语下册重难点讲练全攻略(牛津上海版)
- 湖南省宁远一中2024-2025学年高一下学期第一次月考化学试卷(原卷版+解析版)
- 2025年浙江义乌中国小商品城进出口有限公司招聘笔试参考题库附带答案详解
- 人要有自信+课件-+2024-2025学年统编版道德与法治七年级下册
- (二调)武汉市2025届高中毕业生二月调研考试 历史试卷
- 2024年河北互通高速公路发展集团有限公司招聘考试真题
- 2025年河南建筑职业技术学院单招职业技能测试题库审定版
- 校园环境下的学生心理健康与体育结合研究
- 化妆品营销策略与实践考核试卷
- 第十八章 平行四边形 评估测试卷(含答案)2024-2025学年数学人教版八年级下册
评论
0/150
提交评论