流行病学第八章偏倚及其控制_第1页
流行病学第八章偏倚及其控制_第2页
流行病学第八章偏倚及其控制_第3页
流行病学第八章偏倚及其控制_第4页
流行病学第八章偏倚及其控制_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

biasandtheircontrol第八章偏倚及其控制1

研究的解说涉及到研究的真实性的问题。研究的真实性直接关系到是否获得正确的结论,而真实性需要通过变异性估计来确定。引言2

研究结果的变异性研究的真实性第一节选择偏倚第二节信息偏倚第三节混杂偏倚目录3补1

研究结果的变异性

概述

个体水平的变异性

群体水平的变异性

样本水平的变异性4变异性(variability)

研究结果包括描述性和分析性数据(指标)的变动或波动。一、概述生物学(真实)变异和测量变异生物学变异真实的客观变异测量变异测量过程的误差随机变异和系统变异随机变异绝对值和方向交错变化,正态分布系统变异绝对值和方向保持恒定

变异的来源分为两个层次而偏离真值并且绝对值和方向固定的误差就是系统误差。5表8-1变异性的水平和来源6某个体特征测得值的变化,是个体真值随时间的改变,或是由于测量误差引起的变化。第一节研究结果的变异性二、个体水平的变异性7个体的累计变异群体中的个体具有不同的遗传素质并受环境影响常大于个体变异根据群体的变异范围确定“正常值”范围,用于判定个体测得值是否“正常”群体水平的变异性也受测量误差影响第一节研究结果的变异性三、群体水平的变异性8通过不同样本研究所得结果的差异性

为什么高水平的血清总胆固醇是不利的或不健康的?

(血清总胆固醇与心血管死亡风险呈正相关--Framingham心脏研究。第一节研究结果的变异性四、样本水平的变异性9描述性结果的样本变异性第一节研究结果的变异性样本A样本C样本B10

在图8-1中,群体高胆固醇率为25%,样本A为40%,样本B为20%,样本C为0%。增大样本含量,样本的变异性会减少,样本的高胆固醇率对群体的代表性会增大。11分析性结果的样本变异性①②①9%②6%可信区间,A中有重叠B中无重叠样本越大,效应估计值的抽样误差越小,差异很小的效应值也会有统计学显著差异,但很少有生物学或临床意义。12补2研究的真实性

概述

内部真实性

外部真实性13

真实性(效度)

定义

指研究收集的数据、分析结果和所得结论与客观实际的符合程度。

研究误差

真实性的反面变异可以是真实的(如生物学个体变异),而反映研究误差的变异肯定是不真实的。

一、概述14

随机误差

用统计学方法来估计,增大样本含量可减少,没有固定方向和固定大小,一般呈正态分布。系统误差称为偏倚随机误差以外的,可导致研究结果与真实情况有差异的系统误差,可发生于研究的各个环节,有固定方向和固定大小,理论上可以避免

。研究误差的两种常见类型bias15二、内部真实性

内部真实性(internalvalidity)

定义

研究结果与实际研究对象真实情况的符合程度,----研究本身是否真实或有效。

改善措施

增加研究对象的同质性限制研究对象的类型和研究的环境条件。16

三、外部真实性

外部真实性(externalvalidity)

定义

研究结果与推论对象真实情况的符合程度,又称为普遍性(generalizability)。

----研究能否推广应用到研究对象以外的人群。

改善措施增加研究对象的异质性,使得研究对象的代表性范围扩大。17

在实际研究时,需要综合平衡考虑研究对象的同质性和异质性问题18

研究的偏倚

选择偏倚

信息偏倚

混杂偏倚19

1946年,Berkson偏倚--病人入院机会同病人的多种状况有关联

1976年,Miettinen详细讨论了偏倚的定义,并给出分类框架,分三类选择偏倚信息偏倚混杂偏倚20

由于选择研究对象或变量的方法不恰当,导致入选对象与没有被选入者特征上的差异所造成的系统误差。主要产生于研究的设计阶段以case-controlstudyprevalencestudy中多见。一、选择偏倚(selectionbias)21

描述性研究的选择偏倚

主要体现在样本对总体的代表性上如不是采用随机抽样而是使用方便样本,或某些特定群体(志愿者、因特网利用者等)造成的外部效度(外推)受限问题。控制方法

尽量采用随机抽样,避免样本选取的偏向对特定群体的结果在外推上要谨慎等

22

分析性研究的选择偏倚

主要体现

研究对象进入、排除、不参与或失访等与研究暴露或处理因素存在关联,由此增大或减少暴露与疾病、处理与效应的关联,导致效应估计的偏倚。

控制方法选取具体环节或已选取人群的具体特征分析研究对象的选取是否同暴露或处理因素有关231、常见的类型:

(1)入院率偏倚admissionratebias(Berkson’s--)

利用医院就诊或住院病人作为研究对象时,由于入院率的不同而导致的偏差。(2)现患—新发病例偏倚prevalence-incidence--)

病例对照多用现患病例,而这些病例有可能在患病后改变原来的因素的暴露情况。而队列或临床试验多用新病例。例Friedman对心血管疾病的研究(备注)。

伯克森偏倚奈曼偏倚24

(3)检出征候偏倚detectionsignalbias

因素与疾病无关联,但由于其存在而引起该病症状的出现,使之及早就医而导致该人群较高的检出率,得出二者有关的错误结论。例Ziel1975备注

(4)无应答偏倚nonrespondentbias

(5)易感性偏倚susceptibilitybias

例职业性疾病研究中的健康工人效应。

(6)排除偏倚exclusive--

在研究对象的确定过程中未按对等的原则自观察组或对照组中排除某些研究对象备入院失访志愿者阿司匹林与心梗(慢性关节炎胃溃疡)252、选择偏倚的测量非暴露X100100900900真实情况:ORt=1558090540样本:ORf=4.13A病为对照B为病例暴露X559080540选择偏倚大小:ORf--ORtORt选择概率选择概率选择概率选择概率1=263、选择偏倚的控制:掌握发生环节,选择适当的设计方案及研究方法;严格掌握研究对象的纳入和排除标准,保障较好的代表性;增加应答,采用多重对照:随机化原则。确定有无选择偏倚的关键把握选取环节或已入选对象,是否存在人为增大或减少研究因素与结局的关联程度27二、信息偏倚(informationbias)

定义

又称测量偏倚或观察偏倚,是来自于测量或资料收集方法的问题,使得获取的资料存在系统误差。可来自于研究对象、调查者,也可以是用于测量的仪器设备方法等。由于流行病学的暴露或疾病多为分类测量,所以信息偏倚又可称为错误分类偏倚(misclassificationbias)。信息偏倚同样影响描述性研究和分析性研究的结果。28无差异性错误分类和差异性错误分类表8-3

无差异性错误分类

差异性错误分类

错误分类数据

错误分类数据

研究真实数据

研究真实数据低估了高或低估29

差异性信息偏倚的两种常见类型

回忆偏倚(recallbias)产生于研究对象记忆过去活动和暴露能力的差异。

调查者偏倚(interviewerbias)产生于调查者对研究对象有差异性地收集信息。采取盲法,可以降低调查者偏倚。301.常见的类型:

(1)回忆偏倚

recall–在病例对照研究中常见(2)报告偏倚

reporting--

(3)诊断怀疑偏倚

diagnosticsuspicion--

研究者研究对象均可发生,多见于队列研究及临床实验

(4)暴露怀疑偏倚exposuresuspicion--(5)归类错误偏倚(6)测量偏倚

detection--312.信息偏倚的测量

(1)重测一致性

kappa值评价(2)偏倚程度及方向

信息偏倚:ORf--ORtORt32信息偏倚的控制标准明确盲法客观资料主观资料采用调查技巧避免回忆偏倚:统计学处理ORt=(k+ORf-1)/k33

为了减少错误分类以及改善测量的准确性,---生物学标记物(biologicalmarkers)。优点:测量易感性、内暴露(实际进入体内)剂量或生物学效应(剂量)等。34三、混杂偏倚(confoundingbias)

定义

是指暴露因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰。混杂的本来含义是“混合掺杂”(mixingtogether),这里是指暴露因素对疾病的独立效应与混杂因素的效应混在一起,造成对暴露因素效应的估计偏倚。35混杂因素亦称外来因素(extraneousfactor)是指与研究因素和研究疾病均有关,在比较的人群组中分布不均,歪曲因素与疾病之间的真正联系的因素。最常见的三个混杂因素:吸烟饮酒年龄

混杂因素必须具备以下三个特征:①必须是所研究疾病的独立危险因素②必须与所研究的暴露因素存在统计学联系③一定不是暴露因素与疾病因果链中中间环节归因偏差往往是疾病的危险因子36EFDEFDEFDF’EFDEFDEFDEFDEFD(1)(8)(7)(6)(5)(4)(3)(2)一般相关一般统计联系有因果联系伴随因子E研究因素D研究疾病F混杂因素7、8中间环节4-6缺少条件夸大F、F’都是37

继发关联(secondaryassociation)

定义是一种纯粹由混杂偏倚产生的关联即怀疑的病因(暴露)E与疾病D并不存在因果关系,而是由于两者(E,D)有共同的原因C,E,D同C存在关联,从而继发产生E与D的关联。C高血清胆固醇?D冠心病E黄色瘤38例如高血清胆固醇是冠心病的危险因素,高血清胆固醇可产生沉积于眼睑的黄色瘤,从而导致黄色瘤与冠心病的继发关联。另外,E与C也可以由于相关(因果方向不明)而产生继发关联。例如吸烟是胰腺癌的危险因素,吸烟又与喝咖啡存在相关(没有确定的时间先后),从而造成喝咖啡与胰腺癌的继发关联。C吸烟?D胰腺癌E喝咖啡39

直接因果关联的歪曲

如果怀疑病因E与疾病D既存在直接关联,又存在间接关联(图A)或与其他危险(保护)因素F存在相关(图B),暴露E与疾病D的直接因果关联程度或方向将可能受到混杂干扰,即得到歪曲的关联估计值。

FDE性乱FDHIV感染E静脉吸毒??AB40

例如

静脉吸毒E与性乱F都是HIV感染D的危险因素,吸毒者易发生多性伴行为,即吸毒同HIV感染既存在直接关联(E→D)又存在间接关联(E→F→D)(图8-3,(2)),吸毒与多性伴没有确定的时间先后而呈双向相关(图8-3,(3)),多性伴F将对吸毒E与HIV感染D的直接因果关联起混杂或歪曲作用。41图8-342

判定原则比较混杂因素调控前后的暴露因素效应估计值,如果存在有意义的差异,就产生了混杂偏倚。

调控的统计方法分析阶段:标准化率分层多变量分析设计阶段:匹配随机化分配限制进入43四、混杂偏倚的分层分析

M-H(Mantel-Haenszel)分层分析方法的步骤对可能的混杂因素进行分层判定层间RR或OR是否相等或相近得到控制混杂后的调整RR或OR

再将调整RR或OR与分层前的粗RR或粗OR(cRR或cOR)进行比较44

队列研究

(1)累计发病率资料表8-445(2)发病密度资料表8-546

病例对照研究第三节研究的偏倚表8-647

(1)按可能的混杂因素吸烟分层第三节研究的偏倚表8-7表8-8ai

bi

m1i

ci

di

m0ini

n0

ti

48(2)判定层间关联效应水平是否同质

按是否吸烟分层后,两层内的饮酒与肺癌的关联效应大小是同质(同质性检验)的,可以应用M-H方法计算综合OR第三节研究的偏倚49(3)计算综合或调整OR,并与粗OR比较

P>0.25第三节研究的偏倚50(4)结论吸烟对饮酒与肺癌的关联(cOR=3.69)有混杂作用(cOR≠ORMH)控制吸烟的混杂作用后,饮酒与肺癌无关联(=0.6509,P>0.25)注意针对ORMH的2检验是在排

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论