流行病学研究中的偏倚及其控制_第1页
流行病学研究中的偏倚及其控制_第2页
流行病学研究中的偏倚及其控制_第3页
流行病学研究中的偏倚及其控制_第4页
流行病学研究中的偏倚及其控制_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

流行病学研究中偏倚及其控制主要内容:1、研究结果的变异性2、研究的真实性3、三大偏倚及其控制一、研究结果的变异性(一)变异性概述研究结果包括描述性和分析性数据(指标)的变动或波动。它可存在于不同的水平,包括个体水平、群体水平和样本(研究)水平。

变异的来源可以分为两个层次:1.生物学(真实)变异和测量变异:例如,在个体水平上,某病人的血压真值在一段时间内本身存在波动(生物学变化);同时在血压的测量过程中,又存在一定的测量误差(测量变异)。该病人血压值的总变异就包含生物学变异和测量变异。2.随机变异和系统变异:随机变异的绝对值和方向(符号)交错变化,并呈有界范围的正态分布。系统变异的绝对值和方向保持恒定。1、个体水平的变异性

个体水平的变异性是指某个体特征测得值的变化,它可以是个体真值随时间的改变,也可以是由于测量误差引起的变化。个体水平测得值的变异来源归纳于表8-2。

2、群体水平的变异性1.群体水平的变异性可以看成是各个体的累计变异,因为构成群体的各个个体具有不同的遗传素质并受到不同的环境影响。2.群体的变异程度常常大于个体的变异。一般可根据群体的变异范围来确定“正常值”范围,用于判定个体测得值是否“正常”。如某病人的血清总胆固醇得到一个确定的测得值,可以根据群体血清总胆固醇的变异范围,判定该病人的总胆固醇是否处于“正常”水平。3.群体水平的变异性也受到测量误差的影响。

3、样本水平的变异性

样本(研究)水平的变异性是指通过不同样本的研究所得结果的差异性。

但是,研究通常不能针对整个总体人群来进行,而是通过样本人群来进行,这就引入了抽样变异(误差)。通过不同样本的研究所得的关于总体结果的估计值会有不同,如果排除测量误差,这些样本的估计值与总体真实值(用各样本估计值的均值代表)的差异,就是抽样误差。当样本含量增大时,抽样误差就会减少。二、研究的真实性

(一)真实性概述研究的真实性或效度(validity)是指研究收集的数据、分析结果和所得结论与客观实际的符合程度。如果研究结果与客观实际存在不符合的地方,这就是研究误差,它是研究真实性的反面。研究误差可以分为系统误差和随机误差两部分:系统误差是指有固定方向和固定大小的误差,来自于对象选取、测量和统计分析等的方法学缺陷;而随机误差没有固定方向和固定大小,一般呈正态分布,来自于随机抽样变异和测量随机变异等。系统误差部分,称为偏倚。随机抽样误差可以用统计学方法来估计,并且可以通过增大样本含量来减少。变异可以是真实的(如生物学个体变异),而反映研究误差的变异肯定是不真实的。研究真实性的反面应当包括系统误差和随机误差两部分。(二)内部真实性

内部真实性:是指研究结果与实际研究对象真实情况的符合程度。它回答一个研究本身是否真实或有效。如果一个研究针对实际研究对象提供了真实的描述频率或效应估计值,即随机误差和系统误差较小,则该研究是真实或有效的。如果一个研究本身是不真实或无效的,则很难再应用到其他人群。改善措施有:增加研究对象的同质性,如限制年龄、职业、体质特征或疾病分型等,因为这样可以降低群体水平的变异性,或者使因果机制趋于一致等。(三)外部真实性外部真实性:是指研究结果与推论对象真实情况的符合程度,外部真实性又称为普遍性。它回答一个研究能否推广应用到研究对象以外的人群。如果研究对象对于推论对象的代表性不好,尽管它的内部真实性可能好,但它的外部真实性则肯定差。增加研究对象的异质性,使得研究对象的代表性范围扩大,则可以改善外部真实性。在实际研究确定对象时,需要综合平衡考虑研究对象的同质性和异质性问题。三、研究的偏倚

研究误差中的系统误差部分,称为偏倚(bias)。最著名的早期偏倚研究是Berkson做的,他在1946年证实了采用医院病人对象的病例对照研究容易遭受潜在的选择偏倚,这种偏倚来自于病人入院风险同病人的多种状况有关,又称为Berkson偏倚。1976年Miettinen详细讨论了偏倚的定义,并给出了分类框架,这就是被广泛接受的选择偏倚、信息偏倚和混杂偏倚三分类。(一)选择偏倚的定义指被选定的研究对象与未被抽取的人群在某些特征上存在系统差异而出现的误差。主要发生在设计阶段,也产生于资料收集阶段的失访、无应答等。以在病例对照研究与现况研究中为常见。1.入院率偏倚(admissionratebias)入院率偏倚是由于各种疾病的入院率不同而致的偏倚。现举例说明。某研究者计划研究A病与X因素的关系,A病例取自某医院,同时,他以同一医院随机抽取相应人数的B病人作对照。OR=1,χ2检验差异无统计学意义,说明A病与X因素无关系。假设A病住院率为25%,B病住院率为60%,具有X因素也有一定的入院率为40%。现就上述不同的入院率计算住院人数:A病无X因素住院人数=4800×0.25=1200人A病有X因素住院人数=1200×0.25+(1200-300)×0.4=660人B病无X因素住院人数=4800×0.6=2800人B病有X因素住院人数=1200×0.6+(1200-720)×0.4=912人表6-2医院为基础的病例对照研究P<0.01,上述结果表明人群中A病与X因素本无关联,而以医院病例作为样本所得观察结果则是有关联的。

2.现患-新发病例偏倚,也称奈曼偏倚。研究病例一般是现患病人,不包括死亡病例和那些病程短、轻型、不典型的病例。某些病人在患病后,有可能会改变其原来的某些因素的暴露状况。

这样用于研究的病例类型(现患病例)与队列研究或实验研究的病例不同,它们多用新病例,由此而产生的偏倚即为现患病例-新病例偏倚。美国弗明汉地区居民血胆固醇水平与冠心病关系研究胆固醇百分位队列研究(第6次)病例对照研究(第6次)冠心病非冠心病合计冠心病非冠心病合计>7585462547383472≤7511615111627113117230合计20119732174151151302RR=2.40OR=1.16进一步调查发现,患冠心病病人在被诊断为该病后,其后来的生活习惯或嗜好发生改变,如开始戒烟、多食低胆固醇食物、进行体育锻炼,从而使血中胆固醇水平降低,因此病例对照研究的结论存在明显的差异。3.检出偏倚或称检出症候偏倚(detectionsignalbias),指某因素与某疾病在病因学上虽无关联,但由于该因素的存在而引起该疾病症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群较高的检出率,以致得出该因素与该疾病相关联的错误结论。在对一些慢性疾病如肿瘤、动脉硬化、结石等进行病因研究时,这种偏倚的意义特别重要。

例如:研究绝经期妇女服用雌激素与子宫内膜癌的关系,初步结果显示服用雌激素可使子宫内膜癌发生增多,两者有相关关系,或认为服用雌激素是子宫内膜癌的危险因素。但经仔细分析,特别对子宫内膜癌的发现进行观察,揭示出服用雌激素会导致绝经期妇女不规则的子宫出血,而子宫出血作为一种诊断信息,使她们及时就诊寻求原因,从而大大增加了子宫内膜癌的发现机会。末服用雌激素的妇女中,一旦发生子宫内膜癌,常无明显症状,而未能及时就诊,以致发现较晚。从而高估了雌激素与子宫内膜癌的关系。4.易感性偏倚(susceptibilitybias)

有些因素可能直接或间接地影响观察人群或对照人群对所研究疾病的易感性,导致某因素与某疾病间的虚假联系,由此而产生的偏倚称为易感性偏倚。如职业性疾病研究中的健康工人效应(healthyworkereffect)。

5.排除偏倚(exclusivebias)在研究对象的确定过程中,没有按照对等的原则或标准,而自观察组或对照组中排除某些研究对象,这样导致因素与疾病之间联系的错误估计,称为排除偏倚。例如:在研究吸烟与肺癌的关系时,把与吸烟有关的疾病(支气管炎、冠心病等)病人作为对照,可以低估吸烟与肺癌之间的相关关系,甚至出现假阴性的结果。6.无应答偏倚(non-respondentbias)是指研究对象中那些没有按照研究设计对被调查的内容予以应答者。某个特定样本中的无应答者的患病状况,以及对某一或某些研究因素的暴露情况与应答者可能不同,由此而产生的偏简称为无应答偏倚。无应答偏倚在观察性研究或实验性研究中均可发生。7.失访偏倚(losstofollowupbias)失访:是指在追踪观察的过程中,某些对象由于种种原因而脱离了观察(迁走、与本病无关的死亡及本人退出实验等),观察者无法了解到他们的结局。有两种形式:失访:指观察期限短于规定的观察危险期者。退出:指在随访过程中因种种原因拒绝继续留在观察组中由于失访而引起的偏倚称为失访偏倚。为一种特殊的无应答形式,主要发生在前瞻性性研究及临床试验中。8.志愿者偏倚(volunteerbias)

志愿参加观察者同非志愿者在关心健康、注意饮食及营养食疗、禁烟、禁酒、坚持体育锻炼等方面有系统差异,因支援志愿者被入选为观察对象,而非志愿者落选,由此产生的选择性偏倚,称为志愿者偏倚。例如:美国曾采用邮寄问卷的形式,调查美国退伍军人的吸烟习惯。30天后总结收集的回复,并进行核实发现,不吸烟者有85%回复了问卷,而抽烟者仅67%。这必然导致低估了吸烟与所研究疾病的关系。选择偏倚在理论上可以通过总人群与实际抽样人群疾病与暴露分布情况进行测量。下面以病例对照研究为例,总人群与实际抽样人群中疾病与暴露因素的分布分别如表6-5和表6-6所示:二、选择偏倚的测量与控制

(一)选择偏倚的测量表6-6实际抽样人群疾病与暴露分布表6-5总人群疾病与暴露分布总人群比数比:样本比数比:选择概率为:根据选择概率:选择偏倚或若偏倚=0即=1,则不存在选择偏倚偏倚>0,即>1,则存在正向选择偏倚偏倚<0,即<1,则存在负向选择偏倚(二)选择偏倚的控制◆首先研究者对在整个研究中可能会出现的各种选择偏倚应有充分的了解、掌握◆严格掌握研究对象纳入与排除的标准。

对照的入选原则:不患所研究的疾病且有暴露于研究因素的可能;不患有与研究因素有关的其他病;在某些方面与病例组的可比等(二)选择偏倚的控制◆在研究中采取相应措施,尽量取得研究对象的合作,以获得尽可能高的应答率,减少无应答率及队列研究中的失访和实验性研究中的中途退出等。◆尽量采用多种对照如在病例对照研究中,理想的研究对象应是人群中的全体病例和非该病病例及正常人,或其有代表性的样本,但往往很难做到。(二)信息偏倚

信息偏倚:又称观察偏倚,是指在研究的实施阶段从研究对象获取研究所需的信息时所产生的系统误差。

信息偏倚可来自于研究对象、研究者本身,也可来自用于测量的仪器、设备、方法等。1.回忆偏倚(recallbias)

指研究对象在回忆以往发生的事情或经历时,由于在准确性和完整性上的差异所致的系统误差。回忆偏倚在病例对照研究中最常见。

产生的原因:◆调查的事件或因素发生的频率甚低,未给研究对象留下深刻印象而被遗忘;◆调查事件是很久以前发生的事情,研究对象记忆不清;◆研究对象对调查的内容或事件关心程度不同,因而回忆的认真程度有异。2.报告偏倚(reportingbias)指由研究对象有意的夸大或缩小某些信息而导致的偏倚,因此亦被称作说谎偏倚。3.诊断怀疑偏倚(diagnosticsuspicionbias)由于研究者事先了解研究对象对研究因素的暴露情况,怀疑其已患某病,或主观上倾向于应该出现某种阳性结果,于是在作诊断或分析时,倾向于自己的判断。由此而造成的偏倚称为诊断怀疑偏倚。诊断怀疑偏倚多见于临床试验和队列研究,在病例对照研究中也可产生,亦可发生于研究对象。4.暴露怀疑偏倚研究者若事先了解研究对象的患病情况或某种结局,可能会对其以与对照组不可比的方法探寻认为与某病或某结局有关的因素,如多次认真地调查和询问病例组某因素的暴露史,而漫不经心地调查和询问对照组,从而导致错误结论,此即暴露怀疑偏倚。5.测量偏倚(detectionbias)测量偏倚指对研究所需指标或数据进行测定或测量时产生的偏差。所用仪器、设备校正不准确,试剂不符合要求,使用方法的标准或程序不统一,分析、测试条件不一致,以及操作人员的技术问题等等,均可导致测量结果的不正确,使测量结果偏离真值。所用调查表设计的科学性,记录是否完整,调查人员对工作的认真程度以及访问方式、态度等等,亦均可导致不准确的信息,产生测量偏倚。1、信息偏倚的种类不应答偏倚回忆偏倚报告偏倚(说谎偏倚)社会期望偏倚诊断怀疑偏倚暴露怀疑偏倚测量偏倚来自于被调查者来自于调查者来自于测量仪器2、信息偏倚的测量

一项研究资料是否存在信息偏倚以及偏倚的方向与大小,可通过比较、分析在一定研究对象中调查所得到的信息与实际信息(如客观检查、记录等)予以测量。病例组:灵敏度=54/60=0.90

特异度=28/40=0.70对照组:灵敏度=27/30=0.90

特异度=40/70=0.70

这种由于信息偏倚所导致的错误分类等同地发生在两组,称为无差异错误分类(非特异性错分)(nondifferentialmisclassfication)。发生无差异错误分类时,资料的效应估计值(OR或RR)低于实际值,使效应估计值趋于无效值,低估研究因素与疾病之间的联系。

信息偏倚=(ORx-OR)/OR若得值=0,则不存在信息偏倚;若得值>0,则存在信息偏倚,此时ORx>OR;若得值<0,则存在信息偏倚,此时ORx<OR。OR=(60×70)/(30×40)=3.5ORx=(66×52)/(34×48)=2.1信息偏倚=(ORx-OR)/OR=(2.1-3.5)/3.5=-0.40如计算所得两组的灵敏度与特异度不同,称为有差异错误分类(特异性错分)。当发生有差异错误分类时,资料的效应估计值高于或低于实际值。即可能高估也可能低估因素与疾病之间的联系。信息偏倚=(ORx-OR)/OR若得值=0,则不存在信息偏倚;若得值>0,则存在信息偏倚,此时ORx>OR;若得值<0,则存在信息偏倚,此时ORx<OR。OR=(600×700)/(300×400)=3.5ORx=(660×750)/(340×250)=5.8信息偏倚=(ORx-OR)/OR=(5.8-3.5)/3.5=0.663、信息偏倚的控制1.研究者对拟进行的研究要制定明细的资料收集方法和严格的质量控制方法2.尽可能采用‘盲法’收集资料3.尽量采用客观指标的信息4.回忆偏倚:可通过一定的调查技巧加以避免,如可选择一个与暴露史有联系的鲜明的记忆目标帮助其联想回忆等等。此外对在条件允许时询问到的暴露史,尽可能的与客观记录核实。敏感问题:可通过调查知情人或相应的调查技术获取正确的信息。(三)混杂偏倚的定义混杂偏倚或称混杂(confounding),是指在流行病学研究中,由于一个或多个潜在的混杂因素的影响,掩盖或夸大了研究因素与疾病(或事件)之间的联系,从而使两者之间的真正联系被错误地估计。2.特点◆必须是所研究疾病的独立危险因子;◆必须与研究因素(暴露因素)有关联(有统计学联系);◆一定不是研究因素与研究疾病因果链上的中间变量。(三)混杂偏倚的测量1.测量的方法可通过比较含有该因素时研究因素与疾病的效应估计值,(如RR,OR),与排除该因素后的效应估计值来实现。设含有某可疑混杂因素(f)时,研究因素与研究疾病的效应估计值为cRR或cOR,称作粗RR或粗OR;按该可疑混杂因素调整后的效应估计值,即排除掉该因素的可能混杂作用后的效应估计值为aRR(f)或aOR(f),称作调整RR或调整OR(可用Mantel-Haenszel分层分析方法计算)A.若cRR=aRR(f),则f无混杂作用,cRR不存在f的混杂偏倚。B.若cRR≠aRR(f),则f有混杂作用,cRR存在f的混杂偏倚。C.若cRR>aRR(f),为正混杂(positiveconfounding),亦称阳性混杂,即由于f的混杂作用,使cRR高估了研究因素与研究疾病之间的联系。D.若cRR<aRR(f),为负混杂(negativeconfounding),亦称阴性混杂,即由于f的混杂作用,使cRR低估了因素与研究疾病之间的联系。混杂偏倚=[cRR-aRR(f)]/aRR(f)口服避孕药(OC)与心肌梗死(MI)关系的病例对照研究结果病例(MI)对照合计服OC392463未服OC114154268合计153178331cOR=2.20(1.26-3.84)(x2=7.70,P<0.01)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论