偏倚及其控制-课件_第1页
偏倚及其控制-课件_第2页
偏倚及其控制-课件_第3页
偏倚及其控制-课件_第4页
偏倚及其控制-课件_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

偏倚及其控制ControlofBias1ppt课件

引言任何科学研究往往会因种种原因而在科研的设计、数据的测量和结果的分析过程中产生误差(error),严重的误差有时会使所研究的结果失去真实意义。因此,在医学研究,特别是流行病学研究中,应对各类误差的影响给予充分的重视及正确的估价。2ppt课件

第一节

误差一般可分为三类

第二节研究的真实性

第三节研究的偏倚目录3ppt课件第一节误差一般可分为三类抽样误差过失误差系统误差4ppt课件1、抽样误差特点:见于各种抽样研究中,凡是期望从总体中抽取样本进行研究,并以样本的结果(均数值或样本率等指标)来估计总体的均数或总体率时,定会产生抽样误差。是由机遇所致,是客观存在且难以避免的,又由抽样本身造成的。产生原因,由于总体中个体之间有差异,从而产生。无方向性。5ppt课件描述性结果的样本变异性6ppt课件在示例中,源群体高胆固醇率为25%,样本A为40%,样本B为20%,样本C为0%。如果增大样本含量,样本的变异性会减少,样本的高胆固醇率对群体的代表性会增大。7ppt课件分析性结果的样本变异性8ppt课件在例中可知:研究A和研究B中膳食改良组五年内发生心机梗死的风险为9%,而降胆固醇药物组为6%。研究A样本较小(200人),两组效应指标(心肌梗死风险)的95%可信限较大,从而发生重叠,统计检验无显著性差异。研究B样本较大(2000人),两组效应指标(心肌梗死风险)的95%可信限较小,从而未发生重叠,统计检验有显著性差异。一般而言,研究样本越大,效应估计值的抽样误差越小(95%可信限越小),统计检验能发现的两组间效应差值越小。如果研究样本非常大,两组间差异很小的效应值也会有统计学显著差异,但这很少有生物学或临床意义。9ppt课件减少抽样误差的方法:扩大样本数改进抽样技术,增加随机性10ppt课件问题:当总体中S=0时,请问还会产生抽样误差吗?11ppt课件2、过失误差如:在流行病学研究中因调查员记录或编码错误等原因造成。不负责任X改进工作管理方法、质量控制方法等加以克服。12ppt课件3、系统误差有一定的方向性!在临床研究中,特别是流行病学研究中,因选择观察对象,收集资料及分析推论时产生的一种非抽样误差被称为偏倚(bias,偏性、偏差)13ppt课件第二节研究的真实性(一)真实性概述(二)内部真实性(三)外部真实性14ppt课件(一)真实性概述研究的真实性是指一项观察或研究所作推论的正确及可靠程度,即所得结果与客观实际的符合程度。如果研究结果与客观实际存在不符合的地方,这就是研究误差,它是研究真实性的反面。研究真实性的反面就是研究误差。15ppt课件

研究误差可以分为随机误差和系统误差两部分

随机误差没有固定方向和固定大小,一般呈正态分布,来自于随机抽样变异和测量随机变异等

系统误差是指有固定方向和固定大小的误差,来自于对象选取、测量和统计分析等的方法学缺陷16ppt课件17ppt课件随机误差又叫机会或机遇(chance)

任何观察所固有,只能设法缩小,不能避免影响观察结果的精确性和可靠性系统误差又叫偏倚(bias)

观察结果系统地、向一个方向(或大、或小)发生偏差而不能反映真实情况。在科研设计、实施和分析阶段避免或校正影响研究结果的准确度和真实度18ppt课件机遇与偏倚机遇与偏倚反映了一项研究或测量结果的两方面:精确性(随机误差)(precise)准确度(系统误差)(accurate)19ppt课件AccurateandpreciseTrueValue20ppt课件PreciseonlyTrueValue21ppt课件AccurateonlyTrueValue22ppt课件NeitherAccuratenorPreciseTrueValue23ppt课件偏倚(bias)和机遇(chance)24ppt课件准确度(真实度)与可靠性(精确性)之间的关系

频不可靠数不准确(不真实)

测量值真实值测量偏倚值ACBDA

既真实又可靠(精确)B真实但不可靠(精确)

C可靠(精确)但不真实D不真实不可靠(精确)25ppt课件机遇与偏倚的关系统计方法扩大样本设计、测量、分析

控制方法不能能

能否避免无有

方向性不同点重复性影响真实性任何研究阶段任何类型研究共性机遇偏倚26ppt课件(二)内部真实性内部真实性(internalvalidity)是指研究结果与实际研究对象真实情况的符合程度。

它回答一个研究本身是否真实或有效。如果一个研究针对实际研究对象提供了真实的描述频率或效应估计值,即随机误差和系统误差较小,则该研究是真实或有效的。如果一个研究本身是不真实或无效的,则很难再应用到其他人群。27ppt课件(三)外部真实性外部真实性(externalvalidity)是指研究结果与推论对象真实情况的符合程度,外部真实性又称为普遍性(generalizability)。

它回答一个研究能否推广应用到研究对象以外的人群。如果研究对象对于推论对象的代表性不好,尽管它的内部真实性可能好,但它的外部真实性则肯定差。28ppt课件内部真实性和外部真实性样本样本偏倚机遇研究结论内部真实性外部真实性:外推到样本所属总体或其他人群

病人总体29ppt课件影响科研质量的因素选题起点研究设计研究实施结果分析及解释结论终点30ppt课件第三节研究的偏倚选择偏倚信息偏倚混杂偏倚31ppt课件

偏倚的定义在进行流行病学调查研究或推论过程中由于某种或某些因素的影响,使所研究的结果或推论与真实的情况之间产生系统差异。不仅仅见于流行病学研究中,众多的临床研究中也存在同样的问题。32ppt课件偏倚在整个研究过程中均可产生,从实验的设计、资料的收集、结果分析直至结果的推论,其中任何一个环节均可产生。偏倚在研究中一旦产生,便很难纠正和去除,因此在开始一项医学科学研究时,就应对研究过程中可能产生的偏倚有足够的认识,以便在研究中防患未然。33ppt课件偏倚产生的阶段1设计阶段studydesign---选择偏倚

Selectionbias2实施阶段datacollection--测量偏倚

Measurementbias3分析阶段analysis---混杂偏倚

Confoundingbias34ppt课件常见偏倚:选择偏倚信息偏倚混杂偏倚35ppt课件

一.选择偏倚(一)选择偏倚(selectionbias)的定义

指被选定的研究对象与未被抽取的人群在某些特征上存在系统差异而出现的误差。主要发生在设计阶段,也产生于资料收集阶段的失访、无应答等。以在病例对照研究与现况研究中为常见。

以医院为基础的病例对照研究,病例的代表性?人群中志愿者与非志愿者的不同?36ppt课件(二)选择性偏倚的种类1.入院率偏倚(admissionratebias)亦称伯克森偏倚(Berkson’sbias)是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同而导致的偏差。37ppt课件入院率偏倚(admissionratebias)

亦称伯克森偏倚(Berkson’sbias),是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同而导致的偏差。A、B病患者及其与因素X的关系疾病暴露于X非暴露X合计X暴露率A:对照200800100020%B:病例200800100020%合计4001600200020%OR=1.00P>0.0538ppt课件

因A入院(50%)100人

A病(X+)140人(200人)因X入院(40%)40人A病(1000人)

A病(X-)因A入院(50%)400人(800人)因B入院(20%)40人

B病(X+)104人(200人)因X入院(40%)64人B病(1000人)

B病(X-)因B入院(20%)160人(800人)例:39ppt课件因不同住院率而住院的A、B病患者及其与因素X的关系疾病暴露于X非暴露X合计X暴露率A:对9%B:病例10416026439.4%合计24456080430.4%OR=1.86x2=15.215P<0.00140ppt课件

呼吸道疾病与骨及运动器官疾病的关系

呼吸骨及运动器官疾病骨及运动器官疾病道(一般人群)(曾住院6个月以上者)

疾病病例对照合计病例对照合计

有17(a)207(b)2245(a)15(b)20

无184(c)2376(d)256018(c)219(d)237

合计2012583278433224257

OR=17×2376/207×184=1.06OR=5×219/15×18=4.0641ppt课件

过敏及代谢性疾病与疲乏的关系过敏及代谢性疲乏(一般人群)疲乏(曾住院6个月以上者)

疾病病例对照合计病例对照合计

有13(a)136(b)1491(a)21(b)22

无127(c)2508(d)263527(c)208(d)235

合计1402644278428229257

OR=13×2508/136×127=1.89OR=1×208/21×27=0.3742ppt课件入院率偏倚产生的条件是:⑴研究某因素与某病有关时,该病病例取自医院,对照选自同时住院的其他病例(另一种病);⑵病例与对照由于种种原因进入该医院的机会不同,出现了不同的入院率;⑶暴露因素本身也有一定的独立的、与疾病无关的入院率。43ppt课件避免入院率偏倚最好的办法是从一般人群取样,或增加人群对照。44ppt课件

2.现患-新发病例偏倚(prevalence-incidencebias)也称奈曼偏倚(Neymanbias)研究病例一般是现患病人,不包括死亡病例和那些病程短、轻型、不典型的病例。某些病人在患病后,有可能会改变其原来的某些因素的暴露状况。这样用于研究的病例类型(现患病例)与队列研究或实验研究的病例不同,它们多用新病例,由此而产生的偏倚即为现患病例-新病例偏倚。45ppt课件美国弗明汉地区居民血胆固醇水平与冠心病关系研究胆固醇百分位队列研究(第6次)病例对照研究(第6次)冠心病非冠心病合计冠心病非冠心病合计>7585462547383472≤7511615111627113117230合计20119732174151151302RR=2.40OR=1.1646ppt课件3.无应答偏倚(non-respondentbias)是指研究对象中那些没有按照研究设计对被调查的内容予以应答者。某个特定样本中的无应答者的患病状况,以及对某一或某些研究因素的暴露情况与应答者可能不同,由此而产生的偏倚称为无应答偏倚。无应答偏倚在观察性研究或实验性研究中均可发生。47ppt课件4.失访偏倚(losstofollowupbias)由于失访而引起的偏倚称为失访偏倚。为一种特殊的无应答形式,主要发生在前瞻性研究及临床试验中。失访:是指在追踪观察的过程中,某些对象由于种种原因而脱离了观察(迁走、与本病无关的死亡及本人退出实验等),观察者无法了解到他们的结局。有两种形式:失访:指观察期限短于规定的观察危险期者。退出:指在随访过程中因种种原因拒绝继续留在观察组中。48ppt课件5.志愿者偏倚(volunteerbias)

志愿参加观察者同非志愿者在关心健康、注意饮食及营养食疗、禁烟、禁酒、坚持体育锻炼等方面有系统差异,因支援志愿者被入选为观察对象,而非志愿者落选,由此产生的选择性偏倚,称为志愿者偏倚。49ppt课件(三)选择偏倚的控制◆首先研究者对在整个研究中可能会出现的各种选择偏倚应有充分的了解、掌握。◆严格掌握研究对象纳入与排除的标准。◆在研究中采取相应措施,尽量取得研究对象的合作,以获得尽可能高的应答率,减少无应答率及队列研究中的失访和实验性研究中的中途退出等。◆尽量采用多种对照如在病例对照研究中,理想的研究对象应是人群中的全体病例和非该病病例及正常人,或其有代表性的样本,但往往很难做到。50ppt课件二.信息偏倚(一)概述

信息偏倚(informationbias):又称观察偏倚(observationalbias),是指在研究的实施阶段从研究对象获取研究所需的信息时所产生的系统误差。

信息偏倚可来自于研究对象、研究者本身,也可来自用于测量的仪器、设备、方法等。信息偏倚的表现是使研究对象的某种特征被错误分类(misclassification)。51ppt课件

(二)信息偏倚的种类

1.回忆偏倚(recallbias)

指研究对象在回忆以往发生的事情或经历时,由于在准确性和完整性上的差异所致的系统误差。回忆偏倚在病例对照研究中最常见。

产生的原因:

◆调查的事件或因素发生的频率甚低,未给研究对象留下深刻印象而被遗忘;

◆调查事件是很久以前发生的事情,研究对象记忆不清;

◆研究对象对调查的内容或事件关心程度不同,因而回忆的认真程度有异。52ppt课件2.报告偏倚(reportingbias)

指由研究对象有意的夸大或缩小某些信息而导致的偏倚,因此亦被称作说谎偏倚。3.诊断怀疑偏倚(diagnosticsuspicionbias)

由于研究者事先了解研究对象对研究因素的暴露情况,怀疑其已患某病,或主观上倾向于应该出现某种阳性结果,于是在作诊断或分析时,倾向于自己的判断。由此而造成的偏倚称为诊断怀疑偏倚。

诊断怀疑偏倚多见于临床试验和队列研究,在病例对照研究中也可产生,亦可发生于研究对象。53ppt课件4.暴露怀疑偏倚(exposuresuspicionbias)

研究者若事先了解研究对象的患病情况或某种结局,可能会对其以与对照组不可比的方法探寻认为与某病或某结局有关的因素,如多次认真地调查和询问病例组某因素的暴露史,而漫不经心地调查和询问对照组,从而导致错误结论,此即暴露怀疑偏倚。54ppt课件5.测量偏倚(detectionbias)测量偏倚指对研究所需指标或数据进行测定或测量时产生的偏差。所用仪器、设备校正不准确,试剂不符合要求,使用方法的标准或程序不统一,分析、测试条件不一致,以及操作人员的技术问题等等,均可导致测量结果的不正确,使测量结果偏离真值。所用调查表设计的科学性,记录是否完整,调查人员对工作的认真程度以及访问方式、态度等等,亦均可导致不准确的信息,产生测量偏倚。55ppt课件信息偏倚的种类不应答偏倚回忆偏倚报告偏倚(说谎偏倚)社会期望偏倚诊断怀疑偏倚暴露怀疑偏倚测量偏倚来自于被调查者来自于调查者来自于测量仪器56ppt课件信息偏倚的测量

一项研究资料是否存在信息偏倚以及偏倚的方向与大小,可通过比较、分析在一定研究对象中调查所得到的信息与实际信息(如客观检查、记录等)予以测量。57ppt课件58ppt课件病例组:灵敏度=54/60=0.90

特异度=28/40=0.70对照组:灵敏度=27/30=0.90

特异度=40/70=0.70

这种由于信息偏倚所导致的错误分类等同地发生在两组,称为无差异错误分类(非特异性错分)(nondifferentialmisclassification)。发生无差异错误分类时,资料的效应估计值(OR或RR)低于实际值,使效应估计值趋于无效值,低估研究因素与疾病之间的联系。59ppt课件信息偏倚=(ORx-OR)/OR若得值=0,则不存在信息偏倚;若得值>0,则存在信息偏倚,此时ORx>OR;若得值<0,则存在信息偏倚,此时ORx<OR。OR=(60×70)/(30×40)=3.5ORx=(66×52)/(34×48)=2.1信息偏倚=(ORx-OR)/OR=(2.1-3.5)/3.5=-0.4060ppt课件如计算所得两组的灵敏度与特异度不同,称为有差异错误分类(特异性错分)(differentialmisclassification)。当发生有差异错误分类时,资料的效应估计值高于或低于实际值。即可能高估也可能低估因素与疾病之间的联系。61ppt课件62ppt课件信息偏倚=(ORx-OR)/OR若得值=0,则不存在信息偏倚;若得值>0,则存在信息偏倚,此时ORx>OR;若得值<0,则存在信息偏倚,此时ORx<OR。OR=(600×700)/(300×400)=3.5ORx=(660×750)/(340×250)=5.8信息偏倚=(ORx-OR)/OR=(5.8-3.5)/3.5=0.6663ppt课件

(四)信息偏倚的控制1.研究者对拟进行的研究要制定明细的资料收集方法和严格的质量控制方法2.尽可能采用‘盲法’收集资料3.尽且采用客观指标的信息4.回忆偏倚:可通过一定的调查技巧加以避免,如可选择一个与暴露史有联系的鲜明的记忆目标帮助其联想回忆等等。此外对在条件允许时询问到的暴露史,尽可能的与客观记录核实。敏感问题:可通过调查知情人或相应的调查技术获取正确的信息。64ppt课件三.混杂偏倚(一)混杂偏倚的定义

混杂偏倚或称混杂(confounding),是指在流行病学研究中,由于一个或多个潜在的混杂因素(confoundingfactor)的影响,掩盖或夸大了研究因素与疾病(或事件)之间的联系,从而使两者之间的真正联系被错误地估计。65ppt课件(二)混杂因素的定义与特点

1.定义

亦称混杂因子或外来因素(extraneousfactor),是指与研究因素和研究疾病均有关,若在比较的人群组中分布不均,可以歪曲(掩盖或夸大)因素与疾病之间真正联系的因素。2.特点

◆必须是所研究疾病的独立危险因子;

◆必须与研究因素(暴露因素)有关联(有统计学联系);

◆一定不是研究因素与研究疾病因果链上的中间变量。66ppt课件混杂现象高血压冠心病

高脂血症

非混杂现象风湿热风湿性瓣膜病溶血性链球菌、咽炎67ppt课件吸烟、火柴与肺癌烟草公司的研究者坚持认为火柴暴露可以引起肺癌他们开展了一项大型的病例对照研究来检验这个假说68ppt课件研究者通过人群登记系统找到了1000名肺癌病例,其中820人曾携带过火柴从人群中随机抽取了1000名对照,经X线确认未患肺癌,其中340人曾携带过火柴根据这批数据,定量估计火柴与肺癌之间的关联吸烟、火柴与肺癌69ppt课件火柴与肺癌70ppt课件想分别了解一下吸烟者与不吸烟者中火柴与肺癌的关系结果发现在1000名病例中,900名为吸烟者,其中810名曾携带火柴在1000名对照中,300名为吸烟者,其中270名曾携带火柴分层绘制2×2表,计算火柴与肺癌的关联效应值吸烟、火柴与肺癌71ppt课件OR粗

=8.8(7.2,10.9)OR吸烟者=1.0(0.6,1.5)OR不吸烟者=1.0(0.5,2.0)吸烟、火柴与肺癌72ppt课件这个例子说明:即使本来没有任何效应,混杂也可以引起明显的效应在火柴与肺癌的关系中,吸烟就是一个混杂因素(confoundingfactor,confounder)吸烟混淆了火柴与肺癌之间的真实关系问题:火柴对于吸烟与肺癌的关系是不是一个混杂因素混杂:吸烟、火柴与肺癌73ppt课件OR粗=21.0(16.4,26.9)OR携带火柴=21.0(10.7,41.3)OR不携带火柴

=21.0(13.1,33.6)吸烟、火柴与肺癌74ppt课件75ppt课件(三)混杂偏倚的测量1.测量的方法

可通过比较含有该因素时研究因素与疾病的效应估计值,(如RR,OR),与排除该因素后的效应估计值来实现。设含有某可疑混杂因素(f)时,研究因素与研究疾病的效应估计值为cRR或cOR,称作粗RR或粗OR;按该可疑混杂因素调整后的效应估计值,即排除掉该因素的可能混杂作用后的效应估计值为aRR(f)或aOR(f),称作调整RR或调整OR(可用Mantel-Haenszel分层分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论