偏倚及其控制_第1页
偏倚及其控制_第2页
偏倚及其控制_第3页
偏倚及其控制_第4页
偏倚及其控制_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

偏倚及其控制ControlofBias

研究的解说涉及到研究的真实性的问题。研究的真实性直接关系到是否获得正确的结论,而真实性需要通过变异性估计来确定。引言研究的真实性

概述

内部真实性

外部真实性

真实性(效度)

定义指研究收集的数据、分析结果和所得结论与客观实际的符合程度。

研究误差真实性的反面变异可以是真实的(如生物学个体变异),而反映研究误差的变异肯定是不真实的。

一、概述

系统误差称为偏倚来自于对象选取、测量和统计分析等的方法学缺陷,有固定方向和固定大小的误差

随机误差用统计学方法来估计,增大样本含量可减少,没有固定方向和固定大小,一般呈正态分布。研究误差的两种常见类型6ABDC随机误差和系统误差示意图

因素结局

(危险/保护/干预)(疾病/健康/疗效)

研究因素结局外部因素流行病学研究中随机误差随机误差是流行病学研究中的精确性(Precision)问题。由于随机误差不可避免,精确性具有相对性,随机误差可用统计学方法评价。随机误差的大小(研究的精确性)与样本大小有关,与抽样方法及观察值的变异(变量的变异度)有关。提高精确性的方法增加研究样本量

样本量可用统计学中有关样本大小的公式计算。样本量的大小与研究设计、研究总体、把握度等因素关。提高信息获取的效率

样本大小相同的两项研究,正确的设计者将获得更加精确的估计,更具有统计效率。偏倚的概念定义:指在研究或推论过程中所获得的结果系统的偏离真实值。偏倚的方向:OR:真值OR’:测量值正偏倚与负偏倚、趋于无效假设远离无效假设颠倒偏倚的方向正偏倚与负偏倚

OR’>OR:正偏倚

OR’<OR:负偏倚偏倚的方向趋于无效假设(towardthenull)OR’=1.3OR=5.0OR’=0.9OR=0.3远离无效假设(awayfromthenull)OR’=8.0OR=2.0OR’=0.5OR=0.8颠倒(switchoverbias)OR’=0.5OR=2.0OR’=2.0OR=0.8偏倚的大小偏倚的大小通常以相对数表示:

测量值-真实值Bias=---------------------×100%真实值偏倚的大小RR’=1.2RR=2.001.2-2Bias=------------×100%=-40%

2大小:40%方向:为负Bias,趋于无效假设。研究的偏倚

选择偏倚

信息偏倚

混杂偏倚

混杂偏倚的分层分析

1946年,Berkson做最著名的偏倚研究并给予证实,又称为Berkson偏倚。

1976年,Miettinen详细讨论了偏倚的定义,并给出分类框架,分三类选择偏倚信息偏倚混杂偏倚一、选择偏倚(selectionbias)

定义研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。1.入院率偏倚

admissionratebias,Berksonbias•

1946年由J.Berkson提出。是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同而导致的偏差。•

不同疾病在不同医院的就诊率或住院率各异,其原因是多方面的•

医院:技术专长、服务质量•

患者:疾病严重程度、经济状况、就诊是否方便两类调查对象估计药物与疾病关联强度的比较可疑药物临床疾病比值比(OR)以社区为基础以医院为基础

p水杨酸类过敏1.150.180.02水杨酸类疲乏2.090.720.02缓泻药运动骨骼系疾病1.535.070.06缓泻药关节炎类风湿病1.485.000.01安眠药循环系疾病6.383.720.32维生素类过敏1.760.000.01维生素类外伤0.611.920.11心脏病类循环系疾病30.6519.170.47心脏病类关节炎类风湿病3.4649.92<0.012.现患病例-新病例偏倚

(prevalenceincidencebias,Neymanbias)1955年Neyman提出,在进行回顾性调查时,研究者收集的病例通常只包括调查时的现患病人,无法对那些因患该病而死亡的病例进行调查,由此而得出的某种因素与某种疾病的联系会与队列研究的结果有很大差异。在病例对照研究或横断面研究时,除了很难调查那些死亡病例外,对那些病程短、已痊愈的病例,轻型、不典型病例、隐伏期的病例也很难进行调查。此外,某些病例在患病后,可能会改变原来的暴露情况。例如Friedman等人在美国弗明汉地区对心血管系统疾病的研究中发现男性居民在队列研究中,具有高胆固醇水平的人,患冠心病的RR值为2.4;而在病例对照研中,病例组与对照组却无明显差异(OR=1.16)。进一步分析发现,患冠心病的病人在就诊被诊断为该病后,会改变其原来的生活习惯或嗜好,如戒烟、多食低胆固醇食物、多进行体育锻炼等等,从而使血中胆固醇水平降低,或与正常人相比胆固醇水平增长速度较慢所致。3.检出症候偏倚

(detectionsignalbias,)指某因素与某疾病在病因学上虽无关联,但由于该因素的存在而引起该疾病症状或体征的出现,从而使患者及早就医,接受多种检查,使该人群有较高的检出率,以致得出该因素与该疾病相关联的错误结论。4.检出症候偏倚(例)子宫内膜癌与服用雌激素:服雌激素导致子宫容易出血频繁就医接受检查早发现在同一医院不同科室进行的进一步研究发现,在服用雌激素的子宫内膜癌病人中,79%为早期病人;而在非服用雌激素的子宫内膜癌病人中,早期病人仅占55%。5.易感性偏倚

(susceptibilitybias)•

研究对象是否暴露于某一可疑致病因素,既与各种客观因素有关,也与研究对象的主观因素有关。这些因素可能直接或间接的影响观察人群或对照人群对所研究疾病的易感性,导致某因素与某疾病间的虚假联系。健康工人效应(healthyworkereffect)子宫颈反映异常与OC的关系肾结石与喝茶习惯的关系

比较组间对疾病的易感性存在差异易感性偏倚的典型例子是在对职业性疾病研究中的健康工人效应(healthyworkereffect)。当在对某一有毒物质对作业工人的健康危害进行研究时,可能会发现暴露于该有毒物质者的死亡率或某些疾病的发病率反而会比一般人群低。原因可能是接触此类有毒物质者,由于工作性质的需要,其本来的健康水平就比一般人群高,或者对毒物的耐受性比一般人群要强,因而对某些疾病的易感性低所致。不认识这一点就可能会导致错误的结论。6.无应答偏倚

(non-respondentbias)指研究对象中那些没有按照研究设计对被调查的内容予以应答。某个特定样本中的无应答者的患病状况,以及对某一或某些研究因素的暴露情况与应答者可能不同,由此而产生的偏倚。选择偏倚的控制

研究者对在整个研究中可能会出现的各种选择偏倚应有充分的了解、掌握。采取相应的措施在相应环节阻断此类偏倚产生的可能性,防止或减少其发生。严格掌握研究对象纳入与排除的标准。在研究中采取相应措施,以获得尽可能高的应答率,并对无应答者进行评价。尽量采用多种对照。二、信息偏倚(informationbias)

定义

又称测量偏倚或观察偏倚,是来自于测量或资料收集方法的问题,使得获取的资料存在系统误差。由于流行病学的暴露或疾病多为分类测量,所以信息偏倚又可称为错误分类偏倚(misclassificationbias)。信息偏倚同样影响描述性研究和分析性研究的结果。信息偏倚的来源测量不可靠(暴露、疾病)诊断标准不明确(疾病)原始记录不完整常见信息偏倚诊断怀疑偏倚(diagnosticsuspicionbias)暴露怀疑偏倚(exposuresuspicionbias)回忆偏倚(RecallBias)报告偏倚(reportingbias)测量偏倚(detectionbias)等1.诊断怀疑偏倚定义:由于研究者事先了解研究对象对研究因素的暴露情况,怀疑其已患某病或在主观上倾向于应该出现某种阳性结果,于是在作诊断和分析时,倾向于自己的判断。例:对诊断亚临床病例,判断药物的毒副反应2.暴露怀疑偏倚定义:研究者若事先了解研究对象的患病情况或某种结局,可能会对其与对照组不可比的方法探询认为与某病或某结局有关的因素,如多次认真地调查和询问病例组某因素的暴露史,而漫不经心地调查和询问对照组,从而导致错误结论。Nishiyama等(1962)对儿童甲状腺癌过去放射性物质暴露史的调查,在36例和22例两组患儿中,以常规和查阅医疗记录方法调查:28%和0而经过深入的调查和询问,有暴露史者分别达47%和50%。3.回忆偏倚定义:是指研究对象在回忆以往发生的事情或经历时,由于在准确性和完整性上的差异所致的系统误差。产生原因:调查事件发生频率低,未给研究对象留下深刻印象而被遗忘调查事件是很久以前发生的事情,研究对象记忆不清研究对象对调查内容或事件关心程度不同,回忆认真程度不同4.报告偏倚定义:只由研究对象有意的夸大或缩小某些信息而导致的偏倚,因此亦被称为说谎偏倚。例:敏感性问题、吸烟史等

涉及劳保、福利等一些问题的调查如职业危害对职业人群进行进行健康调查5.测量偏倚定义:指对研究所需指标或数据进行测定或测量时产生的偏差。例:仪器、设备校正不准确,试剂不符合要求使用方法的标准或程序不统一操作人员的技术问题调查表设计的科学性,记录是否完整,调查人员对工作的认真程度、访问方式信息偏倚的控制严格的质量控制诊断、测量方法要统一盲法的应用尽量采用客观指标资料校正方法三、混杂偏倚(confoundingbias)

定义

是指暴露因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰。混杂的本来含义是“混合掺杂”(mixingtogether),这里是指暴露因素对疾病的独立效应与混杂因素的效应混在一起,造成对暴露因素效应的估计偏倚。

判定原则比较混杂因素调控前后的暴露因素效应估计值,如果存在有意义的差异,就产生了混杂偏倚。

调控的统计方法设计阶段:标准化率、分层和多变量分析设计阶段:配比、随机化分配或限制进入四、混杂偏倚的分层分析

M-H(Mantel-Haenszel)分层分析方法的步骤对可能的混杂因素进行分层判定层间RR或OR是否相等或相近得到控制混杂后的调整RR或OR

再将调整RR或OR与分层前的粗RR或粗OR(cRR或cOR)进行比较喝咖啡与心肌梗塞MI关系的研究2000年,儿科邀请一位美国医学及生物统计学教授来院讲学的例子。有人观察发现喝咖啡的人,很多人患MI,这种现象是表象还是内在因果关系的?

研究者调查60岁以上老年人MI及非MI病人各150例,得到如下数据。表1.1MINoMI%Coffee906060Nocoffee609040

相对危险度:OR=90*90/(60*60)=2.25Pearsonchi2(1)=12.0,Pr=0.001。

说明喝咖啡人MI发生的危险性是不喝的2.25倍。

两组MI发生率差异有显著意义。结论:喝咖啡与心肌梗塞MI有关!对否?

研究者怀虑结论,考虑到其中可能混杂其它因素,如吸烟对喝咖啡与心肌梗塞MI间关系的影响,进一步分层分析得到。表1.2

SmokerNosmokerMINoMI%MINoMI%Coffee804067102033Noffee201067408033

相对危险度OR=1,OR=1Pr=1.00,Pr=1.00

队列研究

(1)累计发病率资料

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论