误差、偏倚及其控制-2007_第1页
误差、偏倚及其控制-2007_第2页
误差、偏倚及其控制-2007_第3页
误差、偏倚及其控制-2007_第4页
误差、偏倚及其控制-2007_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

误差、偏倚及其控制

研究的真实性和可靠性真实性(validity)反映了研究的结果和总体的真实的情况的相符合的程度。可靠性,表示相对稳定的情况,重复多次试验之后,与均值的符合程度。举例:真实性和可靠性研究的外部真实性与内部真实性1.外部真实性:

指研究样本的结果和结论可以外推到研究的总体人群。遵循随机抽样原则和避免产生严重的选择偏倚是保证样本代表性的重要措施。2.内部真实性:

指研究样本的结果真实可靠。严格控制和减少测量偏倚和混杂偏倚对结果的影响,保证研究结果真实性的关键。4一、误差的概念及分类几个基本概念

误差error指研究所获得的实际测定值与真实值之间的差别

系统误差systemicerror

由于某种确定的原因,有固定的大小和方向,可消除随机误差randomerror(抽样误差)

由于偶然的原因,没有固定的大小和方向,无法消除二、偏倚的概念及分类1.偏倚bias概念:指系统误差,是指医学研究中从设计、实施到分析的各个环节,由于某些固定的原因,使研究结果与真实值之间出现倾向性的差异。JohnLast在流行病学词典中将偏倚定义:

在进行流行病学调查研究或推论过程中,由于某种或某些因素的影响,使所研究的结果或推论与真实的情况之间产生系统差别。

♦偏倚的性质:是一种人为造成的系统误差,与抽样误差完全不同。偏倚可以控制,抽样误差则不能。

♦偏倚的特点:偏倚在整个研究过程中均可产生,从研究的设计,资料收集、结果分析直至结果的推论,其中任何一个环节均可产生

♦偏倚与抽样误差的区别:

√偏倚是属于系统误差,人为因素造成,可以控制。

√抽样误差属于随机误差,由个体差异决定,抽样研究必然存在的客观事实。2.偏倚的分类

选择偏倚

信息偏倚

混杂偏倚

(一)选择偏倚选择偏倚指在对样本进行研究时,入选的研究对象与总体之间的某些特征具有较大的差别,导致样本不能代表总体,因而使样本的研究结果与总体真实值之间有差别。

入院率偏倚

现患病例——新病例偏倚检出征侯偏倚

无应答偏倚观察性和实验性研究都可能发生

易感性偏倚

志愿者偏倚

排除偏倚入院率偏倚也称Berkson偏倚,指以医院为基础的病例对照研究中,目标疾病的入院率因待研究的暴露因素的存在与否或暴露水平的不同而存在差异,由此而引起的误差。10Roberts(JChronDis,1978)研究了三个社区内几种疾病与一些可疑病因之间的关系。

◘研究对象:2784名成人;257名住院病人

◘研究内容:医学事件与影响因素关系

Roberts根据以人群为基础的研究所获得OR值,显著地不同于仅以住院病例所获的结果,认为Berkson偏倚是存在的。

Sackett(JChronDis,1979)根据这一调查研究的资料,做了另外两项分析,该结果进一步证实了Berkson偏倚的存在。见表1和表2。11OR=1.06OR=4.06呼吸道疾病以人群为基础的分析骨和运动器官疾病以住院病例为基础的分析骨和运动器官疾病

+-合计+-合计+1720722451520-1842376256018219237合计2012583278423234257表1以不同人群为基础的骨和运动器官疾病与呼吸道疾病关系的OR值比较12过敏或代谢病在一般人群中的研究在住院病人中的研究疲劳疲劳

+-合计+-合计+1313614912122-1272508263527208235合计1402644278428229257OR=1.89OR=0.37表2以不同人群为基础的疲劳与过敏和代谢病之间OR值的比较13现患病例-新病例偏倚又称奈曼(Neyman)偏倚,如果研究对象选自现患病例,可能会得到更多的信息,但其中很多信息可能只与存活有关,而未必与该病的发病有关,从而可高估某些暴露因素的病因作用。此外,某些疾病的幸存者可能已改变了原先的生活习惯,从而降低了某危险因素的水平,或当其被调查时夸大或缩小了病前生活习惯上的某些特征,从而导致对某因素与疾病关联的错误估计。14胆固醇水平队列研究*病例对照研究**病例非病例合计病例对照合计≥75th%85462547383472<75th%11615111627113117230OR2.401.16*胆固醇值系第一次测量值**胆固醇值系第六次研究时测量值表3血胆固醇与冠心病的关系15

人数平均胆固醇值(mg/ml)变动值

第一次检查值第六次检查值

患者*148243.6246.1+2.5非患者1620220.0241.5+21.5*患者为第六次检查时现存的患者表4胆固醇值在冠心病病人与非病人中的变化16检出症候偏倚(Detectionsignalbias):

17检出症候偏倚,也叫暴露偏倚。病人常常因为一些与疾病无关的症状而去就医,从而提高了早期病例的检出率,导致过高的估计了暴露程度而产生的系统误差。在研究雌激素和子宫内膜癌的关系中,HorwitzRI进行的病例对照研究中揭示了这种偏倚。选择偏倚的控制充分了解在整个研究中可能会出现选择偏倚的各个环节,从而在研究设计阶段加以预防。严格掌握研究对象纳入与排除标准

尽可能多地采用多组对照在实施阶段,通过各种措施尽量取得对象的支持与合作,降低无应答率和失访率18(二)信息偏倚

信息偏倚又称观察偏倚(observationbias)或测量偏倚(measurementbias),是指研究实施过程中,由于测量或资料收集方面存在缺陷,最终得到的信息与真实情况有差异。

回忆偏倚报告偏倚,即说谎偏倚测量偏倚

暴露怀疑偏倚诊断怀疑偏倚错误分类偏倚暴露错分:

指对病例和非病例做测量或调查时,由于测量仪器的不准确,调查员的主观倾向或过失,被调查者缺乏合作或记忆不准确等原因,造成暴露情况的判别或分类不符合事实。

-表5为比较医院记录和病人回忆两种方法确定X-线暴露史的实例。

-病人回忆的方法导致调查暴露率(26/75)低于真实暴露率(37/75)。(二)信息偏倚表5用回忆法收集孕妇X-线照射史所致偏倚医院记录病人回忆

X-线(+)X-线(-)或不详合计X-线(+)241337X-线(-)23638合计264975病例错分:指对病例和非病例的诊断因使用了不相同的诊断标准,或使用了不相同的实验室测量方法,而产生错误分类。-表6给出的是一模拟的情况。

(二)信息偏倚表6群组研究中病例错分所致偏倚错分情况暴露群组真实结局对照群组真实结局有病无病合计有病无病合计有病3263816824无病8546247276合计40601002080100

真实情况下的RR=(40/100)/(20/100)=2,错分情况下的RR=(38/100)/(24/100)=1.6(过低估计)。信息偏倚的控制明确和统一各个研究因素的定义,研究设计阶段加以预防“盲法”收集资料

掩盖研究假说(三)混杂偏倚

一、混杂偏倚的概念

在对某病的病因学研究中,当对所关心的某种暴露因素(E)与某种疾病(D)之间的关联进行定量估计时,由于其他因子(F)的影响,致使E和D之间关联的真实性被歪曲,关联强度被放大或缩小,这种歪曲关联真实性的作用被称作混杂作用(confoundingeffect),起到混杂作用的因子被称为混杂因子(confounder或confoundingfactor,F)。

♦混杂偏倚性质:

√一种人为造成的偏倚

√是在研究的设计阶段未对混杂因子加以控制或资料分析时未能进行正确校正所致√是完全可以避免和控制的一种系统误差(一)混杂因子成立的条件(1)必须是所研究疾病的危险因素或保护性因素(2)必须和暴露因素之间存在统计学关联(3)一定不是暴露因素与疾病因果链上的中间变量(二)混杂偏倚产生的机理例:氡气与肺癌的队列研究

♠以RR值描述暴露于氡气人群与不暴露于氡气人群在肺癌发生频率之间的关联强度。

肺癌患者(D+)未患肺癌者(D–)

暴露于氡气的人群(E)aba+b未暴露于氡气的人群(Ē)cdc+da/(a+b)RR=----------------------c/(c+d)♦RR值的真实性评价:

此RR值是否真实地反映了氡气与肺癌之间的关联强度,完全取决于下述条件:(1)氡气暴露人群(E)和未暴露人群(Ē)之间在产生肺癌的易感性方面是否可比

(2)导致肺癌的其它危险因素在两组人群之间的分布频率是否可比。

◘a例肺癌的归因可能性(来自暴露人群):(A)由氡气所致

(B)由吸烟所致(研究者已知道的致肺癌因素)(C)由其它未知因素所致◘

c例肺癌的归因可能性(来自非暴露人群):(B)由吸烟所致

(C)由其它未知因素所致

♦对RR值的解读:此相对危险度RR在本项研究中包含有三种效应:

(A)氡气的致癌效应

(B)吸烟的致癌效应(C)其它未知因素的致癌效应

♦RR值产生混杂偏倚的条件:(B)吸烟的致癌效应RRS≠1(C)其它未知因素的致癌效应RRU≠1

♦吸烟导致混杂偏倚产生的原因:

◘研究设计阶段:未保证吸烟者在两人群中的均衡性

◘分析阶段:未先将两人群按吸烟和未吸烟分层,然后再按每一层去确定氡气暴露和肺癌之间的关联

♦小结:该研究中混杂偏倚产生的机理是由于导致肺癌产生的另一因素吸烟在两组人群中分布不均衡所致

二、混杂偏倚和混杂因素的判别

(一)根据专业知识提出研究中可能存在的混杂因子•在流行病学研究中,混杂因子可分为两类:1.人口统计学因素:

年龄、性别、种族、职业、经济收入、文化水平等人口统计学指标,是经常遇到的混杂因子。

2.暴露因素以外的其它危险因子:研究中混杂因素广泛存在,表现形式多样,常常在隐匿中起到混杂作用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论