医学科研中的偏倚和交互作用综述

上传人：m*** IP属地：天津上传时间：2021-10-12 格式：DOCX 页数：23 大小：43.86KB 积分：20 举报 版权申诉

已阅读5页，还剩18页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、医学科研中的偏倚与交互作用与控制第一节概念一、误差科研设计、实施及分析过程中产生的各种误差(error),可能导致研究结果不能真实地、精确地反映实际正确的结果。误差是指对事物某一特征的度量值偏离真实值的部分，即测定值与真实值之差。因此，必须有“金标准” (golden standard或相对可靠的标准来度量真实值才能度量误差。研究结果与真实情况的差异即为误差。误差有两类：(1)随机误差( random error )， (2) 系统误差( systematic error )或称偏倚。随机误差( randomerror )：广义的随机误差，泛指因机遇不同估计总体参数时所产生的误

2、差，机遇既可以指选择的机遇，也可以指时间的机遇。如果误差由机遇以外的原因所造成，则为非随机误差。狭义的随机误差指随机抽样所得均值对总体均值的误差。随机误差主要是由抽样误差引起，其中包括一些随机测量误差。抽样误差指随机抽样所得均值对总体均值的误差，它由总体中个体的变异引起，其大小决定于研究设计和评价指标的统计学特点。抽样误差无一定方向，可以相互抵消，并可通过改进抽样技术(如严格遵守随机化原则，分层抽样，增加样本含量，重复试验以及提高抽样对象的受检率，减少失访率等)加以控制，但不可能完全避免。因此在资料分析阶段，必须用统计学方法计算抽样误差的大小。二、偏倚偏倚是指在调查

3、研究设计或实施阶段，由于某种或某些因素的影响，使得研究或推论的结果与真实的情况存在系统误差，或指在研究或推论过程中所获得的结果系统地偏离其真实值，属于系统误差。偏倚造成的结果与真值间的差异，具有方向性，它可以发生在高于真值的方向，也可发生在低于真值的方向。偏倚是影响流行病学研究真实性的重要原因之一，由于有时难以得到判断真实性的金标准，因此即便在很严格的流行病学研究设计之下，也很难判断是否完全避免了偏倚。尽管如此，如果对偏倚的来源和产生原因有了深刻的认识，则有可能最大限度地减少偏倚的发生，以便取得有价值的研究结果。误差与偏倚都是指测量结果与真值间的偏离。但它们两者之间有着本质的

4、区别。随机误差是由于抽样而致的变异，它无方向性，这种误差是普遍存在的。它可以设法减少但不能完全防止(如随机化抽样，加大样本量) 。偏倚是指随机误差以外的误差，是指观察到的均值与真值之间的系统误差，这种误差不能用统计学方法处理，它是由某些较为恒定的不能准确定量的因素造成，重复抽样或加大样本含量并不能使这种误差减少或消失，它只能依靠研究者的周密设计和科学判断来加以解决。偏倚系非抽样误差，它是错误的，必须努力防止。三、偏倚的方向偏倚是一种系统误差，它或偏向于正方向，使原来的真值被夸大；或偏向于负方向，使原来的真值被缩小，因此偏倚是有方向的。定量并精确地估计偏倚的程度（即偏倚的大小）有困难

5、，而确定偏倚的方向相对比较容易。偏倚的方向指研究人员对事物所产生效应（effect ）的估计值是大于或小于效应真值所做出的一种定性判断，不涉及偏倚的大小。现假定某一欲观察或测量效应值的真实值为 9，而反映在样本中的观测值为攵。设定凡是夸大真实效应者为正偏倚，不论真实效应为危险效应还是保护效应，而缩小真实效应者为负偏倚。零效值（null value）是一个统计学中的概念，是指产生零效应的值。例如，对于RR或0R=1时即为无效值。因此，研究中的真实效应用RR （二）表示，当RR O ） =1.0,即为零效应；RR ） 1为危险效应，RR ） 1为保护（预防）效应。RR （询为RR偏倚了的

6、RR。因此，在具有危险效应RR ） 1:?二1，夸大危险效应，或远离零效应值（或无效值），称为正偏倚；*?1，缩小危险效应，趋向零效应值，称为负偏倚；当效应值为保护（预防）效应时，RR ） 1;二很1，偏倚缩小了保护效应，勺趋近零效应值，称为负偏倚；?二1，偏倚夸大了保护效应，？远离零效应值，称为正偏倚。举例说明： RR （二）1，RR=2.0,是危险效应；当R?=4.0时，它远离零效应值，夸大了原危险效应，R?被判为正偏倚；R?=1.5时，它趋近零效应值，缩小了原危险效应，R?被判为负偏倚。 RR U ） 1，RR=0.6,是一种保护效应；当R?=0.3时，它远离零效应值，夸大了保护效应，

7、RR被判为正偏倚；当R?=0.7,它趋近于零效应值，缩小了保护效应，RR被判为负偏倚。也有一种称颠倒偏倚（switchover bias），指无论1或二1,若r和壬分别在1.0的两侧，则为颠倒偏倚。即所产生的偏倚跨过零效应值1.0,由保护效应偏离为危险效应或由危险效应偏离为保护效应。第二节偏倚的类型一、偏倚的种类目前将流行病学调查研究过程中出现的偏倚分为三类：1. 选择偏倚(selection bias)指研究者在挑选研究人群时由于选择条件受限制或设计失误所致的系统误差。主要发生在研究设计阶段；2. 信息偏倚(in formation bias)指在收集和整理有关暴露或疾病资料时所出现

8、的系统误差，主要发生在观察、收集资料及测量等实施阶段；3. 混杂偏倚(confounding bias)主要由调查中所涉及的混杂因素与疾病和暴露因素三者之间的内在联系所决定，研究者在设计阶段若不注意随机化原则，各比较组间除比较因素外其他非比较因素不均衡，同时在分析阶段又不设法加以控制，即可发生混杂偏倚。(一)选择偏倚在设计阶段选择观察对象时，被选入的对象同未选入的对象间在与研究有关的特征方面有系统的差别，同时在各比较组间除比较因素外，其他一些有关因素分布不均衡，导致研究结果系统地偏离真实情况，即为选择偏倚。在各类流行病学研究中选择偏倚均可发生，以在病例对照研究与现况研究中常见。选择

9、偏倚既可产生于设计阶段的选择研究对象，又可产生于资料收集阶段的失访或无应答等。了解选择偏倚的目的是在设计阶段充分考虑其存在的可能性并尽量予以避免，在分析和作结论时要慎重从事。选择偏倚的种类很多，常见的有以下几种。1. 入院率偏倚(admission rate bias )又称伯克森偏倚(Berkson s bias )，是指利用医院就诊或住院病人作为研究对象时，由于入院率不同而导致的偏差。以研究恶性黑素瘤为例，产生的条件是：研究某危险因素是否同恶性黑素瘤有关时，恶性黑素瘤病例取自医院，对照取自同时住院的其他病例，骨折病人；恶性黑素瘤，骨折病人由于某医院在治疗某病(恶性黑素瘤或骨折)方

10、面的疗效不同、距离医院的远近不同、病情的轻重程度不同，出现了不同的入院率；暴露因素本身也有一定的独立的同疾病无关的入院率。于是就产生伯克森偏倚，现举例如下：假定某研究者计划研究恶性黑素瘤同高血脂的关系，恶性黑素瘤病例取自医院，同时，他从同院某病区随机抽取相应人数的骨折患者作对照。恶性黑素瘤病人在人群中约有5 000例，骨折患者也有5 000例，具有高血脂因素者在恶性黑素瘤病人和骨折病人中各占15%，并假定恶性黑素瘤、骨折、高血脂三者之间无任何关联(表1)，三者的入院率又相对独立。表1 人群恶性黑素瘤、骨折两病及高血脂的人群分布病种有高血脂者无高血脂者总人数恶性黑素瘤750425050

11、00骨折75042505000恶性黑素瘤伴有高血脂同骨折伴有高血脂间的 OR= (750X 4250) / (4250X750) =1.0 表1资料表明人群中恶性黑素瘤、骨折、高血脂三者之间并无关联，OR=1.0。现假定恶性黑素瘤和骨折入院率不同，分别为60%及25%，同时伴有高血脂者的入院率为40% (表2)。表2来自医院恶性黑素瘤和骨折两病及高血脂的病例分布病种有咼血脂者无高血脂者总人数恶性黑素瘤(病例)5702 5503 120骨折(对照)4131 0631 476根据不同的入院率计算住院病人数：恶性黑素瘤伴有高血脂人数：(750 X 60%) + (750750 X 60%)X 40

12、%=570 骨折伴有高血脂人数：(750X 25%) + (750 750X 25%)X 40%=413 恶性黑素瘤住院而无高血脂人数：(5 000- 750)X 60%=2 550 骨折住院而无高血脂人数：(5 000- 750)X 25%=1 063住院病例恶性黑素瘤同高血脂关联的 OR= (570X 1 063) / (2 550X 413) =0.575从表1和表2结果看，社区样本人群中恶性黑素瘤同高血脂本无任何关联，而以医院病例作为样本所得观察结果，高血脂是恶性黑素瘤的保护(预防)因素，而对骨折则是一危险因素。此即伯克森偏倚，因为它远离无效值 1.0,本来是无效，现在则是夸大了其

13、保护效应，或可以说是造成了一虚假的效应，不管它是危险效应还是保护效应，因此该伯克森偏倚是正偏倚。不同疾病在不同医院的就诊或住院率各异，其原因是多方面的，如群众对某种疾病危害的认识水平，患者所患疾病的严重程度，患者的经济状况，以及就诊方便与否，不同医院的技术专长等等，均可影响入院率。当利用医院住院病人作为病例和对照时，由于对照是医院的某一部分病人，而不是全体目标人群中的一个随机样本；又由于病例只是该医院或某些医院的特定病例，因为病人对医院及医院对病人双方都有选择性，所以作为病例组的病例也不是病人全体的一个随机样本，因此，就同一病因学调查课题，在社区和医院同时做调查，其结论是否相同

14、，取决于病例和对照到医院就诊或住院的就诊率(入院率)。在入院率为100%的情况下，两者的调查结果一致，但在实际工作中很难在医院观察到100%的病例，如果入院率不同，则表现为系统误差。因此利用医院的资料作病例对照研究分析病因时，要警惕可能出现这种偏倚，在解释研究结果时要慎重。2. 现患病例 - 新发病例偏倚( prevalence-incidence bias ) 这种偏倚又称奈曼偏倚 (Neymans bias )。在病例对照研究或现况研究中，用于研究的病例一般是研究期间的现患病例，而不包括死亡病例和那些病程短、轻型、不典型的病例。存活病例中又有新发病例和现患病例。存活病例同死亡病例在

15、所研究的因素方面往往有系统差异，同样新发病例同现患病例间也有这类系统差异；此外，某些病人在患病后，有可能会改变其原来的某些因素的暴露情况，这种用于研究的病例类型(现患病例)显然会与队列研究或实验研究不同(多用新发病例)，由此而产生的偏倚即为现患病例 -新发病例偏倚。病例对照研究所得结论常与队列研究结果不一致，其原因除了各自的一般优缺点外，主要是病例对照研究收集的大部分是现患病例，而队列研究可观察新发病例。这两种不同的病例所提供的有关暴露等情况会有很大差别。比如，现患病例，尤其是慢性病的现患病例不能如实、详尽地回忆起较早时期的暴露情况，或因时间过久，某些同暴露危险因素有关的生活习惯

16、等已有很大的改变，更重要的是已分辨不清哪个暴露发生在症状出现之前，哪个在后。而对队列研究来说，由于观察、调查的是新发病例，故很少发生上述问题。3. 健康工人效应偏倚 (healthy worker effect bias) 在生物学群体中，个体差异普遍存在，暴露于同一种危险因素后不同个体的易感性可能不同，高易感性的个体又有主动避免继续暴露的倾向，而低易感性者可能并不在意暴露。例如在进行职业性肿瘤的前瞻性研究时，选择接触职业性毒物的工人作为观察对象，很可能这些工人都是些留下来不易患肿瘤的人员，而对该毒物敏感的那些工人可能一开始就不选择该职业，或者虽然选择了这一职业但因不适应很快调离

17、去从事其他职业或早已转出而失访了，这种偏倚称健康工人效应偏倚。在流行病学观察研究中完全避免本类偏倚是困难的，特别当评论某些在短期接触后即使人们因能否耐受做出职业选择的危险因素时，应考虑到易感性不同所产生的偏倚。在这种情况下，如选择动物做实验研究或者选择无论被观察者易感性如何，都难以避免遭受暴露的某些偶然事件进行研究时(如广岛原子弹爆炸事件) ，则有利于获得较客观的结论。4. 无应答偏倚( nonrespondent bias ) 是因为研究样本中的无答复者，即调查对象中那些没有按照研究设计对被调查的内容予以应答或不依研究设计接受治疗者，由于其身体素质、暴露状况、患病情况、嗜好等可能与

18、应答者不同，由此产生的偏倚称为无应答偏倚。这里应强调的是不应答者泛指研究设计中应予调查但因各种原因拒绝回答问题的人或失访的人。如临床研究中对治疗效果、治疗反应等不作回答者称为无应答者。不应答能否带来偏倚，取决于不应答者在疾病暴露等方面的特征与应答者是否有区别。如果差别显著，则产生无应答偏倚。对敏感问题调查时最容易引起不应答偏倚。例如有研究者调查我国南方某县农村婴儿死因时，有 26.8%的家长拒绝提供其婴儿死亡原因，而现场调查旁证显示该县当年的新生儿男女性别之比高达 116.8%。这种现象的发生与当地存在重男轻女而溺死女婴的行为有关，由此得到的婴儿死亡原因构成比，显然发生了系统误差

19、。无应答偏倚在观察性研究或实验性研究中均可发生。在队列研究中，无应答偏倚同样存在。造成无应答的原因是多方面的，如对调查内容是否感兴趣、年龄、受教育程度、身体健康状况、对健康关心程度以及外出未遇等均可影响研究对象的应答率。失访是无应答的另外一种表现形式，指在随访性研究中，研究对象未能按照计划被随访。失访在队列研究中很容易发生，是此类研究选择性偏倚的主要来源之一。应答率一般至少应达到 90%，且各比较组间无多大差别。如某一组的应答率特别低应作专项调查，查明原因。5. 检出征候偏倚( detection signal bias ) 所谓检出征候，指在疾病和暴露之外存在一个征候因素，即一种

20、临床症状或体征。这种症状或体征不是疾病的危险因素，但人们因具有这种征候去就诊，从而提高了早期病例的检出率，致使过高地估计了暴露程度，因而发生了系统误差，最终可能得出该征候因素与该疾病有联系的错误结论。在对一些慢性疾病如恶性皮肤肿瘤、动脉硬化、结石等进行病因研究时，这种偏倚的意义特别重要。例如，1975 年Ziel 和 Finkle 用病例对照研究设计，从美国加州洛杉矶妇女中研究口服雌激素同子宫内膜癌之间的关系，结果认为两者之间存在高度关联，结论是口服雌激素是妇女患子宫内膜癌的危险因素。 1978 年， Horwitz 和 Feinstein 指出，以上关于口服雌激素与子宫内膜癌相关

21、联的结论是一种检出征候偏倚，两者之间的高度关联是虚假的。因为进一步研究发现使用雌激素可以刺激子宫内膜生长，从而使子宫容易出血。因而服用者较早、较频繁地去求医，从而有可能使医生能较多地早期发现子宫内膜癌病人。相反，那些不服雌激素的无症状子宫内膜癌病人，由于没有或少有子宫出血的症状，因此不会去医院，因而也就不易于被诊断出来，导致子宫内膜癌病例中服雌激素的比重人为地增加了，其结果得出子宫内膜癌与使用雌激素有关的虚假关联。在同一医院不同科室进行的研究发现，服用雌激素的子宫内膜癌病人中， 79% 为早期病人；而非服用雌激素的子宫内膜癌病人中，早期病人仅占55%。以上实例说明发生选择偏倚的重要

22、原因之一是选入的研究对象在所研究的特征方面同未选入的对象有差异。但有同等重要意义的是如何选择好对照组。它同研究者的临床知识，经验及关于研究变量的特性，对象选入的方法等都有关。因此，在设计中对观察对象进入样本的条件应作严格限制，比如病例组中的病例应严格限制在只选入稍晚期的子宫内膜癌病人，对照组的特征如去医院求治的机会、方便条件等非研究因素同病例组应相同。6. 时间效应偏倚( time effect bias ) 许多慢性病(如恶性肿瘤、冠心病等)自接触有效暴露(内、外环境的危险因素)之日起至出现临床症状止，其间经过一段漫长的潜隐过程，在此期间他们实际上是有暴露史但未出现症状，用现有

23、检测手段未能发现有症状的病人；但由于无明显的症状，因此常被错误地归入健康对照组内。例如，早在二战之后西方妇女吸烟的人数便迅速增加，但直到 20世纪 70年代以后才表现出妇女肺癌发生率的明显上升，原因在于开始暴露至发病的时间很长。类似的情况在遗传性疾病中也有，比如，未到外显年龄的观察对象被分配到健康对照组，常发生结果估计过低的偏倚。因而进行遗传性疾病研究时应特别注意外显年龄，不到外显年龄的对象常排除在观察之外，不管是对照组还是病例组。因此，在进行病例对照研究时，那些暴露后即将发生病变的人，已发生早期病变而不能检出的人，或在调查中已有病变但因缺乏早期检测手段而被错误地认为是非病例的

24、人，都可能被选入对照组，由此可能导致研究结果的系统误差。在调查中尽量使用敏感的疾病早期检查技术，或开展观察期足够长的纵向研究，则可以尽可能地控制时间效应偏倚。7. 排除偏倚( exclusive bias ) 研究者在设计时除规定研究对象诊断标准、纳入标准外，还应规定哪些个体不能选作研究对象，即规定排除标准，这些标准在实施期间不得更改。因此，当在研究对象确定过程中，没有依照事先设计要求对等的原则或标准，从观察组或对照组中排除某些研究对象，这样导致因素与疾病之间的联系被错误估计，称为排除偏倚。例如在一项关于阿斯匹林与心肌梗死关系的病例对照研究中，病例组与对照组均不应包括患慢性关节炎

25、者，亦不应包括慢性胃溃疡病人，因前者倾向服用此药，后者则不倾向服用此药。若患这两种疾病者在两组分布不均匀，可导致对阿斯匹林与心机梗死关系的错误估计。8. 志愿者偏倚( volunteer bias ) 这种偏倚在实验性研究中较易出现。一般来说，志愿参加观察研究者同非志愿者在关心健康、注意饮食卫生及营养食疗、禁烟禁酒、坚持锻炼等方面有差异，因志愿者常被入选为观察对象，而非志愿者常被落选，故这样的观察或研究结果肯定有选择偏倚。例如，进行一项措施(如避免阳光晒伤)以预防恶性黑素瘤发生的观察研究，参加者都是志愿者，而将非志愿者作为对照，以此比较该项措施的效果，这显然难以得出正确结论。(二)

26、信息偏倚又称观察偏倚(observation biaS ,指在研究的实施阶段，在资料的观察、测量及收集方法上，诊断试验的灵敏度、特异度以及患者在提供各种有关信息的准确性方面都可能有所不足，而且这种不足或缺陷在各比较组间有系统的差别或不一致，于是导致在研究的实施阶段产生系统误差。信息偏倚在各种类型的流行病学研究中均可发生，既可来自于研究对象、研究者本身，又可来自于测量的仪器、设备、方法等。信息偏倚的表现是使研究对象的某种特征被错误分类(misclassification)，如某病的患者被错误地认为是非患者，暴露于某因素被错误地认为是非暴露者等等。常见的信息偏倚有以下几种。1. 暴露怀

27、疑偏倚( exposure suspicion bias ) 研究者在收集并确定病例组的暴露比例时所具有的认真、细致、深入程度同对照组相比有重大的系统差别。这种偏倚主要见于病例对照研究。研究者若事前了解研究对象的患病情况或某种结局，可能影响采用与对照组不可比的方法探寻认为与某病或某结局有关的因素，如多次认真地调查和询问病例某因素的暴露史，而漫不经心地调查和询问对照组，从而导致错误结论，此即暴露怀疑偏倚。对同一组研究对象以不同的调查方法进行调查，结果可出现很大差异。例如，采用病史记录作为分析资料进行病例对照研究时，因为询问病史的医师知道某些因素和某病发生有关，因此在询问病例病史时特

28、别仔细，常有阳性的记录，而被选为对照的病史，因为医师们知道该因素和对照病例无关，因此询问马虎，阴性结果多，从而产生偏倚。如 Nishiyama 等对儿童甲状腺癌过去放射性物质暴露史的调查发现，如以常规和查阅医疗记录方法调查有暴露史者分别为 28% 和 0%；而经过细致的调查和询问，同一对象组的放射性物质暴露史变为47% 和 50%。可见不可比的调查获得的照射率有明显差异。上例也说明暴露怀疑偏倚往往会夸大可疑致病因素与疾病之间的关联。2. 诊断怀疑偏倚( diagnostic suspicion bias ) 这类偏倚常发生在前瞻性研究中。研究者带有“先入之见”的主观倾向性，以一种主观偏

29、见或愿望来左右诊断，由于研究者事先了解研究对象研究因素的暴露情况，怀疑其已患病，或在主观上倾向于应该出现某种阳性结果，因此在作出诊断或分析时，倾向于自己的判断。于是对暴露者和未暴露者在询问暴露史、疾病史和作各种检查时，采取了不可比的做法，如对暴露者或实验组进行非常细致的检查，而对非暴露者或对照组则不然，这样各比较组所获得的资料就会出现系统误差，从而使研究结果出现偏差，即谓之诊断怀疑偏倚。诊断怀疑偏倚多见于临床试验和队列研究，在病例对照研究中也可产生，特别是在诊断亚临床病例、判断药物的毒副反应时，这种偏倚最容易发生。例如在一项研究口服避孕药与妇女下肢血栓性静脉炎关系的队列研究中，观

30、察者对口服避孕药妇女，会更加频繁和仔细地寻求静脉炎的证据，认真地检查身体，并对更多的怀疑者，作进一步检查，这必然会更多地发现病例，尤其是那些病情较轻，需较复杂准确的诊断检查才能确诊的病例。相反有可能较马虎地检查未服避孕药的妇女，造成结果的偏倚。此类偏倚亦可发生于研究对象。若研究对象知道自己暴露于研究因素的情况，或了解研究目的，主观因素可能会对研究结果产生很大影响，如对是否出现新症状的主观判断等。3. 测量偏倚( detection bias ) 测量偏倚指对研究所需指标或数据进行测定或测量时产生的系统误差。如所用调查表设计的科学性、记录是否完整、调查人员对工作的认真程度以及访问方

31、式、态度等等。均可导致不准确的信息，产生测量偏倚。此外如所用仪器、设备校正不准确，例如调查时需测血压值，但血压计未经校正，而得到血压的偏值；试剂不符合要求，使用方法的标准或程序不统一，分析测试条件不一致以及操作人员的技术问题等等，均可导致测量结果的不正确，使测量结果偏离真值。4. 报告偏倚( reporting bias ) 与回忆偏倚不同，报告偏倚是研究对象的有意做假所造成，即有意的夸大或缩小某些信息而导致的偏倚，因此亦被称作说谎偏倚。最常见的报告偏倚见于敏感问题的调查，例如调查性乱史和中小学生吸烟史，有相当一部分有意掩盖阳性行为，有些人有冶游史，可能隐瞒实情。另一种情况，被调查

32、者为了达到个人目的而有意说谎，例如征兵体检时，愿意入伍者会有意隐瞒病史，而不愿意入伍者有可能故意夸大病史甚至无中生有。在对某些职业人群进行健康调查时，一些研究对象可能会为继续从事该职业而故意缩小某些患病信息，而涉及劳保、福利等，对一些问题的调查如职业危害，研究对象可能会夸大某些暴露信息。因此，对有客观指征或记录在案的事件做调查，常可以避免一部分报告偏倚，或者隔一定时间重复调查，比较前后两次调查的重复性，也可以据 Kappa 值判断报告偏倚。5. 回忆偏倚( recalling bias ) 回忆偏倚是指研究对象在回忆以往发生的事件或经历时，由于记忆失真或不完整在准确性和完整性上的

33、差异所致的系统误差。回忆偏倚的大小取决于作对照的人群，例如病例组和对照组或暴露组和非暴露组产生回忆误差的相对比例和程度的不同，既可能产生正偏倚也可能产生负偏倚，偏倚的趋向可以趋近于零也可以远离零。回忆偏倚最容易发生于病例对照研究，在现况研究和回顾性的队列研究中凡涉及需要回忆的调查内容也都可能发生。回忆偏倚在病例对照研究中最常见，其产生与以下原因有关：对照组是来自社区的一般人群，与来自医院的病例组相比，对过去的暴露经历更易遗忘或不予重视，而病例组却会对过去暴露经历认真回忆并提供有关信息；调查事件是很久以前发生的事情，研究对象记忆不清；调查的事件或因素发生的频率甚低，未给研究对象留下

34、深刻印象而被遗忘。例如 Stolley 等研究发现，仅有 9%的自费购药病人错误记忆了使用过的最新药品名称，而享受福利或公费医疗者有 23%发生记忆错误； Wilcox 等在自发性流产回忆准确程度的研究中发现：由于流产发生的孕周不同对孕妇的重要性不一样，因而被遗忘的程度有显著区别，在受孕前 6 周内发生的流产者中能回忆起的仅有 54%；而在受孕后 13 周发生的流产者中能回忆起的为 93%。该偏倚也可见于疾病家庭聚集性的研究中，例如欲研究银屑病的家族史，发现银屑病的病人比对照组更可能提供银屑病的家族史。然而，再从病例家中未患银屑病的同胞兄弟姐妹中调查，则阳性家族史和对照组相比，这种

35、联系就不存在了。另外，询问技术对研究对象的回忆也有影响，例如向被研究对象提供药物商品目录或展示药物或食物图片，有助于被调查者的回忆。选择不易为人们所忘记的重要指标做调查，并重视问卷的提问方式和调查技术，将有助于减少调查中的回忆偏倚。6. 归类错误偏倚( misclassification bias ) 或称错分偏倚，错误分类偏倚。每项病症所用的客观诊断试验或测定仪器都有一定的灵敏度和特异度，而灵敏度和特异度都不可能是 100%，于是就会产生一定的假阳性和假阴性错误即误诊和漏诊。这就发生了错分，即本应是病人，错将他分入了对照组，而本应是健康者，错将其分入了病例组。错分偏倚在病

36、例对照研究和前瞻性研究中都可能发生。错分偏倚在对疾病状态和暴露状态判断时也都可能发生。混杂因素也可以导致归类错误偏倚。错分有均衡性与非均衡性之分，前者指的是病例组、对照组受到同等程度的错分，而后者指的是病例组、对照组错分的程度不均衡、不一致。如就灵敏度、特异度来讲，两比较组间不一样，比如病例组所用诊断方法的灵敏度为70%，特异度为 90%，而在对照组内，则是灵敏度为 80%，特异度为 60%。严格地讲，错分和产生错分偏倚是两个不同的概念。在一定条件下，错分后可以不产生错分偏倚。例如在队列研究中，如病例的确定在暴露组和非暴露组都以相同比例减少或增加，那么其 RR 不变，即虽然有错

37、分发生，但无错分偏倚发生。7. 诱导偏倚( inducement bias ) 调查者的询问技术不正确，或为获得阳性结论，诱使被调查者做某一倾向性的回答，是产生诱导偏倚的原因。诱导偏倚往往表现为对病例组做诱导而对对照组不做诱导或负诱导，由此只能产生虚假的结论。加强公共卫生医师的医德教育，选择合适的人员参加调查，做认真细致的调查技术培训并由负责人复查调查结果，将可以避免或减少诱导偏倚的发生。(三)混杂偏倚在评价被研究的因素和疾病之间的关联时，由于一个或多个既与研究疾病有制约关系，又与暴露因素密切相关的外来因素( extraneous factor, 或称第三因素)使得资料中研究因

38、素的效应与外来因素的效应混在一起，从而全部地或部分地掩盖或夸大了所研究的因素与疾病之间的真实联系。这些影响谓之混杂偏倚或称混杂(confoun di ng)。那些外来因素称为混杂因素(confounding factor)。混杂偏倚是一种系统误差，可发生在研究的设计阶段，常不易识别从而难以控制，但在资料分析阶段可以用统计学方法加以消除。混杂因素仅见于多病因疾病的病因学研究中，而不会发生于单病因疾病的研究之中，混杂偏倚也见于由多种因素所致同一结局的某些研究中，如疗效评价或人群干预研究的效果评价等。其原因是因为疾病D的发生，可以由所研究的暴露因素 E所致，也可由其它的因素，即混杂因素

39、F所致，因而在估计疾病D和暴露因素E之间的联系强度时，存在受其他因素歪曲其真实性的可能性。单病因疾病的病因研究中不存在其他因素的致病效应，因而也就不会产生混杂偏倚的问题1. 混杂因素的基本特点必须是所研究疾病的独立危险因素或效应修正因素；与所研究的暴露因素有关，但不是暴露因素作用的结果；混杂因素与所研究的疾病有因果联系或通过其他因素与疾病产生因果联系，但不应是疾病因果链中的中间变量；混杂因素在人群中的分布与所研究的暴露因素（研究因素）的分布相关。这是混杂因素成立的基本条件。具备这几个条件的因素，如果在比较的各人群组中分布不均，即可导致混杂产生。如在关于长期口服避孕药与妇女血栓栓

40、塞的病例对照研究中，年龄即具备这样的条件，如果病例组和对照组年龄分布不均衡，即可导致对长期口服避孕药与妇女血栓栓塞关系的错误估计。2. 混杂偏倚的判别在评估一项病因研究（多病因疾病）的RR值或OR值真实性时，首先要判断有无混杂偏倚？如存在，混杂因素是什么？判别混杂偏倚可根据其产生的机制，结合专业知识（对该病病因学说和假设的病因因子有所认识），并按下述定量判别混杂因素和混杂偏倚的方法进行分析。（ 1）根据专业知识提出研究中可能存在的混杂因素：在流行病学研究中，混杂因素可分为两类：其他未知的病因因子的相关因素或代表因素，常见的为与人口统计学有关的因素；除暴露因素以外的其他病因因素

41、或危险因素。人口统计学因素：年龄、性别、种族、职业、经济收入、文化水平等人口统计学指标是经常遇到的可疑混杂因素。以年龄为例，不同年龄人群对疾病的易患程度不同。随着年龄的增长，人体会发生一系列生理、生化、解剖、病理和免疫学的变化，人的社会、经济地位也可能发生变化，在心理和行为等方面变化可能更显著。在流行病学研究中，往往要首先考虑到年龄与发病的关系。例如，在研究妇女使用月经棉（tampon）与中毒性休克综合征（TSS）关系时，因为年轻妇女的月经量丰富（生理变化），他们比中年妇女更喜欢使用高吸收度的月经棉（行为选择），而高吸收度的月经棉比一般的月经棉更容易导致发生中毒性休克综合征，

42、因此，年龄与暴露于月经棉和发生中毒性休克综合征都存在统计学联系，具备了混杂因素成立的条件，如果病例组（中毒组）和对照组年龄分布不均衡，即可导致对月经棉暴露与中毒性休克综合征关联的错误估计。暴露因素（研究因素）以外的其他危险因素：研究中混杂因素广泛存在，表现形式多样，常常在隐匿中起到混杂作用。因此流行病学工作者往往要同基础医学家、临床医师及其他公共卫生专家密切合作，才能全面细致地考虑到这些因素的作用。例如研究饮不洁水与食源性腹泻，饮酒与银屑病，吸烟与肺癌之间的关系时，营养不良，吸烟，饮酒各自都可以起到混杂因素的作用。（2）采用Mantel-Haenszel的OR值或RR值进行判别：

43、测量某一可疑混杂因素的混杂作用，可以通过比较含有该因素时研究因素与疾病的效应估计值(如RR或OR),与排除该因素后效应估计值大小的变化来实现。设含有某可疑混杂因素(f)时，研究因素与研究疾病的效应估计值为cRR或cOR,称作粗RR或粗OR;按该可疑混杂因素调整后的效应估计值，即排除掉该因素的可能混杂作用后的效应估计值为 aRR(f)或aOR(f)，称作调整RR或调整OR, aRR(f)可用Mantel-HaenszeI分层分析方法计算。现以效应估计值RR为例(OR同)，测量方法如下：若cRR=aRR(f)，则f无混杂作用，cRR不存在f的混杂偏倚。若cRRm aRR (f)，则f有

44、混杂作用，cRR存在f的混杂偏倚。若cRRaRR (f)，为正混杂(positive confounding)，亦称阳性混杂，即由于混杂因素(f)的混杂作用，使cRR高估了研究因素与研究疾病之间的联系(指暴露因素为疾病的病因或危险因素时)。若cRRvaRR (f)，为负混杂(negative confounding)，亦称阴性混杂，即由于混杂因素(f)的混杂作用，使cRR低估了研究因素与研究疾病之间的联系(指暴露因素为疾病的病因或危险因素时)。混杂偏倚及其方向与程度也可如下测量：混杂偏倚=cRR-aRR (f) /aRR (f) 若值=0,为无混杂。当值工0,若为正值，为正混杂，高估

45、了关联强度;若为负值，为负混杂，低估了关联强度;值的大小为混杂的程度。(3)利用分层分析进行定量判别：所谓分层分析是将研究对象按是否暴露于提出的可疑混杂因素(f)分类(最简单可分为暴露组与非暴露两组)。按可疑混杂因素分层后的研究因素与研究疾病的效应估计值称为调整掉混杂作用的效应估计值，用aRR (f)和aRF2 (f)来描述。如果其他病因因素和危险因素在两比较组研究对象中的分布完全均衡，同时可疑混杂因素和研究因素之间在产生研究疾病时不存在交互作用，则aRR. (f)和aRRi (f)应完全相等。现以效应估计值RR为例(OR同)，测量方法如下：若cRR=aRP (f)或aRRi (f)

46、,则无混杂作用，cRR不存在混杂偏倚。若cRRm aRR (f)或aRRi (f),则有混杂作用，cRR存在混杂偏倚。上述测量也可转变为“混杂指数” RF (index of the degree of confounding)来判别：RFi=cRR/aRR (f),式中：RFi为混杂指数，i表示分层后的某一层。若RFi=1，则无混杂作用，cRR不存在混杂偏倚。若RFi工1,则有混杂作用，cRR存在混杂偏倚。二、偏倚的控制偏倚一旦发生就会导致研究结果与真实情况存在系统差异，甚至会得出完全错误的结论。因此，在进行研究设计时应深入了解、认识各类偏倚，以便在研究过程中尽量加以避免或控制，

47、从而保证研究结果的真实性。（一）设计阶段1. 强调严格的科研设计多数偏倚发生于科研的设计阶段，研究者应充分了解，掌握该项研究工作中各种可能的偏倚来源及其发生情况，以便在具体设计过程中尽量予以避免。在设计阶段，偏倚可来源于选择研究对象或对照的不妥，如抽样方法不正确，诊断标准、排除标准、纳入标准不统一，样本大小不适当，各比较组间缺乏可比性等。例如一项有关两种药物治疗银屑病病人的试验，研究因素为两种药物，非处理因素可能有年龄、性别等，不同年龄，性别间治疗效果可能不一样，设计时应针对这些非处理因素，设法使之在各比较组间分布均衡，从而消除其对治疗效应的影响。偏倚也可来源于决定调查方法和资料

48、收集方法时考虑不同，如调查表设计不好，实验室检测缺乏质控，判断结果缺乏客观指标等。例如在进行磷敷贴与神经性皮炎的关系研究时，发现社会经济地位可能是一潜在混杂因素，并可导致选择偏倚的产生，则设计中规定采取准确记录研究对象的社会经济地位，在分析过程中对该因素影响进行校正，而达到部分控制选择偏倚的目的。在病例对照研究中，理想的研究对象应是社区人群中的全体病例和非该病病例及正常人，或其有代表性的样本，但往往很难做到。虽然在医院选择研究对象易产生入院率偏倚，但对临床科研工作者来说由于方便、易行、应答率高等优点，在实际工作中常被采用。此时最好选用两个或两个以上的对照组，如不同病种对照，其中

49、之一最好取自社区一般人群。如此通过比较不同对照组的结果，可对是否存在选择偏倚作出判断。在队列研究中，条件许可时，最好也应设立多种对照，如对暴露队列既应用内对照又设立比较队列（外对照），或用全人群资料作比较，从而减少选择偏倚对结果的影响。偏倚一旦发生，则一般很难在资料分析阶段加以消除，唯一的方法就是要求研究者进行严格的科研设计来预防这些偏倚的发生。2. 限制（restriction ）即对各比较组研究对象的条件加以某种限制。从理论上讲，两组进行比较，除研究因素外，其他因素（非研究因素，非处理因素）应当均相同，这样两组的均衡性好，才能比较研究因素在两组中是否有差异，但临床情况千变万

50、化，事实上是做不到的。例如同一种疾病（如银屑病）发生在不同个体身上，病型、病情、病期及预后都可能不同。因此可在选择研究对象时，针对某一或某些可能的混杂因素，在设计时对研究对象的入选条件予以限制。例如研究吸烟与冠心病的关系时，考虑年龄与性别可能均为潜在的混杂因素，可规定研究对象仅限于某社区内 4050 岁的男性居民。在研究口服避孕药与心肌梗死的关系时，考虑到年龄是可能的混杂因素，即仅对 3544岁年龄组的妇女做调查。另外，例如患胃肠道疾病者，不宜选作评价口服药物疗效的对象，因为可能影响药物的吸收。参加疗效评价的患者也不宜同时患其他严重疾病，这是因为这些患者在研究过程中可能死亡或因病

51、情加重被迫退出，这些在设计时都应限制。值得注意的是对研究对象针对潜在的混杂因素实行限制后，可得到同质的研究对象(homogeneousobjective),从而防止某些混杂偏倚，有利于对研究因素与疾病之间的关系作出较为准确的估计。但是在这种情况下，研究工作就丧失了概括性，即从研究对象中排除某些人群后，所选择的病例不能代表患者总体，对照也不代表一般人群，因而所获得的结论常具有很大局限性，影响研究对象对总体的代表性，使研究结果外推至一般人群时的外推真实性(external validity)受限。另外有一点要交待：采用限制的方法控制混杂因素，一方面只能针对特别重要的混杂因素，先决条件

52、为限制后仍然能保证适当的样本数。另一方面，限制的结果使得研究者不可能对暴露和混杂两因素的交互作用加以分析和度量，只能确保对暴露与疾病之间关系的研究。限制的缺点还在于，在限制混杂因素的同时，对暴露和疾病发生的范围也做了限制，难于观察到暴露因素对研究疾病影响的全貌，因此，作结论时应该慎重。3. 匹配( matching ) 匹配是指在为指示研究对象选择对照时，为病例组的每一个研究对象匹配一个或几个具有同样特征的对照，然后进行比较；也即使其针对一个或多个潜在的混杂因素(即匹配因素)与指示研究对象相同或接近，从而消除混杂因素对研究结果的影响。匹配在非实验性和实验性研究中均可应用。许多研究

53、者常以年龄、性别、种族、职业、经济收入等人口统计学特征作为匹配条件，因为这些因素可能是最常见的混杂因素。根据具体疾病及研究因素，许多其他因素也可作为匹配条件，如疾病病型、病期、病情程度及先前的治疗等。匹配条件越多，寻找对照就越困难。但有一点必须强调，不能将研究因素作为匹配条件，否则就不能观察该研究因素在比较组间有何差异，这种情况称匹配过度 (over-matching)，应注意避免，因此，匹配因素不宜太多，一般认为，以只列入主要的混杂因素为宜。匹配可分为成组匹配和个体匹配。成组匹配(category match in,又称频数匹配(freque ncy matching),是指为一

54、组研究对象配上一个潜在混杂因素频率相似的对照组。成组匹配可看成分层抽样的变种，即先按某些特征将总体分层后，再从各亚层中随机抽取病例，然后按病例在各层的分布比例抽取对照样本。例如若抽得的病例样本中男、女各半， 75 岁以上者占 2/5，则对照组中也应如此。个体匹配(in dividual match ing)是为每一位研究对象根据需要控制的混杂因素配上一个或多个对照。其中1 : 1匹配又称配对(pair matching), 1 : 2, 1 : 3, 1 : R (或1 : M)匹配时，则称为匹配。一般不应超过1 : 4。配比的目的是使某些潜在的混杂因素,在各个比较组间有相同或类似的分

55、布,以达到消除混杂因素的目的。另外,匹配时配对变量的单位不应太粗,如年龄配对时应限制在上下 23岁左右,不应粗到上下 10岁的差别, 这样便失去限制的作用。匹配的变量应当一致到什么程度,取决于变量的性质、实际可能与必要，离散型变量(如性别)可以完全匹配。一般除年龄、性别之外，对于其他因素是否引入匹配须持慎重态度，以防止匹配过度及徒增难度和费用。4. 随机化( randomization ) 指按随机化原则使研究对象都有等同的概率 (同等的机会) 被分配到各处理组中，从而使潜在的混杂因素，可测量或不可测量及无法预知的非处理因素 (非研究因素)在各组间分布均衡。随机化方法常用于实验性研究，以

56、在临床试验中最常用。随机化方法进行分组是消除选择性偏倚最好的方法，它不仅平衡掉治疗组和对照组的各种可能影响疗效或预后的因素，而且也平衡了各种未知的可能影响疗效和预后的因素。随机化分组后可以发现两组的一些基本特征极为相似，表明各比较组间除了研究因素外，其他非研究因素在各组间分布均衡，因此可比性好。随机分配方法可分为简单随机分组( simple randomization)和分层随机分组(stratified randomization)。前者指按照随机分配原则，利用随机化方法直接将研究对象分配在各组中。这种方法适合于对混杂因素不太了解时应用。后者是根据拟控制的混杂因素(如按年龄、性别

57、、病情、病程等)先将研究对象分层，然后再将每一层的研究对象随机分配在各组之中。这种方法适合于对主要混杂因素充分了解时应用。如在一项有关不同药物治疗银屑病的疗效临床试验中，病型为混杂因素，可先将研究对象按不同病型分层，然后再将各层研究对象随机分配到实验组和对照组。(二) 实施阶段在对结果的观察、测量及收集过程中，偏倚既可以来自研究对象，又可来自研究者本人。1. 盲法(bli nding 或 mask ing) 可分为单盲(sin gle bli nding),双盲(double bli nding) 和三盲(triple blinding)。单盲指只有研究者了解研究对象的分组情况而研究

58、对象不知道自己是在试验组还是在对照组。其优点是研究者可以更好地观察了解研究对象，可避免来自研究对象方面的偏倚。缺点是避免不了研究者方面带来的主观偏倚，易造成对试验组和对照组的处理不均衡。双盲指研究者和研究对象都不了解试验分组情况，而是由研究设计者来安排和控制全部试验，由于双盲使调查者和研究对象对分组情况及有关内容均不知晓，因而可以避免诊断怀疑偏倚、暴露怀疑偏倚或报告偏倚等。如此在调查过程中虽然仍有可能发生信息偏倚，导致错误分类，但由于对比组间资料的准确度相似，即使发生错误分类，属于无差异错误分类的可能性较大，可据此对研究结果外推的可靠性作出相应的估计。三盲指不但研究者和研究对象不了解分组情况，而且负责资料收集和分析的人员也不了解分组情况，从而较好地避免了偏倚。其优缺点基本同双盲，但实施起来很困难。盲法是避免观察者和观察对象发生偏倚的最有效方法，也是消除信息偏倚的有效手段。在进行调查研究时，最好由同一个人对病例组和对照组进行询问调查，询问方式和时间均相同，最好对调查者保密，不让他们知道真正的科研假设。在考核疗效时要实行双盲，考核疗效者和受试者都不知道真实的治疗内容 ,而且在实验室进行各种检查的报告者也不知道谁是观察组，谁是对照组。但是盲法的应用亦有一定的限制，

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

医学科研中的偏倚和交互作用综述

文档简介

温馨提示

最新文档

评论

相关文档