第九章 偏倚及其控制deng_第1页
第九章 偏倚及其控制deng_第2页
第九章 偏倚及其控制deng_第3页
第九章 偏倚及其控制deng_第4页
第九章 偏倚及其控制deng_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

偏倚及其控制Biasandit'scontrol第九章中学生近视:40%中学生近视?PP=40%?描述性研究Population

Sample分析性研究假设:完全母乳喂养3个月以上的婴儿1岁内感染性疾病的发病比人工喂养婴儿少。设计类型:CasecontrolstudyCohortstudy结果:OR<1?RR<1?第一节研究结果的变异性

概述个体水平的变异性群体水平的变异性样本水平的变异性变异性(variability)研究结果包括描述性和分析性数据(指标)的变动或波动。第一节研究结果的变异性一、概述生物学(真实)变异和测量变异

生物学变异真实的客观变异

测量变异测量过程的误差随机变异和系统变异

随机变异绝对值和方向交错变化,正态分布

系统变异绝对值和方向保持恒定变异的来源分为两个层次第一节研究结果的变异性某个体特征测得值的变化,是个体真值随时间的改变,或是由于测量误差引起的变化。二、个体水平的变异性第一节研究结果的变异性个体的累计变异

群体中的个体具有不同的遗传素质并受环境影响常大于个体变异

根据群体的变异范围确定“正常值”范围,用于判定个体测得值是否“正常”群体水平的变异性受测量误差影响三、群体水平的变异性第一节研究结果的变异性描述性结果的样本变异性第一节研究结果的变异性四、样本水平的变异性分析性结果的样本变异性膳食改良组膳食改良组降低胆固醇药物组降低胆固醇药物组研究A(研究对象200人,随机分配到两组)第一节研究结果的变异性第二节研究的真实性

概述内部真实性外部真实性真实性(效度,validity):指研究收集的数据、分析结果和所得结论与客观实际的符合程度。研究误差(error):真实性的反面。包括随机误差和系统误差。一、概述第二节研究的真实性真实值随机抽样误差BIAS系统误差第二节研究的真实性

系统误差(偏倚):

来自于对象选取、测量和统计分析等的方法学缺陷,有固定方向和固定大小的误差

随机误差:

用统计学方法来估计,增大样本含量可减少,没有固定方向和固定大小,一般呈正态分布。第二节研究的真实性二、内部真实性

内部真实性(internalvalidity)

定义研究结果与实际研究对象真实情况的符合程度,它回答一个研究本身是否真实或有效。改善措施

限制研究对象的类型和研究的环境条件。第二节研究的真实性

三、外部真实性

外部真实性(externalvalidity)

定义研究结果与推论对象真实情况的符合程度,又称为普遍性(generalizability)。它回答一个研究能否推广应用到研究对象以外的人群。改善措施增加研究对象的异质性,使得研究对象的代表性范围扩大。第三节研究的偏倚

选择偏倚信息偏倚混杂偏倚混杂偏倚的分层分析Bias:

systematic,non-randomdeviationofresultsandinferencefromthetruthorprocessleadingtosuchdeviation,anytrendinthecollection,analysis,interpretation,publicationorreviewofdata,thatcanbeleadtoconclusionwhicharesystematicallydifferencefromthetruth.DictionaryofEpidemiology,3rded.第三节研究的偏倚在流行病学研究中由于系统误差的存在,使样本人群的测量指标系统的偏离目标人群的真实值,从而影响研究结果和推论的现象。偏倚可发生于研究的任何阶段。

1946年,Berkson最著名的偏倚研究并给予证实,又称为Berkson偏倚。1976年,Miettinen详细讨论了偏倚的定义,并给出分类框架,分三类:

选择偏倚信息偏倚混杂偏倚第三节研究的偏倚一、选择偏倚(selectionbias)

定义研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。第三节研究的偏倚中学生近视:40%重点高中学生近视?pP=40%?某计划生育门诊随诊的IUD使用者中,生殖道感染现象严重,为此,该门诊收集了半年的病例进行了分析,发现STI感染率达到50%,所以,该门诊医生得出结论:IUD使用者中STI感染率为50%。IUD使用者有症状无症状就医STI感染:50%SO:IUD使用者中STI感染率为:50%?呼吸道疾病一般人群骨和运动疾病住院病人骨和运动疾病+—合计+—合计+1720722451520—1842376256018219237合计2012583278423234257OR1.064.06一般人群和住院人群中骨、运动疾病和呼吸道疾病的关系

描述性研究的选择偏倚

主要体现在样本对总体的代表性上如不是采用随机抽样而是使用方便样本,或某些特定群体(志愿者、因特网利用者等)造成的外部效度(外推)受限问题。控制方法尽量采用随机抽样,避免样本选取的偏向对特定群体的结果在外推上要谨慎等

第三节研究的偏倚分析性研究的选择偏倚

主要体现研究对象进入、排除、不参与或失访等与研究暴露或处理因素存在关联,由此增大或减少暴露与疾病、处理与效应的关联,导致效应估计的偏倚。控制方法选取具体环节或已选取人群的具体特征分析研究对象的选取是否同暴露或处理因素有关第三节研究的偏倚常见选择偏倚入院偏倚失访偏倚志愿者偏倚第三节研究的偏倚确定有无选择偏倚的关键把握选取环节或已入选对象,是否存在人为增大或减少研究因素与结局的关联程度控制方法严密掌握对象选取的各个环节,注意选取对象的代表性,增加应答和减少失访等第三节研究的偏倚二、信息偏倚(informationbias)

定义

又称测量偏倚或观察偏倚,是来自于测量或资料收集方法的问题,使得获取的资料存在系统误差。由于流行病学的暴露或疾病多为分类测量,所以信息偏倚又可称为错误分类偏倚(misclassificationbias)。信息偏倚同样影响描述性研究和分析性研究的结果。第三节研究的偏倚无差异性错误分类和差异性错误分类表8-3

无差异性错误分类

差异性错误分类 错误分类数据 错误分类数据

研究真实数据

研究真实数据第三节研究的偏倚

差异性信息偏倚的两种常见类型

回忆偏倚(recallbias)产生于研究对象记忆过去活动和暴露能力的差异。

调查者偏倚(interviewerbias)产生于调查者对研究对象有差异性地收集信息。采取盲法,可以降低调查者偏倚。第三节研究的偏倚

为了减少错误分类以及改善测量的准确性,研究者们正在越来越多地使用生物学标记物(biologicalmarkers)。它们可以用来测量易感性、内暴露(实际进入体内)剂量或生物学效应(剂量)等。第三节研究的偏倚三、混杂偏倚(confoundingbias)

定义:在流行病学研究中,由于一个或多个与暴露和研究疾病均有关的第三因子的影响,掩盖或夸大了研究因素和疾病之间的真实联系。称为混杂偏倚。第三节研究的偏倚混杂的特征:混杂因素是所研究疾病的一个独立危险因素混杂因素与所研究的暴露因素存在统计学联系混杂因素不是所研究暴露因素和疾病之间因果链的中间环节。混杂的判断:未分层的OR不等于分层调整后OR在非暴露组可疑混杂因子与疾病相关在非疾病组中可以混杂因子与暴露相关当cRR=aRR(f)或cOR=aOR(f)时,则f无混杂作用。当cRR≠aRR(f)或cOR≠aOR(f)时,且分层后有f层和无f层的分层RRi或ORi相同,则f有混杂作用。

混杂的方向:正混杂:cRR>aRR负混杂cRR<aRR中年人少量饮酒与心肌梗塞危险性–混杂因素示例

少量饮酒不饮酒心肌梗塞发病(例)140100随访人年(人年)30,00030,000发病率(1/千)4.673.33

RR=1.40

不同性别中年人少量饮酒与心肌梗塞危险性–混杂因素示例

男性

女性

少量饮酒不饮酒

少量饮酒不饮酒心肌梗塞发病(例)12060

2040随访人年(人年)20,00010,000

10,00020,000发病率(1/千)6.006.00

2.002.00

RR=1.0

RR=1.0口服避孕药心肌梗死对照合计+29135164—20516071812合计23417421796

cOR=1.68口服避孕药与心肌梗死的关系心肌梗死组和对照组年龄分布年龄(岁)心肌梗死例数构成比(%)对照组人数

构成比(%)25~62.628616.430~219.042324.335~3715.835620.440~7130.337121.345~499942.330617.6合计234100.01742100.0年龄组病例组口服避孕药暴露率对照组口服避孕药暴露率ORi2566.721.77.23042.97.88.93510.87.31.5408.52.43.745~496.13063.9合计12.47.7cOR=1.68ORMH=3.97心肌梗死组和对照组口服避孕药年龄别暴露率(%)C?DE高血清胆固醇冠心病黄色瘤?吸烟咖啡胰腺癌

继发关联(secondaryassociation)第三节研究的偏倚第三节研究的偏倚混杂的控制:设计阶段:限制(restriction),匹配(matching)随机化(randomization)

分析阶段:标准化率、分层和多变量分析限制(restriction)是在选择研究对象时,限制在具有一定特征的对象中进行观察,以排除其他因素的干扰。可提高可比性。这种方法所获得的结论常有很大局限性,影响研究对象的代表性,使研究结果外推至一般人群时受限。

匹配(matching)匹配是指在为研究对象设立对照时,使研究组对象和其对照在一个或多个潜在混杂因素上相同或相近,从而消除混杂因素对研究结果的影响。匹配的目的是为了控制混杂、提高研究的统计学效率。病例对照研究、队列研究和实验研究均可采用匹配。尤其是队列研究,使用匹配可达到直接控制混杂的效果,但病例对照研究中仍需进行分层分析来较好地控制混杂。随机化(randomization)随机化是指以随机化原则将研究对象以同等的机率被分配在各处理组中,从而使潜在的混杂因素在各组间分布均衡。随机化多用于实验研究,尤其是临床试验。标准化(standardization)当比较两个率时,如果两组对象内部构成存在的差别足以影响结论,可用率的标准化加以校正,亦即使可能影响结果的因素受到同等的加权,使这两个率可比、无偏倚,这种方法称为标准化。分层(stratification)分层是指将研究所获资料按可疑的混杂因素分成数层(亚组)进行分析。Mantel-Haenszel分层分析是最常用的检出和控制偏倚的方法之一。但如果欲控制的混杂因素较多,则分层分析对样本量的要求较大,此时,可以应用多因素分析方法如Logistic回归分析等来估计和控制混杂。

四、混杂偏倚的分层分析

M-H(Mantel-Haenszel)分层分析方法的步骤按可疑的混杂因素进行分层层间一致性检验;判定层间RR或OR是否相等或相近合并计算调整的(控制混杂后)RR或OR将调整RR或OR与分层前的粗

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论