病例对照研究.ppt_第1页
病例对照研究.ppt_第2页
病例对照研究.ppt_第3页
病例对照研究.ppt_第4页
病例对照研究.ppt_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章 病 例 对 照 研 究,Case-control study,流行病学的任务 病因研究的步骤 验证病因假设的方法 病例对照研究的原理,引 言,流行病学研究方法,观察法,实验法,数 理 逻辑法,描述 流行病学,实验 流行病学,分析 流行病学,临床试验,横断面研究 监测 生态学研究,病例对照研究 队列研究,数理 流行病学, 流行病学数学模型,现场试验,第一节 概 述,概念、目的、特点、用途、种类,一、概念,(一)定义: 病例对照研究(Case-control studies)是选择患病和未患病的两组人群,调查这两组人群过去暴露于某个或某些暴露因素的情况及程度,然后比较这两组人群之间暴露的差异,以判断该因素与疾病之间的联系及联系强度的一种观察研究方法。,人 群,病例组,对照组,某因素的暴露情况,某因素的暴露情况,回顾调查,c/d,OR,患有某病,回顾调查,未患某病,a/b,调查方向:收集回顾性资料,比较 人数 暴露 疾病,病例组,对照组,+,+,a,c,b,d,第一节 概述,1843年Guy向统计学会报告-最早病例对照研究 分析职业暴露与肺结核发生的关系 1844年Louis的著作 最早出现病例对照研究的概念 1926年Lane Claypon 报告 生殖因素与乳腺癌关系的研究,(二)研究简史,1947年Schreck和Lenowitz 包皮环切和性卫生与阴茎癌的关系 1947年Hartwell 输血与肝炎关系的研究 1950年Doll和Hill 吸烟与肺癌的研究,20世纪60年代以来,孕妇服用反应停(thalidomide)与婴儿短肢畸形 母亲吸烟与先天性畸形 早产儿吸入高浓度氧与晶体后纤维组织增生症 经期使用月经棉与中毒性休克综合征 小剂量电离辐射与白血病 母亲早孕期服用雌激素与少女阴道腺癌等之间的关系,(三)其他相关概念,1、病例组: 患所研究疾病的人群。 2、对照组: 未患有所研究疾病的人群(即健康 人,或是患有其他疾病的人)。,(二)其他相关概念,3、暴 露(exposure): 指研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态。 这些因素、特征或状态即为暴露因素,也叫研究变量。暴露因素可以是机体的特征,也可以是体外 的;可以是先天的、人体固有的,也可以是后天获得的。它可以是有害的,也可以是有益的。,(二)其他相关概念,4、 危险因素(流行因子、危险因子、泛称为病因): 引起人群发病概率增加的因素。 5、 保护因素: 引起人群发病概率减少的因素。 6、影响因子: 引起人群发病概率增加或减少的因素。,二、病例对照研究主要目的,主要目的是验证病因假设。 将人群分为病例组和对照组,调查这两组人群既往暴露于假设因素情况,最后比较病例组和对照组对假设因素的暴露比例。如果病例组与对照组的暴露比例在统计学上无显著性差异,表明该因素与疾病之间无联系。如果病例组与对照组的暴露比例在统计学上有显著性差异,表明该因素与疾病之间有联系。,三、病例对照研究的特点,属于观察性研究方法 设立对照 观察方向从“果”至“因” 研究因素可以有多项 不能确证暴露与疾病的因果关系(时间顺序),四、病例对照研究的用途,(一)广泛地探索疾病的可疑危险因素 (二)深入检验某个或某几个病因假说 (三)为进一步进行前瞻性研究提供明确病因线索,五、病例对照研究的种类,(一)按研究目的分类: 1、探索性病例对照研究: 这与病例对照研究的用途“1” 相对应。 它没有预先形成明确的某种假设,而是广泛地搜寻可能的危险因子,以便进一步形成假设供以后检验,它往往是病例对照的起步工作。 在研究设计上,它不对病例和对照作特别的限制,只需随机抽取一定数量的两类研究人群的样本即可满足需要。,五、病例对照研究的种类,2、检验性的病例对照研究: 这与病例对照研究的用途“2” 相对应。 它提出一个或几个明确的病因假设,通过对比调查,以检验其成立或不成立。 它在研究设计上需要对病例或对照组作出较多的规定或限制。,五、病例对照研究的种类,(二)按研究设计的病例与对照配比分类: 1、 病例与对照不配比: 在设计所规定的病例和对照人群中,分别抽取一定量的研究对象。一般对照人数应等于或多于病例人数。此外没有其它任何限制与规定。这种不匹配适合于前述的探索性病例对照研究,实行起来容易,能获得较多的信息。,五、病例对照研究的种类,2、病例与对照匹配 匹配或称配比(matching):即要求对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰。,五、病例对照研究的种类,1)匹配分类: 频数匹配(又称成组匹配):匹配因素所占的比例在对照组与病例组一致 个体匹配:给每一个病例选择一个或几个对照,配成对(pair)或配成伍,使对照在某些因素或特征(如年龄、性别等)方面与其相配的病例相同或基本相同。,五、病例对照研究的种类,2)匹配的优点: 匹配提高了研究效率:也就是说增加了分析时的统计学检验能力,或说是流行病学效率,表现为每一研究对象提供的信息量增加。 控制混杂因素的作用:匹配的特征或变量必须是已知的混杂因子,或有充分的理由怀疑为混杂因子,否则不应匹配。 匹配比不匹配的结果更清楚易于理解,五、病例对照研究的种类,3)匹配的缺点: 增加了选择对照的难度: 一旦某个因子再做匹配,不但使它与疾病的关系不能分析,而且使它与其他因子的交互作用也不能充分分析。 匹配的因素多,可比性强,控制的混杂因素也多。这就会有两个弊病:不易找;容易发生“匹配过度” ,使某些间接联系的因素列入匹配,造成病例组与对照组之间的暴露率差异变小或消失。,五、病例对照研究的种类,3、匹配法注意事项 1)慎重选择匹配因素 2)可疑病因决不能作为匹配因素 3)比例一般为1:1,也可以 1:2,甚至1:3或 1:4,最多不超过1:4 4)匹配的因素不宜过多 ,避免发生“匹配过度(overmatching)” 增加工作的难度,明确研究目的,选择适宜的对照形式 1 如果研究目的是广泛探索疾病的危险因子,可以采用不匹配或频数匹配的方法 2了解可供研究用的病例的数量,以确定是否采用匹配设计及匹配比。 3 以较小的样本量获得较高的检验效率。如:1:R的匹配方法,R值越大,效率越高。随着R值的增加,效率逐渐增加,但增加的幅度越来越小,而工作量却显著增大。因此,R值不宜超过4,否则将得不偿失。,第二节 病例对照研究的步骤,研究内容的确定、研究对象的选择、 病例与对照配比、样本含量的确定、 暴露因素的确定、混杂因素的确定、 调查表格的制定、调查资料的收集、 数据资料的整理、数据资料的分析。,一、研究内容的确定,(一)主要研究内容: 验证某个(或某些)暴露因素与疾病之间的联系,并估计其联系强度。 确定主要研究内容的过程就是提出暴露因素与疾病之间可能存在的因果联系假设的过程。,一、研究内容的确定,(二)提出病因假设方法 1、用描述流行病学方法提出病因假设。 2、根据临床观察的事实提出病因假设。 3、将临床观察与描述流行病学分析结合起来提出病因假设。 4. 通过查阅有关疾病的流行病学、临床医学等方面的文献资料提出病因假设。,一、研究内容的确定,(三)暴露因素与疾病之间的 联系 无联系 有联系 联系强度大小 虚假联系 因果联系,二、研究对象的选择,(一)病例的选择 (二)对照的选择 (三)病例与对照配比分类,二、研究对象的选择 原则:代表性;可比性,(一)病例的选择,诊断标准,其他特征的规定,(一)病例的选择,1、选择疾病的诊断标准: 1)尽量采用国际或国内通用的统一诊断标准; 2)最好采用对疾病诊断较为特异的诊断标准金标准; 3)自定标准时,注意敏感性与特异性。,(一)病例的选择,2、 病例的来源 (1)从医院选择病例:为了减少偏倚,病例应尽量选自同一地区多个医院的医院住院或门诊的病例。有简便易行,诊断准确率高,可节省费用,病人易合作等优点。但容易发生选择偏倚。 (2)从一般社区人群中选择病例:选择一定期间一定人群中全部病例或者随机样本人群中的全部病例 。采用本法收集的病例代表性好,但在实际执行时往往困难较多。病例一般以社区来源为优,代表性较强,但不易得到,(一)病例的选择,3. 病例种类: (1)最好选择新发病例:其发病时间更接近可疑暴露因素的暴露时间,并且对疾病危险因素的回忆可能比较认真,提供的信息较为准确可靠。 (2)也可选择现患病例:有时也可选择现患病例,其优点是在短时间内可收集到足够数量的病例,在研究罕见病病因时常用现患病例为研究对象。 (3)有时可用死亡病例:主要由家属提供信息,准确性较差。但死亡病例省时省钱,很快可以提供研究线索。,(一)病例的选择,4、要求 1)诊断的可靠性:要求通过某一级医院或实验室的诊断,或病人必须经过某项检查等。有时需要另组织专家对病例复查,以保证符合规定的标准。 2)暴露的可能性:暴露于所研究因素。 3)病例的代表性:病例总体中随机样本。,(二)对照的选择,来源,形式,种类,(二)对照的选择,1、对照选择的原则: 1)候选对象必须来自产生病例的总体 2)对照一旦发生所研究的疾病便成为病例组的研究对象 3)目的:如所研究的暴露因素与疾病无联系,对照组与病例组暴露率相一致。,(二)对照的选择,2、对照的来源: (1)从社区一般人群(病例来自该人群)中随机选择对照。较为理想的方法,但实际施行有较多的困难。 (2)从医院中患有其他疾病的病人中随机选择对照。应选择多个医院、多科室、多病种的病人作对照。易选,比较合作, 但代表性较差。 (3)从亲属、邻居、同事、同学等中随机选择对照。代表性也较差,但易选、合作。同时,要考虑到这种对照在某些环境和/或遗传因素方面与病人较为一致。,(二)对照的选择,3、选择对照的要求: (1)对照不患有与所研究的疾病有共同已知病因的疾病。 (2)从医院的其他病人中选择对照时,最好不选择患病时间较长的病人作对照。 (3)在医院选择对照时,尽可能包括其他各种疾病的病例。 (4)不管选择哪种对照,对照和病例陈述暴露于假设因素的情况要有可比性。,三、病例与对照配比分类:,1、 病例与对照不配比:在设计所规定的病例和对照人群中,分别抽取一定量的研究对象,一般对象数目应等于或多于病例人数。此外没有其它任何限制与规定。 2、 病例与对照配比:即对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰。这些因素或特征称之为匹配因素或匹配变量。,四、样本含量的确定,一方面,为了估计暴露因素与疾病之间的联系强度、检验暴露因素的暴露情况在病例组与对照组之间是否存在差异,必须保证样本数量足够。 另一方面,样本数量过多又浪费人、财、物力,影响质量,增加负担。 样本数量多少为宜?,(一)影响样本大小的因素:,1、暴露因素在人群中的估计暴露率(P0);病例组的暴露率(P1 ) 2、估计的该暴露因素引起的比值比优势比(OR); 3、所希望达到的检验显著性水平(); 4、所希望达到的检验把握度(1-)。,(二)方 法 查表法 公式法:求病例对照研究样本含量的公式 或近似公式,暴露组患病率,对照组患病率,例:为研究某市肺癌与吸烟的关系,欲进行一次病例对照研究。 某市普通人群中吸烟率 P0=30% OR=5.0 =0.05 把握度0.90 问需要多少病例与对照?,、值查表,Z为1.64, Z为1.28 代入公式得: 病例组与对照组,各需28人。 如代入近似公式计算,所得结果与原公式很接近(n=29.5),病例组与对照组例数不等时的公式: 病例数:对照数=1:c 对照组例数为c*n,1:1匹配设计 总对子数,(一)暴露因素(变量)的选定:一项病例对照研究可用来研究多个暴露因素与疾病之间联系。但,研究的暴露因素也不是愈多愈好,所以要精心选择、仔细设计暴露因素。 (二)变量的规定:每项变量要有明确的定义,尽可能地采用国际或国内统一的标准,以便交流和比较。 (三)变量的测量: 1、 定性的指标; 2、定量 的指标,六、混杂因素的确定,概念: 混杂因素亦称混杂因子或外来因素,是指与研究因素和研究疾病均有关,若在比较的人群组中分布不匀,可以歪曲(掩盖或夸大)因素与疾病之间真正联系的因素。 混杂因素的基本特点是: 必须是所研究疾病的独立危险因子; 必须与研究因素(暴露因素)有关; 一定不是研究因素与研究疾病因果链上的中间变量。,七、调查表格的制定,(一)要求 1.调查表主要根据研究目的、研究内容以及研究设计要求制定。 2.调查表中调查项目要有明确的定义和具体说明,调查表要简单明确,必要的项目一项也不漏掉,不必要的项目一项也不列。 3. 制定调查表时,事先周密考虑,最好征求有经验人的意见。 4. 为便于用计算机统计分析,现在多用编码(coding)方法。,七、调查表格的制定,(二)调查表主要内容: 1、一般情况,如姓名、性别、住址、出生年月、职业等, 2、疾病诊断情况, 3、暴露因素情况 4、混杂因素情况。,八、调查资料的收集,(一)资料来源 主要包括以下两个方面: 1、通过询问调查收集资料。 2、通过现成记录收集资料。,(二)收集资料要求,1、要有良好的组织,遵守一定制度和规定,并实行质量监督以保证收集过程顺利和达到高质量。 2、使所的收集资料完善、可靠、准确、可比。 3、要注意控制信息偏倚,保证收集资料的质量。,九、数据资料的整理,1、原始资料的核查: 对所收集的资料要经过核查、修正、验收、归档等一系列步骤,以保证资料尽可能的完整和高质量。 2、原始资料的分组、归纳,或编码输入计算机: 这一步骤是使原始的数据系统化和条理化,在此基础上计算各项指标,描述分布的特征,进一步作分析。,十、数据资料的分析,主要分析病例与对照组在暴露因素上的差异,分析暴露与疾病的统计学关联强度,确定关联强度的大小比值比又称优势比,交叉乘积比:是指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。,第三节 资料分析,一 、均衡性检验 比较病例组与对照组在研究因素以外的其他主要特征方面有否可比性,两组非研究因素均衡,其暴露率的差异与发病有关,二 、计算OR值,1、比值比的概念 A、比值:指某事件发生的概率(可能性)与不发生概率(可能性)之比。 B、病例组的暴露比值:病例组有暴露史的概率与无暴露史的概率之比,即(a/m1)/(c/m1)=a/c; C、对照组的暴露比值:对照组有暴露史的概率与无暴露史的概率之比,即(b/ m0)/(d/ m0)=b/d。 D、比值比又称优势比,交叉乘积比:是指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。,二 、计算OR值,2、公式 OR:(a/c)/(b/d)=ad/bc,二 、计算OR值,3、OR特点 与RR一样,优势比反映暴露者患某种疾病的危险性较无暴露者高的程度 如果能满足2个条件 OR RR 所研究疾病的发病率(死亡率)很低 病例对照研究中所选择的研究对象代表性好,二 、计算OR值,4、比值比的意义 当OR=1时,表示暴露因素与疾病之间无联系。 当OR1时,表示暴露因素与疾病之间存在“正”的暴露与疾病联系,暴露因素是一种危险因素,或有害因素。 当OR1时,说明存在“负”的暴露与疾病联系,暴露因素是一种保护性因素,或有益因素。在有些教科书或文献中直接将比值比称为相对危险度。,二 、计算OR值,5、计算OR值的步骤 1)列四格表,计算两组暴露比值; 2) 进行2 检验,判断两组暴露率有无显著性差异所研究的疾病与所研究的因素间有无关联; 3)计算OR值及其95%可信限,判断所研究的疾病与所研究的因素间关联强度; 4)判断所研究的疾病与所研究的因素的关系。,(一)成组比较法分析,1、列四格表,计算两组暴露比值:,1)病例组的暴露比值:(a/m 1)/(c/m 1)=a/c; 2)对照组的暴露比值:(b/ m 0)/(d/ m 0)=b/d。,(一)成组比较法分析,2、2 检验 传统的四格表的专用公式 antel-Haenszel (M-H)方法,其中E() 为a的期望值;V()为a的方差,(一)成组比较法分析,3、 OR计算与可信限的估计及其意义,OR 95%C.I.=,M-H法,两种方法计算结果一致,表明吸烟与食管癌有联系,但联系强度如何,要计算OR,四格表法,结果表明吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信范围是在2.183.78之间,三、1:1配对资料的分析 匹配资料是由病例与对照结合成对子,分析结果时不应把对子拆开分析 先将资料列成表5-4的格式 注意表内的数字a、b、c、d是病例与对照配成对的对子数,食管癌发病因素的研究中发现,吸烟与发病有关,男性的资料归纳成表5-6,2=11.28, OR=4.33 表明男性吸烟者患食管癌的危险性是不吸烟者的4.3倍 OR95%可信限,四、混杂因素作用的估计与分层分析 配比法 分层分析,表57,按饮酒与否分层 计算OR值,饮酒者中吸烟的OR(2.98)稍高于不分层OR(2.87) 不饮酒者中吸烟的OR(1.67)却低得很多 表明饮酒是混杂因素,饮酒似可加强吸烟的作用,按饮酒与食管癌的关系列表计算 2=31.9, RR=2.29 可见饮酒与食管癌有联系,消除饮酒与否的影响,就要计算这两组人群合并的与OR值,而在此之前必须先作齐性检验(可参照有关书籍)。 如果两组人群OR值没有明显差别,用统计学方法消除混杂作用影响,求合并OR值;有显著差异,不宜再计算合并OR值。 本例齐性检验的结果无显著差异。,进行齐性检验 齐性检验 合并与OR值 OR值无明显差别,则饮酒是混杂因素 合并OR值 OR值有显著差异,则饮酒是明显混杂? 合并OR值 本例齐性检验无显著差异,计算合并OR与2,计算合并OR与2值 公式(M-H法): 合并 合并,=37.74,=2.42,经饮酒分层调整后,吸烟的2与OR(即合并2与合并OR)虽较未调整的2 (55.5)与OR(2.87)为低,但仍有一定强度与统计学上的显著性。 吸烟与食管癌之间有显著的关联 饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟的作用,2,M-H,表5-9 分层计算结果整理表,第四节 偏倚及其控制,偏倚:是指由抽样误差以外的任何原因引起的误差。研究误差中的系统误差部分称偏倚。,选择偏倚 (selection bias):由于选入的研究对象与未选入的研究对象在某些特征上存在差异而引起的误差。这种偏倚常发生在设计阶段。 信息偏倚 (information bias):在收集整理信息过程中由于测量暴露与结局的方法有缺陷造成的系统误差。 混杂偏倚 (confounding bias):研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系。,偏倚种类,一、选择偏倚,选择偏倚(Selection Bias)指由于入选的研究对象与未入选的研究对象在某些特征上存在差异而引起的误差。这种偏倚常发生在设计阶段。 选择偏倚游客细分为入院率偏倚、 现患病例-新发病例偏倚、 检出征侯偏倚、时间效应偏倚,1、入院率偏倚,概念 当利用医院病人作为病例和对照时,对照是医院的某一部分病人不是全体目标人群的一个随机样本,病例只是该医院或某些医院的特定病例不是全体病人的随机样本,所以难免产生偏倚,特别是因为各种疾病的入院率不同导致病例组与对照组某些特征上的系统差异 控制 合理地选择病例与对照 ;从总体人群中选择所有或绝大多数符合诊断标准的病例 ;从各医院中选取病例,从多病种中选择对照,2、现患病例-新发病例偏倚,概念 如果调查对象选自现患病例,即存活病例,可能得到更多的信息,但是其中很多信息可能只与存活有关,而未必与该病的发病有关,从而高估了某些暴露因素的病因作用;另一种情况是,某病的幸存者改变了生活习惯,从而降低了某个危险因素的水平,或当他们被调查时夸大或缩小了病前生活习惯上的某些特征,导致某一因素与疾病的关联误差 控制 调查时明确规定纳入标准为新发病例,3、检出征侯偏倚,定义也称暴露偏倚:病人常因某些与致病无关的症状而就医,从而提高了早期病例的检出率,致使过高地估计了暴露程度而产生的系统误差 控制:延长收集病例的时间,超过由早期向中、晚期发生的时间,4、时间效应偏倚,定义对于肿瘤、冠心病等慢性疾病,从开始暴露于危险因素到出现病变往往经历一个较长的时间过程,因此那些暴露后即将发生病变的人、已发生早期病变而不能检出的人、或在调查中已有病变但因缺乏早期检测手段而被错误地认为是非病例的人,都可能被选入对照组,由此而产生了结论的误差 控制 尽量采用敏感的疾病早期检查技术 开展观察期充分长的纵向调查,其他偏倚 无应答偏倚:入选的研究对象与未应答的人员之间有系统的差异,也可致选择偏倚。 研究对象拒绝参加、或除外某些研究对象,会导致暴露与疾病之间联系的估计错误。,二、信息偏倚,信息偏倚(Information Bias)又称测量偏倚、观察偏倚。是在收集信息过程中由于测量暴露与结局的方法(工具)有缺陷,使采集到的信息不准确(即不完全真实),从而引起偏倚。错分是测量不准确导致的最直接的结果。 信息偏倚又可分为回忆偏倚、调查偏倚,1、回忆偏倚,定义由于被调查

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论