中山_病例对照研究_第1页
中山_病例对照研究_第2页
中山_病例对照研究_第3页
中山_病例对照研究_第4页
中山_病例对照研究_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一起食物中毒暴发调查一起食物中毒暴发调查 -病例发病病例发病2-6周前曾于周前曾于A餐馆就餐餐馆就餐 -排除厨师和服务员是传染源排除厨师和服务员是传染源(发病时间)(发病时间) -什么食物被污染?什么食物被污染? 调查:所有病例发病前在调查:所有病例发病前在A餐馆食用食物餐馆食用食物 食用频率最高的食物?(现况研究)食用频率最高的食物?(现况研究) 1 募集同时期餐馆进餐但未发病者募集同时期餐馆进餐但未发病者 对照组对照组 与病例组与病例组比较比较:食用食物的差异:食用食物的差异 沙拉:沙拉: 病例病例94% vs. 39%对照对照 辣菜:病例辣菜:病例15% vs. 3%对照对照 青洋葱青洋

2、葱 2 检验假设检验假设 验证假设验证假设 研究方法研究方法 观观 察察 法法 实实 验验 法法 数数 理理 法法 描述流行病学描述流行病学 分析流行病学分析流行病学 横断面调查横断面调查 监测监测 生态学研究生态学研究 病例对照研究病例对照研究 队列研究队列研究 实验流行病学实验流行病学 临床试验临床试验 现场试验现场试验 社区干预项目社区干预项目 理论流行病学理论流行病学 产生假设产生假设 3 4 病例对照研究病例对照研究 Case Control Study 刘丽刘丽 流行病与卫生统计学系流行病与卫生统计学系 主要内容主要内容 什么是病例对照研究?什么是病例对照研究? 病例对照研究的特点

3、?病例对照研究的特点? 如何进行病例对照研究?如何进行病例对照研究? 病例对照研究的优缺点是什么?病例对照研究的优缺点是什么? 5 第一节第一节 基本原理基本原理 1. 1. 基本概念:基本概念: l病例对照研究:病例对照研究:选择选择患有某病患有某病和和未患有某特定疾病未患有某特定疾病 的人群,的人群,分别作为分别作为病例组病例组和和对照组对照组,调查并,调查并比较两组研比较两组研 究对象既往某些因素的暴露情况究对象既往某些因素的暴露情况,判断该,判断该暴露因素是否暴露因素是否 与该病有关联与该病有关联及关联程度大小的一种观察性研究方法。及关联程度大小的一种观察性研究方法。 从疾病出发,去探

4、讨可能的病因从疾病出发,去探讨可能的病因 回顾性研究回顾性研究 (Retrospective study) 6 l暴露暴露 (exposure) 指研究对象接触过某种待研究的物质(如重金指研究对象接触过某种待研究的物质(如重金 属、属、X X线)、具备某种待研究的特征(如年龄、线)、具备某种待研究的特征(如年龄、 性别及基因突变等)或行为(如吸烟)。性别及基因突变等)或行为(如吸烟)。 l暴露因素暴露因素 可以是有害的,也可以是有益的,可以是有害的,也可以是有益的, 也叫研究因素。也叫研究因素。 7 7 7 8 l危险因素(危险因素(risk factor) 引起某特定不良结局发生或使引起某特

5、定不良结局发生或使 其概率增加的因素。其概率增加的因素。 l保护因素(保护因素(protective factor) 导致疾病事件降低的暴露因素导致疾病事件降低的暴露因素 称为保护因素称为保护因素 决定因素决定因素/ / 研究因素研究因素 暴露即是具有该研究因素暴露即是具有该研究因素 时间时间 病例组病例组 对照组对照组 研究开始研究开始 暴露暴露 暴露暴露 非暴露非暴露 非暴露非暴露 调查方向调查方向 图图 病例对照研究示意图(病例对照研究示意图(Greenberg ,2002) a c b d a/(a+c) b/(b+d) 人数人数比较比较 源源 人人 群群 9 对比的思维(求异法)、概

6、率统计的思维对比的思维(求异法)、概率统计的思维 人群基线或期人群基线或期 望暴露水平望暴露水平 2. 2. 基本原理基本原理 以确诊患某种特定疾病的病人作为以确诊患某种特定疾病的病人作为病例组病例组 以不患该病但具有可比性的个体作为以不患该病但具有可比性的个体作为对照组对照组 搜集既往危险因素搜集既往危险因素/保护因素的暴露史保护因素的暴露史 测量并测量并比较两组各因素的暴露比例比较两组各因素的暴露比例,经统计学,经统计学 检验该因素与疾病之间是否存在统计学关联检验该因素与疾病之间是否存在统计学关联; 利用病因推断技术,对统计学关联进行分析。利用病因推断技术,对统计学关联进行分析。 2. 2

7、. 基本原理基本原理 10 3. 病例对照研究病例对照研究特点特点 l观察法观察法 l按照是否患病分组,设立对照按照是否患病分组,设立对照( (分析性方法分析性方法) ) l测量的是暴露情况,而非疾病情况测量的是暴露情况,而非疾病情况 l回顾性,由果回顾性,由果 因因研究研究 l一般不能验一般不能验证证病因病因 11 4.4.病例对照研究的应用病例对照研究的应用 l 广泛探索疾病的可疑危险因素广泛探索疾病的可疑危险因素 l 检验病因假说检验病因假说 l 防治措施效果的评价防治措施效果的评价 l 药物不良反应的研究药物不良反应的研究 l 疾病预后因素的研究疾病预后因素的研究 12 第二节第二节

8、研究类型研究类型 l病例病例与对照不匹配与对照不匹配 l病例病例与对照匹配与对照匹配 13 1. 1. 病例病例与对照不匹配与对照不匹配 从规定病例源人群从规定病例源人群中,中,分别抽取分别抽取一定量一定量的患病的患病 与非患病的研究对象分别作为病例组和对照组与非患病的研究对象分别作为病例组和对照组 对照组人数对照组人数病例组人数病例组人数 对照组应能代表产生病例对照组应能代表产生病例的源人群的源人群 此外没有其他限制与规定。此外没有其他限制与规定。 14 进行吸烟与肺癌关系研究,若因某种原因,进行吸烟与肺癌关系研究,若因某种原因, 肺癌组以女性患者较多,而对照组以男性占多数,肺癌组以女性患者

9、较多,而对照组以男性占多数, 结果显示吸烟与肺癌无关。结果显示吸烟与肺癌无关。原因?原因? 15 研究研究对象的选择有问题对象的选择有问题,即女性患者吸烟比例较,即女性患者吸烟比例较 低,而男性较高。低,而男性较高。性别分布在两组不均衡性别分布在两组不均衡,产生混,产生混 杂作用杂作用。 研究吸烟与肺癌关系时,研究吸烟与肺癌关系时,肺癌组和对照组在性别肺癌组和对照组在性别 保持一致保持一致,依此比较吸烟与肺癌关系,可消除性别,依此比较吸烟与肺癌关系,可消除性别 对结果影响。对结果影响。 ?如何使病例组和对照组的性别分布保持一致?如何使病例组和对照组的性别分布保持一致? 采用匹配,可控制混杂偏倚

10、对结果的影响。采用匹配,可控制混杂偏倚对结果的影响。 16 2.2.病例病例与对照匹配与对照匹配 l 匹配匹配/ /配比配比( (matching) ) 要求对照在某些因素或特征上与病例保持一致要求对照在某些因素或特征上与病例保持一致 对两组进行比较时排除匹配因素的干扰对两组进行比较时排除匹配因素的干扰 分类分类 频数匹配频数匹配 frequency matching 个体匹配个体匹配 individual matching 17 频数匹配(又称成组匹配)频数匹配(又称成组匹配) 匹配因素所占比例在对照组与病例组一致的匹配因素所占比例在对照组与病例组一致的整体匹配。整体匹配。 个体匹配个体匹配

11、 以以病例和对照个体为单位病例和对照个体为单位进行匹配。进行匹配。 1:1匹配,又称匹配,又称配对配对;1:2, 1:3, 1:41:R 匹配。匹配。 匹配因素的一致程度:匹配因素的一致程度: 离散变量,完全匹配;离散变量,完全匹配; 连续变量,在一定范畴内匹配(分组或分类)连续变量,在一定范畴内匹配(分组或分类) 18 l 匹配法注意事项匹配法注意事项 避免避免匹配过度(匹配过度(overmatchingovermatching) 慎重慎重选择匹配因素(选择匹配因素(已知混杂因素或有理由怀已知混杂因素或有理由怀 疑为混杂因素疑为混杂因素!) l 匹配的目的匹配的目的 提高研究效率提高研究效率

12、 控制控制混杂因素的作用混杂因素的作用 19 匹配过度(匹配过度(overmatching) 把不必要的项目进行匹配把不必要的项目进行匹配,企图使病例和对照尽量一,企图使病例和对照尽量一 致,可能导致信息丢失,增加工作难度,反而降低研致,可能导致信息丢失,增加工作难度,反而降低研 究效率。究效率。 不应进行匹配的情况(不应进行匹配的情况(非混杂因素非混杂因素) u疾病因果链上的中间变量;疾病因果链上的中间变量; u只与暴露因素有关,与疾病无关的因素;只与暴露因素有关,与疾病无关的因素; u可能是疾病的某一危险因素。可能是疾病的某一危险因素。 慎重选择匹配因素(已知混杂因素或有理由怀疑慎重选择匹

13、配因素(已知混杂因素或有理由怀疑 为混杂因素!)为混杂因素!) 20 第三节第三节 研究设计与实施研究设计与实施 1.1. 确定确定研究目的及研究假设研究目的及研究假设 2.2. 确定研究类型确定研究类型 3.3. 研究对象的选择研究对象的选择 4.4. 样本量样本量估计估计 5.5. 研究因素的选定与测量研究因素的选定与测量 6.6. 资料收集资料收集 7.7. 资料整理和分析资料整理和分析 8.8. 偏倚偏倚的识别与的识别与控制控制 21 1. 1. 确定研究目的(拟解决的科学问题是什么?)确定研究目的(拟解决的科学问题是什么?) l研究假设(科学问题)研究假设(科学问题): : 根据根据

14、以往疾病分布的记录以往疾病分布的记录或或现况调查现况调查得到的结果,结合得到的结果,结合 文献资料,提出研究假设。文献资料,提出研究假设。 l研究目的:研究目的: p广泛探索疾病的可疑危险因素广泛探索疾病的可疑危险因素 p深入检验病因假说深入检验病因假说 p药物不良反应的研究药物不良反应的研究 p疾病预后因素的研究疾病预后因素的研究 p防治措施效果的评价防治措施效果的评价 22 2. 2. 明确适宜的研究类型明确适宜的研究类型 l形式形式: : 非匹配、频数匹配、个体匹配非匹配、频数匹配、个体匹配 l原则:原则: 广泛探索病因,采用不匹配或频数匹配广泛探索病因,采用不匹配或频数匹配 罕见病采用

15、个体匹配罕见病采用个体匹配 防止匹配过度防止匹配过度 23 3.3.明确研究对象(病例与对照的来源与选择)明确研究对象(病例与对照的来源与选择) l基本原则:基本原则: 代表性代表性: : 病例能代表总体的病例病例能代表总体的病例; ; 对照能代表产生病例的总体人群或源人群对照能代表产生病例的总体人群或源人群 可比性(可比性(合理的比较往往更重要合理的比较往往更重要) l来源:来源: 以医院为基础以医院为基础 hospital-based 以社区为基础以社区为基础 community-based 24 (1 1)病例的选择)病例的选择 判断病人的标准判断病人的标准/ /如何获得符合标准的病人?

16、如何获得符合标准的病人? l选择病例的要求:选择病例的要求: 诊断可靠诊断可靠 使用金标准使用金标准 对病例的患病部位、病理学分型等明确限制。对病例的患病部位、病理学分型等明确限制。 同是胃癌病人,病理学分类有未分化弥漫性腺癌和同是胃癌病人,病理学分类有未分化弥漫性腺癌和 分化肠型腺癌,病因有差异。分化肠型腺癌,病因有差异。 对病例的外部特征(年龄、性别、种族、职业等)对病例的外部特征(年龄、性别、种族、职业等) 明确规定,控制非研究因素,增强比较组的可比性。明确规定,控制非研究因素,增强比较组的可比性。 25 l病例类型:病例类型:新发病例、现患病例、死亡病例新发病例、现患病例、死亡病例 首

17、选新发病例首选新发病例 回忆偏倚小回忆偏倚小 代表性好代表性好 容易合作容易合作 被调查因素改变少被调查因素改变少 26 l病例来源:病例来源: 医院住院或门诊的病例医院住院或门诊的病例 代表性好代表性好 工作开展比较困难工作开展比较困难 耗费人力物力耗费人力物力 社区的病例社区的病例 (最优)(最优) 比较合作比较合作 资料易得到且比较可靠资料易得到且比较可靠 与对照的可比性好与对照的可比性好 代表性差代表性差 27 (2 2)对照的选择()对照的选择(整个研究的关键之一)整个研究的关键之一) l原原 则则 未患此病的人(可以是其它疾病);未患此病的人(可以是其它疾病); 如研究吸烟与肺癌关

18、系,能否以如研究吸烟与肺癌关系,能否以慢性支气管炎病人慢性支气管炎病人作为作为 对照?对照? 不能患有与所研究疾病有共同病因的疾病。不能患有与所研究疾病有共同病因的疾病。 足以代表产生病例的总体(代表性);足以代表产生病例的总体(代表性); 除研究因素外其它条件与病例组一致(可比性);除研究因素外其它条件与病例组一致(可比性); 必须具有暴露于研究因素的可能性;必须具有暴露于研究因素的可能性; 对照是否匹配以及匹配类型设置。对照是否匹配以及匹配类型设置。 28 l对照来源对照来源 n 社区来源的健康人或非该病人社区来源的健康人或非该病人(最接近全人群的(最接近全人群的 无偏样本)无偏样本) n

19、 医院来源的其他病例医院来源的其他病例(使用最多)(使用最多) l医院为基础的对照选择注意事项:医院为基础的对照选择注意事项: p对照所患疾病与病例的病因无关对照所患疾病与病例的病因无关 p选择多个病种的病人组成选择多个病种的病人组成 p不选择当前患有多种疾病的病人不选择当前患有多种疾病的病人 p从新发病人中选取对照从新发病人中选取对照 29 病例对照研究病例对照研究 社区为基础社区为基础/ /医院为基础医院为基础 以社区为基础的病例对照研以社区为基础的病例对照研 究究 以医院为基础的病例对照研以医院为基础的病例对照研 究究 可以较好的确定源人群研究对象的可及性好 容易保证病例和对照来自同 一

20、源人群 研究对象更易合作 对照的暴露史更可能反映病 例源人群的暴露情况 比较容易从医疗记录和生物 标本收集暴露信息 尽可能设立多种对照尽可能设立多种对照 设立两种或两种以上的对照,可以增强设立两种或两种以上的对照,可以增强 结果的可信度。如果多种对照均获得一致性结果,则结果的说结果的可信度。如果多种对照均获得一致性结果,则结果的说 服力便大大增强。服力便大大增强。 30 l 影响样本大小的因素影响样本大小的因素( (发现比较组的暴露率差异)发现比较组的暴露率差异) p人群中被研究因素的暴露率(人群中被研究因素的暴露率(对照组中的暴露率对照组中的暴露率) p暴露与疾病关联强度指标暴露与疾病关联强

21、度指标OR或或RR的估计的估计值(查阅文值(查阅文 献或预调查获得)献或预调查获得) 病例组的暴露率病例组的暴露率 p值(值(1- ,研究结果的可信程度),研究结果的可信程度) p值(值(1- ,研究,研究把握度)把握度) 根据以上有关参数查表或代入公式计算根据以上有关参数查表或代入公式计算 4.4.样本含量的估计样本含量的估计 31 样本量估计方法样本量估计方法 l 查表法查表法 l 公式法:公式法: 不匹配(病例组与对照组人数相等)不匹配(病例组与对照组人数相等) 病例组暴露率病例组暴露率对照组暴露率对照组暴露率 P1=P0OR/(1+P0(OR-1) 例:为研究某市肺癌与吸烟的关系,欲进

22、行一次病例例:为研究某市肺癌与吸烟的关系,欲进行一次病例 对照研究。对照研究。 某市普通人群中吸烟率某市普通人群中吸烟率 P0=20% OR=2.0 =0.05 把握度把握度0.90 问需要多少病例与对照问需要多少病例与对照? 1 0.2 2 / 1 0.2 10.333 0.20.333 /20.267 1 0.2670.733 p p q 33 、值查表,值查表,Z为为1.96, Z为为1.282 代入公式得:代入公式得: 病例组与对照组,各需病例组与对照组,各需232人。人。 22 2 0.267 0.7331.96 1.282/ 0.3330.2232n 病例组与对照组例数不等时的公式

23、:病例组与对照组例数不等时的公式: 病例数病例数: :对照数对照数=1:c=1:c 对照组例数为对照组例数为c c* *n n 22 10 (1 1/ )() /()nc pq zzpp 10 / 1ppcpc 1qp 35 1:11:1匹配设计匹配设计 总对子数总对子数 p p0 0和和p p1 1分别代表目标人群中对照组与病例组分别代表目标人群中对照组与病例组 的估计暴露率的估计暴露率 m m为暴露状况不一致的对子数为暴露状况不一致的对子数 2 2 /2(1)/(1/2)mzzppp / 1/ 1pORORRRRR 0 110 /Mmp qp q 100 / 1(1)pp RRp RR 1

24、1 1qp 00 1qp 36 5.5.研究因素的选定与测量研究因素的选定与测量 根据根据研究目的或具体的目标研究目的或具体的目标,确定调查变量和,确定调查变量和 每一个变量的具体项目。每一个变量的具体项目。 每项变量都要有明确的定义。每项变量都要有明确的定义。 研究中应尽可能地采用研究中应尽可能地采用定量或半定量的量度。定量或半定量的量度。 吸烟与肺癌的关系的研究吸烟与肺癌的关系的研究 吸烟的定义:吸烟的定义:一生中连续或累积吸烟一生中连续或累积吸烟6 6个月或以上者个月或以上者 吸烟与否;吸烟与否; 开始吸烟的年龄、吸烟的年限、每天吸烟量、是否戒烟、开始吸烟的年龄、吸烟的年限、每天吸烟量、

25、是否戒烟、 戒烟的时间;是否被动吸烟(被动吸烟的定义);戒烟的时间;是否被动吸烟(被动吸烟的定义); 三手烟?三手烟? 37 6. 6. 资料来源与收集资料来源与收集 资料来源:资料来源: l医院病案记录医院病案记录 l疾病登记报告等摘录疾病登记报告等摘录 l检测病人的标本或环境获得检测病人的标本或环境获得 l询问调查获得询问调查获得 38 资料收集的方法资料收集的方法 (1 1)询问)询问:包括面询、函询、电话询问、计算机辅:包括面询、函询、电话询问、计算机辅 助询问、自填问卷。助询问、自填问卷。 (2 2)查阅记录)查阅记录:包括出生、疾病死亡、健康体检记:包括出生、疾病死亡、健康体检记

26、录等。录等。 (3 3)测量:)测量:包括测量各种指标,如机体、环境的测包括测量各种指标,如机体、环境的测 量,区域、个体采样器监测、生物监测,血清学、量,区域、个体采样器监测、生物监测,血清学、 组织学分析等组织学分析等。 39 第四节第四节 资料的整理与分析资料的整理与分析 1.1.资料整理资料整理 2.2.描述统计描述统计 3.3.统计推断统计推断 不匹配资料的分析不匹配资料的分析 1:11:1配对资料的分析配对资料的分析 混杂因素作用的估计与分层混杂因素作用的估计与分层分析分析 l比较病例与对照中研究因素暴露比较病例与对照中研究因素暴露 的比例,估计研究因素与疾病发的比例,估计研究因素

27、与疾病发 生的危险度。生的危险度。 l控制潜在混杂作用,对研究因素控制潜在混杂作用,对研究因素 与疾病的关系做出正确的估计。与疾病的关系做出正确的估计。 40 1.1.资料整理资料整理 核查原始资料(核查原始资料(查漏补缺纠错查漏补缺纠错) 原始资料的分组、归纳、或编码输入计算机原始资料的分组、归纳、或编码输入计算机 双人平行录入双人平行录入 41 2.2.描述统计:描述统计: l研究对象的一般特征描述研究对象的一般特征描述: 病例组和对照组样本量,人口学特征构成,目的病例组和对照组样本量,人口学特征构成,目的 是分析研究对象的是分析研究对象的代表性。代表性。 l均衡性检验均衡性检验 比较病例

28、组和对照组某些基本特征是否相似或齐比较病例组和对照组某些基本特征是否相似或齐 同,检验病例组和对照组的同,检验病例组和对照组的可比性可比性。 如有统计学差异的因素,应分析其是否对其他因如有统计学差异的因素,应分析其是否对其他因 素产生影响(多因素模型,分层分析等)。素产生影响(多因素模型,分层分析等)。 42 (1 1)将资料整理成)将资料整理成表格形式表格形式; (2 2)病例组和对照组暴露比例差异的统计学检验:)病例组和对照组暴露比例差异的统计学检验: 即回答即回答E E和和D D是否有联系?是否有联系? (3 3)估计暴露因素疾病之间的联系估计暴露因素疾病之间的联系强度;强度; (4 4

29、)评价剂量)评价剂量反应关系(等级暴露资料);反应关系(等级暴露资料); (5 5)结果解释。结果解释。可能存在哪些偏倚?可能存在哪些偏倚?得出什么结论得出什么结论? 3.3.推断统计推断统计( (按不同的研究类型分析按不同的研究类型分析 ) ) 43 (1)资料整理成四格表)资料整理成四格表 (2)统计学检验()统计学检验(2 2检验)检验) 检验研究因素与疾病之间有否统计学联系?检验研究因素与疾病之间有否统计学联系? l非非匹配或频数匹配匹配或频数匹配病例病例对照资料的分析对照资料的分析 44 P1, 说明疾病的危险度因暴露而增加;说明疾病的危险度因暴露而增加; OR1, 说明疾病的危险度

30、因暴露而减少。说明疾病的危险度因暴露而减少。 ORRR的前提条件的前提条件 l所研究疾病的发病率(死亡率)很低所研究疾病的发病率(死亡率)很低 l病例对照研究中所选择的研究对象代表性病例对照研究中所选择的研究对象代表性 好,则好,则OR值就很接近甚至等于值就很接近甚至等于RR值值 47 l OR的置信区间的置信区间(confidence interval, CI)估计(估计(为什么?为什么?) 1)Woolf自然对数转换法:以自然对数转换法:以ln OR方差为基础方差为基础 Var(lnOR)=1/a+1/b+1/c+1/d lnOR 95% CI=lnOR1.96 OR 95% CI=exp

31、(lnOR 95%CI) 2) Miettnen卡方值法卡方值法 置信区间不包括置信区间不包括1,即可认为该,即可认为该OR在在0.05的水平上有的水平上有 统计学意义。统计学意义。 )(lnORVar )/.( 2 9611 ORCI 95%OR 48 结果表明吸烟者患食管癌的危险性是不吸烟者的结果表明吸烟者患食管癌的危险性是不吸烟者的 2.87倍倍,OR的的95%置信置信范围是在范围是在2.183.78之间。之间。 87.2 126208 243309 bc ad OR )78. 3 ,18. 2( 2 /96. 11 )( OR (3)研究因素与疾病的关联强度评价研究因素与疾病的关联强度

32、评价 l匹配资料是由病例与对照结合成对子,分析时不应把对匹配资料是由病例与对照结合成对子,分析时不应把对 子拆开分析。子拆开分析。 a a、b b、c c、d d分别代表病例和对照不同暴露情况的对子数分别代表病例和对照不同暴露情况的对子数 l1:11:1配对资料的分析配对资料的分析 (1) 50 cb 2 2 ) c-b( cb cb 2 2 ) 1( b c OR (2) (3) )/.( 2 9611 ORCI 95%OR 51 2=(|b-c|-1)2/(b+c) 2=11.28, OR=4.33 表明男性吸烟者患食管癌的危险性是不吸烟者的表明男性吸烟者患食管癌的危险性是不吸烟者的4.3

33、倍倍 OR 95%CI= H0:吸烟与食管癌无统计学关联 H1:吸烟与食管癌有统计学关联 18.10,84. 133. 4 28.11 96. 1 1 1 2 z OR l分级暴露资料分析分级暴露资料分析 分析暴露与疾病的剂量反应关系分析暴露与疾病的剂量反应关系 根据暴露因素的分级将资料归纳成列联表根据暴露因素的分级将资料归纳成列联表 对列联表数据进行卡方检验对列联表数据进行卡方检验 以最低暴露水平为参照,计算出各暴露水平的以最低暴露水平为参照,计算出各暴露水平的OR 卡方趋势检验卡方趋势检验 暴露分级暴露分级 合计合计 01234 病例病例a0=ca1a2a3a4n1 对照对照b0=db1b

34、2b3b4n0 男性每日吸烟的支数与肺癌关系男性每日吸烟的支数与肺癌关系 卡方卡方检验检验(RC):): 2=43.15, =3, P0.001 说明吸烟量按吸烟水平分级后,组间差别有统计学意义。说明吸烟量按吸烟水平分级后,组间差别有统计学意义。 各暴露分级的各暴露分级的OR: 以不吸烟为以不吸烟为参照参照。OR1=8.10, OR2=11.52, OR3=17.93 OR随吸烟剂量的增加而递增。随吸烟剂量的增加而递增。 卡方趋势检验:卡方趋势检验: 2=40.01, =1,P0.001 剂量反应趋势具有统计学剂量反应趋势具有统计学意义,说明吸烟与男性肺癌之间存在剂量意义,说明吸烟与男性肺癌之

35、间存在剂量 -反应关系。反应关系。 54 l 病例对照研究中偏倚的种类病例对照研究中偏倚的种类 l 偏倚的控制偏倚的控制 第五节第五节 常见偏倚及其控制常见偏倚及其控制 55 1.1.选择偏倚选择偏倚(selection bias) 选入的研究对象与未选入的研究对象在某些特征上选入的研究对象与未选入的研究对象在某些特征上 存在差异而引起的误差(存在差异而引起的误差(选择的研究对象不能代表选择的研究对象不能代表 总体人群总体人群)。)。 最常见偏倚最常见偏倚 入院率偏倚入院率偏倚 现患病例现患病例- -新发病例偏倚新发病例偏倚 检出症候偏倚检出症候偏倚 l病例对照研究中常见偏倚的种类病例对照研究

36、中常见偏倚的种类 无应答偏倚无应答偏倚 时间效应偏倚时间效应偏倚 56 入院率入院率偏倚(偏倚(BerksonBerkson bias) bias) 常见于医院基础的病例对照常见于医院基础的病例对照 研究。当研究。当利用医院的病例利用医院的病例( (门诊或住院病例门诊或住院病例) )作为研究对象作为研究对象 时,由于疾病在不同医院入院率的不同而导致的偏倚,称时,由于疾病在不同医院入院率的不同而导致的偏倚,称 入院率偏倚。入院率偏倚。 不同不同医院技术专长、患者所患疾病的严重程度、经济状况医院技术专长、患者所患疾病的严重程度、经济状况 等不同,患者对医院具有选择性,医院对患者亦具有等不同,患者对

37、医院具有选择性,医院对患者亦具有选择选择 性。暴露和疾病影响研究对象的选择导致倾向性入院率差性。暴露和疾病影响研究对象的选择导致倾向性入院率差 异。异。 本质:病例或对照的不能够代表总体。本质:病例或对照的不能够代表总体。 控制:多家医院的病例来源;多个对照组。控制:多家医院的病例来源;多个对照组。 57 检出症候偏倚检出症候偏倚(detection signal bias)、暴露偏倚、暴露偏倚 f1975年年Ziel研究妇女服用复方雌激素研究妇女服用复方雌激素-子宫内膜癌子宫内膜癌 f妇女服用复方雌激素导致阴道出血,就医后检出子宫内妇女服用复方雌激素导致阴道出血,就医后检出子宫内 膜癌。用这

38、种病例研究时,得出:雌激素与子宫内膜癌有膜癌。用这种病例研究时,得出:雌激素与子宫内膜癌有 关。关。 f实际情况是,病例即使不服用雌激素,若接受检查,也实际情况是,病例即使不服用雌激素,若接受检查,也 可能被检出子宫内膜癌。可能被检出子宫内膜癌。 f服用复方雌激素加快其被检出的可能性。服用复方雌激素加快其被检出的可能性。 58 作者作者就此进行深入调查,结果发现服用复方雌就此进行深入调查,结果发现服用复方雌 激素的病例中有激素的病例中有79%为第一期病例,而未服用复为第一期病例,而未服用复 方雌激素病例中,只有方雌激素病例中,只有58%为第一期病例;病例为第一期病例;病例 组由非同质人群组成组

39、由非同质人群组成。 本质:病例的代表性问题本质:病例的代表性问题 控制:延长收集病例的时间,使其超过由早期向控制:延长收集病例的时间,使其超过由早期向 中晚期过渡的时间,则检出病例中的暴露者比例中晚期过渡的时间,则检出病例中的暴露者比例 接近一般病例。接近一般病例。 59 现患病现患病例例- -新新发病例偏倚发病例偏倚( (prevelenceprevelence- - incidence bias)incidence bias)、NeymanNeyman bias bias d由于现患病例和新病例在某些特征或行为上的差异,造成研由于现患病例和新病例在某些特征或行为上的差异,造成研 究结果的偏

40、倚。究结果的偏倚。 d以现患病例为对象,收集到的信息可能只与存活有关,而与以现患病例为对象,收集到的信息可能只与存活有关,而与 研究的暴露因素无关;幸存者研究的暴露因素无关;幸存者可能改变以往的生活习惯,即可能改变以往的生活习惯,即 降低或增加某研究因素的暴露水平。降低或增加某研究因素的暴露水平。 d调查者得到疾病与暴露之间的虚假联系调查者得到疾病与暴露之间的虚假联系。 d控制:尽量选择新病例;增加新老病例比较分析;对暴露强控制:尽量选择新病例;增加新老病例比较分析;对暴露强 度度-时间与结局进行分析时间与结局进行分析 60 无应答偏倚无应答偏倚(non-response bias) 无无应答

41、是流行病学研究中常见问题。研究者应应答是流行病学研究中常见问题。研究者应 尽可能对确定的研究对象一个不漏地予以调查,尽可能对确定的研究对象一个不漏地予以调查, 无应答可造成偏倚。无应答可造成偏倚。 如儿童意外伤害的病例对照研究。如儿童意外伤害的病例对照研究。 控制:尽量取得调查对象的合作。控制:尽量取得调查对象的合作。 61 时间效应偏倚时间效应偏倚 慢性病由于潜隐期长,当病例与对照判断标慢性病由于潜隐期长,当病例与对照判断标 准不明确,或划分界限有缺陷,则具有早期症状准不明确,或划分界限有缺陷,则具有早期症状 者可能被选入对照组,或把一些轻型、非典型病者可能被选入对照组,或把一些轻型、非典型

42、病 人误划入对照组,则会引发此种偏倚,掩盖暴露人误划入对照组,则会引发此种偏倚,掩盖暴露 与疾病的真正关联。与疾病的真正关联。 控制控制:采用准确可靠、标准化的诊断标准并:采用准确可靠、标准化的诊断标准并 严格遵守,或延长观察期,可以抵消此类偏倚。严格遵守,或延长观察期,可以抵消此类偏倚。 62 回忆回忆偏倚偏倚: 回忆既往暴露情况时准确性和系统性存在的系回忆既往暴露情况时准确性和系统性存在的系 统误差统误差; 与与调查时间和发病时间间隔、被调查者构成及询调查时间和发病时间间隔、被调查者构成及询 问技术等有关。问技术等有关。 控制控制:选择不易忘记的重要指标做调查,并重视问卷调查:选择不易忘记

43、的重要指标做调查,并重视问卷调查 技术,有助于减少回忆偏倚。技术,有助于减少回忆偏倚。 值得值得注意的是,即使注意的是,即使应用相同调查方法应用相同调查方法,两组回忆误差可,两组回忆误差可 能不一致,病例组可能记忆清楚,但也可能夸大暴露信息;能不一致,病例组可能记忆清楚,但也可能夸大暴露信息; 对照组则相反。对照组则相反。 2. 2. 信息信息偏倚偏倚 63 调查偏倚调查偏倚( (疑诊偏倚疑诊偏倚) ) 调查调查环境不同或调查质量不高可造成偏倚。如两组收集环境不同或调查质量不高可造成偏倚。如两组收集 数据的方法(询问重点和方式)不同;调查时间、地点有差数据的方法(询问重点和方式)不同;调查时间

44、、地点有差 别。调查员对项目理解及掌握标准不一致、态度不认真等,别。调查员对项目理解及掌握标准不一致、态度不认真等, 均可造成偏倚均可造成偏倚。 控制控制:尽量采用客观指标,做好质量控制:优化调查表、:尽量采用客观指标,做好质量控制:优化调查表、 统一标准、培训调查员、核查调查结果,采用盲法等。统一标准、培训调查员、核查调查结果,采用盲法等。 64 在评价暴露因素与疾病之间的关联时,由于在评价暴露因素与疾病之间的关联时,由于 一个或多个既与暴露因素有关,同时与研究疾病一个或多个既与暴露因素有关,同时与研究疾病 有关的外来因素存在,使得暴露因素的效应和外有关的外来因素存在,使得暴露因素的效应和外

45、 来因素的效应混在一起,从而歪曲了暴露因素与来因素的效应混在一起,从而歪曲了暴露因素与 疾病的关联性。此外来因素即为疾病的关联性。此外来因素即为混杂因素混杂因素。这种。这种 歪曲联系真实性的偏倚称为歪曲联系真实性的偏倚称为混杂偏倚混杂偏倚。 3.3.混杂混杂偏倚偏倚 65 混杂因素的基本特征(判断混杂因素的基本条件):混杂因素的基本特征(判断混杂因素的基本条件): (1 1)混杂)混杂因素与研究因素与研究疾病有关疾病有关 (2 2)混杂)混杂因素与研究因素与研究因素有关因素有关 (3 3)混杂因素不是研究因素)混杂因素不是研究因素与疾病与疾病因果链上的中间环节因果链上的中间环节。 混杂因素导致

46、混杂偏倚的条件混杂因素导致混杂偏倚的条件:混杂混杂因素在因素在各组各组分布不均。分布不均。 混杂偏倚类型:混杂偏倚类型: 正正混杂偏倚:夸大暴露与疾病的关联混杂偏倚:夸大暴露与疾病的关联 负负混杂偏倚:减弱暴露与疾病的混杂偏倚:减弱暴露与疾病的关联关联 66 流行病学研究中,发现统计学意义上的联系,在流行病学研究中,发现统计学意义上的联系,在 进行病因学推论前,进行病因学推论前,必须首先排除潜在混杂因素必须首先排除潜在混杂因素 的作用,估计和调整混杂偏倚的影响。的作用,估计和调整混杂偏倚的影响。 67 混杂偏倚的识别混杂偏倚的识别 根据专业知识提出可能的混杂因素根据专业知识提出可能的混杂因素:

47、人口统计学:人口统计学 指标;研究因素以外的其他危险因素;指标;研究因素以外的其他危险因素; 利用分层分析进行判断。利用分层分析进行判断。 混杂因素作用混杂因素作用的控制的控制 配比法配比法 ( (设计阶段设计阶段) ) 限制(设计阶段)限制(设计阶段) 随机化分组(实验流行病学)随机化分组(实验流行病学) 分层分析分层分析 (资料分析阶段)(资料分析阶段) 多因素分析(资料分析阶段)多因素分析(资料分析阶段) 标准化分析(资料分析阶段)标准化分析(资料分析阶段) 统计调整统计调整 68 非个体匹配分层资料非个体匹配分层资料 分层分析是按照某种特征(如年龄、性别等)把研究人群分分层分析是按照某

48、种特征(如年龄、性别等)把研究人群分 为不同的层次,然后分别分析各层中暴露与疾病的关联。为不同的层次,然后分别分析各层中暴露与疾病的关联。 评价分层因素本身作用及其与暴露之间关系评价分层因素本身作用及其与暴露之间关系 评价分层因素与暴露因素在疾病中的交互作用评价分层因素与暴露因素在疾病中的交互作用 识别混杂因素,控制混杂,同时提高检验效率。识别混杂因素,控制混杂,同时提高检验效率。 帮助正确设计多因素模型帮助正确设计多因素模型 研究吸烟与食管癌的关系,考虑饮酒为研究吸烟与食管癌的关系,考虑饮酒为混杂因素混杂因素,如何如何 进一步分析?进一步分析? 吸烟吸烟 食管癌食管癌 饮酒饮酒 69 分层分

49、析识别和控制混杂偏倚的步骤:分层分析识别和控制混杂偏倚的步骤: (1)按可能的混杂因素分层,每层整理一个四格表,计算每按可能的混杂因素分层,每层整理一个四格表,计算每 层的卡方和层的卡方和OROR值;值; (2)判断分层因素是否为混杂因素)判断分层因素是否为混杂因素(三个基本条件)(三个基本条件) (3)如果两层如果两层OROR值接近(同质,混杂作用),计算合并卡方值接近(同质,混杂作用),计算合并卡方 值,合并值,合并OROR值值(ORMH)及及95% CI95% CI; 如果两层不同质如果两层不同质( (交互作用),不能合并,分别报告;交互作用),不能合并,分别报告; 70 l 按饮酒与否

50、分层按饮酒与否分层 计算计算OROR值值 饮酒者中吸烟的饮酒者中吸烟的OR(2.98)OR(2.98)稍高于不分层稍高于不分层OR(2.87) OR(2.87) 不饮酒者中吸烟的不饮酒者中吸烟的OR(1.67)OR(1.67)却低得很多却低得很多 吸烟与吸烟与食管癌的关系列表计算食管癌的关系列表计算 2=56.6 P齐性检验。齐性检验。 l 进行齐性检验进行齐性检验 (层别效应的一致性假设与检验)(层别效应的一致性假设与检验) 齐性检验齐性检验 合并合并 与 与OROR值值 OROR值无明显差别,则饮酒产生混杂作用值无明显差别,则饮酒产生混杂作用 合并合并OROR值值 OROR值有显著差异,则

51、饮酒与吸烟存在交互值有显著差异,则饮酒与吸烟存在交互 合并合并OROR值值 本例齐性检验无显著差异(本例齐性检验无显著差异( 2 =3.38),计算合并),计算合并OROR与与2 72 l 计算合并计算合并OROR与与2值值 公式(公式(M-HM-H法):法): 2 i ii 2 HM )V(a 5.0)(Eaa ) N cb ( ) N da ( OR i ii i ii HM 73 74.34 21.45 5 . 07 .268309 2 2 hm 42. 2 ) 300 57 63) 586 151 63( ) 300 136 44() 586 107 265( HM OR =37.74

52、 =2.42 经经饮酒分层调整后,吸烟的饮酒分层调整后,吸烟的2与与OR(即合并(即合并2与合并与合并OR) 虽较未调整的虽较未调整的2 (56.6)与与OR(2.87)为低,但仍有一定强度与为低,但仍有一定强度与 统计学上的显著性。统计学上的显著性。 吸烟吸烟与食管癌之间有显著的与食管癌之间有显著的关联。关联。 饮酒饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟的作是吸烟与食管癌之间的混杂因素,似能加强吸烟的作 用用 2 2 MH 表表5-8 5-8 分层计算结果整理表分层计算结果整理表 74 偏偏 倚倚控制措施控制措施 1.1.选择偏倚选择偏倚选入者与未选入者某些特征上选入者与未选入者某些特征上 存在差异引起(入院率偏倚、现患存在差异引起(入院率偏倚、现患- -新发病例新发病例 偏倚、检出征候偏倚、时间效应偏倚)偏倚、检出征候偏倚、时间效应偏倚) 尽量合理地选择病例与对照尽量合理地选择病例与对照 2.2.信息偏倚信息偏倚收集信息时由于测量及获得数收

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论