流行病学调查资料分析时的质量控制_第1页
流行病学调查资料分析时的质量控制_第2页
流行病学调查资料分析时的质量控制_第3页
流行病学调查资料分析时的质量控制_第4页
流行病学调查资料分析时的质量控制_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、王 辉 公共卫生学院流行病与卫生统计学系流行病学调查资料分析时的质量控制主要内容容:数据录入入常用软软件常用研究究设计的的统计学学分析思思路、方方法和指指标偏倚的测测量决定验证假设所需的资料为得到所需资料,设计调查表和资料整理表收集资料数据录入和整理资料描述性分析:病例计数、频数分布、构成比、率联系的测定:四格表、显著性检验、可信区间计算分层分析:评价混杂因素和效应修正作用必要时作多因素分析必要时进一步深入分析合理解释结果 , 评价因果关系产生假设流行病学学调查资资料分析析步骤流行病学学资料录录入和分分析常用用软件资料的整整理规定变量量的取值值方法如:男性性1,女性2,缺失9录入资料料时有章章

2、可循,正确地地处理不不可接受受数值审查 可与录入入同步(Epidata)质量控制制:范围核对对逻辑核对对及时纠正正数据错错误不能因调调查结果果不在取取值范围围而将数数据随意意改动现场审查查,列出出病例一一览表数据录入入和管理理常见软软件面对所收收集的大大量的原原始资料料,研究究者必须须对原始始资料建建立数据据库、录录入数据据,并保保证数据据能真实实反映资资料所收收集的信信息,因因此这些些工作都都需要数数据管理理软件来实现。各种软件件操作方方式不同同,个人人使用习习惯不同同,因人人而异选选择不同同的软件件。EpiData建立数据据库数据录入入数据库管管理数据库输输出与输输入数据统计计分析当数据录

3、录入和管管理软件件把所有有收集的的流行病病学信息息资料进进行整理理后,就就进入流流行病学学研究的的另外一一个重要要环节,即对资资料进行行分析处处理,并并对分析析结果做做出符合合专业领领域的合合理解释释。资料分析析策略的的制定为实际资资料分析析提供纲纲领和指指南草拟资料料整理表表又称预期期分析表表(一系列)可按逻辑辑顺序可由简单到到复杂可由描述到分析资料整理理表资料描述述整理表表1类:临临床特征征描述2类:三三间分布布描述分析性研研究整理理表3类:22表表(因素和和疾病之之间联系系的基本本表)4类:分分层分析析表(混混杂因素素、效应应修正)5类:剂剂量反应应关系6类:配配比病例例对照研研究整理表

4、举举例Kawasaki综合征调调查资料料整理表表整理表A川崎病临临床症状状频数分分布整理表B川崎病严严重并发发症病人人频数分分布整理表C川崎病病病例特征征整理表D川崎病病病人家庭庭收入整理表E川崎病病病例地区区分布整理表F川崎病病病例发病病时间分分布整理表G川崎病与与既往病病史关系系的病例例对照研研究整理表H川崎病与与地毯清清洁剂关关系的病病例对照照研究整理表I川崎病与与家庭收收入关系系的病例例对照研研究一、描述述性研究究描述性研究究现况研究究(横断面面研究)生态学研研究历史常规规资料的的收集和和分析随访监测测研究现况研究究又称横断断面研究究(cross-sectionalstudy),根据研

5、研究的人人群范围围或调查查方式不不同可分分为:普查抽样调查查个案调查查追踪调查查公共卫生生监测(一)普普查数据据统计分分析思路路和方法法1统计计应调查查人数、实际调调查人数数,描述述漏查率率和应答答率。2描述述调查对对象的社社会人口口学特征征,如性性别、年年龄、民民族等基基本构成成。计数数资料采采用构成成比(百百分比)描述,计量资资料采用用均数标准差差描述。3统计计调查人人群的总总体指标标,根据据数据类类型,分分别描述述总体的的患病率率、感染染率等频频率指标标,或总总体计量量数据的的集中和和离散趋趋势指标标(均数数标准准差、百百分位数数等)。4按社社会人口口学特征征或暴露露与否分分组,统统计、

6、描描述疾病病和健康康状态相相关频率率指标;或按疾疾病有无无描述暴暴露的构构成比;并进行行分层和和对比分分析。(二)抽样样调查数数据统计计分析思思路和方方法统计分析析步骤:1.一一般描述述2.统统计描述述3.关关联分析析1一般般描述包括抽样样方法、设计样样本量、调查样样本量、应答率率和样本本人群的的社会人人口学特特征等。(二)抽样样调查数数据统计计分析思思路和方方法2统计计描述(1)计计算有关关统计指指标,包包括患病病率、感感染率、暴露率率等频率率指标及及其95%的可可信区间间,计量量资料的的均数、标准差差或百分分位数等等。(2)结结合频率率指标,通过图图表或文文字,按按时间、地区和和人群描描述

7、疾病病或健康康状态的的分布。可先按按某个因因素分层层描述,再按多多个因素素综合描描述,如如按时间间地区区、地区区人群群、时间间人群群等不同同分层方方法进行行描述。(二)抽样样调查数数据统计计分析思思路和方方法3关联联分析对暴露和和疾病的的关系可可作初步步的关联联分析,如:计量资料料的比较较采用t检验或或方差分分析(ANOVA)率的比较较采用2检验或u检验。也可选择择适当的的自变量量和因变变量进行行多因素素分析,多重线性性回归分分析或Logistic回回归分析析。(三)生生态学研研究数据据统计分分析思路路和方法法通常采用用比较、分析等等常用的的统计学学处理技技术。在在描述研研究因素素与疾病病或健

8、康康状况的的关系时时,通常常以图示示法直观观表述。驱虫药与与脑炎的的因果关关系(三)生生态学研研究数据据统计分分析思路路和方法法多组比较较资料的的分析,则包括括:1直线线回归分分析将各群体体研究因因素的平平均暴露露水平作作为自变变量,以以疾病的的频率作作为应变变量,通通过计算算生态学学相关系系数和回回归系数数,进行行相关回回归分析析。由于于在生态态学研究究中,一一般可获获得发病病率,故故可计算算。2危险险度分析析计算相对对危险度度、归因因危险度度和人群群归因危危险度百百分比。二、分分析性研研究(一)病病例对照照研究数数据统计计分析思思路和方方法描述性分分析推断性分分析1描述述性分析析(1)一一

9、般性描描述首先描述述病例和和对照的的来源、样本例例数、匹匹配比例例等,然然后描述述研究对对象的一一般特征征,如性性别、年年龄、职职业、出出生地、居住地地、疾病病类型等等。1描述述性分析析(2)均均衡性检检验比较病例例组与对对照组研研究因素素以外的的某些特特征构成成是否齐齐同,检检验其可可比性。计量指标标的比较较(如两两组平均均年龄的的比较)可采用用t检验验、ANOVA;计数指标标的比较较(如两两组性别别构成比比较)可可采用2检验。对有统计计学显著著差异的的因素,在分析析时应考考虑它对对主要关关联因素素的影响响。2推断断性分析析(1)成成组设计计病例对对照研究究资料的的分析比较病例例组和对对照组

10、之之间研究究因素暴暴露比例例的差异异,推断断暴露和和疾病之之间是否否存在统统计学关关联(2检验),计算关关联强度度(OR)及其其95的可信信区间。病例对照照研究的资资料整理理表2推断断性分析析(2)成成组设计计分层资资料的分分析分层分析析是把研研究人群群(暴露露与未暴暴露人群群或者病病例与对对照)根根据某些些特征和和因素分分为不同同层(如如按性别别分为两两层),然后分分别分析析各层中中暴露与与疾病的的关联。2推断断性分析析(2)成成组设计计分层资资料的分分析如果各层层OR值值接近,异质性性检验无无统计学学意义,则可通通过Mantal-haenszel方法法计算2MH,并计算算控制混混杂因素素(

11、分层层因素)影响后后暴露和和疾病之之间真实实的关联联强度ORMH及其95可信信区间。表57按年龄分分层计计算OR值两层的OR均较不分分层的OR(2.20)大。进一步分分析年年龄对MI的关系按OC与MI的关系列列表计算算2=7.70,RR=2.20可见OC与MI有联系2推断断性分析析(2)成成组设计计分层资资料的分分析如果各层层OR值值相差较较大,异异质性检检验有统统计学意意义,则则不宜采采用Mantal-haenszel方法法合并,可通过过计算标标准化死死亡比(standardmortality ratio,SMR)或或标准化化率比(standardrateratio,SRR),评价价控制混混

12、杂因素素影响后后暴露和和疾病的的真实关关联强度度(具体体原理和和计算方方法参见见相关专专业书籍籍)2推断断性分析析(3)成成组设计计分级暴暴露资料料的分析析若能获得得某暴露露因素在在不同暴暴露水平平的资料料,计算算不同暴暴露等级级的OR值,并并作趋势势性2检验,分分析疾病病和暴露露的剂量量反应关关系(dose-response relationship),以增加加因果关关系推断断的依据据。2推断断性分析析(4)1:1配配对和1:M配配比设计计资料的的分析1:1配配对和1:M配配比设计计病例对对照研究究资料的的分析方方法与成成组设计计资料的的分析方方法不同同。2推断断性分析析(5)多多因素分分析

13、在病例对对照研究究中往往往需要同同时研究究多个因因素的作作用,如如果仅应应用一般般分层分分析方法法同时对对若干因因素加以以控制,计算复复杂且受受样本量量的限制制。随着着多因素素分析软软件的出出现,可可比较容容易地分分析多个个因素与与疾病的的联系、联系程程度以及及各因素素之间的的相互关关系。目目前经常常使用的的有条件件和非条条件Logistic回归模模型。2推断断性分析析(6)交交互作用用与效应应修饰的的分析交互作用用主要表表现为暴暴露与疾疾病的联联系由于于受某个个因素的的作用而而改变,这因素素称为效应修饰饰因素(effect modifier),其所产产生的影影响为效应修饰饰(effectmo

14、dification)。2推断断性分析析(6)交交互作用用与效应应修饰的的分析在病例对对照研究究中,评评价交互互作用最最常用的的方法是是按某一一因素分分层后,再看各各层的OR是否否相同,一般需需检验各各层OR是否同同质。通常可以以用多元元回归分分析的方方法来评评价交互互作用,如果某某个代表表交互作作用的回回归系数数具有显显著性,就认为为该系数数所代表表的几个个因素之之间存在在交互作作用。常用的有有Logistic回归归、Cox模模型和对数直线线模型等。(二)队队列研究究数据统统计分析析思路和和过程1.描述性分分析2.推推断性分分析3.标标化比的的计算1.描述性分分析(1)一一般性描描述描述研究

15、究对象的的组成、社会人人口学特特征、随随访经过过、随访访时间、结局的的发生和和失访情情况等。1.描述性分分析(2)均均衡性检检验比较各组组研究因因素以外外的某些些特征构构成是否否齐同,检验其其可比性性;对各各组的失失访率也也要进行行比较。计量指标标的比较较采用t检验、ANOVA;计数指标标的比较较采用2检验或u检验。对差异有有统计学学意义的的因素,在分析析时应考考虑它对对暴露和和疾病关关系的影影响。1.描述性分分析(3)队队列发病病率或死死亡率的的计算根据研究究人群的的稳定程程度,队队列通常常分为固固定队列列(fixed cohort)和和开放队队列(open cohort),两种队队列人群群

16、发病率率或死亡亡率的计计算指标标不同。但通常常都要计计算累计计发病率率或发病病密度。2.推推断性分分析比较暴露露组和对对照组(或多组组)之间间发病率率或死亡亡率的差差异,推推断暴露露和疾病病之间是是否存在在统计学学关联。符合正态态分布或或近似状状态分布布,可进进行两个个率差别别的u检检验;样本较小小、发病病率较低低时,可可用直接接概率法法、二项项分布或或Poisson分布布检验;样本稍大大和发病病率稍大大时,可可用四格格表2检验。队列研究的资资料整理理表2.推推断性分分析再分组或或分层计计算关联联强度相对危危险度(relativerisk,RR)和和95的可信信区间,以及危危险度指指标。危危险

17、度指指标包括括:归因危险险度(AR)归因危险险度百分分比(ARP)人群归因因危险度度(PAR)人群归因因危险度度百分比比(PARP)3.标标化比的的计算当研究对对象人数数较少或或死亡(发病)率较低低时不宜宜计算率率,此时时可以全全人口的的死亡(发病)率作为为标准,计算该该观察人人群的预预期死亡亡(发病病)人数数,然后后计算实实际死亡亡(发病病)数与与预期数数之比,即为标化死亡亡(发病病)比(standardized mortalityratio,SMR)3.标标化比的的计算当未能获获得人群群历年的的人口资资料,而而仅有死死亡人数数、日期期和年龄龄,则可可计算标化比例例死亡比比(standard

18、izedproportionalmortality ratio,SPMR),即以全全人口中中某病因因死亡占占全死因因死亡的的比例乘乘以该人人群实际际死亡数数而获得得预期死死亡数,然后计计算实际际死亡(发病)数与预预期数之之比。3.标标化比的的计算SMR、SPMR和RR一样样都是用用来评价价暴露和和疾病的的关联强强度,是是否具有有统计学学意义,需作显显著性检检验:当期望死死亡数不不太小(10)时,采用u检验验或2检验当期望死死亡数小小于10时,可可查Possion分分布总体体可信区区间表判判定。4.剂剂量反应应关系分分析剂量反应应关系反反映暴露露与疾病病间的共共变关系系,即暴暴露剂量量越大,其效应应越大,则该暴暴露作为为病因的的可能性性越大。计算各各暴露等等级时的的发病率率,计算算关联强强度(RR和A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论