流行病学调查资料时的质量控制_第1页
流行病学调查资料时的质量控制_第2页
流行病学调查资料时的质量控制_第3页
流行病学调查资料时的质量控制_第4页
流行病学调查资料时的质量控制_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

王辉

公共卫生学院流行病与卫生统计学系流行病学调查资料分析时的

质量控制主要内容:数据录入常用软件常用研究设计的统计学分析思路、方法和指标偏倚的测量决定验证假设所需的资料为得到所需资料,设计调查表和资料整理表收集资料数据录入和整理资料描述性分析:病例计数、频数分布、构成比、率联系的测定:四格表、显著性检验、可信区间计算分层分析:评价混杂因素和效应修正作用必要时作多因素分析必要时进一步深入分析合理解释结果,评价因果关系产生假设流行病学调查资料分析步骤流行病学资料录入和分析常用软件资料的整理

规定变量的取值方法如:男性=1,女性=2,缺失=9录入资料时有章可循,正确地处理不可接受数值审查

可与录入同步(Epidata)质量控制:范围核对逻辑核对

及时纠正数据错误不能因调查结果不在取值范围而将数据随意改动现场审查,列出病例一览表数据录入和管理常见软件面对所收集的大量的原始资料,研究者必须对原始资料建立数据库、录入数据,并保证数据能真实反映资料所收集的信息,因此这些工作都需要数据管理软件来实现。各种软件操作方式不同,个人使用习惯不同,因人而异选择不同的软件。EpiData建立数据库数据录入数据库管理数据库输出与输入数据统计分析当数据录入和管理软件把所有收集的流行病学信息资料进行整理后,就进入流行病学研究的另外一个重要环节,即对资料进行分析处理,并对分析结果做出符合专业领域的合理解释。资料分析策略的制定

为实际资料分析提供纲领和指南草拟资料整理表又称预期分析表(一系列)可按逻辑顺序可由简单到复杂可由描述到分析资料整理表表资料描述整整理表1类:临床床特征描述述2类:三间间分布描述述分析性研究究整理表3类:2××2表(因素和疾疾病之间联联系的基本本表)4类:分层层分析表(混杂因素素、效应修修正)5类:剂量量反应关系系6类:配比比病例对照照研究整理表举例例Kawasaki综合征调查查资料整理理表整理表A川川崎病临临床症状频频数分布整理表B川川崎病严重重并发症病病人频数分分布整理表C川川崎病病病例特征整理表D川川崎病病病人家庭收收入整理表E川川崎病病病例地区分分布整理表F川川崎病病病例发病时时间分布整理表G川川崎崎病与既往往病史关系系的病例对对照研究整理表H川川崎病病与地毯清清洁剂关系系的病例对对照研究整理表I川川崎病一、描述性性研究描述性研究现况研究(横断面研研究)生态学研究究历史常规资资料的收集集和分析随访监测研研究现况研究又称横断面面研究(cross-sectionalstudy),根据据研究的人人群范围或或调查方式式不同可分分为:普查抽样调查个案调查追踪调查公共卫生监监测(一)普查查数据统计计分析思路路和方法1.统计应应调查人数数、实际调调查人数,,描述漏查查率和应答答率。2.描述调调查对象的的社会人口口学特征,,如性别、、年龄、民民族等基本本构成。计计数资料采采用构成比比(百分比比)描述,,计量资料料采用均数数±标准差差描述。3.统计调调查人群的的总体指标标,根据数数据类型,,分别描述述总体的患患病率、感感染率等频频率指标,,或总体计计量数据的的集中和离离散趋势指指标(均数数±标准差差、百分位位数等)。。4.按社会会人口学特特征或暴露露与否分组组,统计、、描述疾病病和健康状状态相关频频率指标;;或按疾病病有无描述述暴露的构构成比;并并进行分层层和对比分分析。(二)抽样调调查数据统统计分析思思路和方法法统计分析步步骤:1.一般般描述2.统计计描述3.关联联分析1.一般描描述包括抽样方方法、设计计样本量、、调查样本本量、应答答率和样本本人群的社社会人口学学特征等。。(二)抽样调调查数据统统计分析思思路和方法法2.统计描描述(1)计算算有关统计计指标,包包括患病率率、感染率率、暴露率率等频率指指标及其95%的可可信区间,,计量资料料的均数、、标准差或或百分位数数等。(2)结合合频率指标标,通过图图表或文字字,按时间间、地区和和人群描述述疾病或健健康状态的的分布。可可先按某个个因素分层层描述,再再按多个因因素综合描描述,如按按时间-地地区、地区区-人群、、时间-人人群等不同同分层方法法进行描述述。(二)抽样调调查数据统统计分析思思路和方法法3.关联分分析对暴露和疾疾病的关系系可作初步步的关联分分析,如:计量资料的的比较采用用t检验或或方差分析析(ANOVA)率的比较采采用χ2检验或u检检验。也可选择适适当的自变变量和因变变量进行多多因素分析析,多重线性回回归分析或Logistic回归分析析。(三)生态态学研究数数据统计分分析思路和和方法通常采用比比较、分析析等常用的的统计学处处理技术。。在描述研研究因素与与疾病或健健康状况的的关系时,,通常以图图示法直观观表述。驱虫药与脑脑炎的因果果关系(三)生态态学研究数数据统计分分析思路和和方法多组比较资资料的分析析,则包括括:1.直线回回归分析将各群体研研究因素的的平均暴露露水平作为为自变量,,以疾病的的频率作为为应变量,,通过计算算生态学相相关系数和和回归系数数,进行相相关回归分分析。由于于在生态学学研究中,,一般可获获得发病率率,故可计计算。2.危险度度分析计算相对危危险度、归归因危险度度和人群归归因危险度度百分比。。二、分析析性研究(一)病例例对照研究究数据统计计分析思路路和方法描述性分析析推断性分析析1.描述性性分析(1)一般般性描述首先描述病病例和对照照的来源、、样本例数数、匹配比比例等,然然后描述研研究对象的的一般特征征,如性别别、年龄、、职业、出出生地、居居住地、疾疾病类型等等。1..描描述述性性分分析析(2))均均衡衡性性检检验验比较较病病例例组组与与对对照照组组研研究究因因素素以以外外的的某某些些特特征征构构成成是是否否齐齐同同,,检检验验其其可可比比性性。。计量量指指标标的的比比较较((如如两两组组平平均均年年龄龄的的比比较较))可可采采用用t检检验验、、ANOVA;;计数数指指标标的的比比较较((如如两两组组性性别别构构成成比比较较))可可采采用用χχ2检验验。。对有有统统计计学学显显著著差差异异的的因因素素,,在在分分析析时时应应考考虑虑它它对对主主要要关关联联因因素素的的影影响响。。2..推推断断性性分分析析(1))成成组组设设计计病病例例对对照照研研究究资资料料的的分分析析比较较病病例例组组和和对对照照组组之之间间研研究究因因素素暴暴露露比比例例的的差差异异,,推推断断暴暴露露和和疾疾病病之之间间是是否否存存在在统统计计学学关关联联((χχ2检验验)),,计计算算关关联联强强度度((OR))及及其其95%%的的可可信信区区间间。。病例例对对照照研究究的的资资料料整整理理表表2..推推断断性性分分析析(2))成成组组设设计计分分层层资资料料的的分分析析分层层分分析析是是把把研研究究人人群群((暴暴露露与与未未暴暴露露人人群群或或者者病病例例与与对对照照))根根据据某某些些特特征征和和因因素素分分为为不不同同层层((如如按按性性别别分分为为两两层层)),,然然后后分分别别分分析析各各层层中中暴暴露露与与疾疾病病的的关关联联。。2..推推断断性性分分析析(2))成成组组设设计计分分层层资资料料的的分分析析如果果各各层层OR值值接接近近,,异异质质性性检检验验无无统统计计学学意意义义,,则则可可通通过过Mantal-haenszel方方法法计计算算χχ2MH,并并计计算算控控制制混混杂杂因因素素((分分层层因因素素))影影响响后后暴暴露露和和疾疾病病之之间间真真实实的的关关联联强强度度ORMH及其其95%%可可信信区区间间。表5-7按年年龄龄分分层层计计算算OR值两层层的的OR均较较不不分分层层的的OR(2.20)大。。进一一步步分分析析年年龄龄对对MI的关关系系按OC与MI的关关系系列列表表计计算算χ2=7.70,RR=2.20可见见OC与MI有联联系系2..推推断断性性分分析析(2))成成组组设设计计分分层层资资料料的的分分析析如果果各各层层OR值值相相差差较较大大,,异异质质性性检检验验有有统统计计学学意意义义,,则则不不宜宜采采用用Mantal-haenszel方方法法合合并并,,可可通通过过计计算算标标准准化化死死亡亡比比((standardmortalityratio,,SMR))或或标标准准化化率率比比((standardrateratio,,SRR)),,评评价价控控制制混混杂杂因因素素影影响响后后暴暴露露和和疾疾病病的的真真实实关关联联强强度度((具具体体原原理理和和计计算算方方法法参参见见相相关关专专业业书书籍籍))2..推推断断性性分分析析(3))成成组组设设计计分分级级暴暴露露资资料料的的分分析析若能能获获得得某某暴暴露露因因素素在在不不同同暴暴露露水水平平的的资资料料,,计计算算不不同同暴暴露露等等级级的的OR值值,,并并作作趋趋势势性性χχ2检验,分析疾疾病和暴露的的剂量反应关关系(dose-responserelationship),,以增加因果果关系推断的的依据。2.推断性分分析(4)1:1配对和1:M配比设计计资料的分析析1:1配对和和1:M配比比设计病例对对照研究资料料的分析方法法与成组设计计资料的分析析方法不同。。2.推断性分分析(5)多因素素分析在病例对照研研究中往往需需要同时研究究多个因素的的作用,如果果仅应用一般般分层分析方方法同时对若若干因素加以以控制,计算算复杂且受样样本量的限制制。随着多因因素分析软件件的出现,可可比较容易地地分析多个因因素与疾病的的联系、联系系程度以及各各因素之间的的相互关系。。目前经常使使用的有条件件和非条件Logistic回归模模型。2.推断性分分析(6)交互作作用与效应修修饰的分析交互作用主要要表现为暴露露与疾病的联联系由于受某某个因素的作作用而改变,,这因素称为为效应修饰因素素(effectmodifier),其所产生的的影响为效应修饰(effectmodification)。2.推断性分分析(6)交互作作用与效应修修饰的分析在病例对照研研究中,评价价交互作用最最常用的方法法是按某一因因素分层后,,再看各层的的OR是否相相同,一般需需检验各层OR是否同质质。通常可以用多多元回归分析析的方法来评评价交互作用用,如果某个个代表交互作作用的回归系系数具有显著著性,就认为为该系数所代代表的几个因因素之间存在在交互作用。。常用的有Logistic回归、Cox模型和对数直线模型型等。(二)队列研研究数据统计计分析思路和和过程1.描述性分析2.推断性性分析3.标化比比的计算1.描述性分析(1)一般性性描述描述研究对象象的组成、社社会人口学特特征、随访经经过、随访时时间、结局的的发生和失访访情况等。1.描述性分析(2)均衡性性检验比较各组研研究因素以以外的某些些特征构成成是否齐同同,检验其其可比性;;对各组的的失访率也也要进行比比较。计量指标的的比较采用用t检验、、ANOVA;计数指标的的比较采用用χ2检验或u检检验。对差异有统统计学意义义的因素,,在分析时时应考虑它它对暴露和和疾病关系系的影响。。1.描述性分析析(3)队列列发病率或或死亡率的的计算根据研究人人群的稳定定程度,队队列通常分分为固定队队列(fixedcohort)和和开放队列列(opencohort),两种种队列人群群发病率或或死亡率的的计算指标标不同。但但通常都要要计算累计计发病率或或发病密度度。2.推推断性分分析比较暴露露组和对对照组((或多组组)之间间发病率率或死亡亡率的差差异,推推断暴露露和疾病病之间是是否存在在统计学学关联。。符合正态态分布或或近似状状态分布布,可进进行两个个率差别别的u检检验;样本较小小、发病病率较低低时,可可用直接接概率法法、二项项分布或或Poisson分布布检验;;样本稍大大和发病病率稍大大时,可可用四格格表χ2检验。队列研究的资资料整理理表2.推推断性分分析再分组或或分层计计算关联联强度--相对危危险度((relativerisk,RR)和和95%%的可信信区间,,以及危危险度指指标。危危险度指指标包括括:归因危险险度(AR)归因危险险度百分分比(ARP))人群归因因危险度度(PAR)人群归因因危险度度百分比比(PARP))3.标标化比的的计算当研究对对象人数数较少或或死亡((发病))率较低低时不宜宜计算率率,此时时可以全全人口的的死亡((发病))率作为为标准,,计算该该观察人人群的预预期死亡亡(发病病)人数数,然后后计算实实际死亡亡(发病病)数与与预期数数之比,,即为标化死亡亡(发病病)比((standardizedmortalityratio,SMR))3.标标化比的的计算当未能获获得人群群历年的的人口资资料,而而仅有死死亡人数数、日期期和年龄龄,则可可计算标化比例例死亡比比(standardizedproportionalmortalityratio,SPMR)),即以全全人口中中某病因因死亡占占全死因因死亡的的比例乘乘以该人人群实际际死亡数数而获得得预期死死亡数,,然后计计算实际际死亡((发病))数与预预期数之之比。3.标标化比的的计算SMR、、SPMR和RR一样样都是用用来评价价暴露和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论