Meta分析的有关统计学基本知识_第1页
Meta分析的有关统计学基本知识_第2页
Meta分析的有关统计学基本知识_第3页
Meta分析的有关统计学基本知识_第4页
Meta分析的有关统计学基本知识_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Meta分析的有关统计学基本知识一、概述“Meta”一词源于希腊文,意为“more comprehensive”。即更广泛、更全面。1976年 英国心理学家GVGlass 首 先 将 合 并统计量对文献进行综合分析研究 的 这 类 方 法 称 为 “ Meta- Analysis”。现已广泛应用于医学和健康领域,尤其是针对疾病的诊断、治疗、预防和病因等问题的综合评价。 80年代末该方法传入我国,中文译名有荟萃分析,二次分析、汇总分析、集成分析等。但无论何种中文译名都有不足之处。因此,很多学者建议仍然使用“Meta分析”这一名称。二、Meta分析的定义 Meta-Analysis is a sy

2、stematic reviewthat uses quantitative methods tosummarize the results. Meta分析是运用定量方法去概括(总结)多个研究结果的系统评价。Evidence-Based Medicine- David Sackett等,第247页的定义。 Meta-Analysis is statistical technique forassembling the results of several studies in a review into a single numerical estimate.Meta分析是文献评价中,将若干个研

3、究结果合并成一个单独数字估计的统计学方法。The Cochrane Library第3页的定义。三、Meta分析的统计目的实例一七个阿斯匹林预防心肌梗死的研究资料(取自 Fleiss JL 的资料)K 个研究阿斯匹林死亡数 未死亡数ai bi安慰剂死亡数 未死亡数ci di合计NiOR95%CI下限 上限123456749441023285246157056671473028572520217017676412638522191720557707724271354203868801239152916826261216452417187合计21281205822861153128003表中ai,

4、、bi、 ci、di为各研究四格表数,Ni 为各个研究的样本例数。 ai为处理组的实际阳性数, bi为处理组的实际阴性数;ci为对照组的实际阳性数;di为对照组的实际阴性数。实例二 女童掌骨皮质厚度的11个研究K 个研究高氟区适氟区P 值n11s1n22s2123456789101126554645455246454542444240505045554251454525合计491490 在医学研究中,传统的文献综述在处理同一问题的多个结果报道时,通常是平等(等权重方法)对待每个研究结果而得出结论。这种文献综述一般不进行文献评价,也不考虑文献的质量,主要是以某类结果文献数量的多少得出结论。传统文

5、献综述的特点传统文献综述的主要问题传统文献评价的结果必然存在两个问题:一是多个研究的质量不相同;二是各个研究的样本含量的大小(权重)不相等。因此,传统文献综述的方法很难保证研究结果的真实性、可靠性和科学性,尤其当多个研究的结果不一致时,让人容易产生困惑或误解。Meta分析的统计目的 对多个同类独立研究的结果进行汇总和合并分析,以达到增大样本含量,提高检验效能的目的,尤其是当多个研究结果不一致或都没有统计学意义时,采用Meta分析可得到更加接近真实情况的统计分析结果。四、Meta分析的统计分析过程Meta分析统计过程的主要内容:1.异质性分析2.计算合并效应量3.合并效应量的检验 可信区间、Z检

6、验什么是异质性 在Meta分析过程中,纳入的多个研究尽管都是对同一临床问题或具有相同研究假设的研究。但是,这些研究在纳入和排除标准、样本含量、质量控制等方面很可能不相同,从而导致了同一结局指标在多个研究间的差异。异质性的定义Cochrane协作网将异质性定义为:(1)广义上用于描述试验的参与者、试验的干预措施和多个研究测量结果的变异,即各研究的内在真实性变异。(2)专指统计学异质性,用于描述多个研究中效应量的变异程度,也可以用于描述除偶然机会外,多个研究间存在的差异。异质性的种类Cochrane协作网将Meta分析的异质性分为:临床异质性、方法学异质性和统计学异质性。临床异质性是指:受试对象的

7、不同、干预措施的差异和结局指标的变异所致的偏倚。方法学异质性是指:由于试验设计和研究质量的差异引起的,如盲法的应用和分配隐藏的应用,或由于试验过程中对结局指标的定义或测量的不一致而出现的偏倚。统计学的异质性是指:干预效果的评价在不同试验间的变异,它是研究间的变异,它是研究间的临床和方法学上变异联合作用的结果。统计学异质性通常将Meta分析的统计学异质性简称为“异质性”,它是以各研究之间可信区间(CI)的重合程度来度量异质性的大小。多个研究间的CI重合程度越大,存在统计异质性的可能性就越小,反之,各研究间存在统计学异质性的可能性就越大。临床异质性、方法学异质性和统计学异质性三者相互独立又相互关联

8、的,临床和方法学异质性,不一定在统计学上就有异质性,反之亦然。异质性分析的意义 Meta分析的核心计算是合并(相加),按统计原理,只有同质的资料才能进行合并或比较等统计分析,反之,则不能。异质性检验(tests for heterogeneity)又称同质性检验(tests for homogeneity)用假设检验的方法检验多个独立研究是否具有异质性(同质性)。异质性检验的方法,目前,多用由下式计算:Q = Wi(di )2= Widi2 (Widi)2WiWi 为每个研究的权重,第 i 个研究的权重 Wi 按下式计算:Wi =1Var(di ) 该检验统计量Q服从自由度为K-1的卡方(2)

9、分布,因此,当计算得到Q后,需由卡方分析获取概率,故又将此检验叫做卡方检验(Chi square test) 。异质性检验的方法若异质性检验检验结果为时,多个研究的异质性无统计学意义;若异质性检验结果为时,多个研究的异质性有统计学意义。I 2的计算2I =Q(k1)Q100%式中的Q为异质性检验的卡方值2,K为纳入Meta分析的研究个数。描述多个研究间异质性大小,即 I2,其计算公式如下:I 2的意义I2可用于衡量多个研究结果间异质程度大小的指标。这个指标用于描述由各个研究所致的,而非抽样误差所引起的变异(异质性)占总变异的百分比。在Cochrane系统评价中,只要I2不大于50%,其异质性可

10、以接受。 异质性分析与处理的方法当异质性检验出现时处理的方法:1.首先,检查每个研究的原始数据是否正确,检查提取数据的方法是否正确。2.如果产生异质性的原因可能是由于疗程长短、用药剂量、病情轻重、对照选择等所致,可使用亚组分析(subgroup analysis) 或Meta回归。异质性分析与处理的方法3.敏感性分析,排除可能是导致异质性的某些(个)研究后,重做Meta 分析,与未排除这些(个)研究的Meta 分析结果比较,探讨被去除的研究对合并效应的影响,通过比较了解其异质性的来源。异质性分析与处理的方法4.通过临床专业知识、统计学知识和前述的异质性分析方法,仍然无法解释异质性的原因,可采用

11、随机效应模型(random effect model )进行Meta 分析。5.不做Meta 分析。四、合并效应量的计算多个试验效应的合并 将多个独立研究的结果合并(或汇总)成某个单一的效应量(effect size)或效应尺度(effect magnitude),即用某个指标的合并统计量,以反映多个独立研究的综合效应。合并统计量的计算当多个独立研究的例数不等时,它们的综合效应不等于这多个单独效应的平均数。如三个均数的总均数不等于这三个均数之和除以3。所以,怎样合理的对多个独立研究效应进行合并,是Meta分析统计过程的主要问题之一。(1)分类变量(category ,dichotomous)固

12、定效应模型( fixed effect model) ,指标 (1)RD(rate difference,risk difference)率差 (2)RR(relative risk)相对危险度 (3)OR(odds ratio)比值比随机效应模型(random effect model ) , RD、RR、OR的DerSimonian&Laird(D-L)法(2)数值变量 (continuous) 固定效应模型MD (Mean Difference) ,均数差法;WMD(Weighted Mean Difference),加权均数差法SMD,(Standardised Mean Differ

13、ence)标准化均数差法随机效应模型,D-L法分类变量RD、OR、RR及可信区间 RD(率差)及可信区间两个发生率的差即为率差,也称危险差(rate difference,risk difference,RD),如,试验组发生率(ERR)与对照组发生率(CER)的差,其大小可反映试验效应的大小。 RD= ERR- CER两率差的可信区间由下式计算: | p1-p2|u SE(p1-p2) = (RDu SE(RD),RD+u SE(RD)RD的意义当RD=0时,可认为试验组的发生率与对照组的发生率相同;当RD0时,可认为试验组的发生率大于对照组的发生率;当RD0时,可认为试验组的发生率小于对照

14、组的发生率;实例分析阿司匹林治疗心肌梗死的效果组别死亡未死亡合计试验组15(a)110 (b)125 (n1)对照组30 (c)90(d)120 (n2)合计45200245 (N)该例的RD为: 即该例试验组的病死率比对照组少13%该试验两率差(RD)的可信区间为: (ERR- CER)u SE(p1-p2)即 RDu SE(p1-p2)RD95%的可信区间为 RD1.96SE(RD) RD的可信区间(CI)=阿斯匹林治疗心肌梗死的效果EER= 15/125=12%,CER =30/120 =25%,两率差的标准误:SE(p1-p2)= 实例RD的标准误该试验两率差(RD)的可信区间为: R

15、Du SE(p1-p2) =()该例两率差的可信区间为,上下限均小于0(不包含0),两率有差别。可认为阿斯匹林可降低心肌梗死的病死率。 实例RD的可信区间(CI)RD的可信区间的图示无统计学意义试验组对照组试验组对照组0无效值RR及可信区间相对危险度RR(relative risk,RR)是前瞻性研究中较常用的指标,它是试验组某事件发生率P1与对照组(或低暴露)的发生率P0之比,用于说明前者是后者的多少倍,常用来表示试验因素与疾病联系的强度及其在病因学上的意义大小。其计算方法为:RR=P1/P0=EER/CER当RR1时,可认为试验因素与疾病无关;当RR1时,可认为试验因素与疾病有关。当RR1

16、时,可认为试验组发生率大于对照组;当RR1时,可认为试验组发生率小于对照组。RR的可信区间,应采用自然对数进行计算,即应求RR的自然对数值ln(RR)和ln(RR)的标准误SE(lnRR),其计算公式如下:SE(lnRR)=ln(RR)的1可信区间为:ln(RR) uSE(lnRR)RR的可信区间为:expln(RR) u SE(lnRR)+=阿斯匹林治疗组的病死率P1=15/125;对照组的病死率P0=30/120,其RR和可信区间为:RR =SE(lnRR)=RR的95%可信区间为:expln(RR)1.96 SE(lnRR)= exp(-0.734 ),0.846)该例RR的95%可信区

17、间为 ,使用阿斯匹林治疗的病人,其病死率小于对照组,可认为阿斯匹林可降低心肌梗死有效。OR及可信区间在回顾性研究(如病例对照研究)中,往往无法得到某事件的发生率CER或EER(如死亡率、病死率、发病率),也就无法计算出RR,但是当该发生率很低时(如发生率小于等于5%),可计算出一个RR的近似值,即为比值比(odds ratio,OR),又称优势比等。公式为:OR=ad/bc。回顾性研究的数据表组别暴露未暴露合计病例组abn1=a+b对照组cdn2=c+d合计a+cb+dNOR的计算病例组暴露与未暴露的比值,即odds1 = a/b ;对照组暴露与未暴露的比值,即odds0 =c/d ;以上两个

18、比值之比即为比值比(odds ratio,OR),又称机会比、优势比等。公式为:OR=当所研究疾病的发病率较低时,即a和c均较小时,OR近似于RR,故在回顾性研究中可用OR估计RR;由于前瞻性研究中,RR的可信区间与OR的可信区间很相近,且OR的计算更为简便,因此,常用OR可信区间的计算来代替RR的可信区间的计算。OR值的解释与RR相同。OR的意义当OR1时,可认为病例组的暴露率与对照组的暴露率相同;当OR1时,可认为病例组暴露率大于对照组;当OR1时,可认为病例组暴露率小于对照组。OR的意义OR的可信区间同样需要采用自然对数计算,其ln(OR)的标准误SE (lnOR)按下式计算:SE(ln

19、OR)=ln(OR)的可信区间为: ln(OR) uSE(lnOR)OR的可信区间为: expln(OR) uSE(lnOR)例如:前述阿斯匹林治疗心肌梗死的效果试估计其 OR 的 95%可信区间。OR=OR的95%可信区间为:exp ln(OR) 1.96SE(lnOR) ),0.807)该例OR的95%可信区间为,可以认为阿斯匹林治疗心肌梗死有效。RR或OR的可信区间的图示无统计学意义试验组对照组试验组对照组1无效值数值型变量MD、WMD、SMD及可信区间1. WMD加权均数差(WMD, Weighted Mean Difference)某个研究的两均数差d 可按下式计算:从公式可见,加权

20、均数差(Weighted Mean Difference, WMD)即为两均数的差值。该指标以试验原有的测量单位,真实地反映了试验效应,消除了绝对值大小对结果的影响,在实际应用时,该指标容易被理解和解释。标准化均数差(Standardised Mean Difference) , SMD:某个研究的标准化均数差d,可按下式计算:d=X1-S CX2(1-34N -9)S C=2. SMD标准化均数差(SMD) 的标准误,可按下式计算:SE( SMD)SMD可简单地理解为两均数的差值再除以合并标准差的商,它不仅消除了某研究的绝对值大小的影响,还消除了测量单位对结果的影响。因此,该指标尤其适用于单

21、位不同或均数相差较大的数值资料分析。但是,标准化均数差(SMD)是一个没有单位的值,因而,对SMD分析的结果解释要慎重。WMD和SMD的可信区间若选择WMD或SMD为合并统计量时,其95%CI与假设检验的关系如下:若其95%CI包含了0,等价于,即合并统计量无统计学意义。若其95%CI的上下限均大于0或均小于0,等价于,即合并效应量有统计学意义。WMD与SMD的CI计算WMD合并95%的可信区间:WMD合并1.96SE(WMD)SMD合并95%的可信区间:SMD合并1.96SE(SMD)MD与SMD的森林图示意试验组对照组0无效线无统计学意义试验组对照组合并统计量的两种统计模型固定效应模型(

22、fixed effect model):若多个研究具有同质性(无异质性)时,可使用,可使用固定效应模型。随机效应模型(random effect model ):若多个研究不具有同质性时,先对异质原因进行处理,若异质性分析与处理后仍无法解决异质性时,可使用随机效应模型。关于随机效应模型(1)随机效应模型一种对异质性资料进行Meta分析的方法,但是,该法不能控制混杂、也不能校正偏倚或减少异质性,更不能消除产生异质性的原因。目前,随机效应模型多采用D-L法(DerSimonian & Laird法)。) W i2 W i)D-L法是1986年,由DerSimonian和Laird首先提出,该法不仅

23、可用于分类变量,也适用于数值变量。D-L法主要是对权重Wi进行校正,即将各式中的Wi 按下式进行计算:*W i =(D +1 -1W i其中 D 按下式计算:D =Q (K 1)( W i关于随机效应模型(2)关于随机效应模型(3)D-L法是通过增大小样本资料的权重,减少大样本资料的权重来处理资料间的异质性,而这种处理存在着较大风险。通常小样本资料往往质量较差,偏倚较大,而大样本资料往往质量较好,偏倚较小。因此,经随机效应模型处理的结果,可能削弱了质量好的大样本信息,增大了质量差的小样本信息,故应谨慎使用随机效应模型,对其结论也应当较为委婉。固定二分类变量(Dichotomous)合并统计量(

24、Summary statistic)OR(odds ratio)RR(relative risk)模型(Model)固定固定随机*固定计算方法(Method)Peto 法Mantel-Haenszel 法D-L 法Mantel-Haenszel 法RD(risk difference)随机*随机*D-L 法Mantel-Haenszel 法D-L 法数值变量(Continuous)WMD(weighted meandifference)固定随机*倒方差法(inverse variance)D-L 法个案资料(Individual)SMD(standardised meandifference)

25、OR(odds ratio)固定随机*固定倒方差法(inverse variance)D-L 法Peto 法资料类型(Type of data)5、合并效应量的检验用假设检验(hypothesis test )的方法检验多个独立研究的总效应量(效应尺度)是否具有统计学意义,其原理与常规的假设检验完全相同。两种方法:u检验(Z test)卡方检验(Chi square test)根据z或(u)值或卡方值得到该统计量下概率(P)值。若,多个研究的合并效应量有统计学意义;若P,多个研究的合并效应量没有统计学意义。6、合并效应量的可信区间可信区间(confidence interval,CI)是按一定

26、的概率估计总体参数(总体均数、总体率)所在的范围(区间) ,如:95%的CI,是指总体参数在该范围(区间) 的可能性为95%。可信区间主要有估计总体参数和假设检验两个用途。在Meta分析中,常用可信区间进行假设检验,95%的可信区间与为的假设检验等价,99%的可信区间与为的假设检验等价。此外,森林图即是根据各个独立研究的95%可信区间及合并效应量的的95%可信区间绘制的。OR与RR的可信区间若选择OR或RR为合并统计量时,其95%的可信区间与假设检验的关系如下: 若其95%CI包含了1,等价于,即合并统计量无统计学意义。 若其95%CI的上下限均大于1或均小于1,等价于,即合并效应量有统计学意

27、义。)-)固定效应模型的计算P e to O R 合 并 = e x p (a i -E i ) V iO R 合并 = (a i d i/N i ) (b i c i /N i )R R 合并 = exp ( W i ln R R i W iRD 合并 =a i n 1i c i n 2i ( N i N i)n 1i n 2i N iW M D or SM D = W i d i W iOR与RR的CI计算OR合并95%的可信区间:expOR合并1.96SE(lnOR)Peto OR合并95%的可信区间:expOR合并1.96SE(lnPetoOR)RR合并95%的可信区间:expRR合并

28、1.96SE(lnRR)五、分类变量的实例分析分类变量(category ,dichotomous)的单个研究的统计量di,可选择OR、RR或RD,四格表数据如下表:Summary 22 Table For CountsEventNo EventTreatmentControlaicim1ibidim2in1in2iNi单个分类变量的研究数据K研究的分类变量资料整理TreatmentControli 个研究EventNo EventEventNo Event123aia1a2a3bib1b2b3n1in11n12n13cic1c2c3did1d2d3n2in21n22n23实例一七个阿斯匹林预

29、防心肌梗死的研究资料(取自 Fleiss JL 的资料)K 个研究阿斯匹林死亡数 未死亡数ai bi安慰剂死亡数 未死亡数ci di合计NiOR95%CI下限 上限123456749441023285246157056671473028572520217017676412638522191720557707724271354203868801239152916826261216452417187合计21281205822861153128003表中ai,、bi、 ci、di为各研究四格表数,Ni 为各个研究的样本例数。 ai为处理组的实际阳性数, bi为处理组的实际阴性数;ci为对照组的实际阳

30、性数;di为对照组的实际阴性数。OR和RR的森林图OR和RR的森林图(forest plots),无效线竖线的横轴尺度为1,每条横线为该研究的95%可信区间上下限的连线,其线条长短直观地表示了可信区间范围的大小,线条中央的小方块为OR值的位置,其方块大小为该研究权重大小。若某个研究95%可信区间的线条横跨为无效竖线,该研究无统计学意义,反之,若该横线落在无效竖线的左侧或右侧,该研究有统计学意义。例一 的 Revman森林图M-H法例一 的 Revman 森林图Peto法漏斗图及用途漏斗图(funnel plots)最初是用每个研究的处理效应估计值为X轴,样本含量的大小为Y轴的简单散点图(sca

31、tter plots)。对处理效应的估计,其准确性是随样本含量的增加而增加,小样本研究的效应估计值分布于图的底部,其分布范围较宽;大样本研究的效应估计值分布范围较窄,当没有发表偏倚时,其图形呈对称的倒漏斗状,故称之为“漏斗图”。RevMan中的漏斗图在RevMan软件中,漏斗图是采用OR或RR对数值(logOR或logRR)为横坐标,OR或RR对数值标准误的倒数1/SE(logRR)为纵坐标绘制的,然后,以真数标明横坐标的标尺,而以SE(logRR) 标明纵坐标的标尺。漏斗图的用途漏斗图主要用于观察某个系统评价或Meta分析结果是否存在偏倚,如发表偏倚或其他偏倚。如果资料存在偏倚,会出现不对称

32、的漏斗图,不对称越明显,偏倚程度也就越大。漏斗图的不对称性主要与发表偏倚有关,但也可能存在其他原因。漏斗图不对称的主要原因导致漏斗图不对称的主要原因有:选择性偏倚(Selection bias)发表偏倚(Publication bias)语言偏倚(Language bias)引用偏倚(Citation bias)重复发表偏倚(Multiple publication bias)等等例一 的 Revman 漏斗图(Funnel Plot)六、数值变量的实例分析数值变量 (continuous)的单个研究的统计量di ,可选择WMD和SMD法,单个研究的数据如下表。均数标准差例数kiS kin k

33、i试验组对照组1122S 11S 22n 11n 22单个数值变量的研究数据K研究的数值变量资料整理试验组对照组均数标准差例数均数标准差例数第i个研究S 1in 1 i2iS 2in 2iNii=1i=2i=3S 11S 12S 13n 11n 12n 13212223S 2 1S 2 2S 2 3n 21n 22n 23N1N2N3实例二 女童掌骨皮质厚度的11个研究K 个研究高氟区适氟区P 值n11s1n22s2123456789101126554645455246454542444240505045554251454525合计491490WMD和SMD的森林图WMD和SMD的森林图,无效

34、线竖线的横轴尺度为0,每条横线为该研究的95%可信区间上下限的连线,其线条长短直观地表示了可信区间范围的大小,线条中央的小方块为WMD或SMD值的位置,其方块大小为该研究权重大小。若某个研究95%可信区间的线条横跨为无效竖线,即该研究无统计学意义,反之,若该横线落在无效竖线的左侧或右侧,该研究有统计学意义。例二 的 Revman森林图(WMD法)例二的Revman森林图(SMD法)例二 的 Revman漏斗图(Funnel Plot)七、Meta分析的软件1Review Manager(Revman): 该 软 件 是 国 际Cochrane协作网系统评价的标准化专用软件,其中包含了cochrane系统评价的各项功能,也包括该组织推荐的各种Meta分析功能,具有操作简单、结果直观的特点。该软件是一个免费软件,用户可在如下网址免费下载:2STATA 该 软 件 是 美 国 Computer Resource Cen

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论