循证医学实践中常用的统计分析指标和方法_第1页
循证医学实践中常用的统计分析指标和方法_第2页
循证医学实践中常用的统计分析指标和方法_第3页
循证医学实践中常用的统计分析指标和方法_第4页
循证医学实践中常用的统计分析指标和方法_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1循证医学实践中常用的统计分析指标和方法1一、循证医学中常用的统计分析指标2统计数据类型1.计量资料2.计数资料3.等级资料4.三类资料间关系3住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesQuantitativedata计量资料Qualitativedata计数资料Units;elements41.计量资料

用仪器、工具等测量(measure)方法获得的数据,即为计量资料measurementdata。也叫定量数据Quantitativedata。特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)。52.计数资料

按某种属性分类,然后清点每类的数据,称计数资料(countdata)或enumerationdata。也叫定性数据Qualitativedata。特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男、女)。63.

等级资料Rankdata

半定量的观察结果。有大小顺序,所以也叫有序分类资料(ordinalcategorydata)。

①癌症分期:早、中、晚。

②药物疗效:治愈、显效、有效、无效。

③尿蛋白:,,,++,+++及以上。74.

三类资料间关系

例:一组2040岁成年人的血压以140/90mmHg为界分为正常与异常两组,统计每组例数

<130/85正常血压

130/85

正常高值

140/90

轻度高血压

160/100

中度高血压≥180/110重度高血压计量资料等级资料计数资料8可信区间(confidenceinterval,CI)按预先给定的概率(常取95%或99%)去估计未知总体参数(如总体均数或总体率)的可能范围,即是指该区间有95%的可能性包含了被估计的参数。CI与标准误有关:标准误越小,抽样误差越小,可信区间的范围越窄。用途:参数估计、假设检验。9循证医学中的常用统计指标分类资料EER、CEROR、RRRRR、RRIABI、RBIARR、ARINNT、NNH、LHH数值资料MDSMD10循证医学中的常用统计指标分类资料1.EER,CER及可信区间EER(experimentaleventrate),试验组事件发生率CER(controleventrate),对照组事件发生率死亡生存例数阿司匹林组15(a)110(b)125(n1)对照组30(c)90(d)120(n2)合计45200245(n)11率的抽样误差与标准误

样本率(p)和总体率(π)的差异称为率的抽样误差(samplingerrorofrate),用率的标准误(standarderrorofrate)度量。如果总体率π未知,用样本率p估计12举例:标准误的计算观察某医院产妇106人,其中行剖腹产者62人,剖腹产率为58.5%,试估计剖腹产率的标准误。

解:已知n=106,p=0.585,其标准误为:13总体率的可信区间

总体率的可信区间(confidenceintervalofrate):根据样本率推算总体率可能所在的范围当n足够大,且np

和n(1-p)均大于5时,p的抽样分布逼近正态分布。其可信区间为:双侧:(p-Zα/2Sp,p+Zα/2

Sp)(Z0.05/2=1.96)单侧:p-ZαSp或

p+Zα

Sp(Z0.05=1.645)试估计p=0.585,Sp=0.048的总体率双侧95%可信区间。解:

Z0.05/2=1.96,(p-Zα/2

Sp,p+Zα/2

Sp)=(0.585-1.96×0.048,0.585+1.96×0.048)=(0.491,0.679)即总体率的95%可信区间为49.1%~67.9%。注意:如果计算获得的可信区间下限小于0%,上限大于100%,则将下限直接定为0%,上限直接定为100%14率差(RD)及可信区间

率差(ratedifference,RD)两个发生率的差,其大小可以反映试验效应的大小,其可信区间可以推断两个率有无差别(是否包含0)RD=P1-P2可信区间:(p1-p2)

±ZαSE(p1-p2)

153.相对危险度(RR)及可信区间

相对危险度(relativerisk):是暴露组的发病率与非暴露组发病率的比,用于说明前者是后者的多少倍,常用来表示暴露与疾病联系的强度及其在病因学上的意义大小。RR=EER/CERRR>1,“危险”因素;RR<1,“保护”因素16可信区间可以推断RR有无统计学意义(是否包含1)

计算:SE(lnRR)=RR的可信区间174.OR及可信区间也称比值比、优势比(oddsratio):病例组暴露比值与对照组暴露比值之比即为OR。比值是指某事件发生概率与不发生概率之比。

OR=ad/bc,或配对病例对照研究时,OR=c/b

意义同RR18对照

病例合计暴露非暴露暴露aba+b非暴露cdc+d合计a+cb+dN配对病例对照研究非匹配病例对照研究可信区间可以推断OR有无统计学意义(是否包含1)

计算:SE(lnOR)=OR的可信区间195.相对危险度减少率RRR及可信区间

RRR(relativeriskreduction),可反映试验组与对照组某病发生率增减的相对量,无法衡量增减的绝对量。

RRR=(CER-EER)/CER=1-RR

可信区间可由1-RR的可信区间得到。20如:试验人群中某病的发生率EER=39%,而对照组人群的发生率CER=50%,试计算RRR。

RRR=(CER-EER)/CER=(50%-39%)/50%=22%。但是,若在另一研究中,试验组的疾病发生率为0.39/10万,对照组的疾病发生率为0.50/10万,其RRR仍为22%。举例21ARR(absoluteriskreduction),反映试验组与对照组某病发生率增减的绝对量时,较RRR更明确,更具有临床意义。

ARR较小(如小于10)难于判断临床意义。

ARR=CER-EER可信区间:ARR

±ZαSE226.绝对危险度减少率ARR

ARI,absoluteriskincrease。指试验组中某不利结果发生率EERb与对照组某不利结果发生率CERb的差值。不利的结果:死亡、复发等等。ARI=

|EERb-CERb|反映采用试验因素处理后,病人的不利结果增加的绝对值。

RRI(relativeriskincrease),反映采用试验因素处理后,患者的不利结果增加的百分比。

RRI=|EERb-CERb|/CERb

其中EERb指试验组中某不利结果的发生率,CERb指对照组某不利结果的发生率。237.

绝对危险度增加率ARI和相对危险度增加率RRIABI,absolutebenefitincrease。指试验组中某有益结果发生率EERg与对照组某有益结果发生率CERg的差值。

ABI=|EERg-CERg|RBI,relativebenefitincrease。反映试验因素处理后,患者的有益结果增加的百分比。

RBI=|EERg-CERg|/CERg

8.绝对受益增加率ABI和相对获益增加率RBI249.NNT,NNH及可信区间NNT(numberneededtotreat)

扣除对照组效应后,对患者采用某种防治措施处理,得到一例有利结果需要防治的病例数。

NNT=1/|CER-EER|=1/ARRNNT值越小,防治效果越好NNT可信区间:利用ARR的CI计算

NNT可信区间的下限值=1/ARR的上限值NNT可信区间的上限值=1/ARR的下限值25NNH(thenumberneededtoharm)

对患者采用某种防治措施处理,出现一例副作用需要处理的病例数。

NNH=1/ARINNH值越小,治疗措施引起的副作用就越大2610.其他指标LHH(likelihoodofbeinghelpedvsharmed)防治性措施受益与危害的似然比

LHH=(1/NNT)/(1/NNH)LHH这个指标说明的是防治措施给受试者带来的受益与危害的比例。

LHH>1,利大于弊;LHH<1,弊大于利27集中趋势:均数、几何均数、中位数离散趋势:标准差、四分位数间距、极差、变异系数均数的可信区间:小样本两均数差的可信区间:

数值资料28数值资料的指标∮.均数差值(meandifference,MD)当纳入的研究的结果变量都采用相同方式测量和表达时,效应量采用均数差值。∮.

标准化均数差值(standardizedmeandifference,SMD)当研究的结果变量定义相同但是测量的尺度不同或者测量的单位不同,应采用标准化均数差值。29数值资料的指标标准化均数差(standardisedmeandifference,SMD)

单个研究:其中

是第i个纳入研究中干预组的均数,而

是第i个纳入研究中对照组的均数,Si是第i个纳入研究中干预组和对照组的合并标准差。SMD不仅消除了某研究值的绝对大小的影响,还消除了测量单位对结果的影响。多个研究的SMD计算:95%的可信区间:公式中的Wi是di标准误的平方。30二、循证医学中常用的统计方法31不同的数据类型、不同条件下的资料分析所用的统计学方法是不一样的。统计分析包括统计描述与统计推断,统计推断包括假设检验和可信区间的估计。判断研究的统计方法选用是否合理,首先应明确是否满足统计方法的基本条件。1.统计描述计量资料集中趋势的描述:均数、中位数和几何均数离散趋势的描述:标准差、极差、四分位数和变异系数32表1数值变量的集中趋势和离散趋势指标指标作用适用条件集中趋势均数描述资料的平均水平或集中趋势正态或近似正态分布中位数描述资料的平均水平或集中趋势偏态分布或分布未知几何均数描述资料的平均水平或集中趋势对数正态分布或等比资料离散趋势标准差描述一组资料的离散程度正态或近似正态分布变异系数描述一组资料的离散程度正态或近似正态分布四分位数间距描述一组资料的离散程度偏态分布或分布未知极差描述一组资料的离散程度偏态分布或分布未知计数资料常用率和比,比如发病率、死亡率、构成比和相对比等。33指标表达方式意义事件发生率事件发生的例数/观察总例数分析事件发生的强度和频率构成比单类事件发生的例数/多类事件的总例数总事件中各类事件占的比重相对比甲事件发生率与乙事件发生率比的值发生甲事件与乙事件相比的倍数表2分类变量的常用描述指标2.统计推断统计推断可信区间的估计一般取95%可信区间也具有统计推断的功能可信区间能够提供更多的信息假设检验t检验、u检验卡方检验方差分析多因素分析34一、单个研究中假设检验的方法的正确选择统计学分析方法的选择与资料的质量、类型、分布和分析目的等有关。计量资料分析目的应用条件统计方法单个样本与总体均数比较例数(n)较小,样本来自正态总体t检验例数(n)>50或者>100以上;或者例数较小但总体标准差已知u检验两组资料比较例数(n)>50或者>100以上u检验若例数n较小,来自正态且方差齐性总体成组设计的t检验否则选用成组设计的秩和检验两组配对资料比较(配对设计)配对差值服从正态分布配对设计的t检验否则选用配对设计的秩和检验多组资料比较(完全随机设计)各组均来自正态总体且方差齐性成组设计的方差分析否则选用成组设计的秩和检验表3数值变量资料比较的常用假设检验方法35分类资料分析目的应用条件统计方法两组率或构成比的比较n×p>5且n×(1-p)>5二项分布u检验n>40且最小T>5四格表卡方检验n>40且最小1<T<5校正的四格表卡方检验n<40或最小T<1确切概率法配对资料比较b+c>40McNemar检验b+c<40校正的McNemar检验多组率或构成比比较小于1/5格子的1<T<5行列表卡方检验若有T<1或有大于1/5格子的1<T<5确切概率法36表4分类变量资料比较的常用假设检验方法多因素分析和相关要求疾病的发生、发展、干预到最终的转归,是一个十分复杂的病理生理过程,受到很多因素的影响。常用的多因素分析方法中,一般的表达方式是:Y=X1+X2+X3+X4+…+Xn

其中Y是应变量,即结局指标。在统计分析时,首先做单因素分析,参考单因素分析的结果,在多因素分析时,在模型中纳入有意义的变量。如果单因素分析发现某个变量没有统计学意义,但文献报道这个变量可能是有意义,那么要纳入这个变量到多因素模型中。多因素分析时,还要注意样本量的问题。37常用的多因素分析模型在临床研究中,最常用的多因素分析的方法:多元线性回归分析、Logistic回归分析和Cox回归分析等。多元线性回归分析

是研究一个因变量与多个自变量间线性依存关系数量变化规律的一种方法。多元线性回归方程:Y=β0+β1X1+β2X2+β3X3+…+βnXn+eβ0是截距,回归方程的常数项。其中β1、β2…,是偏回归系数。模型中的e是残差。多元线性回归分析的条件:第一、因变量是数值变量,且满足随机性和独立性。第二、因变量和自变量之间要有线性关系。第三、残差要服从正态分布。38Logistic回归分析Logistic回归是研究分类变量与一些影响因素之间的一种多元统计方法。特点:应变量是分类变量,自变量可以是分类变量,也可以是连续变量。Logistic回归的应用非常广泛。Logistic回归模型常常用于:控制混杂因素之后,探讨研究因素与某个事件的发生的关系;也可用于探讨各种影响因素之间的交互作用;或者用于筛选危险因素,或者是预测某个事件发生的概率。39多因素Logistic回归模型

线性Logistic回归模型公式:

或:

多因素Logistic模型参数的解释

::与变量xi无关的因素的影响;

i:自变量xi

的回归系数,大小由因素xi决定,是控制了其他因素的混杂效应后的i值。

i=0:表明P与

xi

无关,发病不由因素xi

决定;

i>0:表明P与

xi

有关,变量

xi

是疾病发生的危险因素;

i<0:表明P与

xi

有关,变量

xi

是疾病发生的保护因素。

40多因素Logistic回归模型的注意事项首先,变量的取值问题。对于同一个资料,变量采取不同的取值形式,模型中参数的含义可能是不一样的。第二,样本量的问题。样本量太少,结果不稳定。第三,当应变量是一个多水平的分类变量,特别是有序分类变量,可采用多分类的Logistic回归。41Cox回归模型Cox(回归)模型的基本概念

Cox模型也称比例危险度回归模型(proportionalhazardsregressionmodel,PHREG):是一种回归分析方法,也称Cox回归。该模型的优点:可用于分析处理结局的影响因素多;结局发生时间不一;存在删失数据;可处理风险率模型不易确定(难于确定采用非参数模型还是参数模型)的复杂资料。其特点是建立Cox模型不需要知道生存分布的类型,属半参数性质的回归模型。42Cox回归模型比例风险度模型的定义公式为:

h(t,x)=h0(t)exp(β1X1+β2X2+β3X3+…+βnXn)

公式(1)中:

h(t,x)为t时刻存活病人的瞬间死亡率;

h0(t)

为基准危险函数,表示t时刻x1

,x2

,...xp均为0时存活病人的死亡率。应用Cox模型的注意事项:在研究的设计阶段,要保证研究对象是总体中的一个随机样本。研究的协变量在研究对象中的分布要适中。对所研究的生存时间要有明确的规定。43分层分析或亚组分析

在临床研究中,为了观察某种治疗措施的效果,直接将试验组和对照组进行整体分析,可能发现不了有意义的结果。但是如果按照病情的轻重程度重新进行分层分析或亚组分析,就有可能发现有重要临床价值的结果。44二、多个研究的统计分析方法的正确选择45多个研究的统计描述指标的选择二分类资料相对指标:比值比(OR值)、相对危险度(RR值)等。绝对指标:绝对危险度(RD)、NNT等。连续性变量资料正态分布:均数±标准差。偏态分布:中位数和四分位数间距。多个研究的合并效应量:选用均数差值和标准均数差值。46Pooled分析和Meta分析Pooled分析获得每个研究的原始资料,对原始数据进行重新分析。Meta分析对两个或多个相似的研究结果进行定量综合分析的方法。47Meta分析中的统计分析方法

Meta-分析定义是对具有相同研究题目的多个医学研究进行综合分析的一系列过程,包括提出研究问题、制定纳入和排除标准、检索相关研究、汇总基本信息、综合分析并报告结果等。目的在于增大样本含量,减少随机误差所致的差异,增大检验效能。Meta分析基本原理把不同研究者对同一问题所作的研究看作是从同一总体中随机抽取的样本。如果都是按照相同的设计方案得到的研究结果,并可获得每一项研究的结果,则可得到一个更为可靠的综合的结果。Meta分析方法可以定量估计研究效应的平均水平和提高统计学检验效能。48编号Aspirin组安慰剂组RR2P观察人数死亡人数存活人数观察人数死亡人数存活人数161549566624675570.7422.8000.094275844714771647070.6993.6280.05738321027308501267240.8272.3590.125431732285309382710.8210.7650.382581085725406523540.8191.4490.229622672462021225721920381.1181.6170.20478587157070178600172068800.9148.1800.004举例:7个Aspirin预防心肌梗塞后死亡的研究结果Meta-分析的统计目的49传统文献综述的特点处理同一问题的多个结果报道时,通常是平等对待每个研究结论。以某类结果文献数量的多少得出结论。存在问题:多个研究质量不同各个研究的样本含量的大小(权重)不相等

50Meta-分析的目的增大样本含量,减少随机误差所致的差异,增大和提高统计分析效能。探讨多个研究结果间的异质性,实现不一致研究结果间的定量综合。增加效应量的估计精度。引出新的见解。节省研究经费。51Meta-分析与系统评价的关系当数据资料适合并使用了Meta分析,系统评价可以克服传统文献综述的两大问题,其分析结论的可靠性更高;当数据资料不适合作Meta分析时,系统评价只能解决文献评价的问题,不能解决样本量的问题,也无法得到多个研究的合并效应量,无法得出较为确切的分析结论;没有按系统评价标准操作规范实施,即使用了Meta分析也不一定是系统评价的研究,更难说是高质量的研究。52Meta-分析的统计过程异质性分析合并效应量合并效应量的检验可信区间假设检验:Z检验敏感性分析53异质性分析目的:按统计原理,只有同质的资料才能进行合并或比较等统计分析异质性检验(testsforheterogeneity):又称同质性检验(testsforhomogeneity),即用假设检验的方法检验多个独立研究是否具有异质性(同质性)异质性检验的方法包括Q检验法和目测图形法54异质性检验方法—Q检验法Q服从自由度为K-1的χ2分布其中,di为第i项研究的效应量为效应量的均数为第i项研究的权重效应量:是指临床上有意义或实际价值的数值或观察指标改变量。55异质指数,I2意义:用于衡量多个研究结果间异质程度大小的指标。是描述由各个研究所致的,而非抽样误差所引起的变异占总变异的百分比。范围:0~100%。不大于50%可接受。56异质性检验方法—Q检验法举例:Q检验法

Marinho收集了7个有关氟牙膏预防青少年龋齿的临床随机对照研究,试进行异质性检验。研究干预组对照组合计(Ni)发生(ai)未发生(bi)发生(ci)未发生(di)Dolles(1980)131115847Forsman(1974)1742405689559Forsman(1974a)1391236963394Hanachowioz(1984)4254844725945Kleber(1996)45324039156Marthaler(1974)3713545109Torell(1965)113222169164668表5含氟牙膏预防龋齿的疗效观察注:Q=23.37,查表得P值小于0.01,异质性检验有统计学意义,说明7个研究之间的效应量是不同质的。I2=74.3%。57异质性分析与处理方法一般原则是同质(P>0.05)采用固定效应模型存在异质性(P≤0.05)找出产生异质性(临床、方法学)的原因:如疗程长短、用药剂量、病情轻重、对照选择等是否相同,然后采用亚组分析和回归近似法等。未能消除异质性的资料采用随机效应模型。58合并效应量的估计—

固定效应模型固定效应模型常见的方法有:Mantel-Haenszel法、Peto法、方差倒置法等。Mantel-Haenszel方法计算合并OR值的计算公式:公式中ai、bi、ci、di是四格表的实际频数,Ni就是各个研究的样本量。ORMH对数的方差:其中Pi=(ai+di)/Ni,Qi=(bi+ci)/Ni

,Ri=aidi/Ni,Si=bici/Ni。ORMH的95%可信区间计算公式:59举例:Mantel-Haenszel方法计算合并OR值和可信区间氟牙膏预防青少年龋齿的临床随机对照研究60研究阳性数aidi/Nibici/NiORiDolles(1980)132.213.510.63Forsman(1974)17427.7024.041.15Forsman(1974a)13922.2321.541.03Hanachowioz(1984)42511.2422.700.50Kleber(1996)4511.258.211.37Marthaler(1974)371.706.440.26Torell(1965)11327.7456.160.49合计946104.07142.610.73最后结果:合并的OR值=0.73,95%的可信区间:0.61-0.87,说明有统计学意义。还可进行合并效应量的假设检验,即Z检验。Z检验的计算公式:

Z=-3.48,P值<0.0011986年提出,适用于分类变量、数值变量对权重进行校正:增大小样本资料的权重,减少大样本资料的权重来处理资料间的异质性,因此存在较大风险。以研究内的方差与研究间方差之和的倒数作为权重多采用D-L(DerSimonian&Laird法)61随机效应模型:Revman软件中包含的方法资料类型合并统计量模型计算方法二分类变量OR(oddsratio)固定Peto法固定Mantel-Haenszel法随机D-L法RR(relativerisk)固定Mantel-Haenszel法随机D-L法RD(riskdifference)固定Mantel-Haenszel法随机D-L法数值变量WMD(weightedmeandifference)固定倒方差法随机D-L法SMD(standardizedmeandifference)固定倒方差法随机D-L法个案资料OROR(oddsratio)固定Peto法62Meta-分析中其他的统计分析方法敏感性分析(sensitivityanalysis)指改变某些影响结果的重要因素如:纳入标准、研究质量的差异、统计方法等,判断结果的稳定性。Meta回归,估计合并效应量模型:Ti=β0+β1Xi1+β2Xi2+…+βpXip+ei公式中的Xi1,…

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论