Cox回归分析医疗培训课件_第1页
Cox回归分析医疗培训课件_第2页
Cox回归分析医疗培训课件_第3页
Cox回归分析医疗培训课件_第4页
Cox回归分析医疗培训课件_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

随访资料的特点分布类型不易确定。一般不服从正态分布,少数情况下近似服从指数分布、Weibull分布、Gompertz分布等,多数情况下往往是不服从任何规则的分布类型。影响因素多而复杂且不易控制。根据研究对象的结局,生存时间数据可分为两种类型:

完全数据(completedata)

截尾数据(截尾值、删失数据,censoreddata)8/23/20241Cox回归分析医疗生存分析的研究内容生存分析的研究内容主要包括以下三个方面:①对生存时间进行统计描述;②寻找影响生存时间长短的“危险因素”(包括正危险因素和负危险因素);③估计生存率和生存时间长短,进行预后评价。8/23/20242Cox回归分析医疗生存分析常用的分析方法非参数法:主要用于描述性分析(估计生存率)和单因素分析,如寿命表法、乘积极限法、时序检验等。参数法:一般用作多因素预后分析,也可计算生存率和半数生存期,如指数模型、Weibull模型、Gompertz模型等。半参数法:即Cox回归模型,兼有非参数法和参数法的优点,既不依赖于生存时间的分布类型,又可以用作多因素分析,是生存分析中最重要的分析方法。8/23/20243Cox回归分析医疗影响因素分析生存分析中一个很重要的内容是探索影响生存时间或生存率的危险因素,这些危险因素通过影响各时刻的死亡风险(即危险率)而影响生存率,不同特征的人群在不同时刻的危险率函数不同。通常将危险率函数表达为基准危险率函数与相应协变量函数的乘积,即。对于协变量函数f(X),最常用的是对数线性模型,即8/23/20244Cox回归分析医疗一、危险率函数(hazardfunction)

1、定义:指t时刻尚存活的研究对象死于t时刻之后一瞬间的概率。为条件概率,即活到了t时刻的条件下在t~t+

t这一微小时段内死亡的概率,用h(t)表示。

式中,T为观察对象的生存时间,n(t)为t时刻的生存人数,n(t+

t)为t+

t时刻的生存人数。危险率函数也称为死亡力(forceofmortality)、瞬时死亡率(instantaneousfailurerate)等。

8/23/20245Cox回归分析医疗h1(t)是一种上升的曲线,表示危险率随时间变化而增加,如急性白血病患者治疗无效其危险率随时间呈增加趋势;h2(t)的曲线为下降趋势,表示危险率逐渐减小,如意外事故造成的外伤经有效治疗后死亡的危险性逐渐减小;h3(t)为一种稳定的危险率函数,如某些慢性病患者在稳定期,其危险率基本不变。图16-1三种不同形式的危险率函数曲线8/23/20246Cox回归分析医疗2、危险率函数与生存函数的关系:危险率函数是生存分析的基本函数,它反映研究对象在某时点的死亡风险大小。生存函数与危险率函数的关系可表示为:不同人群的危险率模型不同,危险率函数可以表现为递增、递减、恒定或其它波动形式。

8/23/20247Cox回归分析医疗8/23/20248Cox回归分析医疗风险函数与生存函数的关系8/23/20249Cox回归分析医疗h0(t)已知时当基准危险率函数h0(t)已知时,为参数模型,如:h0(t)=

时,为指数回归模型;h0(t)=

tr-1时,为Weibull回归模型;h0(t)=

e

t时,为Gompertz模型。8/23/202410Cox回归分析医疗h0(t)未知时1972年英国生物统计学家D.R.Cox提出在基准危险率函数未知的情况下估计模型参数的方法,后人将这一模型称为Cox比例风险回归模型(Cox’sproportionalhazardregressionmodel)。由于该模型的参数估计不依赖于基准危险率的分布类型,故属于一种半参数模型。8/23/202411Cox回归分析医疗二、Cox比例风险回归模型生存分析的主要目的在于研究协变量X与观察结果即生存函数之间的关系,当S(t)受到协变量的影响时,传统的方法是考虑回归分析,即各协变量对S(t)的影响,由于生存分析研究的数据中包含有截尾数据,用一般的方法难以解决上述问题。看下面的例子8/23/202412Cox回归分析医疗如果分析x1-x6这6个因素对生存时间t的影响,能否用线性回归分析建立时间t与影响因素间的线性回归方程?或建立生存函数S(t)与影响因素间的线性回归方程?t=b0+b1x1+b2x2+┅+b6x6?S(t)=b0+b1x1+b2x2+┅+b6x6?1.生存时间t一般不服从正态分布2.生存时间t中含有截尾数据8/23/202413Cox回归分析医疗利用生存率函数S(t,X)与风险函数h(t,X)的关系可导出较好地解决截尾值的问题反映了协变量X与生存函数的关系Cox模型的基本形式8/23/202414Cox回归分析医疗所有危险因素为0时的基础风险率,它是未知的,但假定它与h(t,X)是呈比例的。右侧可分为两部分:h0(t)没有明确的定义,分布无明确的假定,参数无法估计,为非参数部分;另一部分是参数部分,其参数可以通过样本的实际观察值来估计的,正因为Cox模型有非参数和参数两部分组成,故又称为半参数模型。8/23/202415Cox回归分析医疗若

i>0,则RR>1,该因素为危险因素;若

i<0,则RR<1,该因素为保护因素;若

i=0,则RR=1,该因素为无关因素。

偏回归系数

i的意义是,当其它协变量都不变时,Xi每变化一个单位,相对危险度的自然对数(lnRR)变化

i个单位。

8/23/202416Cox回归分析医疗相对危险度RR①只考虑1个协变量X时,

②考虑多个危险因素,其中Xi增加1个单位而其它变量都不变时,8/23/202417Cox回归分析医疗相对危险度RR③同时考虑2个协变量,2个因素都存在的危险率与2个因素都不存在时的危险率之比(相对危险度)为

8/23/202418Cox回归分析医疗实例----胃癌患者预后

手术治疗(X1:1施行手术治疗;0未施行手术治疗)放射治疗(X2:1接受放射治疗;0未接受放射治疗)偏回归系数

1、

2的估计值分别为b1=-0.360,b2=-0.333

接受治疗病人的危险率未接受治疗病人的危险率8/23/202419Cox回归分析医疗Cox回归基本模型的两个前提假设

①各危险因素的作用不随时间变化而变化,即不随时间变化而变化;②各危险因素之间不存在交互作用。

8/23/202420Cox回归分析医疗Cox回归模型与一般的回归分析不同,它不是直接用生存时间作为回归方程的因变量,协变量对生存时间的影响是通过风险函数和基础风险函数的比值反映的,其中的风险函数和基础风险函数是未知的。另外偏回归系数的估计需要借助于偏似然函数的方法。在完成参数估计的情况下,可对基础风险函数和风险函数做出估计,并可计算每一个时刻的生存率。8/23/202421Cox回归分析医疗二、Cox回归分析的一般步骤1.分析前的准备----数据整理2.参数估计,建立最佳模型3.假设检验4.Cox模型的解释及应用5.Cox模型拟合优度的考察8/23/202422Cox回归分析医疗1.分析前的准备----数据整理严密的研究设计收集资料:影响疾病的因素、病人的个性及行为特征等资料(如病人的年龄、性别、职业、是否饮酒、是否吸烟及病情、病理类型等资料)、研究对象的生存时间和截尾指示变量(一般用变量t表示生存时间,用变量d表示是否截尾)。资料应尽量避免偏性及主观因素的影响。样本含量:不宜过小。一般情况下,样本例数应为分析因素的5-20倍。数据预处理:如数据的变换、日历数据与生存时间的转化等。同时要对数据进行描述性分析。8/23/202423Cox回归分析医疗8/23/202424Cox回归分析医疗2.参数估计,建立最佳模型

(1)参数估计----偏似然估计假定有n个病人,他们的生存时间由小到大排列:t1≤t2≤…≤tn

对于每个生存时间ti来说,凡生存时间大于ti的所有病人组成一个危险集,记为R(ti)。在危险集内的病人,在ti以前尚生存,但处在危险之中,随着时间的推移,危险集内的病人陆续死亡,逐渐退出观察,直至最后一个病人死亡时,危险集消失。8/23/202425Cox回归分析医疗8/23/202426Cox回归分析医疗代表ti时刻以后危险集R(ti)中对似然函数作贡献的个体将n个病人死亡的条件概率相乘

8/23/202427Cox回归分析医疗两边取自然对数8/23/202428Cox回归分析医疗当病人的生存时间存在重复,即在时间ti上有重复死亡数的情况,或者病人的数据资料是以分组的形式出现时,其似然函数的构造比较复杂。学者们建议采用边缘似然函数(marginallikelihoodfunction)来估计参数。当在时间ti上重复死亡数和危险集的人数相比不多时,其似然函数为:式中,即是在时间ti上的di例病人的第j个协变量取值之和。对上式取对数后,再求其一阶偏导数并令其等于0,即可得到

j的最大似然估计值。8/23/202429Cox回归分析医疗(2)建立最佳模型为建立最佳模型常需对研究的因素进行筛选,筛选方法有前进法、后退法和逐步回归法。实际工作中要根据具体情况选择使用,最常用的为逐步回归法。因素筛选时需规定显著性水平,一般情况下初步筛选因素的显著性水平确定为0.1或0.15,设计较严格的研究显著性水平可确定为0.05。另外,筛选因素时,还要考虑因素间共线性的影响。当存在共线性时,应考虑消除共线的影响,如采用主成分回归等方法。8/23/202430Cox回归分析医疗3.假设检验(1)似然比检验(likelihoodratiotest)

2=2[lnL(p+1)-lnL(p)]

服从自由度为1的

2分布。(2)得分检验(scoretest)(3)Wald检验8/23/202431Cox回归分析医疗4.Cox模型的解释及应用(1)探索结局事件发生的危险因素,分析各因素的作用大小。(2)计算个体预后指数(prognosisindex,PI),对个体进行定性的预后评价。(3)通过估计生存率,对群体定量地进行预后评价。8/23/202432Cox回归分析医疗影响因素Xi的标准差

标准正态离差

相应偏回归系数的标准误

8/23/202433Cox回归分析医疗

(2)计算个体预后指数(prognosisindex,PI),对个体进行定性的预后评价。

定义第j个观察单位的预后指数为:

式中为第i个协变量的标准偏回归系数的估计值(),为第j个观察单位(个体)第i个协变量的标准化值。若PLj=0,说明该个体死亡风险处于平均水平;若PLj>0,说明该个体死亡风险高于平均水平;若PLj<0,说明该个体死亡风险低于平均水平。8/23/202434Cox回归分析医疗3.通过估计生存率,对群体定量地进行预后评价。

由于生存率与基础生存率相关,故只要估计出基础生存率,再结合各因素的偏回归系数就可以估计出生存率,即8/23/202435Cox回归分析医疗ti时刻的基础生存率公式

ti时刻的基础累计风险函数公式在ti时刻的死亡人数

ti时刻的生存率计算公式

8/23/202436Cox回归分析医疗5.Cox模型拟合优度的考察可将研究对象按个体预后指数恰当地分组,用乘积极限法估计各组的生存率曲线,并与按Cox模型预后指数分类的生存率曲线在同一坐标系内进行比较,若两种曲线具有一致性,说明模型拟合较理想。8/23/202437Cox回归分析医疗三、Cox回归分析的应用实例为探讨某恶性肿瘤的预后,收集了63名该病病人的生存时间、结局及影响因素。8/23/202438Cox回归分析医疗8/23/202439Cox回归分析医疗dataAA16;inputx1-x6td@@;cards;54 0 0 0 1 0 52 1……62 0 0 1 1 2 16 0;proc

phreg;modelt*d(1)=x1-x6/selection=stepwisesls=0.05sle=0.05

alpha=0.05risklimits;run;8/23/202440Cox回归分析医疗dataAA16;inputx1-x6td@@;cards;54 0 0 0 1 0 52 1……62 0 0 1 1 2 16 0;procphreg;modelt*d(1)=x1-x6/selection=stepwisesls=0.05sle=0.05

alpha=0.05risklimits;run;计算各因素RR及其95%CI调用Cox模型分析模块建立生存时间为t,截尾指示变量为d的Cox模型,d取值为1时表示截尾8/23/202441Cox回归分析医疗

TheSASSystem12:32Wednesday,April28,20061ThePHREGProcedureModelInformationDataSetWORK.AA16DependentVariabletCensoringVariabledCensoringValue(s)1TiesHandlingBRESLOWSummaryoftheNumberofEventandCensoredValuesPercentTotalEventCensoredCensored63263758.73数据集信息的简单描述8/23/202442Cox回归分析医疗

Step1.Variablex4isentered.Themodelcontainsthefollowingexplanatoryvariables:x4ConvergenceStatusConvergencecriterion(GCONV=1E-8)satisfied.ModelFitStatisticsWithoutWithCriterionCovariatesCovariates-2LOGL201.994187.690AIC201.994189.690SBC201.994190.948TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPr>ChiSqLikelihoodRatio14.303810.0002Score13.039910.0003Wald10.263410.0014逐步回归法筛选变量8/23/202443Cox回归分析医疗Step2.Variablex5isentered.Themodelcontainsthefollowingexplanatoryvariables:x4x5ConvergenceStatusConvergencecriterion(GCONV=1E-8)satisfied.ModelFitStatisticsWithoutWithCriterionCovariatesCovariates-2LOGL201.994182.777AIC201.994186.777SBC201.994189.293TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPr>ChiSqLikelihoodRatio19.21682<.0001Score17.594120.0002Wald14.577020.0007NOTE:No(additional)variablesmetthe0.05levelforentryintothemodel.逐步回归法筛选变量8/23/202444Cox回归分析医疗

AnalysisofMaximumLikelihoodEstimat

ParameterStandardHazard95%HRVariableDFEstimateErrorChi-SquarePr>ChiSqRatioConfidenceLimitsx411.761280.5478510.33560.00135.8201.98917.031x510.931330.444554.38900.03622.5381.0626.066SummaryofStepwiseSelectionVariableNumberScoreWaldStepEnteredRemovedInChi-SquareChi-SquarePr>ChiSq1x4113.0399.0.00032x524.7039.0.0301最大似然估计结果筛选过程总结8/23/202445Cox回归分析医疗实例与SAS程序例2某医师对一所医院1988年收治的16例鼻腔淋巴瘤患者随访了13年,数据见表2,试作Cox模型分析。8/23/202446Cox回归分析医疗8/23/202447Cox回归分析医疗dataa;inputnumsexagestagebloodxraychmthrpcensorday;cards;1 1 45 2 2 0 1 1 5782 0 36 2 2 0 1 1 15493 1 57 2 2 1 0 1 9384 0 45 2 0 1 0 0 47175 0 42 2 0 1 1 1 41116 0 39 2 1 0 1 1 12457 1 38 2 1 1 1 1 44358 1 45 2 2 1 0 1 37509 1 30 2 0 1 0 1 395810 0 45 2 1 0 1 1 258111 0 45 3 1 0 1 1 357212 1 57 2 1 1 0 1 293813 0 57 2 2 0 1 1 193214 1 49 2 2 1 1 1 320515 1 33 2 1 0 1 1 345116 0 51 2 2 1 0 1 2363;PROC

PHREG;Modelday*censor(0)=sexagestagebloodxraychmthrp/

risklimits;RUN;SAS程序8/23/202448Cox回归分析医疗SAS程序输出结果TheSASSystem16:31Saturday,December4,20056ThePHREGProcedureAnalysisofMaximumLikelihoodEstimates

ParameterStandardHazard95%HazardRatioVariableDFEstimateErrorChi-SquarePr>ChiSqRatioConfidenceLimitssex10.261750.895510.08540.77011.2990.2257.515age10.052740.052860.99550.31841.0540.9501.169stage1-1.273861.261111.02030.31240.2800.0243.313blood11.106260.618353.20070.07363.0230.90010.158

xray1-2.587121.113645.39690.02020.0750.0080.667chmthrp1-0.540820.848180.40660.52370.5820.1103.0708/23/202449Cox回归分析医疗回归系数及其解释8/23/202450Cox回归分析医疗

回归模型及回归系数的假设检验

ModelFitStatisticsWithoutWithCriterionCovariatesCovariates

-2LOGL61.34445.145AIC61.34457.145SBC61.34461.393TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPr>ChiSq

LikelihoodRatio16.198760.0127Score14.783360.0220Wald11.406660.07668/23/202451Cox回归分析医疗

回归模型及回归系数的假设检验

TheSASSystem16:31Saturday,December4,20056ThePHREGProcedureAnalysisofMaximumLikelihoodEstimates

ParameterStandardHazard95%HazardRatioVariableDFEstimateErrorChi-SquarePr>ChiSqRatioConfidenceLimitssex10.261750.895510.08540.77011.2990.2257.515age10.052740.052860.99550.31841.0540.9501.169stage1-1.273861.261111.02030.31240.2800.0243.313blood11.106260.618353.20070.07363.0230.90010.158

xray1-2.587121.113645.39690.02020.0750.0080.667chmthrp1-0.540820.848180.40660.52370.5820.1103.0708/23/202452Cox回归分析医疗

模型的筛选及有关问题

(1)剔去缺失数据较多,或变异程度几乎为0的因子(如表19-1的“分期”)。(2)单变量分析(表19-2)(3)采用软件进行逐步筛选8/23/202453Cox回归分析医疗

模型的筛选及有关问题(单变量分析)8/23/202454Cox回归分析医疗

模型的筛选及有关问题(逐步回归分析)PROC

PHREG

data=a2;Modelday*censor(0)=sexagestagebloodxraychmthrp/risklimits

selection=stepwisesle=0.05

sls=0.05;RUN;AnalysisofMaximumLikelihoodEstimates

ParameterStandardHazard95%HazardRatioVariableDFEstimateErrorChi-SquarePr>ChiSqRatioConfidenceLimitsblood11.069570.410196.79920.00912.9141.3046.511xray1-0.814190.356335.22090.02230.4430.2200.8918/23/202455Cox回归分析医疗SAS求基线生存率的程序PROC

PHREG

data=a;Modelday*censor(0)=bloodxray/risklimits;baseline

out=phoutsurvival=s_t

stderr=stderr/method=ch;symbol1

i=stepjv=nonel=1;symbol2

i=stepjv=nonel=3;strataxray;proc

gplot

data=phout;plots_t*day=xray;run;proc

print

data=phout;

RUN;8/23/202456Cox回归分析医疗BASELINE

<OUT=SAS-data-set><COVARIATES=SAS-data-set><keyword=name...keyword=name></options>;TheBASELINEstatementcreatesanewSASdatasetthatcontainsthesurvivorfunctionestimatesattheeventtimesofeachstratumforeverypatternofexplanatoryvariablevalues(x)givenintheCOVARIATES=dataset.Bydefault,thedatasetalsocontainsthesurvivorfunctionestimatescorrespondingtothemeansoftheexplanatoryvariables()foreachstratum.Ifyouwantonlytheseestimates,youcanomittheCOVARIATES=option.NoBASELINEdatasetiscreatedifthecountingprocessstyleofinputisusedorifthemodelcontainsatime-dependentvariable.8/23/202457Cox回归分析医疗METHOD=method

specifiesthemethodusedtocomputethesurvivorfunctionestimates.ThetwoavailablemethodsareCH

|

EMPspecifiesthattheempiricalcumulativehazardfunctionestimateofthesurvivorfunctionistobecomputed;thatis,thesurvivorfunctionisestimatedbyexponentiatingthenegativeempiricalcumulativehazardfunction.PLspecifiesthattheproduct-limitestimateofthesurvivorfunctionistobecomputed.ThedefaultisMETHOD=PL.8/23/202458Cox回归分析医疗SAS求基线生存率的结果Obsbloodxrayxray2days_tstderr

11.428570001.00000.21.42857005780.889940.1051531.428570012450.762750.1501741.428570015490.644000.1703251.428570019320.495570.1860861.428570025810.277490.1910371.428570034510.116270.1322181.428570035720.020410.0442091.111111101.00000.101.11111119380.935760.06618111.111111123630.860370.10263121.111111129380.767490.13678131.111111132050.676100.16068141.111111137500.547340.18550151.111111139580.290680.20267161.111111141110.137990.14366171.111111144350.055790.078818/23/202459Cox回归分析医疗SAS求基线生存率的结果8/23/202460Cox回归分析医疗四、Cox模型的适用范围及注意事项1.适用范围Cox模型适用于生存资料的统计分析,属半参数模型,对资料没有特殊的要求,也可以估计各因素的参数,并能做多因素的统计分析。该模型的主要优点在于能从众多的影响因素中排除混杂因素的影响,找出影响生存时间的因素,根据各因素的参数估计出个体的生存

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论