Cox比例风险模型_第1页
Cox比例风险模型_第2页
Cox比例风险模型_第3页
Cox比例风险模型_第4页
Cox比例风险模型_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十九章比例风险模型——Cox回归

ProportionalHazardModel——Cox’sRegression华中科技大学同济医学院流统系宇传华

是一种允许资料有“删失(或截尾)”数据存在的,可以同时分析众多因素对生存时间影响的多变量生存分析方法。是一种半参数方法。Cox回归(Coxregression)生存分析方法

一般可以分为参数、非参数、半参数三类。1、参数法:生存时间的分布符合某一特定类型,如对数正态分布、weibull分布、指数分布、Gamma分布等,则可用特定的分布函数分析,这称之为参数法(参见书第20章,SAS的LifeReg过程步)。2、非参数法:用Kaplan-meier法、或寿命表法求生存率,作生存曲线;用logrank检验或Breslow检验比较两组或几组生存率差异有无统计学意义(SAS的LifeTest过程步)

。3、半参数法:Cox比例风险模型(SAS的PHReg过程步)

一.模型结构:

设有n名病人(i=1,2,…,n),第i名病人的生存时间为ti,同时该病人具有一组伴随变量xi1,xi2,xi3,…,xip。则模型为:第一节模型结构与参数估计

比例风险举例

病人2的死亡风险是病人1的5倍比例风险(假定违背)举例

治疗组与安慰剂病人的死亡风险不呈比例Source:Kay.Pharmaceut.Statist.2004;3:295–297风险——指瞬间风险(instantaneoushazard),或forceofmortality(死亡力),用h(t)表示,是在时间点t尚存个体在短暂时期(Δ)内发生死亡的危险程度。即指生存到时间t的病人,从t到(t+Δ)这一非常小时间区间内的瞬间死亡概率。如Kaplan-Meier法计算的死亡概率qi就是h(t)的估计值。风险函数(Hazardfunction)

二.回归系数的估计方法

偏似然函数(partiallikelihoodfunction,Lp)

分母中j∈Ri表示在ti时刻的所有个体(包括删失个体)风险之和,分子只反映观察到的死亡风险。只有非删失(即死亡)个体才有偏似然函数

偏似然函数(partiallikelihoodfunction,Lp)

对数偏似然函数[l(b)=lnLp]

第二节回归系数及其假设检验1.实例与SAS程序2.回归系数及其解释3.回归模型及回归系数的假设检验4.模型的筛选及有关问题1.实例与SAS程序

例19-1某医师对一所医院1988年收治的16例鼻腔淋巴瘤患者随访了13年,数据见表19-1,试作Cox模型分析。dataa;inputnumsexagestagebloodxraychmthrpcensorday;cards;1 1 45 2 2 0 1 1 5782 0 36 2 2 0 1 1 15493 1 57 2 2 1 0 1 9384 0 45 2 0 1 0 0 47175 0 42 2 0 1 1 1 41116 0 39 2 1 0 1 1 12457 1 38 2 1 1 1 1 44358 1 45 2 2 1 0 1 37509 1 30 2 0 1 0 1 395810 0 45 2 1 0 1 1 258111 0 45 3 1 0 1 1 357212 1 57 2 1 1 0 1 293813 0 57 2 2 0 1 1 193214 1 49 2 2 1 1 1 320515 1 33 2 1 0 1 1 345116 0 51 2 2 1 0 1 2363;PROC

PHREG;Modelday*censor(0)=sexagestagebloodxraychmthrp/

risklimits;RUN;SAS程序SAS程序输出结果TheSASSystem16:31Saturday,December4,20056ThePHREGProcedureAnalysisofMaximumLikelihoodEstimates

ParameterStandardHazard95%HazardRatioVariableDFEstimateErrorChi-SquarePr>ChiSqRatioConfidenceLimitssex10.261750.895510.08540.77011.2990.2257.515age10.052740.052860.99550.31841.0540.9501.169stage1-1.273861.261111.02030.31240.2800.0243.313blood11.106260.618353.20070.07363.0230.90010.158

xray1-2.587121.113645.39690.02020.0750.0080.667chmthrp1-0.540820.848180.40660.52370.5820.1103.0702.回归系数及其解释回归系数实际上是偏回归系数,其意义与多元线性回归模型或Logistic回归模型中的偏回归系数的意义相似。表示控制其他因素条件下,各个因素对回归方程的独立贡献。观察值经过标准化变换后所求得的回归系数称为标准偏回归系数b'。2.回归系数及其解释(续1)

3.回归模型及回归系数的假设检验

ModelFitStatisticsWithoutWithCriterionCovariatesCovariates

-2LOGL61.34445.145AIC61.34457.145SBC61.34461.393TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPr>ChiSq

LikelihoodRatio16.198760.0127Score14.783360.0220Wald11.406660.0766

3.回归模型及回归系数的假设检验(续)

TheSASSystem16:31Saturday,December4,20056ThePHREGProcedureAnalysisofMaximumLikelihoodEstimates

ParameterStandardHazard95%HazardRatioVariableDFEstimateErrorChi-SquarePr>ChiSqRatioConfidenceLimitssex10.261750.895510.08540.77011.2990.2257.515age10.052740.052860.99550.31841.0540.9501.169stage1-1.273861.261111.02030.31240.2800.0243.313blood11.106260.618353.20070.07363.0230.90010.158

xray1-2.587121.113645.39690.02020.0750.0080.667chmthrp1-0.540820.848180.40660.52370.5820.1103.070

4.模型的筛选及有关问题

(1)剔去缺失数据较多,或变异程度几乎为0的因子(如表19-1的“分期”)。(2)单变量分析(表19-2)(3)采用软件进行逐步筛选

4.模型的筛选及有关问题(单变量分析)

4.模型的筛选及有关问题(逐步回归分析)PROC

PHREG

data=a2;Modelday*censor(0)=sexagestagebloodxraychmthrp/risklimits

selection=stepwisesle=0.05

sls=0.05;

RUN;AnalysisofMaximumLikelihoodEstimates(参见书P253的表19-3)ParameterStandardHazard95%HazardRatioVariableDFEstimateErrorChi-SquarePr>ChiSqRatioConfidenceLimitsblood11.069570.410196.79920.00912.9141.3046.511xray1-0.814190.356335.22090.02230.4430.2200.891第三节生存函数的估计SAS求基线生存率的程序PROC

PHREG

data=a;Modelday*censor(0)=bloodxray/risklimits;baseline

out=phoutsurvival=s_t

stderr=stderr/method=ch;symbol1

i=joinv=nonel=1;symbol2

i=joinv=nonel=3;strataxray;proc

gplot

data=phout;plots_t*day=xray;run;proc

print

data=phout;

RUN;SAS求基线生存率的结果TheSASSystem22:52Saturday,December4,200510Obsbloodxrayxray2days_tstderr

11.428570001.00000.21.42857005780.889940.1051531.428570012450.762750.1501741.428570015490.644000.1703251.428570019320.495570.1860861.428570025810.277490.1910371.428570034510.116270.1322181.428570035720.020410.0442091.111111101.00000.101.11111119380.935760.06618111.111111123630.860370.10263121.111111129380.767490.13678131.111111132050.676100.16068141.111111137500.547340.18550151.111111139580.290680.20267161.111111141110.137990.14366171.111111144350.055790.07881SAS求基线生存率的结果风险指数(HI)第四节比例风险假定的检验如果比例风险假定成立,意味着二次对数生存曲线(log-logsurvivalcurves)应该平行.

(a).风险指数分组(图19-2b)(b).放疗协变量分组(鼻血=1.19,图19-2c)图19-3Cox模型生存率两次对数曲线比较放疗=1放疗=0风险=-1风险=1第五节时依协变量时依协变量是指变量的取值或效应大小随时间变化,可分别称之为取值时依协变量和效应时依协变量。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论