版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Cox回归分析刘瑞红当前1页,总共46页。利用生存率函数S(t,X)与风险函数h(t,X)的关系可导出较好地解决截尾值的问题反映了协变量X与生存函数的关系Cox模型的基本形式当前2页,总共46页。所有危险因素为0时的基础风险率,它是未知的,但假定它与h(t,X)是呈比例的。右侧可分为两部分:h0(t)没有明确的定义,分布无明确的假定,参数无法估计,为非参数部分;另一部分是参数部分,其参数可以通过样本的实际观察值来估计的,正因为Cox模型有非参数和参数两部分组成,故又称为半参数模型。当前3页,总共46页。
若i>0,则RR>1,该因素为危险因素;若i<0,则RR<1,该因素为保护因素;若i=0,则RR=1,该因素为无关因素。
偏回归系数i的意义是,当其它协变量都不变时,Xi每变化一个单位,相对危险度的自然对数(lnRR)变化i个单位。
当前4页,总共46页。相对危险度RR当前5页,总共46页。相对危险度RR
③同时考虑2个协变量,2个因素都存在的危险率与2个因素都不存在时的危险率之比(相对危险度)为
当前6页,总共46页。Cox回归基本模型的两个前提假设
①各危险因素的作用不随时间变化而变化,即不随时间变化而变化;②对数线性假定:模型中的协变量应该与对数风险比成线性关系。
当前7页,总共46页。Cox回归模型与一般的回归分析不同,它不是直接用生存时间作为回归方程的因变量,协变量对生存时间的影响是通过风险函数和基础风险函数的比值反映的,其中的风险函数和基础风险函数是未知的。另外偏回归系数的估计需要借助于偏似然函数的方法。在完成参数估计的情况下,可对基础风险函数和风险函数做出估计,并可计算每一个时刻的生存率。当前8页,总共46页。二、Cox回归分析的一般步骤1.分析前的准备----数据整理2.参数估计,建立最佳模型3.假设检验4.Cox模型的解释及应用5.Cox模型拟合优度的考察当前9页,总共46页。1.分析前的准备----数据整理严密的研究设计收集资料:影响疾病的因素、病人的个性及行为特征等资料(如病人的年龄、性别、职业、是否饮酒、是否吸烟及病情、病理类型等资料)、研究对象的生存时间和截尾指示变量(一般用变量t表示生存时间,用变量d表示是否截尾)。资料应尽量避免偏性及主观因素的影响。样本含量:不宜过小。一般情况下,样本例数应为分析因素的5-20倍。数据预处理:如数据的变换、日历数据与生存时间的转化等。同时要对数据进行描述性分析。当前10页,总共46页。当前11页,总共46页。2.参数估计,建立最佳模型
(1)参数估计----偏似然估计假定有n个病人,他们的生存时间由小到大排列:t1≤t2≤…≤tn
对于每个生存时间ti来说,凡生存时间大于等于ti的所有病人组成一个危险集,记为R(ti)。在危险集内的病人,在ti以前尚生存,但处在危险之中,随着时间的推移,危险集内的病人陆续死亡,逐渐退出观察,直至最后一个病人死亡时,危险集消失。当前12页,总共46页。当前13页,总共46页。代表ti时刻以后危险集R(ti)中对似然函数作贡献的个体将n个病人死亡的条件概率相乘
当前14页,总共46页。两边取自然对数当前15页,总共46页。(2)建立最佳模型为建立最佳模型常需对研究的因素进行筛选,筛选方法有前进法、后退法和逐步回归法。实际工作中要根据具体情况选择使用,最常用的为逐步回归法。因素筛选时需规定显著性水平,一般情况下初步筛选因素的显著性水平确定为0.1或0.15,设计较严格的研究显著性水平可确定为0.05。另外,筛选因素时,还要考虑因素间共线性的影响。当存在共线性时,应考虑消除共线的影响,如采用主成分回归等方法。当前16页,总共46页。3.参数的假设检验(1)似然比检验(likelihoodratiotest)
(2)得分检验(scoretest)(又称为拉格朗日乘数法)(3)Wald检验是三种基于极大似然法大样本检验方法。当前17页,总共46页。似然比检验:用于模型中原有不显著变量的剔除和显著变量的引入,以及包含不同变量数时模型间的比较。检验新增加的协变量是否有统计学意义的统计量为:当前18页,总共46页。当前19页,总共46页。拉格朗日乘子检验(LM)基本思想:拉格朗日乘子检验(LM),又称为Score检验。该检验基于约束模型,无需估计无约束模型。假设约束条件为,在约束条件下最大化对数似然函数,另表示拉格朗日乘子向量,此时,拉格朗日函数为约束条件下最大化问题就是求解下式根,当前20页,总共46页。拉格朗日乘子检验(LM)如果约束成立,对数似然函数值不会有显著变化。这就意味着在一阶条件下,第二项应该很小,特别是应该很小。因此,约束条件是否成立检验转化成检验,这就是拉格朗日乘子检验的思想。
但是直接检验比较困难,有一个等价而简单的方法。如果约束条件成立,在约束估计值处计算对数似然函数的导数应该近似为零,如果该值显著异于零,则约束条件不成立,拒绝原假设。对数似然函数的导数就是得分向量,因此,LM检验就是检验约束条件下参数估计值的得分向量值是否显著异于零,因而,LM检验又称为得分检验。当前21页,总共46页。拉格朗日乘子检验(LM)在最大似然估计过程中,通过解似然方程,可以求出无约束估计量;如果计算有约束估计量在此处得分,则一般不为零,但是如果约束有效,则趋近于零。在原假设成立条件下,当前22页,总共46页。拉格朗日乘子检验(LM)对于线性约束将有关量代入上式得,拒绝域,当前23页,总共46页。拉格朗日乘子检验(LM)LM统计量另一种表达形式,LR、Wald、LM关系(一般情况下成立):当前24页,总共46页。4.Cox模型的解释及应用(1)探索结局事件发生的危险因素,分析各因素的作用大小。(2)计算个体预后指数(prognosisindex,PI),对个体进行定性的预后评价。(3)通过估计生存率,对群体定量地进行预后评价。当前25页,总共46页。影响因素Xi的标准差
标准正态离差
相应偏回归系数的标准误
当前26页,总共46页。
(2)计算个体预后指数(prognosisindex,PI),对个体进行定性的预后评价。
定义第j个观察单位的预后指数为:
式中为第i个协变量的标准偏回归系数的估计值(),为第j个观察单位(个体)第i个协变量的标准化值。若PIj=0,说明该个体死亡风险处于平均水平;若PIj>0,说明该个体死亡风险高于平均水平;若PIj<0,说明该个体死亡风险低于平均水平。当前27页,总共46页。3.通过估计生存率,对群体定量地进行预后评价。
由于生存率与基础生存率相关,故只要估计出基础生存率,再结合各因素的偏回归系数就可以估计出生存率,即当前28页,总共46页。当前29页,总共46页。ti时刻的基础生存率公式
ti时刻的基础累计风险函数公式在tk时刻的死亡人数
ti时刻的生存率计算公式
2.Breslow法当前30页,总共46页。5.Cox模型拟合优度的考察可将研究对象按个体预后指数恰当地分组,用乘积极限法估计各组的生存率曲线,并与按Cox模型预后指数分类的生存率曲线在同一坐标系内进行比较,若两种曲线具有一致性,说明模型拟合较理想。也可以使用卡方检验的方法。当前31页,总共46页。比例风险假定(PH假定):PH假定的检验方法大致可以分为图法和正规的检验方法。图法:即通过观察散点图中散点的分布或趋势是否满足既定模型基本假设下的形状来判断资料是否满足或近似满足模型假定,主要的方法有:比较COX-KM生存曲线、基于累计风险函数的图示法、Schoenfeld残差图、Score残差图;正规的检验方法:通过构造满足既定模型基本假定下服从某一已知分布的统计量,利用P值来检验资料是否满足或近似满足模型假定。主要方法有:时协变量法、线性相关检验、加权残差Score检验、三次样条函数法..\Cox比例风险回归模型诊断及预测有关问题的研究_余红梅.caj.caj当前32页,总共46页。对数线性假定主要的方法:多重β法;鞅残差法;改进的鞅残差法;构造变量法Cox回归影响点的分析鞅残差,剩余残差,得分残差,Schoenfeld残差,加权Schoenfeld残差当前33页,总共46页。R程序:在survival包中的函数:coxph(formula,data,weights,subset,na.action……)formula:反应变量要有Surv()函数定义cox.zph(fit,transform=,global=T/F)检验比例风险假定basehaz(fit,centered=T/F)计算基础风险率的函数当前34页,总共46页。getwd()setwd("C:/Users/Administrator/Desktop")my<-read.csv("pharynx.csv",header=T)attach(my)my<-my[COND!=9&GRADE!=9,]#去掉两个缺失值COND[COND==3|COND==4]<-2COND[COND==0]<-1aa<-table(COND)aamydata<-my[,-c(1,11)]library(survival)fit<-coxph(Surv(TIME,as.numeric(STATUS))~.,data=mydata)#cox比例风险模型函数plot(survfit(fit))summary(fit)当前35页,总共46页。basehaz(fit)#基础风险函数aa<-cox.zph(fit)#比例风险假定的检验print(aa)plot(aa[6])当前36页,总共46页。多重分数多项式模型library(mfp)f<-mfp(Surv(TIME,as.numeric(STATUS))~fp(AGE,df=4,select=0.05)+INST+SEX+TX+GRADE+COND+SITE+T_STAGE+N_STAGE,select=0.15,family=cox,data=mydata)print(f)(rsq=1-sum((f$residuals)^2/sum((mydata$TIME-mean(mydata$TIME))^2))#R^2当前37页,总共46页。SAS程序:procphregdata=;model<生存时间变量*截尾指示变量(数值)>=<自变量>/选项;strata<分组变量名列>freq<变量名列>;by<变量名列>;Proportionality_test:test……;/*比例风险假定,时协变量法*/run;当前38页,总共46页。libnamell'F:\R语言学习\COX';dataa;setll.pharynx;run;dataa;seta;ifcond=9orgrade=9thendelete;ifcond=3orcond=4thencond=2;ifcond=0thencond=1;run;procphregdata=a;modeltime*status(0)=txcondsitet_stagen_stageagegradeinst/selection=stepwiserisklimitssle=0.15sls=0.15;baselineout=coxsurvival=suvstderr=stderr/method=ch;run;当前39页,总共46页。四、Cox模型的适用范围及注意事项1.适用范围Cox模型适用于生存资料的统计分析,属半参数模型,对资料没有特殊的要求,也可以估计各因素的参数,并能做多因素的统计分析。该模型的主要优点在于能从众多的影响因素中排除混杂因素的影响,找出影响生存时间的因素,根据各因素的参数估计出个体的生存率。另外,Cox模型能分析具有截尾数值的生存时间。Cox模型可以分析多种因素对疾病预后的影响,使其更适合于临床的随访研究。Cox模型使临床观察的定性指标又加上定量指标进行分析,提高了分析的效率。当前40页,总共46页。2.注意事项(1)设计阶段应注意的问题①样本的代表性要好。样本的含量为观察协变量的5-20倍。②所有危险因素要在设计时考虑全面,避免漏掉重要因素和加入无关因素。③生存时间的定义要明确。起始事件和终点事件要有明确规定,时间尽可能精确测量。④研究的协变量在研究对象中的分布要适中,否则会给参数的估计带来困难。⑤在设计时要注意影响时间的效应因素。如研究吸烟对肺癌患者生存率的影响,若本来吸烟的人因患肺癌而戒烟,则一般模型不易分析吸烟的作用,需考虑吸烟量随时间变化的趋势。如果研究的因素随时间而发生变化,必要时可以采用伴时协变量的Cox模型进行分析。当前41页,总共46页。
注意事项(2)模型拟合时应注意的问题①多重共线性问题:医学研究中的许多变量间并不是独立的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版餐饮业菜品研发与技术支持服务合同3篇
- 二零二五年度基础设施建设项目承包合同模板2篇
- 二零二五年度商业特许经营合同要点3篇
- 二零二五年度制造业生产线操作工劳务派遣合同3篇
- 2024正规科研实验室租赁合同样本2篇
- 二零二五年度仓储设施共建共享合同2篇
- 2025年度版权侵犯索赔合同2篇
- 2025版家政服务与家庭心理健康咨询合同3篇
- 二零二五年城市轨道交通工程场地调查与风险评估委托合同3篇
- 2024热力换热站设备改造与维修一体化工程合同3篇
- 安全生产培训法律法规
- 广东省广州市2021-2022学年高二上学期期末五校联考生物试题
- 2024年领导干部任前廉政知识考试测试题库及答案
- 2023-2024学年浙江省宁波市镇海区四年级(上)期末数学试卷
- 舞蹈演出编导排练合同模板
- 肠梗阻课件完整版本
- 融资合作法律意见
- 2024年度技术研发合作合同with知识产权归属与利益分配
- 污水泵站运营维护管理方案
- 湖北省武汉市洪山区2023-2024学年六年级上学期语文期末试卷(含答案)
- 2024下半年软考信息安全工程师考试真题-及答案-打印
评论
0/150
提交评论