第15章 生存分析_第1页
第15章 生存分析_第2页
第15章 生存分析_第3页
第15章 生存分析_第4页
第15章 生存分析_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生存分析SurvivalAnalysis一、什么是生存分析?在医学研究中,常常用追踪(followup)的方式来研究事物发展的规律。了解某药物的疗效了解手术后的存活时间了解某医疗仪器设备的使用寿命这种研究的特点是追踪研究的现象都要经过一段时间,统计学上将这段时间称为生存时间。生存分析就是用来研究生存时间的分布规律以及生存时间和相关因素之间关系的一种统计分析方法。二、生存分析的基本概念生存时间(survivaltime):

从某起始事件起到某终止事件止所经历的时间跨度称为生存时间。例如,在临床研究中,急性白血病患者从骨髓移植治疗开始到复发为止之间的时间间隔。冠心病患者在两次发作之间的时间间隔。在流行病学研究中,从开始接触某危险因素到发病所经历的时间。在动物实验研究中,从开始给药到发生死亡所经历的时间。生存时间数据的类型完全数据(completedata):它提供的关于生存时间的信息是完整确切的,也就是说它准确地度量了观察对象实际生存的时间。截尾数据(censoreddata):它提供的关于生存时间的信息是不完整不确切的,也就是说它没有准确地度量观察对象实际生存的时间。例如,在随访过程中某些观察对象失访;或死于其它原因;或在规定的研究过程结束时观察对象的终止事件还未发生。生存时间数据的特点:所有观察值取值非负存在截尾数据生存时间函数:

描述生存时间分布规律的函数,例如,生存函数、死亡函数、死亡密度函数、风险函数生存分析的主要任务:描述生存过程比较生存过程分析危险因素建立数学模型生存函数S(t):观察对象的生存时间T大于某时刻t的概率称为生存函数(survivalfunction)。S(t)满足条件:S(0)=1,S(∞)=0,且0≤S(t)≤1。三、生存时间函数的估计死亡函数F(t):观察对象的生存时间T不大于某时刻t的概率称为死亡函数(failurefunction)。F(t)满足条件:F(0)=0,F(∞)=1,且0≤F(t)≤1。死亡密度函数f(t):观察对象在某时刻t的瞬时死亡率称为死亡密度函数(failuredensityfunction)。风险函数h(t):生存到时刻t的观察对象在时刻t的瞬时死亡率称为风险函数(hazardfunction)。四、生存分析的基本方法描述法:根据样本观察值提供的信息,直接用公式计算出每一时间点或每一个时间区间上的生存函数、死亡函数、风险函数等,并采用列表或绘图的形式来显示生存时间的分布规律。优点:方法简单且对数据的分布无要求。缺点:1)不能比较两组或多组生存时间分布函数的区别;2)不能分析危险因素对生存时间的影响;3)不能建立生存时间与危险因素之间的关系模型。SurvivalFunctionEstimates1.0+**|**SDF|**N|L*N|L*NN0.5+LLNNN|LLNNNN|LLLNNN|L--LN-N--N||N-------------N---N0.0+LN----+----+----+----+----+----+----+----+----+----+----+----- 0102030405060708090100Time无淋巴结浸润患者(N)比有淋巴结浸润患者(L)的平均生存时间长。例如,两组急性淋巴细胞性白血病患者治疗后的随访资料:非参数法:估计生存函数时对生存时间的分布没有要求,并且检验危险因素对生存时间的影响时采用的是非参数检验方法。优点:1)可以估计生存函数;2)可以比较两组或多组生存布函数;3)可以分析危险因素对生存时间的影响;4)对生存时间的分布没有要求。缺点:不能建立生存时间与危险因素之间依存关系的数学模型。参数法:根据样本观察值来估计假定的分布模型中的参数,获得生存时间的概率分布模型。优点:1)可以估计生存函数;2)可以比较两组或多组生存布函数;3)可以分析危险因素对生存时间的影响;4)可以建立生存时间与危险因素之间依存关系的模型。缺点:需要事先知道生存时间的分布。半参数法:不需要对生存时间的分布作出假定,但却可以通过一个模型来分析生存时间的分布规律,以及危险因素对生存时间的影响。例如:Cox比例风险回归模型。优点:1)可以估计生存函数;2)可以比较两组或多组生存布函数;3)可以分析危险因素对生存时间的影响;4)可以建立生存时间与危险因素之间依存关系的模型。5)不需要事先知道生存时间的分布。重点学习内容五、Cox比例风险回归模型

设x=(x1,x2,…,xk)是影响生存时间t的k个危险因素。设h(t,x)表示受危险因素x的影响下,在时刻t的风险率,又设h0(t)表示在不受危险因素x的影响下,在时刻t的风险率。显然h0(t)=h(t,0),并称h0(t)为基准风险率或基准函数。Cox比例风险回归模型是:其中,β1,β2…,βk是待估未知参数,h0(t)是未知表达式。因为对于任意一时刻t,都有:

所以,个体在任何时刻的风险率都正比于基准风险率,比例因子为:可见,RH(x)不随生存时间t的变化而变化。所以这个模型又称为比例风险模型。而且,RH(x)表示个体在因素x影响下的风险率相对于基准风险率之比。参数的估计方法---最大似然法参数的显著性检验方法:似然比检验法,Wald

检验法和比分检验法等。

H0:βj=0vsH1:βj≠03. 模型的显著性检验:似然比卡方检验法

H0:β1=…=βk=0vsH1:βj≠0六、Cox比例风险模型参数的估计和检验六、Cox比例风险模型参数的解释对于一元Cox模型,如果因素x的取值为1和0,分别表示暴露与非暴露于危险因素之下,那么eβ表示受x影响与不受x影响的相对风险。对于一元Cox模型,如果因素x为连续变量,eβ表示相邻两个水平的风险率之比(相对风险率)。对于多元Cox模型,eβj表示在其它因素不变的情况下,因素xj的相邻两个水平的风险率之比。例:为研究某种药物是否会改进急性白血病人的预后,延长其缓解时间。将确诊病人随机给予不同的治疗。一组为用药组(传统治疗加某药),另一组为对照组(传统治疗)。治疗前检测病人白细胞计数(wbc),经一定时间随访,白血病病人的缓解时间列在下表中,其中带-号的是截尾数据。试作Cox模型回归分析因素变量不能随时间变化而变化;样本死亡相对数不能过小;样本含量要足够大;因素各水平组的例数要适当;模型拟合要注意因素之间的交互作用;分类型因素变量要建立哑变量;生存曲线不能随意延长,也不能轻易地用来作预报。七、应用Cox模型的注意事项

线性回归 Logistic回归 Cox回归因变量:连续型变量y分类型变量y 生存时间t 服从正态分布无分布要求 无分布要求模型:y与x的 y取某个值的概率 t的风险函数 线性关系 p与x的关系 h与x的关系系数:b表示x增加一exp(b)=OR,近似表示exp(b)=RH,表示 个单位,y的在x=x*+1时的发病率在x=x*+1时的 改变量 与x=x*时的发病率之风险度与x=x* 比RR 时的风险度之比(在发病率较低时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论