Survivalanalysis生存分析.ppt_第1页
Survivalanalysis生存分析.ppt_第2页
Survivalanalysis生存分析.ppt_第3页
Survivalanalysis生存分析.ppt_第4页
Survivalanalysis生存分析.ppt_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Survival analysis,Dep. of Epidemiology and Biostatistics, CPUMS 闫宇翔,生存分析简介,在临床研究中,常对各个观察对象进行随访观察,记录各个时点上事件的发生情况,以评价临床疗效。 比较不同疗法的疗效时,不仅要考虑是否有效,还要考虑从治疗开始到产生疗效的时间。 生存时间一般通过随访收集,常见的随访起点是确诊日期、治疗日期等,最明确的阳性结局是死亡、此外还有复发、致残、痊愈等。 生存分析还可适用于现场追踪研究(发病为阳性)、临床疗效试验(痊愈或显效为阳性)、动物试验(发病或死亡为阳性)等。,资料收集,起始事件 随访时间 终点事件 疾病确诊 死亡,截尾数据的处理,某研究者追踪100名病人,经治疗后的生存情况:第一年有30人死亡,第三年时有20人死亡,共有40人失访(退出观察),10人存活。试估计其生存率 法一:去掉截尾数据 法二:不去掉截尾数据 N=60 N=100 生存数 生存率 生存数 生存率 1年 30 30/60=50% 70 70/100=70% 3年 10 10/60=13% 10 10/100=10%,1 生存分析的基本概念,生存时间:病人从进入观察随访到规定的结局出现,其间所经历的这段时间。 完全数据(complete data):从起点至死亡所经历的时间,即死者的存活时间。 删失数据(censored data):由于失访、改变治疗方案、研究工作结束等情况,使得部分病人不能随访到底,称为删失数据。 失效事件(failure event): 起始事件(initial event),死亡概率与死亡密度函数,死亡概率:表示一个观察对象从开始观察到t时间为止的死亡概率,它是一个随时间上升的函数: 死亡密度函数:表示具有协变量X的所有观察对象在t时刻的瞬时死亡率:,生存率与风险函数,生存函数:又称为累计生存率,简称生存率。表示具有协变量X的观察对象其生存时间T大于t时刻的概率。实际工作中,生存率是用生存时间大于t的病人数对总病人数的比例来估计。 风险函数:表示具有协变量X已生存到时间t的观察对象,每个观察对象从生存时间ttt这一非常小的区间内死亡的概率极限,即生存时间已达到t的一群观察对象在t时刻的瞬时死亡率,生存分析研究的主要内容,描述生存过程:研究生存时间的分布特点,估计生存率及平均生存时间,绘制生存曲线。从而估计出各时点的生存率及中位生存时间,也可分析其生存特点。 比较生存过程:通过生存率及其标准误对各样本的生存率进行比较,以探讨各总体生存过程是否有差别。 影响生存时间的因素分析:通过生存分析模型来探讨影响生存时间的因素,通常以生存时间和结局作为因变量而将影响它们的因素作为自变量,如年龄、性别、病理分型、治疗方式等,通过拟和模型,筛选出影响生存时间的保护因素和有害因素。,生存分析的基本方法,非参数法:不论资料是什么样的分布形式,只根据样本提供的顺序统计量对生存率进行估计,常用的方法有乘积极限法和寿命表法。 参数法:假定生存时间服从特定的参数分布,然后根据已知分布的特点对影响生存的时间进行分析,常用的方法有指数分布法、Weibull分布法、对数正态回归分析法等。 半参数法:兼有参数法和非参数法的特点,主要用于分析影响生存时间和生存率的因素,属多因素分析方法,其典型方法是Cox 模型分析法。,2 生存率的估计与生存曲线,医学研究中的生存资料分部常常不规则、不确定或未知分布,因而常用非参数法估计生存率。 根据样本含量的大小可分别选择 乘积极限法(Kaplan-Meier):小样本时 寿命表法(life table):大样本时,小样本资料生存率及其标准误的计算,生存率的计算:利用条件概率及概率乘法的原理来计算生存率。 (1)将生存时间由小到大排列 (2)列出生存时间t对应的死亡人数d (3)列出各时点t的期初观察人数 (4)计算条件死亡率及条件生存率 (5)计算活过t时点的生存率及其标准误,9例某癌症病人随访记录的生存时间(月)如下 3(2),3,4(3),4,6,7 乘积极限法估计生存率计算表 存活时 死亡 删失 期初 死亡 生存 生存率 标准误 间(年) 人数 人数 人数 概率 概率 t d c n q=d/n p=1-q S(t) SES(t) 3 2 1 9 2/9 7/9 (7/9)=0.778 0.1385 4 3 1 6 3/6 3/6 (7/9)(3/6)=0.389 0.1733 6 1 0 2 1/2 1/2 (7/9)(3/6)(1/2)=0.199 0.1663 7 1 0 1 1 0 (7/9)(3/6)(1/2)(0/1)=0 -,生存率曲线的绘制,在直角坐标系中,将各个时刻的生存率所对应的点标在图上,然后向右连成与横轴平行的阶梯形成一条生存曲线。,生存曲线的应用,直观比较不同治疗方式之间的生存过程 中位生存时间:刚好有50个体其存活期大于该时间,大样本资料的生存分析,寿命表法估计生存率计算表 术后 期内死 期内删 期初观 校正年 死亡 生存 t+1年 标准误 年数 亡人数 失人数 察人数 初人数 概率 概率 生存率 t d c n0 nc= n0-c/2 q=d/nc p=1-q S(t+1) SES(t+1) 0 68 8 233 229.0 0.2969 0.7031 0.7031 0.0302 1 61 7 157 153.5 0.3974 0.6026 0.4237 0.0332 2 38 3 89 87.5 0.4343 0.5657 0.2397 0.0293 3 16 1 48 47.5 0.3368 0.6632 0.1589 0.0254 4 8 0 31 31.0 0.2581 0.7419 0.1179 0.0226,样本例数足够多时,乘积极限法可按时间分组,就是寿命表法。t时刻的生存率为前t时刻前各时间区间生存概率的乘积。,寿命表法生存曲线,寿命表法估计的是时间区间右端点上的生存率,两点间生存率肯定有变化,但不知其变化规律如何,故用直线连接之。,3 生存曲线的比较,生存率组间比较实际上是两条或多条生存曲线的比较。 原理: Log-rank检验是以生存时间的对数为基础推倒出来的,其基本思想是实际死亡数与预期死亡数之间的比较,作卡方检验。 例:9例某癌症病人随访记录生存时间(月)如下: 手术组: 3,3,4,4,7 非手术组: 3,4,4,6 试分析两种方法对生存影响有无差别,Log-rank 检验步骤,(1)建立检验假设(H0):两种方法治疗肝癌病人的生存率相同。 (2)将两组资料混合后统一排序: (3)分别计算各组在不同时点上的期初病例数,并分别求出两样本的合计数 (4)计算各组在时间ti上理论死亡数 (5)求各组的期望死亡人数之和 (6)计算X2 值,Log-rank 检验,初期病例数 理论死亡数 时间 病死数 处理组 对照组 合计 处理组 对照组 3 2 5 4 9 10/9 8/9 4 3 3 3 6 9/6 9/6 6 1 1 1 2 1/2 1/2 7 1 1 0 1 1 0 合计 7 5 4 4.1(T1) 2.9(T2) X2 =(4-4.1)/4.1+(3-2.9)/2.9=0.0034,P0.05,4 COX比例风险模型,生存分析资料,尤其是医学临床随访资料具有一定的特殊性,主要表现在生存时间的分布种类繁多且难以确定,存在截尾数据,需要考虑多个协变量的影响。 生存分析的主要目的在于研究协变量X与观察结果即生存函数之间的关系,传统的方法是考虑回归分析,即各协变量对S(t,X)的影响。由于生存资料包含截尾数据,用一般的方法难以解决上述问题。,COX模型的基本形式,COX模型(半参数模型)回归分析:在特定的假设之下,建立生存时间随多个危险因素变化的回归方程。 COX回归主要用于肿瘤和其他慢性病的预后分析,也可用于队列研究的病因探索。 COX模型不直接考察生存函数S(t,X)与协变量的关系,而是用风险函数h(t,X)作为因变量,并假定,COX模型参数的含义,h(t) 表示具有协变量X的个体在时刻t时的风险函数,又称为瞬时死亡率。 t 表示生存时间 表示与生存时间可能有关的协变量或交互项。可能是定性的或定量的,在整个观察期内它不随时间的变化而变化。 h0(t) 是所有危险因素为0的基础风险率,它是未知的,但假定它与h(t,X)是呈比例的。 为COX模型的回归系数。,公式右侧分为两部分: h0(t) 没有明确的定义,其分布与形状无明确的假定,这是非参数部分;另一部分是参数部分,其参数可以通过样本实际观察值来估计。因而COX模型称为半参数模型。 j与风险函数h (t) 之间有如下关系: (1) j 0,则X j取值越大时, h (t)的值越大,表示病人的死亡危险越大; (2) j0,则则X j取值对 h (t)没有影响 (3)j 0,则X j取值越大时, h (t)的值越小,表示病人的死亡危险越小;,两个分别具有协变量Xi与X j的病人其风险函数之比称为相对危险度,是一个与时间无关的量: 例:为探讨胃癌病人的预后,对是否实行手术治疗(X1,是取值为1,否取值为0)和是否接受放射治疗( X2 ,是取值为1,否取值为0 )的效果进行了分析,其对应的回归系数分别为0.360和0.333,根据所给的数据,接受治疗病人的危险度为 未接受治疗病人的危险度为,参数估计与假设检验,参数估计 最大似然法 模型及变量的显著性检验:,生存率的估计 因素的筛选 筛选方法:向后剔除法、向前引入法及逐步筛选法三种; 检验方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论