应用统计学生存_第1页
应用统计学生存_第2页
应用统计学生存_第3页
应用统计学生存_第4页
应用统计学生存_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生存分析重庆交通大学管理学院7/13/202120:55:56生存分析生存分析:在临床诊疗工作的评价中,慢性疾病的预后一般不适用于治愈率、病死率等指标来考核,因为其无法在短时间内明确判断预后情况,为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗效果。生存分析还适用于现场追踪研究(发病为阳性)、临床疗效试验(痊愈或显效为阳性)、动物试验(发病或死亡)等。重庆交通大学管理学院7/13/202120:55:57基本概念生存时间(Survival

Time):从狭义的角度来说:生存时间是患某病的病人从发病到死亡所经历的时间跨度。生存时间开始发病 病人死亡从广义的角度:从某种起始事件到达某种终点时间所经历的时间跨度。生存时间起始事件 终点事件重庆交通大学管理学院7/13/202120:55:57生存时间的数据类型重庆交通大学管理学院7/13/202120:55:58完全数据(CompleteData)指达到了明确结局的观察对象的生存时间数据。某个观察对象具有明确的结局时,该观察对象所提供的关于生存时间的信息是完整的。截尾数据(CensoredData):由于某种原因未能观察到观察对象的明确的结局,所以不知道该观察对象的确切的生存时间,就象该观察对象的生存时间在未到达规定的终点之前就被截尾了。截尾数据提供了部分关于生存时间的信息,使研究者知道该观察对象至少在已经经历的这个时间长度内没有发生终点事件,其真实的生存时间只能长于我们现在观察到的时间而不会短于这个时间。(符号t+)生存时间资料的特点重庆交通大学管理学院7/13/202120:55:58有2个效应变量:一是生存时间(天数),二是结局(死亡与否、是否阳性等)。存在截尾数据:由于某种原因未能明确观察到随访对象发生事先定义的终终事件。分布类型复杂:生存时间资料常通过随访获得,因观察时间长且难以控制混杂因素,故其分布常呈偏态,影响因素较多,规律难以估测。生存分析方法Kaplan-meier过程这是一种非参数法,主要用于小样本,适用于能够准确记录事件和删失发生时点的数据。Life

Tables过程也叫寿命表法,适用于样本量大,且不太可能准确记载每个观察对象的死亡或删失发生时间的数据。Cox回归模型分析法用于描述多个变量对生存时间的影响重庆交通大学管理学院7/13/202120:55:58Kaplan-meier过程重庆交通大学管理学院7/13/202120:55:58Kaplan-meier法用于:估计某因素不同水平的中位生存时间比较研究因素不同水平的生存时间有无差异控制一分层因素后对研究因素不同水平的生存时间比较例1:3种疗法治疗66例白血病患者缓解时间(天),数据(kaplanm.sav)如下A疗法:4,5,9,10,11,12,13,28,28,28,29,31,32,37,41,41,57,62,74,100,139,20+,258+,269B疗法:8,10,10,12,14,20,48,70,75,99,103,162,169,195,220,161+,199+,217+,245+C疗法:8,10,11,23,25,28,28,31,31,40,48,89,124,143,12+,159+,190+,196+,197+,205+,219+重庆交通大学管理学院7/13/202120:55:58Kaplan-meier过程Kaplan-meier过程重庆交通大学管理学院7/13/202120:55:58Kaplan-meier过程时间变量结局变量分组变量重庆交通大学管理学院7/13/202120:55:58·

当变量为二分类变量时,一般以死亡、复发、恶化等为

终结事件,如本例就是以恶化为终结事件,标记值为1,所以在Single

value框中输入1;如果生存状态变量取值为连续变量时,则在Range

of

values框分别输入下限值和上限值。Kaplan-meier过程重庆交通大学管理学院7/13/202120:55:58重庆交通大学管理学院7/13/202120:55:58Kaplan-meier过程对组间生存函数的差异进行检验的方法Log

Rank法和Breslow法较为常用重庆交通大学管理学院7/13/202120:55:58Kaplan-meier过程Survival:累积生存率估计,选中,表明要求将各观察样本的生存率存入原始数据库中Standard

error

of

survival:累积生存率估计的标准误Hazard:累积风险函数估计Cumulative

events:终结事件的累积频数重庆交通大学管理学院7/13/202120:55:58生存分析表平均生存时间和中位生存时间及其标准误和可信区间累积生存函数曲线Kaplan-meier过程重庆交通大学管理学院7/13/202120:55:58Kaplan-meier过程分析结果……1.观察时间生存状态累积生存率累积生存率的标准差累积死亡数组中剩余人数重庆交通大学管理学院7/13/202120:55:5812

3456(1)生存表分析·

Mean是生存时间的算术均数,Median为中位生存时间,同时表格中也给出它们的95%的可信区间。Kaplan-meier过程分析结果(2)生存时间估计重庆交通大学管理学院7/13/202120:55:58·

Log

Rank、Breslow和Tarone-Ware三种检验方法的检验统计量分别为3.282、2.861和3.360,它们的p值分别为0.194、0.2390.186,说明三组疗法之间生存时间的差异无显著性Kaplan-meier过程分析结果(3)水平间的整体比较重庆交通大学管理学院7/13/202120:55:59分析结果Kaplan-meier过程(4)生存曲线重庆交通大学管理学院7/13/202120:55:59Life

Tables过程用于:制作寿命表绘制各做曲线如生存函数、风险函数曲线等。对某一研究因素的不同水平的生存时间分布进行比较,控制另一个因素后对研究因素不同水平的生存时间分布进行比较,包括从总体上比较和不同水平间进行两两比较。重庆交通大学管理学院7/13/202120:55:59Life-Tables过程例2:某医院对114名男性胃癌患者接受手术后的生存情况进行了11年的随访,得到数据(lifetb.sav)如下Life-Tables过程重庆交通大学管理学院7/13/202120:55:59Life-Tables过程重庆交通大学管理学院7/13/202120:55:59输出生存时间范围及组距:前一个框输入生存时间上限,后一个框输入生存时间的组距Life-Tables过程重庆交通大学管理学院7/13/202120:55:59Life-Tables过程寿命表生存曲线风险函数曲线重庆交通大学管理学院7/13/202120:55:59Life-Tables过程(1)寿命表(分三部分讲解)分析结果重庆交通大学管理学院7/13/202120:55:591.生存时间的组段下限3.该组段的删失例数2.进入该组段的观察例数4.暴露于危险因素的例数5.所关心的事件的例数,即死亡例数Life-Tables过程分析结果重庆交通大学管理学院7/13/202120:55:59(1)寿命表Ⅰ1

2345.所关心事件的观察单位数的比,即各组的死亡概率.各组的生存概率.至本组段上限的生存函数估计值,由各组的生存概率累积相乘所得。.概率密度,所有个体在时点t后单位时间内死亡概率估计值。Life-Tables过程分析结果重庆交通大学管理学院7/13/202120:55:59(1)寿命表Ⅱ12341.风险率。活过时点t个体在时点t后单位时间内死亡概率的估计值2.

生存函数估计的标准误。

3.

概率密度的标准误4.风险率的标准误。234(1)寿命表Ⅲ1Life-Tables过程分析结果重庆交通大学管理学院7/13/202120:55:59Life-Tables过程(2)累积生存函数曲线分析结果重庆交通大学管理学院7/13/202120:55:59基本思想不同:LifeTables过程是将生存时间分成许多小的时间段,计算该段内生存率的变化情况,分析的重点是研究总体生存规律;而Kaplan-Meier过程则是计算每一“结果”事件发生时点的生存率,分析的重点除了研究总体生存规律外,还热心于寻找相关影响因素。对于分层变量的处理不同:LifeTables过程仅按该分层变量进行分层,没有考虑其对生存时间的影响,即没有提供控制该分层变量的情况下对研究因素对生存时间的影响进行统计分析的能力;Kaplan-Meier过程则是在控制该分层变量的情况下对研究因素对生存时间的影响进行统计分析。做出的生存曲线不同统计学检验方法不同:LifeTables过程采用Wilcoxon法,Kaplan-Meier过程用Log

rank法、Breslow法、Tarone-are法Kaplan-Meler法和寿命表法的比较重庆交通大学管理学院7/13/202120:55:59Cox回归模型重庆交通大学管理学院7/13/202120:56:0·

上面介绍的两种生存分析方法只能研究一至两个因素对生存时间的影响,当生存时间的影响因素有多个时,它们就无能为力了,下面介绍CoxRegression过程,这是一种专门用于生存时间多变量分析的统计方法。模型结构:设有n名病人,第i名病人的生存时间为ti,同时该病人具有一组伴随变量xi1,xi2…xip。该病人生存到时间ti的风险函数hi(t)是其基础风险函数ho(t)与相应伴随变量的函数的乘积,其数学表达式为:hi(t)=

h0(t)f(β1xi1+….+βpxip)Cox建议伴随变量的函数为指数形式,故Cox比例风险回归可写为:hi(t)=

h0(t)exp(β1xi1+….+βpxip)式中的h0(t)是当所有伴随变量xi1,xi2,…xip都处于0或标准状态下的风险函数,是一个不确定的值,β1,β2…,βp为回归系数,须用实际资料来估计。重庆交通大学管理学院7/13/202120:56:0Cox回归模型将h0(t)移至等式左边并去自然对数得:ln[hi(t)/h0(t)]=β1xi1+….+βpxip等式左边的部分为相对风险度的自然对数值,等式右边部分为伴随变量与相应回归系术的线性组合。βj(j=1,2,…,p)的实际意义是:在p-1个伴随变量为一定值时,当伴随变量xj每改变一个测定单位时所引起的相对风险度自然对数值的改变量。

Cox模型假定各自变量xj的回归系数βj与危险度间呈指数函数关系。当βj=0时,说明xj对危险度不起作用;βj为正值时xj为危险因子,增大了危险度;βj为负值时xj=1与xj=0的两个危险度相比,则得到一个与h0(t)无关的比值,称为相对危险度。重庆交通大学管理学院7/13/202120:56:0Cox回归模型例3

数据pancer.sav是关于胰脏癌术中接受放疗会否延长病人生存时间

的研究。该研究的终点为死亡,接受手术被定义为计算生存时间的起点。由于该研究是一项未经随机化的观察研究,要正确估计术中接受放疗提

高患者生存时间的效果,还需考虑对其他因子的效果进行调整。重庆交通大学管理学院7/13/202120:56:0Cox回归模型Cox回归模型重庆交通大学管理学院7/13/202120:56:0Cox回归模型重庆交通大学管理学院7/13/202120:56:0ch为有序多分类,将其指定为哑变量进行分析重庆交通大学管理学院7/13/202120:56:0Cox回归模型累积生存函数曲线重庆交通大学管理学院7/13/202120:56:0Cox回归模型Cox回归模型相关性估计重庆交通大学管理学院7/13/202120:56:0·

上表输

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论