生存分析课件_第1页
生存分析课件_第2页
生存分析课件_第3页
生存分析课件_第4页
生存分析课件_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生存分析生存分析的概念在临床疗效的评价研究中常常需要进行病例随访研究。对该类研究所得到的资料有一种将随访结局、时间、影响因素同时结合起来考虑的统计分析方法,称为生存分析〔survivalanalysis〕。生存分析是队列研究和临床试验的重要分析方法之一。生存时间资料的特点生存时间资料常因失访等原因造成观察不完全,因而在资料搜集、统计分析和质量控制等方面均有其显著的特点。生存时间资料有如下显著特点:(1)效应变量有2个一是生存时间(天数),二是结局(死亡与否、是否阳性等)。(2)存在截尾数据如有些病人未观察到底,不知他们究竟能活多长时间。(3)分布类型复杂生存时间资料常通过随访获得,因观察时间长且难以控制混杂因素,故其分布常呈偏态,影响因素较多,规律难以估测。因此,生存时间资料不宜简单地计算死亡率,也不能简单地计算生存时间的平均数,必须将两者结合起来分析才能准确地反映疗效和预后的好坏程度,即必须用生存分析方法作统计分析。病例随访资料分析根本概念小样本未分组资料分析大样本分组资料分析根本概念生存时间完全数据截尾数据死亡概率生存概率生存率截尾数据截尾数据〔censoreddata〕在随访工作中,由于某种原因未能观察到病人的明确结局〔即终止事件〕,所以不知道该病人确实切生存时间,它所提供关于生存时间的信息是不完全的。产生截尾现象的原因:①病人失访②病人的生存期超过了研究的终止期③在动物实验中,到达了事先规定的终止事件各种生存数据的表示×o××

19951996199719981999

年份XXXO各种生存数据的表示×o××

199519961997199819992000

年份XXXX死亡概率死亡概率〔mortalityprobability〕记为q,是指死于某时段内的可能性的大小。假设有截尾数据,上式按下式计算时段内校正例数:生存概率生存概率〔survivalprobality〕:记为p,表示在某单位时段开始时存活的个体到该时段结束时仍存活的时机大小。假设有截尾数据,那么分母用校正例数。生存率生存率〔survivalrate〕:记为S(tk),是指观察对象经历tk个时间单位后仍存活的概率。假设有截尾数据,那么分母必须用分时段的校正例数。生存率与生存概率的关系生存分析研究的主要内容

描述生存过程比较生存过程分析影响生存时间的因素生存分析的根本方法非参数法乘积极限法参数法指数分布法

Weibull分布法对数正态回归分析分布法对数logistic回归分析法半参数法

Cox模型分析法

统计描述一般的统计描述属于空间分布范畴,侧重于集中趋势(如平均数、死亡率)和离散趋势(如标准差)。生存时间资料的分布属于时间分布,强调时间过程和截尾数据,故死亡强度必须用概率表示,生存时间不能计算均数,此外还要有时间与死亡结合在一起的指标。手术治疗40例肝癌病人,术后3年中每年死亡数10例,无截尾。试描述其分布的根本特征。死亡概率、生存概率生存率及其标准误生存曲线生存曲线(survivalcurve):是指将各个时点的生存率连接在一起的曲线图。式(12-5)估计的生存率是间断性的,曲线形状分两种类型:①阶梯型:小样本资料用直接法估计的生存曲线(图12-3);②折线型:大样本资料用频数表法估计的生存曲线(图12-4)。

(a)研究终止在475天(b)研究终止在474天图12-3乘积极限法生存曲线(阶梯形)及其半数生存期(Md=158天)半数生存期及其四分位数间距半数生存期(mediansurvivaltime):又称中数生存期,记为T50,其定义为:

T50

=生存率为0.5时所对应的时间 它表示有并且只有50%的个体可活这么长时间,它反映生存期的平均水平。四分位数间距:记为Q,表示中间半数病人生存期的分布范围,它反映生存期的离散程度,其定义为:

Q=T25-T75

式中T25和T75分别是25百分位数和75百分位数,其估计方法同半数生存期。生存分析的资料要求1.死亡例数和比例不能太少这类资料的样本大小主要看死亡例数和比例,而不是总例数,因其信息主要由死亡病例提供,死亡病例少那么信息量小,死亡比例小那么易出现偏性。2.截尾原因无偏性例如,老年患者常因不重视随访而失访,由此可能使估计的生存率偏高。为防止截尾偏性,常需对被截尾者的年龄、职业和地区等构成情况进行分析。3.生存时间尽可能精确因为多数生存分析方法都是在生存时间排序的根底上进行的,即使是小小的舍入误差,也可能改变生存时间顺序而影响结果。对于随访资料,生存时间最好精确到天数。小样本未分组资料分析生存率与标准误生存率曲线总体生存率的估计生存率及其标准误小样本资料(通常为不分组资料),直接采用概率乘法原理估计生存率,称乘积极限法。又称Kaplan-Meier〔KM〕法。是一种非参数法。[例]一组病人的存活时间〔天数〕如下:90,150,210,540,150,270+。用乘积极限法估计生存曲线。计算步骤列出序号;将死亡时间从大到小排列;计算出t时刻初的例数;列出t时刻的死亡数;计算t时刻的死亡概率;计算t时刻的生存概率。生存率的标准误计算公式:乘积极限法估计生存率计算表生存曲线1.00.80.60.40.20.00901802703604505400.5大样本分组资料分析生存率与标准误生存率曲线总体生存率的估计寿命表法计算步骤列出序号整理数据计算期初例数校正期初例数计算死亡概率计算生存概率计算生存率及其标准误寿命表法估计生存率计算表两个生存率曲线的比较对数秩检验〔logranktest〕是以生存时间的对数为根底推导出来的,其根本思想是实际死亡数与期望死亡数之间的比较。统计检验的根本步骤将两组资料混合后统一排序计算在每个生存时间上各组的期望死亡数分别对期望死亡人数求和计算卡方值某医师收集20例脑瘤患者甲、乙两疗法治疗的生存时间〔周〕如表23-2表23-220例脑瘤患者两种疗法的生存时间〔周〕脑瘤患者甲、乙两疗法组生存曲线

甲疗法组乙疗法组比较甲乙两疗法组脑瘤患者的生存率有无差异?生存分析中注意点:应用条件除了生存资料的根本要求之外,还要求各组生存曲线不能交叉。假设出现这种交叉,那么提示可能存在混杂因素,应采用多因素方法来校正混杂作用或分段作统计分析。Cox比例风险回归模型

Cox回归实例

346例手术后的大肠癌患者随访资料可以了解影响术后生存情况的因素。为简单说明问题,从中抽取30例数据见表23-8。其中术后生存时间time以月为单位,status表示随访结局〔其值为0表示相应的术后生存时间为删失值〕。三个协变量分别为:性别sex〔其值为0表示女性,1表示男性〕,年龄age〔岁〕,确诊到进行手术治疗的时间dtime〔月〕。试对此数据作Cox回归分析。将原始数据录入计算软件,首先对每个备选的自变量作单因素Cox回归模型,得到表23-9所示结果。由表23-9可见,在水准上,有统计学意义的因素为年龄和确诊到手术时间。Cox回归应用中的本卷须知1.Cox回归分析结论的正确性要以科学的设计、有代表性的抽样为前提。如果样本例数过少〔多因素分析中死亡例数一般应在自变量个数的10倍以上〕,或者抽样不随机而使得某些变量在其各个水平上分布极偏,很难得到真正的结果。有时回归分析得到的相对危险度与专业知识相悖,并非是什么专业上的新发现,而是设计上的缺陷造成。通过计算机软件进行模型拟合只能保证计算上的准确,不合理的设计得到的数据计算出的结果只能是错得更复杂。另外,虽然它可以利用删失数据的信息,但过多的删失很可能会带来分析结果的偏倚。2.数据的编码可能会严重地影响结论的可解释性。对于某些数值型协变量,根据专业上的考虑转换为等级编码更恰当一些,否那么会得到譬如红细胞每减小一个,患者的死亡率会增加假设干倍的夸大解释;对于无序的多分类协变量,应设置哑变量进入模型,例如4种血型可转换为3个0-1型变量拟合模型,并且这3个变量应作为一个因素整体进出模型,人为地将血型编码为1,2,3,4会造成回归系数或相对危险度解释上的困难。3.本章介绍的Cox回归必须满足PH假定,如果某个协变量不同水平的Kaplan-Meier曲线有明显交叉,或者协变量与时间的交互作用项在Cox回归模型中有统计学意义,那么不能使用本章介绍的比例风险模型,可考虑拟合各种扩展Cox模型,如分层Cox模型或含时协变量的Cox模型等。4.自变量的筛选事实上是一个复杂的建模过程,除了考虑以上问题,需要指出的是各种逐步方法只是一个计算手段,并不能保证总是得到最好的模型。变量筛选时首先要进行专业上的充分考虑,很重要的自变量不能遗漏,专业上无关的变量不参与计算。待选变量较多时可以首先进行单因素分析,将具有统计学意义的变量再进行逐步筛选,以防止总的样本例数不够多而使结果不稳定。必要时可以更换筛选变量的方法并调整检验水准,多数情况下总在方程中的变量可能是有意义的,最终备选的模型一定要结合专业知识来判断,有时甚至可提供1、2个模型备选。小结

1.生存分析是将观察结局和出现这一结局所经历的时间结合起来分析的一种统计分析方法,其主要特点是考虑了每个研究对象出现某一结局所经历的时间长短。生存时间定义为终点事件与起始事件之间的时间间隔。终点事件不限于死亡,可以是疾病的发生、一种处理〔治疗〕的反响、病情复发等。而起始事件是反映研究对象生存过程起始特征的事件。含有删失数据是生存资料的主要特点。另外,生存时间的分布也和常见的统计分布有明显不同,因此需有能分析这类数据的特殊的统计方法。2.生存率与生存概率不同。生存概率是单个时段的结果,而生存率实质上是累积生存概率,是多个时段的累积结果。生存率的非参数估计法有乘积限法〔Kaplan-Meier法〕和寿命表法,乘积限法适用于小样本或大样本未分组资料,寿命表法适用于观察例数较多的分组资料。生存曲线是以观察〔随访〕时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线图。分析时应注意曲线的高度和下降的坡度。中位生存期表示恰有50%的个体尚存活的时间。中位生存期的长短可直观反映预后的好坏。估计中位生存期可用图解法或线性内插法。3.log-ranktest是生存率比较的非参数方法之一,由于该检验能对各组的生存率作整体比较,实际工作中应用较多。多组生存率比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论