医学统计学课件-生存分析第十七章资料讲解_第1页
医学统计学课件-生存分析第十七章资料讲解_第2页
医学统计学课件-生存分析第十七章资料讲解_第3页
医学统计学课件-生存分析第十七章资料讲解_第4页
医学统计学课件-生存分析第十七章资料讲解_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十七章生存分析

(SurvivalAnalysis)

随访研究及统计分析第二军医大学卫生统计学教研室孟虹1/22/20251医学统计学本章内容第一节生存分析的基本概念第二节生存率的估计与生存曲线*第三节生存曲线的Log-rank检验第四节COX比例风险回归模型*第五节寿命表(不讲)*要求掌握概念、方法、用途。1/22/20252医学统计学概述临床上疗效、预后的评价常用疾病的结局指标:如有效率、治愈率、死亡率比较。对于短期内能明确治疗效果的疾病是适用的。但对于远期疗效,上述指标的评价不全面。1/22/20253医学统计学例

某病的疗效比较

治愈率(%)平均治愈时间(月)甲药8020乙药8112疗效除了应评价“结局”的好坏,结局所经历时间长短也是评价疗效重要的指标。1/22/20254医学统计学随访研究随访研究(follow-upstudy)是医学中常用前瞻性研究.例:两种方法肾移植病人术后肾的生存时间和结局(生存率)比较.例:不同方法对某病人(癌症、反复发作疾病)生存时间(缓解时间)与结局(生存率)比较.该类数据通过随访得到,称为随访资料。1/22/20256医学统计学随访研究资料

当研究事件(y)的结局是两分类数据(发生,不发生),并且结局与时间(t)有关,如同时收集事件发生的时间(t),该类数据称为随访资料,分析该数据的统计方法用生存分析。生存分析是将“结局”与“时间”两个因素结合一起研究的统计分析方法。1/22/20257医学统计学一、随访数据概念

1.分析的变量(y)

1)结局事件:指结局出现的特征,如疾病的死亡、复发、发生(

y=1或0)。2)时间间隔变量记为(t)t=结局事件出现日期-事件的起始日期(起始日期可规定:如诊断、用药、手术日期等),t的单位:可用年、月、周表示第一节生存分析的基本概念1/22/20258医学统计学2.截尾数据观察过程中个体因其他原因未观察到明确的结局,称为截尾或删失数据(

censoreddata)。截尾原因有:①失访,②退出研究,如其他原因死亡。③研究时间结束,未出现结局事件。截尾值(censoredvalue):时间(t)=截尾事件日期-起始事件日期记为t+。(例:10+月)1/22/20259医学统计学3.生存数据的特点1)完全数据:研究对象在规定研究期间提供确切的“时间和结局”。2)截尾数据(t+):截尾数据虽然提供的信息不完全,但提供了部分信息,如t=10+年>9年。3)生存数据的结果变量(Y)有两个:时间(t)值,t>0结局状态(y)=“如死亡或截尾值”1/22/202510医学统计学二资料的收集(一)随访研究设计1.明确研究对象的起始事件时间,如手术日期等。2.明确结局事件:如死亡或复发。3.明确研究跨度时间:如2000年至2005年结束。4.记录个体影响结果(y)的其他自变量。1/22/202511医学统计学例:收集生存数据和影响预后的因素。

某病不同药后随访记录(天)

预后因素 随访记录 病例性别处理开始终止是否生存号组日期日期死亡 时间1 1A药98/07/1298/11/29114022B药98/07/0198/12/291 160 3 1A药98/08/2298/11/29099

4 2B药98/10/2098/11/25车祸死亡 36 0

1/22/202512医学统计学(二)随访的方式1.全部观察对象同时接受不同处理(起点相同)随访方式:多见于动物实验(见图17-1,a)2.观察对象在不同时间接受处理因素(起点不同)随访方式:临床试验研究(见图17-1,b)1/22/202513医学统计学起始事件时间如给药0研究结束时间t×O××O×为死亡O为截尾动物实验随访数据(图17-1,a)1/22/202514医学统计学90年91年92年93年(研究结束)死亡失访死亡一批病人不同时间进入研究的随访资料起点存活起点起点起点起点存活1/22/202515医学统计学

资料整理和记录

某人研究手术方法治疗23位肾上腺肿瘤病人的生存时间(月)如下:1,3,5(3),6(3),7,8,10(2),14+,17,,19+,20+,22+,26+,31+,34,34+,44,59注:()括号内的数为相同时间点的人数数据另一种记录:对象编号生存时间(t)结局状态(0为截尾值)11121401/22/202516医学统计学(三)生存分析主要研究的内容1.统计描述:计算不同时间点(t)的生存率,描述生存过程。2.统计推断:检验不同处理方式的生存过程有无统计差别.3.自变量(x)对生存时间(t)的关系:影响生存时间的危险因素分析.1/22/202517医学统计学第二节生存率的估计与生存曲线

(一)描述生存资料的几个指标1.不同时间点生存率2.生存曲线3.中位生存时间1/22/202518医学统计学几个率概念死亡率、死亡概率、生存概率、生存率死亡率:表示在单位时间(年)内死亡发生的频率(年平均死亡水平)。1/22/202519医学统计学

死亡概率(F):在某时间段(t)开始存活的个体,死于(t+△t)该时段内的可能性。生存概率(pi=1-F):

指某时间段开始存活的个体到该时间段结束时仍存活的概率。

(17-1)死亡概率、生存概率1/22/202520医学统计学生存率(survivalrate)

称为生存函数记为S(t)

S(t):指观察对象从起始事件(如手术时间为0点)开始,到t时刻仍存活的概率。常用n年生存率表示。

时间ti,i=1,2,3…n假设数据是完全数据,计算见例1/22/202521医学统计学例:某病病人术后生存率生存期初死亡生存死亡生存生存率人数人数人数概率概率[0,1]10010900.10.90.90[1,2]9010800.110.890.80[2,3]8020600.250.750.60

1/22/202522医学统计学生存时间数据分析时整理示意图

死亡02468101214161820年“t”表示从研究起点到结局出现时间t失访失访死亡死亡死亡1/22/202523医学统计学生存率S(t)的概率乘法估计S(t)也称累计生存概率,t时刻存活是t时刻之前一直生存的累积。概率乘法原理计算(359页)Pi为某时间区间(ti)的生存概率。假定个体在各时段生存是独立。(公式17-2)1/22/202524医学统计学2.生存曲线:(survivalcurve)指各时点(t)为横轴,生存率S(t)为纵轴,连接一起的曲线图。描述生存率在各时点(t)的变化过程。3.半数生存期(中位数生存时间)即生存率为0.5时对应的时间(t),描述一组数据平均生存时间。注:生存时间(t)是正偏态分布。1/22/202525医学统计学甲手术乙手术图17-2两种手术治疗方式术后病人生存曲线的比较月1/22/202526医学统计学(二)生存率估计的统计方法

(非参数方法)1.小样本数据生存率计算*。用kaplan-Meier的乘积极限法(product-limitmethod,PL法)方法:1)将生存时间t由小到大排列。截尾值排在完全数据后,例:20,20+2)列出t时刻死亡数(d)3)生存率估计用概率乘法原理例:17-1和表17-11/22/202527医学统计学例17-1:某手术方法(甲法)治疗23例肾上腺肿瘤病人后生存情况(讲义358页)生存时间(t,月),其中“+”者为截尾数据1,3,5(3),6(3),7,8,10(2),14+,17,19+,20+,22+,26+,31+,34,34+,44,59计算生存率s(t)和生存曲线1/22/202528医学统计学表17-1甲种手术后病人生存率的计算方法

时间(月)死亡期初死亡生存生存率ti

人数人数概率概率

11230.0430.9570.95731220.0450.9550.91453210.1430.8570.78363180.1670.8330.65271150.0670.9330.60981140.0710.9290.565102130.1540.8460.47814+0110.0001.0000.4781/22/202529医学统计学表17-1资料甲手术描述指标(SPSS软件)

SurvivalStandard95%ConfidenceTimeerrorIntervalMean:24.234.99(14.44,34.01)Median:10.006.96(.00,23.63)

表17-2资料乙手术描述指标SurvivalStandard95%ConfidenceTimeErrIntervalMean7.801.18(5.50,10.10)Median6.002.98(0.16,11.84)1/22/202530医学统计学2.大样本资料的生存分析方法—寿命表法(Life-tablemethod)表17-32418例男性心绞痛病人生存率情况术后死亡截尾期初校正生存生存率年数人数人数人数人数概率(t+1)0-4560241824180.81140.81141-2263919621942.50.88370.7172-15222169716860.90980.6524校正人数=1962-39/2=1942.5例17-31/22/202531医学统计学寿命表法与PL的区别1.计算在时间段的生存率。如0-1年、1-2年,时间段组距相等。2.寿命表方法计算死亡概率,用校正观察人数计算。假定有截尾事件的人在各时间组内平均生存为1/2时间。死亡概率=某时间组内死亡人数/校正观察人数(校正观察人数=期初观察人数-截尾人数/2)1/22/202532医学统计学第三节生存曲线的统计检验比较不同方法的生存率,常进行生存率曲线间的比较。方法:时序检验(Log-Ranktest),可对两组或多组生存率曲线做比较.检验假设:H0:两总体的生存率曲线相同H1:两总体的生存率曲线不同α=0.05,如P≤α,拒绝H01/22/202533医学统计学Log-rank检验检验统计量:该χ2服从自由度=比较组数-1Ai为某组各时点实际死亡频数合计.Ti为某组各时点期望死亡频数合计i表示比较组,i=1,2,…k组1/22/202534医学统计学Log-rank检验的基本思想时间

甲法手术组乙法手术组合计tT1iT2i12311.6052021.39543322200.5501810.450401

表17-4部分数据,365页按两组合计死亡率计算各组理论频数(T).1/22/202535医学统计学两组生存率曲线的检验

H0:s(t1)=s(t2)ν=组数-1=2-1,p<0.01结论:两生存率曲线有统计差别,甲手术方法后生存率高于乙法.1/22/202536医学统计学甲手术乙手术图17-2两种手术治疗方式术后病人生存曲线的比较月1/22/202537医学统计学第四节COX比例风险回归模型COX模型用于分析生存事件与多个危险因素(x)的回归关系,以确定X对预后的重要性。生存数据(y)的特殊性:事件结局y=1或0,同时结局经历的时间(t)。有截尾数据。不能单用时间(t)做多元线性回归或用结局做Logistic回归。1/22/202538医学统计学一、Cox模型的基本形式h(t,x):风险函数(hazardfunction)表示具有某危险因素(x)的个体在t时刻的死亡风险率。

公式17-15回归模型1/22/202539医学统计学Cox模型及参数的意义h(t,x)=h0(t)exp(βx)方程由两部分组成:1.h0(t):危险因素X=0时,在ti时刻的基础风险死亡率。h0(t)是未知的。2.exp(βx):危险因子的系数假定Exp(βX)与t变化无关的风险因子1/22/202540医学统计学h(t,x)01.00.20.40.60.81234时间t死亡风险率比例风险率函数示意图假定在任何时刻t,死亡风险的比值是不变的。1/22/202541医学统计学COX回归模型又称为比例风险率模型

(proportionhazardmodel,PH)

模型的另一表达方式或1/22/202542医学统计学COX回归系数β的含义某风险函数β表示有危险因素(x=1)与无危险因素(x=0)的个体相比,两组死亡率相对危险度的对数值。

1/22/202543医学统计学相对危险度(Relativerisk,RR)RR:指暴露于某种危险因素观察对象的发病(死亡)率(P1)与无暴露因素组观察对象发病(死亡)率(P0)的比值。RR>1说明有暴露因素存在,发生疾病危险性相对于对照组的倍数,反映暴露因素与疾病的关联(因果)关系。常用于前瞻性或队列研究。1/22/202544医学统计学COX模型回归系数(β)在医学中的意义h(t,x)=h0(t)exp(βx)反映某X与死亡风险的关系Β=0,表示某因素(X)与死亡风险无关。Β>0,是死亡的危险因素。Β<0,是死亡保护因素。

如有某危险因素=1,无=01/22/202545医学统计学

βi表示其他因素固定(不变)后,个体有某有协变量(Xi=1)与(X=0)相比,死亡风险率相对危险度的对数值,或Xi每增加一个单位,死亡风险增加βi。多因素Cox回归模型βi的概念1/22/202546医学统计学例368页探讨胃癌患者的预后因素:比较胃癌患者用不同方法后,对其生存时间的预后因素分析,其中X1(手术=1,否=0)、X2(放射治疗=1,否=0)。数据记录和整理:患者编号X1X2生存时间t截尾*110201201150*死亡=1,截尾=01/22/202547医学统计学得COX模型:1/22/202548医学统计学

Β1的含义:做手术者的死亡风险是不做手术者的69.7%。Β1的含义:控制其他因素后(放射因素),做手术与不手术者相比,死亡风险的相对危险度。X1(手术=1,否=0)1/22/202549医学统计学含义:两个方法都治疗的病人的死亡风险是不治疗病人的50%。如

病人甲(X1=1,X2=1)与病人乙(X1=0,X2=0)相比。

1/22/202550医学统计学二.COX模型的参数估计与假设检验

(讲义368-371页)

1.回归系数(βi)的估计βi采用最大似然法估计似然函数得到。2.回归系数(βi)的检验似然比函数和wald检验。(不需要掌握)1/22/202551医学统计学三因素的筛选和最佳模型的建立

(讲义371页)

采用逐步回归法筛选有统计意义的变量逐步回归检验水准:进入方程的检验水准为0.05或0.10变量保留在方程的水准为0.1或0.15

以上计算在统计软件(SAS、SPSS等)均可完成。1/22/202552医学统计学四、COX回归方程在生存分析中

的主要应用1.筛选对死亡风险预后的危险因素估计危险因素(x)的回归系数(β),得到相对危险度(RR)和可信区间。2.校正混杂因素,评价实验处理的效应

例讲义探讨胃癌患者的预后因素3.计算预后指数(PI),对个体预后风险做评价。(17-28)1/22/202553医学统计学五应用实例

例17-5探讨63例恶性肿瘤患者的预后变量名变量量化值X1年龄岁X2性别男1,女2X3组织学类型高分化1,低分化2X4治疗方式传统1,新方法2X5淋巴节是否转移是1否2X6肿瘤浸润程度突破浆膜1无2Y结局死亡0截尾1t生存时间月1/22/202554医学统计学数据录入格式

63例恶性肿瘤患者的生存时间(t,月)与预后因素

患者序号X1X2X3X4X5X6ty154000105212570110051135800111350443110101031Y为结局,死亡=0,截尾=1检验水准:进入水准为0.05,剔除方程水准为0.061/22/202555医学统计学采用逐步回归计算

表17-7COX模型筛选危险因素

变量βSbpRR95%可信区间X41.7610.5470.00135.8221.9817.03X50.9310.4440.03622.5381.066.06X4:传统法=1,新法=0,X5淋巴节转移=1,未转移=0COX模型表达h(t,x)=h0(t)exp(1.761X4+0.931X5)结论:传统法和淋巴节转移是影响肿瘤生存的不利因素.1/22/202556医学统计学例:探讨胃癌患者的预后因素

得COX模型:x1=手术,x2=放疗结论:手术效果优于放疗.问:两种方法何者效果更好?1/22/202557医学统计学例:肺癌病人生存时间与有关因素的分析记录75例肺癌病人的生存时间(月)和18个可能与预后有关的因素年龄、性别、得分、类型、分化、分期、淋巴结侵犯、CEA、P53、、P16、放疗、化疗、手术等分析目的:1.筛选出与预后有关的主要危险因子2.对个体预后危险性进行评价1/22/202558医学统计学COX回归模型结果(逐步回归法)

B SE Wald B’Sig.Exp(B) 年龄.064 .01713.890.77.0001.066 性别-.833 .4253.839-0.35.040 .435 分期.266 .141 3.5850.51.0051.305 CEA.015 .0074.264 0.50.0391.015 NM-.360.2601.920-0.31.001 .698

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论