生存分析(第17章)_第1页
生存分析(第17章)_第2页
生存分析(第17章)_第3页
生存分析(第17章)_第4页
生存分析(第17章)_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第17章生存分析SurvivalAnalysis第二军医大学卫生统计学教研室张罗漫12讲课内容第一节生存分析中的基本概念(重点)第二节生存率的估计与生存曲线第三节生存曲线的log-rank检验第四节Cox比例风险回归模型(重点)23开始观察时间:1992.01.01终止随访时间:2001.12.3141.

两种治疗方法的治愈率相同,但平均治愈天数不同。甲、乙两药物治疗某病治愈率均为90%,甲药治疗的患者平均12天出院,乙药治疗的患者平均7天出院。随访观测评价临床疗效存在三个问题52.一部分研究对象可观测到死亡,得到准确生存时间(完全数据);一部分研究对象中途失访、或死于其它疾病、或观测结束时仍存活,得不到准确生存时间(不完全数据)。3.生存时间分布通常不服从正态分布。随访观测评价临床疗效存在三个问题62个效应变量

生存时间(天数)

结局(死亡或生存、阳性或阴性等)存在不完全数据分布类型复杂生存时间分布常呈正偏态分布生存时间资料的特点7

2个效应变量错误1:忽略生存时间,采用logistic回归分析死亡与否与各Xi的关系。错误2:忽略结局,采用多元线性回归分析生存时间与各Xi的关系。对生存时间资料的错误处理8对生存时间资料的错误处理不完全数据错误1:丢弃不完全数据,只考虑完全

数据,损失了部分信息。错误2:将不完全数据当作完全数据处

理,低估了生存时间的平均水平。9对生存时间资料的错误处理非正态分布数据错误1:描述时采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。错误2:推断时采用常规t检验或方差分析进行各组间生存时间比较。10针对以上生存时间资料的特点,生存分析是将事件发生的结果与随访时间两个因素结合起来、可以对完全或不完全数据进行分析的方法。11第一节生存分析中的基本概念TheBasicConceptofSurvivalAnalysis1112

一、名词解释

1.生存时间(survivaltime,

t)

起始事件终点事件

发病死亡戒烟开始重新吸烟白血病治疗缓解复发冠心病前一次发作下一次发作接触危险因素发病开始服药治愈132.截尾值(censoredvalue,X+)随访中由于某种原因未能观测到病人的明确结局,提示真实生存时间长于观测到的时间原因:失访(一般失访率不应>20%);死于其他疾病;病人生存期超过研究的终止期;治疗措施改变。又称删失值或终检值

,本章讨论右删失情况143.死亡概率(mortalityprobability,q)

死于某时间段内的可能性大小。有删失值时:年初校正人数=原年初人数删失例数/2154.生存概率(survivalprobability,p)单位时段开始时存活的个体到该时段结束时仍存活的可能性。

p=1q有删失值时:年初校正人数=原年初人数删失例数/2165.生存率

(survivalrate,S(t,X))

又称生存函数,累积生存概率。生存概率针对单位时间;生存率针对某个较长时间段,它是生存概率的累积结果。如5年生存率是每一年不同生存概率乘积。协变量17例手术治疗50例肺癌病人,术后1、2、3年的死亡数分别为10、10、10例,无截尾数据。求各年的生存概率和3年生存率。各年生存概率p1=(50–10)/50=0.8000p2=(40–10)/40=0.7500p3=(30–10)/30=0.66673年生存率

S(3)=(N–d)/N

=(50–30)/50=0.4000S(3)=p1×

p2×

p3=0.8000×0.7500×0.6667=0.4000186.风险函数

(hazardfunction,h(t,X))生存时间已达到t的一群具有协变量X的观测对象在t

时刻的瞬时死亡率。本章讨论的重点风险函数h(t,X)是生存率S(t,X)的导数函数,通过研究风险函数同样达到研究生存率的目的。19

二、资料收集(一)随访内容

1.明确开始随访的时间如出院时间、确诊时间、开始治疗时间

2.随访的结局终止随访时间死亡死亡时间生存但中途失访最后一次访问时间死于其他疾病死于该病时间生存但随访结束研究结束时间

3.记录影响生存时间的有关因素20(二)随访方式○○○○○××××时间0始点t终点×

死亡○失访治疗措施改变死于其他疾病21○○○○○××××时间0始点t终点×

死亡○失访治疗措施改变死于其他疾病22○○○○○××××时间

始点t终点×

死亡○失访治疗措施改变死于其他疾病23三、生存分析研究的主要内容1.描述生存过程生存时间分布特点估计生存率及平均生存时间绘制生存曲线2.比较生存过程对各样本生存曲线进行比较3.影响生存时间的因素分析拟合生存分析模型24四、生存分析的基本方法25第一节生存分析中的基本概念25一、名词解释二、资料收集三、生存分析研究的主要内容四、生存分析的基本方法26第二节生存率的估计与生存曲线

(生存过程的描述)26EstimateofSurvivalRate&SurvivalCurve27

一、小样本资料

1.生存率的计算

2.生存率标准误的计算

3.生存曲线

4.中位生存时间281.生存率的计算乘积极限法

(product-limitedmethod)由Kaplan-Meier于1958年提出,又称为Kaplan-Meier法。利用生存概率与概率乘法原理计算生存率29例有人研究了甲种手术方法治疗肾上腺肿瘤病人23例的生存情况,定义从手术后到病人死亡时间为生存时间,得到生存时间(月)如下(+为截尾数据),试计算其生存率与标准误。

1,3,5,5,5,6,6,6,7,8,10,

10,14+,17,19+

,20+

,22+

,26+

31+

,34,34+

,44,59。相同数据只列一次,完全数据与截尾数据相同时,截尾数据在后。300.957×0.955×0.857=0.783312.生存率标准误的计算

由Greenwood1926年提出32总体生存率1-的可信区间

333.生存曲线例

用乙种手术方法治疗与甲种手术方法病情基本相同的肾上腺肿瘤病人20例,定义从手术后到病人死亡的时间为生存时间,得到生存时间(月)如下(+为截尾数据)。试计算其生存率与标准误,并绘制甲、乙两种手术方法的生存曲线。

1,1,2,3,3,4,4,4,6,6,8,9,

9,10,11,12,13,15,17,18。34SPSS实现3536死亡373839每一级阶梯代表一个死亡时间点,在截尾时间点无阶梯。39173440例有人研究了甲种手术方法治疗肾上腺肿瘤病人23例的生存情况,定义从手术后到病人死亡时间为生存时间,得到生存时间(月)如下(+为截尾数据),试计算其生存率与标准误。

1,3,5,5,5,6,6,6,7,8,10,

10,14+,17,19+

,20+

,22+

,26+

31+

,34,34+

,44,59。414.中位生存时间生存率为50%时对应的时间。424.中位生存时间生存率为50%时对应的时间。434344

二、大样本资料

1.生存率的计算

寿命表法(lifetablemethod)由E.Halley(英,1656-1742)最早提出。452418-456=19621962-19.5=1942.5462.生存率曲线4647

第二节生存率的估计与生存曲线47一、小样本资料

乘积极限法

(Kaplan-Meier法)二、大样本资料寿命表法4849第三节生存曲线的log-rank检验

(生存过程的比较)48Log-rankTestforSurvivalCurves50log-rank检验译为时序检验,译为对数秩检验是错误的。log-记录。log-rank检验是对各组生存曲线作整体的比较log-rank检验的基本思想将各组生存时间混合统一排序后,对实际死亡数与期望死亡数进行比较。log-rank检验是一种非参数方法。51例用甲、乙两种手术方法分别治疗病情基本相同的肾上腺肿瘤病人23例与20例,定义从手术后到病人死亡的时间为生存时间,得到生存时间(月)如下(+为截尾数据),问甲、乙两种手术方式后病人生存率有无差别?甲(n=23)1,3,5,5,5,6,6,6,7,8,10,10,14+,17,19+

,20+

,22+

,26+

,31+

,34,34+

,44,59乙(n=20)1,1,2,3,3,4,4,4,6,6,8,9,9,10,11,12,13,15,17,1852H0:两种手术方式后病人的生存曲线相同H1:两种手术方式后病人的生存曲线不相同=0.05是两条生存曲线的整体比较53混合统一排序截尾生存时间5455(1)将两组生存时间混合后统一排序

c1i、c2i分别表示两组截尾数据(2)计算各组的期望死亡数:56(3)求各组的期望死亡人数之和:

(4)计算值:结论:按=0.05水准拒绝H0

,接受H1

,认为两种手术方式后病人的生存曲线有差别。57SPSS软件计算58死亡59差别由三种方法在各时点所取权重不同造成。60第三节生存曲线的log-rank检验59两样本生存曲线比较及SPSS实现61第四节Cox比例风险回归模型

(生存过程影响因素分析)60Cox’sProportionalHazardRegressionModel62

1972年由英国统计学家D.R.Cox

提出,解决以下问题:在生存时间的分布种类繁多且难以确定、存在截尾数据的情况下,研究协变量X与生存函数S(t,X)之间的关系。Cox模型不直接考察生存函数S(t,X)与协变量的关系,而是用风险函数h(t,X)作为应变量。该方法在不对生存时间的具体分布进行假设的情况下分析协变量的影响,大大降低了生存分析的烦琐性,被誉为生存分析研究的里程碑。63DavidRoxbeeCox(英,1924~)1972年发表了在生存分析领域具有开创性的论文《回归模型和寿命表》,提出了著名的Cox比例风险模型,从而极大地推动了寿命分布模型的发展并且拓宽了模型的应用。1990年他因此获得了凯特灵奖和金质奖章。从1966年到1991年,担任著名生物统计学杂志Biometrika编委,发表了300多篇论文,出版了多部著作。他被推举担任了英国皇家统计学会和国际统计机构的会长。64一、Cox模型的基本形式与意义h(t,X)=h0(t)exp(β1X1+β2X2+···+βmXm)h(t,X):风险函数,瞬时死亡率

X=(X1,X2,···,Xm)’:影响生存时间的协变量,不随时间而变化。

h0(t):危险因素为0的基础风险率,分布未知,

与h(t,X)呈比例非参数部分

β=(β1,β2,···,βm)’:偏回归系数参数部分65对于0,1变量,假设危险因素Xj在非暴露组取值为0,在暴露组取值为1:h(t,X)=h0(t)exp(β1X1+β2X2+···+βmXm

)

对于连续变量,假设危险因素Xj取值为k与k+1Cox比例风险回归模型6667例:

为探讨胃癌患者的预后,对是否施行手术治疗(X1,手术=1,否=0)和是否接受放射治疗(X2,放射=1,否=0)的效果进行分析,其偏回归系数分别为-0.360与-0.333。h(t,Xi=1)=h0(t)exp(β1X1+β2X2)=h0(t)exp(0.360×1

0.333×1)=0.5h0(t)

h(t,Xi=0)=h0(t)exp(0.360×0

0.333×0)=

h0(t)RR=h(t,Xi=1)∕h(t,Xi=0)=0.5多因素相对危险度

RR=h(t,Xi=1)/h(t,Xi=0)=exp[β’(Xi=1Xi=0)]68多因素相对危险度

RR=h(t,Xi=1)/h(t,Xi=0)=HR风险比(hazardratio)69

二、参数估计与假设检验(一)参数估计在时刻ti上病人死亡的条件概率为:S代表ti时刻以后危险集R(ti)中对似然函数有贡献的个体。70

n个病人死亡的条件概率相乘,并非通常意义下的似然函数,但Cox证明了它是观察数据在特定意义下的一部分,称为偏似然函数。71

截尾资料(i=0截尾;i=1死亡)的偏似然函数

对ln()求关于j的一阶偏导数,并求其等于0

的解,可得到j的最大似然函数估计值bj。72

(二)假设检验

1.最大似然比检验(maximumlikelihoodratiotest)模型中原有不显著变量剔除与新变量引进;包含不同协变量的模型间比较。733.计分检验(scoretest)新变量是否能够引进模型。2.wald检验(waldtest)模型中的协变量是否应从模型中剔除。74

(三)生存率的估计基础生存率75三、因素的初步筛选与最佳模型的建立常用多元逐步Cox模型分析,SAS程序:

procphreg;modelt*y(1)=X1~Xn/selection=stepwiseslentry=0.05slstay=0.10;

检验各因素是否有统计学意义:

Maximunlikelihoodratiotest(选与剔)Scoretest(选)Waldtest(剔)

76

四、Cox模型的统计描述

1.回归系数(bj)和标准回归系数(bj’)反应某因素Xj对生存时间影响的程度。

2.相对危险度(某因素Xj取值为1与取值为0相比)RR的1–可信区间:773.个体预后指数(personalprognosisindex)PI>0

表示该病人对应的危险度大于平均水平PI=0表示该病人对应的危险度达到平均水平PI<0表示该病人对应的危险度小于平均水平

78

五、应用实例7980X4治疗方式(传统=1,新=0)X5淋巴结是否转移(是=1,否=0)81SPSS软件计算82死亡83基于最大似然估计的向前逐步回归法848586六、Cox模型的注意事项及应用范围设计阶段应注意的问题研究样本要有代表性;协变量在研究对象中的分布要有敏感性;尽可能全部包括影响因素;生存时间要有明确规定;过多的失访容易造成研究结果的偏倚;协变量随时间变化而变化时采用Cox时间依存协变量模型;样本含量一般为自变量个数的15~20倍。87模型配合时应注意的问题消除多元共线的影响;选择单因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论