生存分析课件_第1页
生存分析课件_第2页
生存分析课件_第3页
生存分析课件_第4页
生存分析课件_第5页
已阅读5页,还剩159页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

19

生存分析119生存分析1回归分析1个因变量Y1个自变量X2个以上自变量XY是数值变量Y是分类型变量两个因变量(结局分类变量+时间)生存分析Cox回归④一元回归SimpleregressionLogistic回归Logistic

regression多重回归Multipleregression①②③常用的回归分析:曲线回归线性回归2回归分析1个因变量Y1个自变量X2个以上自变量XY是数值变主要特点:考虑到了每个研究对象出现某一结局所经历的时间长短。生存分析(survivalanalysis)

——将终点事件和出现终点时间所经历的时间结合起来分析的一类统计分析。

3主要特点:考虑到了每个研究对象出现某一结局所经历的时例:某医院泌尿外科医师对可能影响膀胱肿瘤术生生存的因素进行了调查,选择1996-2000年间手术治疗的膀胱肿瘤患者30例,随访截止日期2000年12月30日:编号年龄(岁)肿瘤分级肿瘤大小/cm是否复发手术日期终止观察日期结局生存时间/月162I≤3.0002/10/199612/30/2000存活59264I≤3.0003/05/199608/12/2000死于膀胱瘤54

352II≤3.0104/09/199612/03/1999失访44460I≤3.0006/06/199610/27/2000死于冠心病53559II>3.0007/20/199606/21/1998死于膀胱瘤23659I>3.0108/19/199609/10/1999死于膀胱瘤37…表19-230例膀胱肿瘤患者生存资料的原始记录表4例:某医院泌尿外科医师对可能影响膀胱肿瘤术生生存的因素进行了对缺损数据无法处理。Logistic分析的缺陷:只考虑终点事件的出现与否。

但在研究中,还需要考察对象到达终点时所经历时间的长短,也就是说研究者对医学事件发生、发展所经历的时间感兴趣。

如恶性肿瘤、慢性病等各个观察对象随访各时间点的发生情况,以评价临床疗效和控制的好坏。生存分析5对缺损数据无法处理。Logistic分析的缺陷:只考虑终点事有结局和生存时间两个因变量;生存时间分布不正态—非负且右偏;可能含有删失数据(censor)。生存资料特点:生存分析特点:同时考虑结局和生存时间两个因变量;可处理生存时间分布不正态的问题;可处理删失数据。6有结局和生存时间两个因变量;生存资料特点:生存分析特点:同生存分析19.1概述。

19.2生存率的估计

19.3

生存曲线的比较。19.4Cox比例风险回归模型7生存分析19.1概述19.1生存分析的概述819.1生存分析的概述8三要素:1.

生存时间(survivaltime)

——从规定的观察起点到某一特定终点事件出现的时间长短。终点事件生存时间

观察起点生存分析中的基本概念:9三要素:1.生存时间(survivaltime)随机对照临床试验研究:观察起点通常是随机化分组的时间。观察性研究:观察起点可以是发病时间、第一次确诊时间或接受正规治疗的时间;终点事件可以是某种疾病发生、某种处理的反应、疾病的复发或死亡等。10随机对照临床试验研究:观察起点通常是随机化分组的时间。10终点事件生存时间

观察起点⑴

疾病确诊 死亡 痊愈 死亡⑵治疗开始复发 痊愈⑶

症状缓解 疾病恶化 ⑷

接触毒物 出现毒性反映⑸

接触危险因素 发病观察性研究:11终点事件生存时间观察起点⑴疾病确诊 合格的研究对象出现结果尚未出现结果失访、脱落试验组对照组伴随因素干扰因素随访研究(follow-upstudy)示意图随机对象的临床试验研究:12合格的出现结果试验组对照组伴随因素随访研究(follow-u随访研究:时间终点事件:死于膀胱肿瘤研究截止时点2000/12/30死亡失访死于冠心病死亡死亡生存时间到截止时间事件尚未发生死亡删失13随访研究:时间终点事件:死于膀胱肿瘤研究截止时点死亡失完全数据:在规定的观察期内,对某些观察对象观察到了终点事件发生,从起点到终点事件所经历的时间,称为生存时间的完全数据(completedata)。用符号“t”表示。

删失数据(截尾数据):规定的观察期内,对某些观察对象,由于某种原因未能观察到病人的终点事件发生,并不知道其确切的生存时间,就象病人生存时间在未达到规定的终点就被截尾一样,称为生存时间的删失数据,又称截尾数据,用符号“

t+”表示。

2.生存数据类型:14完全数据:在规定的观察期内,对某些观察对象观察到了终点事件发产生删失数据的常见原因有:

研究结束时终点事件尚未发生;失访;死于其它原因;由于严重药物反应而终止观察或改变治疗措施。15产生删失数据的常见原因有:15生存分析的特点:特点:同时考虑生存结局和生存时间可能含有删失数据(censor);生存时间分布不正态—非负且右偏。生存分析生存资料可处理删失数据;可处理生存时间分布不正态的问题。

处理删失/截尾数据时两种错误的做法:错误1:只考虑确切数据,丢弃截尾数据(损失信息);错误2:将截尾数据当作确切数据处理(低估了生存时间的平均水平)。16生存分析的特点:特点:同时考虑生存结局和生存时间生存分析生存在处理正偏态分布数据时两种错误的做法:错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间)17在处理正偏态分布数据时两种错误的做法:172.生存分析中常用概念:

死亡概率(probabilityofdeath);

生存概率(probabilityofsurvival);

生存率(survivalrate)及其标准误;

中位生存期(mediansurvivaltime)及四分位间距;

风险函数(hazardfunction):t时刻存活的个体在t

时刻的瞬时死亡率。针对单位时间的182.生存分析中常用概念:

死亡概率(proba⑴死亡概率(probabilityofdeath):表示某单位时段开始存活的个体,在该时段内死亡的可能性;如年死亡概率。注意:如果年内有删失,则分母用校正人口数:

校正人口数=年初人口数—删失例数/2末人口数:n-k初人口数:n期间死亡人数:k19⑴死亡概率(probabilityofdeath):表⑵生存概率(probabilityofsurvival):单位时段开始时存活的个体,到该时段结束时仍然存活的可能性。注意:若年内有删失,分母用校正人口数。末人口数:n-k初人口数:n期间死亡人数:k20⑵生存概率(probabilityofsurvival⑶

生存率(survivalrate)

:0时刻存活的个体经历tk时个单位时间段后仍存活的可能性。若资料中无删失数据时:21⑶生存率(survivalrate):0时刻存活的个解:1.

各年生存概率

p1=(50–10)/50=0.80

p2=(40–10)/40=0.75

p3=(30–10)/30=0.672.3年生存率

S(3)=P(T≥3)=(50–30)/50=0.4=

p1×p2×p3【举例】手术治疗50例肺癌病人,术后1,2,3年的死亡数分别为10,10,10例,无截尾数据。试求各年的生存概率和3年生存率。22解:1.各年生存概率【举例】手术治疗50例肺故生存率又称为累积生存概率(cumulativeprobabilityofsurvival),它是随着时间的变化而变化着的,是关于时间的函数,称为生存函数(survival

function)。23故生存率又称为累积生存概率(cumulat若资料中有删失数据,则须分段计算生存概率,再应用概率乘法定理将分时段的生存概率相乘得到生存率:区分:生存率——生存概率生存概率是针对单位时间而言的;生存率是针对某个较长时段的,是生存概率的累计结果。24若资料中有删失数据,则须分段计算生存概率,再应用概率乘法定理生存率的标准误:第j个时间段内死亡人数第j个时间段期初人口数25生存率的标准误:第j个时间段内死亡人数第j个时间段期②生存期的四分位数间距:

Q=P75-P25是反映离散程度大小的指标。⑷

中位生存期及四分位数间距①中位生存期(mediansurvivaltime)

:也称半数生存期,是生存时间中位数(M/P50),表示恰有50%的个体存活的时间,即生存率为50%时对应的生存时间,是描述集中趋势的指标。中位生存期越长,表示疾病的预后越好。26②生存期的四分位数间距:Q=P75-P25⑷中位生存期及⑸

风险函数(hazardfunction)

:t

时刻存活的个体在t时刻的瞬时死亡率。h(t)近似地等于t时刻存活的个体在此后一个单位时段内的死亡概率。27⑸风险函数(hazardfunction)h生存分析的基本步骤:

估计生存率(生存函数)估计生存曲线评价生存时间影响因子的效果生存时间分布的组间比较1.寿命表法2.Kaplan-Meier法在不考虑其它混杂因素的情况下,可用寿命表法和Kaplan-Meier法作Cox回归模型Logrank检验28生存分析的基本步骤:估计生存率(生存函数)估计生存曲线评价21.2生存曲线的估计2921.2生存曲线的估计29生存率估计或称乘积极限法

(productlimitmethod)大样本资料:寿命表法小样本资料:kaplan-meier法30生存率估计或称乘积极限法

(productl19.2.1寿命表法(lifetablemethod)例21-1收集374名某恶性肿瘤患者的随访资料,取时间区间均为1年,整理结果见下午表,试估计各年生存率。3119.2.1寿命表法(lifetablemethod)解析:该生存资料为大样本,生存时间粗略且含有删失数据。方法原理:

1.计算期初有效例数,注意删失数据

期初有效例数=期初病例数-期内删失数/2

2.计算死亡概率、生存概率

死亡概率=期内死亡数/期初有效例数生存概率=1-死亡概率

3.计算生存率。

4.作生存曲线。寿命表法32解析:寿命表法32寿命表法①②③④33寿命表法①②③④33寿命表法曲线为折线。该法只估计时段右端点的生存率,省略了时段内的生存率估计。

恶性肿瘤患者确诊后5年内生存率下降较快,5年后下降较平缓,说明确诊5年内该恶性肿瘤患者的死亡威胁较大。中位生存期34寿命表法曲线为折线。恶性肿瘤患者确诊后5年内生存率【电脑实现】

—SPSS1.数据录入:频数形式生存分析—寿命表法【Time】

生存时间(年)【Status】0:删失数据1:完全数据(死亡)【

Freq】频数35【电脑实现】

—SPSS1.数据录入:频数形式生存分析—寿命2.加权362.加权363.SPSS过程373.SPSS过程37383839394.结果及结果输出:

期初病例数期内删失数期初有效例数期内死亡数死亡概率生存概率生存率概率密度生存率标准误概率密度标准误风险率风险率标准误404.结果及结果输出:期初病例数期内删失数期414119.2.2乘积极限法——kaplan-meier法例19-2

按下表数据,14例膀胱肿瘤<3.0cm患者和16例膀胱肿瘤≥3.0cm患者的生存时间(月)如下,试估计两组生存率。<3.0cm14192628293236404244+4553+5459+≥3.0cm679101112132023252730343743504219.2.2乘积极限法——kaplan-meier法例19解析:以“<3.0cm”组为例,n=14,样本含量较小且含删失数据。方法原理:

1.将生存时间由小到大依次排列,

2.在每个时间区间上,计算死亡人数、删失人数、期初人数、死亡概率、生存概率和生存率。

3.作生存曲线。乘积极限法——kaplan-meier法43解析:乘积极限法——kaplan-meier法43+++①②③④44+++①②③④44Kaplan-Meier法生存曲线为阶梯形曲线。中位生存期45Kaplan-Meier法生存曲线为阶梯形曲线。中位生存期419.2.3生存率的区间估计⑵

假定标准误近似正态分布,则标准误的1-α置信区间为:⑴Greenwood法求生存率的近似标准误:4619.2.3生存率的区间估计⑵假定标准误近似正态分布【电脑实现】

—SPSS1.数据录入生存分析—Kaplan-Meier【

Group】1:

<3.0cm;2:3.0cm【

dtime】

生存时间(月)【Status】0:删失数据1:完全数据(结局事件)47【电脑实现】

—SPSS1.数据录入生存分析—Kaplan-2.SPSS过程482.SPSS过程483.结果及结果输出:

493.结果及结果输出:49

5050515119.3生存曲线的比较

(Logrank检验)5219.3生存曲线的比较

(Log【例19-3】

比较上例中膀胱肿瘤<3.0cm患者和肿瘤≥3.0cm患者的生存曲线,就总体而言,两个生存函数是否有差别?两组或多组频率比较检验?Log-rank检验53【例19-3】比较上例中膀胱肿瘤<3.0cm患者和肿瘤≥319.2.2乘积极限法——kaplan-meier法例19-2

按下表数据,14例膀胱肿瘤<3.0cm患者和16例膀胱肿瘤≥3.0cm患者的生存时间(月)如下,试估计两组生存率。<3.0cm14192628293236404244+4553+5459+≥3.0cm679101112132023252730343743505419.2.2乘积极限法——kaplan-meier法例19检验过程:55检验过程:55组别死亡数未死亡数合计<3.0cm组01414≥3.0cm组11516合计1293056组别死亡数未死亡数合计<3.0cm组01414≥3.0cm57575858【注意事项】Log-rank检验可用于整条生存曲线的比较,也适用于寿命表资料及多组生存率间的比较;Log-rank检验属于单因素分析方法,其应用条件是除比较因素外,影响生存率的各混杂因素在不同的组间均衡。否则,可采用Cox回归。可计算两组死亡的相对危险度(relativeratio,RR)肿瘤≥3.0组对肿瘤<3.0组:意义:肿瘤≥3.0组的死亡风险是对肿瘤<3.0组的2.69倍。59【注意事项】肿瘤≥3.0组对肿瘤<3.0组:意义:肿瘤≥3.19.4

Cox比例风险回归模型

6019.4Cox比例风险回归模型60举例:30例膀胱肿瘤患者的随访记录61举例:30例膀胱肿瘤患者的随访记录61几种分析模型用于生存资料分析的缺陷:Log-rank检验属于单因素分析法,一次只能分析一个因素,那么对影响因素较多的情况就无法应对。Logistic回归模型:可以事件的结局(定性资料)为反应变量,可以解决各因素对结局的影响,但不能解决生存期时间长短的问题。多重线性回归模型,它要反应变量为定量资料,且服从正态分布,而生存时间通常不呈正态分布。62几种分析模型用于生存资料分析的缺陷:Log-rank检验属于Cox回归模型:是由英国伦敦大学的Cox于1972年提出的,它是一种半参数模型;Cox模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响,分析带有删失数据的资料,且不要求资料服从特定的分布类型;主要用于研究多个影响因子对生存时间的影响。63Cox回归模型:63风险函数(hazardfunction)

:t

时刻存活的个体在t时刻的瞬时死亡率。h(t)近似地等于t时刻存活的个体在此后一个单位时段内的死亡概率。64风险函数(hazardfunction)h(tCox模型表达式:h(t):表示具有协变量X1、X2、…、Xp的个体在t时刻的风险函数,表示t时刻存活的个体在t时刻的瞬间死亡率;h0(t):基准风险函数(baselinehazard)表示当X1=X2=…=Xp=0时,个体在t时刻的风险函数。β

1、β

2、…、

β

p:各协变量所对应的回归系数。65Cox模型表达式:h(t):表示具有协变量X1、X2、…任两个群体风险函数之比,即风险比(riskratio,RR或hazardratio,HR)或66任两个群体风险函数之比,即风险比或66RR值与h0(t)无关,也与时间t无关,即模型中的自变量效应不随时间而改变,所以称为比例风险模型假定,又称PH假定。βj的实际意义:在其他自变量固定不变的条件下,变量Xj每增加一个单位所引起的风险比的自然对数。67RR值与h0(t)无关,也与时间t无关,即模型中的自变量效Cox回归模型拟合的基本步骤:

估计参数:β0、β1、β2、…、βilogistic回归方程的假设检验回归方程的统计应用极大似然法列出回归方程回归系数的区间估计1.检验整个模型——似然比检验2.检验单个自变量

——Wald检验68Cox回归模型拟合的基本步骤:估计参数:β0、β1、β举例:

.30例膀胱肿瘤患者的随访记录,试进行患者生存情况的影响因素分析。。69举例:.69【电脑实现】

—SPSS1.数据录入生存分析—Coxanalysis70【电脑实现】

—SPSS1.数据录入生存分析—Coxa2.SPSS过程712.SPSS过程713.结果及结果输出:

列出Cox回归方程(风险函数表达式):相对危险度723.结果及结果输出:列出Cox回归方程(风预后指数(Prognosticindes,PI):其取值越大,则风险函数的取值越大,预后越差。73预后指数(Prognosticindes,PI):其取值越Cox回归的基本假定是比例风险假定(PH假定),即模型中的自变量效应不随时间而改变。只有在满足该假定前提下,基于此模型的分析预测才是可靠有效的;PH假定的判断,最简单的是观察Kaplan-Meier生存曲线。三、Cox回归中PH假定及判断方法74Cox回归的基本假定是比例风险假定(PH假定),即模型中的Cox回归中PH假定的判定方法(1)75Cox回归中PH假定的判定方法(1)75Cox回归中PH假定的判定方法(2)76Cox回归中PH假定的判定方法(2)7619.5结果报告7719.5结果报告77结果报告:⑴生存率的估计:报告生存率估计方法、生存曲线及中位生存期⑵生存曲线比较:报告生存曲线、生存曲线的比较方法、检验统计量及其P值。⑶影响因素分析:报告变量筛选方法、检验水准α、各变量RR值、RR值的95%置信区间及其P值。78结果报告:⑴生存率的估计:报告生存率估计方法、生存曲线及中位附图:肿瘤<3.0cm组和≥3.0cm组生存曲线(K-M法)以Kaplan-Meier法估计肿瘤<3.0cm组和≥3.0cm组的生存率,生存曲线如图1所示。其结果显示:两组中位生存期分别为20个月和36个月;经log-rank检验,两条曲线的差别有统计学意义,肿瘤<3.0cm组的生存率高于肿瘤≥3.0cm组的。结果报告1:79附图:肿瘤<3.0cm组和≥3.0cm组生存曲线结果报告2:膀胱肿瘤死亡的影响因素分析见附表示,经多变量Cox比例风险回归分析显示,肿瘤分级(RR=5.367,95%CI2.540~11.340,P<0.001)、肿瘤大小(RR=2.939,95%CI1.193~7.242,P<0.02),以及是否复发(RR=2.662,95%CI1.080~6.560,P<0.05)与死亡有关。.80结果报告2:膀胱肿瘤死亡的影响因素分析见附表示,小结生存分析是将终点事件和达到终点事件所经历的时间结合起来分析的一种统计学方法,可用于生存率的估计、生存曲线比较、影响因素分析和生存预测。生存曲线的非参数估计方法和寿命表法和Kaplan-Meier法,前者适用于大样本的分组资料;后者适用于小样本或大样本未分组资料,两者均利用概率乘积法定理计算生存率。Log-rank检验是两条或多条生存曲线比较的非参数方法之一,因其能对各组生存曲线作整体比较,实际工作中应用研究较多。Cox模型属比例风险模型、乘法模型;Cox可用于影响因素分析、校正混杂因素后的组间比较以及多因素生存预测。81小结生存分析是将终点事件和达到终点事件所经历的时间结合起区分多重线性回归、logistic回归和Cox回归的异同。82区分多重线性回归、logistic回归和Cox回归的异同。8案例分析(一)某医师收集30例肺癌术后患者的生存情况,有1例由于电话和地址错误无法随访到患者,他设计了以下几种处理方法:①把该病例去掉;②把这例患者写入SPSS数据,但末次随访时间空白,让SPSS自动去分析;③因为某一天(比如2006年9月1日)想随访这例患者但是没有随访到,所以将末次随访时间写为随访当天的日期。另欲分析肺癌术后患者的中位生存期,计算结果为10个月,但是检查原始数据发现,生存时间为10个月的这个患者一直存活到随访结束,似乎与中位生存期的定义相矛盾。.83案例分析(一)某医师收集30例肺癌术后患者的请问:(1)该医师对这例失访患者的处理是否恰当?为什么?正确的处理方法是什么?(2)另有1例患者死于脑梗死,生存分析时应如何处理?(3)该医师的发现是否与中位生存期的定义相矛盾?为什么?.84请问:84答案:(1)该医师对这例失访患者的三种处理都不恰当。应作为删失病例,删失生存时间的计算为从手术切除到最后一次随访的时间。(2)死于脑梗死的病例同样应当作为删失病例。死于脑梗死的病例应当作删失病例,删失生存时间的计算为从手术切除到死于脑梗死的时间。(3)属于概念不清而产生的怀疑。该医师的发现与中位生存期的定义并不矛盾,中位生存期不能与个体生存时间相混淆。85答案:85案例分析(二)

评价A、B两种治疗方案对某病的治疗效果,A组(group=0)12人,B组(group=1)13人。患者分组后检查其肾功能(kidney),功能正常者记为0,异常者记为1。治疗后生存时间为time(天),生存结局status=0表示删失,status=1表示死亡。

.86案例分析(二)评价A、B两种治疗方案对某病的治疗甲医师以生存结局为观察指标,整理得A、B两组死亡情况。考虑到例数较少,采用Fisher确切概率法,得P=0.097,说明两种治疗方法疗效差别无统计学意义。乙医师以生存时间为观察指标,考虑到肾功能是否异常为可能混杂因素,采用多重线性回归进行校正混杂因素后的组间生存时间比较,说明校正肾功能是否异常后,两种治疗方法疗效差别无统计学意义,与甲的结论一致。87甲医师以生存结局为观察指标,整理得A、B两组请问:(1)甲医师和乙医师所采用的统计分析方法是否恰当?为什么?(2)针对原始数据和分析目的,指出正确的分析方法并说明理由。88请问:88案例辨析:甲医师和乙医师所采用的统计分析方法都不恰当。甲医师仅考虑生存结局,未考虑生存时间;乙医师仅考虑生存时间,未考虑生存结局,而且不该采用多重线性回归,因为生存时间并不服从正态分布。正确做法:同时考虑生存结局和生存时间,采用Cox回归进行校正混杂因素后的组间比较。89案例辨析:甲医师和乙医师所采用的统计分析方法都不恰当。甲医师THANKYOU!90THANKYOU!90919119

生存分析9219生存分析1回归分析1个因变量Y1个自变量X2个以上自变量XY是数值变量Y是分类型变量两个因变量(结局分类变量+时间)生存分析Cox回归④一元回归SimpleregressionLogistic回归Logistic

regression多重回归Multipleregression①②③常用的回归分析:曲线回归线性回归93回归分析1个因变量Y1个自变量X2个以上自变量XY是数值变主要特点:考虑到了每个研究对象出现某一结局所经历的时间长短。生存分析(survivalanalysis)

——将终点事件和出现终点时间所经历的时间结合起来分析的一类统计分析。

94主要特点:考虑到了每个研究对象出现某一结局所经历的时例:某医院泌尿外科医师对可能影响膀胱肿瘤术生生存的因素进行了调查,选择1996-2000年间手术治疗的膀胱肿瘤患者30例,随访截止日期2000年12月30日:编号年龄(岁)肿瘤分级肿瘤大小/cm是否复发手术日期终止观察日期结局生存时间/月162I≤3.0002/10/199612/30/2000存活59264I≤3.0003/05/199608/12/2000死于膀胱瘤54

352II≤3.0104/09/199612/03/1999失访44460I≤3.0006/06/199610/27/2000死于冠心病53559II>3.0007/20/199606/21/1998死于膀胱瘤23659I>3.0108/19/199609/10/1999死于膀胱瘤37…表19-230例膀胱肿瘤患者生存资料的原始记录表95例:某医院泌尿外科医师对可能影响膀胱肿瘤术生生存的因素进行了对缺损数据无法处理。Logistic分析的缺陷:只考虑终点事件的出现与否。

但在研究中,还需要考察对象到达终点时所经历时间的长短,也就是说研究者对医学事件发生、发展所经历的时间感兴趣。

如恶性肿瘤、慢性病等各个观察对象随访各时间点的发生情况,以评价临床疗效和控制的好坏。生存分析96对缺损数据无法处理。Logistic分析的缺陷:只考虑终点事有结局和生存时间两个因变量;生存时间分布不正态—非负且右偏;可能含有删失数据(censor)。生存资料特点:生存分析特点:同时考虑结局和生存时间两个因变量;可处理生存时间分布不正态的问题;可处理删失数据。97有结局和生存时间两个因变量;生存资料特点:生存分析特点:同生存分析19.1概述。

19.2生存率的估计

19.3

生存曲线的比较。19.4Cox比例风险回归模型98生存分析19.1概述19.1生存分析的概述9919.1生存分析的概述8三要素:1.

生存时间(survivaltime)

——从规定的观察起点到某一特定终点事件出现的时间长短。终点事件生存时间

观察起点生存分析中的基本概念:100三要素:1.生存时间(survivaltime)随机对照临床试验研究:观察起点通常是随机化分组的时间。观察性研究:观察起点可以是发病时间、第一次确诊时间或接受正规治疗的时间;终点事件可以是某种疾病发生、某种处理的反应、疾病的复发或死亡等。101随机对照临床试验研究:观察起点通常是随机化分组的时间。10终点事件生存时间

观察起点⑴

疾病确诊 死亡 痊愈 死亡⑵治疗开始复发 痊愈⑶

症状缓解 疾病恶化 ⑷

接触毒物 出现毒性反映⑸

接触危险因素 发病观察性研究:102终点事件生存时间观察起点⑴疾病确诊 合格的研究对象出现结果尚未出现结果失访、脱落试验组对照组伴随因素干扰因素随访研究(follow-upstudy)示意图随机对象的临床试验研究:103合格的出现结果试验组对照组伴随因素随访研究(follow-u随访研究:时间终点事件:死于膀胱肿瘤研究截止时点2000/12/30死亡失访死于冠心病死亡死亡生存时间到截止时间事件尚未发生死亡删失104随访研究:时间终点事件:死于膀胱肿瘤研究截止时点死亡失完全数据:在规定的观察期内,对某些观察对象观察到了终点事件发生,从起点到终点事件所经历的时间,称为生存时间的完全数据(completedata)。用符号“t”表示。

删失数据(截尾数据):规定的观察期内,对某些观察对象,由于某种原因未能观察到病人的终点事件发生,并不知道其确切的生存时间,就象病人生存时间在未达到规定的终点就被截尾一样,称为生存时间的删失数据,又称截尾数据,用符号“

t+”表示。

2.生存数据类型:105完全数据:在规定的观察期内,对某些观察对象观察到了终点事件发产生删失数据的常见原因有:

研究结束时终点事件尚未发生;失访;死于其它原因;由于严重药物反应而终止观察或改变治疗措施。106产生删失数据的常见原因有:15生存分析的特点:特点:同时考虑生存结局和生存时间可能含有删失数据(censor);生存时间分布不正态—非负且右偏。生存分析生存资料可处理删失数据;可处理生存时间分布不正态的问题。

处理删失/截尾数据时两种错误的做法:错误1:只考虑确切数据,丢弃截尾数据(损失信息);错误2:将截尾数据当作确切数据处理(低估了生存时间的平均水平)。107生存分析的特点:特点:同时考虑生存结局和生存时间生存分析生存在处理正偏态分布数据时两种错误的做法:错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间)108在处理正偏态分布数据时两种错误的做法:172.生存分析中常用概念:

死亡概率(probabilityofdeath);

生存概率(probabilityofsurvival);

生存率(survivalrate)及其标准误;

中位生存期(mediansurvivaltime)及四分位间距;

风险函数(hazardfunction):t时刻存活的个体在t

时刻的瞬时死亡率。针对单位时间的1092.生存分析中常用概念:

死亡概率(proba⑴死亡概率(probabilityofdeath):表示某单位时段开始存活的个体,在该时段内死亡的可能性;如年死亡概率。注意:如果年内有删失,则分母用校正人口数:

校正人口数=年初人口数—删失例数/2末人口数:n-k初人口数:n期间死亡人数:k110⑴死亡概率(probabilityofdeath):表⑵生存概率(probabilityofsurvival):单位时段开始时存活的个体,到该时段结束时仍然存活的可能性。注意:若年内有删失,分母用校正人口数。末人口数:n-k初人口数:n期间死亡人数:k111⑵生存概率(probabilityofsurvival⑶

生存率(survivalrate)

:0时刻存活的个体经历tk时个单位时间段后仍存活的可能性。若资料中无删失数据时:112⑶生存率(survivalrate):0时刻存活的个解:1.

各年生存概率

p1=(50–10)/50=0.80

p2=(40–10)/40=0.75

p3=(30–10)/30=0.672.3年生存率

S(3)=P(T≥3)=(50–30)/50=0.4=

p1×p2×p3【举例】手术治疗50例肺癌病人,术后1,2,3年的死亡数分别为10,10,10例,无截尾数据。试求各年的生存概率和3年生存率。113解:1.各年生存概率【举例】手术治疗50例肺故生存率又称为累积生存概率(cumulativeprobabilityofsurvival),它是随着时间的变化而变化着的,是关于时间的函数,称为生存函数(survival

function)。114故生存率又称为累积生存概率(cumulat若资料中有删失数据,则须分段计算生存概率,再应用概率乘法定理将分时段的生存概率相乘得到生存率:区分:生存率——生存概率生存概率是针对单位时间而言的;生存率是针对某个较长时段的,是生存概率的累计结果。115若资料中有删失数据,则须分段计算生存概率,再应用概率乘法定理生存率的标准误:第j个时间段内死亡人数第j个时间段期初人口数116生存率的标准误:第j个时间段内死亡人数第j个时间段期②生存期的四分位数间距:

Q=P75-P25是反映离散程度大小的指标。⑷

中位生存期及四分位数间距①中位生存期(mediansurvivaltime)

:也称半数生存期,是生存时间中位数(M/P50),表示恰有50%的个体存活的时间,即生存率为50%时对应的生存时间,是描述集中趋势的指标。中位生存期越长,表示疾病的预后越好。117②生存期的四分位数间距:Q=P75-P25⑷中位生存期及⑸

风险函数(hazardfunction)

:t

时刻存活的个体在t时刻的瞬时死亡率。h(t)近似地等于t时刻存活的个体在此后一个单位时段内的死亡概率。118⑸风险函数(hazardfunction)h生存分析的基本步骤:

估计生存率(生存函数)估计生存曲线评价生存时间影响因子的效果生存时间分布的组间比较1.寿命表法2.Kaplan-Meier法在不考虑其它混杂因素的情况下,可用寿命表法和Kaplan-Meier法作Cox回归模型Logrank检验119生存分析的基本步骤:估计生存率(生存函数)估计生存曲线评价21.2生存曲线的估计12021.2生存曲线的估计29生存率估计或称乘积极限法

(productlimitmethod)大样本资料:寿命表法小样本资料:kaplan-meier法121生存率估计或称乘积极限法

(productl19.2.1寿命表法(lifetablemethod)例21-1收集374名某恶性肿瘤患者的随访资料,取时间区间均为1年,整理结果见下午表,试估计各年生存率。12219.2.1寿命表法(lifetablemethod)解析:该生存资料为大样本,生存时间粗略且含有删失数据。方法原理:

1.计算期初有效例数,注意删失数据

期初有效例数=期初病例数-期内删失数/2

2.计算死亡概率、生存概率

死亡概率=期内死亡数/期初有效例数生存概率=1-死亡概率

3.计算生存率。

4.作生存曲线。寿命表法123解析:寿命表法32寿命表法①②③④124寿命表法①②③④33寿命表法曲线为折线。该法只估计时段右端点的生存率,省略了时段内的生存率估计。

恶性肿瘤患者确诊后5年内生存率下降较快,5年后下降较平缓,说明确诊5年内该恶性肿瘤患者的死亡威胁较大。中位生存期125寿命表法曲线为折线。恶性肿瘤患者确诊后5年内生存率【电脑实现】

—SPSS1.数据录入:频数形式生存分析—寿命表法【Time】

生存时间(年)【Status】0:删失数据1:完全数据(死亡)【

Freq】频数126【电脑实现】

—SPSS1.数据录入:频数形式生存分析—寿命2.加权1272.加权363.SPSS过程1283.SPSS过程3712938130394.结果及结果输出:

期初病例数期内删失数期初有效例数期内死亡数死亡概率生存概率生存率概率密度生存率标准误概率密度标准误风险率风险率标准误1314.结果及结果输出:期初病例数期内删失数期1324119.2.2乘积极限法——kaplan-meier法例19-2

按下表数据,14例膀胱肿瘤<3.0cm患者和16例膀胱肿瘤≥3.0cm患者的生存时间(月)如下,试估计两组生存率。<3.0cm14192628293236404244+4553+5459+≥3.0cm6791011121320232527303437435013319.2.2乘积极限法——kaplan-meier法例19解析:以“<3.0cm”组为例,n=14,样本含量较小且含删失数据。方法原理:

1.将生存时间由小到大依次排列,

2.在每个时间区间上,计算死亡人数、删失人数、期初人数、死亡概率、生存概率和生存率。

3.作生存曲线。乘积极限法——kaplan-meier法134解析:乘积极限法——kaplan-meier法43+++①②③④135+++①②③④44Kaplan-Meier法生存曲线为阶梯形曲线。中位生存期136Kaplan-Meier法生存曲线为阶梯形曲线。中位生存期419.2.3生存率的区间估计⑵

假定标准误近似正态分布,则标准误的1-α置信区间为:⑴Greenwood法求生存率的近似标准误:13719.2.3生存率的区间估计⑵假定标准误近似正态分布【电脑实现】

—SPSS1.数据录入生存分析—Kaplan-Meier【

Group】1:

<3.0cm;2:3.0cm【

dtime】

生存时间(月)【Status】0:删失数据1:完全数据(结局事件)138【电脑实现】

—SPSS1.数据录入生存分析—Kaplan-2.SPSS过程1392.SPSS过程483.结果及结果输出:

1403.结果及结果输出:49

141501425119.3生存曲线的比较

(Logrank检验)14319.3生存曲线的比较

(Log【例19-3】

比较上例中膀胱肿瘤<3.0cm患者和肿瘤≥3.0cm患者的生存曲线,就总体而言,两个生存函数是否有差别?两组或多组频率比较检验?Log-rank检验144【例19-3】比较上例中膀胱肿瘤<3.0cm患者和肿瘤≥319.2.2乘积极限法——kaplan-meier法例19-2

按下表数据,14例膀胱肿瘤<3.0cm患者和16例膀胱肿瘤≥3.0cm患者的生存时间(月)如下,试估计两组生存率。<3.0cm14192628293236404244+4553+5459+≥3.0cm6791011121320232527303437435014519.2.2乘积极限法——kaplan-meier法例19检验过程:146检验过程:55组别死亡数未死亡数合计<3.0cm组01414≥3.0cm组11516合计12930147组别死亡数未死亡数合计<3.0cm组01414≥3.0cm1485714958【注意事项】Log-rank检验可用于整条生存曲线的比较,也适用于寿命表资料及多组生存率间的比较;Log-rank检验属于单因素分析方法,其应用条件是除比较因素外,影响生存率的各混杂因素在不同的组间均衡。否则,可采用Cox回归。可计算两组死亡的相对危险度(relativeratio,RR)肿瘤≥3.0组对肿瘤<3.0组:意义:肿瘤≥3.0组的死亡风险是对肿瘤<3.0组的2.69倍。150【注意事项】肿瘤≥3.0组对肿瘤<3.0组:意义:肿瘤≥3.19.4

Cox比例风险回归模型

15119.4Cox比例风险回归模型60举例:30例膀胱肿瘤患者的随访记录152举例:30例膀胱肿瘤患者的随访记录61几种分析模型用于生存资料分析的缺陷:Log-rank检验属于单因素分析法,一次只能分析一个因素,那么对影响因素较多的情况就无法应对。Logistic回归模型:可以事件的结局(定性资料)为反应变量,可以解决各因素对结局的影响,但不能解决生存期时间长短的问题。多重线性回归模型,它要反应变量为定量资料,且服从正态分布,而生存时间通常不呈正态分布。153几种分析模型用于生存资料分析的缺陷:Log-rank检验属于Cox回归模型:是由英国伦敦大学的Cox于1972年提出的,它是一种半参数模型;Cox模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响,分析带有删失数据的资料,且不要求资料服从特定的分布类型;主要用于研究多个影响因子对生存时间的影响。154Cox回归模型:63风险函数(hazardfunction)

:t

时刻存活的个体在t时刻的瞬时死亡率。h(t)近似地等于t时刻存活的个体在此后一个单位时段内的死亡概率。155风险函数(hazardfunction)h(tCox模型表达式:h(t):表示具有协变量X1、X2、…、Xp的个体在t时刻的风险函数,表示t时刻存活的个体在t时刻的瞬间死亡率;h0(t):基准风险函数(baselinehazard)表示当X1=X2=…=Xp=0时,个体在t时刻的风险函数。β

1、β

2、…、

β

p:各协变量所对应的回归系数。156Cox模型表达式:h(t):表示具有协变量X1、X2、…任两个群体风险函数之比,即风险比(riskratio,RR或hazardratio,HR)或157任两个群体风险函数之比,即风险比或66RR值与h0(t)无关,也与时间t无关,即模型中的自变量效应不随时间而改变,所以称为比例风险模型假定,又称PH假定。βj的实际意义:在其他自变量固定不变的条件下,变量Xj每增加一个单位所引起的风险比的自然对数。158RR值与h0(t)无关,也与时间t无关,即模型中的自变量效Cox回归模型拟合的基本步骤:

估计参数:β0、β1、β2、…、βilogistic回归方程的假设检验回归方程的统计应用极大似然法列出回归方程回归系数的区间估计1.检验整个模型——似然比检验2.检验单个自变量

——Wald检验159Cox回归模型拟合的基本步骤:估计参数:β0、β1、β举例:

.30例膀胱肿瘤患者的随访记录,试进行患者生存情况的影响因素分析。。160举例:.69【电脑实现】

—SPSS1.数据录入生存分析—Coxanalysis161【电脑实现】

—SPSS1.数据录入生存分析—Coxa2.SPSS过程1622.SPSS过程713.结果及结果输出:

列出Cox回归方程(风险函数表达式):相对危险度1633.结果及结果输出:列出Cox回归方程(风预后指数(Prognosticindes,PI):其取值越大,则风险函数的取值越大,预后越差。164预后指数(Prognosticindes,PI):其取值越Cox回归的基本假定是比例风险假定(PH假定),即模型中的自变量效应不随时间而改变。只有在满足该假定前提下,基于此模型的分析预测才是可靠有效的;PH假定的判断,最简单的是观察Kaplan-Meier生存曲线。三、Cox回归中PH假定及判断方法165Cox回归的基本假定是比例风险假定(PH假定),即模型中的Cox回归中PH假定的判定方法(1)166Cox回归中PH假定的判定方法(1)75Cox回归中PH假定的判定方法(2)167Cox回归中PH假定的判定方法(2)7619.5结果报告16819.5结果报告77结果报告:⑴生存率的估计:报告生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论