王静老师最全的生存分析_第1页
王静老师最全的生存分析_第2页
王静老师最全的生存分析_第3页
王静老师最全的生存分析_第4页
王静老师最全的生存分析_第5页
已阅读5页,还剩103页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

例1:25名恶性肿瘤病人随机分成A(12人)、B(13人)两组,分别采用手术及保守治疗两种方案进行治疗,之后随访观察直到25名病人均死亡,记录下他们的存活时间(单位:天)。见下表所示。2023/3/291安徽医科大学流统系王静制作当前1页,总共108页。2023/3/292安徽医科大学流统系王静制作当前2页,总共108页。例2:25名恶性肿瘤病人随机分成A(12人)、B(13人)两组,分别采用手术及保守治疗两种方案进行治疗,之后随访观察10年,记录他们的存活、死亡情况。见下表所示。2023/3/293安徽医科大学流统系王静制作当前3页,总共108页。2023/3/294安徽医科大学流统系王静制作当前4页,总共108页。对于例1,只比较两组的生存时间长短即可,采用两样本秩和检验。对于例2,若比较两组的存活率,可采用两样本卡方检验;但只考虑了生存效果评价的其中一个方面。而评价生存效果,不仅要看是否出现了某种结局(如:有效、治愈、死亡等),还要考虑出现这些结局所经历的时间长短。(举例说明)2023/3/295安徽医科大学流统系王静制作当前5页,总共108页。措施:采用生存分析方法。生存分析方法特点:(1)能将研究对象的随访结局和生存时间两个因素同时结合起来考虑的一种统计方法;(2)能处理失访等不完全数据,充分利用所获得的信息,对生存时间的分布特征进行描述、比较,对影响生存时间的主要因素进行分析,达到全面评价和比较随访资料的目的。2023/3/296安徽医科大学流统系王静制作当前6页,总共108页。生存分析方法的用途:用于随访研究(即:观察结果并非在短期内能够确定,而需做长期随访观察,如对一些慢性病或恶性肿瘤的预后及远期疗效观察等)。2023/3/297安徽医科大学流统系王静制作当前7页,总共108页。随访研究的特点医学随访研究:1、队列研究——所有被观察对象同时进入研究;2、临床随访研究(一般称“临床试验”)——被观察对象逐个进入研究。在大多数研究中,由于受经费和时间的限制,最终观察时点是固定的,而不是无限制延长的,所以容易产生截尾值。2023/3/298安徽医科大学流统系王静制作当前8页,总共108页。截尾值假设一组肺癌病人手术后,随访记录他们的存活情况,死于肺癌是终点。当观察到规定的时点,除了死于肺癌,还有:

死于其他病、尚活着、因迁移等原因失去联系(即失访),后三者的观察值都未达到终点,不能提供完全的信息,这种不完全数据称为截尾值(censoring)。2023/3/299安徽医科大学流统系王静制作当前9页,总共108页。

终点事件失访

研究时间

观察起点观察终点

队列研究中的截尾情况2023/3/2910安徽医科大学流统系王静制作当前10页,总共108页。

终点事件失访

研究时间

观察起点观察终点

临床随访研究中的截尾情况2023/3/2911安徽医科大学流统系王静制作当前11页,总共108页。基本概念2023/3/2912安徽医科大学流统系王静制作当前12页,总共108页。1、生存时间(survivaltime)(狭义)从发病到死亡所经历的时间;(广义)从某种起始事件到某种终点事件所经历的时间,又称失效时间(failuretime),表示为t。2023/3/2913安徽医科大学流统系王静制作当前13页,总共108页。“生存”和“死亡”扩展为具有两类互斥结果的事件,“生存”是某事件某状态的持续,“死亡”是某终点事件的发生。

“生存时间”扩展为某事件某状态所持续的时间或过程。2023/3/2914安徽医科大学流统系王静制作当前14页,总共108页。2、起点事件和终点事件(endpointevent)终点事件也称为观察结果(outcome),是指研究者关心的研究对象的特定结局,当被观察对象出现终点事件通常记为1,出现截尾记为0。起点事件是反映研究对象生存过程的起始特征的事件。生存时间的起点和终点要有严格、统一的定义,以便于计算生存时间。2023/3/2915安徽医科大学流统系王静制作当前15页,总共108页。3、暴露因素及混杂因素除了要研究的危险因素(暴露因素)外,还要控制混杂因素的影响。必须分清暴露因素和混杂因素。如:在比较A、B两种治疗方案治疗某恶性疾病的生存情况的同时,病人的肾功能状况也影响治疗后的生存情况。这项研究中,暴露因素为A、B两种治疗方案,混杂因素是肾功能状况。2023/3/2916安徽医科大学流统系王静制作当前16页,总共108页。随访资料的特点1、生存时间的分布呈偏态。一般为正偏态,因为生存时间一般为单调递减。102名黑色素瘤患者的生存时间资料,做直方图。2023/3/2917安徽医科大学流统系王静制作当前17页,总共108页。2023/3/2918安徽医科大学流统系王静制作当前18页,总共108页。2023/3/2919安徽医科大学流统系王静制作当前19页,总共108页。2、数据中常含有截尾值。如41+(天),表示该病人至少活了41天;虽然不知道确切时间,但此类不完全数据包含一定信息,需要生存分析这特殊方法来利用这些信息。组别生存时间(天)A273541+…

…B9980+102…

…2023/3/2920安徽医科大学流统系王静制作当前20页,总共108页。2023/3/2921安徽医科大学流统系王静制作当前21页,总共108页。生存分析的主要内容及研究方法2023/3/2922安徽医科大学流统系王静制作当前22页,总共108页。

主要内容研究方法1、生存过程的描述

乘积-极限法(Kaplan-Meier)寿命表法(LifeTables)2、生存过程的比较

对数秩检验(log-rank)3、影响因素的分析

Cox比例风险模型

2023/3/2923安徽医科大学流统系王静制作当前23页,总共108页。生存分析对资料中应变量的要求:2023/3/2924安徽医科大学流统系王静制作当前24页,总共108页。1、达到终点的例数所占的比例不能太少,即完全数据占大部分,截尾值所占的比例要<10%;2、截尾原因无偏性;3、生存时间尽可能精确。2023/3/2925安徽医科大学流统系王静制作当前25页,总共108页。常用的研究指标2023/3/2926安徽医科大学流统系王静制作当前26页,总共108页。1、生存函数(survivalfunction)又称累积生存概率(cumulativesurvivalprobability)、生存率,表示个体生存时间T≥t的概率。2023/3/2927安徽医科大学流统系王静制作当前27页,总共108页。生存概率与生存率生存概率:在单位时段开始存活的个体到该时段结束时仍存活的可能性,用p表示;生存率:观察个体活过t个单位时间的概率,用S(t)表示。如数据中无截尾值,则生存率计算公式为:S(t)=生存时间≥t的病人数/随访病人总数如有截尾值,则分时段计算不同单位时段的生存概率p1、p2、…pt,S(t)=p1×p2×…×pt,即累积生存概率。2023/3/2928安徽医科大学流统系王静制作当前28页,总共108页。2023/3/2929安徽医科大学流统系王静制作当前29页,总共108页。可采用SPSS软件中生存分析方法计算出生存率大小,并画出生存函数图(或生存率曲线)直接观察。2023/3/2930安徽医科大学流统系王静制作当前30页,总共108页。2023/3/2931安徽医科大学流统系王静制作当前31页,总共108页。2023/3/2932安徽医科大学流统系王静制作当前32页,总共108页。2、半数生存时间(mediansurvivaltime)又称中位生存时间,表示累积生存概率(生存率)为50%的时候所对应的生存时间;为中位数指标,因为生存时间的分布是偏态的。在分析结果中给出中位生存时间;从生存曲线图中也能估计出相同结果。2023/3/2933安徽医科大学流统系王静制作当前33页,总共108页。2023/3/2934安徽医科大学流统系王静制作当前34页,总共108页。3、风险函数(hazardfunction)又称危险率函数等,一般用h(t)表示,表示生存时间已达t的个体在t时刻的瞬时风险率;在Cox比例风险模型中风险函数常用λ(t)表示。h(t)=死于区间(t,t+⊿t)的病人数在t时刻尚存的病人数×⊿t⊿t为极小时间段。2023/3/2935安徽医科大学流统系王静制作当前35页,总共108页。2023/3/2936安徽医科大学流统系王静制作当前36页,总共108页。4、风险比(hazardratio)是指同一时点两组的风险函数之比,即相对危险度RR。风险比=第一组个体的h1(t)第二组个体的h2(t)

(1)比例风险:风险比与时间无关,即任何时刻,两组的风险比值是相等的;(2)非比例风险或时间依赖型:风险比与时间有关。2023/3/2937安徽医科大学流统系王静制作当前37页,总共108页。乘积—极限法(Kaplan-Meier)寿命表法(Lifetable)Analyze→Survival→Lifetable、Kaplan-Meier用途:1、做出生存表、估计生存率,并绘出两组的生存曲线图和风险函数图;2、进行两组生存资料的比较。2023/3/2938安徽医科大学流统系王静制作当前38页,总共108页。

LifetableKaplan-Meier共同点:非参数分析方法、一般用于单因素分析适用条件大样本资料大样本、小样本资料生存表人为划分各时间段每个时间值为一段多组间的生存率比较方法(方法选择途径)

“Options”对话框“CompareFactors”对话框2023/3/2939安徽医科大学流统系王静制作当前39页,总共108页。见下例word文档中的数据及对应的SPSS数据文件KM1.sav,采用乘积极限法进行分析。注意:1)SPSS数据文件格式;2)SPSS中乘积极限法的操作过程;3)乘积极限法的具体结果解释。2023/3/2940安徽医科大学流统系王静制作当前40页,总共108页。2023/3/2941安徽医科大学流统系王静制作当前41页,总共108页。2023/3/2942安徽医科大学流统系王静制作当前42页,总共108页。2023/3/2943安徽医科大学流统系王静制作当前43页,总共108页。2023/3/2944安徽医科大学流统系王静制作当前44页,总共108页。2023/3/2945安徽医科大学流统系王静制作当前45页,总共108页。2023/3/2946安徽医科大学流统系王静制作当前46页,总共108页。2023/3/2947安徽医科大学流统系王静制作当前47页,总共108页。2023/3/2948安徽医科大学流统系王静制作当前48页,总共108页。注意事项:组间的生存率比较时,要求各组的生存曲线不能交叉,若出现交叉,提示可能存在混杂因素,应采用多因素方法来校正混杂因素或分层做统计分析。2023/3/2949安徽医科大学流统系王静制作当前49页,总共108页。采用Lifetable法对某生存数据进行分析2023/3/2950安徽医科大学流统系王静制作当前50页,总共108页。2023/3/2951安徽医科大学流统系王静制作当前51页,总共108页。2023/3/2952安徽医科大学流统系王静制作当前52页,总共108页。生存分析中的多因素分析方法2023/3/2953安徽医科大学流统系王静制作当前53页,总共108页。2023/3/2954安徽医科大学流统系王静制作当前54页,总共108页。2023/3/2955安徽医科大学流统系王静制作当前55页,总共108页。(生存分析方法中单因素与多因素分析的区别)若只比较男、女的生存情况优劣,则可采用前面所述的单因素分析方法——乘积极限法、寿命表法。而在实际工作中,研究者关心的影响因素不止一个,如在此例中,除了性别,还有年龄等其他因素。因此,应采用多因素分析方法。2023/3/2956安徽医科大学流统系王静制作当前56页,总共108页。(多元线性回归、多元logistic回归与生存分析中多因素回归分析方法的区别)如果仅以生存时间为反应变量做多元线性回归,则生存时间并不一定服从近似正态分布,不满足线性回归的要求;若仅以是否达到终点为反应变量做多元logistic回归,则未能充分利用生存时间长短的信息。而且两者均未考虑到资料中删失数据提供的信息。2023/3/2957安徽医科大学流统系王静制作当前57页,总共108页。解决措施:采用生存分析中的多因素回归。生存分析中的多因素回归同时以生存时间、结局为反应变量,有效利用不完全数据提供的信息,从而探索生存的影响因素。2023/3/2958安徽医科大学流统系王静制作当前58页,总共108页。生存分析中的多因素回归包括:半参数方法:cox比例风险模型、非比例风险模型参数方法:指数分布模型、Weibull分布模型、Gompertz分布模型、对数正态分布模型、对数logistic分布模型,等。参数方法中均假设生存时间服从某分布,而半参数方法中不需指定生存时间的分布情况。2023/3/2959安徽医科大学流统系王静制作当前59页,总共108页。Cox比例风险模型2023/3/2960安徽医科大学流统系王静制作当前60页,总共108页。适用情况:用于分析带有伴随变量的生存时间资料,如:肿瘤和其它慢性病的预后分析,临床疗效评价和队列研究的病因探索。优点:适用条件宽,便于作多因素分析。2023/3/2961安徽医科大学流统系王静制作当前61页,总共108页。一、cox回归模型简介2023/3/2962安徽医科大学流统系王静制作当前62页,总共108页。1、模型结构即Cox回归,它的一般形式是:

λ(t)=[λ0(t)]•

e(β1*x1+β2*x2+….+βm*xm

)

=[λ0(t)]•exp(β1*x1+β2*x2+….+βm*xm)2023/3/2963安徽医科大学流统系王静制作当前63页,总共108页。λ(t)表示t时刻暴露于各危险因素(x1,x2,….xm)状态下的风险函数。λ0(t)为基线风险函数,表示所有的危险因素状态都为0情况下的风险函数。λ(t)/λ0(t)=exp(β1*x1+β2*x2+….+βm*xm

)即:ln[λ(t)/λ0(t)]=β1*x1+β2*x2+….+βm*xm将cox回归与线性回归、logistic回归做一比较。2023/3/2964安徽医科大学流统系王静制作当前64页,总共108页。λ0(t)的形式不限,使模型的适用范围如同非参数法那么广;模型中含有参数β,又使得其统计效率接近参数模型。(但参数β就不能用传统的方法进行估计和检验)∴模型中含有参数β,但基线风险函数λ0(t)不要求服从特定分布形式,具有非参数的特点,故Cox回归又称为半参数模型。2023/3/2965安徽医科大学流统系王静制作当前65页,总共108页。英国生物统计学家D.R.Cox于1972年建立了条件死亡概率和偏似然函数方法,解决了参数β的估计和检验问题。故,该统计分析方法称为Cox模型。2023/3/2966安徽医科大学流统系王静制作当前66页,总共108页。2、参数的统计学意义假设只有一个X危险因素,0为“不暴露”,1为“暴露”,模型形式为:λ(t)=λ0(t)•exp(β*x)X=1时的风险函数为:λ1(t)=λ0(t)•exp(β*1)X=0时的风险函数为:λ2(t)=λ0(t)•exp(β*0)λ1(t)、λ2(t)分别表示暴露于危险因素的两种不同状态下发病的风险函数。2023/3/2967安徽医科大学流统系王静制作当前67页,总共108页。暴露于危险因素的两种不同状态下发病的风险比即为相对危险度RR。RR=λ1(t)/λ2(t)=[λ0(t)•exp(β*1)]/[λ0(t)•exp(β*0)]=exp(β*1)/exp(β*0)=exp(β)RR表示暴露组与非暴露组的风险函数之比,即:暴露组发病的风险是非暴露组的RR倍。回归系数β的流行病学含义是0、1协变量X的相对危险度的自然对数。2023/3/2968安徽医科大学流统系王静制作当前68页,总共108页。如果X为连续性变量——年龄(岁),则λ1(t)、λ2(t)分别表示k岁、k+1岁的两种不同状态下发病的风险函数。RR=λ1(t)/λ2(t)=[λ0(t)•exp(β*(k+1))]/[λ0(t)•exp(β*k)]=exp(β*(k+1)/exp(β*k)=exp(β)β:X每增加一个单位时其相对危险度的自然对数值。RR表示某危险因素(或协变量)改变一个测量单位时风险函数改变多少倍。2023/3/2969安徽医科大学流统系王静制作当前69页,总共108页。当β>0,说明相应协变量值的增加将增大所研究事件发生的可能性;当β<0,相应协变量值的增加将减少所研究事件发生的可能性;当β=0,相应协变量与所研究事件的发生无关。2023/3/2970安徽医科大学流统系王静制作当前70页,总共108页。3、模型假设满足比例风险(proportionalhazards)假定,简称PH假定。即:相对危险度RR或风险比保持一个恒定的比例,与时间t无关。2023/3/2971安徽医科大学流统系王静制作当前71页,总共108页。Cox回归无须对λ0(t)的形式作任何限制,因为不影响各危险因素相对危险度的估计,而相对危险度正是多因素分析时最关注的问题。∴cox模型巧妙地将非参数[λ0(t)]部分与参数(回归系数β)的概念结合起来,这种灵活性使得它在生存分析的应用中备受青睐。2023/3/2972安徽医科大学流统系王静制作当前72页,总共108页。比值比OR可以作为相对危险度RR的估计值。2023/3/2973安徽医科大学流统系王静制作当前73页,总共108页。比例风险假设的检验:可分组(若为0、1两组)做二次对数生存率图(LogminusLog,LML),进行目测判断,若两条曲线有交叉或间距变动大,则提示风险比随时间而改变,不具备cox比例风险模型的适用性;反之,则资料适宜用cox比例风险模型。2023/3/2974安徽医科大学流统系王静制作当前74页,总共108页。2023/3/2975安徽医科大学流统系王静制作当前75页,总共108页。4、协变量的筛选策略与其他回归模型类似,如果协变量个数较多,则通常采用逐步法。2023/3/2976安徽医科大学流统系王静制作当前76页,总共108页。二、cox回归模型的分析步骤及主要结果2023/3/2977安徽医科大学流统系王静制作当前77页,总共108页。SPSS中的程序为:Analyze→Survival→CoxRegression将cox回归的对话框与线性回归、Kaplan-Meier、Lifetable做比较。见文件cox1.sav2023/3/2978安徽医科大学流统系王静制作当前78页,总共108页。示例:评价A、B两治疗方案对某病的治疗效果。A组(group=0)12人,B组(group=1)13人;肾功能正常者为0,不正常者为1。应变量是治疗后的生存时间和观察结果(达到终点还是截尾值);group是研究因素x1,肾功能是混杂因素x2。2023/3/2979安徽医科大学流统系王静制作当前79页,总共108页。注意事项一般情况下,截尾值设为0,完全数据(即出现终点事件)为1;但在具体资料中,没有限制,只要能有两个分别表示完全数据和截尾的数值,结果不受影响。但是一旦设定后,分析时,“Status”对话框中的终点事件值一定要和资料中吻合,否则结果错误。2023/3/2980安徽医科大学流统系王静制作当前80页,总共108页。SPSS分析结果如下:第一步、求Cox比例风险模型2023/3/2981安徽医科大学流统系王静制作当前81页,总共108页。2023/3/2982安徽医科大学流统系王静制作当前82页,总共108页。λ(t)=λ0(t)·e(1.243group+4.105kidney)=λ0(t)·exp(1.243group+4.105kidney)group、kidney的P值分别为0.038、0.000,均<0.05,说明不同治疗方案及肾功能对病人的生存有影响。2023/3/2983安徽医科大学流统系王静制作当前83页,总共108页。group、kidney的OR值分别为3.466、60.670,均大于1,说明接受B治疗方案的病人死亡的风险是接受A治疗方案者的3.466倍、肾功能不正常的病人死亡的风险是肾功能正常者的60.670倍。2023/3/2984安徽医科大学流统系王静制作当前84页,总共108页。第二步、由模型可求出不同状态下的相对危险度RR值2023/3/2985安徽医科大学流统系王静制作当前85页,总共108页。1、肾功能正常者接受B治疗方案比接受A治疗方案在某时刻死亡的相对危险度为:RR=[λ0(t)]•

e(1.243*1+4.105*0)

[λ0(t)]•e(1.243*0+4.105*0)=3.4662023/3/2986安徽医科大学流统系王静制作当前86页,总共108页。2、肾功能不正常者接受B治疗方案比接受A治疗方案在某时刻死亡的相对危险度为:RR=[λ0(t)]•e(1.243*1+4.105*1)

[λ0(t)]•e(1.243*0+4.105*1)=3.4662023/3/2987安徽医科大学流统系王静制作当前87页,总共108页。3、肾功能不正常者接受B治疗方案,比肾功能正常者接受A治疗方案在某时刻死亡的相对危险度为:RR=[λ0(t)]•e(1.243*1+4.105*1)

[λ0(t)]•e(1.243*0+4.105*0)=210.300可见在Cox模型的建立中没有估计基线风险λ0(t);在危险因素的RR分析中也没有涉及基线风险。所估计的风险比与时间无关。2023/3/2988安徽医科大学流统系王静制作当前88页,总共108页。第三步、画出风险函数曲线2023/3/2989安徽医科大学流统系王静制作当前89页,总共108页。2023/3/2990安徽医科大学流统系王静制作当前90页,总共108页。第四步、画出二次对数生存率图(LogminusLog,LML)从LML图中,目测判断PH假设是否成立。2023/3/2991安徽医科大学流统系王静制作当前91页,总共108页。2023/3/2992安徽医科大学流统系王静制作当前92页,总共108页。目的:探讨影响胃癌患者长期生存的预后因素。方法:采用Cox比例风险模型对可能影响胃癌患者预后的11项临床病理参数进行单因素和多因素回归分析。结果:Cox单因素回归分析表明胃癌的分化程度、浸润深度、淋巴结转移数、脉管内是否有癌栓、临床分期、肿瘤直径、淋巴细胞浸润量与胃癌的预后有关(P<0.05),而性别、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论