医学统计学第16-章生存分析-PPT幻灯片_第1页
医学统计学第16-章生存分析-PPT幻灯片_第2页
医学统计学第16-章生存分析-PPT幻灯片_第3页
医学统计学第16-章生存分析-PPT幻灯片_第4页
医学统计学第16-章生存分析-PPT幻灯片_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节生存分析的基本概念

一、基本概念

1、生存时间(survivaltime)是任何两个有联系事件之间的时间间隔,常用符号t表示。从狭义的角度来讲,生存时间指患某种疾病的病人从发病到死亡所经历的时间。广义的生存时间定义为从某种起始事件到终点事件所经历的时间。

2、失效事件(failureevent)一般是指反映治疗效果特征的事件,又称死亡事件或终点事件。它是根据研究目的所确定,因此在研究设计时必需明确规定,并在研究的实施中严格遵守。

起始事件(initialevent)是反映生存时间起始特征的事件终点事件(死亡事件、失效事件):反映研究对象生存过程特定结局的事件5、生存时间资料的分布特征

生存时间资料常通过随访获得,因观察时间长且难以控制混杂因素,再加上存在截尾数据,规律难以估计,一般为正偏态分布。6、生存率(survivalrate)与

死亡概率

①生存率:又叫累积生存率或生存函数。表示观察对象其生存时间T大于t时刻的概率,常用S(t,X)=P(T>t,X)表示。在实际工作中,如无截尾数据,生存率是用生存时间大于t的病人数除以开始观察的病人总数来估计的。

②死亡概率:表示观察对象从开始到时间t为止的死亡概率,是一个随时间上升的函数,F(t,X)=P(T≤t,X)。死亡概率与生存率的关系是:

S(t,X)=P(T>t,X)=1-F(t,X)。当t=0时,死亡概率为0;当观察期为无穷大时,其死亡概率为1。

(条件)死亡概率(ConditionalProbabilityofFailure):是指在某单位时段开始时存活的个体在该时段内死亡的可能性大小。(条件:在某时段的条件下)7、死亡密度函数(deathdensityfunction)

死亡密度函数是死亡概率函数的导数,表示所有观察对象在t时刻的瞬时死亡率。f(t)定义如下:PDF:概率密度函数的估计值8、风险函数(hazardfunction)风险函数:生存时间达到t的一群观察对象在t时刻的瞬时死亡率。生存函数、风险函数、死亡密度函数的关系:无截尾数据时,h(t)可估计为:例16-1现有40个肝癌病人的随访资料,见表16-2,试估计生存函数、死亡密度函数和风险函数。(SAS程序见例16-1无截尾程序)datali16_1;inputcountctime;cards;510715611041155120412541300135214011452150;proc

lifetestplots=(s)method=lifewidth=5;timetime*c(0);freqcount;run;

LifeTableSurvivalEstimatesConditionalEffectiveConditionalProbabilityIntervalNumberNumberSampleProbabilityStandard[Lower,Upper)FailedCensoredSizeofFailureErrorSurvivalFailure055040.00.12500.05231.000005107035.00.20000.06760.87500.125010156028.00.21430.07750.70000.300015204022.00.18180.08220.55000.450020255018.00.27780.10560.45000.550025304013.00.30770.12800.32500.67503035409.00.44440.16560.22500.77503540005.0000.12500.87504045205.00.40000.21910.12500.87504550103.00.33330.27220.07500.925050.202.01.000000.05000.9500SurvivalMedianMedianPDFHazardIntervalStandardResidualStandardStandardStandardLower,UpperErrorLifetimeErrorPDFErrorHazardError05017.50003.95280.02500.01050.0266670.0118995100.052315.50002.95800.03500.01200.0444440.01669410150.072514.00002.64580.03000.01130.0480.01945415200.078712.50002.93150.02000.009490.040.019920250.078710.00002.65170.02500.01050.0645160.02847525300.07418.12502.25350.02000.009490.0727270.03575830350.066011.25003.75000.02000.009490.1142860.05476135400.052312.50005.59020.0.40450.05237.50005.59020.01000.006890.10.06846545500.0416..0.005000.004940.080.07838450.0.0345......二、生存分析研究的主要内容

1、描述生存过程:研究生存时间的分布特点,估计生存率及平均存活时间,绘制生存曲线等。根据生存时间的长短,可以估计出各时点的生存率,并根据生存率来估计中位生存时间。同时也可以根据生存曲线分析其生存特点2、比较生存过程

可通过生存率及其标准误对各样本的生存率进行比较,以探讨各总体的生存过程是否有差别。

3、影响生存时间的因素分析

通过生存分析模型来探讨影响生存时间的因素,通常以生存时间和结局为应变量,而将影响它们的因素作为自变量,通过拟合生存分析模型,筛选出影响生存时间的保护因素和风险因素,为临床治疗及预防提供重要的参考。

三、生存分析的基本方法1.非参数法:不论资料呈何分布,可根据样本提供的顺序统计量,采用乘积极限法、寿命表法对生存率作估计。对两个及多个生存率的比较,无效假设是“两组或多组总体生存时间分布相同”,不对其具体的分布形式及参数作推断。2.参数法假定生存时间服从某种参数分布⑴指数分布法⑵Weibull分布法⑶对数正态回归分析法⑷对数logistic回归分析法通过估计分布的参数得到生存率的估计值,两组及多组生存率的比较,对分布的参数进行统计推断。3.半参数法:兼有参数法和半参数法的特点对生存时间、生存率作多因素影响分析典型方法Cox模型第二节生存率的估计与生存曲线一、小样本资料的生存分析例16-2在儿童急性淋巴细胞白血病(ALL)的生存研究中,有21例高危儿童ALL的临床随访资料。生存时间定义为确诊日期到病人死亡日期的时间跨度,得到的生存时间(月),见表15-3第(1)栏,其中有“+”者是截尾数据,表示病人仍生存或失访。试计算其生存率与标准误。dataex16_2;inputmonthcensor@@;cards;10304050608010011012014017018024030031051062178188111511241;proc

lifetestplots=(s);timemonth*censor(1);run;

SurvivalStandardNumberNumbermonthSurvivalFailureErrorFailedLeft0.0001.0000000211.0000.95240.04760.04651203.0000.90480.09520.06412194.0000.85710.14290.07643185.0000.80950.19050.08574176.0000.76190.23810.09295168.0000.71430.28570.098661510.0000.66670.33330.102971411.0000.61900.38100.106081312.0000.57140.42860.108091214.0000.52380.47620.1090101117.0000.47620.52380.1090111018.0000.42860.57140.108012924.0000.38100.61900.106013830.0000.33330.66670.102914731.0000.28570.71430.098615651.0000.23810.76190.092916562.000*...16478.000*...16388.000*...162115.000*...161124.000*...160QuartileEstimatesPoint95%ConfidenceIntervalPercentEstimate[LowerUpper)7551.00018.000.5017.00010.00031.000258.0004.00014.0001、生存率的计算(1)将生存时间由小到大排列:(1)栏。(2)生存时间t对应的死亡人数d:(2)栏。(3)期初观察人数:见n:(3)栏(4)条件死亡率及条件生存率:(4)、(5)栏F=d/n,S=1-F

(5)活过t时点的生存率:(6)栏

P(T>t)=∏S

2、生存率的标准误计算(16-6)表示把小于和等于t时刻的各种非截尾值所对应的全部加起来。总体生存率的1-α可信区间:

P(T>5)=0.810,其总体生存率95%CI为3、生存曲线

以生存时间为横轴、生存率为纵轴绘制一条生存曲线,用以描述其生存过程。并根据两条生存曲线的高低,直观地比较不同病情或不同治疗方式之间的生存过程。例16-3表16-4第(1)栏为23例标危儿童ALL的临床随访资料。用上例相同方法计算生存率及标准误。图16-3标危和高危儿童ALL病人生存曲线的比较

4、中位生存时间

中位生存时间(mediansurvivaltime)又称为生存时间的中位数,是生存分析中最常用的概括性统计量,表示刚好有50%的个体其存活期大于该时间。MedianResidualLifetime:中位剩余寿命(在时刻ti活着的人一半可望生存时间)二、大样本资料的生存分析

对于大样本,按生存时间编制频数表,按寿命表法计算生存率。

例16-4某研究收集了1980-1993年中山市肺癌新发患者2238例,经随访将有关资料整理后列于表16-5,其中生存时间是以月计算的,试计算其生存率及其标准误。1、生存率的计算将生存资料以经历时间的长短分成若干时间区间,死亡和截尾的例数分别列入各时间区间内。

⑴⑵⑶

⑷期初观察人数Li:

⑸校正观察人数Ni:Ni=Li-ci/2

⑹死亡概率qi:

⑺生存概率pi:pi=1-qi

⑻2、生存率曲线以不同时点(时间区间的中点)为横坐标,每个时间区间的生存率为纵坐标,得到生存率曲线图(图15-4)。

图16-42238例肺癌病人生存率曲线datali16_4;inputcountctime;cards;153.001.000.00291.001.001.00260.001.002.00219.001.003.00164.001.004.00121.001.005.00111.001.006.0061.001.007.0063.001.008.0047.001.009.0032.001.0010.0027.001.0011.0018.001.0012.0017.001.0013.0019.001.0014.005.001.0015.0015.001.0016.0010.001.0017.0015.001.0018.004.001.0019.0010.001.0020.004.00.00.002.00.001.00.00.002.00.00.003.002.00.004.003.00.005.006.00.006.007.00.007.009.00.008.002.00.009.008.00.0010.004.00.0011.00.00.0012.00.00.0013.001.00.0014.001.00.0015.003.00.0016.007.00.0017.003.00.0018.0010.00.0019.00504.00.0020.00;proc

lifetestplots=(s)method=lifewidth=1;timetime*c(0);freqcount;run;

ConditionalEffectiveConditionalProbabilityIntervalNumberNumberSampleProbabilityStandard[Lower,Upper)FailedCensoredSizeofFailureErrorSurvivalFailure0115342236.00.06840.005341.000001229122080.00.13990.007610.93160.0684232600788.00.14540.008340.80120.19883421901528.00.14330.008960.68470.31534516421308.00.12540.009160.58660.41345612131141.50.10600.009110.51300.48706711161016.00.10930.009790.45870.541378617898.50.06790.008390.40860.591489639829.50.07590.009200.38080.6192910472761.00.06180.008730.35190.64811011328709.00.04510.007800.33020.66981112274671.00.04020.007590.31530.68471213180642.00.02800.006520.30260.69741314170624.00.02720.006520.29410.70591415191606.50.03130.007070.28610.7139151651586.50.008530.003800.27710.72291617153579.50.02590.006600.27480.72521718107559.50.01790.005600.26760.73241819153544.50.02750.007010.26290.73711920410523.00.007650.003810.25560.744420.10504262.00.03820.01180.25370.7463

SurvivalMedianMedianPDFHazardIntervalStandardResidualStandardStandardStandard[Lower,Upper)ErrorLifetimeErrorPDFErrorHazardError0105.23990.19440.06840.005340.070850.005724120.005344.86900.18780.13030.007120.1504260.008793230.008445.28590.34160.11650.006790.1568150.009695340.009836.43830.40300.09810.006300.1543880.010401450.01049.09891.01220.07350.005530.1337680.010422560.010613.87481.04850.05440.004810.1119330.01016670.0106..0.05010.004630.1155650.010951780.0104..0.02770.003500.0702760.008992890.0103..0.02890.003590.0789470.0099399100.0101..0.02170.003130.0637290.00929110110.01000..0.01490.002610.0461760.00816111120.00989..0.01270.002420.0410650.00790112130.00978..0.008480.001990.0284360.00670213140.00971..0.008010.001930.027620.00669814150.00964..0.008960.002050.0318260.007315160.00955..0.002360.001060.0085620.003829

SurvivalMedianMedianPDFHazardIntervalStandardResidualStandardStandardStandard[Lower,Upper)ErrorLifetimeErrorPDFErrorHazardError16170.00953..0.007110.001830.0262240.0067717180.00946..0.004780.001510.0180340.00570318190.00941..0.007240.001860.0279330.00721219200.00934..0.001950.0009760.0076780.00383920.0.00932......

第三节生存曲线的检验H0:高危和标危ALL儿童的生存率相同H1:高危和标危ALL儿童的生存率不同=0.051、将两组资料混合后统一排序:

2、计算各组的期望死亡数:

3、求各组的期望死亡人数之和:第1组期望死亡总数为12.829,第2组期望死亡总数为19.171。4、计算值:ν=组数-1P>0.05。按α=0.05水平不拒绝H0,还不能认为两种类型儿童ALL生存率不同。

datalogrank;inputgroupmonthcensor@@;cards;110130140150160180110011101120114011701180124013001310151016211781188111151112412302702120213021502160217021902210223022802370242024702500265026912721279128012851296121091;proc

lifetestplots=(s);timemonth*censor(1);stratagroup;run;TestofEqualityoverStrataPr>TestChi-SquareDFChi-SquareLog-Rank1.368110.2421Wilcoxon2.669510.1023-2Log(LR)0.945710.3308

第四节Cox比例风险回归模型一、Cox模型的相关概念

h(t,X):比例风险函数,瞬时死亡率,危险度t:生存时间X=(X1,

X2,…,Xm):协变量:参数部分h0(t):基础风险率,非参数部分。Cox比例风险回归模型由非参数和参数两部分组成1.Cox模型

2.回归系数

βj:在其它协变量不变的情况下,协变量Xj

每改变一个测量单位时所引起的相对危

险度的自然对数的改变量。

⑴βj>0:h(t,X)随Xj增大而增大,病人

死亡风险增大;

⑵βj=0:Xj增加对h(t,X)无影响;

⑶βj<0:h(t,X)随Xj增大而减小,病人

死亡风险减小。相对危险度RRh(t,):暴露组危险度,h(t,):非暴露组危险度相对危险度与时间t无关(当其它协变量不变时)二、参数估计与假设检验(一)参数估计:偏似然函数估计ti上的偏似然函数:

S:ti以后危险集中对似然函数有贡献的个体n:病人数δj=1:j病人在ti时刻死亡,δj=0:j病人在ti时刻截尾对lnL(β):求关于βj(j=1,2,…,m)的一阶偏导数,解得到βj的最大似然函数估计值bj(二)假设检验1.最大似然比检验:用于剔除不显著变量和新变量引入及不同协变量数时模型的比较df=1K,k+1:协变量的个数2.得分检验:用于检验新变量能否选入模型3.Wald检验:用于检验模型中协变量是否应剔除(三)生存率估计Cox回归常用近似法估计生存率:表示对j时刻暴露人群求和。代表所有协变量均为0的病人在ti时刻的基础生存率。dj为j时刻死亡例数。三、因素的初步筛选与最佳模型的建立

单因素Cox分析,多因素Cox前进法、后退法和逐步回归法四、Cox模型的统计描述1.回归系数和标准回归系数:标准回归系数绝对值较大的因素对生存时间的影响也较大。2.个体预后指数

:标准回归系数:标准化变量值

PI=0,表示该病人达到平均水平;PI>0,表示该病人对应的危险度大于平均水平;PI<0,表示该病人对应的危险度小于平均水平。

例16-5

为了探索影响儿童急性淋巴细胞白血病(ALL)长期生存的预后因素。采用回顾性队列研究,对1990年1月1日至1995年12月30日期间在苏州大学附属儿童医院血液科就诊,治疗时间大于2周,年龄<15周岁获得有效随访的118例ALL初诊患儿进行生存分析。本研究的起始时间为ALL的确诊日期,终点日期为病人的死亡日期;如果研究对象仍存活,研究的截尾日期设定为2000年6月30日。data;inputsexage1riskwbc1fabremsps1score1healthttt;cards;2011110016.572000210001.371011110004.312100210001.141001110001.991011100001.521000210007.651000210001.302011210101.761111101000.031101100000.351111111000.341000111001.462000100001.022000101018.101000110101.962000110003.531000110002.401000200018.021000110004.352000110001.042010110017.941111111001.481000200016.611000100005.251100110002.721100110002.281001110001.452111110002.051000110000.631000210001.482010101000.022100200016.062000110001.081010210002.471000110001.231000110002.971000210003.082111110001.641011100002.482100200015.801000100000.472100100016.701100110002.322001111000.251100110004.682100110002.221000110002.941111100000.071100100001.881000110004.871000110004.191101211001.212000110005.852000110017.152010110017.401000110005.371111110100.601100210103.512110110000.901000110002.232111101100.442010210000.941001110001.332000200001.092101110101.471000111001.341101110000.771001110002.061011110000.221010110015.171000110000.391010111002.332000111002.491100100015.032000100015.012000110000.452100110100.851000110001.501000110003.981011111001.052100110000.741000110001.811000200014.611100110003.792000110001.642010111002.652010100019.601010110002.541000110000.701100210005.081100110005.451000311002.961010111000.692000100019.101111111000.701000210019.051000110006.681000111001.182010110001.221100110000.931000200018.752101110000.812111110001.811000100018.732011110101.121100211001.041110110100.611000110000.481100110001.6511101110110.371000110002.411100100000.331111111000.301010100000.881000110004.281000200001.611011110002.05;procphreg;modelttt*health(1)=age1/risklimits;run;

procphreg;modelttt*health(1)=risk/risklimits;run;procphreg;modelttt*health(1)=wbc1/risklimits;run;procphreg;modelttt*health(1)=fab/risklimits;run;procphreg;modelttt*health(1)=re/risklimits;run;procphreg;modelttt*health(1)=sex/risklimits;run;procphreg;modelttt*health(1)=msps1/risklimits;run;procphreg;modelttt*health(1)=score1/risklimits;run;多因素Cox模型SAS计算:

1、逐步回归法procphregdata=a;modelttt*health(1)=age1riskwbc1fabresexmsps1score1/risklimitsselection=stepwisesle=0.10sls=0.10;run;procphregdata=a;modelttt*health(1)=age1sexwbc1remsps1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论