医学统计学第16-章生存分析.ppt_第1页
医学统计学第16-章生存分析.ppt_第2页
医学统计学第16-章生存分析.ppt_第3页
医学统计学第16-章生存分析.ppt_第4页
医学统计学第16-章生存分析.ppt_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十六章随访时间资料的分析,生存分析(survivalanalysis)是既考虑结局又考虑生存时间的一种分析方法,并可以充分利用不完全数据,对生存时间的分布特征进行统计描述和统计推断,也可以通过多因素模型对影响生存时间的主要影响因素进行分析。通过生存分析方法才能对临床随访资料进行全面和准确的评价。,第一节生存分析的基本概念一、基本概念,1、生存时间(survivaltime)是任何两个有联系事件之间的时间间隔,常用符号t表示。从狭义的角度来讲,生存时间指患某种疾病的病人从发病到死亡所经历的时间。广义的生存时间定义为从某种起始事件到终点事件所经历的时间。,2、失效事件(failureevent),一般是指反映治疗效果特征的事件,又称死亡事件或终点事件。它是根据研究目的所确定,因此在研究设计时必需明确规定,并在研究的实施中严格遵守。起始事件(initialevent)是反映生存时间起始特征的事件终点事件(死亡事件、失效事件):反映研究对象生存过程特定结局的事件,完全数据:对研究对象观察到死亡,得到准确的生存时间不完全数据:对失访、研究结束时仍存活等研究对象,无法得到准确的生存时间,3、生存资料的类型,截尾的主要原因有三种:,(1)失访:指失去联系;(2)退出:是指退出研究,如死于其它原因、临时改变治疗方案等;(3)终止:指研究时限已到而终止观察。,5、生存时间资料的分布特征,生存时间资料常通过随访获得,因观察时间长且难以控制混杂因素,再加上存在截尾数据,规律难以估计,一般为正偏态分布。,6、生存率(survivalrate)与死亡概率,生存率:又叫累积生存率或生存函数。表示观察对象其生存时间T大于t时刻的概率,常用S(t,X)=P(Tt,X)表示。在实际工作中,如无截尾数据,生存率是用生存时间大于t的病人数除以开始观察的病人总数来估计的。,死亡概率:表示观察对象从开始到时间t为止的死亡概率,是一个随时间上升的函数,F(t,X)=P(Tt,X)。死亡概率与生存率的关系是:S(t,X)=P(Tt,X)=1F(t,X)。当t=0时,死亡概率为0;当观察期为无穷大时,其死亡概率为1。,(条件)死亡概率(ConditionalProbabilityofFailure):是指在某单位时段开始时存活的个体在该时段内死亡的可能性大小。(条件:在某时段的条件下),7、死亡密度函数(deathdensityfunction),死亡密度函数是死亡概率函数的导数,表示所有观察对象在t时刻的瞬时死亡率。f(t)定义如下:PDF:概率密度函数的估计值,8、风险函数(hazardfunction),风险函数:生存时间达到t的一群观察对象在t时刻的瞬时死亡率。,生存函数、风险函数、死亡密度函数的关系:,无截尾数据时,h(t)可估计为:,例16-1现有40个肝癌病人的随访资料,见表16-2,试估计生存函数、死亡密度函数和风险函数。(SAS程序见例16-1无截尾程序),datali16_1;inputcountctime;cards;510715611041155120412541300135214011452150;proclifetestplots=(s)method=lifewidth=5;timetime*c(0);freqcount;run;,LifeTableSurvivalEstimatesConditionalEffectiveConditionalProbabilityIntervalNumberNumberSampleProbabilityStandardLower,Upper)FailedCensoredSizeofFailureErrorSurvivalFailure055040.00.12500.05231.000005107035.00.20000.06760.87500.125010156028.00.21430.07750.70000.300015204022.00.18180.08220.55000.450020255018.00.27780.10560.45000.550025304013.00.30770.12800.32500.67503035409.00.44440.16560.22500.77503540005.0000.12500.87504045205.00.40000.21910.12500.87504550103.00.33330.27220.07500.925050.202.01.000000.05000.9500,SurvivalMedianMedianPDFHazardIntervalStandardResidualStandardStandardStandardLower,UpperErrorLifetimeErrorPDFErrorHazardError05017.50003.95280.02500.01050.0266670.0118995100.052315.50002.95800.03500.01200.0444440.01669410150.072514.00002.64580.03000.01130.0480.01945415200.078712.50002.93150.02000.009490.040.019920250.078710.00002.65170.02500.01050.0645160.02847525300.07418.12502.25350.02000.009490.0727270.03575830350.066011.25003.75000.02000.009490.1142860.05476135400.052312.50005.59020.0.40450.05237.50005.59020.01000.006890.10.06846545500.0416.0.005000.004940.080.07838450.0.0345.,二、生存分析研究的主要内容,1、描述生存过程:研究生存时间的分布特点,估计生存率及平均存活时间,绘制生存曲线等。根据生存时间的长短,可以估计出各时点的生存率,并根据生存率来估计中位生存时间。同时也可以根据生存曲线分析其生存特点,2、比较生存过程,可通过生存率及其标准误对各样本的生存率进行比较,以探讨各总体的生存过程是否有差别。,3、影响生存时间的因素分析,通过生存分析模型来探讨影响生存时间的因素,通常以生存时间和结局为应变量,而将影响它们的因素作为自变量,通过拟合生存分析模型,筛选出影响生存时间的保护因素和风险因素,为临床治疗及预防提供重要的参考。,三、生存分析的基本方法1.非参数法:不论资料呈何分布,可根据样本提供的顺序统计量,采用乘积极限法、寿命表法对生存率作估计。对两个及多个生存率的比较,无效假设是“两组或多组总体生存时间分布相同”,不对其具体的分布形式及参数作推断。,2.参数法,假定生存时间服从某种参数分布指数分布法Weibull分布法对数正态回归分析法对数logistic回归分析法通过估计分布的参数得到生存率的估计值,两组及多组生存率的比较,对分布的参数进行统计推断。,3.半参数法:,兼有参数法和半参数法的特点对生存时间、生存率作多因素影响分析典型方法Cox模型,第二节生存率的估计与生存曲线一、小样本资料的生存分析例16-2在儿童急性淋巴细胞白血病(ALL)的生存研究中,有21例高危儿童ALL的临床随访资料。生存时间定义为确诊日期到病人死亡日期的时间跨度,得到的生存时间(月),见表15-3第(1)栏,其中有“”者是截尾数据,表示病人仍生存或失访。试计算其生存率与标准误。,dataex16_2;inputmonthcensor;cards;10304050608010011012014017018024030031051062178188111511241;proclifetestplots=(s);timemonth*censor(1);run;,SurvivalStandardNumberNumbermonthSurvivalFailureErrorFailedLeft0.0001.0000000211.0000.95240.04760.04651203.0000.90480.09520.06412194.0000.85710.14290.07643185.0000.80950.19050.08574176.0000.76190.23810.09295168.0000.71430.28570.098661510.0000.66670.33330.102971411.0000.61900.38100.106081312.0000.57140.42860.108091214.0000.52380.47620.1090101117.0000.47620.52380.1090111018.0000.42860.57140.108012924.0000.38100.61900.106013830.0000.33330.66670.102914731.0000.28570.71430.098615651.0000.23810.76190.092916562.000*.16478.000*.16388.000*.162115.000*.161124.000*.160,QuartileEstimatesPoint95%ConfidenceIntervalPercentEstimateLowerUpper)7551.00018.000.5017.00010.00031.000258.0004.00014.000,1、生存率的计算,(1)将生存时间由小到大排列:(1)栏。(2)生存时间t对应的死亡人数d:(2)栏。(3)期初观察人数:见n:(3)栏(4)条件死亡率及条件生存率:(4)、(5)栏F=d/n,S1F(5)活过t时点的生存率:(6)栏P(Tt)=S,2、生存率的标准误计算,(16-6)表示把小于和等于t时刻的各种非截尾值所对应的全部加起来。总体生存率的1可信区间:P(T5)=0.810,其总体生存率95CI为,3、生存曲线,以生存时间为横轴、生存率为纵轴绘制一条生存曲线,用以描述其生存过程。并根据两条生存曲线的高低,直观地比较不同病情或不同治疗方式之间的生存过程。例16-3表16-4第(1)栏为23例标危儿童ALL的临床随访资料。用上例相同方法计算生存率及标准误。,图16-3标危和高危儿童ALL病人生存曲线的比较,4、中位生存时间,中位生存时间(mediansurvivaltime)又称为生存时间的中位数,是生存分析中最常用的概括性统计量,表示刚好有50的个体其存活期大于该时间。MedianResidualLifetime:中位剩余寿命(在时刻ti活着的人一半可望生存时间),二、大样本资料的生存分析,对于大样本,按生存时间编制频数表,按寿命表法计算生存率。例16-4某研究收集了1980-1993年中山市肺癌新发患者2238例,经随访将有关资料整理后列于表16-5,其中生存时间是以月计算的,试计算其生存率及其标准误。,1、生存率的计算将生存资料以经历时间的长短分成若干时间区间,死亡和截尾的例数分别列入各时间区间内。期初观察人数Li:校正观察人数Ni:Ni=Li-ci/2死亡概率qi:,生存概率pi:pi=1-qi2、生存率曲线以不同时点(时间区间的中点)为横坐标,每个时间区间的生存率为纵坐标,得到生存率曲线图(图154)。,图16-42238例肺癌病人生存率曲线,datali16_4;inputcountctime;cards;153.001.000.00291.001.001.00260.001.002.00219.001.003.00164.001.004.00121.001.005.00111.001.006.0061.001.007.0063.001.008.0047.001.009.0032.001.0010.0027.001.0011.0018.001.0012.00,17.001.0013.0019.001.0014.005.001.0015.0015.001.0016.0010.001.0017.0015.001.0018.004.001.0019.0010.001.0020.004.00.00.002.00.001.00.00.002.00.00.003.002.00.004.00,3.00.005.006.00.006.007.00.007.009.00.008.002.00.009.008.00.0010.004.00.0011.00.00.0012.00.00.0013.001.00.0014.001.00.0015.003.00.0016.00,7.00.0017.003.00.0018.0010.00.0019.00504.00.0020.00;proclifetestplots=(s)method=lifewidth=1;timetime*c(0);freqcount;run;,ConditionalEffectiveConditionalProbabilityIntervalNumberNumberSampleProbabilityStandardLower,Upper)FailedCensoredSizeofFailureErrorSurvivalFailure0115342236.00.06840.005341.000001229122080.00.13990.007610.93160.0684232600788.00.14540.008340.80120.19883421901528.00.14330.008960.68470.31534516421308.00.12540.009160.58660.41345612131141.50.10600.009110.51300.48706711161016.00.10930.009790.45870.541378617898.50.06790.008390.40860.591489639829.50.07590.009200.38080.6192910472761.00.06180.008730.35190.64811011328709.00.04510.007800.33020.66981112274671.00.04020.007590.31530.68471213180642.00.02800.006520.30260.69741314170624.00.02720.006520.29410.70591415191606.50.03130.007070.28610.7139151651586.50.008530.003800.27710.72291617153579.50.02590.006600.27480.72521718107559.50.01790.005600.26760.73241819153544.50.02750.007010.26290.73711920410523.00.007650.003810.25560.744420.10504262.00.03820.01180.25370.7463,SurvivalMedianMedianPDFHazardIntervalStandardResidualStandardStandardStandardLower,Upper)ErrorLifetimeErrorPDFErrorHazardError0105.23990.19440.06840.005340.070850.005724120.005344.86900.18780.13030.007120.1504260.008793230.008445.28590.34160.11650.006790.1568150.009695340.009836.43830.40300.09810.006300.1543880.010401450.01049.09891.01220.07350.005530.1337680.010422560.010613.87481.04850.05440.004810.1119330.01016670.0106.0.05010.004630.1155650.010951780.0104.0.02770.003500.0702760.008992890.0103.0.02890.003590.0789470.0099399100.0101.0.02170.003130.0637290.00929110110.01000.0.01490.002610.0461760.00816111120.00989.0.01270.002420.0410650.00790112130.00978.0.008480.001990.0284360.00670213140.00971.0.008010.001930.027620.00669814150.00964.0.008960.002050.0318260.007315160.00955.0.002360.001060.0085620.003829,SurvivalMedianMedianPDFHazardIntervalStandardResidualStandardStandardStandardLower,Upper)ErrorLifetimeErrorPDFErrorHazardError16170.00953.0.007110.001830.0262240.0067717180.00946.0.004780.001510.0180340.00570318190.00941.0.007240.001860.0279330.00721219200.00934.0.001950.0009760.0076780.00383920.0.00932.,第三节生存曲线的检验H0:高危和标危ALL儿童的生存率相同H1:高危和标危ALL儿童的生存率不同0.051、将两组资料混合后统一排序:2、计算各组的期望死亡数:,3、求各组的期望死亡人数之和:第1组期望死亡总数为12.829,第2组期望死亡总数为19.171。4、计算值:=组数-1P0.05。按=0.05水平不拒绝H0,还不能认为两种类型儿童ALL生存率不同。,datalogrank;inputgroupmonthcensor;cards;110130140150160180110011101120114011701180124013001310151016211781188111151112412302702120213021502160217021902210223022802370242024702500265026912721279128012851296121091;proclifetestplots=(s);timemonth*censor(1);stratagroup

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论