华西统计学资料-随访资料的生存分析_第1页
华西统计学资料-随访资料的生存分析_第2页
华西统计学资料-随访资料的生存分析_第3页
华西统计学资料-随访资料的生存分析_第4页
华西统计学资料-随访资料的生存分析_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

#随访资料的生存分析生存分析的意义和应用无论观察性研究,还是实验(试验)性研究,有时需对研究对象进行追踪观察,不仅了解某事件发生的结局,同时还了解发生这种结局所经历的时间。例如临床治疗措施效果评价:白血病化疗缓解持续时间和缓解率、乳腺癌术后生存时间和生存率、肾移植术后生存时间和生存率等。上述生存资料若按通常的方法进行分析,有两方的问题:1.n年生存率有时出现后一年大于前一年的现象。活满n活满n年的人数观察满n年的人数100%表1某地1974—1981年胃癌根治术后随访记录年份例数生存年数12345678197429282523191817171719752624191818181616197624211916141413197732272321181619782523201616197936312926198025231919814636合计24321315412085664633171974年一1981年共手术243例,1974年手术29例,术后1年内死亡1例,活满1年的28例,到1982年末,活满8年的17例。以次类推。观察满1年的243例,活满1年的213例:年生存率=21X100%=87.65%243观察满2年的病例243-46=197例,活满2年的共154例:年生存率=兰1x100%二78.17%197年生存率=58.23%年生存率=60.00%年生存率=58.62%由于失访或死于其它疾病而终止观察等原因,分析时,当作存活或本病死亡均不合理,当作未观察病例则损失信息。因此,在观察例数较少同时截尾数据较多时,此法很不理想。2.某时点生存率不能反映整个生存过程,比较时可能出现不正确的结论。分析生存资料的统计方法称为生存分析(survivalanalysis)。它是将事件的结局和发生这种结局所经历的时间两个因素综合起来分析的一种统计方法。它能够处理截尾数据,并对整个生存过程进行分析或比较。生存分析在临床医学和公共卫生等领域应用广泛:1.临床治疗方案或处理措施的效果评价。如恶性肿瘤手术或化疗后(转移或死亡前)生存时间、肾移植术后生存时间、心脏起搏器的保留时间、种植牙的保留时间等。2.疾病危险因素分析和疾病预后的影响因素分析。如肺癌发病危险因素分析、肾移植手术效果的影响因素分析等。3.特殊人群卫生保健措施的效果评价。如中老年糖尿病预防效果评价、青少年控制吸烟的健康教育干预试验效果评价、食管癌高发区干预措施的效果评价、不同种类宫内节育器的节育效果评价(宫内保留时间或有效避孕时间)、某疫苗接种效果评价(观察抗体滴度了解免疫力持续时间或某病发病率)等。生存分析包括统计描述和统计推断两方面:统计描述:计算生存率、绘制生存率曲线、计算中位生存时间等。统计推断:估计总体生存率的可信区间、生存率曲线的比较。随访研究的几个问题一、随访内容1.开始随访的时间:入(出)院时间、确诊时间、开始治疗时间等可作为随访开始的时间。如乳腺癌的乳腺切除术后第一天或出院日、白血病化疗后缓解出院日等,也可规定开始治疗日为随访开始时间。2.随访的结局和终止随访的时间随访的结局可能有以下几种:“死亡”:泛指处理措施失败的事件。如肿瘤化疗后的复发、肾移植因肾衰或与之有关的原因而死亡等。终止随访时间为“死亡”时间。失访:拒绝随访、失去联系或中途退出等。终止随访时间为最后一次访问时间。死于与研究疾病无关的原因:终止随访时间为死亡时间。研究终止。研究终止时观察对象仍然存活。终止随访时间为研究终止时间。3.影响生存的有关因素:如患者年龄、病情、病程、术前健康等情况,以便分析这些因素对生存率的影响。二、随访方式1.全部观察对象同时接受处理措施,观察到最后一例出现结果或事先规定的随访截止时间。2.观察对象在不同时间接受处理措施,完成一定数量随访病例或按事先规定的时间停止随访。1.“死亡”事件“死亡”事件(deathevent)又称失败事件(failureevent),泛指标志某种措施失败或失效的事件,是根据研究目的确定的。如乳腺癌术后死亡、白血病化疗后复发、肾移植术后的肾衰等,均可作为“死亡”事件。2.生存时间生存时间(survivaltime)也是一个广义概念,泛指所关心的某现象的持续时间,即随访观察持续的时间,常用符号t表示。表26例乳腺癌患者术后随访记录患者观察记录原因-生存天数t终止日期结局(死=1,生=0)编号开始日期102-09-0302-12-290死于肺癌118+202-09-1002-12-081转移死亡90302-09-1402-12-310研究终止108+402-08-2502-11-290失访96+502-10-0102-11-280死于车祸59+602-10-0402-12-281复发死亡86生存时间分为两种类型:完全数据(completedata):指从观察起点到发生“死亡”事件所经历的时间。提供了观察对象确切的生存时间。截尾数据(censoreddata):亦称截尾值(censoredvalue)或终检值。指从观察起点到发生非“死亡”事件所经历的时间。截尾原因即前述三种情况:失访、死于与研究疾病无关的原因、研究终止。截尾数据不能提供完全的信息,常用符号“+”表示。三、生存率指某个观察对象活过t时刻的概率,常用P(X>t)表示。生存率也是一个广义概念,研究者定义的“死亡”事件不同,其含义亦不同。如白血病化疗的失败事件是白血病复发,生存率即为缓解率;预防接种腮腺炎疫苗后,接种儿童发生腮腺炎为失败事件,此时生存率为疫苗有效率;安放宫内节育器,失败事件定义为因节育器引起的腹痛、出血过多、感染等副作用,或带环受孕导致取出节育器,此时生存率即为节育器保留率。生存分析的主要内容一、描述生存过程计算各时点生存率、绘制生存率曲线、计算中位生存时间等。常用方法有乘积极限法和寿命表法。二、比较生存过程比较两组或多组生存曲线(生存过程)。常用方法有对数秩检验和分层对数秩检验等。三、生存过程的影响因素分析多因素生存分析如Cox比例风险模型分析疾病发生、发展及其预后的影响因素。例如,分析影响鼻咽癌手术预后的因素,如年龄、病程、病情、术前健康状况、有无淋巴结转移、术后有无感染、辅助治疗措施、营养状况等。生存资料的统计描述及

生存率的区间估计、乘积极限法乘积极限法(product-limitestimate)又称kaplan-Meier法,适用于未分组生存资料的分析。例1某方案治疗III期肺癌患者11例,随访时间(月)如下。试估计各时点生存率及其标准误。1,2,3,5,6,9+,11,13,16,26,37+,表3例1资料生存率及标准误的计算生存时间(月)X(1)死亡数dX(2)期初病例数nX⑶死亡概率(4生存概率&生存率P(X>t)(6)生存率标准误s黔11111/111-1/110.90910.086721101/101-1/100.81820.11633191/91-1/90.72730.13435181/81-1/80.63640.14506171/71-1/70.54550.15019+06010.54550.150111151/51-1/50.43640.163813141/41-1/40.32730.155016131/31-1/30.21820.136426121/21-1/20.10910.103037+01010.10910.1030生存率的计算1•生存时间X由小到大排列,遇非截尾和截尾值相同,截尾值排后。2•死亡数d:与生存时间X对应。注意:截尾值x对应的个体未发生“死亡”事件,故死亡数为0。3•期初病例数n,表示恰好在该时刻以前的病例X数。如n5为8,表示恰好在5月时点前有8人存活。

4•死亡概率q,表示X月前的观察对象恰好在XX月时点死亡的概率。5•生存概率p,表示X月前的观察对象恰好在X月时点存活的概率。6•生存率P(X>t)。表示该人群恰好活过t时刻的概率。它为小于和等于t时刻的各时点生存概率的乘积。7.生存率的标准误例如,P(X>3)的标准误为=P(X>=P(X>3)1—P(X>3)=0.72731—0.7273=0.1343生存率曲线未分组资料的生存率曲线称Kaplan-Meier曲线,它是以时间t为横轴,生存率P(X>t)为纵轴的曲线,其中水平横线表示从一个时点到下一个时点的距离。可对某一个体任意时刻的生存率作出估计,反之亦可由任意生存率估计生存时间。生存率0.5所对应的生存时间即中位生存时间。由图可见,生存率P(X>t)=0.5时,中位生存时间的估计值在6〜11月之间:6-110.5455-0.43646-t0.5455-0.5(6-11)(0.5455-0.5)t=6=80.5455-0.4364生存时间具有截尾值,一般不呈正态分布,故不宜用平均生存时间来描述生存资料。若生存率0.5处所对应的曲线与X轴平行,则中位生存时间不止一个。若Kaplan-Meier曲线上生存率全大于0.5,则中位生存时间无法估计。总体生存率可信区间的估计正态近似原理估计某时点总体生存率可信区间:P(x>t)土usaP(x>t)生存率曲线尾部的生存率不适合于用该法计算总体生存率的可信区间。二、寿命表法适用于分组的生存资料。①实际工作中,随访结果常常没有每个观察对象确切的生存时间,只能获得按随访时间分组的资料。②当样本较大(如n>50)时,采用乘积极限法估计生存率及其标准误较为繁琐。

例2某院对100例确诊的原发性肝癌患者进行随

访,见表第(1)至(3)栏。据此资料计算生存率和标准误。表2100例原发性肝癌患者生存率及标准误确诊后月数期内失访人数期内死亡人数期初观|确诊后月数期内失访人数期内死亡人数期初观|业h察人数0〜217100991〜1268180.52〜3275452.53〜21524234〜02775〜1254.56〜00227〜1021.58〜90111死亡概率生存概率n月生存率(n=X+1)生存率标准误q©p1(7)p"(8js(9)00.17170.82830.82830.03790.32300.67700.56080.05020.51430.48570.27240.04570.65220.34780.09470.03140.28570.71430.06770.02770.44440.55560.03760.02210.00001.00000.03760.02210.00001.00000.03760.02211.00000.00000.0000校正人数生存率的计算1.确诊后月数X〜:“0〜”表示从确诊日起不满一月,“1〜”表示确诊后1月至不满2月,依次类推。2•期内失访人数WX:泛指具有截尾数据的人,X表示随访已满X月,但在未满X+1月期间失访的人。3.3.期内死亡人数DX:指期内死于肝癌的人数。4.4.5.期初观察人数LX:指时刻X以前的人数。校正人数NX:相当于实际观察人时数。在各X月月初观察人数中减去同月失访人数的一半。6•死亡概率iqx:指活满X月的病人在X+1月内死亡的概率。7•生存概率iPx:指活满X月的病人在X+1月内存活的概率,即在活过某时刻的条件下,再活下一时间段的概率。n月生存率p,表示活过n月的概率。n0生存率标准误的计算。生存率曲线以生存月数X为横轴,n月生存率p为纵轴作n0生存率曲线。总体生存率可信区间的估计根据正态近似原理用p土us估计。n0apn0不宜用该法计算接近尾部的生存率可信区间。生存曲线比较的假设检验——对数秩检验对数秩检验(log-ranktest)的基本思想是:若无效假设成立,则根据各个时点两组的期初观察人数和死亡概率,计算两组在各个时点的理论死亡数。如无效假设成立,理论死亡数与实际死亡数应相差不大。反之,则不支持无效假设成立,进而认为两条生存曲线差异有统计学意义。对数秩检验可用于两个或多个样本生存曲线的比较,其检验统计量:(A-T)2X2=工-Tv=组数-1当有T小于5时,用下式计算校正x2值。(A-T-0.5)2X2=Z-T例3将22例III期非小细胞肺癌患者随机分配到放疗组和放化疗联合组,从缓解出院日开始随访,随访时间(月)如下。比较放疗和放化疗联合两种治疗方案的生存率曲线有无差别。甲:放疗组1,2,3,5,6,9+,11,13,16,26,37+乙:放化疗联合组10,11+,14,18,22,22,26,32,38,40+,42+1.建立检验假设和确定检验水准H0:单放疗与放化疗联合两治疗方案的生存率曲线分布相同再:单放疗与放化疗联合两治疗方案的生存率曲线分布不同a=0・052•计算统计量‘2值

表3单放疗组和放化疗联合组理论死亡数的计算序号(1)组别(2)观察时间t⑶死亡数d(4)期初病例数理论病死数甲n乙⑹合计(7)甲(8)=(4)X(5)/(7)乙(9)=(4)X(6)/(7)1甲111111220.50000.50002甲211011210.47620.52383甲31911200.45000.55004甲51811190.42110.57895甲61711180.38890.61116甲9+0611170.00000.00007乙101511160.31250.68758甲11+1510150.33330.66679乙110410140.00000.000010甲13149130.30770.692311乙14139120.25000.750012甲16138110.27270.727313乙18128100.20000.800014乙2222790.44441.555615甲乙2622570.57141.428616乙3211450.20000.800017甲37+01340.00000.000018乙3810330.00001.000019乙40+00220.00000.000020乙42+00110.00000.0000合计5.128211.8718表4例3对数秩检验总结表组另U观察死亡数A理论死亡数T死亡比A/T甲95.12821.7550乙811.87180.6739(9-5.1282)2(8-11.8718)2x2=+=4.195.128211.8718v=2-1=13.求出P值,作出统计推断查咒2界值表,得P<0.05,在«=0.05水准拒绝H0,接受H1,可以认为单独放疗和放化疗联合治疗III期非小细胞肺癌的生存率曲线分布不同,放化疗联合治疗的效果较好(因为A组死亡比大,表示B组生存率曲线高)。对于分组资料,计算公式完全相同,只是表中d、n、n、n分别表示对应于各观察时间区间的比较组甲乙的死亡人数、甲组校正人数、乙组校正人数、合计校正数。对数秩检验也可用于三组生存曲线的比较。由对数秩检验过程可知,若每一时点A组死亡率都高一点(生存率低一点),则检验结果必然为A不同于B。因此,在比较的两条生存率曲线无交叉时,直接用对数秩检验是合适的。反之,就需进一步分析原因,了解是否存在混杂因素的影响。例4为比较A、B两治疗方案对某病的治疗效果,

将25名病人随机分成2组,分别给予A、B两种治疗。治疗前检查每名患者肾功能(记功能正常者为0,不正常为1),治疗后的生存时间(天)如下。表5A、B两组病人生存时间及肾功能A组B组生存时间肾功能生存时间肾功能811800852+

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论