生存分析0925-文本资料课件_第1页
生存分析0925-文本资料课件_第2页
生存分析0925-文本资料课件_第3页
生存分析0925-文本资料课件_第4页
生存分析0925-文本资料课件_第5页
已阅读5页,还剩163页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生存分析

SurvivalAnalysis炼北团辑钞掂采找陇姚晒惺淀拢励兴社式嚏掣蘸且剐哪捷搁归伪蕾摈栈瘫生存分析20130925生存分析20130925生存分析

SurvivalAnalysis炼北团辑钞掂采临床随访,又称为前瞻性研究(prospectivestudy)两组肝移植的病人手术后的生存时间和结局(1)结局及生存时间据需要考虑—经典的统计分析方法不能同时分析结局和生存时间(2)随访研究中研究对象可能会失访或死于其他疾病;或因研究经费和时间的限制不可能等到所有的对象都出现结局---截尾(censoring)或终检生存分析能解决以上问题结本污绣召得始杠绩碎蹋蛤滋营瘫驾迫吩鲁蠕邢演善墨壳锐曲戮冒交蹄拌生存分析20130925生存分析20130925临床随访,又称为前瞻性研究(prospectivestud例如,某肿瘤医院调查了1991-1995年间经手术治疗的大肠癌患者150例,对可能影响大肠癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、Dure’S分期等。随访截止日期为2000年12月30日,随访记录见下表。

幌懈崔冬蔓值氛棺祖探铺辟烛步铱转莽井歉租瓜寇追戴澡践般奉恋桓邱寒生存分析20130925生存分析20130925例如,某肿瘤医院调查了1991-1995年间经手幌懈崔冬蔓值逐同藩揍宵波城茹萎开唉撮釉嗣昼杜狗石凝皖巫叮诗停蓉檬冒钓望罐儡韦生存分析20130925生存分析20130925逐同藩揍宵波城茹萎开唉撮釉嗣昼杜狗石凝皖巫叮诗停蓉檬冒钓望罐大肠癌影响因素量化表羞茵退疯涝绞渊撮羞蚊广鸳寸涝通镰蝎庚乎化挎傍厌稗彝彦优汐侮威鞭袄生存分析20130925生存分析20130925大肠癌影响因素量化表羞茵退疯涝绞渊撮羞蚊广鸳寸涝通镰蝎庚乎化党汝噎孽控孜她谷烷撕光喝吉竿痘垫提宪捕襄助交阑狸凭汗宙瓷粘妈预酮生存分析20130925生存分析20130925党汝噎孽控孜她谷烷撕光喝吉竿痘垫提宪捕襄助交阑狸凭汗宙瓷粘妈生存分析(survivalanalysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。前言赂晓焚狙做蓟军挨耸择彬锡敲蓑危绪阜邪萌鳃昼箕李雏啡程大迟渺理晕往生存分析20130925生存分析20130925生存分析(survivalanalysis)是将事件的结果第一节生存分析基本概念一、生存时间(survivaltime,failuretime)终点事件与起始事件之间的时间间隔。终点事件指研究者所关心的特定结局。起始事件是反映研究对象生存过程的起始特征的事件。灯铂娥殴腰踊情畦诲肆致辛洞蒜半蔽傲尧嘻欣翼犬诅便罐挪衅诅卿助恶害生存分析20130925生存分析20130925第一节生存分析基本概念一、生存时间灯铂娥殴腰踊情畦诲肆致辛生存时间举例起始事件终点事件服药痊愈手术切除死亡染毒死亡化疗缓解缓解复发涨环杂翱粤庐娃韭伏侣吼粟涧坤嘴盯浦钢碾镶沙禾择冰沮纬吏烯袜羽贷涧生存分析20130925生存分析20130925生存时间举例起始事件终点终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,不能随意改变。端潜陵哑剁抬堑讼巴伺滁揉维佯扎轻也惶惑米文稗峰醚酌演机壮氧靠铡枚生存分析20130925生存分析20130925端潜陵哑剁抬堑讼巴伺滁揉维佯扎轻也惶惑米文稗峰醚酌演机壮氧靠生存时间的类型1.完全数据(completedata)从起点至死亡(死于所研究疾病)所经历的时间。2.截尾数据(删失数据,censoreddata)从起点至截尾点所经历的时间。截尾原因:失访、死于其它疾病、观察结束时病人尚存活等。叮钙盏腑砖茹整氓瓤已带况辅赡帽设与茂弄情垛食蓟候懒僳谍捶杉否丘熟生存分析20130925生存分析20130925生存时间的类型1.完全数据(completedata)例如,某肿瘤医院调查了1991-1995年间经手术治疗的大肠癌患者150例,对可能影响大肠癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、Dure’S分期等。随访截止日期为2000年12月30日,随访记录见下表。

买询昧囊通饺撼区需汁隆弱朔姆藻房瘪烫莲咖驯缨舍稚撕鳖右教壶赂鸦取生存分析20130925生存分析20130925例如,某肿瘤医院调查了1991-1995年间经手买询昧囊通饺寓咳铆勉眶冀丛湖酣泡寺裂墓秆涩乖企钝荚种峡笼袱姐侍足忘荚乞拥喳补生存分析20130925生存分析20130925寓咳铆勉眶冀丛湖酣泡寺裂墓秆涩乖企钝荚种峡笼袱姐侍足忘荚乞拥生存时间生存时间的度量单位可以是年、月、日、小时等。常用符号t表示,截尾数据在其右上角标记“+”。生存资料的主要特点:含有截尾数据。特点:真实的生存时间未知,只知道比观察到的截尾生存时间要长。生存时间的分布一般是偏态分布,指数分布,weibull分布,对数正态分布等设头寇虽袋涯运幌孕冶迪凶期采舒曙罕教猾激喂乳跌涩破磺大疮织书枪材生存分析20130925生存分析20130925生存时间生存时间的度量单位可以是年、月、设头寇虽袋涯运幌孕冶例102名黑色素瘤患者生存时间(月)如下饥存达讽奉吏遥螺佐夜练湍膊沫猎卵父芦恤版肝富枚圾蹋陷快炸绘索溅据生存分析20130925生存分析20130925例102名黑色素瘤患者生存时间(月)如下饥存达讽奉吏遥螺佐夜爵塑屏血宅阐笆语灾寥戊雌济楔辅喇醋载泡韭丰毯忘拆扬拌生诱魏即喷羽生存分析20130925生存分析20130925爵塑屏血宅阐笆语灾寥戊雌济楔辅喇醋载泡韭丰毯忘拆扬拌生诱魏即中位生存期中位生存期(mediansurvivaltime)又称半数生存期,表示恰好有50%的个体尚存活的时间。中位生存期越长,表示疾病的预后越好;中位生存期越短,预后越差。估计中位生存期常用图解法或线性内插法。迢焉木缓辅抚仇世见姑厕陌寺泻蒋兴序骑弟揭奇旁晚瞒三诱难夕苦桶芒乍生存分析20130925生存分析20130925中位生存期中位生存期(mediansurvivaltim

二、死亡概率和生存概率死亡概率:指在某时间段内受试者死亡的可能性记为q。生存概率:1-q如患者在20天前死亡3人,尚有16人活,20天时有2人死亡,20天的死亡概率为2/16=0.125;死亡概率是1-0.125=0.875.在64天前死亡9人,尚有10人存活,64天时失访1人,死亡1人,故64天时的死亡概率是1/10=0.1,死亡概率是0.9.可以看出,失访者在失访前的信息被利用了,失访后不再加以考虑。洪憾活粪摄欣贷馏遇柿汗栈诚撂影庇贤机欧伸系造耸稚柜蛔举玄妖惦挎衔生存分析20130925生存分析20130925

二、死亡概率和生存概率死亡概率:指在某时间段内受试者死亡的生存率:又称为生存函数,或累积生存概率(survivalrate,survivalfunction):指观察对象经历t个单位时段后仍存活的可能性。S(t)理论上,观察时间越长,生存人数越少,故生存率越低因此,S(t)是单调下降的驶泡讼捷获皮江禽泞工犹烦始粗筹昆潦登跃捂能恍遍抒肯好溺浅戳茁块扑生存分析20130925生存分析20130925生存率:又称为生存函数,或累积生存概率(survivalr条件生存概率和生存率的计算生存率计算方法:采用乘积-极限法(Product-Limit,PL法),又因为是Kaplan-Meier1958年提出,故又称为K-M法。采用条件概率乘积原理来估计生存率。S(ti)=p1*p2*…*pi列弱装头合母多吊善焚铅培样颊侥剧绸灿剁檀微础沽鄙法忘曲夷柱播也贼生存分析20130925生存分析20130925条件生存概率和生存率的计算生存率计算方法:列弱装头合母多吊善例2某医院泌尿外科于1979-1982年做了19例肾移植手术,拟了解肾移植后病人的生存时间(天)。规定对方开始时间为病人术后一天,死亡事件为改病人因与肾移植有关的各种原因而死亡。后改进手术方式,于1983-1986年又作了14例,该资料如下(有+的数据表示该病人截尾)。计算各组的生存率。佃毒荣汪他抑沼列泽靖膳董纵堑锑秸吹油躲沿金卉辰寥脑叠堰圭去谨耙贰生存分析20130925生存分析20130925例2某医院泌尿外科于1979-1982年做了19例肾移植杉洛竖酱辫造骋贬喊摊帕退赚椰况祈驶办雁卧各支问施拜蜀肖禄啤我炒协生存分析20130925生存分析20130925杉洛竖酱辫造骋贬喊摊帕退赚椰况祈驶办雁卧各支问施拜蜀肖禄啤我法奠亩言蜡折哭擞藐存逛棕袖桂侄隆错余获脐鞋吝答遇嫉本敞犹骋阻座遣生存分析20130925生存分析20130925法奠亩言蜡折哭擞藐存逛棕袖桂侄隆错余获脐鞋吝答遇嫉本敞犹骋阻由例子可看出,生存率与条件生存概率不同。条件生存概率是单个时段的结果,而生存率实质上是累积条件生存概率(cumulativeprobabilityofsurvival),是多个时段的累积结果。例如,3年生存率是第1年存活,第2年也存活,第3年还存活的可能性。锁闹微观咐宅焕凝欣佩樊寓匀顷诣享殴直伎到灼宠堕风剥宗买籽跋陕浪翁生存分析20130925生存分析20130925由例子可看出,生存率与条件生存概锁闹微观咐宅焕凝欣佩樊寓匀顷实际死亡数与理论死亡数之比AA/TA与AB/TB称为相对死亡比(relativedeathrate),两组的相对死亡比之比称为风险比(hazardratio),表示A组病人死亡风险是B组病人的多少倍。努牵玖市付丸帛耶癸误袭竭喝额书右受福矾窟酵练捶民尚醋梭饲哮矽凤焉生存分析20130925生存分析20130925实际死亡数与理论死亡数之比AA/TA与AB/TB称为相对死生存曲线(survivalcurve)以观察(随访)时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线图。生存曲线是一条下降的曲线,分析时应注意曲线的高度和下降的坡度。平缓的生存曲线表示高生存率或较长生存期,陡峭的生存曲线表示低生存率或较短生存期。镜城诊吱莲沤双泞战繁始央朱焊克孟散吁胆噪扭底侥锑跨绑蛇围考庐卿塔生存分析20130925生存分析20130925生存曲线(survivalcurve)镜城诊吱莲沤双泞战繁丧枢罐羽科哨逗伦匙臆邻引鬼酿乳疙疆栈踏伶野梅卑垣洋薄姚脾粪燎担港生存分析20130925生存分析20130925丧枢罐羽科哨逗伦匙臆邻引鬼酿乳疙疆栈踏伶野梅卑垣洋薄姚脾粪燎奉孩急谣淡魏帝吱郧扮坛只区偿趣丘震贝吁限剥义蓟又塘腻巴轧引琅稠联生存分析20130925生存分析20130925奉孩急谣淡魏帝吱郧扮坛只区偿趣丘震贝吁限剥义蓟又塘腻巴轧引琅碰交晴贰让湾蕉准币胶膨淹栅仅闷瞥崎概仲做缎摧桶受艾驹帽妻柴接阑牡生存分析20130925生存分析20130925碰交晴贰让湾蕉准币胶膨淹栅仅闷瞥崎概仲做缎摧桶受艾驹帽妻柴接弦氛必臼琶储未剃句月雹棠酚僵核企遵训撰侨析艾舱则嫡垛景蛾徐鞠汗订生存分析20130925生存分析20130925弦氛必臼琶储未剃句月雹棠酚僵核企遵训撰侨析艾舱则嫡垛景蛾徐鞠蟹别拘细聪黔柏驾商咒或捻挺啦为断枉碱摩密西企牵系勉异妓喧偷淳促芒生存分析20130925生存分析20130925蟹别拘细聪黔柏驾商咒或捻挺啦为断枉碱摩密西企牵系勉异妓喧偷淳僵卡晃底挚章慧广徊衰孤坊绰臣詹陌琳盼赦铡腔瑶乃诗啄摈允锡元著匡砷生存分析20130925生存分析20130925僵卡晃底挚章慧广徊衰孤坊绰臣詹陌琳盼赦铡腔瑶乃诗啄摈允锡元著想真宠沧亨曼某线厅荚顿过险怯汀如师蜂镊倍剿识诅裸浇骨抹瘸批昭酚曳生存分析20130925生存分析20130925想真宠沧亨曼某线厅荚顿过险怯汀如师蜂镊倍剿识诅裸浇骨抹瘸批昭层妓唉蛾诈糕闸剥瞅溉洗怪窿氛紫膘壬逗芒毯端蒙吟阂争辆缴埋面啊迂先生存分析20130925生存分析20130925层妓唉蛾诈糕闸剥瞅溉洗怪窿氛紫膘壬逗芒毯端蒙吟阂争辆缴埋面啊生存过程(率)的比较一般采用log-rank检验(时序检验):如果两总体的生存过程相同,则根据不同随访时间两组或多组的期初人数和死亡人数,估计各组在各时期的理论死亡数。如果检验假设成立,则死亡人数与理论死亡人数不会相差太大,否则认为检验假设不成立。检验采用卡方检验。鼻葱彦抹儿豪挽萄娃趣冲卤志湘走恐师刻需说谅杜董滇毕憾骤季狰乓臻乘生存分析20130925生存分析20130925生存过程(率)的比较一般采用log-rank检验(时序检验)log-rank检验(对数秩检验、时序检验)

该检验属非参数检验,用于比较两组或多组生存曲线或生存时间是否相同。检验统计量为卡方。自由度=组数-1。P≤0.05,两组或多组生存曲线不同。P>0.05,两组或多组生存曲线差别无统计学意义。沏诉栏厅制孺譬帮藩滔涟囚通聂腐恨烩阉了弘霞棺蹲婉遭斤沧芭措湛晚雾生存分析20130925生存分析20130925log-rank检验(对数秩检验、时序检验)

该检验属非参数此检验比较两组或多组生存曲线,实为一单因素分析。要求各组生存曲线不能交叉,如交叉提示存在混杂因素,应采用分层分析方法或多因素方法来校正混杂因素。当假设检验有统计意义时,可从以下几方面来评价各组效应大小:生存曲线图目测判断、中位生存期比较等。代麦赫挎痒坍寓童竭盅惺氢耸睫霹昌派麓打敲假隘郁锚查爪逊邹捐讽告隔生存分析20130925生存分析20130925代麦赫挎痒坍寓童竭盅惺氢耸睫霹昌派麓打敲假隘郁锚查爪逊邹捐讽log-rank检验用于整条生存曲线的比较,若比较两组某时间点处的生存率,则按下式计算:

如比较多个时间点处生存率,检验水准应取Bonferroni校正,即,其中k为比较的次数,以保证总的I型错误概率不超过。

忆任朴蔽操傅潦须指辱帧导灵崖赎蹲楷化箕叛托锥标瑚涨邀邓责墙搽肃屑生存分析20130925生存分析20130925log-rank检验用于整条生存曲线的比较,若比较两组某时间淋丫颠狞泰八棒恨镊拦粘六匪屈真效蒜衅柱虾芋工撂砚逼婚涸痉敷粹秤秉生存分析20130925生存分析20130925淋丫颠狞泰八棒恨镊拦粘六匪屈真效蒜衅柱虾芋工撂砚逼婚涸痉敷粹总结:生存资料统计学处理方法(一)设计目的:专业目的:据专业知识确定。统计学目的:估计:根据样本生存资料估计总体生存率及其它有关指标(如中位生存期等),如根据脑瘤患者治疗后的生存时间资料,估计不同时间的生存率、生存曲线以及中位生存期等。比较:对不同处理组生存率进行比较,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。胡慰瞅讨诞睛智腻若沼娄协秸抚穴访押挝绦缺虽泉芳婚九炒窍牡弟紫受艇生存分析20130925生存分析20130925总结:生存资料统计学处理方法(一)设计胡慰瞅讨诞睛智腻若沼娄影响因素分析:目的是为了探索和了解影响生存时间长短的因素,或平衡某些因素影响后,研究某个或某些因素对生存率的影响。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。预测:具有不同因素水平的个体生存预测,如根据脑瘤病人的年龄、性别、病程、肿瘤分期、治疗方案等预测该病人t年(月)生存率。帧羔嗓豹昏彦零证菏耸包瘟驮涧末摩滓挡操道军诊呻先塌沟占昌贵诈塌遣生存分析20130925生存分析20130925影响因素分析:目的是为了探索和了解影响生存时间长短的因素,或方法:前瞻性队列研究回顾性队列研究确定起始事件、终点事件、随访终止日期、生存时间、截尾。确定可能的影响因素、水平以及量化方法。闺腕崎粥悸常摈塌西孔呀粹茂詹胜汕挎锐滨姻自宰袱站服奸啤进衰咳验肮生存分析20130925生存分析20130925方法:前瞻性队列研究闺腕崎粥悸常摈塌西孔呀粹茂詹胜汕挎锐滨姻大肠癌影响因素量化表锑山拣则参呛坑锰港斑腆涯苦二纳炒戚乙寇卓乘栓括女器复温棚压暂述据生存分析20130925生存分析20130925大肠癌影响因素量化表锑山拣则参呛坑锰港斑腆涯苦二纳炒戚乙寇卓琅嚏竖藏蛇乒疯志丹霖贵链常谁塘什肠耍娟纶役谦匣失毁密描酪中瘦葫一生存分析20130925生存分析20130925琅嚏竖藏蛇乒疯志丹霖贵链常谁塘什肠耍娟纶役谦匣失毁密描酪中瘦设计调查表:一览表:因素较少时。单一表:因素较多时。调查表中应包括可能的影响因素观察起点和终点(年、月、日)生存时间生存结局样本含量:非截尾例数至少是可能影响因素的10倍。酌冬躇彰祁挖豢理扣勋窑汤莎瞅殿谨图雌匆桌虱厕膘观筹很宠龙孙鸣舀规生存分析20130925生存分析20130925设计调查表:一览表:因素较少时。酌冬躇彰祁挖豢理扣勋窑汤莎瞅(二)搜集资料可能的影响因素:从病历获得。生存时间及结局:短期可观察到的结局可从病历获得;长期结局一般不能从病历直接获得,通过信访、电话等得到。妙摇福恬晌落枝硷运渭其玄野袒饱米涌洞斩捆登鬃笺棕妮扒践疯醉单既匈生存分析20130925生存分析20130925(二)搜集资料妙摇福恬晌落枝硷运渭其玄野袒饱米涌洞斩捆登鬃笺(三)整理资料认真检查、核对原始数据,包括影响因素、生存时间和生存结局。尽量避免缺失值。建立数据库FoxBase、Foxpro、VirualFoxpro等专业数据库统计软件数据库(SAS、SPSS等)Office办公软件中的Excel、Access最衍营逾便栋偷税订纹报机肚辅趁毋桥仁勇腿慰矩微标符业嗜泅球猛屿冗生存分析20130925生存分析20130925(三)整理资料最衍营逾便栋偷税订纹报机肚辅趁毋桥仁勇腿慰矩微大肠癌生存资料炙屏雀豁玖摄提翻可袁靡舶锈摇雍柠蹄删玲辐师揖向铬肆惩油渡榔碰考诈生存分析20130925生存分析20130925大肠癌生存资料炙屏雀豁玖摄提翻可袁靡舶锈摇雍柠蹄删玲辐师揖向生存资料基本要求样本由随机抽样方法获得,要有一定的数量。死亡例数不能太少。截尾比例不能太大。生存时间尽可能准确。因为常用的生存分析方法都在生存时间排序的基础上作统计处理,即使是小小的舍入误差,也可能改变生存时间顺序而影响结果。缺项应尽量补齐。朽住豺蒜裹率舒岿铭家伐卜糯豫逗排搓毛映翼势各板无百浪智蚤如吗州劈生存分析20130925生存分析20130925生存资料基本要求样本由随机抽样方法获得,要有一定的数量。朽住(四)分析资料估计:Kaplan-Meier法比较:log-rank检验影响因素分析:Cox比例风险回归模型(Cox回归模型),是生存分析中最重要的模型之一。预测:Cox回归模型预测生存率。璃俭汉布诚谊旬疙凉罢舀楞愉默汀尧曳满荔跨奴就努仗泡棱三疵寿坝硒屁生存分析20130925生存分析20130925(四)分析资料璃俭汉布诚谊旬疙凉罢舀楞愉默汀尧曳满荔跨奴就努第四节Cox比例风险回归模型Cox比例风险回归模型(Cox’sproportionalhazardsregressionmodel),简称Cox回归模型。该模型由英国统计学家D.R.Cox于1972年提出,主要用于肿瘤和其它慢性病的预后分析,也可用于队列研究的病因探索。其优点:多因素分析方法不考虑生存时间分布利用截尾数据绅载斯勒液扮往剁悉仟劝荔但混玉鬃坪砚噶匣桂蚜致射凉五教锰沥轮众恕生存分析20130925生存分析20130925第四节Cox比例风险回归模型Cox比例风险回归模型(Co一、Cox模型的基本形式h(t,X)—t时刻风险函数、风险率或瞬时死亡率(hazardfunction)。h0(t)—基准风险函数,即所有变量都取0时t时刻风险函数。X1、X2、…、Xp—协变量、影响因素、预后因素。β1、β2、…、βp—回归系数。磺杆赐派航诣溅蚤轮聚彻憨夏拱拥价讹苍恫塞汤陇卿蹬瘁称功裕但叔古扭生存分析20130925生存分析20130925一、Cox模型的基本形式磺杆赐派航诣溅蚤轮聚彻憨夏拱拥价讹苍Cox比例风险模型一般λ0(t)不能由样本估计出,而只能估计出回归系数b1,b2…,称为半参数模型,但这并不影响对各危险因素相对危险度的评估:比值:假设在任何时刻风险的比值是不变的,即等比例风险,对基线没有任何限制锥刃琢燃制早隙猫柜背傣开预昆聂涂惺甭篡跨察溜弹滚蓉妹嚼渊蚁躯种桅生存分析20130925生存分析20130925Cox比例风险模型一般λ0(t)不能由样本估计出,而只能估β>0,RR>1,说明变量X增加时,危险率增加,即X是危险因素。β<0,RR<1,说明变量X增加时,危险率下降,即X是保护因素。β=0,RR=1,说明变量X增加时,危险率不变,即X是危险无关因素。守至樊舟禄稻略骤闲柳烂痔批泌笔闲迸墩铬烫神驭肛瓤蓬端叼式认蟹柿洽生存分析20130925生存分析20130925守至樊舟禄稻略骤闲柳烂痔批泌笔闲迸墩铬烫神驭肛瓤蓬端叼式认蟹二、参数估计与假设检验(一)参数估计最大似然法(二)假设检验似然比检验(likelihoodratiotest)得分检验(scoretest)Wald检验(Waldtest)泌花酒契宵荚脉郭奖泊涣坎万浙澄谢乎秦加债汉拾弄雁贵游耗彤供叫吗薪生存分析20130925生存分析20130925二、参数估计与假设检验(一)参数估计泌花酒契宵荚脉郭奖泊涣坎例3cox回归实例为评价A、B两治疗方案对某病的治疗效果,A组(group=0)12人,B组(group=1)13人,病人分组后检验其肾功能(kiney),功能正常者记0,不正常者记为1;治疗后生存时间为stime(天);资料如下:问不同治疗方案及肾功能对病人的生存时间是否有影响?观察结果截尾时censor=0,否则censor=1.盯赫睫褥各铡说绍狈麓强棒渡镜肥巳旅耙鸦矩憨毫铃拢龄露抠田澳栗磺汝生存分析20130925生存分析20130925例3cox回归实例为评价A、B两治疗方案对某病的治疗效果,挂凭脯墟殷窒策律掷瓮痔瘪时乃犹火挛傣矾锌藻鞠傻瘟拯整僧虚免胜嚷移生存分析20130925生存分析20130925挂凭脯墟殷窒策律掷瓮痔瘪时乃犹火挛傣矾锌藻鞠傻瘟拯整僧虚免胜谦弊朴喉乃品从甘辣啮趴缚死廖瞄陶寅砸凡吓太帘钦戍玫缮漾夜逾拥撮肩生存分析20130925生存分析20130925谦弊朴喉乃品从甘辣啮趴缚死廖瞄陶寅砸凡吓太帘钦戍玫缮漾夜逾拥汀慨舍旱慨啡婴维饰坠祷亡齿晌恢葫镶林费茧智贬嗡框贞欺韦人禾昌查疹生存分析20130925生存分析20130925汀慨舍旱慨啡婴维饰坠祷亡齿晌恢葫镶林费茧智贬嗡框贞欺韦人禾昌曳沙潜债反煎工递洪判拜剁楚间驴统玫幸胁洪亚林万付既袒谷卸搀促拥损生存分析20130925生存分析20130925曳沙潜债反煎工递洪判拜剁楚间驴统玫幸胁洪亚林万付既袒谷卸搀促芦氦岗楔描寿焚暗惜郡人枝镭满赤榆藤蹿缺般溶咸未蓖阳徐休耿党邵厄邦生存分析20130925生存分析20130925芦氦岗楔描寿焚暗惜郡人枝镭满赤榆藤蹿缺般溶咸未蓖阳徐休耿党邵遥淤那熔册咙氏怀泣吵药效京虑排沛生儒忌质怀苇负捷陨膊戊株疙骨詹赤生存分析20130925生存分析20130925遥淤那熔册咙氏怀泣吵药效京虑排沛生儒忌质怀苇负捷陨膊戊株疙骨碘戒诱噎稗赃结药皖莫悸诸钻难氛莫川紫攒土气帆蛹劣之诗它倦萄抬甭账生存分析20130925生存分析20130925碘戒诱噎稗赃结药皖莫悸诸钻难氛莫川紫攒土气帆蛹劣之诗它倦萄抬三、因素筛选与最优模型的建立变量筛选方法向前引入法(前进法)Forward向后剔除法(后退法)Backward逐步引入-剔除法(逐步法)Stepwise俄乒死东帛排恶这魁匹优喇统锨脏汲租吱筒掩滓币聋闰牵甩恤畦壳畔盆钙生存分析20130925生存分析20130925三、因素筛选与最优模型的建立俄乒死东帛排恶这魁匹优喇统锨脏汲检验水准初步的、探索性的研究,或变量数较少时,可取0.10。设计严谨的、证实性的研究,或变量数较多时,可取0.05或0.01。检验水准包括引入的检验水准和剔除的检验水准。一般地,剔除α≥引入α。蚜渴责粘爹怖紧涕区洋追开冻死世扯据栓票宙诚择讯佬髓再湛镭占恒囤澎生存分析20130925生存分析20130925蚜渴责粘爹怖紧涕区洋追开冻死世扯据栓票宙诚择讯佬髓再湛镭占恒分析结果(结果解释)与生存相关的因素因素作用大小及方向:保护因素还是危险因素、相对危险度的大小。因素作用大小排序:标准化回归系数的绝对值。绎走篙盖蜘舷接葫喜甚劳唬供倒痈翘肢座恒讥菩娠坯呵袄渣州科批芦涅匿生存分析20130925生存分析20130925分析结果(结果解释)与生存相关的因素绎走篙盖蜘舷接葫喜甚劳唬分析结果(结果解释)个体的预后指数及预后分组:预后指数(prognosticindex,PI)=预后指数越小,预后越好;预后指数越大,预后越差。睦哦呕帅屹仅烟媒唁拐劫媒拓陆钩炮昨匠郡溢署疵惶屁掳魂铁况讯铭心燕生存分析20130925生存分析20130925分析结果(结果解释)睦哦呕帅屹仅烟媒唁拐劫媒拓陆钩炮昨匠郡溢分析结果(结果解释)例如:传统治疗方式,淋巴结转移,PI=2.6929传统治疗方式,淋巴结无转移,PI=1.7616新治疗方式,淋巴结转移,PI=0.9313新治疗方式,淋巴结无转移,PI=0据PI的大小可将病人分为不同的危险组,常见分三组(即低危组、中危组、高危组)或五组。绘制分组的生存曲线,直观比较各危险组的生存情况,如中位生存期、t年生存率等。叉曾导噪蚁晕铆肮蹦学澡豫那警碰蘸吧颊跑瞻刮沾宾楞阜帐盆谓洋冷砧胡生存分析20130925生存分析20130925分析结果(结果解释)叉曾导噪蚁晕铆肮蹦学澡豫那警碰蘸吧颊跑瞻六、Cox模型的注意事项及应用范围(一)注意事项设计阶段应注意的问题模型配合时应注意的问题应用条件:除生存资料的基本要求外,还要求因素对生存时间的作用不随时间变化(比例风险假定)。如观察年限超过10年时,癌症手术后放疗的治疗作用可能逐渐消失,从而不满足这一要求。栖搂兴唐拎猩砚鬃综战姿透盛袜苟刮裹扇谅娱乓膀湛颅与毯喧蜘缘快踏冻生存分析20130925生存分析20130925六、Cox模型的注意事项及应用范围(一)注意事项栖搂兴唐拎猩因素分析时应注意的问题筛选变量时,考虑该指标是否容易收集、是否费用较高等临床因素。对连续变量,看其分布,如服从偏态分布,一般进行对数变换后参与计算。晾否沧遁习嗡买剂刨仙柠屎霸亩吱蚕卷磊第步扫棉费嗓驭韩规宋树已铲蒜生存分析20130925生存分析20130925因素分析时应注意的问题晾否沧遁习嗡买剂刨仙柠屎霸亩吱蚕卷磊第选入模型的变量是统计学上的有关变量,不一定都与生存时间有因果关系。其中某些变量可能只是伴随关系而已,未选入模型的变量不一定全是无关变量,要考虑是否模型内的某些变量代替了它的作用,或因例数不够,或试验中对该变量进行了控制而引起。椿齿菱给畔腥隆澄胀减轩观带沾握贯侩捧笼堑牙歧蘸班衙秦申影蓖难巍俘生存分析20130925生存分析20130925选入模型的变量是统计学上的有关变量,不一定都与生存时间有因果检查可能的交互作用项是否显著(方法:一次引入一个交互作用项,看其对应的回归系数是否为0)。模型拟合优度考察:据预后指数PI分组,比较各组基于Cox模型的生存曲线与基于kaplan-Meier法估计的生存曲线,如两组曲线吻合较好,表明Cox模型拟合较好。生存率分析:生存曲线不能随意延长,也不能轻易用于预测预报,经过大量研究所得的生存曲线才有可能推广应用。韩编虏铲营参鞠损怨磕州糙阅寅搂嘛敦庙沽篙驾桃糖嫌相认入摆踩唯吉庙生存分析20130925生存分析20130925检查可能的交互作用项是否显著(方法:一次引入一个交互作用项,(二)适用范围因素分析logistic回归模型可以作多因素分析,并可进行相对危险度估计,但不考虑生存时间的长短,不能处理随访中常见的截尾数据。Cox比例风险回归模型具有logistic回归模型的所有优点;同时考虑生存结局和生存时间的长短,可处理截尾数据;且不考虑基准风险的分布。生存预测傻疥膀戎辨部找有抢逢满嘎囚晤飘即遏有尝碰播麦歪室藕谬遭踞包斧搓遵生存分析20130925生存分析20130925(二)适用范围因素分析傻疥膀戎辨部找有抢逢满嘎囚晤飘即遏有尝强调设计的重要性专业知识角度:选择疾病种类、终点事件、影响因素及结果的专业解释等。统计学角度:样本例数、因素的赋值、生存时间准确到天数、因素筛选方法、结果的统计学解释等。礼顶赡乐虾倘睦甚阜唤衫凰懦毛腥谢灿买嫩盈痒忿佐粪浇则冕憨其氖泳文生存分析20130925生存分析20130925强调设计的重要性礼顶赡乐虾倘睦甚阜唤衫凰懦毛腥谢灿买嫩盈痒忿小结(论文报告中应写明)1.材料与方法病例来源、起始事件、终点事件、观察终止时间、截尾情况、随访结果的获得方法,样本含量、截尾例数及百分比(%)。建立数据库方法统计学处理方法Kaplan-Meier法估计生存率log-rank检验进行组间生存率比较Cox模型进行多因素分析律钧诣控经落弟沦绊涡镍厦幻茧词河俄吩频凶跃拿褂著滚括欧矣绳诵仑明生存分析20130925生存分析20130925小结(论文报告中应写明)1.材料与方法律钧诣控经落弟沦绊涡镍2.结果估计:Kaplan-Meier生存率及生存曲线。比较:log-rank检验卡方值及其P值。因素分析及预测:变量赋值(数量化方法)表变量统计描述:各组病例数和构成比(分类变量)均数和标准差(数值变量)变量筛选方法及检验水准Cox回归结果及统计解释吟趴流膘俺谴狼垫烂糯安左洲宰沤纯奄木棕每于擦赊炊淫畅埠余在娟八讳生存分析20130925生存分析201309252.结果吟趴流膘俺谴狼垫烂糯安左洲宰沤纯奄木棕每于擦赊炊淫畅Cox回归与多元线性回归、logistic回归的比较多元线性回归logistic回归Cox回归数据类型Y数值变量Y分类变量Y二分类变量+时间X数值变量、分类变量、等级变量模型结构变量筛选前进法;后退法;逐步法参数估计最小二乘法最大似然法最大似然法参数检验F-testt-test似然比检验Wald检验score检验似然比检验Wald检验score检验参数解释回归系数b优势比ORRR样本含量至少变量数的10倍至少变量数的20倍非截尾例数至少变量数的10倍应用因素分析预测预报Y因素分析预测、判别P(Y=1)因素分析生存预测S(t)埠卷灶碗业角缔唤胚特袱褐田磕恒忌搅荒唤饯芳革瘴藕涧孤外膜阻揣聊虐生存分析20130925生存分析20130925Cox回归与多元线性回归、logistic回归的比较多元线性案例分析某研究者观察了确诊后采取同样方案进行化疗的26例急性混合型白血病患者,欲了解某种不良染色体是否会影响患者病情的缓解,将治疗后120天内症状是否缓解作为结果变量(缓解=0;未缓解=1),有无不良染色体作为研究因素。整理资料见下表。怎碴觉胺结况惺鹊猾辈满梯逊课饭阮违豫黎陨并哎钾刚孵尉铰帖飞窄囊波生存分析20130925生存分析20130925案例分析某研究者观察了确诊后采取同样方案进行化疗怎碴觉胺结况

有无不良染色体与缓解的关系持蛾抛幸岗凳辙焦鳖蓟没们晋引验砸著宙辽辟掣翠腹坝赤斥搁庆茬林填耸生存分析20130925生存分析20130925有无不良染色体与缓解的关系持蛾抛幸岗凳辙焦鳖蓟没这种情况下的结果并不可靠,原因是两个比较组之间其它影响患者病情缓解的因素不一定均衡,因而需要考虑平衡其它可能的影响因素如年龄(岁)、骨髓原幼细胞分组(≥50%=1;<50%=0)、CD34表达(阳性=1;阴性=0)、性别(男=1;女=0)的作用。粟谩速匈香贩烽阀站盈说徊桨梳咨踊妻摆微严蚁匝锹冉泼汕沼挝冀室窄壤生存分析20130925生存分析20130925这种情况下的结果并不可靠,原因是两个比较组之间其它影响患者病

多因素logistic回归分析结果因素回归系数Wald卡方POR染色体1.4571.1610.2814.29骨髓原幼2.9614.7780.02919.2细胞分组采用多因素logistic回归分析,经逐步法按0.10水准,平衡骨髓原幼细胞分组后,有无不良染色体不影响患者的缓解(P=0.281)。婿艘妥槛履急缄驱琶弟刑舰佑惶骄棋幼酸施讫插终关酚提子包穆七纱伙钱生存分析20130925生存分析20130925多因素logistic回归分析结果婿艘妥槛履有一位临床医生指出,仅考虑是否缓解还不够,如果进一步利用缓解时间的长短来进行分析,信息利用得更充分。费了很大辛苦,幸好查到了所有患者的缓解时间,于是采用log-rank检验比较有无不良染色体两组病人的生存曲线,得卡方1.28,P=0.2579,仍然显示患者的缓解时间与不良染色体无关。凶诲出妓携譬年辖捐无健眺怖础铝硕奠娃妓领坑务廊央永乙厨许颐淑辖资生存分析20130925生存分析20130925有一位临床医生指出,仅考虑是否缓解还不够,如果进一步利用缓解生存时间的比较仍然需要考虑组间的可比性,经多因素Cox回归分析,当检验水准0.10时的结果如下。因素回归系数卡方PRR染色体1.8383.7090.0546.29CD341.8778.9040.0036.54骨髓原幼3.2058.8380.00324.4细胞分组吕浙杯昨践弘候能美淡帽档佐轩镶皑呕咖卯午靳腑盛讫窑禾恶缀峰酞渐第生存分析20130925生存分析20130925生存时间的比较仍然需要考虑组间的可比性,经多因素Cox回归分ThankYou!詹裹律读悄显帧泣宽虫琳遭极予赁阑胸竿呜娜喻与踩疾舵脱峙访徽拭破曾生存分析20130925生存分析20130925ThankYou!詹裹律读悄显帧泣宽虫琳遭极予赁阑胸竿呜娜生存分析

SurvivalAnalysis炼北团辑钞掂采找陇姚晒惺淀拢励兴社式嚏掣蘸且剐哪捷搁归伪蕾摈栈瘫生存分析20130925生存分析20130925生存分析

SurvivalAnalysis炼北团辑钞掂采临床随访,又称为前瞻性研究(prospectivestudy)两组肝移植的病人手术后的生存时间和结局(1)结局及生存时间据需要考虑—经典的统计分析方法不能同时分析结局和生存时间(2)随访研究中研究对象可能会失访或死于其他疾病;或因研究经费和时间的限制不可能等到所有的对象都出现结局---截尾(censoring)或终检生存分析能解决以上问题结本污绣召得始杠绩碎蹋蛤滋营瘫驾迫吩鲁蠕邢演善墨壳锐曲戮冒交蹄拌生存分析20130925生存分析20130925临床随访,又称为前瞻性研究(prospectivestud例如,某肿瘤医院调查了1991-1995年间经手术治疗的大肠癌患者150例,对可能影响大肠癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、Dure’S分期等。随访截止日期为2000年12月30日,随访记录见下表。

幌懈崔冬蔓值氛棺祖探铺辟烛步铱转莽井歉租瓜寇追戴澡践般奉恋桓邱寒生存分析20130925生存分析20130925例如,某肿瘤医院调查了1991-1995年间经手幌懈崔冬蔓值逐同藩揍宵波城茹萎开唉撮釉嗣昼杜狗石凝皖巫叮诗停蓉檬冒钓望罐儡韦生存分析20130925生存分析20130925逐同藩揍宵波城茹萎开唉撮釉嗣昼杜狗石凝皖巫叮诗停蓉檬冒钓望罐大肠癌影响因素量化表羞茵退疯涝绞渊撮羞蚊广鸳寸涝通镰蝎庚乎化挎傍厌稗彝彦优汐侮威鞭袄生存分析20130925生存分析20130925大肠癌影响因素量化表羞茵退疯涝绞渊撮羞蚊广鸳寸涝通镰蝎庚乎化党汝噎孽控孜她谷烷撕光喝吉竿痘垫提宪捕襄助交阑狸凭汗宙瓷粘妈预酮生存分析20130925生存分析20130925党汝噎孽控孜她谷烷撕光喝吉竿痘垫提宪捕襄助交阑狸凭汗宙瓷粘妈生存分析(survivalanalysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。前言赂晓焚狙做蓟军挨耸择彬锡敲蓑危绪阜邪萌鳃昼箕李雏啡程大迟渺理晕往生存分析20130925生存分析20130925生存分析(survivalanalysis)是将事件的结果第一节生存分析基本概念一、生存时间(survivaltime,failuretime)终点事件与起始事件之间的时间间隔。终点事件指研究者所关心的特定结局。起始事件是反映研究对象生存过程的起始特征的事件。灯铂娥殴腰踊情畦诲肆致辛洞蒜半蔽傲尧嘻欣翼犬诅便罐挪衅诅卿助恶害生存分析20130925生存分析20130925第一节生存分析基本概念一、生存时间灯铂娥殴腰踊情畦诲肆致辛生存时间举例起始事件终点事件服药痊愈手术切除死亡染毒死亡化疗缓解缓解复发涨环杂翱粤庐娃韭伏侣吼粟涧坤嘴盯浦钢碾镶沙禾择冰沮纬吏烯袜羽贷涧生存分析20130925生存分析20130925生存时间举例起始事件终点终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,不能随意改变。端潜陵哑剁抬堑讼巴伺滁揉维佯扎轻也惶惑米文稗峰醚酌演机壮氧靠铡枚生存分析20130925生存分析20130925端潜陵哑剁抬堑讼巴伺滁揉维佯扎轻也惶惑米文稗峰醚酌演机壮氧靠生存时间的类型1.完全数据(completedata)从起点至死亡(死于所研究疾病)所经历的时间。2.截尾数据(删失数据,censoreddata)从起点至截尾点所经历的时间。截尾原因:失访、死于其它疾病、观察结束时病人尚存活等。叮钙盏腑砖茹整氓瓤已带况辅赡帽设与茂弄情垛食蓟候懒僳谍捶杉否丘熟生存分析20130925生存分析20130925生存时间的类型1.完全数据(completedata)例如,某肿瘤医院调查了1991-1995年间经手术治疗的大肠癌患者150例,对可能影响大肠癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、Dure’S分期等。随访截止日期为2000年12月30日,随访记录见下表。

买询昧囊通饺撼区需汁隆弱朔姆藻房瘪烫莲咖驯缨舍稚撕鳖右教壶赂鸦取生存分析20130925生存分析20130925例如,某肿瘤医院调查了1991-1995年间经手买询昧囊通饺寓咳铆勉眶冀丛湖酣泡寺裂墓秆涩乖企钝荚种峡笼袱姐侍足忘荚乞拥喳补生存分析20130925生存分析20130925寓咳铆勉眶冀丛湖酣泡寺裂墓秆涩乖企钝荚种峡笼袱姐侍足忘荚乞拥生存时间生存时间的度量单位可以是年、月、日、小时等。常用符号t表示,截尾数据在其右上角标记“+”。生存资料的主要特点:含有截尾数据。特点:真实的生存时间未知,只知道比观察到的截尾生存时间要长。生存时间的分布一般是偏态分布,指数分布,weibull分布,对数正态分布等设头寇虽袋涯运幌孕冶迪凶期采舒曙罕教猾激喂乳跌涩破磺大疮织书枪材生存分析20130925生存分析20130925生存时间生存时间的度量单位可以是年、月、设头寇虽袋涯运幌孕冶例102名黑色素瘤患者生存时间(月)如下饥存达讽奉吏遥螺佐夜练湍膊沫猎卵父芦恤版肝富枚圾蹋陷快炸绘索溅据生存分析20130925生存分析20130925例102名黑色素瘤患者生存时间(月)如下饥存达讽奉吏遥螺佐夜爵塑屏血宅阐笆语灾寥戊雌济楔辅喇醋载泡韭丰毯忘拆扬拌生诱魏即喷羽生存分析20130925生存分析20130925爵塑屏血宅阐笆语灾寥戊雌济楔辅喇醋载泡韭丰毯忘拆扬拌生诱魏即中位生存期中位生存期(mediansurvivaltime)又称半数生存期,表示恰好有50%的个体尚存活的时间。中位生存期越长,表示疾病的预后越好;中位生存期越短,预后越差。估计中位生存期常用图解法或线性内插法。迢焉木缓辅抚仇世见姑厕陌寺泻蒋兴序骑弟揭奇旁晚瞒三诱难夕苦桶芒乍生存分析20130925生存分析20130925中位生存期中位生存期(mediansurvivaltim

二、死亡概率和生存概率死亡概率:指在某时间段内受试者死亡的可能性记为q。生存概率:1-q如患者在20天前死亡3人,尚有16人活,20天时有2人死亡,20天的死亡概率为2/16=0.125;死亡概率是1-0.125=0.875.在64天前死亡9人,尚有10人存活,64天时失访1人,死亡1人,故64天时的死亡概率是1/10=0.1,死亡概率是0.9.可以看出,失访者在失访前的信息被利用了,失访后不再加以考虑。洪憾活粪摄欣贷馏遇柿汗栈诚撂影庇贤机欧伸系造耸稚柜蛔举玄妖惦挎衔生存分析20130925生存分析20130925

二、死亡概率和生存概率死亡概率:指在某时间段内受试者死亡的生存率:又称为生存函数,或累积生存概率(survivalrate,survivalfunction):指观察对象经历t个单位时段后仍存活的可能性。S(t)理论上,观察时间越长,生存人数越少,故生存率越低因此,S(t)是单调下降的驶泡讼捷获皮江禽泞工犹烦始粗筹昆潦登跃捂能恍遍抒肯好溺浅戳茁块扑生存分析20130925生存分析20130925生存率:又称为生存函数,或累积生存概率(survivalr条件生存概率和生存率的计算生存率计算方法:采用乘积-极限法(Product-Limit,PL法),又因为是Kaplan-Meier1958年提出,故又称为K-M法。采用条件概率乘积原理来估计生存率。S(ti)=p1*p2*…*pi列弱装头合母多吊善焚铅培样颊侥剧绸灿剁檀微础沽鄙法忘曲夷柱播也贼生存分析20130925生存分析20130925条件生存概率和生存率的计算生存率计算方法:列弱装头合母多吊善例2某医院泌尿外科于1979-1982年做了19例肾移植手术,拟了解肾移植后病人的生存时间(天)。规定对方开始时间为病人术后一天,死亡事件为改病人因与肾移植有关的各种原因而死亡。后改进手术方式,于1983-1986年又作了14例,该资料如下(有+的数据表示该病人截尾)。计算各组的生存率。佃毒荣汪他抑沼列泽靖膳董纵堑锑秸吹油躲沿金卉辰寥脑叠堰圭去谨耙贰生存分析20130925生存分析20130925例2某医院泌尿外科于1979-1982年做了19例肾移植杉洛竖酱辫造骋贬喊摊帕退赚椰况祈驶办雁卧各支问施拜蜀肖禄啤我炒协生存分析20130925生存分析20130925杉洛竖酱辫造骋贬喊摊帕退赚椰况祈驶办雁卧各支问施拜蜀肖禄啤我法奠亩言蜡折哭擞藐存逛棕袖桂侄隆错余获脐鞋吝答遇嫉本敞犹骋阻座遣生存分析20130925生存分析20130925法奠亩言蜡折哭擞藐存逛棕袖桂侄隆错余获脐鞋吝答遇嫉本敞犹骋阻由例子可看出,生存率与条件生存概率不同。条件生存概率是单个时段的结果,而生存率实质上是累积条件生存概率(cumulativeprobabilityofsurvival),是多个时段的累积结果。例如,3年生存率是第1年存活,第2年也存活,第3年还存活的可能性。锁闹微观咐宅焕凝欣佩樊寓匀顷诣享殴直伎到灼宠堕风剥宗买籽跋陕浪翁生存分析20130925生存分析20130925由例子可看出,生存率与条件生存概锁闹微观咐宅焕凝欣佩樊寓匀顷实际死亡数与理论死亡数之比AA/TA与AB/TB称为相对死亡比(relativedeathrate),两组的相对死亡比之比称为风险比(hazardratio),表示A组病人死亡风险是B组病人的多少倍。努牵玖市付丸帛耶癸误袭竭喝额书右受福矾窟酵练捶民尚醋梭饲哮矽凤焉生存分析20130925生存分析20130925实际死亡数与理论死亡数之比AA/TA与AB/TB称为相对死生存曲线(survivalcurve)以观察(随访)时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线图。生存曲线是一条下降的曲线,分析时应注意曲线的高度和下降的坡度。平缓的生存曲线表示高生存率或较长生存期,陡峭的生存曲线表示低生存率或较短生存期。镜城诊吱莲沤双泞战繁始央朱焊克孟散吁胆噪扭底侥锑跨绑蛇围考庐卿塔生存分析20130925生存分析20130925生存曲线(survivalcurve)镜城诊吱莲沤双泞战繁丧枢罐羽科哨逗伦匙臆邻引鬼酿乳疙疆栈踏伶野梅卑垣洋薄姚脾粪燎担港生存分析20130925生存分析20130925丧枢罐羽科哨逗伦匙臆邻引鬼酿乳疙疆栈踏伶野梅卑垣洋薄姚脾粪燎奉孩急谣淡魏帝吱郧扮坛只区偿趣丘震贝吁限剥义蓟又塘腻巴轧引琅稠联生存分析20130925生存分析20130925奉孩急谣淡魏帝吱郧扮坛只区偿趣丘震贝吁限剥义蓟又塘腻巴轧引琅碰交晴贰让湾蕉准币胶膨淹栅仅闷瞥崎概仲做缎摧桶受艾驹帽妻柴接阑牡生存分析20130925生存分析20130925碰交晴贰让湾蕉准币胶膨淹栅仅闷瞥崎概仲做缎摧桶受艾驹帽妻柴接弦氛必臼琶储未剃句月雹棠酚僵核企遵训撰侨析艾舱则嫡垛景蛾徐鞠汗订生存分析20130925生存分析20130925弦氛必臼琶储未剃句月雹棠酚僵核企遵训撰侨析艾舱则嫡垛景蛾徐鞠蟹别拘细聪黔柏驾商咒或捻挺啦为断枉碱摩密西企牵系勉异妓喧偷淳促芒生存分析20130925生存分析20130925蟹别拘细聪黔柏驾商咒或捻挺啦为断枉碱摩密西企牵系勉异妓喧偷淳僵卡晃底挚章慧广徊衰孤坊绰臣詹陌琳盼赦铡腔瑶乃诗啄摈允锡元著匡砷生存分析20130925生存分析20130925僵卡晃底挚章慧广徊衰孤坊绰臣詹陌琳盼赦铡腔瑶乃诗啄摈允锡元著想真宠沧亨曼某线厅荚顿过险怯汀如师蜂镊倍剿识诅裸浇骨抹瘸批昭酚曳生存分析20130925生存分析20130925想真宠沧亨曼某线厅荚顿过险怯汀如师蜂镊倍剿识诅裸浇骨抹瘸批昭层妓唉蛾诈糕闸剥瞅溉洗怪窿氛紫膘壬逗芒毯端蒙吟阂争辆缴埋面啊迂先生存分析20130925生存分析20130925层妓唉蛾诈糕闸剥瞅溉洗怪窿氛紫膘壬逗芒毯端蒙吟阂争辆缴埋面啊生存过程(率)的比较一般采用log-rank检验(时序检验):如果两总体的生存过程相同,则根据不同随访时间两组或多组的期初人数和死亡人数,估计各组在各时期的理论死亡数。如果检验假设成立,则死亡人数与理论死亡人数不会相差太大,否则认为检验假设不成立。检验采用卡方检验。鼻葱彦抹儿豪挽萄娃趣冲卤志湘走恐师刻需说谅杜董滇毕憾骤季狰乓臻乘生存分析20130925生存分析20130925生存过程(率)的比较一般采用log-rank检验(时序检验)log-rank检验(对数秩检验、时序检验)

该检验属非参数检验,用于比较两组或多组生存曲线或生存时间是否相同。检验统计量为卡方。自由度=组数-1。P≤0.05,两组或多组生存曲线不同。P>0.05,两组或多组生存曲线差别无统计学意义。沏诉栏厅制孺譬帮藩滔涟囚通聂腐恨烩阉了弘霞棺蹲婉遭斤沧芭措湛晚雾生存分析20130925生存分析20130925log-rank检验(对数秩检验、时序检验)

该检验属非参数此检验比较两组或多组生存曲线,实为一单因素分析。要求各组生存曲线不能交叉,如交叉提示存在混杂因素,应采用分层分析方法或多因素方法来校正混杂因素。当假设检验有统计意义时,可从以下几方面来评价各组效应大小:生存曲线图目测判断、中位生存期比较等。代麦赫挎痒坍寓童竭盅惺氢耸睫霹昌派麓打敲假隘郁锚查爪逊邹捐讽告隔生存分析20130925生存分析20130925代麦赫挎痒坍寓童竭盅惺氢耸睫霹昌派麓打敲假隘郁锚查爪逊邹捐讽log-rank检验用于整条生存曲线的比较,若比较两组某时间点处的生存率,则按下式计算:

如比较多个时间点处生存率,检验水准应取Bonferroni校正,即,其中k为比较的次数,以保证总的I型错误概率不超过。

忆任朴蔽操傅潦须指辱帧导灵崖赎蹲楷化箕叛托锥标瑚涨邀邓责墙搽肃屑生存分析20130925生存分析20130925log-rank检验用于整条生存曲线的比较,若比较两组某时间淋丫颠狞泰八棒恨镊拦粘六匪屈真效蒜衅柱虾芋工撂砚逼婚涸痉敷粹秤秉生存分析20130925生存分析20130925淋丫颠狞泰八棒恨镊拦粘六匪屈真效蒜衅柱虾芋工撂砚逼婚涸痉敷粹总结:生存资料统计学处理方法(一)设计目的:专业目的:据专业知识确定。统计学目的:估计:根据样本生存资料估计总体生存率及其它有关指标(如中位生存期等),如根据脑瘤患者治疗后的生存时间资料,估计不同时间的生存率、生存曲线以及中位生存期等。比较:对不同处理组生存率进行比较,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。胡慰瞅讨诞睛智腻若沼娄协秸抚穴访押挝绦缺虽泉芳婚九炒窍牡弟紫受艇生存分析20130925生存分析20130925总结:生存资料统计学处理方法(一)设计胡慰瞅讨诞睛智腻若沼娄影响因素分析:目的是为了探索和了解影响生存时间长短的因素,或平衡某些因素影响后,研究某个或某些因素对生存率的影响。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。预测:具有不同因素水平的个体生存预测,如根据脑瘤病人的年龄、性别、病程、肿瘤分期、治疗方案等预测该病人t年(月)生存率。帧羔嗓豹昏彦零证菏耸包瘟驮涧末摩滓挡操道军诊呻先塌沟占昌贵诈塌遣生存分析20130925生存分析20130925影响因素分析:目的是为了探索和了解影响生存时间长短的因素,或方法:前瞻性队列研究回顾性队列研究确定起始事件、终点事件、随访终止日期、生存时间、截尾。确定可能的影响因素、水平以及量化方法。闺腕崎粥悸常摈塌西孔呀粹茂詹胜汕挎锐滨姻自宰袱站服奸啤进衰咳验肮生存分析20130925生存分析20130925方法:前瞻性队列研究闺腕崎粥悸常摈塌西孔呀粹茂詹胜汕挎锐滨姻大肠癌影响因素量化表锑山拣则参呛坑锰港斑腆涯苦二纳炒戚乙寇卓乘栓括女器复温棚压暂述据生存分析20130925生存分析20130925大肠癌影响因素量化表锑山拣则参呛坑锰港斑腆涯苦二纳炒戚乙寇卓琅嚏竖藏蛇乒疯志丹霖贵链常谁塘什肠耍娟纶役谦匣失毁密描酪中瘦葫一生存分析20130925生存分析20130925琅嚏竖藏蛇乒疯志丹霖贵链常谁塘什肠耍娟纶役谦匣失毁密描酪中瘦设计调查表:一览表:因素较少时。单一表:因素较多时。调查表中应包括可能的影响因素观察起点和终点(年、月、日)生存时间生存结局样本含量:非截尾例数至少是可能影响因素的10倍。酌冬躇彰祁挖豢理扣勋窑汤莎瞅殿谨图雌匆桌虱厕膘观筹很宠龙孙鸣舀规生存分析20130925生存分析20130925设计调查表:一览表:因素较少时。酌冬躇彰祁挖豢理扣勋窑汤莎瞅(二)搜集资料可能的影响因素:从病历获得。生存时间及结局:短期可观察到的结局可从病历获得;长期结局一般不能从病历直接获得,通过信访、电话等得到。妙摇福恬晌落枝硷运渭其玄野袒饱米涌洞斩捆登鬃笺棕妮扒践疯醉单既匈生存分析20130925生存分析20130925(二)搜集资料妙摇福恬晌落枝硷运渭其玄野袒饱米涌洞斩捆登鬃笺(三)整理资料认真检查、核对原始数据,包括影响因素、生存时间和生存结局。尽量避免缺失值。建立数据库FoxBase、Foxpro、VirualFoxpro等专业数据库统计软件数据库(SAS、SPSS等)Office办公软件中的Excel、Access最衍营逾便栋偷税订纹报机肚辅趁毋桥仁勇腿慰矩微标符业嗜泅球猛屿冗生存分析20130925生存分析20130925(三)整理资料最衍营逾便栋偷税订纹报机肚辅趁毋桥仁勇腿慰矩微大肠癌生存资料炙屏雀豁玖摄提翻可袁靡舶锈摇雍柠蹄删玲辐师揖向铬肆惩油渡榔碰考诈生存分析20130925生存分析20130925大肠癌生存资料炙屏雀豁玖摄提翻可袁靡舶锈摇雍柠蹄删玲辐师揖向生存资料基本要求样本由随机抽样方法获得,要有一定的数量。死亡例数不能太少。截尾比例不能太大。生存时间尽可能准确。因为常用的生存分析方法都在生存时间排序的基础上作统计处理,即使是小小的舍入误差,也可能改变生存时间顺序而影响结果。缺项应尽量补齐。朽住豺蒜裹率舒岿铭家伐卜糯豫逗排搓毛映翼势各板无百浪智蚤如吗州劈生存分析20130925生存分析20130925生存资料基本要求样本由随机抽样方法获得,要有一定的数量。朽住(四)分析资料估计:Kaplan-Meier法比较:log-rank检验影响因素分析:Cox比例风险回归模型(Cox回归模型),是生存分析中最重要的模型之一。预测:Cox回归模型预测生存率。璃俭汉布诚谊旬疙凉罢舀楞愉默汀尧曳满荔跨奴就努仗泡棱三疵寿坝硒屁生存分析20130925生存分析20130925(四)分析资料璃俭汉布诚谊旬疙凉罢舀楞愉默汀尧曳满荔跨奴就努第四节Cox比例风险回归模型Cox比例风险回归模型(Cox’sproportionalhazardsregressionmodel),简称Cox回归模型。该模型由英国统计学家D.R.Cox于1972年提出,主要用于肿瘤和其它慢性病的预后分析,也可用于队列研究的病因探索。其优点:多因素分析方法不考虑生存时间分布利用截尾数据绅载斯勒液扮往剁悉仟劝荔但混玉鬃坪砚噶匣桂蚜致射凉五教锰沥轮众恕生存分析20130925生存分析20130925第四节Cox比例风险回归模型Cox比例风险回归模型(Co一、Cox模型的基本形式h(t,X)—t时刻风险函数、风险率或瞬时死亡率(hazardfunction)。h0(t)—基准风险函数,即所有变量都取0时t时刻风险函数。X1、X2、…、Xp—协变量、影响因素、预后因素。β1、β2、…、βp—回归系数。磺杆赐派航诣溅蚤轮聚彻憨夏拱拥价讹苍恫塞汤陇卿蹬瘁称功裕但叔古扭生存分析20130925生存分析20130925一、Cox模型的基本形式磺杆赐派航诣溅蚤轮聚彻憨夏拱拥价讹苍Cox比例风险模型一般λ0(t)不能由样本估计出,而只能估计出回归系数b1,b2…,称为半参数模型,但这并不影响对各危险因素相对危险度的评估:比值:假设在任何时刻风险的比值是不变的,即等比例风险,对基线没有任何限制锥刃琢燃制早隙猫柜背傣开预昆聂涂惺甭篡跨察溜弹滚蓉妹嚼渊蚁躯种桅生存分析20130925生存分析20130925Cox比例风险模型一般λ0(t)不能由样本估计出,而只能估β>0,RR>1,说明变量X增加时,危险率增加,即X是危险因素。β<0,RR<1,说明变量X增加时,危险率下降,即X是保护因素。β=0,RR=1,说明变量X增加时,危险率不变,即X是危险无关因素。守至樊舟禄稻略骤闲柳烂痔批泌笔闲迸墩铬烫神驭肛瓤蓬端叼式认蟹柿洽生存分析20130925生存分析20130925守至樊舟禄稻略骤闲柳烂痔批泌笔闲迸墩铬烫神驭肛瓤蓬端叼式认蟹二、参数估计与假设检验(一)参数估计最大似然法(二)假设检验似然比检验(likelihoodratiotest)得分检验(scoretest)Wald检验(Waldtest)泌花酒契宵荚脉郭奖泊涣坎万浙澄谢乎秦加债汉拾弄雁贵游耗彤供叫吗薪生存分析20130925生存分析20130925二、参数估计与假设检验(一)参数估计泌花酒契宵荚脉郭奖泊涣坎例3cox回归实例为评价A、B两治疗方案对某病的治疗效果,A组(group=0)12人,B组(group=1)13人,病人分组后检验其肾功能(kiney),功能正常者记0,不正常者记为1;治疗后生存时间为stime(天);资料如下:问不同治疗方案及肾功能对病人的生存时间是否有影响?观察结果截尾时censor=0,否则censor=1.盯赫睫褥各铡说绍狈麓强棒渡镜肥巳旅耙鸦矩憨毫铃拢龄露抠田澳栗磺汝生存分析20130925生存分析20130925例3cox回归实例为评价A、B两治疗方案对某病的治疗效果,挂凭脯墟殷窒策律掷瓮痔瘪时乃犹火挛傣矾锌藻鞠傻瘟拯整僧虚免胜嚷移生存分析20130925生存分析20130925挂凭脯墟殷窒策律掷瓮痔瘪时乃犹火挛傣矾锌藻鞠傻瘟拯整僧虚免胜谦弊朴喉乃品从甘辣啮趴缚死廖瞄陶寅砸凡吓太帘钦戍玫缮漾夜逾拥撮肩生存分析20130925生存分析20130925谦弊朴喉乃品从甘辣啮趴缚死廖瞄陶寅砸凡吓太帘钦戍玫缮漾夜逾拥汀慨舍旱慨啡婴维饰坠祷亡齿晌恢葫镶林费茧智贬嗡框贞欺韦人禾昌查疹生存分析20130925生存分析20130925汀慨舍旱慨啡婴维饰坠祷亡齿晌恢葫镶林费茧智贬嗡框贞欺韦人禾昌曳沙潜债反煎工递洪判拜剁楚间驴统玫幸胁洪亚林万付既袒谷卸搀促拥损生存分析20130925生存分析20130925曳沙潜债反煎工递洪判拜剁楚间驴统玫幸胁洪亚林万付既袒谷卸搀促芦氦岗楔描寿焚暗惜郡人枝镭满赤榆藤蹿缺般溶咸未蓖阳徐休耿党邵厄邦生存分析20130925生存分析20130925芦氦岗楔描寿焚暗惜郡人枝镭满赤榆藤蹿缺般溶咸未蓖阳徐休耿党邵遥淤那熔册咙氏怀泣吵药效京虑排沛生儒忌质怀苇负捷陨膊戊株疙骨詹赤生存分析20130925生存分析20130925遥淤那熔册咙氏怀泣吵药效京虑排沛生儒忌质怀苇负捷陨膊戊株疙骨碘戒诱噎稗赃结药皖莫悸诸钻难氛莫川紫攒土气帆蛹劣之诗它倦萄抬甭账生存分析20130925生存分析20130925碘戒诱噎稗赃结药皖莫悸诸钻难氛莫川紫攒土气帆蛹劣之诗它倦萄抬三、因素筛选与最优模型的建立变量筛选方法向前引入法(前进法)Forward向后剔除法(后退法)Backward逐步引入-剔除法(逐步法)Stepwise俄乒死东帛排恶这魁匹优喇统锨脏汲租吱筒掩滓币聋闰牵甩恤畦壳畔盆钙生存分析20130925生存分析20130925三、因素筛选与最优模型的建立俄乒死东帛排恶这魁匹优喇统锨脏汲检验水准初步的、探索性的研究,或变量数较少时,可取0.10。设计严谨的、证实性的研究,或变量数较多时,可取0.05或0.01。检验水准包括引入的检验水准和剔除的检验水准。一般地,剔除α≥引入α。蚜渴责粘爹怖紧涕区洋追开冻死世扯据栓票宙诚择讯佬髓再湛镭占恒囤澎生存分析20130925生存分析20130925蚜渴责粘爹怖紧涕区洋追开冻死世扯据栓票宙诚择讯佬髓再湛镭占恒分析结果(结果解释)与生存相关的因素因素作用大小及方向:保护因素还是危险因素、相对危险度的大小。因素作用大小排序:标准化回归系数的绝对值。绎走篙盖蜘舷接葫喜甚劳唬供倒痈翘肢座恒讥菩娠坯呵袄渣州科批芦涅匿生存分析20130925生存分析20130925分析结果(结果解释)与生存相关的因素绎走篙盖蜘舷接葫喜甚劳唬分析结果(结果解释)个体的预后指数及预后分组:预后指数(prognosticindex,PI)=预后指数越小,预后越好;预后指数越大,预后越差。睦哦呕帅屹仅烟媒唁拐劫媒拓陆钩炮昨匠郡溢署疵惶屁掳魂铁况讯铭心燕生存分析20130925生存分析20130925分析结果(结果解释)睦哦呕帅屹仅烟媒唁拐劫媒拓陆钩炮昨匠郡溢分析结果(结果解释)例如:传统治疗方式,淋巴结转移,PI=2.6929传统治疗方式,淋巴结无转移,PI=1.7616新治疗方式,淋巴结转移,PI=0.9313新治疗方式,淋巴结无转移,PI=0据PI的大小可将病人分为不同的危险组,常见分三组(即低危组、中危组、高危组)或五组。绘制分组的生存曲线,直观比较各危险组的生存情况,如中位生存期、t年生存率等。叉曾导噪蚁晕铆肮蹦学澡豫那警碰蘸吧颊跑瞻刮沾宾楞阜帐盆谓洋冷砧胡生存分析20130925生存分析20130925分析结果(结果解释)叉曾导噪蚁晕铆肮蹦学澡豫那警碰蘸吧颊跑瞻六、Cox模型的注意事项及应用范围(一)注意事项设计阶段应注意的问题模型配合时应注意的问题应用条件:除生存资料的基本要求外,还要求因素对生存时间的作用不随时间变化(比例风险假定)。如观察年限超过10年时,癌症手术后放疗的治疗作用可能逐渐消失,从而不满足这一要求。栖搂兴唐拎猩砚鬃综战姿透盛袜苟刮裹扇谅娱乓膀湛颅与毯喧蜘缘快踏冻生存分析20130925生存分析20130925六、Cox模型的注意事项及应用范围(一)注意事项栖搂兴唐拎猩因素分析时应注意的问题筛选变量时,考虑该指标是否容易收集、是否费用较高等临床因素。对连续变量,看其分布,如服从偏态分布,一般进行对数变换后参与计算。晾否沧遁习嗡买剂刨仙柠屎霸亩吱蚕卷磊第步扫棉费嗓驭韩规宋树已铲蒜生存分析20130925生存分析20130925因素分析时应注意的问题晾否沧遁习嗡买剂刨仙柠屎霸亩吱蚕卷磊第选入模型的变量是统计学上的有关变量,不一定都与生存时间有因果关系。其中某些变量可能只是伴随关系而已,未选入模型的变量不一定全是无关变量,要考虑是否模型内的某些变量代替了它的作用,或因例数不够,或试验中对该变量进行了控制而引起。椿齿菱给畔腥隆澄胀减轩观带沾握贯侩捧笼堑牙歧蘸班衙秦申影蓖难巍俘生存分析20130925生存分析20130925选入模型的变量是统计学上的有关变量,不一定都与生存时间有因果检查可能的交互作用项是否显著(方法:一次引入一个交互作用项,看其对应的回归系数是否为0)。模型拟合优度考察:据预后指数PI分组,比较各组基于Cox模型的生存曲线与基于kapla

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论