生存分析与Cox回归.ppt_第1页
生存分析与Cox回归.ppt_第2页
生存分析与Cox回归.ppt_第3页
生存分析与Cox回归.ppt_第4页
生存分析与Cox回归.ppt_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生存分析与Cox回归,流行病与卫生统计学教研室 曹 明 芹,2019/4/2,生存分析与Cox回归,2,生存分析与Cox回归,生存资料概述 生存分析的基本概念 生存资料的统计描述 生存曲线的比较 Cox回归,2019/4/2,生存分析与Cox回归,3,一、生存资料概述,举例 某医师分别用中药、西药各治疗急性肝炎病人40例,结果如下表,试问:哪种药物的治疗效果好?,2019/4/2,生存分析与Cox回归,4,一、生存资料概述,随访研究 (follow up) 是医学研究中常用的设计方法 随访研究不仅要考虑观察对象的结局,还要考虑出现结局所经历的时间 这类(既要考虑结局又要考虑结局出现的时间)资料称为生存资料 (survival data) 生存分析(survival analysis)是将观察的结局和出现结局所经历的的时间结合起来进行分析的统计方法。,2019/4/2,生存分析与Cox回归,5,一、生存资料概述,医学随访研究一般有两种 所有研究对象同时进入研究(观察起始时间相同) 例如,队列研究、动物的随访观察 被研究对象逐个进入研究(观察起始时间不同) 例如,临床随访研究 由于受经费和时间的限制,最终观察时间不能无限延长,2019/4/2,生存分析与Cox回归,8,1. 基本概念,起始事件与终点事件 起始事件反映研究对象生存过程的起始特征事件。 终点事件(outcome event)又称失效事件(failure event) 或死亡事件(death event) 终点事件研究者所关心的研究对象的特定结局,可以标志某种处理措施失败或失效的特征事件 起始事件和终点事件是由研究目的决定的,在设计时就明确规定,并在研究期间严格遵守不能随意改变,2019/4/2,生存分析与Cox回归,9,1. 基本概念,举例 说明下列研究的起始事件与终点事件 急性白血病患者进行骨髓移植后以是否复发来评价骨髓移植效果 职业性铅中毒的危险因素(开始职业性接触至出现铅中毒症状) 冠心病患者两次发病的时间间隔 大肠癌患者手术后存活情况(手术、死亡) 接受健康教育对青少年戒烟到复吸的影响因素分析 接受某种保险方式后的中途退保分析,2019/4/2,生存分析与Cox回归,10,1. 基本概念,生存时间(survival time)或失效时间(failure time) 生存时间指观察到的存活时间 常用符号 t 表示 生存时间是生存分析中的重要信息,必须准确 明确规定起始事件、终点事件 时间的测度单位(年、月、日),2019/4/2,生存分析与Cox回归,11,1. 基本概念,整个研究的观察时间 研究开始到研究结束的时间 因为有起始事件发生时间、终点事件发生时间、观察开始时间、观察结束时间,生存资料数据分为完全数据(complete data)和截尾数据(censored data),2019/4/2,生存分析与Cox回归,12,1. 基本概念,完全数据:指从观察起点到发生死亡事件所经历的时间,生存时间是完整确切的。 截尾数据或截尾值(censored value),又称删失值或终检值。 生存时间观察过程的截止不是由于死亡/终点事件,而是由于其他原因引起的,称为截尾(censored) 从观察起点到截尾时点所经历的生存时间称为截尾数据,习惯上在生存时间右上角标注“”表示,2019/4/2,生存分析与Cox回归,13,1. 基本概念,截尾的主要原因: 失访(withdrawal):失去联系,如信访无回音、电话采访不应答、上门采访找不到人、搬迁没留地址等 退出:死于非研究因素或非处理因素而退出研究,如死于意外或其他疾病 终止:设计时规定的研究时限已到而终止观察,但研究对象仍然存活,2019/4/2,生存分析与Cox回归,16,1. 基本概念,完全数据提供了观察对象确切的生存时间,是生存分析的主要依据; 截尾数据仅提供了部分信息,研究者并不知道观察对象确切的生存时间。截尾数据太多会影响生存分析的效果 那么截尾数据能不能删除?,2019/4/2,生存分析与Cox回归,17,1. 基本概念,对生存资料的两种错误分析 抛弃截尾数据,只考虑确切数据 损失样本含量、损失了信息,截尾数据提供部分信息,说明在某时刻之前仍存活 将截尾数据当作确切数据处理 低估了生存时间的平均水平,截尾数据中存在生存时间较长的数据,如果损失,会使结果产生偏性,2019/4/2,生存分析与Cox回归,18,1. 基本概念,对截尾数据进行分析是生存分析的重要特点,在生存分析中,结局变量常以1表示出现结局,0表示截尾。 应变量有2个: 生存时间 t 和结局变量(0-1),2019/4/2,生存分析与Cox回归,19,2. 生存资料的特点, 蕴涵有结局和时间两个方面的信息; 结局为两分类互斥事件; 一般是通过随访收集得到,随访观察往往是从某统一时间点(如确诊、入院或实施手术等某种处理措施后)开始,观察到某规定时间点截止; 常因失访等原因造成某些研究对象的生存时间数据不完整; 分布类型复杂,需用生存分析,2019/4/2,生存分析与Cox回归,20,3. 生存资料的数据形式,2019/4/2,生存分析与Cox回归,21,4. 生存分析的基本内容, 描述生存过程:研究生存时间的分布特点,估计生存率及其标准误、绘制生存曲线等。 例如,根据乳腺癌患者手术后的生存资料,可以估计不同时间点的生存率及其标准误,如1年生存率、3年生存率、5年生存率等,还可以绘制生存曲线,观察乳腺癌患者手术后的生存过程。 常用方法有乘积极限法和寿命表法。,2019/4/2,生存分析与Cox回归,22,4. 生存分析的基本内容, 比较生存过程:获得生存率及其标准误的估计值后,可进行两组或多组生存曲线(生存过程)的比较。 例如,比较两种不同治疗措施治疗恶性肿瘤患者的生存曲线,可了解哪种治疗措施较优,从而为临床决策提供依据。常用方法有对数秩检验。,2019/4/2,生存分析与Cox回归,23,4. 生存分析的基本内容, 生存过程的影响因素分析 例如,为了改善鼻咽癌患者的预后,应先了解可能影响患者预后的因素,如年龄、病程、病情、术前健康状况、有无淋巴结转移、术后有无感染、辅助治疗措施、营养状况等,通过随访收集患者术后的生存时间和上述因素的资料,然后采用多因素生存分析方法确定影响患者预后的主要因素,从而为在手术前后进行预防或干预提供参考依据。 常用的多因素生存分析方法:Cox比例风险回归模型,2019/4/2,生存分析与Cox回归,24,生存分析的基本方法,统计描述 统计指标:生存率、中位生存时间 列表和绘图:生存曲线 统计推断 参数法:指数分布、威布尔分布等 非参数法:log-rank检验(单因素分析) 半参数法:Cox回归 (多因素分析),2019/4/2,生存分析与Cox回归,25,二、生存资料的统计描述,生存率及其标准误 中位生存期 生存曲线,2019/4/2,生存分析与Cox回归,26,基 本 概 念,2019/4/2,生存分析与Cox回归,27,基 本 概 念,2019/4/2,生存分析与Cox回归,28,基 本 概 念,2019/4/2,生存分析与Cox回归,29,基 本 概 念,2019/4/2,生存分析与Cox回归,30,基 本 概 念,2019/4/2,生存分析与Cox回归,31,基 本 概 念,2019/4/2,生存分析与Cox回归,32,常 用 方 法,乘积极限法 (product-limit method) 也称为-法(Kaplan-Meier法) 小样本资料或大样本未分段(未按时间分组)资料 寿命表法 (life table method) 大样本分段 (按时间分组)资料,2019/4/2,生存分析与Cox回归,33,1. 未分组资料 (乘积极限法/Kaplan-Meier法),2019/4/2,生存分析与Cox回归,36,2. 分组资料(寿命表法 life-table method),中位生存期为2.3,生存资料的统计描述SPSS实现例1,生存资料的统计描述SPSS实现例2,2019/4/2,生存分析与Cox回归,45,三、生存曲线比较 (单因素分析),2019/4/2,生存分析与Cox回归,46,对上例进行分析时两种错误的做法: 错误1:采用平均生存时间而不是中位生存时间来表示生存时间的平均水平。 错误2:采用常规t检验或方差分析进行组间比较。,2019/4/2,生存分析与Cox回归,48,三、生存曲线比较 (单因素分析),2019/4/2,生存分析与Cox回归,49,三、生存曲线比较 (单因素分析),2019/4/2,生存分析与Cox回归,52,生存资料分析的基本要求 样本应由随机抽样得到,要保证一定的样本含量 死亡例数不宜太少 截尾例数不宜太多 生存时间应尽可能精确,2019/4/2,生存分析与Cox回归,53,对数秩检验(log-rank)注意事项,属于单因素分析方法,适用于两组及多组间的比较 可用于时间未分组的资料,也可用于时间分组资料 各组间生存时间的比较根据各组生存曲线的高低及中位生存时间判断 需满足生存资料的基本要求,且各样本生存曲线不能交叉 生存曲线若出现交叉,则提示可能存在混杂因素,应采用分层对数秩检验或Cox比例风险回归模型进行分析,生存曲线比较SPSS实现例3,2019/4/2,生存分析与Cox回归,56,四、 Cox回归,对生存时间资料进行单因素分析(log-rank检验)时,要求各对比组在非处理因素方面均衡可比,而实际工作中却很难做到;很多因素会对生存时间产生影响,需用多因素分析方法。 Cox回归也称比例风险模型(Proportional hazards model)是对生存资料进行多因素分析常用的统计方法,2019/4/2,生存分析与Cox回归,57,四、 Cox回归,Cox回归模型的一般形式 回归系数的解释 Cox回归应用条件 回归系数的估计及假设检验 Cox回归分析应注意的问题,2019/4/2,生存分析与Cox回归,58,1. Cox回归模型的一般形式,2019/4/2,生存分析与Cox回归,60,1. Cox回归模型的一般形式,2019/4/2,生存分析与Cox回归,61,2. 回归系数的解释,相对危险度 RR: 两个风险函数(率)之比 (风险比) 当Xi为有无某危险因素时(0-1变量),2019/4/2,生存分析与Cox回归,62,2. 回归系数的解释,在其他自变量固定不变时,自变量Xi每改变一个单位,得到的相对危险度RR的对数值。 RR= exp() 0, RR 1 危险因素 0, RR 1 无作用 0, RR 1 保护因素 RR的解释与自变量的编码有关,2019/4/2,生存分析与Cox回归,65,3. Cox回归应用条件,独立性 等比例风险 风险比与时间无关,为常数 自变量的取值及作用大小不随时间变化而变化 例:在研究10中,有糖尿病的发生心脏病的风险始终是无糖尿病的3倍。 对数线性:自变量与对数风险比呈线性关系,2019/4/2,生存分析与Cox回归,69,4. 回归系数估计及假设检验,回归系数的估计极大似然法(偏似然函数) 假设检验方法 似然比检验 Wald卡方检验 Score比分检验 借助统计软件估计回归系数,进行假设检验 对 SPSS软件: Analyze/ Survival /Cox Regression,2019/4/2,生存分析与Cox回归,70,5. Cox回归分析应注意的问题,等比例风险的假定 影响因素(协变量)各水平的生存曲线无交叉 协变量与时间交互项无

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论