版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十六章苏州大学卫生统计学教研室随访资料的分析第16章生存分析前言为什么要引入生存分析方法?临床上有许多随访资料,如有两组肺癌病人,病情、性别、年龄等因素齐同,一组并病人用单纯手术治疗,另一组用手术+放疗,随访5年,怎样综合评定治疗效果?第16章生存分析表16-1甲(手术组)、乙(手术+放疗)两组治疗方案肺癌病人临床随访结果第16章生存分析什么是生存时间资料?所以疾病预后的好坏,出现这种结局所需要的时间。慢性疾病,如恶性肿瘤、糖尿病、高血压、心血管等疾病疗效的分析,单纯的治愈率不能敏感地反映出治疗的效果。有一类资料含有结局和时间两方面的信息,它源于寿命统计,通过随访收集,特称为生存时间资料(survivaldata)。生存时间资料的分析方法简称为生存分析。第16章生存分析某临床医生将22例肺癌患者随机分成两组,分别采用化疗和放化疗联合治疗,从缓解出院日开始随访,随访时间(月)如下(带“+”号的数据表示患者至少活了多少个月)。化疗组1,2,3,5,6,9+,11,13,16,26,37+放化疗联合组10,11+,14,18,22,22,26,32,38,40+,42+5第16章生存分析共同特点①蕴涵有结局和时间两个方面的信息;②结局为两分类互斥事件;③一般是通过随访收集得到,随访观察往往是从某统一时间点(如确诊、入院或实施手术等某种处理措施后)开始,观察到某规定时间点截止;④常因失访等原因造成某些研究对象的生存时间数据不完整,分布类型复杂。6第16章生存分析第一节生存分析中基本概念2.起始事件:反映研究对象生存过程起始特征的事件如疾病“确诊”、“开始治疗”、“接触毒物”等。3.终点事件(死亡事件、失效事件):反映研究对象生存过程特定结局的事件,如“死亡”、“痊愈”、“出现毒性反应”。1.生存时间(失效时间):起始事件与终点事件的时间间隔t。时间的尺度可以是分、小时、天、月、年等。、基本概念第16章生存分析截尾值(censoredvalue)(终检)随访过程中,由于某种原因未能观察到所期望的事件发生,这些个体所提供的数据称截尾值或删失值。删失原因:
1.随访对象失访、死于其他疾病
2.随访结束时对象仍存活
3.治疗措施改变4.生存资料的类型完全数据:是指在整个随访研究期间能够观察到终点事件,即能够观察到从起点到终点的生存时间第16章生存分析5.1观察对象同时进入研究,即研究起始时间相同,这类研究常见于:队列研究、动物实验等。5.随访研究的模式5.2观察对象逐个进入研究,即研究起始时间不同,多见于临床随访研究。
●
▲
●
起始事件
●
▲
●
╳
▲
终点事件
●
▲
●
▲
╳
失
访
●
╳
●
╳
○
截
尾
●
○
●
○
●
○
研究时间
研究时间
研究起点
研究终点
研究起点
研究终点
图15-1队列研究示意
图15-2
临床随访研究示意
第16章生存分析死亡率:死亡概率:q=年内死亡人数/年初观察人数生存概率:P=该年活满一年的人数/年初观察人数=1-q第16章生存分析6.生存函数(survivalfunction)生存函数又称累积生存概率,记为S(tk),是病人活到t时刻仍然存活的概率常用S(tk)=P(Ttk)。实际应用中计算:tk时刻仍然存活的例数/观察总例数。其中T为病人存活的时间。但如果含有截尾数据,分母分段校正。故采用概率乘法原理计算生存率,生存概率用p表示,生存率估计的应用公式为:
S(tk)=P(T
tk)=p1p2…pk
S(0)=1S()=0第16章生存分析生存曲线:各时点的累积生存概率连接在一起的曲线图。半数生存期
中位生存期(mediansurvivaltime):即寿命表中的中位数,表示有50%的个体存活的时间。第16章生存分析第16章生存分析7.死亡函数:表示一个观察对象从开始观察到时间t为止的死亡概率,随时间上升的函数F(t,X)=P(Tt,X),t+时,F(t,X)=1
生存函数与死亡函数的关系:S(t,X)=1-F(t,X)
8.死亡密度函数:所有观察对象在t时刻的瞬时死亡率
第16章生存分析9.风险函数:生存时间达到t的一群观察对象在t+∆t区间内死亡的概率极限。第16章生存分析例16-1现有40个肝癌病人的随访资料,见表16-2,试估计生存函数、死亡密度函数和风险函数。表16-240个肝癌病人的随访资料第16章生存分析二、生存分析的基本内容
2.生存过程的比较1.生存过程的描述3.影响因素的分析生存分析已形成了一套较为完善的理论体系,可概括如下:第16章生存分析三、生存分析的基本方法研究目的非(半)参数方法参数方法生存过程的描述乘积—极限法(Kaplan-Meier)指数分布寿命表法Weibull分布Turnbull估计(危险率估计)Gamma分布Logistic分布对数正态分布第16章生存分析研究目的非(半)参数方法参数方法生存过程的比较对数秩(log-rank)检验指数分布分层对数秩检验Weibull分布Gehan检验Gamma分布广义Wilcoxon检验Logistic分布Mantel-Haenszel检验对数正态分布第16章生存分析研究目的非(半)参数方法参数方法影响因素的分析Cox比例风险模型指数分布非比例风险模型Weibull分布Logistic回归模型第16章生存分析第二节生存率的估计一、小样本生存率的乘积极限法(Kaplan-Meier)例16-2在儿童急性淋巴细胞白血病(ALL)的生存研究中,有21例高危儿童ALL的临床随访资料。生存时间定义为确诊日期到病人死亡日期的时间跨度,得到的生存时间(月),见表16-3第(1)栏,其中有“+”者是截尾数据,表示病人仍生存或失访。试计算其生存率与标准误。第16章生存分析表16-3高危ALL儿童生存率计算方法
第16章生存分析生存率的标准误计算表示把小于和等于t时刻的各种非截尾值所对应的全部加起来(式15-6)(式15-7)第16章生存分析总体生存率的可信区间计算公式:第五个月总体生存率的95%CI:(1)正态分布法第16章生存分析(2)尾部总体率的区间估计G(T>t)的渐近标准误为:生存率的对数变换公式G(T>t)的95%CI:总体生存率95%CI:第16章生存分析生存曲线高危儿童ALL病人生存曲线
0.000.250.500.751.00month020406080100120140CensoredObservations第16章生存分析中位生存时间的计算采用内插法:t=15.5(月)第16章生存分析二、大样本生存资料的寿命表估计法
在样本较大时,随访病例的生存时间常可按年、月或日进行分组,得出具有若干时间段的频数表。例16-4某研究收集了1980-1993年中山市肺癌新发患者2238例,经随访将有关资料整理后列于表16-5,其中生存时间是以月计算的,试计算其生存率及其标准误。第16章生存分析表16-52238例肺癌病人生存率及其标准误计算29第16章生存分析
图16-42238例肺癌病人生存率曲线30第16章生存分析第三节生存曲线的比较
两组及多组生存曲线的比较一般用log-rank检验。log-rank检验是以生存时间的对数为基础推导出来的,其基本思想是实际死亡数与期望死亡数之间的比较。v=组数-131第16章生存分析
例根据例16-2和例16-3的随访资料,问高危儿童和标危ALL儿童的生存率有无差别?第16章生存分析注意事项对于大样本资料生存率比较,可以将其整理成频数表形式,其基本原理与上述方法相同。用log-rank检验对样本生存率进行比较时,要求两组生存曲线不能交叉,生存曲线的交叉提示有某种混杂因子存在。此时应采用分层的方法或多因素的方法来校正混杂因素。另外,当假设检验推断有差别时,可以通过生存曲线、半数生存期及相对危险度等指标来评价其效果。第16章生存分析对于生存分析数据,国外学者提出针对具体问题提出了许多处理方法,包括统计描述和统计推断在实践中,人们发现许多生存分析资料,尤其是医学随访资料有其特殊性:生存时间分布复杂;存在截尾数据;有时需要将多个因素同时考虑1972年英国统计学家Cox提出了比例风险模型(Cox’sproportionalhazardregressionmodel),解决了上述的问题如何进行生存时间的影响因素分析?第四节Cox比例风险模型第16章生存分析Cox模型的基本形式生存分析的目的在于研究因素X与观察结果之间的关系;当累积生存率或称生存函数S(t,X)受到因素的影响时,传统的方法是考虑回归分析,即各因素对S(t,X)的影响Cox模型不直接考察生存函数S(t,X)与因素之间的关系,而用风险率函数h(t,X)作为应变量第16章生存分析Cox模型的表达形式及含义中,右侧可以分为两部分:h0(t)没有明确定义,其分布与形状无明确的假定,这是非参数部分;另一部分是参数部分,其参数可以通过样本的实际观察值来估计。由于h0(t)分布类型未知,将它移到等式左边,并取自然对数,得到:由式中可以看到,
j
表示当协变量Xj每改变一个单位时,所引起的相对危险度的自然对数值的改变。t时刻个体暴露于危险因素与非(低)暴露状态下发病的风险比第16章生存分析参数估计与假设检验Cox模型中的参数是在偏似然函数(Partiallikelihoodfunction)的基础上采用最大似然法估计的,在得到参数后,还需对参数进行假设检验。1.似然比检验2.得分检验3.Wald检验第16章生存分析例16-5为了探索影响儿童急性淋巴细胞白血病(ALL)长期生存的预后因素。采用回顾性队列研究,对1990年1月1日至1995年12月30日期间在苏州大学附属儿童医院血液科就诊,治疗时间大于2周,年龄<15周岁获得有效随访的118例ALL初诊患儿进行生存分析。通过设计调查表调查:人口学特征资料如性别、年龄、家庭年收入;临床资料包括ALL类型、初诊白细胞数等,可通过摘录病史获得;而调查对象的存活状态及死亡时间通过随访的方式获得,本研究通过信访、电话和上门采访相结合的方式,以提高应答率(92%)。表16-6显示了部分调查对象的关键变量调查信息。本研究的起始时间为ALL的确诊日期,终点日期为病人的死亡日期;如果研究对象仍存活,研究的截尾日期设定为2000年6月30日。38第16章生存分析表16-7变量赋值表39第16章生存分析拟合Cox模型的方法和策略一般先做
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年酒店会议室场地租赁及旅游套餐合同2篇
- 二零二五年户外运动俱乐部装修设计合同2篇
- 二零二五年第3章电子发票电子合同操作规范3篇
- 二零二五版文化创意产业试用期员工激励合同3篇
- 二零二五年度物业经理竞聘选拔合同3篇
- 二零二五版环保型厂房买卖合同范本3篇
- 幼儿园2025年度教学计划设计与执行合同3篇
- 二零二五年综合性商业地产合作开发合同范本3篇
- 二零二五版无抵押个人宠物医疗借款合同2篇
- 二零二五年甲乙间设备租赁借款合同6篇
- 开展课外读物负面清单管理的具体实施举措方案
- 中国骨关节炎诊疗指南(2024版)解读
- 2025年内蒙古包钢集团公司招聘笔试参考题库含答案解析
- 企业内训师培训师理论知识考试题库500题(含各题型)
- 2025年云南中烟工业限责任公司招聘420人高频重点提升(共500题)附带答案详解
- 2024年山西省晋中市公开招聘警务辅助人员(辅警)笔试专项训练题试卷(2)含答案
- 2023九年级历史上册 第二单元 5《罗马城邦和罗马帝国》教学实录 新人教版
- 北京市房屋租赁合同自行成交版北京市房屋租赁合同自行成交版
- 《AM聚丙烯酰胺》课件
- 教育综合体项目策划书
- 软件开发项目服务方案
评论
0/150
提交评论