研究生医学统计学生存分析ppt课件_第1页
研究生医学统计学生存分析ppt课件_第2页
研究生医学统计学生存分析ppt课件_第3页
研究生医学统计学生存分析ppt课件_第4页
研究生医学统计学生存分析ppt课件_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

19 生存分析 生存分析的目的 1. 估计:根据样本生存资料估计总体生存率及其他有关指标 (如中位生存期)等。 2. 比较:对不同组生存率进行比较。 3. 影响因素分析:为探索和了解影响生存时间长短的因素,或 平衡 某些因素后,研究某个或某些因素对生存的影响。 4. 预测:对具有不同因素、不同水平的个体进行生存预测。 第一节 生存时间资料的特点 第二节 小样本生存率的 kaplan-Meier估 计 第三节 大样本生存率的寿命表法估计 第四节 生存曲线比较的假设检验 第一节 生存时间资料的特 点 一、数据结构 二、统计描述指标 三、资料要求 一、数据结构 在临床医学中 , 对病人疗效考查: 治疗结局? 生存时间? “ 生存时间 ”的概念 开始事件 终点事件 生物生存 死亡 生存时间生存时间 电脑开始使用正常 出现故障 疾病产生 治愈 疾病治愈 复发 阴性 阳性 生存时间的三个要点 一、起始事件 二、 终点事件 三、生存时间 医学例子:起始事件 随访时间 终点事件 疾病确诊 死亡 治疗开始 死亡 治疗开始 痊愈 接触危险物 出现反应 治愈出院 复发 广义的 “生存时间 ”也可为医疗费用(元)、 医疗设备使用次数、车辆行驶总里程 (公里 )等 随访( follow-up) 资料的记录 生存资料一般通过随访收集, 记录的项目: (起始与终止)随访事件 生存时间(开始观察日期与终止观察日期)(年、月 、天、小时、分、秒等) 分组变量(处理方法) 和其它协变量(性别、年龄、职业、文化程度等) 月 份( 2000年) 图 12-1 生存时间原始记录示意 (“+“截尾 ) 天 数 图 12-2 生存时间排序整理数据示意 01 167 生存时间资料的特点 2个效应变量 ( 1)生存时间 (天数 ),( 2)结局 (死亡与 否、是否阳性等 ) 删失(截尾)数据 : 在规定的观察期内,对某些观察对 象由于某种原因未能观察到死亡结局,并不知道确切的生存时 间,称为生存时间的删失数据( censored data)。如表 12-1 中的 1号和 3号病人未观察到底,不知他们究竟能活多长时间。 产生结尾原因: (1)迁移 (2)死于其他原因 (3)因其他客观原因中途退出 (4)研究结束时终点事件尚未 发生 分布类型复杂 : 生存时间分布不服从正态分布,常常呈正 偏态分布、 Weibull分布、 Gamma分布或更为复杂的分布,因 此要用特殊的统计方法。 2个效应变量 ( 1)生存时间 (天数 ),( 2 )结局 (死亡与否、是否阳性等 ) 错误 1:忽略生存时间,采用 Logistic回归分析死亡 率 错误 2:忽略结局,采用 t检验、线性回归分析生存时 间 得不到确切的生存时间,但它们提供的生存时间长 于观察期的时间,这种数据为 不完全数据 。或截尾数据 、删失数据或终检值。 (如有确切的生存时间,则这种数据称为 完全数据 。) 两种错误的做法: 错误 1: 丢弃 截尾 数据,只考虑确切数据。(损失了 信息) 错误 2: 将 截尾 数据当作确切数据处理。(低估了生 存时间的平均水平)。 截尾 (删失 )数据或终检值 (censored data) 两种错误的做法: 错误 1: 采用平均生存时间而不是采用 中位生存时间 来表示生存时间的平均 水平。 错误 2: 采用常规 t检验或方差分析进 行组间比较。(应采 用 log-rank检验 比较几组生存时间 ) 正偏 态 ( positive skewness) 数据 二、生存分析的统计描述指标 1.死亡概率、生存概率 2. 生存率及其标准误 3. 半数生存期(中位数) 及四分位数间距 例 1 手术治疗 60例肺癌病人,术后每年死亡 10例,无删失。试求基本生存分析指标。 N=60 ; 术后 年内 年内 年初 年 死亡 死亡 生存 (t+1)年 年 死亡 截尾 观察 平均 率 概率 概率 生存率 数 例数 例数 例数 例数 p=1-q t d c n0 n=no-d/2 m=d/n q=d/n0 (n0-d)/n0 (n0-d)/N (1) (2) (3) (4) (5) (6) (7) (8) (9) 0 10 0 60 55 . 181 . 167 . 833 . 833 1 10 0 50 45 . 222 . 200 . 800 . 667 2 10 0 40 35 . 286 . 250 . 750 . 500 3 10 0 30 25 . 400 . 333 . 667 . 333 4 10 0 20 15 . 667 . 500 . 500 . 167 1 . 死亡率、死亡概率、生存概率 (1) 死亡率 (mortality rate, death rate) 表示某单位时间 内 的死亡强度 。 年平均人口数 =(年初人口数 +年末人 口数 )/2 (2) 死亡概率 ( mortality probability ) 是指单位时段开始时存活的个体到该时段结 束时死亡的可能性,即死于某时段 t t+n内的 概率 。 d/n0 年内有删失,分母用校正人口数: 校正人口数 = 年初人口数 删失 例数 / 2 n0 c/2 (3) 生存概率 ( survival probability ) 指某单位时段开始时存活的个体 到该时段结束时仍存活的可能性的大小 。 (n0- d)/n0 分子为年末尚存人数, 若年内有删失,分母用校正人口数 。 生存率 (survival rate) ( 累积生存概率 cumulative probability of survival ) 指病人经历 t个 单位时间后仍存 活的概率。 生存概率指单个时段的概率, 生存率指从 0 t多个时段的积累概 率 。 2. 生存率及其标准误 生存率与生存概率仅一字之差,含义却 是不同的。 生存概率是针对单位时间而言的,生 存率是针对某个较长时间段的,它是生存 概率的累积结果。 如评价肿瘤预后常用的 5年生存率, 是指第 1年存活、第 2年也存活, ,直 至第 5年仍存活的累积概率,而这 5年间每 1年有不同的生存概率。 如数据中无删失,生存率可用下式计算 如果有删失数据,则需分时段计算不同单 位时间的生存概率 Pi(i=1,2,t), 然后利 用概率乘法原理将 Pi相乘得到 t时刻生存 率。 S ( t ) = P (T tk ) = p1 p2 p k 例如 手术治疗 50例肺癌病人,术后 1, 2, 3年的 死亡数分别为 10, 10, 10例,无截尾数据。 试求各年的 生存概率和 3年生存率。 解: 各年生存概率 p1 = ( 50 10 ) / 50, p2 = ( 40 10 ) / 40, p3 = ( 30 10 ) / 30 3 年生存率 S(3) = P(T 3) (n0-d)/N = ( 50 30 ) / 50 = 0.4000 或 S(3) = p1 p2 p3 = 0.4000 生存率的标准误 生存率置信区间 生存曲线 以生存时间为横轴,生存率为纵轴绘制的曲线 (a)研究终止在 475天 (b) 研究终止在 474天 图 12-3 乘积极限法生存曲线 (阶梯形 )及其半数生存期( Md=158天) 图 12-4 寿命表法生存曲线 (折线 )及其半数生存期( Md=1.7年) 生存曲线给我们的信息 阶梯状;每一级阶梯代表一个死亡时间点 (在截尾时间点 无阶梯 );如果最大时间点是截尾则生存曲线不与曲线相 交(见下图),否则与横轴相交。 Death Censored Median Survival 1.8 Years 生存曲线给我们的信息 3. 半数生存期及四分位数间距 半数生存期 也称中位生存期( median survival time), 即生存时间中位数,表示恰好 有 50%的个体活过此时间,即生存率为时 对应的生存时间(集中趋势指标)。其数值可借 助生存曲线进行粗略的图表法估计,或用线性内 插法求解精确的数值。删失数据超过样本量的 50%时,无法估计中位生存时间。此时较为实际 的做法是使用生存时间超过一给定时间长度的概 率(如 3年生存率或 5年生存率) 生存期的四分位数间距 t t, 反映离散程度大小 三、资料的基本要求 1. 死亡例数(或死亡比例)不宜太少, 否 则宜出现偏性; 2. 截尾原因无偏性; 3. 生存时间尽可能记录精确 生存率估计生存率估计 常用的两种方法 : 1. 乘积极限法,即 kaplan-Meier法 (小样本时) 2. 寿命表 法 (大样本时) 第二节 小样本生存率的 kaplan-Meier估计 乘积极限法 (product-limit method)又称 Kaplan-Meier 法,由 Kaplan和 Meier于 1958年提出 ,主要针对小样本资料,也 可用于大样本,是一种非参数方法。 基本思想:将生存时间由小到大依次排 列, 在每个死亡点上 ,计算其期初人数 、死亡人数、死亡概率、生存概率和生 存率。 11名接受 “手术 +化疗 ”治疗的乳腺癌患者的生存时间: 10,14,15,16+,19,19,20,20+,24,26,28 序 号 时间 ( 月 ) 死 亡 数 删 失 数 期初 例 数 生存概率 生存率 标准误 i ti di ci ni Pi=(ni-di)/ni S(ti) SE(S(ti) 1 10 1 0 11 10/11=0.90 91 0.9091 0.0867 2 14 1 0 10 9/10=0.900 0 0.8182 0.1163 3 15 1 0 9 8/9=0.8889 0.7273 0.1343 4 16+ 0 1 8 8/8=1.0000 0.7273 0.1343 5 19 2 0 7 5/7=0.7143 0.5195 0.1569 6 20 1 0 5 4/5=0.8000 0.4156 0.1562 7 20+ 0 1 4 4/4=1.0000 0.4156 0.1562 8 24 1 0 3 2/3=0.6667 0.2771 0.1537 9 26 1 0 2 1/2=0.5000 0.1385 0.1245 1 0 28 1 0 1 0/1=0.0000 0.0000 - (a)研究终止在 475天 (b) 研究终止在 474天 图 12-3 乘积极限法生存曲线 (阶梯形 )及其半数生存期( Md=158天) 0 0 第三节 大样本生存率的 寿命表法估计 寿命表法 (life-table method)的应用 早于 Kaplan Meier法,它是 Kaplan Meier法的近似方法 (频数表法 ) 图 12-4 寿命表法生存曲线 (折线 )及其半数生存期( Md=1.7年) 寿命表法只估计时段 右端点的生 存率 ,省略了时段内的生存率估 计 第四节 生存曲线比较的假设检 验 Log rank(时序 ) 检验 (也称为 Cox-Mantel检验 ) Breslow检验 (也称 Breslow广义 Wilcoxon检验 ) 21例乳腺癌患者两种疗法的生存时间(月) 手 术 组 6 9 13 15 18 19 19 20 22 24 手 术 + 化 疗 组 10 14 15 16+ 19 19 20 20+ 24 26 28 序 号 时 间 单 纯 手 术 组 手 术 加 化 疗 组 合 计 i ti n1i d1i c1 i T1i n2i d2 i c2i T2i Ni Di 1 6 10 1 0 0.476 2 11 0 0 0.523 8 21 1 2 9 9 1 0 0.450 0 11 0 0 0.550 0 20 1 3 10 8 0 0 0.421 1 11 1 0 0.578 9 19 1 4 13 8 1 0 0.444 4 10 0 0 0.555 6 18 1 5 14 7 0 0 0.411 8 10 1 0 0.588 2 17 1 6 15 7 1 0 0.875 0 9 1 0 1.125 0 16 2 7 16+ 6 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论