肿瘤登记资料的统计分析-生存分析_第1页
肿瘤登记资料的统计分析-生存分析_第2页
肿瘤登记资料的统计分析-生存分析_第3页
肿瘤登记资料的统计分析-生存分析_第4页
肿瘤登记资料的统计分析-生存分析_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

肿瘤登记资料的统计分析

---生存分析河南省肿瘤防治研究办公室孙喜斌电存率分析内容:基本概念1观察生存率2相对生存率4统计学检验5基本概念生存分析是一类时间到事件变量数据的分析(analysisoftime-to-eventdata)。医学研究中用生存分析这一术语(工业工程中则称作寿命时间分析或失效时间分析)。时间到事件变量三个基本限定:起点的时间是明确的。指标单位(时、天、月、年)要统一。事件发生的界定要明确。时间-事件变量由于存在截尾数据及反应变量往往呈非正态分布,故应用标准的统计方法处理是不合适的。生存率是一比例(不是率),但习惯上称作率。生存率是肿瘤登记数据的常用统计指标。临床疗效评价中常用的痊愈率、有效率、病死率等百分率指标,其统计效能较差。人群110000人随访3年15人在1年内死亡9985人在随访结束时存活死亡率=5/10000(年)人群210000人随访3年15人在3年内死亡9985人在随访结束时存活死亡率=5/10000(年)12例子1例子2人群110000人随访3年15人在1年内死亡9985人在随访结束时存活死亡率=5/10000(年)人群210000人随访3年15人在3年内死亡9985人在随访结束时存活其中有10人在结束时失访死亡率=5/10000(年)癌症诊断到死亡的时间随机分组到癌症复发的时间HIV感染到死亡的时间癌症临床实验中随机分组到死亡的时间淋巴瘤治疗期间缓解到复发的时间电灯(可)使用的时间………各学科中均涉及这类变量的处理。生存(失效)时间的界定研究群体的率在观察期内不一致(动态)关心生存时间的长短截尾观察存在生存分析应用01研究(观察)结束的日期(研究对象仍存活)02退出研究的日期03死亡日期(如果对象在随访研究结束前死亡)时间=开始的日期到:生存时间的计算截尾记录:被观察的个体在整个随访期间未有关注的事件(死亡、复发等)发生。截尾生存时间发生原因:观察期限已到失访,随访不完整不相关的事件发生(如,在癌症研究中,观察对象在随访期间死于意外伤害)失访终检(有信息性),终末终检(非信息)终检要尽量避免,尤其是失访终检终检(Censoring,截尾)终点事件的限定(二项变量)观察终点的确定(截至日期)起始点的限定观察对象的生存时间观察对象的确定(癌肿、性别、地区、时期)生存分析所需信息死亡证书(生命统计系统)1人口登记系统2临床记录3信访4电话随访5家访6随访方法A直接法B寿命表法(Life-tablemethod,actuarialmethod)C极限乘积法(Kaplan-Meiermethod)观察生存率的计算方法直接法随访期结束时存活病人的比例每个观察对象均要随访够限定的期限(如5年,除非死亡事件发生)失访病例除外(不能处理截尾数据)不考虑存活时间长短信息丢失该方法基本不用,如果观察对象中没有终检病例,该法得到的生存率结果与寿命表法和K-M法的结果相同。中位生存时间:50%病人存活过的时间。假如34例病例在观察期间(5年)有10例死亡,24例存活,那么死亡概率为:q=10/34=0.29=29%生存概率:p=24/34=0.71=71%死亡概率+生存概率=1q+p=1P=1-0.29=0.71=71%生存概率计算考虑到每个观察对象的生存过程包含终检观察数据寿命表法失访的注释

(保险统计的假定)失访可定为截至日期前终检:失访终检失访终检是有信息的,越低越好。(保险统计)假定:1、平均考虑,在一随访时段内,失访病例将存活一半的时间。2、这一时段内,每一失访病例贡献1/2的生存时间。3、失访病例的后续生存经历与该时段内随访完整病例的相同。4、将1/2的失访病例看作完整数据。寿命表(LT)法公式:i=1,2,...,m;用n(ti)、d(ti)、w(ti)分别表示在时间或随访区间t的期初存活病例数、期内死亡数、期内终检数。总的生存人数是计算死亡概率的分母。01失访减少了分母的数量。02有效观察数ni’=ni-wi/203有效观察病例数寿命表数据:

某市某区1972-79年期间男性肺癌新病例随访结果

(截止时刻1979年12月31日)确诊日期起

期内死亡

其中死于

其中死于其他

生存者随访未满随访期间总例数肺癌因的例数

个期间的例数

(包括期内失访)d w (1)

(2)

(3)

(4)

(5)0月~2912901343月~2102100126月~1381380279月~92920121年~2062033212年~4545093年~880114年~440115年~…

…21寿命表格式:

某市某区1972-79年期间男性肺癌观察生存率的计算确诊日期起期初观

期内死亡

有效观

死亡概率

生存概率

累积生存概率

随访期间察例数总例数察人数

ndn`q

pSR(1)

(2)

(3)

(4)

(5)

(6)

(7)0月~11522911135 0.25640.74360.74363月~827210821 0.2558 0.74420.55346月~605138591.5 0.23330.76670.42439月~44091434 0.21200.78800.33431年~336206325.5 0.63290.36710.12272年~10945104.5 0.43060.56940.06993年~55849.5 0.16160.83840.05864年~36430.5 0.13110.86890.05095年~21…

0.7436×0.7442×0.7667×0.7880=0.3343

计算步骤估计各个时段的生存概率:

期内死亡概率=死亡数/有效观察人数

0~期初人数1152(n1)期内死亡人数291(d1)期内终检人数34(w1)期内有效观察人数n1’=1152-34/2=1135

该时段死亡概率q1=291/1135=0.2564

该时段生存概率p1=1-0.2564=0.7436下一时段的期初人数=上一期初人数-上一期内死亡人数-上期内终检人数

如:3~期初人数=1152-291-34=827以此类推。

计算累计生存概率(生存率)各个时段的生存概率相乘即得(各年的)生存率。生存率(Survivalrate)=∏pn×pn-1×pn-2×….p2×p1如上表中的9个月生存率=0.7436×0.7442×0.7667×0.7880=0.3343步骤:计算各时段死亡概率计算各时段生存概率计算累计生存概率SPSS软件输出的寿命表结果累积生存率KM法计算公式:极限乘积(K-M)法i=1,2,...,m;用n(ti)、d(ti)、分别表示在时间t的期初存活病例数、期内死亡数。Kaplan-meier法计算(黑色素瘤)观察生存率治疗后月数(i)月初存活数(ni)死亡数(di)退出数(wi)死亡比例(qi)生存比例(pi)累计生存率(∏pi)050200.0400.9600.960148100.0210.9790.940247200.0430.9570.9003452*00.044……843100.023……1042100.024……12412*00.049……1339100.026……1538100.026……18371*00.027……1936100.028……2135012734023032013331110.0320.9680.6773429100.0340.9660.654*非黑色素瘤死亡01病例生存时间升序排列。03区间的长度取决于生存时间度量精度(年、月、天、小时…)。05终检数据只对分母有贡献(包括在分母内)。02区间的样本量渐进于0,分割区间数量倾向无穷大。04计算时仅考虑有事件发生或终检发生的区间,忽略其他区间。KM法说明Kaplan-Meier生存率曲线0504020301基本相同寿命表法较适用于成组数据生存指标的刻度连续,选用KM法两种方法都是计算出“观察生存率”KM法的生存曲线是阶梯状的,每一阶梯代表发生了限定的事件;寿命表法的曲线是平滑的。寿命表法与KM法比较原因别生存(Cause-specificsurvival)A(校正生存---correctedsurvivalrate;净生存---Netsurvival)相对生存(relativesurvival)B生存率的“竞争”死因调整01020304估计限定的癌症独立于其他死因的生存概率(仅计算由于该种癌症死亡作为事件结局的生存率)。原因别(观察)生存率终点=死于特定的原因因的病例作为终检观察数据处理(?)。总体(观察)生存率终点=死亡计算方法同总体生存率一样,只是将死于其他(非特定)原这类指标在临床试验研究中运用较多(死亡原因易确定)。0506原因别生存率人群为基础的肿瘤登记数据计算原因别生存率存在难度:死亡原因(死亡证书):未获得不准确编码错误用相对生存率表达原因别生存指标相对生存率(relativesurvivalrate)较多地应用于人群为基础肿瘤登记资料调整了竞争死因不需要死因信息运用人口统计寿命表观察生存率为限定诊断时期内、限定性别、癌症种类及年龄的一组病人的观察生存率(可由寿命表法及KM法计算获得)。01期望生存率是除了未患癌症外,其他因素(时期、年龄、地区等混杂因素)与癌症组病人相同的普通人群(暴露于全部死因风险)的生存率(该生存率从人口统计寿命表中计算获取),即该组癌症病人的期望生存率。02相对生存率=(观察生存率/期望生存率)×100相对生存率定义区间相对生存率:ri=pi/eipi:区间观察生存率,ei:区间期望生存率累计相对生存率:计算方法类似累计生存率的算法,各期间相对生存率的乘积,即得相应时间的相对生存率。相对生存率计算累计相对生存率累计相对生存率1ri计算方法∏ri1r11r21rnr1r2×r1rn×rn-1×….×r2×r11ri=∏ri=∏

(pi/ei)=∏pi/

∏ei01例如某地一组男性患者的诊断时间集中在1982年02或相邻年份内,从人口寿命表得知,相当于48-0352岁患者(假定用50岁代表这组患者)的一般男04性的五年生存概率为1-0.034089=0.965911,相05当于53-57岁患者(假定用55岁代表这组患者)06的一般男性的五年生存概率为1-0.064116=07935884,余类推。将一般人口寿命表内查得的08生存概率求其平均数,就得到该组患者的五年期09望生存率。简单计算说明简单算法再设n个患者的五年观察生存率为P,则五年相对生存率为:设Pi'为相当于第i个(i=1,2,……,n)患者的一般人群的五年生存概率,则所求的该组患者五年期望生存率(P’)为:例如:某地一组1990~1994年诊断的35~65岁乳腺癌病人的5年观察生存率为0.57(57%),该地区相应时期35~65岁一般人群女性的5年期望生存率为0.94。那么这组乳腺癌病人的5年相对生存率为:相对生存率=(观察生存率/期望生存率)×100=0.57/0.94×100=61%期望生存率的计算

(EdeerⅠ)IDSexAgeatdxYeardxSurvtimeExpectedprob.ofsurvivingtheinterval123455-yCul.exp.survival1M728900.949000.943380.941160.937670.932570.73912F829100.920140.910550.898930.885480.874570.58343M739300.949290.944160.937670.937180.933290.7351……………….....……………….....……………….....……………….....32F808780.93131.....33M668680.96957.....34M678780.96574.....35F568690.995270.995310.994490.994200.993290.9729各病人5年累计期望生存率=各年期望生存概率的乘积

=0.94900×0.94338×-----×0.93257=0.739135例病人的5年累计期望生存率=各期望生存率合计/病人总数

=(0.7391+0.5834+0.7351+-------+0.9729)/35=0.8159

期望生存率的计算(EdeerⅡ)IDSexAgeatdxYeardxSurvtimeExpectedprob.ofsurvivingtheinterval123451M728900.949002F829100.92014………………9m649410.976790.97501……………….13f799320.944720.939070.93084………………..22F859230.885480.87475.0.858960.8457625M809140.903380.893600.886280.871860.8638534M678780.96574....35F568690.995270.995310.994490.994200.99329各年的期望生存率=每一病人的各年期望生存概率相加/相应的病人总数

1年期望生存率=(0.94900+0.92014+-----+0.99527)/35=33.7398/35=0.963992年期望生存率=(0.97501+0.97943+-----+0.99531)/27=25.95746/27=0.9613935例病人的5年累计期望生存率=各年期望生存率的乘积

=0.96399×0.96139×0.95859×0.95543×0.95847=0.81355各年的期望生存率0.963990.961390.958590.955430.95847Hakulinen法首先生成期望寿命表il*(i)D*(i)v*(i)1l(1)d*(1)+σ*(1)v*(1)2l(2)d*(2)+σ*(2)v*(2)3l(3)d*(3)+σ*(3)v*(3)4l(4)d*(4)+σ*(4)v*(4)5etc.Hakulinen法计算区间的期望生存概率(与寿命表相同)计算总计的期望生存概率如果计算大于10年的相对生存率,这要用Hakulinen法计算期望生存率(可靠、稳定?)。计算时较复杂统计程序的应用Hakulinen法芬兰1985-1994年男性皮肤黑色素瘤5年观察生存率(p)、期望生存率(p*)及相对生存率(r)ageNpp*r15-28670.9470.9930.95430-442730.8560.9820.87245-595030.8240.9430.87460-744490.6790.8150.83375+2000.3960.5050.781观察生存率OSR 相对生存率RSR上海市区肺癌生存率(全人群):1988-1991男性 31.5 12.5 9.9 32.6 13.9 12.0女性 29.7 12.1 9.8 30.5 13.1 11.31年 3年 5年 1年 3年 5年生存率曲线

6-11某市某时期男性膀胱癌生存资料的相对生存率

Indwn'PCPCR2*SECRSR2*SESRE1R0-7542240754.00.702920.702920.724150.034290.724150.034290.724151-5301060530.00.800000.562330.597550.038400.597550.038400.597552-424850424.00.799530.449600.493940.039810.493940.039810.493943-339590339.00.825960.371350.422610.040050.422610.040050.422614-280211279.50.924870.34345

0.40563

0.040850.40563

0.040850.40562

5-258170258.00.934110.320820.393600.041720.393600.041720.393576-241210241.00.912860.292870.373840.042330.373840.042330.373797-220170220.00.922730.270240.359640.043070.359640.043070.359578-203130203.00.935960.252930.351520.044030.351520.044030.351439-190100190.00.947370.23962

0.348260.045220.348260.045220.34814

10-18084178.00.955060.228850.348430.046640.348430.046640.3482611-168748144.00.951390.217720.347820.048370.347790.048360.34761

P-观察生存率(期间),CP-观察生存率(累积)CR-相对生存率,SR-相对生存率,E1R-相对生存率期望生存率不同方法(EⅠ、Ⅱ及Hakulinenmethod)所得结果有所差别,应用时要标明。相对生存率的计算关键在可比一般人群(性别、年龄、时期、地区的一致)寿命表的选取及期望生存率的计算。我国期望生存率的计算???01相对生存率是癌症病人去除其他死亡危险(死亡竞争风险)后),评价癌症所产生的超额死亡率的综合指标。05相对生存率不是“粗率”,但也不是完全的年龄调整率。该指标只是对分母部分做了年龄调整,未对分子部分进行调整。03时间t时的累计相对生存率可解释为假定只有该癌症为可能死亡原因时,病人至少存活到t时的比例。02相对生存率等于1表示观察生存与期望生存相等,没有造成超额死亡。04尽管计算期望生存率时,所考虑的癌症死亡也包括在一般人群的死亡风险中,实际估计时其影响很小,可以忽略不计。相对生存率的解释生存率的标准误和可信区间标准误是评价(计算)生存率不准确性的指标。95%(99%)可信区间是取值范围,表示重复100次研究,所得指标有95(99)次所在的区间范围。直接法:P=限定年数的生存率;n=观察总数95%可信区间=p±1.96×Se(p)如一组30例病人的观察生存率57%则:Se(p)==0.0995%区间=0.57±1.96×0.09=0.39~0.75寿命表法标准误的计算:Pi*i年累计观察生存率;qi区间死亡概率;ri区间有效人数;di区间死亡数置信区间估计:95%CIpi*±1.96Se(pi*)STEP01STEP02Se(ri)=Se(pi*)/期望生存率95%可信区间:相对生存率±1.96×Se(ri)相对生存率的标准误01生存率比较02生存期比较统计学检验生存率比较–U(Z)检验两组一年生存率:45%,40%两组一年生存率的标准误:0.1250,0.11300.05(U=1.96,P=0.05)生存曲线(分布)比较:Logrank检验

(适用于寿命表和KM法)2<3.84,自由度=1,P>0.05O:观察期内实际死亡人数E:观察期内期望死亡人数030201第一组期望死亡数=∑(区间内第一组死亡数+区间内第二组的死亡数)/(区间内第一组存活数+区间内第二组的存活数)×第一组有效观察数第二组期望死亡数=∑(区间内第一组死亡数+区间内第二组的死亡数)/(区间内第一组存活数+区间内第二组的存活数)×第二组有效观察数存活数=组内有效人数-组内死亡数期望死亡数010203不提供生存曲线差异大小的指标生存曲线出现交叉检验不敏感不能调整混杂因素Log-rank检验的局限Wilcoxon检验:对各期间的观察人数加权。010

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论