




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 一、生存分析的概念: 将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。 研究生存现象和响应时间数据及其统计规律的一门学科。 对一个或多个非负随机变量(生存时间)进行统计分析研究。 对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计分析方法。 在综合考虑相关因素(内因和外因)的基础上,对涉及生物学、医学(临床、流行病)、工程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、犯罪、婚姻)、经济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状态持续)发生的时间(也叫寿命、存活时间或失效时间,统称生存时间)有关的问题提供相关的
2、统计规律的分析与推断方法的学科。 二、“生存时间”(Survival Time)的概念 生存时间也叫寿命、存活时间、失效时间等等。 医学:疾病发生时间、治疗后疾病复发时间 可靠性工程系:元件或系统失效时间 犯罪学:重罪犯人的假释时间 社会学:首次婚姻持续时间 人口学:母乳喂养新生儿断奶时间 经济学:经济危机爆发时间、发行债券的违约时间 保险精算学:保险人的索赔时间、保险公司某一索赔中所付保费 汽车工业:汽车车轮转数 市场学中:报纸和杂志的篇幅和订阅费 三、生存分析的应用领域:社会学,保险学,医学,生物学,人口学,医学,经济学,可靠性工程学等 六、生存分析研究的目的 1、描述生存过程:估计不同时
3、间的总体生存率,计算中位生存期,绘制生存函数曲线。统计方法包括Kaplan-Meier(K-M)法、寿命表法。 、比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗2生存分析课程总结 方案较优。统计方法log-rank检验等。 3、影响因素分析:研究某个或某些因素对生存率或生存时间的影响作用。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。统计方法Cox比例风险回归模型等。 4、预测:建立Cox回归预测模型。 主要研究内容 描述生存过程:研究人群生存状态的规律,研究生存率曲线的变动趋势,是人寿保险业的基础。 生存
4、过程影响因素分析及结局预测:识别与反应、生存及疾病等相关风险因素,预测生存结局,在临床中应用的非常广泛。 七、主要分析方法 1、参数法方法:首先要求观察的生存时间t 服从某一特定的分布,采用估计分布中参数的方法获得生存率的估计值。生存时间的分布可能为指数分布、Weibull分布、对数正态分布等,这些分布曲线都有相应的生存率函数形式。只需求得相应参数的估计值,即可获得生存率的估计值和生存曲线。 2、非参数方法:实际工作中,多数生存时间的分布不符合上述所指的分布,就不宜用参数法进行分析,应当用非参数法。这类方法的检验假设与以往所学的非参数法一样,假设两组或多组的总体生存率曲线分布相同,而不论总体的
5、分布形式和参数如何。非参数法是随访资料的常用分析方法。 3、半参数方法:只规定了影响因素和生存状况间的关系,但是没有对时间(和风险函数)的分布情况加以限定。这种方法主要用于分析生存率的影响因素,属多因素分析方法,其典型方法是Cox比例风险模型。 4、几种常用的统计软件:SAS,SPSS,Stata,Excel,R 第二章 数据类型 一、完全数据(Complete data) 每个个体确切的生产时间都是知道的。这样的数据称为完全数据(Complete data)。但在实际的生存分析中,数据在很多情况下是很难完全观察到的。 二、删失(Censoring ) 2 32009121304 吕嘉琦 班2
6、统计学【经济分析】09生存分析课程总结 生存数据一个重要的特点是:在研究结束时,无法获得某些个体确切的生存时间。例如:失去联系(病人搬走,电话号码改变),无法观察到结局(死于其他原因),研究截止,个体仍然存活在这些情况下获得的数据就是删失数据(Censored data)。对存在删失的个体,只知道删失时间(Censoring time)。 删失分为右删失(Right censoring)、左删失(Left censoring)和区间删失(Interval censoring) 1、右删失(Right censoring)。 在进行观察或调查时,一个个体的确切生存时间不知道,而只知道其生存时间大
7、于时间L,则称该个体的生存时间在L上是右删失的,并称L为右删失数据(Right-censored data)。 右删失有三种类型(按结束时间差别):I型删失(Type I censoring)、II型删失(Type II censoring)和III型删失(Type III censoring)。 (1)I型删失(Type I censoring):对所有个体的观察停止在一个固定的时间,这种删失即为I型删失(或定时删失)。例如:动物研究通常是以有固定数目的动物接受一种或多种处理开始,由于时间和费用的限制,研究者常常不能等到所有动物死亡。一种选择就是在一个固定时间周期内观察,在截止时间之后仍可能
8、有些动物活着,但不继续观察了。这些动物的生存时间是不知道的,只知其不小于研究周期时间。I型删失的删失时间是固定的。 图表 1 I型删失示例 (2)II型删失(Type II censoring):同时对n个个体进行观察,一直到有一固定数目(r n)的个体死亡(失效)为止,这种删失即为II型删失。II型删失的删失时间是随机的。 3 32009121304 吕嘉琦 班2统计学【经济分析】09生存分析课程总结 型删失示例图表 2 II :所有个体在不同时间进入研究,某些个体在研究结束)型删失(Type III censoring(3)III其他个体在研究结束之前退出研究而不被跟踪观他们的确切生存时间
9、是知道的,之前死亡,这种删失叫进入研究的时间可能不同,删失时间也可能不同,察或在研究结束时仍然活着。 )。做III型删失,又称为随机删失(Random censoring 型删失示例3 III图表 )2、左删失(Left censoringC 这就是左删失。开始接受观察,研究对象在时刻而在此之前我们感兴趣的时间已经发生,l我吸食过,但我不记得吸食的具体有一种回答:“例如:您初次吸食大麻是在什么时候?” ”这些回答的吸食时间数据就是左删失。时间了。有些儿童在进入研究前就已经可以完成某项特通过测试确定儿童学会完成特定任务的年龄, 定任务,这些儿童的事件发生时间也是左删失。对吸食大麻的:。例如也可能
10、出现右删失,称为双删失(,Double censoring)出现左删失同时4 32009121304 吕嘉琦 班2统计学【经济分析】09生存分析课程总结 问卷还有一种回答:“我从来没有吸食过”,这样的数据就是右删失。 3、区间删失(Interval censoring):若个体的确切生存时间不知道,只知道其生存时间在两个观察时间 L和R之间(LR),则称该个体的生存时间在L,R上是区间删失的。实际工作中,凡是不能或者不愿作连续监测时就会遇到这样的区间删失。 区间删失分两种:第一类区间删失(Case I Interval censoring)和第二类区间删失(Case II Interval c
11、ensoring)。 当对个体只进行一次观察,且个体的确切生存时间不知道,只知道其生存时间是否大于观察L?0R?)或时间(即,这种删失称为第一类区间删失,也称为现实状况数据(Current 0?L?R?时,这种删失称为第data)R 满足。当对个体进行次观察,其观察时间L和二类区间删失,也称为一般区间删失。 如果初始时间(如艾滋病感染时间)和发生时间均为区间删失,则称生存时间为双重区间删失(Double interval censoring)。 三、截断(Truncation) 在研究或者观测中,淘汰了一些对象(样本),使得研究者“意识不到他们的存在”。对截断数据的分析构造似然采用条件分布。
12、截断包括两种:左截断(Left truncation)和右截断(Right truncation)。 1、左截断(Left Truncation):只有个体经历某种初始事件以后才能观察到其生存时间,称为左截断(Left truncation),此时获得的数据称为左截断数据(Left-truncated data) 例如:暴露于某疾病、发生死亡前的中间事件等。退休中心老年居民死亡时间(没到年龄没有进入观测) 左截断与左删失的区别:在左截断的研究中,根本没有考虑那些在进入研究之前已经经历了感兴趣时间的个体,而在左删失的研究中,我们能获得这些个体的部分信息。 即有左截断又存在右删失的情况,称为左截断
13、右删失(Left-truncation and right-censoring) 2、右截断(Right Truncation) 只有经历了某种终止事件才能观察到生存时间(将要经历该事件的个体不包含在实验样本中),称为右截断(Right truncation),此时获得的数据称为右截断数据(Right-truncated data)。 例如:对艾滋病感染和发病时间观测数据,有些个体感染病毒但尚未发病,这样的个体不在样本范围之内。 3、截断的数学表示 设Y是一个非负的表示生存时间的随机变量;T是另外一个表示截断时间的随机变量。 5 32009121304 吕嘉琦 班2统计学【经济分析】09生存分
14、析课程总结 Y?TY?T时,才能观;在左截断下,只有当时,才能观察到在左截断下,只有当T和Y察到T和Y。 第三章 基本函数和模型 一、生存函数(Survival Function) 描述生存时间统计特征的基本函数,也叫生存率(Survival Rate) :设T 表示生存时间,F(t)S(t)?P(T?t)?1?F(t),0?T? T 分布函数,生存函数定义为:为生存函数性质:非增函数。 ?)?limS(xS(0)?1?x?0 满足0?(x)(?)?limSS?x当生存时间为连续型随机变量时: ?f(u)(t)?duP(T?t)?1?FS(t)?t )(tdS?)?S(t)?(tf dtS(t
15、)的图像叫做生存曲线(Survival Curve),如下图: 生存函数 陡峭的生存曲线表示较低的生产率或较短的生存时间;平缓的生存曲线表示较高的生存率或较长的生存时间。 离散生存时间产生于舍入操作将失效(或死亡)时间分组从区间和寿命用整数计量等。 a?a?,且取值为T 增存函数是非的阶梯函数,当时离散间生21?f(a),i?P(Ta)1,2,?)(St?,?)?(?)(faPTai,?12 ,iiiia?ta?tii6 32009121304 吕嘉琦 班2统计学【经济分析】09 生存分析课程总结 离散时间生存函数是非增的阶梯函数 :二、危险率函数(Hazard Function) 概率:危险
16、率函数:描述观察个体在某时刻存活条件下,在以后的单位时间内死亡的(条件)tT?t?hP(T?lim?t)( h?0h?)tlndS(f(t)?(t)? 当T 连续 ; dt)S(ta?2,,i?1,(f(a)?PT?a)?a?a?处的危险率为离散,取值为当T ,则,iii21)(aa)S)S(a?S(af(?i1?iii? ?,1,2?T?PT?a?a?1,i? iii)aS(Sa)(a)S(1i?11i?i? )(aS?i?)(1S(t)? i)S(ata?ta?1i?ii在生存分析和医学统计中又称为风险率函危险率函数在工程上叫做失效率函数或损坏函数, 数率或条件死亡(Death inten
17、sity)、death 或瞬时死亡率(Simultaneous rate)、或死亡强度 Age death rate)等。(Conditional death rate)、或年龄死亡率( 常见风险函数曲线7 32009121304 吕嘉琦 班2统计学【经济分析】09生存分析课程总结 )三、累积风险函数(Cumulative Hazard Functiont?dutu? 累积危险率函数:t?du?expu?t?tSexp? 连续,当T ?0?t?lntS? T 离散时,危险率函数有两种定义形式:当?t?it?ia i ?ln?1ti tia?i? 如果的值很小,两种定义形式的值接近i )四、平均
18、剩余寿命函数(Expected residual life 平均剩余寿命函数定义为:?ds?ftss?t ?ttT?r?t?ET ? tS?0r 为平均寿命。 五、常用的参数模型)分布、Weibull生存时间的分布一般不呈正态分布。常用的分布有:指数分布、威布尔( )分布、对数正态分布。logistic伽玛(Gamma)分布、对数罗吉斯蒂(8 32009121304 吕嘉琦 班2统计学【经济分析】09生存分析课程总结 1、指数分布 ?0,?tts?t,?exp0 生存函数形式为:?ttp?fex 密度函数为:?t 危险率函数为:指数分布的一个重要性质:无记忆性(某事件的发生时间与历史记录无关)
19、,即 ? t?tT?PP?T?thT 2、威布尔(Weibull)分布 ?0?exp0?,stt? 生存函数形式为:?1时为指数分布。是尺度参数, 是形状参数,其中?1?tt? 危险率函数为:?1?11?)等各种情形。)和为常数(取)适用于危险率递增(取、递减(取 Gamma)分布3、伽玛(?t?1?duu?u1?exp?0?0?s0t,?, 生存函数:? ?1?du?uuexp? 其中称为伽玛函数。0 生存数据基本特征的非参数估计第四章 一、生存函数的估计t?t?t D个严格区分的时间点上:假设事件发生在D2?的个数t生存时间?tS 在无删失条件下: 个体总数 二、右删失生存函数的估计:?t
20、SSttStS?1i?i12t?t?SS? 0itSSSSttt 0?211ii? t?tPtT?T?TP?tT?ttTtS?tPT?PT?Tt?11221i?ii?i1i9 32009121304 吕嘉琦 班2统计学【经济分析】09生存分析课程总结 ?Y?d?ii D?,1,2,iTPT?t?t?,? 存在右删失下: iiYi失效个体数时刻tt面临危险的个体数;d:Y:时刻 iiii product-limit)估计三、乘积限( Kaplan-Meier估计乘积限估计又称tt?1,? 1?)S(td? iit?)(1?t? 1Y?tt?ii 阶梯函数,在观察时间点上发生跳跃;tt超出观测上限
21、的时间没有给出很好的估与上发生的事件数和跳跃的高度前删失数有关;ii 计。 四、乘积限估计尾部修正即等价于假定最大时间点上的生建议最大观察时间点以后的生存函数等于0,Efron(1967) 存者马上就会死亡。(负偏估计)?t?tSS即假设最大时间点上的生)建议最大观察时间点以后的生存函数,Gill(1980max 存者永远不会死。(正偏估计) 1974)建议尾部估计为一条指数曲线,即和 Kowar(Brown、Hollander ?tt/t?expSlntS maxmax 五、乘积限估计的方差?d?i22?t?tS?VarSt 估计式:Greenwood? dY?Yiiistt?i 六、生存函
22、数点估计的置信区间 利用渐进正态性的线性置信区间:?tSZt?Z?t,St ?SS?1?1 22 其他变换形式的非线性置信区间 反正弦平方根对数变换 七、累积死亡率的估计 无删失条件下危险率函数的估计:10 32009121304 吕嘉琦 班2统计学【经济分析】09生存分析课程总结 ?在时间t开始的区间中死亡的个数?t 在时间t存活着的个体数?区间宽度 有删失条件下累计死亡率估计: ?t?lntS? 直接利用累积死亡率与生存函数的关系:1.d?2?i?t 方差为: 估计为2.Nelson-Aalen HYt?tii0,t?t?1? ?H(t)?d?it?t? 1Y?t?tii 具有更好的小样本
23、性质 估计的应用Nelson-Aalen )用于选择事件发生时间的参数模型1 )为危险率提供粗估计(对估计进行核平滑后计算斜率)2 八、累积死亡力函数的置信区间?,t?tZ?Z?tt 线性置信区间:?HH?11? 22 其他变换形式的非线性置信区间 反正弦平方根变化区间对数变换区间 注:)假censoringNelson-Aalen估计都是建立在非信息删失(non-informative 1、乘积限估计和 设下 构造指数曲线取最大观测点的值;c)取0;b)a)2、乘积限估计的尾部估计:?texp?ttlnS/St maxmax 、无删失时,乘积限估计即为经验生存函数3 九、生命时间均值的估计?
24、dtt?S 平均生存时间:0?S?tdt 估计式为:?011 32009121304 吕嘉琦 班2统计学【经济分析】09生存分析课程总结 2?Dd?rvaiSdtt? 方差为:? d?YY1?iiii十、左截断右删失数据生存函数的估计 只有生存到某时刻之后才能进入观察 乘积限估计(独立截断下是最大似然估计) ?d?i?S?t1(为条件估计) ? Y?t?tiiY:在时刻t之前进入区研究,且至少被研究到t的个体数;iii 时死亡的个体数。在时刻td:iiLai和Ying(1991)修正乘积限估计: (当风险集较小时忽略此处的死亡) ?d?in?1?cSItY10?c?0, 为常数。 I为指数函数
25、;n为样本大小;? iY?tt?ii十一、左删失数据生存函数估计 利用“时间倒转法”: ? 即不是从原点处测量时间,而是从很大的一个时间倒着从相反的方向测量,用时间减去原始时间,得到右删失数据结构,利用乘积限估计式估计 ?t?P?PXt?X? 纯粹左删失情况很少见。 十二、同时存在左、右删失情况 trtcdt?0?t?t表时的死亡数,时的右删失数,表示设为观察时间点, 表示jjjjjm12t时的左删失数,则生存函数的迭代估计步骤为:示 j?tS :忽略左删失获得乘积限估计作为的初始估计;步骤0j0?t?SSt?j?1KKji?j ? tS1?jK? tX?t?tp?P?X 的当前估计值通过估计
26、:使用步骤(K+1)1Sijij?1jm?dcp?d?t时发生的事件数为:使用上一步骤的结果,估计在)2K+1 步骤(jjiijjj?i步骤(K+1)3: 使用上一步修正后的右删失数据,仍然忽略左删失计算乘积限估计。如果12 32009121304 吕嘉琦 班2统计学【经济分析】09生存分析课程总结 ?tttSS,则停止迭代,否则继续步骤1。 这一估计在所有处都有接近jK1K?十三、右截断数据生成函数的估计 TXi是从感染到发病的时间。传染病的研究中比较常见。设个个体被传染的时间,代表第ii?X,T之前发病的人才进入研研究样本包含从期间病人的观测值.0到(只有在时间ii究)。 ?XRR?左截断
27、的,变为颠倒时间轴法:令便可构造则利用iii?tP?XPXR?tR?0? 的乘积限估计式。 十四、生命表中生存函数的估计 生命表(也称寿命表,life table)方法是测定死亡率和描述群体生存现象的最古老的技术之一。主要用于保险精算、人口学、医学等方面。 一组(大规模)个体在整个考察时间上被连续观察,它们的事件发生时间或删失时间被记入 ?1k?1a,a,j1?k? 个相邻但不重叠的区间内 jj?1根据生命表方法应用的范围不同,可分为人口生命表和临床生命表,分析方法相似。 生命表方法数据假设 (1)独立删失:假定删失的事件时间(包括损失和退出)与它们如果一直被观察到事件发生所得到的死亡时间是独
28、立的。 (2)假定删失时间和死亡时间是均匀分布在每个区间上的。 (3)假定死亡力在区间内是常数。 生命表的构造方法 1. 第一列给出相邻但不重叠的固定区间 ?a?a?0k?1,?,?1,?Iaa,j事件发生时间和删失时间将落入且只落入其1jk?1ij?0 中的一个区间。Yj 个区间的对象数2. 第二列给出进入第,这些个体还没有经历观察事件的发生。jWj 3. 第三列给出在第个区间中失去踪迹(死亡)或活着退出观察(迁出)的个体数jYj的一个估计值,假设删失时个区间中,面临观察事件风险的暴露数4. 第四列给出在第j2W?YY?/ 间在区间上是均匀分布的,则jji13 32009121304 吕嘉琦
29、 班2统计学【经济分析】09 生存分析课程总结 dj 个区间中发生观察事件(如死亡)的个体数5. 第五列是在第j?aSj1?aS 个区间起点处的生存函数的估计,且6. 第六列给出在第对于第一个区间1j?0j?Y/Y?Sda/?S1a?1?d jjj?j1jj1?i?Sa生命表分析的主要任务就是估计 ,基本思想:乘积限方法。j?2a?a?a/faj个区间中点处的概率密度函数第七列给出估计的第,其中它7. 1mjjj?mjj即率,事件的概个区间上单位时间内发生观察在表示第?fa?aa?SS/aa 1?j?1jjjmj?t/ttS?fja率险处估计的列给出在第危个区间中点 ,由 8. 第八mj有?a
30、?SaaS/Safa/Sa?aS/S/a2?faa?f2? jj?1jmjj?1mjmjmjmjj?2a?d/d/?aY?a也可以定义为每个个体单位时间的时间发生率 jmjjjj?1j 注:最后一个区间在理论上是无限的,所以没有任何危险或概率密度函数的估计。 j: 1976)将其定义为个区间起点生存函数标准差的估计值,Greenwood9. 第九列是第(1?j?1?2d/,Y,Y?dka,Sj? ii?j1ii1i?S1?a其中 的估计的标准差为0 0 其形式与乘积限估计式的标准差估计一样。 j 第十列给出在第个区间中点处概率密度函数标注差的估计值,它近似等于10. ? ?)(Sqa1j?1j
31、?j? )/(,q?YpYp iiiii)?aa(1i?j1?j ? =/,.1qdY其中p ?q jjjjj j 11. 生命表的最后一列给出了第个区间中点处危险率函数的标准差的估计,它近似等于 ?2?(a)?mj1/22?1aa()(a?)/2?1?jmjj?Yq14 32009121304 09班统计学【经济分析】2 吕嘉琦jj生存分析课程总结 第五章 相对风险回归模型 一、Cox相对风险模型 ?x,tthT?t,xr/ht;x?limP?t?T?t?0? 设0h?t?0?txr,tx为协变量。 成为相对风险。为基准风险函数。0二、相对风险回归模型(Cox模型) ?trpt,xZ?ex即得取Cox model ?t,ZttZZ,tZ?exptt;xtx?,其中:的函数和为协变量 p10? 0x,?t,?0?t 0?,? 为未知的回归参数p1Relative risk model(Cox model) ?tpZex,?,? 为参数部分为未知参数p1?t 为非参数部分,未知基准函数,因此,相对风险模型为半参数模型。0 模型下:生存时间的分布函数为在Cox )|x(T?t;S(tx)?P t?u)du(u)expZ(?
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 超星尔雅学习通《法律与社会(复旦大学)》2025章节测试附答案
- 妇幼保健员考试科学备考方法试题及答案
- 2025年茶艺师市场营销试题及答案
- 2025年妇幼健康宣传与教育策略试题及答案
- 2025年度新能源汽车充电停车场合作运营协议范本
- 二零二五年度商业秘密保护竞业限制协议
- 二零二五年度农村土地部分互换与农村文化传承合作协议
- 2025年度木材贸易金融服务及买卖合作协议
- 二零二五年度文化娱乐场所劳务工解除合同及安全管理服务协议
- 二零二五年度旅游行业劳动合同终止及旅游服务协议
- 2024年湖南食品药品职业学院单招职业技能测试题库及答案解析
- 2024年江苏医药职业学院单招职业技能测试题库及答案解析
- 幼教培训课件:《幼儿园教育指导纲要》
- 2024年全国高考物理电学实验真题(附答案)
- 红楼春趣课本剧剧本
- 保育员基本素养知识讲座
- 2024宁波枢智交通科技有限公司招聘笔试参考题库附带答案详解
- 船体结构图课件
- 阿里巴巴《成为教练式销售主管》教材
- 药物指导健康宣教
- 有限元分析基础教学课件
评论
0/150
提交评论