




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Ainy 晴生存分析知识总结一、生存分析G基本概念生存分析是将事件G结果和出现此结果所经历G时间结合起来分析G统计分析方法。研究生存现象和响应时间数据及其统计规律G一门学科。对一个或多个非负随机变量(生存时间)进行统计分析研究。对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系 及其程度G统计分析方法。在综合考虑相关因素(内因和外因)G基础上,对涉及生物学、医 学(临床、流行病)、工程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、 犯罪、婚姻)、经济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状 态持续)发生G时间(也叫寿命、存活时间或失效时间
2、,统称生存时间)有关G问题提供相关 G统计规律G分析与推断方法G学科。生存时间也叫寿命、存活时间、失效时间等等。比如:医学上包括疾病发生时间、治疗后 疾病复发时间;可靠性工程系为元件或系统失效时间;犯罪学方面是重罪犯人G假释时间;社 会学上指首次婚姻持续时间;人口学上包括母乳喂养新生儿断奶时间;经济学包括经济危机爆 发时间、发行债券G违约时间;保险精算学包括保险人G索赔时间、保险公司某一索赔中所付 保费;汽车工业包括汽车车轮转数;市场学中有报纸和杂志G篇幅和订阅费。这些也可以说明, 生存时间可以不是具体G时间。二、生存分析G历史生存分析方法最早可上溯至十九世纪G死亡寿命表。现代G生存分析则开始
3、于二十世纪三 十年代工业科学中G相关应用。二次世界大战时期,武器装备G可靠性研究,这一研究兴趣延续到战后。此时生存分析都 集中在参数模型。二十世纪六七十年代,医学研究中大量临床试验G出现,要求方法学有新G 突破,导致了生存分析G研究开始转向非参数方法。D.R. Cox在72年提出G比例风险模型为此做出了划时代G贡献。现在,生存分析方法G在医学领域得到了广泛G应用,而通过医学研究要求G不断提高, 这一方法也得到了飞速G发展。三、生存分析G研究目内容和具体方法(一)研究目G主要由以下五个方面.描述生存过程:估计不同时间G总体生存率,计算中位生存期,绘制生存函数曲线。统计方 法包括 Kaplan-M
4、eier ( K-M )法、寿命表法。.比较:比较不同处理组G生存率,如比较不同疗法治疗脑瘤G生存率,以了解哪种治疗方案 较优。统计方法log-rank检验等。.影响因素分析:研究某个或某些因素对生存率或生存时间G影响作用。如为改善脑瘤病人G 预后,应了解影响病人预后G主要因素,包括病人G年龄、性别、病程、肿瘤分期、治疗方案Ainy 晴Ainy 晴.统计方法Cox比例风险回归模型等。.预测:建立 Cox回归预测模型。 (二)主要研究内容描述生存过程研究人群生存状态G规律研究生存率曲线G变动趋势是人寿保险业G基础生存过程影响因素分析及结局预测识别与反应、生存及疾病等相关风险因素预测生存结局在临床
5、中应用G非常广泛(三)主要分析方法.参数法方法:首先要求观察G生存时间t服从某一特定G分布,采用估计分布中参数G方法获得生存率G估计值。生存时间G分布可能为指数分布、Weibull分布、对数正态分布等,这些分布曲线都有相应G生存率函数形式。只需求得相应参数G估计值,即可获得生存率G估计值 和生存曲线。.非参数方法:实际工作中,多数生存时间G分布不符合上述所指G分布,就不宜用参数法进 行分析,应当用非参数法。这类方法G检验假设与以往所学G非参数法一样,假设两组或多组 G总体生存率曲线分布相同,而不论总体G分布形式和参数如何。非参数法是随访资料G常用分析方法。.半参数方法:只规定了影响因素和生存状
6、况间G关系,但是没有对时间(和风险函数)G分 布情况加以限定。这种方法主要用于分析生存率G影响因素,属多因素分析方法,其典型方法 是Cox比例风险模型。生存分析G典型G统计软件主要有SAS、SPSS Stata、Excel、R。四、生存分析数据G数据类型(一)完全数据每个个体确切G生产时间都是知道G。这样G数据称为完全数据。但在实际G生存分析中,数据在很多情况下是很难完全观察到O。(二)删失生存数据一个重要G特点是:在研究结束时,无法获得某些个体确切G生存时间。例如:失去联系(病人搬走,电话号码改变);无法观察到结局(死于其他原因);研究截止,个体仍然存活;获得G数据就是删失数据;对存在删失G
7、个体,只知道删失时间。删失分为右删失、左删失和区间删失.右删失是指,在进行观察或调查时,一个个体G确切生存时间不知道,而只知道其生存 时间大于时间L,则称该个体G生存时间在L上是右删失并称 L为右删失数据。右删失有三种类型(按结束时间差别): I型删失Ainy 晴Ainy 晴对所有个体G观察停止在一个固定G时间,这种删失即为I型删失(或定时删失)。例如:动物研究通常是以有固定数目G动物接受一种或多种处理开始,由于时间和费用G限制,研究者常常不能等到所有动物死亡。一种选择就是在一个固定时间周期内观察,在截止时间之 后仍可能有些动物活着,但不继续观察了。这些动物G生存时间是不知道只知其不小于研 究
8、周期时间。I型删失G删失时间是固定内。II型删失同时对n个个体进行观察,一直到有一固定数目( r n) G个体死亡(失效)为止,这种 删失即为II型删失。II型删失G删失时间是随机内。III型删失所有个体在不同时间进入研究,某些个体在研究结束之前死亡,他们G确切生存时间是知 道其他个体在研究结束之前退出研究而不被跟踪观察或在研究结束时仍然活着。进入研究 G时间可能不同,删失时间也可能不同,这种删失叫做III型删失,又称为随机删失。.左删失研究对象在时刻t开始接受观察,而在此之前我们感兴趣G时间已经发生,这就是左删失。例如:“您初次吸食大麻是在什么时候?”有一种回答:“我吸食过,但我不记得吸食G
9、具体时间了。这些回答G吸食时间数据就是左删失;通过测试确定儿童学会完成特定任务G年龄,有些儿童在进入研究前就已经可以完成某项特定任务,这些儿童G事件发生时间也是左删失;出现左删失同时,也可能出现右删失,称为双删失( Double censoring ) o例如:对吸食大麻G问卷 还有一种回答:“我从来没有吸食过”,这样G数据就是右删失;.区间删失若个体G确切生存时间不知道,只知道其生存时间在两个观察时间L和R之间(LR),则称该个体G生存时间在 L,R上是区间删失内。实际工作中,凡是不能或者不愿作连续监测时 就会遇到这样G区间删失。区间删失分两种:第一类区间删失;第二类区间删失。区间删失,当对
10、个体只进行一次观察,且个体G确切生存时间不知道,只知道其生存时间是否大于观察时间(即 L=0或R=oo),这种删失称为第一类区间删失,也称为现实状况数据当对个体进行两次观察,其观察时间L和R满足0 L R 笛时,这种删失称为第二类区间删失,也称为一般区间删失,如果初始时间(如艾滋病感染时间)和发生时间均为区间删失, 则称生存时间为双重区间删失。(三)截断在研究或者观测中,淘汰了一些对象(样本),使得研究者“意识不到他们G存在”。对截断数据G分析构造似然采用条件分布。截断包括两种:左截断和右截断。.左截断只有个体经历某种初始事件以后才能观察到其生存时间,称为左截断,此时获得G数据称Ainy 晴A
11、iny 晴为左截断数据例如:暴露于某疾病、发生死亡前G中间事件等。退休中心老年居民死亡时间(没到年龄没有进入观测)左截断与左删失G区别:在左截断G研究中,根本没有考虑那些在进入研究之前已经经历 了感兴趣时间G个体,而在左删失G研究中,我们能获得这些个体G部分信息。即有左截断又存在右删失G情况,称为左截断右删失.右截断只有经历了某种终止事件才能观察到生存时间(将要经历该事件G个体不包含在实验样本中),称为右截断,此时获得G数据称为右截断数据。例如:对艾滋病感染和发病时间观测数据,有些个体感染病毒但尚未发病,这样G个体不在样本范围之内截断G数学表示:设 Y是一个非负G表示生存时间G随机变量;T是另
12、外一个表示截断时间G随机变量。在左截断下,只有当 Y2T时,才能观察到T和Y;在左截断下,只有当 丫 T时,才能观察到T和Y;五、生存分析G基本函数和模型(一)生存函数描述生存时间统计特征G基本函数,也叫生存率(Survival Rate)设T表示生存时间,F(t)为T分布函数,生存函数定义为S(t)= P(T t) =1 -F(t), 0 t :二二生存函数是非增函数,满足S(0 ) =lim S(x) =1; S(+二)=lim S(x) =0 x-0 -x 举:当生存时间为连续型随机变量时:S(t); P(T t) =1 -F = f(u)dutf(t) =-S(t)=dS(t)dt(二
13、)危险率函数: 描述观察个体在某时刻存活条件下,在以后G单位时间内死亡G (条件)概率。P(T t h|T -t) ,(t)= lim .Lh)0h当 T连续 Mt) =f (t)/S(t) =-dlnS(t)/dtAiny 晴Ainy 晴当T离散,取值为 ai a2 III,且f (ai) = P(T =a), i =1,2川则a处的危险率为i =P(T |T =f(a)S(ay)S(ay)-S(ai)S(ai)=1-坐Li =1,2,|HSQ)1 1S工“沙“骨)迅(1- i)危险率函数在工程上叫做失效率函数或损坏函数,在生存分析和医学统计中又称为风险率 函数或瞬时死亡率、或死亡强度、或条
14、件死亡率、或年龄死亡率等。(三)累计危险率函数t累积危险率函数:上-(u)du0t当 T 连续 S(t) =expA(t) =expJK(u)du0上(t) = -lnS(t)当T离散时,危险率函数有两种定义形式:A(t)= %和A(t)= ln(1-%)i|ai空旧i如果;的值很小,两种定义形式的值接近(四)平均剩余寿命函数(s -t) f (s)dsr(t) = E(T -t|T t)=S(t)平均剩余寿命函数定义为:r(0)为平均寿命(五)常用G参数模型 生存时间G分布一般不呈正态分布。常用G分布有:指数分布威布尔(Weibull)分布伽玛(Gamma)分布 对数罗吉斯蒂(logisti
15、c)分布对数正态分布六、风险回归模型设(t;x) =lim P(t 0r(t,x)称为相对风险。(t)为基准风险函数。x为协变量Ainy 晴Ainy 晴取 r(t,x)=expZ(t)即得 Cox model(t;x)= o(t)expZ(t)其中:Z(t)=乙(t)|,Zp(t)为协变量x和t的函数0(t)=(t|x) =(0,|l|,0)一:=(fIM;p)为未知的回归参数Relative risk model (Cox model)expZ(t)P为参数部分P =(Pi|,Pp)为未知参数%(t)为非参数部分,未知基准函数因此,相对风险模型为半参数模型在Cox模型下:生存时间的分布函数为
16、S(t;x)=P(T t|x)t=exp-Y0(u)expZ(u) du0密度函数为:f (t;x) = (t;x)F(t;x)比例风险模型当Zt)=Z时,即协变量不依赖时间变化Mt;x) =%(t)expZB止匕时r(t, x) =expZ P为常数。故称为比例风险模型。在风险比例模型下exp(Z:)S(t;x) =S0(t)tS0(t) =exp 1%(u)du为基准生存函数。tt这是因为:A(t;x)= pu;x)du = 1% (u)exp( Z P)du=Ao exp(Z P) 00故:S(t;x); exp-(t;x): exp(- 0(t)exp(Z ) = S0(t)exp(Z)相对风险模型参数估计基本方法:偏似然(partial likelihood )偏似然G定义:Ainy
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年床头末端装置合作协议书
- 四年级信息技术下册 装饰家园1教学实录 龙教版
- memset使用的注意事项
- 第10课《三峡》教学设计 2024-2025学年统编版语文八年级上册
- 水质提升与水生态修复计划
- 品牌社区建设的实践计划
- 幼儿园日常管理的实施细节计划
- 学校开放日活动安排计划
- 幼儿园学期教学目标探索计划
- 八年级物理上册 第二单元 第3节《我们怎样区分声音(续)》教学实录 (新版)粤教沪版
- 任务4 聚酯缩聚生产操作-工艺流程
- 新修订烟草专卖法主要内容
- 车辆维护定期检查
- 不同温度盐度对卤虫
- 急性脑血管病的护理查房
- 脓毒血症指南(医生版)课件
- 资本市场与上市筹划-讲义宋丽梦老师课件
- 实验室6S管理实施方案
- 中国康养产业链图谱研究报告
- 派出所民警接处警工作培训
- 安全生产费用使用台账
评论
0/150
提交评论