可加危险模型在生存分析中的应用_第1页
可加危险模型在生存分析中的应用_第2页
可加危险模型在生存分析中的应用_第3页
可加危险模型在生存分析中的应用_第4页
可加危险模型在生存分析中的应用_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

可加危险模型在生存分析中的应用

1在文献中的应用最近,有许多关于生存疾病的文章。该模型通常用于模拟生命数据中包含的所谓“长期生存者”的生存数据,并广泛应用于癌症、艾滋病研究、犯罪学、市场学和工程可靠性的研究。鲍尔和肖乔从频率分析的角度详细讨论了这种模型。当需要考虑这种带有共同变量的模型时,kuk和chen在文献中讨论了该模型。S(t)=1-p[1-F0(t)]exp(zTβ).(1.1)这里F0(t)是一个正确的分布函数,z是协变量,β是协变量系数,p是人群中的易感染人群的比例,1-p是治愈比例,T表示向量的转置.Yakovlev等在文献中给出了另一个生存治愈模型,称之为“非混合”治愈模型.其定义如下:S(t)=exp{-θF0(t)}.(1.2)这里θ是待估的参数,F0(t)是一个正常的分布函数.Chen等在文献中指出,在模型(1.1)中,当β=0时,则它和模型(1.2)有明确的数学联系.但当其带有协变量的时候,则各自有不同的生物学的背景.当模型(1.2)带有协变量的时候,变为如下的模型:S(t)=exp{θ[1-F0(t)]exp(zTβ)-θ}.(1.3)Tsodikov在文献中,假设分布函数F0(t)是连续的情形,研究了模型(1.3).Zhao在文献中研究了离散情况下的模型(1.3).我们注意到,模型(1.1)和(1.3)都不具有比例危险率(proportionalhazrads)结构.因此,Maller和Zhou在文献中提出了另一个模型:S(t)=[1-pF0(t)]exp(zTβ).(1.4)我们称之为“不正确”的比例危险率模型,Zhao在文献中从多个方面研究了模型(1.4)的性质.虽然比例危险率(可乘)模型已经被广泛讨论,但最近以来,可加危险模型也引起了广泛重视,Lin和Ying在文献中首次给出了可加模型λ(t)=ˉλ0(t)+zΤβ(1.5)的部分似然估计方法,这里λ(t)是危险率函数,ˉλ0(t)是基础危险率函数.我们这里假定了协变量及其系数与时间t无关,或叫独立于时间t.那么模型(1.5)所对应的生存函数为:s(t)=[1-f0(t)]·exp{-zTβt}.(1.6)读者可参看另外的相关文献,如文献、等.类似地,如果我们同时考虑可加的危险函数和生存治愈模型,上面的模型(1.1)和(1.3)可以推广为:F(t)=pF0(t),λ0(t)=ˉλ0(t)+zΤβt,(1.7)S(t)=exp{-θF0(t)},λ0(t)=ˉλ0(t)0(t)+zΤβt.(1.8)这里,λ0(t)是相应于F0(t)的危险率函数,ˉλ0(t)是未知的基础危险函数,可以完全未知或参数化.模型(1.4)可以推广为:λ(t)=ˉλ0(t)+zΤβ=pf0(t)1-pF0(t)+zΤβ.(1.9)注意到模型(1.9)的基础危险率ˉλ0(t)是“半参数”的,当然我们可以将其参数化,这也是此模型与前两个模型不相同的地方.我们注意到模型(1.7)-(1.9)都是可乘模型的自然延伸,这3个模型目前的文献没有研究过.本文的目的就是希望将可乘危险模型推广到可加危险模型,并且可以容许生存数据中有治愈部分出现.我们再注意到模型(1.9)是模型(1.5)的推广,即在模型(1.6)中允许其基础危险函数1-F0(t)可以“不正确”为1-pF0(t).我们这里重点研究模型(1.9).在第2节,我们研究模型(1.9)的模型识别问题,其参数估计和大样本性质我们放在第3节讨论.第4节我们做了一个小的模拟,总结和讨论放在本文的第5部分.2模型不可识别性的定理Li等在文献中讨论了“不正确”可乘危险模型的识别问题,这里我们可以类似讨论模型(1.9)的识别问题.假设T+(允许T+=∞)是一个充分大的时间,除此之外,我们不再感兴趣.我们假设参数p通过函数p(x)依赖于协变量x,正常的分布函数F0(t)独立于变量x.不妨假设x是一维的变量.假设F0={F0(t,Ψ):Ψ∈ΘΨ}是正常的失效时间分布函数的一个类,令χ是设计空间.为了方便,我们假设χ是闭区间[a0,a1],记易感染人群的比例函数空间为Ρ={p(x)≠0、1,x∈χ}.本节我们假设Ρ是独立于协变量x的常数.定义H1={S(t,p,Ψ)=[1-pF0(t,Ψ)]·exp(-r(x)t),t<T+,x∈χ,p∈(0,1],F0(t,Ψ)∈F0]}(2.1)我们先给出“不正确”AH模型可识别的定义.定义2.1“不正确”AH模型类H1是可识别的,如果对H1中任意两个元素S(t,p)=[1-pF0(t)]·exp(-r(x)t)和SΔ(t,p)=[1-pΔFΔ0(t)]exp(-rΔ(x)t],则S(t,p)≡SΔ(t,p)成立当且仅当p≡pΔ,r(x)≡rΔ(x)和F0(t)≡FΔ0(t)对x∈χ和几乎所有t∈(0,T+]成立.定义2.2“不正确”AH模型类H1是可识别的,如果对H1中任意两个元素,SΔ(t,pΔ,ΨΔ)=[1-pΔF0(t,ΨΔ)]·exp(-rΔ(x)t)和S(t,p,Ψ)=[1-pF0(t,Ψ)]·exp(-r(x)t),则S(t,p,Ψ)≡SΔ(t,pΔ,ΨΔ)成立当且仅当p≡pΔ,r(x)≡rΔ(x)和F0(t,Ψ)≡FΔ0(t,Ψ)对x∈χ和几乎所有t∈(0,T+]成立.下面我们建立“不正确”AH模型的可识别性定理.定理2.1假设x是设计空间χ=[a0,a1]上的连续变量,-∞<a0<a1<∞.那么,模型S(t,p)=[1-pF0(t)]·exp(-r(x)t),t∈T+(2.2)是不可识别的.定理2.2假设x是设计空间χ=[a0,a1]上的连续变量,-∞<a0<a1<∞.那么,模型S(t,p,Ψ)=[1-pF0(t,Ψ)]·exp(-r(x)t),t∈T+(2.3)是可识别的.证明定理2.1,我们需要证明S(t,p)≡SΔ(t,p)成立当且仅当p≡pΔ,r(x)≡rΔ(x)和F0(t)≡FΔ0(t)对几乎所有t∈(0,T+]成立.充分性是显然的,我们只证明必要性.假设S(t,p)≡SΔ(t,p).由(2.2)我们可以看出:r(x)-rΔ(x)=[log(1-pF0(t)-log(1-pΔFΔ0(t))]t.(2.4)注意到(2.4)的左边仅仅依赖于x而右边仅仅依赖于t,所以差必定是不依赖x∈χ和t<T+的常数c,于是我们有:r(x)-rΔ(x)=c,(2.5)1-pΔFΔ0(t)=[1-pF0(t)]·exp(-ct).(2.6)那么对任意的c>0,我们可以找到比例p≠pΔ,和分布函数F0(t)≠FΔ0(t)使得(2.6)对所有t<T+成立,这是基于以下理由:对任意固定的p,c>0和生存函数1-pF0(t),生存函数1-pF0(t)可以被视为两个独立随机变量的生存函数[1-pF0(t)]}和exp(-ct)(指数生存函数)的联合生存函数,因此模型(2.2)是不可识别的.证明定理2.2如果模型不可识别,那么必定存在两个互不相同的函数(pΔ,F0(t,ΨΔ),rΔ(x))和(p,F0(t,Ψ),r(x))使得:r(x)-rΔ(x)=c,(2.7)1-pΔF0(t,ΨΔ)=[1-pF0(t)]·exp(-ct).(2.8)我们容易知道,如果c≠0,则(2.8)不正确.因为此时F0(t,ΨΔ)不再属于F0(t,Ψ)所在的分布函数类.3估计p:0正如文献所做的那样,我们也假设计数过程Ni(t)表示第i个对象的直到时刻t(含t)我们感兴趣的事情发生的次数,则相应的强度函数定义为:Yi(t)Λ(dt,zi)=Yi(t){Λ0(dt)+zΤiβdt}.(3.1)这里,Yi(t)=Ι{Τi∧ci≥t}={1,在t前(含t),第i人仍处于观测中;0‚其它.失效时间T常常被另一个随机时间c右删失,Λ0(t)=∫t0λ0(u)du,λ0(u)定义于(1.9)中.对任意的i和t,计数过程可以被唯一地分解为:Ni(t)=Mi(t)+∫t0Yi(u)Λ(u,zi).(3.2)此处Mi(t)是一个局部鞅(localmartingale).因此,自然地,Λ0(t)的一个估计可以定义为:ˆΛ0(ˆβ,t)=∫t0∑ni=1{dΝi(u)-Yi(u)ˆβ′zidu}∑nj=1Yj(u).(3.3)其中,β^是某个相合估计.我们注意到,由(1.6)和(1.9),参数p的一个估计可以定义为:p^=1-exp{-Λ^0(β^,∞)}.(3.4)模仿Cox的部分似然估计,Lin和Ying在文献中给出了参数β的一个估计为:β^=[∑in∫0∞Yi(t){zi-z¯}×2dt]-1[∑in∫0∞{zi-z¯}dΝi(t)].(3.5)这里a×2=aa′,z¯=∑j=1nYj(t)zj/∑j=1nYj(t).当没有治愈部分出现的时候,即在模型(1.6)的情形下,Lin和Ying在文献中证明了以下事实:(Ⅰ)由(3.5)式定义的β的估计有下列大样本性质:n{β^-βL→Ν(0,σ2)}.这里,σ2可以由它的一个相合估计A-1BA-1代替,其中A=n-1∑i=1n∫0∞Yi{zi(t)-z^}×2dt,B=n-1∑i=1n∫0∞{zi-z^}×2dΝi(t).(Ⅱ)由(3.3)式定义的估计Λ^0(t)满足下列渐近性质:n(Λ^0(t)-Λ0(t))弱收敛到一个零均值Gaussian过程,它的协方差函数的一个相合估计为:∫0sn∑i=1ndΝi(u){∑j=1nYj(u)}2+C′(t)A-1BA-1C(s)-C′(t)A-1D(s)-C′(s)A-1D(t).(3.6)其中C(t)和D(t)定义为:C(t)=∫0tz¯dt,D(t)=∫0t∑i=1n{zi-z¯}dΝi(u)∑i=1nYi(u).由性质(Ⅰ)和(Ⅱ),我们容易得到模型(1.9)中的参数的估计p^(参看(3.4)式)的大样本性质.为了节省篇幅,我们不给出详细的证明过程.由泛函版本的δ-方法,我们容易证明下列性质:定理3.1在某些规则条件下,由(3.4)所定义的估计p^满足下列性质:当n→∞时,p^p→p以及n1/2(p^-p)→dΝ(0,exp(-2Λ0(+∞))∑Λ^0(+∞)-1).这里Λ0(t)=∫0tλ˜0(u)du,λ˜0(u)定义于(1.9)中;∑Λ^0(+∞)是Λ^0(+∞)的渐近方差,其估计由(3.6)式给出.4样本均值和协变量系数我们考虑一个小的模拟来检验我们提出的估计的精度.我们考虑两样本问题.假设我们的失效分布函数是F(t)=pF0(t),这里我们假设F0(t)是均值为1/λ=1/0.0581的指数分布,删失分布我们取为0到100之间的均匀分布,易感染人群的比例我们取为p=0.85,协变量系数β=-0.385.就两样本问题而言,样本一和二的协变量系数分别取为zi=0和zi=1.我们主要考虑样本均值和样本方差和真实值的差异.样本大小我们考虑n=100和n=400,重复1000次.当n=100时,Mean(β^)=-0.364,STD(β^)=0.0156,Mean(p^)=0.8211,STD(p^)=0.0328;当n=400时,Mean(β^)=-0.383,STD(β^)=0.0042;Mean(p^)=0.8503,STD(p^)=0.0065;这里Mean(·)表示样本均值,STD(·)表示样本方差.从我们模拟的结果看,我们提出的估计是真实的参数值的一个合理的估计,并且随着样本容量的增加,估计更靠近真实参数值.5生存治疗性模型的离散化本文首先总结了生存治愈模型中的可乘危险模型,即常见的比例危险模型,然后将这几类可乘危险模型推广到可加危险模型,并重点讨论了模型(1.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论