(概率论与数理统计专业论文)区间数据形式下线性模型的参数估计.pdf_第1页
(概率论与数理统计专业论文)区间数据形式下线性模型的参数估计.pdf_第2页
(概率论与数理统计专业论文)区间数据形式下线性模型的参数估计.pdf_第3页
(概率论与数理统计专业论文)区间数据形式下线性模型的参数估计.pdf_第4页
(概率论与数理统计专业论文)区间数据形式下线性模型的参数估计.pdf_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 在生存分析问题中,含协变量的回归分析是一个很重要的研究方向,本 论文讨论了在区间数据情形下线性模型的参数估计问题 区别于以往我们常见的右截断等删失数据情况,本文研究的个体的生 存时间或寿命是不可观测的,只是知道其值是否在某个区间内,实际问题中 这种数据形式是经常遇到的,一般来说人们把这种区间形式的数据分为i 型 截断和i i 型截断两类( 文【1 8 】) 已有不少学者纂于i 型区间数据对不同的生 存模型进行了研究,但是这些理论成果大都是把协变量看作可观测的,当协 变量本身处于区问截断时的相关文献并不多见 对形如y = z + e 的线性模型,这里相应变量y 是精确观测的,日是 待估计的向量,误差项服从某种分布族当协变量z 被i 型区间数据截断 时,本文利用自相一致和极大似然思想给出了z 的分布和模型参数的估计 并且证明了估计量的相合性,模拟结果表明了结论是令人满意的 关键词:区间数据自相一致极大似然相合性 a b s 毛r a e 毫 r e 鬈r 黼露o na n a l y 挂弧强哇t hc o 、玛耐粼抟v 淞i a b l ! si 8i m p o r t 艇l ti nm 瓤l ys u r - v i v a la n 越y s i sp r o b l e m s ,i nt h i sp a p e rw e n 8 试e rt h eh l e t h o do fe 8 t i m a t i n g p 缸8 琢旗e 醛f 。r 鑫萎珏e 馘m o d 蘸弼镪主n e 翔蠢c e n s o i 羚g , n o t i c et h ed i 脓e l l c eb e t w e e ni 埔黼lc e n s 蕊粥黼dt h eu 8 u 赫r 主g h te e m s o r i l l g ,w eo n l yk n a ww h e t h e rt h es u r v i v 啦t i m el i e 8i n 8 i d ea ni n 七e r 、憎dr 8 t h e r 强蠲t h e 娩 c tv 越地,t h 泌k i l 癌o f ( 赫& 歉慨扭a 礅h l o no o e 硅r r e n e e 括e l l 越k g e n e r 琏玟w ed i v i d ei n 惋r v a | e e n s o r 磁d 矗t ai n 毫ot 啪t y p e sf l 霹+ m a 鞋y8 矗o k a f sh a e8 t u d i e dt h ed i 糕e r e n ts u r v i v 以m o i i e l sw i t ht 、m eii h e e c e n s o r e d d a 土a ,h o w e v e r m 0 8 to ft h e s er e s e 甜c hr e s u i t 8r e 9 8 r dac o v a r i a n tw i a b l ea 8 o 珏et h a 土c a nb eo 垂瞎e r v 戚e 1 谗e t 甄s oi 糕t e r v 翻一貔n 8 0 r e do b s 疆嘶i o l 塔o f8e o 。 v 甜i a n t 黼靠曲k 甜ei 芏l f i 喇u e 蘸w 每h 拄v e 喊f o 瑚d 擞l yi i t e f 赫h 辩o n 毋p ei i n t e r v a lc e n s o r e dd a t aw h e nc a v 甜i a n t 、,舭i a b l e 8 盯ec e n s o r e db yn o w , i ne 躲p a p e r 珊c o 瓣d e r t h e 黝d e ly = 扫7 z + ,w h e r ew e t a 妇z t o b e l i 狂e 雅每r e 瓤涮抛yw 至毒ht k 毛y 弦 氛舞雠谳e e n s o 娥鑫越8 w eb 露黼爵v e n t h ee x p r e 8 8 i o n s e s t 虹n 舢e sa b o u td i 8 t r i b u t i o no fz 蹴dm o d e l 瑚a e r 8b v u s eo ft h e 蚀o t 王g h to ns e l f _ c o n s i s t e n c y 鞋鼢dm a 船m u m 嚣| 舱l i h o o d o u rr e s e r e h i s 幽。嚣v e np r o o fo fc o n s i s t e n c y 嬲t i m a t e 8 t h er e 8 u l to ft h e8 h n m 戢i o n d e m o n 8 t r a “嚣跳rr 程蛇矗董e h se f f 交t i v e 黩h dr e a s o 鞋a b l e + k e yw o r d s : i n t e r v a lc e i l s o r i n gs e m c o n s i 8 t e n tt h em a 诎牲m m1 i b l i h da 。n s i s t e 珏c y l i 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及取得的 研究成果。据我所知,除文中已经注明引用的内容外,本论文不包含其他 个人已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和 集体,均已在文中作了明确说明并表示谢意。 作者签名:翟逛近 日期:迦6 :q ! 望 学位论文授权使用声明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学校有 权保留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质 版。有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书 馆被查阅。有权将学位论文的内容编入有关数据库进行检索。有权将学位 论文的标题和摘要汇编出版。保密的学位论文在解密后适用本规定。 学位论文作者签名:尹迎浓导师签名_ 3 与幺弘纩 日期:2 舶,o 孓2 l 日期:础6 。f ,参 lg f 寓 华东薅范大学磺士学位论文 l 引言 在生襻分拆闼题巾,露对我们不仪仅要研究生存变量本身的统计特性, 往往遂要对其含舂浚变鬃辩弱薅彩遴行靼羟努辑,郄要在生存变爨泰势 变量岔之黼建立一个回归模型以对参数或分稚进行楣关估计比较重要簸 模型有比例危险率禳蘩,比饲优托横擞及线性醚灯骥溅等在突念数据形式 下,上述模型纛经取褥了比较成熟的理论成果,谣鼠对于右截断( 左截断 或囊鞠黻凝) 静菲完全数据猿援 鏊毫经遗行了丈鬃静研究。不褥子右截繇 等删失数据机制,当生存变量的观测数据为区间形式时,获得的信息量更少, 比较耐富更难以研究i 本论文对线性模型初步探讨了在区间数据形式下的 摸壁参数健诗蠢趣我稻宠对嚣藏数攥这一援念豫一分缮 在寿命或生存时黼阀嚣研究中由予客戏藤因,肖时不能获褥准确盼寿 命数据,耀只戆鲡遒冀蹙蓊位子菜一时闯区间内,这静数据称为耩闯藏断数 据( 简称隧问数据) 以后的讨论我们郡是考虑的如下类型的酝间数据形 式。没室羟变量? 熬分蠢鹾婺为f ( 费,令 甄 燕一梦l 独立嚣溺势霉藏瓠变 量( 可为常数) 序歹硅,共黼分布为g ( “) ,醪是可以被溅测蓟盼,樽令 嘲一r 搿 赠我耵j 可以看到的数搬形式是慨u ) ,丽t 是不能观测的从数据形式上我 们可以磷副区间数据尊通常的右截断数据的不同,在右截断机制中我们可 敬鼹溅到d 及班纽f ,秽) ,舞包含豹痿息显然要比送阍形式的数据丰富。实 际闽题中, 酝 是试验瓣蘩( 或戏测时粼) 簧献分布逶数为f 静蕊俸 中随机抽淑n 个进行观测,于是得剐数据形式 ( 魂,肌) ,i = 1 ,。,挖) 这里 我们锻寇弱独立固努谢,共同豹分礤戆f ;城也是独立弱分布的,g 是共鄹 静努毒,基 霉 毒 琵 怒程互独立鹃这耱数攥形震一簸黎必l 囊区瓣数 据( 玲p ei i n t e r v 站o r e dd a t 8 ) ,在可靠性研究中这种数据逐可表永产 品在试骧时刻失效与磷,l 型区间数据也叫当前状态数据( c u r r e n ts t 矗_ u s ig 言华东师范大学硕士学位论文 区间数据下带协变擞的回归研究具有很强的现实意义,很多学者都 对此避行了理论上豹研究,h u a n g ( 1 9 5 ) 对眈倒优眈模型( p r o p o r t i 傩啦 o d d sm o d e l ) 做了极大似然估计,h u a n g 和w e l l i l e r ( 1 9 9 5 ) 对比例危险率 模型( p r o p o r t i o n a lh a z a r d 8m o d e l ) 作了效的 鑫计,h u 8 n g ( 1 9 9 6 ) 对e o x 模型的极大似然估计做了研究,此外,“g a n g 和z h a n gc u n h u i ( 1 9 9 8 ) 利 用u 统计量对线性模型的系数给出了一个估计 这些理论研究都是褥协变量视为因定的可具体观测懿,两当协变量受 到区间截断时,情况会变得更加复杂本文对这一问题做一初步探讨 绘出一个线性模型y 一岛+ 岛五+ 岛磊+ 苫+ ,其中的分毒 属于某种分布族响应变量y 及协变量( z l ,磊,z ) 中的而,磊是可 以观测的,箍z 不能观测列,虽然z 看不到但是其具鸯数据形式( d ,己,) ,这 里d = 4 t 。阱,为协变蹙z 的截断变量且与z 褶氨独立,我们的问逐就 是如何在已知的观测数据形式( y 1 旎,磊,6 ,u ) 下对模型参数( 包括误 差分存中豹参数) 进行估计。 本文的第= 部分首先讨论了一元线性模型的情形,在对模型给出了相 应假定詹构造了似然函数,推导出丁参数的估计形式,从理论上说明了结论 的合理性,并且给出了具体的算法,第三部分则对多元情形给出了一般结 论,并证明了我们构造的似然函数的似然孵满足相合性最后我们通过模拟 验证了估计量的正确性 2 2 一元线谯模型韵参数翁计华容师范太学硐士学位论文 2 一元线牲搂鍪的参数估喜 在量譬多实际蛔题研究中对每个个体既要研究其嫩存时间t 逐娶考虑该 个嚣掰戆垮凌熬褥经。姹辩裁痊该考虑辍臻交鲞z ,这遥我翻考虑在生存努 祈中占肖蓬要瑰位的蠛性模型 y ;科2 年 这里# 及茗秀p 雏离嚣,箕孛随惑误豢矮静分布为鬻整瓣据数分帮族,参 数未知警响应变量y 截断时已有不少理论成果,对于协变量z 截断的情 形并不多见这照我们考虑当z 处予i 型区间数据情况下的上述模型的参 数售诗。 2 1 横逖的假定积娥然螽数 在绘缒误差为非疆悫分奄时线性横型敬结论魏、我们先考虑如下一元 线程隧辩摸鳘 y = a 十芦z + ( 2 1 ) 其孛y 蔻遴续斡穗建变豢,取接变黧z 舞离散蘩瓣越魏交囊势黧箕支撵 为w = ( l ,地,蚴) 1 ) ,宦的分布未知,记为辫= p p 一屿) ,j l ,2 ,虞,简单起觅,我们先霰定误麓项s 服从正懑分布( o ,萨) ,且与z 相互独立。参数起量口一知,声,口2 ) 是我们德继计豹我们限定z 楚离散酌, 这是鼠方使在理论上捺静参数蓓诗靛角度窭发黯,掇然在实舔翔熬中镶多 例子都熙连续的状态,我们的结论在大多数情况下鼹仍是有效的 摸型( 2 。1 ) 中,y 是精确观测豹,协变量z 的试骏时测为u ,与z 相 互独立,慕密度瀵数苓辩表示秀铲如( 其基繁专否蒡蚕彭穗我髓掇淫簿瓣 题) 我们获得的数据形试为m 正,) ,其中5 = 譬m ,最z 不能蕊察判。 给定g 辩y 的条件密泼表示为,( # 两8 ) 注意到数搬驰截新是蠢傣息的,我 们可以佟下面羽假定: 3 2 2 参数锆诗 华衷师范大学硕士学位论文 ( a 匐尹( z = # | 盈秽) = 尹( z ;2 ) ; ( a b ) ,悖| z = g ,蠡,) = 歹每 g z ) 对上述的数据形式( md ,u ) ,我们着获得饨个相嚣独立并飘阍分布的观 测值鼢一咄,反,龌) ,i l ,2 ,嚣则可以构造如下形式豹群零的联合密 痉 , 一 陲酬如泐鳓 蠡匿尚删刚) 黔r 出i ) l j = lj l j 燃1 其中8 珏= 丑q 雄) ,臻j 耸曩 。 嵩l n 由予漠差与交鬣z 相互独立,w 以翘遴 地驴去 _ 虹蔷雠) 盈注懑到试验嚣聿翔秽秘密度添黢嘛) 与参数# 爱魏臻蠢荚,因藏我 织得到榉本的似然函数与下式戒比铡。 nrd 1 mfd1 l 一氐 | 哟,热| 鞋| ;8 ) 秘| | ,吲弼;慨| = il = i jl j = l 2 2 ) 不妨将上式表示为似然函数k ( p ) 口) 这里p = ( p ,m ) ,功一 p ( z 篇t 略) 2 2 参数估计 上一蓼我翻褥到了参装# 懿毅然蘧数式,按照一嫂瓣寒极大锹然毽圣 。豹 傲法器霈豢对式子f 2 2 ) 关于8 求导帮掰,但蹩就式中斡协变量苫的分布并 不知道,崽接求铎不可能,如果能够获得p 的估计问题就会变褥容易解决 下薤分为掰步来求参数的估计。酋宪黻定参数9 ,荧予p 求似然姻数f 2 2 ) 豹 蘩然解;焚次弱建尹,荧予参数$ 袭簌然添数( 2 。2 ) 瓣蘩然解。襞秘游篓法藏 是反复利用这秘步迭代最终得到极火似然待计详细的算法及收敛的性质 将在后掰捌出 莲 2 。2 参数估计 华东癖范太学矮士学位论文 下越先假定参数8 已知,此肘记z 的分布p 的似然豳数为。,尸即有 k p :f l 陲吖( 柏朋功1 陵刚蜘功r 滓ll j = l l j = ij ( 2 3 ) 对( 2 3 ) 式直接求导将会变得非常困难,特别当协变量z 的支撑w 的维数d 变得很大的时候几乎不可能求出。为避免烦杂的运算我们就利用自相合的 思戆来推导p 一( n ,p d ) 的非参数估计自相台( s e l f _ c o n 8 i s t e n t 或称 自相一致) 一般与e m 算法紧密结合,这一思想首次见于e f r o n ( 1 9 6 7 ) 用 来娃理表绷失数据,羼被似n b u l l ( 1 9 7 4 ) 羽于分组数据,1 9 7 6 笨强r h b u l l 又根据这一算法获得区间数据形式下分布函数的非参数估计下面我们详 细介缨其步骤。 令 岛= “最:蜥) ,i = 1 ,弼j = 1 ,d 在取得样本( 驶,磊,“;) 的条件下其数学期望记为a 玎,则 a 哲= e ( 岛 执,蠡,) 一p ( 磊= l 挑,文,t “) f 。罐,( 弘l 链。;8 ) 转1 ,( 啦 吣;p ) 岛r 咄 一 ljlj 墨。 ,( 玑i q ;日场r 【,( 瓠i 哟;口) 功 卜“ ( 2 4 ) 如果我们把( 2 4 ) 式不蹙看作期勰的频率而是可以观察到的话,就可以 得到协变量z 取值为嘶的比例为 譬粤垒 ( 2 5 ) n 。 于是当参数口固定时我们 寻到关于z 的分布p 的自相合方程为 辫= ( p j 目) ,j = 1 ,d( 2 6 ) 还注意到蜀:岛) 是存在的,由条件期望的性质知邀 e ( q ( p 口) ) = 辫 5 2 2 参数估计 华东师范大学硕士学位论文 由于在实际问题中上式中的参数日并不知道,因此自相合方程( 2 6 ) 不 能直接用来估计分布p 方程中的口用其给定的一个估计来代替后我们 有估计式 b = ( p 1 ,p d ;口) ,j = 1 ,d 记= ( 7 r ,“) ,则白相合方程( 2 6 ) 我们可以用向量的形式来表示, 即 尸= ( p ) p )( 2 ,7 ) 又知道名1 考l ,则欧氏空间e 4 中的子集 畦恤砌隆,) 为d 维单位球体,由b r o u w e r 不动点定理知( 2 7 ) 式是收敛的 初值后得到迭代公式 p + 1 = ( p ,8 ) ,= o ,1 , 于是置p 的 ( 2 8 ) 另外,给定参数目时,由上述自相合方程得到的户是不是极大似然估 计,根据【9 】中的( 3 1 1 ) ,我们有下面这个定理: 定理2 1自相合方程( 2 7 ) 的解p 是m l e 的一个充要条件是对每一 个j 有 由( p ) = 0 或者当功= o 时,由( p ) 0 这里d j ( 尸) = 毒l ( 南,褚,南) 。:。,其中口为一小的正量, f ( p ) = 1 0 9 l 。,p 定理的证明我们在后面2 4 节给出 上面我们讨论了协变量z 的概率分布估计,下面我们再来考虑给定p 时的模型( 2 1 ) 的参数目的估计,首先给出其似然函数记为l 。,口即有 隆地功瞧删一r 6 。:l = 口n l 2 。2 参数佑诗 华系郯范大学硕士学位论文 其孛 舷陬螗志唧 一掣) 函数,关于参数口求导得 整。鍪二竺二丝, a a口z 。 堑。亟二! = 垒1 2 笪f d 口 。 筹一f 一刍+ 掣 , 舀口2 | 2 盯22 萨4 | 。 对每一个i ,又注意剃下式戒立 一魂 薹菱:笔擞+ e ,一魂, 茎嚣:;徽。砘芝i 瓦甄丽卜氆薏5 磊瓦蕊面 记副一a l o g “m 予慰对数似然满数关于口求导,得 。2 = 毋 坤删薯磬 忑 卜 一溉蛆泐渤一讯竺型:墓 一吖0 译一臃野一 渤一蛾 畸一 型枷 ;o拇一 。:瑟 一 撼 _ 。m 2 2 参数估计 华东师范大学硕士学位论文 = 喜 字一箬卜甓慧 ,。名1 岛,( 玑i 屿;口) 巧 1 “1 。锃粉踹鬻j l = 1 m r j 、w l k ”,k ij = 击喜p 旷倒弛m ) 对数似然函数关于卢求导,得 州叫型蔷恭警 2 喜 字 瓯瓷豢 州叫瓷慧l 一外甓裟 州卅甓糍 ) = 击喜k 郴( 弛舢m 嘲m ,曲 杀:妻l # 1 l ;= , 嘉+ 丝鼍紊猷1 。玎,( 鼽i 屿;口) 功驴十i 孑广一o 玎八鼽i 屿;f j 功 :;1n l 七,i k ;口) m 8 豢 2 2 参数估计华东师范大学硕士学位论文 叫啦嘉筹 一喜 刍+ 刍 画受堑轰兰等苗警 罅吲蜜鬟意挚】 一扑去+ 譬掣b 瓷慧 坤删甓糕l 。p 2ls 警l 嵋甜,( 轨l 哆;口) 璐 2 “i 。i 瓯,( 翻馘;# 溶 ”删窀躲 ) 一豁刍+ 学一掣即懈目 + 磊酮蜘,蝴】 ( 蚺一a ) = 卢居( z 魂,峨) 烹l 黜l ( 虢一a ) 蟊 z | 就,蘸,) = 芦e ( z 2 i 执,也,撕) 1搿l 礼盯2 = ( 鼽一毡) 2 一矿e ( z 2 l 俄,最,啦) = l= l 9 2 2 察敷估计华东师范犬学硕士学位论文 国以上三式玎褥参数# 的m l e 为 蠹:基羔! 望里l 墨i 熬! 墨:竺2 :i 美釜! 墨! 墨l 堡:苎! 竺! 1 :l 嚣z 2 l 辩,茂,连) 一熹l 西( 善l 錾,轰,魄) 尸 矗= 雪一p 岔 ( 2 ( 2 1 0 ) n 一2 一芝二( 雏一a ) 2 一西2 e ( z 2 l 弧,文,啦) ( 2 1 1 ) 式中= 去羔1 虢,茗= 嘉羔i 嚣( 司臻,蠡铷) , 从前两个式子可以看到模型搽数a ,口的估计表达式和般意义上的最 小:= 藤法估计在澎式上楚一样鲍,如果把协变慧熬鼹测镶用戳凝数据下蛉 条襄二瓣鎏取代爱簸是我髓这里 譬戮酶嵇诗表选式f 2 9 ) 秘f 2 1 0 ) ,受z 瘫祓蕊 察时,上两式就是通常的回归系数储计量 间样虽然我们褥赛了参数的似然估计,憾怒上述三个储计式中含有来 鬟瓣豹爨,我们把f 2 9 ) 一( 2 。l l 记是趣嚣熬表达形式 8 一a ,p ) 向爨形式中戆p 我们事先假设穗绘定,实黼当中是米躲的,如果餍其一个 焦诗庐塞最替,蠖可敬褥懿模整( 2 1 ) 串参数# 赞镳诗= 盖泡翅,这羹我 们戳定模型( 2 ,1 ) 的参数取有界德,i 司样根据b 黼u w e r 不动点定理可知上式 是教皴的。且其粲露选代形式 萨+ 1 = ( 铲,固、= 0 ,l ,( 2 i 2 ) 猩得到协变嚣的分布p 和参数目的估计搿忒后我们可以通过如下步骤 获褥 娃然函数& 如鲶极大仪然解, i 蔓耪簋g 。套: 2 。啦( 2 8 ) 蟹p 。+ 1 = ( p 。,8 。) ,女一o ,l ,瘩张,j = 1 ,2 ,d 收敛盼 停止运算,记估计值为p 1 ; 3 。剃定定理2 i 姆条箨,若不满足转l 1 0 2 3 膳机误差为非正态时的情形 华东师范大学硕士学位论文 4 由( 2 1 2 ) 得日+ 1 = a ( 驴,尸1 ) ,女= o ,1 ,当日收敛时停止运算,记估 计值为口1 : 5 置换2 中的泸为口1 ,执行2 4 ,获得( p 2 ,目2 ) ; 6 重复上述过程直至达到指定精度,获得估计值( p f ,) ,f = 1 ,2 + 关于初值的选取: 在未知参数很多的时候,如果初值选择恰当的话就能够加快迭代公式 的收敛速度,从而提高程序运行的效率对于协变量z 的分布p 可以置初值 p o = ( 1 d ,1 d ) ,而对于模型参数目,要估计其初值,只要对z 的条件 期望给出一个初始值,即对每一个个体i 估计e 旧l 玑,也,u 。) ,再由式( 2 9 ) 一 ( 21 1 ) 便可得到一个初值目o 对z 的截断变量【,的观测值“。我们对其排 序且记为“( 1 ) “( 2 ) “( 。) ,相应的示性函数记为j ( 1 ) 、6 ( 1 ) ,d ( 。) , z 的支撑由小到大排列后不妨仍记为( w 。”d ) 由于i 型区间数据提 供的信息量很少我们一般不选取u f l ) 不小于w d 及“不大于”1 的观测 时刻序列于是对于j = 1 ,2 ,n ,若西f ) = 1 ,我们可以取期望估计为 ( l + “( ,) ) 2 ;若6 ( j ) = o ,我们可以取期望估计为( ,+ d ) 2 ,这里 白= m i n m ) w m “0 ) m = l d 2 3 随机误差为非正态时的情形 从上一小节讨论的线性回归模型的参数估计过程来看,我们得到的结 论并不局限于误差服从均值为零的正态分布这一情形,而且在实际问题当 中也存在线性模型的误差为非正态的情况下面我们就以常用的指数型分 布族为例来考虑模型的参数估计这相当于对上一小节的结论作了推广 模型仍记为如下形式 y = n + 口z + e ( 2 1 3 ) 2 3 随机误差为非正态时的情形 华东师范大学硕士学位论文 其中误差项e 的分布函数是按标准定义的指数族,密度函数的定义如下: 州_ c ( 小冲 车“7 ) 球) 沁) e 式中的叫为未知的参数( 或者参数向量) ,于是我们要估计的模 型( 2 1 3 ) 的参数为口= ( q ,p ,1 ) ,其他的有关记号和假定均同于2 1 节 注意到c 为常数时随机变量y = + c 具有密度函数n ( 一c ) ,于是模 型f 2 1 3 】中响应变量y 的条件密度为 ,( 玑l 屿;p ) 2c ( 7 ) “p 莓c t ( 1 ) 疋一n 一舰) ) ( 玑一n 一卢屿) 在给定参数日时的协变量z 的分布p 我们按照2 2 节的推导容易知道 其自相合方程仍具有( 27 ) 的形式,具体的过程不再叙述下面我们对参数日 在给定协变量z 的分布情况下求其似然解这里记似然函数为l ,在上 面给出的响应变量条件密度函数,( 玑i 屿:目) 下,易知 l 。,。= 垂 妾a 。,c 玑u 。;一,功 “ 骞届。,c 玑i “。;a ,功 1 一“ t = 1l j = lj l j = l j 对上式取对数后关于日求其极大值后,参数( n ,卢,1 ) 的似然解满足下列 e ( 鬻卜地) + 喜e ( p 诽圳m ,“t ) = 。 e ( z 器卜m ) + 砉e ( z p 悱圳= 。 目( p 酬m ) 一n 等 ( 2 1 4 ) 这样通过方程组( 2 1 4 ) 可以获得误差服从指数族时的模型参数估计 式很多情形下解方程组可得到形如( 2 1 2 ) 的简单迭代形式,如果通过方程 1 2 。d。:l 2 i 4 相关定理和结论的证明华东师范大学硕士学位论文 以成1 _ 0 令= 籍,蚴= 薷,n 萨酱,i = l ,2 ,3 矩阵 j = 畦翔 p m = 泸一j 。1 f 1 = o ,l , 这里口= ( n ,卢,7 ) 7 ,f = ( r ,f 2 ,r ) 7 这样我们就可以按照上一节给出的算法来求得模型f 2 1 3 ) 的参数估计 方程组f 21 4 ) 的具体推导过程我们在下一节24 详细论述 2 4 相关定理和结论的证明 f 1 ) 首先我们给出定理2 1 的证明 令 毋= 絮 鲰= 羔,“j - 1 d 1 3 2 。4 树潜定理穰纺埝肿话甥华东师范大学礤士学位论文 霹 8 f 终 您+ 霉斑、 鬲3 两5i 而南百两, :旦塑;毒曼垫“。毒旦堕 耘魏魏勘18 辩劫 :旦l 一缝,曼 毋辨( 1 + 户 台( 1 + ) 2 a 瓤 :旦土一盈墨 锄l + 霉急l + 霉瓠 所以可得 毒瀚2 蓦砉魏差 叉蝴遴辩数镁然蕊羧 f ( p ) 一l 最l 。g 蚴,码;粉+ ( 1 一画) l o g ,( 挑旧功i 记 。蝴,f 铙f t ;鳓 2 露i 而丽砺 魄妻篙黥砖k 啦,葚 于是有 吗t 刃一耋转十e ,酗嘞卜塞 瓢喜p * t ,一蕊,双* 玲 * 喜 蠡a 埘+ c t 南,岛j 一喜 塞p t 最a 船+ e t 一文,撬* 】 一事南+ 疆一鑫; 一| 鑫a t 热l 一妫葛避蕊| n镕l# “:l 。ll 持1 一ij w i 蠡如+ ( 1 魂) & 卜扎 2 。4 相关定理和结论的证明 华东师范大学硕士学位论文 即有 n 州沪吕陋+ ( 1 删嘞 又注意到对每一个下式均成立 函i ”+ ( 1 一文) 甄j i p ”= a ,j 于是我们得到 ( + 掣) 刮删 结合自相合方程( 2 6 ) 可得 ( 2 ) 方程组( 2 1 4 ) 的推导过程 取参数目的对数似然函数 2 ( 口) = f 文l 。g a “,( 玑f ;目) 珊+ ( 1 一文) l 。g 尚,( 虮i 蚴;目) 功l 这罩 地旧驴晰,唧 莩嘶烈姚一删,卜一n 一酬lkj 则条件密度函数,( f - ) 关于参数日求导得 挑( 机一n d o a ( 玑一o a 口 卢q ) 卢屿) 翌圣垫二竺二垒兰2 挣n = 一 ( 。) = 一屿 他1 ) = 一( 日) 型与笋型:一屿礁) 0 8 “| 1k v lj 同时易知下式 也毛坐塑里丝唑+ ( 1 一也) 圣圣! 竺鱼! 堕l 丝! ! 堕 := ln 诣,( 挑i k ;目) p b 、 ! = 1 岛k ,( 矾i 叫k ;p ) m = 妾嘶者然洌蒜蒜 2 4 褶灏窟理和黠糟舯话孵 华东师范大学硕士学位论文 霹毒一个黎或立, 下瓣鼗稻结台上斌辩辩鼗骰然蕊数( 棼蓉予参数# 求导,为公式蔷霉 方便起风,首先给出公式推导过程中用到的几个记号 令 砻一啦,虢1 1 略:# 掉i 一鼬,l q ;口) 辫 秘一瓣 莩嘶磁蕊一寇一熬秘。瓣 莩蛹矿扣熬 & i 一c * ( 7 ) ( ( 执一目一芦“o ) ) 暴玲一乏二繇7 ) ( 毪f 撬一馥一声毽磅 s 蜘一c 砜泓一位一p 嘞) 蕊建辩琏采零霹褥 罴一卧墅坐畿掣 “,墅坐誉学 娄 函丛燮鲨 雄“,盥糕塑 j 8 2 4 相关定理和结论的证明 华东师范大学硕士学位论文 别 - - 一 a 口 斟 瓯邀挚州 锱陋“。) + 喜e ( f ( 目) 关于卢求导得 刚遂挲 ( 7 ) ( 嘲k 坑,地) k 墨。a 缸c ( ,y ) 叼( 一嘶( 矗) ) + ( 岛) 昂。 p j :,让 ”刊墅坐笔掣) = 喜 坑生挚 民,盐擎 州叫紫 ) 1 7 紫眷 , e 。“ , 、 。 一 鍪厂 一幻一 婺 l 一甚 。兰 一 “ 。 紫 一 _ 2 4 槽关定理和结论的证明华东师范大学硕士学位论文 z 鬻恤“t ) + 喜目( f ( 目) 关于,y 求导得 z 莓嘶) 球牡咖。) e 考= 卦堕巡篷警盟垫 州圳坠坐蹩警 :抖型跫箬兰 州吲鲻挚l = 喜 辫+ 卜紫州叫紫 ) = 喜 鬻+ e ( 莩嘶脯忙,) 分别令貉,黠,貉为零,由以上三个求导式的结果就可得到方程 窖日r 9 1 吐、 1 8 ,一 日 。 3 多元线性模型和似然解的相台性华东师范大学硕士学位论文 3 多元线性模型和似然解的相合性 这一节我们在多元线性模型情形下对协变量含有区间截断形式的情况 给出了般的参数估计表达式,并且讨论了一般情况下当模型的误差服从 常见的指数分布族时模型参数的相合性 3 1 参数估计 在第二节中我们考虑了含有一个协变量的线性模型的情况,下面就来 探讨当模型含有多个协变量时如何估计参数,首先我们给出以下模型 y = 肺+ 卢1 2 1 + + + 岛,+ p z + e( 3 1 ) 模型( 3 1 ) 中,z 1 ,乙;p 1 是可以观测到具体值的p 个协变量, 而z 是被区问截断的协变量,我们只能看到其具有数据形式f 以j ) ,这 里6 = z c u ,其中u 和z 足相互独立的随机变量仍假定z 的支 撑为w = ( 1 w 2 ,w d ) d 1 ,其分布未知与( z l ,磊,z ) 相 互独立并且服从正态分布( 0 ,口2 ) ,则我们要估计的参数为向量日= ( 岛,胁,岛,p ,a 2 ) 对n 个个体进行观测后于是我们获得数据形式即样 本,五,。,啦,魂) ,i = 1 ,n ,同样在和一元模型有相同假定的情况 下我们可以得到似然函数 nrd 以rd 1 d t k ( p 目) 一f ,( 肌 z ,q i 口) 鳓ff ,慨k ,i 目) n l 仁ll j = 1 j l j = 1 j 其中o “= , q ! 。, ,= l o ”;p 一( p h p d ) ,功= 尸( z = 屿) ,响应 变量y 的条件密度函数为 m 扯;驴击唧 一 这里 坐二鱼二望! 兰l 二:二垫= 丝1 2 盯2 z - = ( 盈1 ,盈p ) ,i = l ,礼 1 9 3 1 参数估计 华东师范大学硕士学位论文 对协变量z 的分布p ,由第二节中的相关叙述可知,我们可以按照相 同的方法来构造p 的自相合方程,不难知道将( 2 4 ) 中的条件密度函数换为 这里的,( 玑iz i 屿;目) 便可以得到形如( 2 6 ) 的表达式 当给定j d 时对似然函数l 。( p j 日) 取对数,然后关于参数p 求导我们可 以得到未知的向量( 岛,岛,卢,口2 ) 满足下面这个方程组 p 。妻e ( z 。砒) 3 2 其中g = ( 1 ,抛,) 7 ,z 7 为矩阵的z 的转置矩阵,这里矩阵 向量 z 。1 pe ( z i 可1 ,z 1 占1 ,“1 ) 。2 p e ( z i 可2 ,z 2 ,如,“2 ) 1 1 锄e ( z l ,z 。,k ,u 佗) n ( p 2 一( 叭棚,压季面蕊) e 。= ( 叭o ,压j 莎丽) 这里向量e l 和向量e 2 均为p + 2 维,以及由模型系数组成的向量b = ( 岛口,岛,卢) 方程组( 3 2 ) 的推导过程和一元的情形是类似的,按照21 节中式( 2 9 ) ( 2 1 1 ) 的计算方法我们便可得到相应结论,具体过程由于计算繁琐我 们不再详细叙述这里只是写出似然函数k ( p 1 口) 取对数后关于参数 、 0 风 ,m r 阮 咖 一 十0 陬。m | i | | 劲 舻 ,i,、l 施 现 1 1 3 i 2 似然解的相合性华东师范大学硕士学位论文 ( 岛,卢 引 a 风 引 a p 】 ,岛,卢,口2 ) 求导后的结果 刍喜 ( 玑一风一喜玩z m ) 一卢ec z i 玑,瓦,也, 击卦,( 玑一喜) 氓- 一,砘叫 最= 刍喜一熹哦蒯蚶如,岫 品= 击喜k 岛一砉) ,珈卜础,咖。) 旦:一土+ 堕二鱼二i = ! 垒垫 a 口2 l 2 口2 2 口4 一旦垒生二堑二j ;圳e ( z i 轨,:;,也,吨) + 等即2 觚) | 分别令以上各式为零即可得方程组( 3 2 ) ,获得观测数据后参数的估计 步骤和一元时给出的算法相同,但是如果模型的维数很大的话计算会变得 相当复杂 当模型的误差服从更一般的指数分布族时,同样我们可以根据第2 3 节 的做法得卅柏廊的结论且体的讨棵从田箨 3 2 似然解的相合性 到此为止我们通过以上讨论知道了多元线性模型在误差服从已知的分 布族类型情况下模型参数和区间截断协变量的分布的估计( 对于一元模型 有更具体的估计形式) ,下面就来说明我们得到的估计量还具有相合性 2 1 3 ;2 娃然躲的糍合谴华东师范大学硕士学位论文 这爨我靛记毅然骚数为 l 。c 只= 垂 委n 酊,c 玑lz 。,u 。;一,鳓 妻岛,c 凯fz 。呐;一,秘 1 。是 k ( 只= i ,( 玑lz 。,u 。;p ) p if 岛,( 蚓z 。呐;o ) 秘f t = 1l j = l jl j = 1j f 3 0 ) 其中 触汹鸺一。唧 莩嘣歌( 骗一岛一喜巍忍n 一芦嘶) )、 、 = 1 7o 矗( 虢一岛一砉编酗) 矗虢一岛一芝:斑盏a 癣咯; 、 h 斟1 7 假墩上式中的参数的维数是m ,函数c 及其诸龇的定义域均为区问 f o ,。) ,通蘩弼霸与参数7 无关势。趣褒夯袋蕊豹莓溺丞数。参囊淘星 8 = ( 岛,扇,岛,y ) 0 良及p = ( 孤,鳓) ,这里我稍藏参数空阀 ( 维数为p + m + 2 ) 年珏掣看侉欧鼹空洞中的子浆 记榉本的数据形式为勰= ( 挑,z 。,文,u 。) ,方便越见,去掉f 标届,我们用 添数譬凌示。秘密瘦,袭迭式蛰下 d符 g ( 8 ,p ;) = 6 哟,( g | z ,哟;口) 秘+ ( 1 一j ) 芝:传,( z ,“o ;目) 功 = l,赫l 奁谖骥酝然瓣数p 3 ) 黪钕熬癣蔡骞裙合整之敷凌键先嫠、f 瑟凡拿缓 定: a 1 有限维参数空间o 怒i 妒+ m + 2 中的有界子集: a 2 邋鼗多 # ,尹;) 楚可承爱赘。帮薅任意限固滔,蜀) ,有 。 9 p ;z ) 9 ( 岛,娲;。) ) 不足零潮集; a 3 拇缀量( z l ,如,z ) 具有有爨燮撵; a 4 ( 1 够,四跫禳攀宝闽,概率灏发p 与模鳖翡参数茏关 a 5 似然方程缰a l o g 毛溯= 0 ,各l 蜷0 j ) = o 存在唯一解 3 ,2 议然解的楣台牲华农j ;i ;范大学碳士学位论文 即有 我翻蠢下嚣瓣定理 定礁3 i 灌是上述缓霆蓊蔫提下,簌爨醺羧豁。3 ) 瓣敷然簿翼宵稳台犍, 如一如8 s &_岛a s 该寇邂的证明方法主豁参考自j i 龇h u a n g ( 1 9 9 6 ) 谯文献f 2 j 中懋蠼3 1 2 l 猕 程臻,邀一涯爨爨恕最霹篷鑫v a n 鑫e rv a 与w e l b e r f l 9 轻) 矮索潦爨淫台 穰型串秘混合分奄n p 醚l 嚣( 1 参撩失强然穗浮 鹣稳合茬 为谢明方便超见我们先对参数徽间0 和p d 的性质作适当的限制条件 出于8 秘测均为鸯嚣予嶷,困北硪令它 3 暴警通辩的欧氏辐羚,这样乘积 窒趣 藏建交了一个豢霉 螽羚,避一步,对予序裂f 露,只转产在菠 们定义的瓣积拓脊下还满足( 靠,只) 一溉功警,嚣暇尚靠一8 及磊一p 。 定理的证明:由偎淀a l 知参数燮问 跫欧氐空黼中的有辨予粲,因此 慧毙我戮个蔡予集镑tc 妒十2 ,健褥ec 秽不失一般我,以下躬证 硬遘蠢蔑瓤藏蕤参鼗察簿e 我替秽疆鬟冀凳个紧予集,嚣襻鹃蒋予磐 我们也搬熊视为一个紧的子集 设( & ,岛) 为参数窦值,弘,瑚) 暾示基予真值的 熨4 度,而嚣淡示关于概 率灏囊觏e 。- 蛳,求耪鋈。予建垂程定纛2 ,对予黎积空潮8 孛镪慧不等予 真蓬( ,岛) 酶点f 8 ,p ) ,结合l 。g 嚣鼗豹瞪瞧及j 辅张不等式袋稻可褥 嚣 l o g - + 娃( 黯翳一x ) ) 魄卜( 嚣舞器一,) 】 =0 这至0 馥 l 蹩一令辩鼗; 记为纸鞠酌歼球邻域,我稍港义 口( 茹;a r ) =8 u pg ( 矿,p + ;带) ( 3 ,4 ) 持,) 2 3 3 2 似然解的相合性 华东师范大学硕士学位论文 令e 为任意小的正数来表示的半径,记p = ( 口,p ) ,对于中的点 p 7 = ( 口7 ,p 7 ) ,有p 垆,p 7 ) 0 使得下式成立 e - 。s - + n ( i 揣一- ) 吼 0 我们定义协变量z 的取值为 ,7f z ,】+ 1 ,z , l o 扣1l o , z ,21 0 这里 z 表示不大于z 的最大整数于是给定e x p ( 1 8 ) 的n 个观测 值就产生n 个相应的截断协变量z 的真值z 的值取定后,响应变量y 的观测值由式l ,= n + p z + ,e 一( 0 ,口2 ) 取得我们假定试验时刻 为( 1 2 ,l o ,由于截断变量与协变量z 是相互独立的,则观测值 地,i = l ,2 ,n 在 l ,2 ,1 0 ) 中随机取得,示性函数的值文根据真值 五和观测时刻“。即知 我们分别对当口= l 和口= 05 这两种情况下模型的系数取了三组不同 值进行模拟,模拟结果中所列出的每组参数估计值均是我们模拟了1 0 0 次后 得到的均值,为便于比较同时给出了相应的均方误差( m s e ) 首先我们对样本量为2 0 0 时的模拟结果列于表1 再取样本量为5 0 0 ,模 拟的情况列于表2 ( 表1 ,表2 附后) 模拟的程序在m a t h e m a t i c a 中实现 4 模拟华东师范大学硕士学位论文 表1 ( a ) 样本量n = 2 0 0 参数取值参数估计值及m s e ( n ,卢) ( m s e )西( m s e )占2 ( m s e ) 矿= 1 ( 1 ,2 ) 1 0 0 9 9 l1 9 9 9 6 l09 6 7 6 9 4 ( 0 0 3 7 7 6 8 8 )( o o 0 0 5 0 3 3 8 8 )( o 0 2 4 4 7 7 4 ) ( 3 ,5 ) 3 0 0 7 5 35o 0 0 4 209 9 7 5 0 6 ( 0 0 2 8 0 6 3 8 )( o 0 0 0 5 3 0 8 3 9 )( o 0 1 2 6 8 2 4 ) ( 2 5 ,1 5 ) 2 4 7 3 9 2 l5 0 3 0 7 0 9 7 1 5 0 2 ( o 0 4 3 6 6 1 1 )( o 0 0 0 6 2 3 8 9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论