(概率论与数理统计专业论文)纵向数据模型方差分量的估计和检验.pdf_第1页
(概率论与数理统计专业论文)纵向数据模型方差分量的估计和检验.pdf_第2页
(概率论与数理统计专业论文)纵向数据模型方差分量的估计和检验.pdf_第3页
(概率论与数理统计专业论文)纵向数据模型方差分量的估计和检验.pdf_第4页
(概率论与数理统计专业论文)纵向数据模型方差分量的估计和检验.pdf_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 纵向数据是指对同一个个体按时问先后进行多次观测所得到的数据,是 目前统计研究的个热点问题本文主要研究纵向致据线性混合模型的参数 估计及检验问题 对含两个方差分量的一般线性混合模型。我们给出其方差分量的改进估 计,主要对组合谱分解估计进行改进在正态假设下,得到了一个不变佑计 类,证明了在均方误差意义下,在该估计类中不存在一致最优估计,但在个 重要子估计类中。我到了一致最优估计,并用截断方法得到了优于谱分解估计 正部的正估计 本文还重点研究了禽三个方差分羞的套误差分量平衡模型,我们利用b a l - t a x i 提出的方差分析型估计- w h 估计,w k 估计,s a 估计的方法,得到套 误差分量平衡模型中对应估计,并且对其改进,特别对随机效应和随机误差方 差分量的w k 估计,证明了在均方误差意义下,我们得到的改进估计一致优 于按b a l t a g i 方法导出的估计 本文的最后部分,我们利用广义p 一值检验方法给出了含两个方差分量 的线性混合模型中一种新的方差分量的检验方法,对单个随机效应和两个模 型随机效应方差分量间的比较分别做出了检验。这些检验都是精确检验,且计 算简单、便于使用 关键词,纵向数据 线性混合模型组合谱分解估计方差分 北京工业大学理学硕士学位论文 析型估计非负估计 广义p 一值 a b s t r a c t a b s t r a c t l o n g i t u d i u a ld a t ai sr e f e r r e dt od g h i nw h i c ht h es a m ei n d i v i d u a li sl e a - s u r e dr e p e a t x x l l yt h r o u g ht i m e m a n yo fs t a t i s t i c i a n sh a v eb e e n 缸【t l 哪t e di n l o n g i t u d i n a ld a t aa tp r e s e n t i nt h i sp a p e r w em a i n l ys t u d yt h ee s t i m a t o r sa n d t e s t so fv a r i a n c ec o m p o n e n t si nl i n e a rm i x e dm o d e lf o rl o n g i t u d i n a ld a t a f o rt h eg e n e r a ll i n e a rm i x e dm o d e lw i t ht w ov a r i a n c ec o m p o n e n t s t h e i m p r o v e dc o m b i n a t o r ys p e c t r a ld e c o m p o s i t i o ne s t i m a t o r so fv a r i a l l c ec o m p o - n e n t sa r eg i v e n u n d e rt h en o r m a la s s u m p t i o n s ,w es t u d yac l a s so fi n v a r i a n t e s t i m a t o r s i ti sp r o v e dt h a tt h e r ei sn ob e s te s t i m a t o ri nt h ec l a s su n d e rm e a n - s q u a r e d - e r r o rc r i t e r i o n i na ni m p o r t a n ts u b c l a s s ,h o w e v e r ,t h eb e s te s t h n a t o r i so b t a i n e d a tt h es a m et i m e w es u g g e s tt h en o n n e g a t i v ee s t i m a t o rw h i c hi s b e t t e rt h a nc o m b i n a t o r ys p e c t r a ld e c o m p o s i t i o ne s t i m a t o r f u t h e r m o r e ,t h i st h e s i ss t u d i e sn e s t e de r r o rc o m p o n e n tb a l a n c e dm o d e l w i t ht h r e ev a l * “m l e ec o m p o n e n t s a st h em e t h o d sb 如a g iu s e dt og i v et h e a n a l y s i so fv a r i a n c e ( a n o v a ) 一t y p ee s t i m a t o r s - w he s t i m a t o r s ,w ke s t i m a - t o m ,s ae s t h n a t o r s ,w eg e tt h ec o r r e s p o n d i n ge s t h n a t o r si nn e s t e de r r o rb a l - a n c e dm o d e l w h a t sm o 他,w ep r o v i d et h ei m p r o v e de s t h n a t o r s ,e s p e c i a l l ya l l n - i n g a t t h e w ke s t i m a t o r s o f v a r i a n c e c o m p o n e n t s o f r a n d o m e 8 e c t a n dr a n d o m e r r o rr e s p e c t i v e l y , i ti sp r o v e dt h a tt h ei m p r o v e de s t i m a t o r sw - eo b t a i na r eb e t t e r u n d e rm e a n - s q u a r e d - e r r o rc r i t e r i o n , 北京工业大学理学硬士学位论文 i nt h el a s tp a r to ft h i sp a p e r ,ap r o c e d u r ef o rt e s t i n gy a l i a l l c ec o m p o n e n t s i nl i n e a rm i x e d m o d e lw i t ht w ov a r i a n c ec o m p o n e n t si sd e v e l o p e d t h et e s t i n g i sp e r f o r m e do nt h eb a s i so fag e n e r a l i z e dp - v a l u e w eh a v ef i r s td e v e l o p e d 僦8f o ras i n g l er a n d o me f f e c tu s i n gt h ei d e a so fg e n e r a l i z e dp - v a l u ea n dg e n - e r a l i z e dc o n f i d e n c ei n t e r v a l s w eh a v ea l s od e v e l o p e ds i m i l a rp r o c e d u r e sf o r o b t a i n i n gt h et e s tf o rc o m p a r i s o no fr a n d o me f f e c t si nt w om o d e l s t h er e s u l t - i n gp r o c e d u r e sa r ee x a c tt 曲a n de a s yt oc o m p u t e k e y w o r d s :l o n g i t u d i n a ld a t a l i n e a rm i x e d m o d e l c o m b i n a t o r y s p e c t r a ld e c o m p o s i t i o ne s t i m a t o ra n o v a - t y p ee s t i m a t o r sn o n n e g a - r i v ee s t i m a t o r g e n e r a l i z e dp - v a l u e , 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作 及取得的研究成果尽我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表和撰写过的研究成果,也不包 含为获得北京工业大学或其他教育机构的学位或证书而使用过的材 料,与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意 砬 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定, 即。学校有权保留送交论文的复印件,允许论文被查阅和借阅;学 校可以公布论文的全都或部分内容,可以采用影印,缩印或其他复 制手段保存论文 ( 保密的论文在解密后应遵守此规定) 签名,丛塑导师签名;鸟盔迹日期:五宣:么 第1 章绪论 第1 章绪论 在这一章中,我们将对纵向数据作般性的介绍纵向数据的特点线性 模型及参数估计尤其是方差分量估计的方法 1 1 纵向数据 。纵向数据是指对同一个体或者受试单元在不同时间观测若干次,即 得到同一个个体不同时刻的观测,是由截面和时间序列融合在一起的数据 此类研究经常应用于医学和社会科学领域如在医学领域,纵向数据研究可 应用于动物实验,药物的临床试验及长期治疗法的有效分析近年来,纵向数 据模型的研究已成为统计学的热点课题之一,在理论和应用两方面都得到了 很大的发展h 鲥a o 4 j 和b 以t 叼羽讨论了纵向数据在经济学中的应用在经 济学的研究中,纵向数据也称为。p a n a ld a t a d i g g l ee t 址l q 系统的介绍 了纵向数据的线性模型、广义线性模型,边缘模型以及随机效应模型等理论 d a v i d i a n 和g i l t i n a n l 7 】研究了纵向数据的非线性理论d a v i s s 对纵向数据 的线性模型进行了研究,并通过大量的实例说明其应用 纵向数据在实际中的例子很多如研究儿童的身体发育状况( 如身高,体 重等) 随年龄增长的趋势。我们可以随机抽取一些凡童作为研究对象,在不同 的时间对其身体发育状况进行测量,这样得到了纵向数据又如儿童阅读能力 随时间变化的趋势再如,在研究我国城镇居民消费和收入的关系,2 0 个省 份2 1 个城镇居民人均生活往消费和人均可支配收入的数据也为纵向数据 纵向数据的应用如此广泛,这是由纵向数据的特点所决定的纵向数据是 对观测对象中的每一个个体按时间顺序重复观测而得到的,它将截面数据和 时间数据结合在起,能很好地分析出个体随时闻变化的趋势,同时又反映了 个体间的差异以及个体内的变化趋势,起着只利用截面数据或只利用时间序 列数据模型不可替代的作用,有很高的使用价值例如我们要研究儿童的阅读 能力情况我们随机地抽取若干名儿童,观测这些儿童在不同年龄段阅读能力 北京工业大学理学硕士学位论文 的情况随着年龄的增长,每个儿童的阅读能力都有所提高,但是每个儿童在 我们首次观测时的阅读能力却不相同,有些儿童在年龄较小时的阅读能力反 而比有些儿童在年龄较大时的阅读能力还要强也就是说,纵向数据不但考 虑了个体间的差异( 初始的阅读能力不相同) ,同时也考虑了个体内部的变化 ( 阅读能力随年龄的增长而不同程度地提高) 但是,如果我们对此数据采用 截面数据的方法进行分析,就忽略了儿童的初始阅读能力,从而使得分析出的 结果有可能与实际情况不符再如,分析我国结构性失业问题,它不但受各地 区产业结构的影响,而且也受到国家在各个时期宏观政策的影响若只利用截 面数据,即选择同一时闯不弼地区的数据作为样本观测值,可以分析出各个地 区不同的的产业结构对结构性失业的影响但是不能分析出国家的宏观政策对 各个地区结构性失业的影响如只利用时间序列数据,即选择同一地区在不同 时间点的数据作为样本观测值,可以分析出国家的宏观政策对结构性失业的 影响,但不能分析出不同的产业结构对结构性失业的影响如果采用纵向数据 模型,即在不同的时间选择不同的地区的数据作为样本观测值,不但可以分析 出不同的产业结构对结构性失业的影响,而且也可以分析出国家的宏观政策 对结构性失业的影响纵向数据的另一特点是提供给研究者大量的数据点, 不但增加了自由度,而且减少了解释变量之间的共线性,从而能够改进估计的 有效性 由于纵向数据是同一个个体不同时刻的多次重复观测。对于每个个体来 说,都得到一个响应变量,但它不同于一般意义上的多元统计数据在多元统 计分析中,每个个体也得到一个响应变量,但这个响应变量是同个体多个指 标在同一次观测中得到的向量,并无重复的含义而纵向数据是对每一个体在 不同的时间进行多次重复地观测而得到的一组响应变量,对不同个体进行观 测时获得的响应变量是独立的,但是对同一个体在不同时刻观测获得的响应 变量却是相关的,从而导致了纵向数据协方差结构的复杂性因而对纵向数据 的研究方法不同于以前的情形,对纵向数据的研究方法有待于进步的创新 2 第1 章绪论 1 2 线性混合效应模型 线性模型的般形式为 f = x z + 毛室( ) = 0 ,c o v ( ) = e ,( 1 1 ) 其中y 是个n 1 的观察值向量,x 是个n x p 的已知设计矩阵,卢是一 个p x l 的未知参数向量,是个n 1 维的随机误差向量,c o v ( y ) = e 0 或e 0 ( 根据具体情形而定) 在经济和社会科学领域中的许多模型可以表 示成( 1 1 ) 的形式。 若参数向量口中既包含固定效应也包含随机效应,则模型( 1 1 ) 称为线 性混合效应模型,其般形式为 y = x z + z + 岛 ( 1 2 ) 这里y 为n 1 的观测向量,芦为p x l 的非随机参数向量,称为固定效应,x 为对应于固定效应的设计阵;为q x1 的随机向量,称为随机效应,z 为对应 于随机效应的设计阵;s 是随机误差向量般我们设定e ( f ) = 0 ,e ( ) = o ,e 和6 互不相关且 g d t i ( f ) = g ,c o v ( e ) = r , 于是c o v ( y ) = e = z g z ,+ r ,这里g 和置分剐为已知或未知的非负定和正 定阵,在它们未知时,它们可以依赖于一个未知参数向量口即此时模型( 1 - 2 ) 的随机部分z + s 可以分解为名+ s = 巩f l + 现岛+ + 巩缸。则得到一 般的方差分量模型 y = x z + 仉6 + 巩+ + 巩靠,( 1 3 ) 其中矗为口1 的随机效应向量,阢为n 吼的已知设计阵,通常假设 e ( 6 ) = 0 ,c 伽婚) = 砰瓦,c 伽像,白) = 0 ,i j 一3 一 北京工业大学理学硕士学位论文 于是 e ( ) = x 反g d l ,( 计= :砰矾珥, = l 称为方差分量,最后一个随机效应向量是通常的随机误差向量e ,而 巩= 厶模型( 1 3 ) 包含多类具有广泛应用背景的线性模型t 5 - i q ,如p a n e l 数据模型,单向( 两向,多向) 分类混合模型,套分类混合模型 当模型( 1 3 ) 中固定效应只有常数项。即x p = 1 u ,这里1 。表示元 素皆为1 的n 维列向量,当从上下文知道其维数时,下标n 可略去;“是未 知的总体均值此时,模型( 1 3 ) 又常称为随机模型 另一方面,若( 1 1 ) 中的未知参数向量是随机回归系数,即p 的各分量 看作是来自于相应总体的随机抽样,可得如下模型 f = x 卢+ e ,e ( z ) = a a ,g d ( 卢) ;口2 ve ( 卢e ) = 0 , 这里x 和a 分别是已知的n p 和p k 的矩阵,y 是已知的p p 的对称 非负定矩阵当回归系数随时间,个体、单元,区域等变化而发生变化时,随 机回归系数模型是很好的选择( 见b u r a e t t 1 7 ,s w a m y 1 8 和s a r r i 8 1 9 ) 当所研究的因变量不是一个而是多个。这就导致多因变量的线性模型, 如多元线性回归模型,生长曲线模型等其中生长曲线模型是一种在生物医学 和社会科学等领域被广泛应用来处理重复测量数据的多元模型它的一般形 式为 y = x l b x 2 + ,e ( e ) = 0 ,d d t ,扣e c ( ) ) = o h , 这里y 是n q 的随机观测矩阵,j 矗和j 己分别是n p 和g xk 的已知矩 阵,b 是未知的参数矩阵。e 是随机误差矩阵,ok 是钾c ( e ) 的协方差 矩阵。其中k o 表示k 和的k r a n e c k e r 乘积,v e r ( e ) 表示将的列 向量依次排成一列的列向量 下面我们看个纵向数据线性模型的例子 一4 第1 章绪论 例1 2 1p a n e l 数据模型 这类模型被广泛用于计量经济学中( 见b a l t a g i 【5 】) 假设我们对个个 体( 如个人,公司或国家) 进行了t 个时刻的观测,观测数据可表示为 强= z + 6 + e 4 z ,i = 1 ,t = 1 ,正( 1 4 ) 其中为第t 个个体第t 个时瓤的某项经济指标,$ n 是p 1 的已知向量, 它刻画了第 个个体在第t 个时刻的一些自身特征,6 是第个个体的个体效 应,是随机误差项 若我们的目的是研究整个市场的运行规律,而不是关心这特定的个个 体,这个个体只不过是从总体中抽取的随机样本,这时个体效应就是随机 的记 可= ( 玑l ,i t t ,可乱,掣肌- ) ,x = 扛u ,z l t ,2 l ,茁t ) , 巩= h 0 1 t ,f = 婚,如) ,e = ( e l l ,e l t ,e 2 1 ,e 胛) , 则模型( 1 4 ) 可以表示成 f = 即+ 矾f + e , 如果假设y ”婚) = ,y ”) = 程,所有的矗和缸都不相关,则 锄白) = 巩玩+ 程栅= 疃( n 。而) + 蠢抽, 这里和即为方差分量,模型( 1 - 4 ) 也称为具有套误差结构( n e s t e de r r o r s t r u c t u r e ) 的线性模型,它经常出现在实验设计,抽样调查等问题中模型( 1 4 ) 有时也称为纵向数据模型i s , 9 ,常用于生物医药统计的研究领域 1 3 参数估计 1 3 1 固定效应和方差分量的估计 5 北京工业大学理学硕士学位论文 ( 1 ) 固定效应的估计 在线性混合模型中,只对固定效应部分估计的研究文献相对较少,对于可 信函数c ,卢,较为常见的有最小= 乘估计( t h el e a s ts q u a te s t i m a t e ) 和最佳线 性无偏估计( t h eb e s tl i n e a ru n b i a s e de s t i m a t e ) ,它们分别为 c ,矿= d ( x x ) 一x y , ( 1 5 ) 和 c ,卢= d ( x e x ) 一x 7 e 一玑( 1 6 ) 在实际应用中,观测向量的协方差阵e 常常未知,因此选择最小二乘估计作为 一种可行的估计,但由于其未能利用协方差结构所含的信息,所以经常会有估 计精度上的损失另一种常用的可行估计是c ,卢的两步估计方法是首先求出 的估计宝,将其带入( 1 - 6 ) 得到d 卢的两步估计,c ,庐= c ,( x 宝一x ) 一x 金一y 由于两步估计往往是观测值很复杂的非线性函数,对其统计性质的研究难度 较大,因而目前对其小样本的的精确分布知之甚少在较特殊的p a n e l 数据 模型下。王松桂和范永辉【刎给出了一个两步估计协方差阵的精确表达式, 同时获得了该两步估计在均方误差意义下优于最小二乘估计,w i t h i n 估计 的一些简单的充分条件最近,王松桂和尹索菊口1 1 在模型的随机效应为一般 多向分类平衡数据模型中,利用能够对协方差阵进行谱分解的方法,通过对 线性模型进行变换,给出了固定效应和方差分量的同时估计,称为谱分解估 计( t h es p e c t r a ld e c o m p o s i t i o ne s t i m a t e ) ,并证明了它们的一些优良的统计 性质而在许多实际问题中,我们经常要考虑固定效应和随机效应的组合的 估计例如,质量指标的估计,纵向数据研究,植物育种试验和小域估计问题 ( 见r o b i n s o n 2 2 1 ) ( 2 ) 方差分量的估计 在线性混合模型的参数估计理论中,方差分量的估计是研究的焦点之一。 研究内容和文献已非常丰富 1 6 - 冽迄今为止提出了众多的估计方法史建红 - 6 第1 章绪论 在他的博士论文嘲中,对方差分量的估计作了深入的研究,并将已有一些估 计分为三类 a 基于矩法的估计方法 其基本思想是t 先把观测数据的平方和y y 分解为口的某些二次型的和, 令这些= 次型等于各自的期望,得到关于方差分量的个线性方程组,然后通 过解此方程组来获得方差分量的估计方差分析法和谱分解法就属于此类 在乎衡数据下,方差分析估计具有无偏性和最小方差性 h 砌s o 三种方法是针对非平衡数据提出的,但同样适用于平衡数据 其共同点是t 先定义类似于平衡数据均方的平方和,然后求平方和的期望并令 之等于此平方和,最后解方程组来获得方差分量的估计它们的区别在于平方 和的定义不同,应用范曝不同 b 基于分布的估计方法 其思想是假定观测向量服从某分布,然后借助分布函数给出方差分量的 估计方差分量极大似然估计和b a y e s 估计方法属于此类方法 c 基于准则的估计方法 其思想是先提出估计应具有的性质,而后把为满足这些性质所需的充要 条件转化为个极值问题。通过解此极值问题来获得方差分量的估计这类方 法包括t 最小范数二次无偏估计、最小方差二次无偏估计,非负最小偏差二次 估计等等此类方法都直接考虑方差分量的个线性函数妒= d 矿的估计问 题因为待估参数是方差分量的一个线性函数,所以自然考虑观测向量的二次 型”a y 作为妒的估计,a 为待选的对称矩阵通常,此类方法都要求二次 型v 向具有不变性或无偏性。且能极小化某个最优准则例如,方差、均方 误差、偏差或范数等 1 3 2 方差分量的非负估计 7 一 北京工业大学理学硕士学位论文 关于方差分量的非负估计同题曾被许多学者所讨论。人们在这一领域也 做出了相当多的研究成果l e m o t t e 2 8 于1 9 7 3 年证明了在线性混合模型下, 至多只有随机误差对应的方差分量存在非负二次无偏估计既然随机效应方 差分量的非负二次无偏估计不存在,因此要其非负就必须牺牲一定的优良性 质( 或是无偏或是二次,甚至两者皆失) ,也就是得到非负二次、非负无偏或 非负估计目前文献中关于非负= 次和非负估计的研究成果已有很多除了 讨论单个方差分量的非负估计问题外,许多文献还研究了方差分量的线性函 数的非负估计问题,而且主要研究在什么条件下方差分量或方差分量的线性 函数存在非负估计以及如何基于已有估计有效地构造非负估计下面具体来 说t ( 1 ) 非负估计存在性问题 虽然单个方差分量的非负二次无偏估计不存在,但许多文献研究了线性 函数妒= c a 2 的非负二次无偏估计的存在性问题p u k e l s h e i m 在文献 2 7 】中 利用原模型的残差模型的自然参数集给出了线性函数i p = d 口2 存在= 次无偏 估计的个充要条件b a k s a l a r y 和m o l i n s k a 2 s 利用p u k e l s h e i m 的结论,给 出了含两个方差分量的方差分量模型下方差分量的线形函数存在非负二次无 偏估计的充要条件,此条件较p u k s h e i m 的更简洁且更容易验证,史建红嘲 用上面的结论给出了平衡方差分量模型下方差分量的线性函数存在非负二次 无偏估计的充要条件 ( 2 ) 非负估计构造问题 目前文献中构造非负估计的思想大多是对原有的二次无偏估计进行改造。 使之满足非负性这些非负估计为克服原估计的缺点,绝大多数都牺牲了原估 计的无偏性,丽要求改进后的估计具有较小的均方误差,例如目前已得到的非 负最小偏差二次估计非负谱分解估计、非负不变二次估计等等针对各种估 计为达到非负所采用的技术手段,归纳起来常用的大致有以下几种t a 截断法 8 第1 章绪论 此法是文献中最常用的一种方法。其思想比较简单,就是针对已有的估计 非负时在零点处截断对于方差分量的一切估计都可采用截断法来获得非负 估计,截断般分为两种。1 ) 对估计的取值进行非负截断,这个是最简单和 常用的i2 ) 对估计的二次型进行非负截断因为常见的随机效应方差分量的 二次型估计都会有r a y y ,b y 的形式,对二次型截断也就是将,b y 的 一部分截掉使得估计大于零,有时直接将一b y 截掉,再将,a y 乘较小 的非负系数,r a o 在文献f 1 5 中给出的对最小范数二次无偏估计的改进正是 基于这一点 b 特征值法 此方法利用了模型协方差阵的特征值的估计,其优点在于它总产生方差 分量的非负估计( 非二次的) 然而,这种估计方法的成功之处在于特征值的 精确估计因为目前在小样本情形下没有这些特征值的无偏估计方法,文献中 一般用一个刀切法来获得它们的估计这种基于多元方法的刀切法在均方误 差意义下可能产生比限制极大似然估计和非二次估计较好的估计,不过用这 种方法有可能产生方差分量的负估计,当出现负估计时再采用零处截断法 c 二次型加权法删 此方法主要是通过对方差分量的二次型估计加权使得得到的估计比原估 计取负概率减小,并且改进估计在均方误差意义下比原估计一致地好 利用非负估计方法获得方差分量的非负估计仅仅是实际中处理方差分量 负估计的种方法,文献中还给出了多种其他的处理方法,例如重新考虑模 型的选择;收集更多的数据,重新估计;忽略估计值为负的方差分量,对其他 分量重新估计( 参阅文献p 1 】) 1 4 本文研究的问题及论文结构 本文主要目的是研究几类特殊的纵向数据线性模型的参数估计以及检验 问题,主要是针对数据相互独立。睡吼项服从正态分布的特殊情形,研究了 9 北京工业大学理学硕士学位论文 方差分量的改进估计及检验问题对含两个方差分量的一般线性混合效应模 型,将徐礼文论文【3 2 】中的组合谱分解估计进行改进,研究了一个不变估计 类,证明了在均方误差准则下,在该估计类中不存在一致最优估计,但在个 重要子估计类中,找到了一致最优估计,并用截断法得到了优于谱分解估计正 部的正估计进步,对含三个方差分量的套误差分量模型,我们利用b a l t a g i 在 3 3 j 中得到方差分析型估计一w h 估计,w k 估计,s a 估计的方法,得 到我们的套误差分量平衡模型中这几种估计,并且对其改进,得到它们的改进 估计我们重点阐述对w k 估计的改进,其它两类改进与其类似对l 痘机效 应和随机误差方差分量的w k 估计,在均方误差意义下,我们得到了一致优 于它们的估计,最后我们用截尾法给出了随机效应方差分量的正估计最后。 我们利用广义p 一值方法,给出了含两个方差分量的一般线性混合模型下一种 方差分量的新的检验方法,该方法计算简洁,便于使用,最后还对两个模型方 差分量间的比较做出了检验 本文主要由三章组成,其中第一章是绪论部分,属于准备工作,介绍有关 纵向数据和线性模型以及参数估计方面的知识,第二章到第三章是本文的主 要结果部分第二章在不同模型下分别给出了对组合谱分解估计和几种方差 分析型估计的改进并得到其非负估计,证明了在均方误差准则下我们所给估 计的优良性第三章利用广义p 一值的思想,对含两个方差分量的方差分析模 型,我们利用广义p 一值方法,对单个随机效应和两个模型随机效应方差分量 间的比较分别作出了精确检验 - 1 0 第2 章纵向数据模型中方差分量的估计 第2 章纵向数据模型中方差分量的估计 2 1组合谱分解估计 2 1 1 引富 考虑下面的模型 蜥= 毛卢+ 矗+ 8 巧,i = 1 ,t ;j = i ,啦, 这个套误差回归模型是一个方差分析模型,也是个纵向模型的特例,它也是 如下的带有两个方差分量的一般线性混合模型的特例 f = x 卢+ 嘴+ 毛( 2 1 ) 这里,是n 1 的观测向量,x 和u 是已知的设计阵,卢是女1 的未 知参数向量,f 和s 是相互独立的,均值为0 ,且协方差阵分别是畦五和 k ,易知,c o v ( 口) = e = c ,( 厂+ 口:k 对于模型( 2 1 ) ,在正态假设下,也是个方差分量模型方差分量模型 是类在经济,生物医学等领域具有广泛应用的统计模型在文献中已经提 出了许多种估计方差分蟹的方法,其导出的估计在一定条件下,具有不同的优 良性,同时又存在一些缺点徐礼文利用谱分解估计的思想,导出了随机效应 的组合谱分解估计本节对这种组合谱分解估计进行改进我们研究了个不 变估计类,证明了在均方误差准则下,在该估计类中不存在一致最优估计,但 在个重要子估计类中,找到了一致最优估计,并用截断法得到了优于组合谱 分解估计正部的正估计 2 1 2 组含谱分解估计的改进 首先,对模型( 2 1 ) ,考虑谱分解 u v = k 脱,( 2 - 2 ) 北京工业大学理学硕士学位论文 其中 l ,k 是u t 的全都互不相同的非零特征值,坛是特征根对应 的主幂等阵( 即孵= 必,蛆坞= o , j ) ,记m o = 厶一尬。则我们 可以得到e 的谱分解为 ( 以+ 九) 慨, 这里,知= 0 用坛左乘( 2 - 1 ) ,并记y ( o = m , y ,x ( o = 胍x ,e o ) = 坛吠+ 脱,江 0 ,1 ,8 ,则得到了下列变换后的新模型t 。) = x 。卢+ ( 订, e 忙g ) = 0 ,g d u 仁) = ( 吒十 吒2 ) 尬, ( 2 3 ) 这里i = 0 ,1 ,8 ,因尬是奇异阵,故( 2 - 3 ) 是带有奇异协方差阵的线性混 合效应模型。其协方差阵为( 砖+ 九畦) 舰 记玩= 以( 磊) 一r k ( m _ x ) ,i = 0 ,1 ,5 由上面的新模型,我们可以得 到磋+ 九的估计 坎2 拶姒一x i = o ,1 ,s 对任一i 0 ,令 仇= 以+ 九, i ) 0 = 以, 解此方程,得唯一解 吒2 = 忑1 【i 1 , ( 磁一蜀峨x 阿一未矿( 确一只如x ) 司, ( 2 4 ) 五2 。扣一p m a x ) 口, 分别称磊2 和喀2 为砖和的谱分解估计 1 2 第2 章纵向数据模型中方差分量的估计 在模型( 2 1 ) 下,当v = u 只有个非零特征值( 不计重数) 。即在 ( 2 2 ) 式中s = 1 时,由上面知和疃的谱分解估计分别为 磊2 = 亡f ( 娲一j k x ) , 噍2 = 砉 击9 ( 蛆一x h 一瓦1 可s ( 一x ) 胡 当矿的非零特征值大于等于2 ( 不计重数) 。即在( 2 2 ) 式中s 2 时,由 ( 2 4 ) 式可知霹的谱分解估计就不唯一,与幂等阵尬有关易见,此t t 中- 方 差分量砰的谱分解估计没有利用s + 1 个新模型的信息,这显然不是最好的 估计为了构造能利用所有模型信息的估计,徐礼文在【3 2 中提l f i - r 疃的组 合谱分解估计即在正态假设下,考虑下列形式的二次型 t o = ! ,( 一p m o x ) y 一0 - 。2 娃, ( 2 5 ) 噩一( 晒一p m ,x ) y 一( + a ) 磕, ( 2 6 ) 正一( 尬一p m o x ) y 一( 砰+ a 。) 冠, ( 2 7 ) 这里瑶表示服从自由度为玩的中心卡方分布变量又尬一j k x ( i = 0 ,1 ,8 ) 是对称幂等阵。且( 尬一x ) g 鲫( ”) ( 易一x ) = 0 “j ) ,因此统计量 而,乃,正是相互独立的,且蜀,冗,e 在变换群y + y + x a ( a 璐) 下是不变的类似于文献【3 4 j 中方差分析估计的构造方法,考虑如下形式的 估计 2 ;( :丑一未乃) , 称+ 为组合谱分解估计,这里口= 晚,b = 沁下面我们在正态假设 下对组合谱分解估计进行改进,考虑不变估计类 噍2 ( m ,n ) 2 壶正一t o , 1 3 北京工业大学理学硕士学位论文 我们用均方误差m s e ( d 2 ( m ,n ) ) = e ( 唾2 ( m ,n ) 一) 2 作为比较估计优劣的 标准来研究估计类噍2 ( m ,n ) 中估计的优良性 定理2 1 对模型( 2 1 ) ,若一n ( o ,n 一n ( o ,) ,则 m s e ( d e 2 ( m ,n ) ) = g l ( m ,n ) z + 2 9 2 ( m ,n ) 吒2 吒2 + 卯( m ) , 这里 g l ( m = 掣+ 唑# 一裟, 9 2 ( m = 兰警一而2 b b o 一豢+ 鲁, 咖m _ - + 2 b 竺挲 证明根据( 2 5 ) 一( 2 7 ) ,我们有 一以x 磊,噩一( + a i ) x t ,i = 1 ,8 , 故e ( t o ) = ,e ( 正) = 氐( + k ) ,显然 m s e ( d 2 ( m ,n ) ) = e ( 噍2 ( m ,n ) 一) 2 = e ( 噍2 ( m ,n ) ) 2 + 一2 e ( d 2 ( m ,n ) ) = y o r ( 噍2 ( m ,佗) ) + ( j 狡2 ( m ,n ) ) 2 2 e ( 嚷2 ( m ,n ) ) + ( 2 8 ) 又t o ,五,正相互独立,故 e ( 吱2 ( m ,n ) ) = 去e 正一;曰晶 = 击塞( + k ) 堍一;程6 0 ( 2 - 9 ) = ( 景一鲁) + 斋bu f 2 第2 章纵向数据模型中方差分量的估计 y 口簖( m ,哟) = 静1 , ( 固+ 1y 盯c l ) t = 1 = 嘉z ( d + 九疃) 2 6 + 帚2 。4 6 0 = j = 嘉e ( + 2 凡吒2 叱2 + 碍溉+ 帚2 。0 。4 = 嚣+ 等+ 嘉碍6 + 景b = = ( 鲁+ ) + 帚4 b u 。2 u 2 - t - 嘉e 埒如 “ f 2 1 0 ) 将( 2 一g ) 和( 2 1 0 ) 代入( 2 8 ) 式并化简便可得到所要结论,定理证毕 令妻碍= c ,则卯( m ) = 1 一羔+ 警 因为m s e ( d e 2 ( m ,n ) ) 中g i ( r n ,t 1 ) ,i = 1 ,2 和9 3 ( m ) 在m ,n 的不同值处达 到极小值,于是在估计类嚷2 ( m ,哪中不存在致最优估计从m 船( 咬2 ( 孤哟) 的表达式还可以看出,畦的系数西( ”磅不依赖于n 。且它在m = 堑处达到 最小僮于是在估计类噍2 ( m ,哪中,若m 芝铲,就不可能优于畦2 ( 芝軎堑,n ) 定理2 2 若m s 学,”之譬,则噍2 ( 堑,住) 在均方误差意义下一致 优于噍2 ( m ,n ) 推论2 1 估计唾2 ( 堑,警) 在均方误差意义下一致优于组合谱分解估 计咬2 ( 6 ,譬) 引理2 1 对于模型( 2 1 ) ,若e n ( 0 ,o y ) ,e n ( o ,已,) ,则 ( 1 ) 嵋是嵋的无偏估计; ( 2 ) 和的方差分析估计相等,当且仅当p x 和,驴可交换 引理的证明参见文献1 3 5 】 由上面的引理及定理2 2 ,我们有下面的推论 推论2 2 若f n ( o ,畦d ,一n ( o ,砰j ) ,且最和u u 可交换,则估 计喀2 ( 蟹軎丝,警) 在均方误差意义下一致优于方差分析估计噍2 p ,警) 一1 5 北京工业大学理学硕士学位论文 这个推论表明,在均方误差准则下。的方差分析估计是不容许的 因为为非负参数,于是我们往往用截断法取个估计的正部,获得 的个非负估计下面给出个引理。这个引理对比较两个非负估计是很有用 的 引理2 2 设口为待估计的非负参数,反和如为两个估计,反 赴,m s e ( 1 ) sm s e ( 0 2 ) ,则m s e ( o + ) m s e ( 露) 这里q + = ,n ( a ,o ) 证明记酣= m 凹( 鼠,o ) ,舒= m ( 一反,o ) ,i = 1 ,2 于是反= 莳一审,i = 1 ,2 m s e ( 0 1 ) = 刀( 靠一开一口2 ) 2 = m s e ( 对) + e ( i i ) 2 + 2 a 2 e ( 6 i ) ( 2 1 1 ) m s e ( 0 2 ) = m s e ( o + ) + e ( 露) 2 + 2 a 2 e ( 露) 由岛s 如。便有口i 露0 ,故e ( d i ) e ( 露) ,e ( d i ) 2 e ( 露) 2 , 从( 2 1 1 ) ,命题得证 记( m ,n ) = 噍2 ( m ,n ) + = m 一( 嚷2 ( m ,n ) ,o ) ,即露( m ,n ) 为估计 噍2 ( m ,n ) 的正部从推论2 1 及引理2 2 ,我们得到 推论2 3 磋( 堑,譬) 在均方误差意义下一致优于组合谱分解估计的正 部,在引理2 1 的条件下,它也优于方差分析估计的正部 2 2 方差分析型估计 2 2 1 引富 考虑下面的套误差分量模型, t = 未& + t 蝣t ,l = 1 ,m , j = 1 ,n , t = 1 ,正 ( 2 1 2 ) 这是个平衡的套误差回归模型,其中鼽靠表示第i 个产业第j 个公司在时 1 6 第2 章 纵向数据模型中方差分量的估计 间段t 的产量,。蚺表示个k 维的非随机向量其中误差项 蛳= 肚+ + 啄,汪1 ,m , j = 1 , t = 1 ,z( 2 1 3 ) 其中肚表示第 个不可观测的具体产业效应,假定它们独立同分布于n ( o ,畦) , 表示第i 个产业第j 个公司的套效应,假定它们独立同分布于n ( o ,元) , 8 班表示剩余误差项,假定它们独立同分布与n ( o ,霹) ,且胁,和勺也是 相互独立的 模型( 2 - 1 2 ) 也是个含三个方差分量的纵向数据线性混合模型,在这个 模型中有个很重要的问题就是估计方差分量文献中对方差分量的估计已 提出了许多方法,比如方差分析估计,极大似然估计,限制极大似然估计等 方差分析估计是无偏的,但无偏性的要求往往使得估计量和估计值之间产生 较大的差异所以我们往往忽视无偏性,而在均方误差意义下评价估计的优 劣本部分内容给出了在均方误差意义下改进方差分析型估计的方法另外, 方差分析估计往往得到的不是非负估计,即估计取负值的概率大于0 ,这是 个不目旨令人满意的性质,人们一直在寻我方差分量的正估计l e m o t t e 在 1 9 7 3 年证明了随机效应方差分量的非负无偏估计是不存在的对于含两个方 差分量的线性混合模型,t a t s u y a 3 4 利用积分参数方法给出了方差分董的正 截尾估计;史建红。王松桂删基于谱分解估计给出了一种方差分量的非负估 计,并讨论了它优于谱分解估计的条件在本节中,我们也给出了套误差分量 模型中方差分量的正截尾估计下面我们利用b a l t a g i 在【3 3 i 中得到方差分析 型估计_ w h 估计,w k 估计,s a 估计的方法,得到我们的套误差分量平 衡模型中这几种估计,并且对其改进,得到它们的改进估计我们重点阐述对 w k 估计的改进,其它两类改进与其类似对随机效应和随机误差方差分量 的w k 估计,在均方误差意义下,我们得到了一致优于它们的估计,最后我 们用截尾法给出了随机效应方差分量的正估计 2 2 2 方差分析型估计 1 7 北京工业大学理学硕士学位论文 我们把模型( 2 - 1 2 ) 写成矩阵形式t = x 侈+ u , ( 2 1 4 ) 其中是m n t 1 的向量,x 是m n t k 的矩阵,卢是k 1 的参数向 量,“是m n t 1 的误差向量把( 2 - 1 3 ) 写成矩阵形式为 t = 乙p + z

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论