版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、之前介绍过的基于线性模型的方差分析,虽然扩展了方差分析的领域,但是并 没有突破方差分析三个原有的假设条件,即正态性、方差齐性和独立性,这其中独 立性要求较严格,我们知道方差分析的基本思想其实就是细分,将所有对因变量产 生影响的因素逐一摘出,但是如果各观测值之间相互影响,这样在细分影 响因素的 时候,是很难分出到底是自变量的影响还是观测值之间自己的影响。虽然随机抽样会最大程度的使数据满足独立性,但是有时候这种方法并不奏效,比如 随机抽取受访者分析其消费特征,这里就假定所有受访者的之间是相互独立的,然 而仔细想想,这其中存在问题,如果某些受访者来自同一个城市或地区,从个 体角 度讲,他们确实是独立
2、的人,之间没有任何联系,但是如果从分析目的角度讲,由 于区域因素他们之间的消费特征是趋于相似的,而产生这种相似性,正是由于相互 作用导致,这些人是存在相互影响矣系的,也就类以于相尖样本,与此同时,这种 相互作用也使得不同城市间的消费特征产生差异,我们称这种数据为具有层次聚集 性的数据。数据的聚集性除了表现在聚集因素间指标的均值水平不同外,还表现在 不同城市间的指标离散度上。从层次聚集性数据也可以看出,随机抽样只能保证数据被抽到的概率相同,但是 对 于抽到的是什么样的数据,却无法控制了。对于这种具有层次结构的数据,如 果分 析目的仅限于这几种层次,比如就分析这几个城市,那么可以把它当做一种 固定
3、因 子,只分析固定效应而不用考虑这种聚集性,但是如果想把结果推广到所 有城市, 那就不能忽略这种特征,否则会降低结果的准确性,因此还要加入随机 效应。混合线性模型就是同时包含固定效应和随机效应的线性模型,是解决此类层次聚集 性数据的方法之一,对于具有层次结构的数据,我们需要将使观测值之间产生相互 影响的层次因素也摘出来,比如上述中的城市因素,传统的方差分析模型中,将所 有无法解释的因素都归在随机误差中,而随着我们对传统方差模型的不断拓展,对 随机误差的分解也越来越精细,结果也越来越准确。【例】我们想分析哪些因素会对16岁时毕业成绩的影响,显然毕业成绩和学校 有 尖,好学校的学生成绩会好一些,而
4、差学校的学生成绩会差一些,那么学校这个因 素就是上述的层次因素,它使得因变量产生相尖性,而且我们是想把结果推广到所 有学校,因此学校这个变量应该被定为随机变量,我们首先按照一般线性模型来分 析,不考虑层次因素分析一一般线性模型一单变量因变量为1気岁成绩*协变量为口岁成集I机因子为学檢,不 做其也设定,不考虑二者 交互作用F直犊分析其 主敷应在按照一般线性模型 分析之后,我们再来 看看按照混合线性模 型分析的结果会有什 么不同只看方差分析结果,11i-r.-.r16i; *岁成绩稲学校对因娈重II均有显者凳响,我们将5?1141丽该结黑与后续用混合线2WW口删性模型分折古怡mdln1127 12
5、011127J3O1S92.5SC04Q 的结果作对比X?&225S 7093射3閒PSChQDIrrii1731046410 303.0C0225ft 7043$35#12 $86 MSf liaaQ 414 M C : 1Jb唄卅乃首先弾出的对话框用耒设置作为层 欢因素的娈量特其设墨在主赢对分析一混合模型一线性话框中,本例为学校A如黑不设董 的话J后面的分折则认为没有层次 因素谡罟好层次因素之后,进入 的親合线性模型的主对话 框和殿尊性模型类似, 住此可叹对模型做更详细 的阙本例中我们首先 来分析学技这个因素是否 是 层次因素,也就是检 齡 不同学棣的平均成绩罡否 有差异,因此不纳入任何
6、其她因 子只选入因变量 在睛机对话框中,我们选 走包含截距,并将学校选 入组合中如果学梭不是 层次聖 集因素的话那么所 有学校的平均成绩应该相同体观在图中就罡所 有回归线的初姑点即载 距相等“如果不相等说明其中有变异那 么变异的耒源就是最开 始设走的学校因素。匚幅濒计働1丨丄啊tfog云g1 r*8*1丿荃靖店计p丿怙育運费鉄检題 WISiimXtttEi壘對活计怕団方整直i馬世笳是的间方菱迴.洒协万雀世)I匚时比晶禮距降Q111 t13a J 16 :*t. -1 111.5 RANDOM -I-I / 丨:s* IS的命&常洋可II产堂不岡于先初版本的诘 M0.05是不能 柜絕幕假设的:區
7、母SF162.529.060.807因变呈;戚謝协方卿當数wjuzirwiAiF 亦 9 . tdTKM:隔二scfMjaqB47T51 inmaiaAn93非押41 687OOQ QOQ01157311WVF冊T创陆爲输出的检方差靈魏琴架鱸是对陆W.部分的分析裁果,也殖是对学校是杏是层次鑒集 囲麦的最缪定论。此处,原假设为I机麹应的方差为m也強是不存在賈异。等冃于不冋 学枝见的威待均值設有差身,可见计值萍不為0检监給果也是柜寰捺假设,因吐可以判 断,学校确寞星一个匡真衆集因憲*上方的匪望走示越个腕测值”也或是学生之冏是香存在个体差异“也是拒绝康鶴诰,即认均 学生之目是存在个律差异的经过以上分
8、析,我们知道学校确实是一个层次聚集因素,不能按照一般线性模型 进行分析,那么影响16岁考试成绩的原因有很多,我们继续加入变量进行分析。 首先加入门岁时的入学成绩,先将其加入固定因素,并观测和之前不加人任何因 子相比有何变化V,W2W fliFIWWV 将口岁入学成填纳入,由于是连续娈量“因此进 入协变童,并且在固走按钮中 将其迭入模型倩暑乖作1Mffll-K 1frvsliandlrt脚乙11冷卸fit if11114schooli / 1.41( - kM,Lb1U庄町武厂豎事剧予UWIfllK细啟草心忆隱忌索農柿谄匕峙站HU椚甲竹屮S3E8.735豈旳柬的对数似甦苗9372735Akaik
9、e的柑息秦件(*HurvicH Tsai 拘玉件(AICC)9372 738Bozdogan 寂& | (CAIC)930八351Schwarz 的 Bayesian 丢件 (BIC)9365351以墩少为披好”的檔式显示佶息臺件ail n*诙吊./ Fsian-ai n11907324050074OQJ2041 M|_9$4000固定效应E3忖績轨曲曲特空惋首先模型槪况中固定效应多了新如入的变量,其次各个信息条#的值,也比之前降 低说明有韶分娈异襪隸加入的变量 所解释*棲下来的固走效应分折 中可看到F0-05,说明 新扣入的变量确实对因 娈量产生軫响,并目怙 计值为正埶,说明呈正 相矢髡响“
10、即入学成饋陋 高,毕业成绩也14高。曲案隨底亍广l*ii ;1住脱rdrtWXh9% B(lt-ifpJ!辺1 Wl! ttandlftO&331S 5t33D5040354012160D.732 4050.074057 45190.000m輔mtQfIMIO5677464: F t 曲 2 F协方號毬怙计”llg熬g補WsldZ95% R J-.ir=whcoflSBfiflg;093卿J1W?018SB644 6724 343OODQOQ541571QG3119.591 241U9503H;时我们再来看龍机部分的分折结果,甘计值比恿来小整參,说明之前祯归在随 机效应巾的銮异被新加入固定效应
11、巾的克望所8釋棹了,也iftfflilfittA的变堕便得 原敷狐的层次累集性璋诙通过以上分析,我们看到,在固定因素中加入入学成绩这个变量以后,对于层次 聚集性起到了减弱的效果,但是该影响仍然存在,说明还需要引入其他变量以完善模型,之前讲过,数据聚集性除了表现在聚集因素间指标的均值水平不同外,还 表现在不同聚集因素间的指标离散度上,我们现在将11岁时的入学成绩这个变量加入随机因素中。点随机按钮将娈量纳 入模型 2肉束囱对数似兰朋Atalke(AIC)Hunrich ft I Tsai .ii 1(A!CC)Bczdogan 的貞 fl (CAIC)Schwarz -I1一一Bayesian 必
12、9335.6779341 677B341 6839363.60293C0.602mt-八訓小:你川厂二山讯亡XI3固亜宣:鶴岁威酚信息条井值进一步降 低说明将该娈量引 入至随机效应中罡有 敦果餌伯息条ft戶2换旬索的时Akalk 9335.677金的信息睾件別 Hundch ftlTsai ii 1 (AJCC)Bozdogan 的負 fl (CAIC) Scliwarz ! Eiayzs ian 论戸CBIO9341 6778341 6839363.60293C0.602信息条件倩进一步 KfS说明齬该蜚量引 入至随机效应中罡有 敦果的fi ,t: XIa固变2 : 16罗威绩dfaF160
13、 136 93S.9MD*t mwSilOMa. Jf/1$ tIM ”dr1i&n: mndinS-57021 M0M4M4M.沁27 njMioaosum4FM79固走效应结果浸有太犬 变化,检验翳果也相同协方差挣数sizWaldZ9$%: nJl勿Its553636Q1219?44 31*Q0057S5&tv|!a 014490CJ000oeiS35137174如”lit【1 ! 5 ICtkOOl.tM 4749C646403.U7tn8. r;|祐冷比厲随机效应检馥中,可臥看岀斯加入的娈童屋有境计学意又的*说明门岁入学旗绩度対诃岁 是存在彩响的并且残差和粲集性因素的方差也进一步降低,
14、说明该变量的引入罡有效果 的&在将11岁毕业成绩引入到随机效应之后,层次聚集性又进一步减弱了,实际上我 们可以不断的引入变量,这样最终层次聚集性就会消失,下面我们再来引入性别、 学校类型、各学校学生在11岁入学时的平均成这三个变量。由于性别和学校类型属于分 类变量,囲此迭入因子选 框、而学校平均成绩是连续 变量蛊要 选入协变量选框I二 F.2广a- r it ei阖二嘗柜11gMdar3132酉己汕vfkt11avsi n11約” HQ rA*Aandlrth2鳖曲吕2school氓曼1BiVw停3!哪肝, 也履:情:产b,干较丰11 5 * RAMDOM ? 酩險的常建風莊已巴卩旷斷节:工叫
15、嵐广 业平“千先耐钿塔屡TflXTFTF|T用號宅11咐崔闵出?由于我们认为学校是 层次聚集性因素,因 此新加入的变量都选 入固定效应中,輸岀 的模型摘裳结果如左 图-2 StVS的对数认然ffi Akalke的信盘兼怦(AIG) Huwich八oTsai力记件 (AICC)Bozdogn 的嶷件 CCAIQ SchwasOi Bayesiin 兼件 (SIC)9305.9749311.9749311.9909323636933Q896if聶轻件独戟心占号術的溶式畀信目棊件 a因雲量:1蜩成始门息粲件值 进滾隔惟说 明引入变量 起到作用,实 际上我们可 以逐步引入 喪量进行比 按固定效应旳脸瞬
16、烫型I卜行干曲J (ifF址昔性玄距156956.499嚴后输岀的效应类型橙验gender1403271624.5S7()()()中新引入的变量中,学枝schgend261.9422 573.094类型是没用窥计学直义的stan dirt157.164726.9S6.aooavelrt161 15611 579.G01a.E 畳.固足承应启汁目4&由计dft95%WWF隕IFFKJB力 45373.06375354.3692.260.027.017575.273171gsndePO-.157903.0338554032.716-1.959DC 234278-.101529henderilQb0e1schgnd=1-.1445220175060413-1 Jfi9092-.30902318990schg nd=7l.042609,1 1622468.042.39713-.189030274BOOchgond=30bCstandlrt.5484452034157.16426.963ODO.507716.589175avslrt.363210.1O674C61 1563.4030D1.1497705766503目冬量比壺沾b因
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论