版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三讲一般模型及其简模型再强化一下术语啊Level-1 modelLevel-2 modelCombined model254假如在学校效应的应用研究中层-1的分析单位是学生,层-2的单位是学校误差项rij的是层-1的随机效应,误差项u0j和u1j是层-2的随机效应。Var(rij)为层-1的方差,Var(u0j)、Var(u1j)和Cov(u0j,u1j)为层-2的方差协方差成分。类参数是层-1模型的系数;类参数是层-2模型的系数。当层-1只有一个自变量Xij且层-2也只有一个自变量Wj时,构成了完全HLM的最简形式若某些为0值,模型便进一步简化。增加或减少方程中的某些项,既可示范HLM的应
2、用领域,又可将HLM与常规分析方法联系起来当子模型从简单逐步转为复杂,可成为不同模型:es)带随机效应的单因素方差分析(one-wayANOVAmodelwithrandom effects)将平均数作为结果的回归模型(regressionmodelw带随机效应的单因素协方差分析(one-wayANCOVAwithrandom effects)随机系数回归模型(ramdom-coefficientsregressionmodel)将截距和斜率作为结果的回归模型(regressionmodelwithinterceptsand es)斜率非随化的模型(modelwithnonrandomlyva
3、ryingslopes)1.带随机效应的单因素方差分析(One-way ANOVA with Random Effects)最简单的HLM等价带随机效应的单因素方差分析层-1模型的1j对于所有的单位 j 被设为06假定层-1中每一项误差rij服从正态分布,均值为0且层- 1的方差2相同仅用一个层-2参数(即0j)层-1中各单位的结果0j就是第 j 个单位的平均结果,即 0 j = Yj带随机效应的单因素方差分析的层-2模型就是将方程4a中的01设为0700代表总体中结果的总平均数(grand mean)u0j为与第j个单位相联系的随机效应,并且假定其有平均数等于0和方差等于00将方程7代入方程
4、6,得8上公式即单因素方差分析模型总平均数为00分组(即层-2)效应为u0j个人(即层-1)效应为rij。但也可认为是随机效应模型,因其分组效应被解释为随机效应其结果的方差9常将单因素方差分析用作初步分析可以得到总平均数00的点估计和臵信区间分别提供了两个层次中结果的变化信息参数2代表组内变化(within-group variability)参数00捕获了组间变化(between-group variability)将方程6和方程7称为完全无条件HLM(fully unconditional),因其层-1、层-2都无自变量与单因素随机效应方差分析相连的重要指标是组内相关系数(intracla
5、ss correlation coefficient)其公式为:10这一指标测量了层-2中结果方差中各单位之间差别所占的比例。从严格意义上说,这类似于确定系数的概念。比如回归中的 R2,表达的是方差中被解释的比例,而这种解释比例不是通常所说的相关系数,而是相关系数的平方。呵呵,这个模型明白了吧随机效应的单因素方差分析就是层一层二都不设自变量意义:某校某生成绩总平均成绩学校随机误差该生随机误差学生成绩的总方差被分解为学校和学生两个层次的方差。主要功能:分层模型的方差分析与常规分析方法类似但在随机效应模型中,学校效应被定义为随机效应随机方差模型结果说明分层数据中随机总方差在两层中的比例2.将层二平
6、均数作估计结果的回归模型(Regression model with means ases)各个组的平均数通过分组特征层-1模型:层-2模型:即只在层-2模型设一个自变量Wj组合模型:61112注意u0j与方程7中的意义不同随量u0j本来是单位j的平均值与总平均值之间的离差(deviation),但现在代表残差(residual),即u0j的方差00现在是残差的方差,或称为0j在控制Wj以后的条件方差(conditional variance)注:离差通常指案例值与平均值之差,残差指观测值与回归值之差。呵呵,这个模型明白了吗以层二单位平均数作估计结果的回归即只在层二模型中设立自变量某校某生成绩
7、总平均学校特征效应+学校特征误差该生随机误差检测模型定义的宏观自变量是否显著,并描述这一作用的方向与强度在控制宏观自变量的条件下,完成层二截距随机效应的方差检验层二方差不显著,说明层二方差已无进一步解释的余地,否则需重视其它自变量该模型常用于检验组织、单位、地区等宏观特征影响的研究,但它不同于完全忽略个人变异的简单模型(即犯区位谬误的那种OLS模型)层二变量的测量层次可多样化3.带随机效应的单因素协方差分析(One-way ANCOVA with Random Effects)先重新回到完全模型再将层-2的系数01、11和随机效应u1j(对所有的j)设为0则为带随机效应的单因素协方差分析,以层
8、-1中的一个自变量作为协变量(covariate)层-1模型为方程2,自变量Xij以总平均值中心化13Level -1Level -214a14b方程14表示,对于每一个层-2单位,Xij的作用已经被规定为相同的固定值。这一组合模型成为:15随机效应协方差分析的一种扩展:引入层-2的协变量若系数01不能省略,则组合模型为16这一模型规定了层-2的协变量Wj,但也控制了层- 1的协变量Xij的影响、及层-2单位的随机效应u0j方程16的所有参数不能用经典的固定效应(fixed effects)的协方差分析因其假定协变效应(covariate effect) 10在每个组都相同,但事实上该方程存在
9、随机效应随 化系数和对非随 化系数的回归模型能摆脱回归的同质性(homogeneity)假定的约束,可以进行方程16的分析呵呵,再看一遍啊带随机效应的单因素协方差分析即只在层一模型中设立自变量功能:在控制学生特征(如智商)的条件下做协方差分析如不同类型的学校是否对学生成绩的影响是否显著(普通样0,重点校1)平均IQ重点校成绩假设:重点校成绩好是因为学生素质好,即学校没有作用。若在控制学生IQ时,学校随机效应的方普通校差不显著,则上述假设不能。否则,两类学校存在学校作用上的差异同时,该模型也能测量并检验学生IQ对学生IQ 成绩的影响。小结前3类模型上述3类子模型属于随机截距模型(random-
10、intercept models)共同特征只有层-1的截距系数0j被视为是随机的在单因素方差分析或将平均数作为结果的回归中,层-1模型不存在斜率在随机效应的协方差分析模型中,虽然包括1 j,但却限制其对所有的组有共同的效应4.随机系数回归模型(Random-coefficients Regression model)HLM主要的研究应用都涉及到将层-1的斜率设为在层-2单位之间随化最简单的情况是随机系数回归模型这类模型中,层-1的截距和层-1的一个或多个斜率是随化的,但并不想这种变化层-1模型与方程2相同层-2模型仍是方程4的简化式,其中01和11被设为017a17b其中:00是层-2所有单位
11、的平均截距10是层-2所有单位的平均回归斜率u0j是层-2上与单位 j 相连的截距上的特性增量u1j是层-2上与单位 j 相连的斜率上的特性增量将方程17a和方程17b中的0j和1j代入方程2得组合模型: 该模型意味着结果变量Yij是平均回归方程再加上随机误差的三个成分的函数:单位j对平均数的随机效应u0j,u1j是单位 j 对斜率1j的随机效应层-1误差rij呵呵,看明白了吗随机系数模型层二截距仅设误差层二斜率增设误差目的:检查学校之间回归系数(截距与斜率)是否存在差异哈,组合模型的截距与斜率都有随机误差项了学生特征的斜率系数的效应有两项一项用于所有学校的固定效应另一项是随机系数模型的特色所
12、在,即各校回归斜率的随机效应,它的存在可以导致各校斜率不同对 1 j 效应进行方差检验可检查不同学校的斜率差异是否显著只表现为误差项,而不是系数估计。若呈现差异显著,则可肯定学生特征对成绩的作用在不同学校之间存在差异,说明有必要寻找层二的自变量。在随机截距模型中,学生变量或对学生变量的测量都以总均值中心化,而随机系数模型对学生变量的测量是以学校的均值中心化5.将截距和斜率作为结果的回归模型(regression model with intercepts andes)若用随机系数回归模型估计贯穿层-2各单位的回归系数(包括截距和斜率)上的变化,则须用“将截距和斜率作为结果的回归模型”,可解决为
13、什么有些学校的均值高于其他学校?为什么有些学校社会经济状况与成绩之间的联系程度要高于其他学校?在层-1只有一个自变量Xij且层-2也只有一个自变量Wj的情况下,这些问题的解决可以运用“完全模型”的方程2和方程4。当然,这一模型也随时可扩展到分析多个X和多个 W时的效应。这个模型的特点将截距与斜率作为结果的回归模型各层各个模型都设了自变量和误差项因变量可以看作是总截距( 00 )、MEAN SES的主效应( 01 )、SECTOR的主效应( 02 )、学生个人社会经济状况SES的主效应( 10 )、以及两个层间的交互效应(即SECTOR与学生SES的互动( 12 )、以及MEAN SES与学生S
14、ES的互动( 11 )、再加上随机误差这一分析可回答的问题(1)MEANSES和SECTOR是否可以有效地截距?对01 进行估计, 在控制SECTOR后,具有较高平均SES的学校与较低平均SES的学校在数学成绩均值上是否存在差异估计02 来 在控制MEAN SES后,天主教学校和公立学校在成绩均值上是否存在差异(2)用MEANSES和SECTOR是否可以有效地各学校的斜率?在控制SECTOR条件下,对11进行估计以考察学校之间在平均SES上的差别是否影响校内学生SES与成绩间的关系。估计(在控制MEAN SES条件下) 12 来天主教学校和公立学校在学生SES与成绩之间的关系是否存在差异。(3
15、)作为自变量的SECTOR和MEAN SES可以在多大程度上解释截距和斜率的变化?可以通过估计,并且将其与以上随机系数回归模型的结果相比较来回答。6.非随化斜率模型在某些情况下,能(Nonrandom varying)回归斜率ij的变化如发现方程2.4b中层-2自变量Wj能层-1的斜率1j但实际上可以发现,在控制了Wj之后, 1j的残差方差(即方程4b中残差u1j的方差)十分接近于0。这意味着,一旦控制了Wj,斜率的方差就变得很小、甚至没有变化,不必再解释出于追求统计上有效和计算的稳定性,设u1j值等于0。消除了斜率的残差方差11、以及斜率与截距之间的残差协方差01,不用再估计其参数若方程4b
16、中的残差u1j被设为0,层-2的斜率模型将变为:20组合模型:21斜率在各组之间确实发生变化,但它们的变化却是非随机的。正如方程20所示,斜率1j的变化是严格作为Wj的函数发生的。方程21可以视为随机截距模型的特例,因为0j是唯一的一个随化于层-2各单位之间的成分。分层线性模型可以包括多个层-1自变量,并且可以设定为任何随化的、非随化的、固定的斜率组合。呵呵,再来看一下这个模型斜率在各组之间是确实发生变化的,但其变化却是非随机的,因其斜率 PJ的变化是严格作为 WJ 的函数发生的其表现为层二模型中的 WJ 能成功地回归斜率 PJ的变化同时,在控制 W之后,PJ 的残差方差十分接近于0(即残差的
17、方差PJJ),说明斜率的残余方差变得很小,甚至没有变化,意味着可解释的余地较少出于统计上的有效性及计算的稳定性,常将 PJ值设为0,消除了斜率的残差方差PP 及斜率与截距间的残差协方差 0 P即不用再将它们进行参数估计六种模型小结最具一般性分层模型(方程5)层-1只有一个自变量Xij且层-2也只有一个自变量Wj的简单的分层线性模型在这种情况下,层-1模型(方程2)定义了两个参数,即截距与斜率。正如方程4a和方程5b所示,在层-2,它们都可以由Wj来,并且都存在一个随化成分。完全模型的某些要素被强制设为无效值,就得到某种子模型,既可以作为完全分层模型分析的初步尝试,也可以作为对完全模型更简约的概
18、括单因素随机效应方差分析模型:不涉及层-1或层-2的自变量,称为完全无条件模型随机截距模型:只有一个随机的层-1系数0 j将平均数作为结果的回归模型: 随机截距模型的一种单因素随机效应协方差分析模型:基本与经典的协方差分析模型相同,只是层-2效应被视为是随机的随机系数回归模型:容许所有层-1系数随化。这种模型在层-2是无条件的层-1回归层-2回归Yi 0 j rijYij 0 j 1 j Xij rij结果变量为层-1截距结果变量为层-1斜率1.one-way ANOVA with random effect0 j 00 u0 j2. Means ases reg.0 j 00 01wj u0
19、 j3.one-wayANCOVA withrandome fect0 j 00 u0 j1 j 103same as 30 j 00 01wj u0 j1 j 104.Random coefficients reg.0 j 00 u0 j1 j 10 u1 j5.Intercepts and slope ases0 j 00 01wj u0 j1 j 10 11wj u1 j6.Nonrandomly varying slopes0 j 00 01wj u0 j1 j 10 11wj表1 各种模型参数设定比较六模型可分成随机截距模型与随化斜率模型: 单因素随机效应方差分析模型、将平均数作为结
20、果的模型、单因素协方差分析模型、以及非随 化斜率模型,都是随机截距模型 该类模型,方差成分只有层-1的方差2和层-2的方差00在方差分析及将平均数作为结果的模型中,不存在层-1斜率;在协方差分析中,层-1斜率存在但被设为贯穿层-2各个单位中固定不变。在非随化斜率模型中,斜率被设为严格作为已知Wj的函数变化,且不存在其他的随机成分。与此相反,随机系数模型和将斜率和截距作为结果的模型容许截距和斜率二者随化。随机、非随机效应与固定效应模型设置层二非随机效应模型层二随机效应模型层二固定效应模型将斜率作为结果的层二模型pj p1Wj pj p1Wjpj p 0pj p 0pj p 0pj p 0无自变量有随机项无自变量无随机项有自变量无随机项若发现层一模型各单位的斜率PJ 之间几乎是没有变化的,则可将其在层二模型中设定为固定效应(fixed effect)即固定效应的层二斜率模型中既无自变量也无随机项其它辅助统计指标单因素方差分析模型中的组内相关系数(intra-classcorrelation) 00 /(00
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度船舶股份抵押贷款合同范本4篇
- 2025年度煤矿股权转让与矿区安全生产文化培育合同4篇
- 2025版城市道路停车棚施工与运营合同范本6篇
- 二零二五年度木枋原材料供应链合作协议3篇
- 2025年度出租车租赁与乘客满意度提升合同4篇
- 2025年化纤不织布项目可行性研究报告
- 2025年山林承包权转让与生态保护合同范本4篇
- 2025年项目咨询管理合作协议范本汇编6篇
- 2025年对溴丙苯项目投资可行性研究分析报告
- 2025年度智能化批灰施工技术合作框架协议
- 课题申报书:GenAI赋能新质人才培养的生成式学习设计研究
- 骆驼祥子-(一)-剧本
- 全国医院数量统计
- 《中国香文化》课件
- 2024年医美行业社媒平台人群趋势洞察报告-医美行业观察星秀传媒
- 第六次全国幽门螺杆菌感染处理共识报告-
- 天津市2023-2024学年七年级上学期期末考试数学试题(含答案)
- 中国的世界遗产智慧树知到期末考试答案2024年
- 中国绿色食品市场调查与分析报告
- 手卫生依从性调查表
- 湖北教育出版社四年级下册信息技术教案
评论
0/150
提交评论