分层线性模型_第1页
分层线性模型_第2页
分层线性模型_第3页
分层线性模型_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、分层线性模型 ( hierarchical linear model HLM)的原理及应用一、概念: 分层线性模型( hierarchical linear model HLM )又名多层线性模型(MultilevelLin ear Model MLM、层次线性模型(Hierarch Lin ear Model、多层分析( Multilevel Analysis/Model )。相对于传统的两种统计方法:一般 线性模型( general linear model GLM )和广义线性模型( generalized linear models GLMS,它们又有所不同,HLM中的线性模型指的是线

2、性回归,不过它 与一般的分层线性回归( Hierarchical Regression )又是不同的,具体的不同 见下面数学模型部分。HLM又被通俗的称为“回归的回归”。Wikipedia : “一般线性回归和多重线性回归都是发生在单一层面,HLM相对于更适用于嵌套数据( nest data )。”在理解HLM之前应了解有关回归分析和嵌套设计(分层设计)的基本知识。、模型:1、假设:由于个体行为不仅受个体自身特征的影响,也受到其所处环境(群体 /层次)的影响。相对于不同层次的数据,传统的线性模型在进行变异分解时,对 群组效应分离不出, 而增大模型的误差项。 而且不同群体的变异来源也可能分布 不

3、同,可能满足不了传统回归的方差齐性假设。在模型应用方面,不同群体(层次)的数据,这些生态谬误a、个体层面:也不能应用同一模型。鉴于传统方法的局限性,分层技术则解决了( Ecological Fallacy )。它包含了两个层面的假设:这个与普通的回归分析相同,只考虑自变量X对因变量丫的影响。b、群组层面:群组因素 W分别对个体层面中回归系数和截距的影响。2、数学模型:a、个体层面:Yij= B 0j+ B 1jXij+eijb、群组层面:B 0j= 丫 00+ 丫 01Wj+U0jB 1j= 丫 10+ 丫 11Wj+U1j涉及到多个群组层次的时候原理与之类似, 可以把较低级层次的群组, 如不

4、 同的乡镇层面与不同的县市层面, 可以这样理解, 乡镇即是一个个体, 群组即是 不同的县市。 更多层次的可以这样理解, 一直是下一层对上一层回归系数和截距 的回归。与普通的“回归的回归”不同的是,整个计算过程通过迭代过程完成。3、因变量: 此处数学模型仅适用于连续的单因变量。 非连续因变量、 多因变量、 潜变量 以及非典型的嵌套设计, 多层线性模型也可以进行处理, 但对模型的设定会更复 杂。4、与分层回归的区别:a、向前回归、向后回归和逐步回归:向前回归: 根据自变量对因变量的贡献率, 首先选择一个贡献率最大的自变 量进入,一次只加入一个进入模型。然后,再选择另一个最好的加入模型,直至 选择所

5、有符合标准者全部进入回归。向后回归: 将自变量一次纳入回归, 然后根据标准删除一个最不显著者, 再 做一次回归判断其余变量的取舍,直至保留者都达到要求。逐步回归是向前回归法和向后回归法的结合。 首先按自变量对因变量的贡献 率进行排序,按照从大到小的顺序选择进入模型的变量。 每将一个变量加入模型, 就要对模型中的每个变量进行检验, 剔除不显著的变量, 然后再对留在模型中的 变量进行检验。直到没有变量可以纳入,也没有变量可以剔除为止。向前回归、 向后回归和逐步回归都要按照一定判断标准执行。 即在将自变量加入 或删除模型时,要进行偏 F 检验。b、分层回归与前三者的区别与联系:在理解分层回归与以上三

6、者的区别时,应理解以下三个概念。 总体变异:预测变量X和结果变量丫之间相关的平方,它包括该X和丫之间 的所有关系。共同变异:在每个X互相独立的理想情况下,共同变异为 0。它指的是X对 丫的影响的重叠部分。独特变异: 在控制了其他变量以后, 特定 X 对 丫的影响。 它表示了 丫中由特 定X所单独解释的变异。假如X之间存在重叠,那么它们共有的变异就会削弱独 特变异。X的独特效应指的是去除重叠效应后该 X与丫的偏相关的平方。可以看 出,X的独特变异依赖于其他预测变量。在强制回归(ENTER法)中,所有预测变量的偏决定系数之和要小于整个模型的 决定系数(R2)。总决定系数包括偏决定系数之和与共同变异

7、。 强制回归(ENTER 法)的局限性在于不能将重叠(共同)变异归因于模型中的任何一个预测变量, 每个预测变量只能分配到它所解释的独特变异, 共同变异则被抛弃了。 此时的偏 相关的平方与回归系数是等同的。 分层回归与以上三种方法则提供了一种可以将 共同变异分配给特定预测变量的方法。共同变异将会分配给优先进入模型的变 量。在分层回归中,将会把重叠(共同)变异分配给第一层模型中的预测变量。 因此,上面三种方法则是针对自变量而言的, 而分层回归则针对第一层 (优先层 的模型)。分层回归则是由研究者根据经验和理论思考来将自变量分成不同的组( block ),然后再安排每一组变量进入模型的顺序,进入的顺

8、序不是根据贡献 率,而是根据相应的理论假设。 而且, 研究者还可以为不同组的自变量选用不同 的纳入变量的方法。 从这个意义上说, 它与前面三种回归方法只是指定变量进入 模型的方式不同。c、分层回归与分层线性模型:从回归模型中, 可以看出, 分层回归更像是分组回归或者分块回归, 而与分 层线性模型中的分层,性质是完全不一样的。三、类型1、群组模型:即以上所介绍的研究背景效应的数据处理方式。2、发展模型:主要用于追踪研究的模型建构。 不同时间的观察结果 (第一层) 嵌套于被观 察个体(第二层) ,研究不同的个体对时间效应的回归系数和截距产生了何种影 响。在这个模型中,个体不是第一层,而是时间效应,

9、这是发展模型与群组模型 在模型建构上的区别。四、应用评价多层线性模型的适用范围非常广, 凡是具有嵌套和分层的数据均可使用多层 线性模型进行分析。 此外,多层线性模型还可以用于纵向研究。 采用多层分析的 方法处理重复测量数据与时间变量之间的关系。 在多层结构中可以对非平衡测量 数据得到参数的有效估计。 因此用多层分析法处理重复测量的数据, 不要求所有 的观测个体有相同的观测次数。 在纵向调查研究中, 由于各种各样的原因, 被试 个体观测值部分缺失的情况时有发生, 因此多层分析法处理缺失数据而不影响参 数估计精度的这一特征, 使得多层分析法处理在处理纵向观测数据时, 比传统多 元重复测量方法有很大

10、的优势。与传统的用于处理多元重复测量数据的方差分析和回归分析方法相比, 多层 分析法至少具有以下优点:1、多层分析法通过考虑测量水平和个体水平不同的差异,明确表示出个体在水 平 1(不同测量点) 的变化情况, 因而对于数据的解释 (个体随时间的增长趋势) 是在个体与重复测量交互作用基础上的解释,即不仅包含了不同测量点的差异, 而且包含了个体之间存在的差异。2、多层分析法对数据资料较传统多元重复测量方法有较低的要求,对于重复测 量的次数和重复测量之间的时间跨度都没有严格的限制。 不同个体可以有不同的 测量次数,测量与测量之间的时间跨度也可以不同。3、多层分析模型可以定义重复观测变量之间复杂的协方

11、差结构,并且对所定义 的不同的协方差结构进行显著性检验。 在多层分析模型中, 通过定义第一水平和 第二水平的随机变异来解释个体随时间的复杂变化情况, 当数据满足传统多变量 重复测量模型对数据的要求和假设时, 层次分析法得到与传统固定效应多元重复 测量模型相同的参数估计和假设检验结果。 用多层分析模型可以考虑更高一层的 变量,如不同地区儿童对个体增长的影响。但是多层分析模型也有缺点, 首先用于多层分析模型的参数估计方法较传统 估计参数的方法要复杂得多, 而且不能处理变量之间间接的影响关系和处理复杂 的观测变量和潜变量之间的关系。五、HLM软件分析步骤:具体操作步骤可以参看:张雷等 . 多层线性模

12、型应用 . 北京:教育科学出版社, 2005.p42.1、创建HLM可识别的数据文件(*ssm/mdm格式)a、创建SSM数据文件的原始数据准备:HLM支持的原始数据格式包括纯文本,SPSS SAS STAT等主流统计软件,如果 不兼容,可以转换成HLM支持的数据格式。一般而言,一层结构一个数据文件, 而且这些数据文件,需要存在一个同样的标识变量( ID) ,最好是数字型的。每 层的数据文件均按照这个标识变量排序。b、生成MDM文件(指定数据层级及相关信息):选择你需要建立的模型层数, 以下以两层为例。 选择群组嵌套设计还是追踪测量 设计 =浏览指定第一层的文件 =指定标识变量和非标识变量 =

13、指定对缺失数 据的处理;浏览指定第二层的文件=指定标识变量和非标识变量(HLM的高层 数据不允许缺失)。如果是两层以上的数据,原理相同,只不过最高层要指定下一层级的标识变量ID 及总标识变量。c、指定要存储的SSM文件名,生成SSM/MD文件。d、检查生成SSM是否正确。此过程对于后面的统计分析相当重要,数据的正确 性是所有准确进行统计分析的前提。2、建立模型1、指定第一层的因变量和自变量:在HLM左边的变量列表中选择因变量, 点击左键“ outcome variable ”选择 因变量,点击“ add variable group centered ”选择自变量。2、指定第二层的变量:在指定

14、第二层的自变量之前, 先建立随机回归模型来考察第一层的变量在第 二层上差异是否显著,然后根据差异情况来选择合适的第二层的变量作为自变 量。随机回归模型即是指在第二层上不做设定, 按照系统默认的模型来进行分析。 具体结果需要参考方差成分和显著性的结果, 如果方差成分不显著, 说明此因素 对因变量的影响在不同的群组之间差异不显著, 这样就没有必要在第二层以该回 归系数为因变量来建构相应的二层模型了,在设定模型时把相应 beta 固定即可B 仁丫 10。指定第二层的自变量:“ add variable uncentered ”,没有第三层时,截距意 义不重要,采用这种方法定义进入方式即可。3、模型修正及结果解释:HLM 输出结果由两部分构成:OLS回归结果与HLM结果(收缩估计)。OLS 结果与一般回归结果一致。a、信度估计:两部分结果的分界线是信度估计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论