探索性因子分析与验证性因子分析_第1页
探索性因子分析与验证性因子分析_第2页
探索性因子分析与验证性因子分析_第3页
探索性因子分析与验证性因子分析_第4页
探索性因子分析与验证性因子分析_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

探索性因子分析与验证性因子分析比较研究湖北武汉杨丹摘要:探索性因子分析与验证性因子分析是因子分析的两种不同形式。它们都是以普通因子模型为基础,但它们之间也存在着较大差别。本文通过对它们进行比较分析,找出其异同,并对实证分析提供一定的指导根据。核心词:探索性因子分析、验证性因子分析、构造方程模型现实生活中的事物是错综复杂的,在现实的数据中,我们经常碰到的是多元的状况,而不仅仅是单一的自变量和单一的因变量。因此要用到多元的分析办法,而因子分析就是其中一种非常重要的解决降维的办法。它是将含有错综复杂关系的变量(或样品)综合为少数几个因子,以再现原始变量与因子之间的互有关系,同时根据不同因子还能够对变量进行分类。它事实上就是一种用来检查潜在构造是如何影响观察变量的办法。因子分析重要有两种基本形式:探索性因子分析(ExploratoryFactorAnalysis)和验证性因子分析(ConfirmatoryFactorAnalysis)。探索性因子分析(EFA)致力于找出事物内在的本质构造;而验证性因子分析(CFA)是用来检查已知的特定构造与否按照预期的方式产生作用。两者之间是现有联系也有区别的,下面我们就从不同的方面进行分析比较。两种因子分析的相似之处两种因子分析都是以普通因子模型为基础的。因子分析的基本思想是通过变量的有关系数矩阵内部构造的研究,找出能控制全部变量的少数几个随机变量去描述多个变量之间的有关关系,但在这里,这少数几个随机变量是不可观察的,普通称为因子。然后根据有关性的大小把变量分组,使得同组内的变量之间有关性较高,但不同组的变量有关性较低。如图1所示,我们假定一种模型,它表明全部的观察变量(变量1到变量5)是一部分受到潜在公共因子(因子1和因子2)影响,一部分受到潜在特殊因子(E1到E5)影响的。而每个因子和每个变量之间的有关程度是不同的,可能某给定因子对于某些变量的影响要比对其它变量的影响大某些。我们能够把图1的因子模型表达成线性函数:其中表达两个因子,它对全部是公有的因子,普通称为公共因子,它们的系数表达第个变量在第个因子上的载荷。表达第个变量不能被前两个因子涉及的部分,称为特殊因子,普通假定。F1F2F1F2V1V2V3V4V5E1E2E3E5E4不管是探索性因子分析还是验证性因子分析都是为了考察观察变量之间的有关系数和方差协方差。高度有关的观察变量(不管是正有关还是负有关)很可能是受同样的因子影响,而相对来说有关程度不是很高的观察变量很可能是受不同的因子影响的。而因子必须尽量多地解释变量方差,每个变量在每个因子上都有一种因子载荷,因子的意义需由看哪些变量在哪个因子上载荷最大来决定。通过寻找潜在公共因子,并合理解释因子的意义,我们就能揭示错综复杂的事物的内部构造。二、两种因子分析的差别(一)、基本思想的差别因子分析的基本思想是寻找公共因子以达成降维的目的。在寻找公共因子的过程中,与否运用先验信息,产生了探索性因子分析和拟定性因子分析的区别。探索性因子分析是在事先不懂得影响因素的基础上,完全根据资料数据,运用统计软件以一定的原则进行因子分析,最后得出因子的过程。而拟定性因子分析充足运用了先验信息,是在已知因子的状况下检查所收集的数据资料与否按事先预定的构造方式产生作用。因此探索性因子分析重要是为了找出影响观察变量的因子个数,以及各个因子和各个观察变量之间的有关程度;而验证性因子分析的重要目的是决定事前定义因子的模型拟合实际数据的能力。进行探索性因子分析之前,我们不必懂得我们要用几个因子,各个因子和观察变量之间的联系如何;而验证性因子分析规定事先假设因子构造,我们要做的是检查它与否与观察数据一致。探索性因子分析试图揭示一套相对比较大的变量的内在构造。研究者的假定是每个批示变量都与某个因子匹配。这是因子分析最普通的形式。没有先验理论形式。没有先验理论,只能通过因子载荷凭知觉推断数据的因子构造。验证性因子分析试图检查观察变量的因子个数和因子载荷与否与基于预先建立的理论的预期一致。批示变量是基于先验理论选出的,而因子分析是用来看它们与否如预期的同样。研究者的先验假设是每个因子都与一种具体的批示变量子集对应。验证性因子分析最少规定预先假设模型中因子的数目,但有时也预期哪些变量依赖哪个因子(KimandMueller,1978b:55)。例如,研究者试图检查代表潜在变量的观察变量与否真属于一类。(二)、分析办法的差别由于两种因子分析的出发点不同而产生了不同的分析办法,我们分别从两种因子分析的分析环节来比较它们的差别。探索性因子分析重要有下列7个环节:1、收集观察变量。由于总体的复杂性和统计基本原理的确保,为了达成研究目的,我们普通采用抽样的办法收集数据。因此我们必须按照实际状况收集观察变量,并对其进行观察,获得观察值。2、获得协方差阵(或相似系数矩阵)。我们全部的分析都是从原始数据的协方差阵(或相似系数矩阵)出发的,这样使我们分析得到的数据含有可比性,因此首先要根据资料数据获得变量协方差阵(或相似系数矩阵)。3、拟定因子个数。有时候你有具体的假设,它决定了因子的个数;但更多的时候没有这样的假设,你仅仅但愿最后的到的模型能用尽量少的因子解释尽量多的方差。如果你有k个变量,你最多只能提取k个因子。通过检查数据来拟定最优因子个数的办法有诸多。Kaiser准则规定因子个数与有关系数矩阵的特性根个数相等;而Scree检查规定把有关系数矩阵的的特性根按从小到大的次序排列,绘制成图,然后来拟定因子的个数。终究采用哪种办法来拟定因子个数,具体操作时能够视状况而定。4、提取因子。因子的提取办法也有多个,重要有主成分办法、不加权最小平办法、极大似然法等,我们能够根据需要选择适宜的因子提取办法。其中主成分办法一种比较惯用的提取因子的办法,它是用变量的线性组合中,能产生最大样品方差的那些组合(称主成分)作为公共因子来进行分析的办法。5、因子旋转。由于因子载荷阵的不唯一性,能够对因子进行旋转,而正是由于这一特性,使得因子构造能够朝我们能够合理解释的方向趋近。我们用一种正交阵右乘已经得到的因子载荷阵(由线性代数可知,一次正交变化对应坐标系的一次旋转),使旋转后的因子载荷阵构造简化。旋转的办法也有多个,如正交旋转、斜交旋转等,最惯用的是方差最大化正交旋转。6、解释因子构造。我们最后得到的简化的因子构造是使每个变量仅在一种公共因子上有较大载荷,而在其它公共因子上的载荷比较小,至多是中档大小。这样我们就能懂得我们所研究的这些变量终究是由哪些潜在因素(也就是公共因子)影响的,哪些因素是起重要作用的,而哪些因素的作用较小,甚至能够不用考虑。7、因子得分。因子分析的数学模型是将变量表达为公共因子的线性组合,由于公共因子能反映原始变量的有关关系,用公共因子代表原始变量时,有时更利于描述研究对象的特性,因而往往需要反过来将公共因子表达为变量的线性组合,即因子得分。而验证性因子分析重要有下列6个环节:1、定义因子模型。涉及选择因子个数和定义因子载荷。因子载荷能够事先定为0或者其它自由变化的常数。或者在一定的约束条件下变化的数(例如与另一载荷相等)。这是和探索性因子分析在分析办法上的一种重要差别,我们能够用一种直观的比方,也就是说探索性因子分析是在一张白纸上作图,而验证性因子分析是在一张有框架的图上完善和修改。2、收集观察值。定义了因子模型后来,我们就能够根据研究目的收集观察值了。这一点与探索性因子分析有一定的相似之处。3、获得有关系数矩阵。与探索性因子分析同样,我们的分析都是在原始数据的有关系数矩阵基础上进行的,因此首先就要得到有关系数矩阵。事实上方差协差阵、相似系数矩阵和有关阵之间是能够互相转化的。4、根据数据拟合模型。我们需要选择一种办法来预计自由变化的因子载荷。在多元正态的条件下,最惯用的是极大似然预计,也可采用渐进分布自由预计。5、评价模型与否恰当。这一步能够说是验证性因子分析的核心。当因子模型能够拟合数据时,因子载荷的选择要使模型暗含的有关阵与实际观察阵之间的差别最小。最佳的参数被选择后来,差别量能被用来作为衡量模型与数据一致的程度。最惯用的模型适应性检查是卡方拟合优度检查。原假设是模型是适应性模型,备择假设是存在明显差别。但是,这个检查受样本量大小影响,包含大样本的检查往往会造成回绝原假设,尽管因子模型是适宜的。其它的统计办法,例如用Tucker-Lewis指数,比较建议模型和“原模型”的拟合度。这些办法受样本量大小影响不大。6、与其它模型比较。为了得到最优模型,我们需要完毕这一步。如果你想比较两个模型,其中一种是另一种的缩略形式,你就能从卡方统计量的值检查出他们的差别,大概服从卡方分布。几乎全部独立因子载荷的检查能用来作为全因子模型和简因子的模型之间的比较。为以防你不是在检查全模型和简模型,你能够比较均方根误差的近似值(RMSEA),它是模型中每个自由度差别的一种预计值。三、两种因子分析办法应结合使用验证性因子分析与构造方程模型(StructureEquationModeling)有着极强的联系,SEM是统计学领域中相对不太原则的领域,其具体原理和应用办法本人在另一篇文章中有具体介绍,这里不在赘述。验证性因子分析比探索性因子分析解决要困难多了。验证性因子分析比探索性因子分析规定更大容量的样本。重要是由于验证性因子分析要解决推论统计量。精确的样本量要随着观察值和模型的因子数变化而变化,但一种原则模型最少需要200个个体。和探索性因子分析同样,模型中每个因子最少需要3个变量;与探索性因子分析不同的是,你必须选择与每个因子在很大程度上匹配的变量,而不是可能是潜在变量的“随机样本”。普通来说,如果你没有坚实的理论基础支撑,有关观察变量内部构造,普通用探索性因子分析。先用探索性因子分析产生一种有关内部构造的理论,再

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论