探索性因子分析与验证性因子分析_第1页
探索性因子分析与验证性因子分析_第2页
探索性因子分析与验证性因子分析_第3页
探索性因子分析与验证性因子分析_第4页
探索性因子分析与验证性因子分析_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

探索性因子分析与验证性因子分析探索性因子分析与验证性因子分析比较研究湖北武汉杨丹全文:探索性因子分析与检验性因子分析就是因子分析的两种相同形式。它们都就是以普通因子模型为基础,但它们之间也存有着很大差异。本文通过对它们展开比较分析,找到其优劣,并对方法论分析提供更多一定的指导依据。关键词:探索性因子分析、验证性因子分析、结构方程模型现实生活中的事物就是错综复杂的,在现实的数据中,我们经常碰到的就是多元的情况,而不仅仅就是单一的自变量和单一的因变量。因此必须使用多元的分析方法,而因子分析就是其中一种非常关键的处置降维的方法。它就是将具备错综复杂关系的变量(或样品)综合为少数几个因子,以重现完整变量与因子之间的相互关系,同时根据相同因子还可以对变量展开分类。它实际上就是一种用以检验潜在结构就是怎样影响观测变量的方法。因子分析主要存有两种基本形式:探索性因子分析(exploratoryfactoranalysis)和检验性因子分析(confirmatoryfactoranalysis)。探索性因子分析(efa)致力于找到事物内在的本质结构;而检验性因子分析(cfa)就是用以检验未知的特定结构与否按照预期的方式产生促进作用。两者之间就是既有联系也有区别的,下面我们就从相同的方面展开分析比较。一、两种因子分析的相同之处两种因子分析都就是以普通因子模型为基础的。因子分析的基本思想就是通过变量的相关系数矩阵内部结构的研究,找到能够掌控所有变量的少数几个随机变量回去叙述多个变量之间的有关关系,但在这里,这少数几个随机变量就是不容观测的,通常称作因子。然后根据相关性的大小把变量分组,使同组内的变量之间相关性较低,但相同组的变量相关性较低。如图1所示,我们假定一个模型,它表明所有的观测变量(变量1到变量5)是一部分受到潜在公共因子(因子1和因子2)影响,一部分受到潜在特殊因子(e1到e5)影响的。而每个因子和每个变量之间的相关程度是不一样的,可能某给定因子对于某些变量的影响要比对其他变量的影响大一些。我们可以把图1的因子模型表示成线性函数:x1;a11f1+a12f2+£1口x2;a21f1+a22f2+£2口x3=a31f1+a32f2+£3x4;a41f1+a42f2+£4口x5;a51f1+a52f2+£5口其中f1,f2则表示两个因子,它对所有xi(i=1,2,,5)就是公有的因子,通常称作公共因子,它们的系数aij(i=1,2,,5;j=1,2)则表示第i个变量在第j个因子上的载荷。称作特定因子,£i(i=1,2,,5)则表示第i个变量无法被前两个因子包含的部分,口通常假定£in(0,oi2)。□不论是探索性因子分析还是检验性因子分析都就是为了实地考察观测变量之间的相关系数和方差协方差。高度有关的观测变量(不管就是正有关还是负相关)很可能将就是受到同样的因子影响,而相对来说有关程度不是很高的观测变量很可能将就是受到相同的因子影响的。而因子必须尽可能多地表述变量方差,每个变量在每个因子上都存有一个因子载荷,因子的意义需由看看哪些变量在哪个因子上载荷最小去同意。通过找寻潜在公共因子,并合理表述因子的意义,我们就能够阐明错综复杂的事物的内部结构。二、两种因子分析的差异(一)、基本思想的差异因子分析的基本思想是寻找公共因子以达到降维的目的。在寻找公共因子的过程中,是否利用先验信息,产生了探索性因子分析和确定性因子分析的区别。探索性因子分析是在事先不知道影响因素的基础上,完全依据资料数据,利用统计软件以一定的原则进行因子分析,最后得出因子的过程。而确定性因子分析充分利用了先验信息,是在已知因子的情况下检验所搜集的数据资料是否按事先预定的结构方式产生作用。因此探索性因子分析主要是为了找出影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度;而验证性因子分析的主要目的是决定事前定义因子的模型拟合实际数据的能力。进行探索性因子分析之前,我们不必知道我们要用几个因子,各个因子和观测变量之间的联系如何;而验证性因子分析要求事先假设因子结构,我们要做的是检验它是否与观测数据一致。探索性因子分析企图阐明一套相对比较小的变量的内在结构。研究者的假设就是每个命令变量都与某个因子相匹配。这就是因子分析最通常的形式。没先验理论形式。没先验理论,就可以通过因子载荷凭无意识推测数据的因子结构。验证性因子分析试图检验观测变量的因子个数和因子载荷是否与基于预先创建的理论的预期一致。命令变量就是基于先验理论挑选出的,而因子分析就是用来看它们与否例如预期的一样。研究者的先验假设就是每个因子都与一个具体内容的命令变量子集对应。检验性因子分析至少建议预先假设模型中因子的数目,但有时也预期哪些变量倚赖哪个因子(kimandmueller,1978b:55)。比如,研究者企图检验代表潜在变量的观测变量与否真属一类。(二)、分析方法的差异由于两种因子分析的出发点相同而产生了相同的分析方法,我们分别从两种因子分析的分析步骤去比较它们的差异。探索性因子分析主要有以下7个步骤:1、搜集观测变量。由于总体的复杂性和统计数据基本原理的确保,为了达至研究目的,我们通常使用样本的方法搜集数据。所以我们必须按照实际情况搜集观测变量,并对其展开观测,赢得观测值。2、获得协方差阵(或相似系数矩阵)。我们所有的分析都是从原始数据的协方差阵(或相似系数矩阵)出发的,这样使我们分析得到的数据具有可比性,所以首先要根据资料数据获得变量协方差阵(或相似系数矩阵)。3、确认因子个数。有时候你存有具体内容的假设,它同意了因子的个数;但更多的时候没这样的假设,你仅仅期望最后的至的模型能够用尽可能少的因子表述尽可能多的方差。如果你存有k个变量,你最多就可以抽取k个因子。通过检验数据去确认最优因子个数的方法存有很多。kaiser准则建议因子个数与相关系数矩阵的特征根个数成正比;而scree检验建议把相关系数矩阵的的特征根按从小到大的顺序排列,绘制lenses,然后去确认因子的个数。究竟使用哪种方法去确认因子个数,具体操作时可以视情况而的定。4、提取因子。因子的提取方法也有多种,主要有主成分方法、不加权最小平方法、极大似然法等,我们可以根据需要选择合适的因子提取方法。其中主成分方法一种比较常用的提取因子的方法,它是用变量的线性组合中,能产生最大样品方差的那些组合(称主成分)作为公共因子来进行分析的方法。5、因子转动。由于因子载荷阵的不能唯一性,可以对因子展开转动,而正是由于这一特征,使因子结构可以朝我们可以合理表述的方向收敛。我们用一个拓扑阵右乘坐已经获得的因子载荷阵(由线性代数所述,一次拓扑变化对应坐标系的一次转动),并使转动后的因子载荷阵结构精简。转动的方法也存有多种,例如拓扑转动、斜交转动等,最常用的就是方差最大化拓扑转动。6、解释因子结构。我们最后得到的简化的因子结构是使每个变量仅在一个公共因子上有较大载荷,而在其余公共因子上的载荷比较小,至多是中等大小。这样我们就能知道我们所研究的这些变量到底是由哪些潜在因素(也就是公共因子)影响的,哪些因素是起主要作用的,而哪些因素的作用较小,甚至可以不用考虑。7、因子罚球。因子分析的数学模型就是将变量则表示为公共因子的线性组合,由于公共因子能够充分反映完整变量的有关关系,用公共因子代表完整变量时,有时更有利于叙述研究对象的特征,因而往往须要反过来将公共因子则表示为变量的线性组合,即为因子罚球。而验证性因子分析主要有以下6个步骤:1、定义因子模型。包含挑选因子个数和定义因子载荷。因子载荷可以事先订为0或者其它民主自由变化的常数。或者在一定的约束条件下变化的数(比如说与另一载荷相等)。这是和探索性因子分析在分析方法上的一个重要差异,我们可以用一个直观的比喻,也就是说探索性因子分析是在一张白纸上作图,而验证性因子分析是在一张有框架的图上完善和修改。2、搜集观测值。定义了因子模型以后,我们就可以根据研究目的搜集观测值了。这一点与探索性因子分析存有一定的相似之处。3、获得相关系数矩阵。与探索性因子分析一样,我们的分析都是在原始数据的相关系数矩阵基础上进行的,所以首先就要得到相关系数矩阵。实际上方差协差阵、相似系数矩阵和相关阵之间是可以相互转化的。4、根据数据插值模型。我们须要挑选一个方法去估算民主自由变化的因子载荷。在多元正态的条件下,最常用的就是很大似然估算,也可以使用渐进式原产民主自由估算。5、评价模型是否恰当。这一步可以说是验证性因子分析的核心。当因子模型能够拟合数据时,因子载荷的选择要使模型暗含的相关阵与实际观测阵之间的差异最小。最好的参数被选择以后,差异量能被用来作为衡量模型与数据一致的程度。最常用的模型适应性检验是卡方拟合优度检验。原假设是模型是适应性模型,备择假设是存在显著差异。但是,这个检验受样本量大小影响,包含大样本的检验往往会导致拒绝原假设,尽管因子模型是合适的。其他的统计方法,比如用tucker-lewis指数,比较建议模型和“原模型”的拟合度。这些方法受样本量大小影响不大。6、与其他模型比较。为了获得最优模型,我们须要顺利完成这一步。如果你想要比较两个模型,其中一个就是另一个的缩略形式,你就能够从卡方统计数据量的值检查出来他们的差别,大约顺从卡方原产。几乎所有单一制因子载荷的检验能够用以做为全系列因子模型和珍因子的模型之间的比较。为以免你不是在检查全系列模型和珍模型,你可以比较均方根误差的近似值(rmsea),它就是模型中每个自由度差异的一个估计值。□三、两种因子分析方法应结合使用检验性因子分析与结构方程模型(structureequationmodeling)有著极强的联系,sem就是统计学领域中相对不太标准的领域,其具体内容原理和应用领域方法本人在另一篇文章中存有详尽了解,这里无此可知。检验性因子分析比探索性因子分析处置必须困难多了。检验性因子分析比探索性因子分析建议更大容量的样本。主要是因为检验性因子分析必须处置推断统计数据量。准确的样本量必须随着观测值和模型的因子数变化而变化,但一个标准模型至少须要200个个体。和探索性因子分析一样,模型中每个因子至少须要3个变量;与探索性因子分析相同的就是,你必须挑选与每个因子在非常大程度上相匹配的变量,而不是可能将就是潜在变量的“随机样本”。一般来说,如果你没有坚实的理论基础支撑,有关观测变量内部结构,一般用探索性因子分析。先用探索性因子分析产生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论