第6章 因素分析_第1页
第6章 因素分析_第2页
第6章 因素分析_第3页
第6章 因素分析_第4页
第6章 因素分析_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章因素分析6.1因素分析的原理6.2求因素负荷矩阵的初始解6.3因素旋转6.4因素分数及其应用因素分析的主要目的:对数据进行降维,浓缩,探索数据的基本结构。就是研究如何以最少的信息损失把众多的观测变量浓缩为少数几个综合指标(因素)。这些因素(Factor)能够反映原来众多的观测变量所代表的主要信息,并解释这些观测变量之间的相互依存的关系。6.1因素分析的原理因素分析的基本思想是根据相关性大小把变量分组,使得同组内的变量相关性较高,但不同组的变量相关较低.每组变量代表一个基本结构,这个基本结构称为公共因子(公因子或因素)。对于所研究的问题就可试图用最少个数的不可观测的公因子的线性组合与特殊因子之和来描述原来观测的每一个变量。6.1.1因素分析模型6.1.2因素分析中的几个概念1、因素负荷aij是xi与fj的相关系数。反映了第i个变量对第j个因素fj的相对重要性,表示变量xi与因素fj间的密切程度。2、变量的共同度(Communality)变量的共同度指观测变量的方差中由公因子(因素)决定的比例,也叫公因子方差。3、因素的方差贡献因素fj对数据的解释能力,可以用该因素所解释的总方差来衡量。等于因素负荷矩阵A中第j列的各元素的平方和。6.1.3因素分析的步骤

1、计算观测变量的相关矩阵,并判断是否适合做因素分析;2、抽取因素。确定因素个数和求解的方法;3、因素旋转。目的是通过坐标变换使得因素解的含义更容易解释;4、计算因素分数。6.1.4判断一组观测数据是否适合做因素分析1、反映象相关矩阵(Anti-imagecorrelationmatrix)它的元素等于负的偏相关系数,其绝对值应该很小时,适合做因素分析。2、巴特利特球形检验(Bartletttestofsphericity)零假设为相关矩阵是单位矩阵。拒绝零假设时,适合做因素分析。3、KMO测度KMO:0.9以上,非常适合;0.8以上,较适合;0.7,一般;0.6,较不适合;0.5以下,很不适合做因素分析。6.2求因素负荷矩阵A的初始解-----因素抽取6.2.1主成分(Principalcomponents)分析法1、主成分分析法的原理通过数学变换的方法,将一组(p个)相关的变量转化成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中,保持变量的总方差不变,使第一个变量具有最大的方差,称为第一主成分,第二个变量的方差次大,并且与第一个变量不相关,成为第二主成分,依次类推,p个变量就有p个主成分。这些主成分之间互不相关。2、主成分的几何意义3、主成分的求解设R为p个观测变量的相关矩阵,非奇异的。由于R是实对称矩阵,通过求解可得到R的p个非零特征值,从大到小排列为:

1>2>…>p>0,对应的一组正交的单位特征向量为V1,V2,…,Vp.Vi=(v1i,v2i,…,vpi)‘,则V=(V1,V2,…,Vp)为正交阵。满足VV’=V’V=I,令Q=diag(1,2,…,p),RV=VQ,R=VQV’,令f=V’X,则f的协方差阵M=E(FF’)=E(V’XX’V)=V’E(XX’)V=V’RV=Q=diag(1,2,…,p),第k个主成分为fk=V’kX4、主成分的性质(1)主成分之间互不相关,且fk的方差等于

k;(2)1+2+…+p=p;5、因素个数的确定(1)特征值法取特征值大于等于1的主成分作为初始解,放弃特征值小于1的主成分。(2)碎石图检验法按照因素被抽取的顺序画出特征值随因素个数变化的散点图。根据图的形状来判断因素的个数。曲线变平开始的前一点认为是抽取的最大因素个数。6、主成分分析法的应用(1)降低所研究的数据空间的维度;(2)可通过因子负荷的结构,弄清x变量间的某些关系;(3)多维数据的一种图形表示方法。(4)有主成分法构造回归模型。把各主成分作为新的自变量代替原来自变量x做回归分析;(5)用主成分分析筛选回归变量。6.2.2公因子分析法因素分析模型:x=Af+

V(x)=V(Af+)=E[(Af+)(Af+)’]=AV(f)A’+V(),即=AA’+D,因为x是标准化的变量,所以=R,R=AA’+D主成分分析法从解释变量的方差出发,假设变量的方差能完全被主成分解释。而公因子法从解释变量之间的相关系数出发,假设观测变量之间的相关能完全被公因子解释,变量的方差不一定能完全被公因子解释。公因子模型求解时,只考虑公因子方差。几种公因子法:1、主轴因子法(Principalaxisfactoring)用公因子方差代替相关矩阵主对角线上的元素1,通过该矩阵,类似主成分法求因子解。2、最小二乘法(Leastsquares)通过使因素模型计算出的相关系数AA‘和观测到的相关系数R之间的离差平方和达到最小来求因子解。3、最大似然法(Maximumlikelihood)假设样本来自多元正态总体,通过构造样本的似然函数,其中因子负荷为未知参数,使似然函数达到最大,求得因子解。4、因子抽取法(Alphafactoring)5、映象分析法(Imageanalysis)6.2.3不同的因子求解法对结果的影响当变量个数p不大时,主成分法和公因子法的结果会有差异,当p较大时两者的差异不大。最大似然法比其他解的精度明显提高。决定选用哪种方法,需要考虑两点:1、进行因素分析的目的;2、对变量方差的了解程度。如果目的是简化数据,以最少的因素最大程度地解释原始数据的方差,或者知道特殊因素和误差带来的方差很小,则适合用主成分法。如果是确定数据的结构,且要易于解释,但不了解变量方差的情况,则适合用公因子法。6.3因素旋转--解释因素因素的初始解达到了简化数据的目的,但往往很难解释因素的意义,因为大多数因素都和很多变量相关。因素旋转的目的是通过改变坐标轴的位置,重新分配各个因素所解释的方差的比例,是因素结构更简单,便于解释。转轴过程中不改变模型对数据的拟合程度,也不改变每个变量的公因子方差(共同度)。因素旋转方法分为两种:正交旋转和斜交旋转。正交旋转要求因素轴之间仍然保持90度,即旋转后因素之间是不相关的。而斜交旋转中,因素之间的夹角是任意的,因素之间不一定是正交的。转轴前的结果转轴后的结果6.3.1正交旋转方法(Orthogonalrotation)1、四次方最大法(QUARTIMAX)从简化因素负荷矩阵的行出发,通过旋转因素使得每个变量只在一个因素上有较高的负荷,在其他因素上有尽可能低的负荷,此时因素解释是最简单的。该方法使得因素负荷矩阵中每一行因素负荷平方的方差达到最大。其规则为:2、方差最大法(VARIMAX)从简化因素负荷矩阵的每一列出发,使和每个因素有关的负荷平方的方差达到最大。当只有少数几个变量在某个因素上具有较高的负荷时,对因素的解释是最简单的。方差最大法希望通过旋转使得每个因素上的负荷尽可能地拉开距离,一部分变量的负荷接近1,另一部分的负荷接近0.方差最大法通过使下式达到最大求得因素解:3、等量最大法(EQUIMAX)把四次方最大法和方差最大法结合起来,取V和Q的加权平均作为简化准则,通过使下式达到最大求得最后因子解。6.3.2斜交旋转法(Obliquerotation)斜交旋转法允许因素之间相关,这时,因素结构更加简洁,更容易解释。最常见的求斜交因素解的方法为OBLIMIN。用该方法得到的因素解使变量尽量落在主轴附近。参数控制因素斜交的程度,取值一般小于等于零。等于零时,因素之间的斜交程度最大,小于0时因子之间的斜交程度减小。因素模式和因素结构因素分析中,因素负荷矩阵称为因素模式(Factorpattern)矩阵。因素结构(Factorstructure)矩阵指因素和观测变量之间的相关矩阵。在正交因素解中,两者是等同的,不加区别;而在斜交因素解中,因素负荷不再等于因素和变量之间的相关系数,它们之间是有区别的。因素模式矩阵因素结构矩阵因素相关矩阵6.3.3旋转方法的选择选择哪种旋转方法主要看研究问题的目的。如果目标只是为了简化数据,而因素确切的含义并不重要,应该选用正交旋转法。如果目标是要得到几个理论上有意义的因素,要求因素容易解释,应该用斜交旋转法。6.3.4解释因素通过前面的步骤得到因素解(负荷矩阵)后,需要对每一个因素进行解释,给出一个有意义的名称。对因素命名,首先要从负荷矩阵中找出每个因素上有显著负荷的变量,然后,根据这些变量的意义和共性对因素命名。一般认为绝

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论