多元统计分析课件因子分析_第1页
多元统计分析课件因子分析_第2页
多元统计分析课件因子分析_第3页
多元统计分析课件因子分析_第4页
多元统计分析课件因子分析_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2022-7-41cxtMultivariate Statistics Analysis 多元统计分析多元统计分析2022-7-42cxt 7.1 7.1 因子分析概述因子分析概述 7.2 7.2 因子分析的数学模型因子分析的数学模型 7.3 7.3 因子载荷阵的估计因子载荷阵的估计 7.4 7.4 因子旋转因子旋转 7.5 7.5 因子得分因子得分 7.6 7.6 因子分析的上机实现因子分析的上机实现2022-7-43cxt因子分析的重点因子分析的重点v 1 1、什么是因子分析?、什么是因子分析?v 2 2、因子分析的基本思想、因子分析的基本思想v 3 3、因子分析的数学模型以及模型中公共因

2、子、因子分析的数学模型以及模型中公共因子、 因子载荷、变量共同度的统计意义因子载荷、变量共同度的统计意义v 4 4、因子旋转的意义、因子旋转的意义 v 5 5、因子分析的软件实现、因子分析的软件实现2022-7-44cxt7.1 7.1 因子分析的概述因子分析的概述v 1 1、什么是因子分析?、什么是因子分析? 因子分析因子分析(Factor (Factor AnalysisAnalysis) )是主成分分是主成分分析的推广,也是利用析的推广,也是利用降维降维的思想,由研究原始的思想,由研究原始变量相关矩阵或协方差矩阵的内部依赖关系出变量相关矩阵或协方差矩阵的内部依赖关系出发,把一些具有错综复

3、杂关系的多个变量归结发,把一些具有错综复杂关系的多个变量归结为少数几个综合因子,以再现原始变量与因子为少数几个综合因子,以再现原始变量与因子之间的关系,并可以根据不同因子对变量进行之间的关系,并可以根据不同因子对变量进行聚类的一种多元统计分析方法。聚类的一种多元统计分析方法。2022-7-45cxt2 2、因子分析的基本思想:、因子分析的基本思想:v 基于变量之间的相关性,通过对变量相关基于变量之间的相关性,通过对变量相关系数矩阵结构的研究,找出能控制所有变量系数矩阵结构的研究,找出能控制所有变量的少数几个随机变量即因子来描述多个变量的少数几个随机变量即因子来描述多个变量之间的相关性,从而将每

4、个原始变量分解成之间的相关性,从而将每个原始变量分解成两部分:一部分是由所有变量共同具有的少两部分:一部分是由所有变量共同具有的少数几个数几个公共因子公共因子,另一部分是每个变量独自,另一部分是每个变量独自具有的因素,即具有的因素,即特殊因子特殊因子。2022-7-46cxt (1)为了解学生的学习能力,观测了为了解学生的学习能力,观测了n个学生个学生p个科目的成个科目的成绩绩,用用X1, X2, , Xp 表示科目(例如代数、几何、语文、物表示科目(例如代数、几何、语文、物理,理,)可以认为各科目由)可以认为各科目由两部分组成两部分组成: 其中其中F是对所有的是对所有的Xi都起作用的公共因子

5、,它表示智能都起作用的公共因子,它表示智能高低的因子;系数高低的因子;系数ai称为因子载荷,表示第称为因子载荷,表示第i各科目在智能各科目在智能高低上的体现;高低上的体现; i 是科目变量特有的特殊因子,描述是科目变量特有的特殊因子,描述原始变量原始变量.这就是一个最简单的因子模型这就是一个最简单的因子模型 (2) 推广到推广到m个因子,如数学因子、记忆因子、计算因子个因子,如数学因子、记忆因子、计算因子等,分别记为等,分别记为F1,Fm。 这就是一个因子分析模型这就是一个因子分析模型1,.,iiiXa Fip1122iiiimmiXa Fa Fa F2022-7-47cxt公因子公因子F1公

6、因子公因子F2共同度共同度hi特殊因子特殊因子ix1=代数代数0.8960.3410.9190.081x2=几何几何0.8020.4960.8890.111x3=语文语文0.5160.8550.9970.003x4=物理物理0.8410.4440.9040.096x5=化学化学0.8330.4340.8820.118特征值特征值 G3.1131.4794.9590.409方差贡献率方差贡献率(变异量)(变异量)62.26%29.58%91.85%因子分析案例因子分析案例F F1 1 体现数理逻辑思维和运算能力,体现数理逻辑思维和运算能力,F F2 2 体现语言思维能力体现语言思维能力2022-

7、7-48cxt3 3、因子分析的目的:、因子分析的目的:(1)(1)简化变量维数。简化变量维数。即以最少的共同因素(公共因即以最少的共同因素(公共因子),再现因子与原始变量之间的内在联系。子),再现因子与原始变量之间的内在联系。(2)(2)用于分类,可以对变量或样品进行分类。用于分类,可以对变量或样品进行分类。o R R型和型和Q Q型因子分析型因子分析(1)R(1)R型:型: 从变量的相关阵出发,找出控制所有变量从变量的相关阵出发,找出控制所有变量的几个公共因子,用以对变量进行分类。的几个公共因子,用以对变量进行分类。(2)Q(2)Q型:型: 从样本的相似矩阵出发,找出控制所有样从样本的相似

8、矩阵出发,找出控制所有样品的几个主要因素,对样品进行分类。品的几个主要因素,对样品进行分类。 。2022-7-49cxt例:在企业形象或品牌形象的研究中,消费者通过一个有例:在企业形象或品牌形象的研究中,消费者通过一个有2424个指标构成的评价体系,评价百货商场的个指标构成的评价体系,评价百货商场的2424个方面的个方面的优劣。优劣。v 但消费者主要关心的是三个方面,即商店的环境、商店但消费者主要关心的是三个方面,即商店的环境、商店的服务和商品的价格。因子分析方法可以通过的服务和商品的价格。因子分析方法可以通过2424个变量个变量之间的相关性,找出反映商店环境、商店服务水平和商之间的相关性,找

9、出反映商店环境、商店服务水平和商品价格的三个潜在的因子,对商店进行综合评价品价格的三个潜在的因子,对商店进行综合评价:v 称称F F1 1、F F2 2、F F3 3是不可观测的潜在因子是不可观测的潜在因子, ,称为公共因子。是称为公共因子。是2424个变量共同具有的,但是每个变量又有自己的个性,个变量共同具有的,但是每个变量又有自己的个性,不被不被包含的部分包含的部分i i ,称为特殊因子。,称为特殊因子。iiiiiiFFFx3322112022-7-410cxt7.2 因子分析的数学模型因子分析的数学模型一、正交因子模型:以一、正交因子模型:以R R型因子分析为例型因子分析为例设有设有p

10、p个变量个变量X Xi i(i=1,2i=1,2p p)之间有较强的相关性,)之间有较强的相关性,如果如果Xi i可以可以表示为表示为1122iiiimmiXa Fa Fa F)(pm 111121112212222212mmppppmpmXFXFXFXAF或 简 记 为 :用矩阵表示:用矩阵表示:2022-7-411cxt(1 1)(2 2) 称称 为公共因子,是不可观测的变量,为公共因子,是不可观测的变量,系数系数a aijij称为因子载荷。称为因子载荷。 是特殊因子,是不能被前是特殊因子,是不能被前m m个公共因子包含的部分。其中:个公共因子包含的部分。其中:mFFF,21icov( ,

11、 )0,F,F相互独立即不相关;相互独立即不相关;IFD111)(mFFF,21即即 互不相关,方差为互不相关,方差为1 1。2022-7-412cxt(3 3)22221)(pD即即 i互不相关,方差不一定相等,互不相关,方差不一定相等, 。满足以上条件的,称为满足以上条件的,称为正交因子模型正交因子模型如果()不成立,即如果()不成立,即 , ,各公共因子之间不独各公共因子之间不独立,则因子分析模型为立,则因子分析模型为斜交因子模型斜交因子模型), 0(2iiNIFD)(2022-7-413cxt二、因子分析模型的性质二、因子分析模型的性质 1、原始变量、原始变量X的协方差矩阵的分解的协方

12、差矩阵的分解X = AF + ( )( )( )VarVarVarX = AF A +x = AA +DA是因子模型的系数矩阵22212( )(,)pVardiagDD的主对角线上的元素值越小,则原始变量方差被公因子的主对角线上的元素值越小,则原始变量方差被公因子分解的越多。分解的越多。2022-7-414cxt2、因子载荷不是惟一的、因子载荷不是惟一的 设设T为一个为一个mm的正交矩阵,令的正交矩阵,令A*=AT,F*=TF,则模型可以表示为则模型可以表示为*XA F + ()ET F0( )E0*()()( )VarVarVarFT FTF TI22212( )(,)pVardiag*co

13、v()()EF ,F 0且满足条件因子模型的条件2022-7-415cxt三、因子分析模型中几个重要统计量的意义三、因子分析模型中几个重要统计量的意义:1.1.因子载荷因子载荷a aijijii1 1i2 2im miXFFFaaamijji 1mjii 1ijCov(X ,F )cov(,F ) cov(,F )cov(,Fj) ikkiikka Fa Facov(*,) var(*)var()ijijijXFraXF当变量经过标准化处理时:当变量经过标准化处理时:表示表示X Xi i依赖于依赖于F Fj j的程度。的程度。反映第反映第i i个原始变量在第个原始变量在第j j个公共个公共因子

14、上的相对重要性。因子上的相对重要性。a aijij绝对值越大,则公共因子绝对值越大,则公共因子F Fj j与与原有变量原有变量X Xi i的关系越强。的关系越强。2022-7-416cxt2.2.变量变量共同度共同度-又称又称共性方差或公因子方差共性方差或公因子方差(community或或common variance)是因子载荷矩是因子载荷矩阵的第阵的第i i行的元素的平方和。行的元素的平方和。 表示所提的表示所提的m m个公共因子变量对变量个公共因子变量对变量X Xi i的方差所的方差所做的贡献,从共同性的大小可以判断这个原始实做的贡献,从共同性的大小可以判断这个原始实测变量与公共因子间之

15、关系程度。测变量与公共因子间之关系程度。l 特殊因子方差(剩余方差)特殊因子方差(剩余方差)-各变量的特殊因素各变量的特殊因素影响大小就是影响大小就是1 1减掉该变量共同度的值。减掉该变量共同度的值。mjijiah1222022-7-417cxt统计意义统计意义:11iiimmiXa Fa F两边求方差两边求方差 )()()()(2112imimiiVarFVaraFVaraXVar221221iimjiijha 所有的公共因子和特殊因子对变量所有的公共因子和特殊因子对变量X Xi i的贡献为的贡献为1 1。h hi i2 2反映了全部公共因子对变量反映了全部公共因子对变量X Xi i的影响,

16、是全部公共因子的影响,是全部公共因子对变量方差所做出的贡献,或者说对变量方差所做出的贡献,或者说X Xi i对公共因子的共同对公共因子的共同依赖程度,称为公共因子对变量依赖程度,称为公共因子对变量X Xi i的方差贡献。的方差贡献。 H Hi i2 2接近于接近于1 1,表明该变量的原始信息几乎都被选取的,表明该变量的原始信息几乎都被选取的公共因子说明了。公共因子说明了。 特殊因子的方差,反映了原有变量方差中无法特殊因子的方差,反映了原有变量方差中无法被公共因子描述的比例。被公共因子描述的比例。2i2022-7-418cxt 3 3、公共因子、公共因子 方差贡献的统计意义方差贡献的统计意义jF

17、因子载荷矩阵中第因子载荷矩阵中第j j列元素的平方和列元素的平方和 表示公因子表示公因子F Fj j对所有的变量对所有的变量X X的方差贡献。衡量的方差贡献。衡量F Fj j的的相对重要性。相对重要性。piijjaS122022-7-419cxt四、四、因子的基本内容因子的基本内容1 1、因子分析的基本步骤:、因子分析的基本步骤:(1 1)因子分析的前提条件鉴定)因子分析的前提条件鉴定 考察原始变量之间是否存在考察原始变量之间是否存在较强的相关关系较强的相关关系,是,是否适合进行因子分析。因为:否适合进行因子分析。因为: 因子分析的主要任务之一就是对原有变量中信因子分析的主要任务之一就是对原有

18、变量中信息重叠的部分提取和综合成因子,最终实现减少变息重叠的部分提取和综合成因子,最终实现减少变量个数的目的。所以要求原有变量之间应存在较强量个数的目的。所以要求原有变量之间应存在较强的相关关系。否则,如果原有变量相互独立,不存的相关关系。否则,如果原有变量相互独立,不存在信息重叠,也就无需进行综合和因子分析。在信息重叠,也就无需进行综合和因子分析。(2 2)因子提取)因子提取 研究如何在样本数据的基础上提取综合因子。研究如何在样本数据的基础上提取综合因子。2022-7-420cxt(3 3)因子旋转)因子旋转 通过正交旋转或斜交旋转使提取出的因子具有可通过正交旋转或斜交旋转使提取出的因子具有

19、可解释性。解释性。(4 4)计算因子得分)计算因子得分 通过各种方法求解各样本在各因子上的得分,为通过各种方法求解各样本在各因子上的得分,为进一步分析奠定基础。进一步分析奠定基础。2022-7-421cxt2 2、因子分析前提条件、因子分析前提条件相关性分析:相关性分析:分析方法主要有:分析方法主要有:(1 1)计算相关系数矩阵)计算相关系数矩阵( (correlation coefficients correlation coefficients matrixmatrix) ) 如果相关系数矩阵中的大部分相关系数值均小如果相关系数矩阵中的大部分相关系数值均小于于0.30.3,即各变量间大多为

20、弱相关,原则上这些,即各变量间大多为弱相关,原则上这些变量不适合进行因子分析。变量不适合进行因子分析。(2 2)计算反映象相关矩阵()计算反映象相关矩阵(Anti-image Anti-image correlation matrixcorrelation matrix) )2022-7-422cxt 反映象相关矩阵,如果其主对角线外的元素大反映象相关矩阵,如果其主对角线外的元素大多绝对值较小,对角线上的元素值较接近多绝对值较小,对角线上的元素值较接近1 1,则说,则说明这些变量的相关性较强,适合进行因子分析。明这些变量的相关性较强,适合进行因子分析。 其中主对角线上的元素为某变量的其中主对角

21、线上的元素为某变量的MSA(Measure MSA(Measure of Sample Adequacy)of Sample Adequacy): r rijij是变量是变量X Xi i和变量和变量X Xj j(i ij)间的简单相关系数,)间的简单相关系数,P Pijij是变量是变量X Xi i和变量和变量X Xj j ( i ij )在控制了其他变量影响下在控制了其他变量影响下的偏相关系数,即净相关系数。的偏相关系数,即净相关系数。MSAMSA取值在取值在0 0和和1 1之间,之间,越接近越接近1 1,意味着变量,意味着变量X Xi i与其他变量间的相关性越强,与其他变量间的相关性越强,越

22、接近越接近0 0则相关性越弱。则相关性越弱。ijijijijijijiprrMSA2222022-7-423cxt(3 3)巴特利特球度检验()巴特利特球度检验(Bartlett test of Bartlett test of sphericitysphericity) ) 该检验以原有变量的相关系数矩阵为出发点,其零该检验以原有变量的相关系数矩阵为出发点,其零假设假设H H0 0是:相关系数矩阵为单位矩阵是:相关系数矩阵为单位矩阵,即相关系数矩阵,即相关系数矩阵主对角元素均为主对角元素均为1 1,非主对角元素均为,非主对角元素均为0 0。(即原始变量。(即原始变量之间无相关关系)。之间无相

23、关关系)。 依据相关系数矩阵的行列式计算可得其近似服从卡依据相关系数矩阵的行列式计算可得其近似服从卡方分布。如果统计量卡方值较大且对应的方分布。如果统计量卡方值较大且对应的sigsig值小于给值小于给定的显著性水平定的显著性水平a a时,零假设不成立。即说明相关系数时,零假设不成立。即说明相关系数矩阵不太可能是单位矩阵,变量之间存在相关关系,适矩阵不太可能是单位矩阵,变量之间存在相关关系,适合做因子分析。合做因子分析。2022-7-424cxt(4 4)KMO(Kaiser-Meyer-OlkinKMO(Kaiser-Meyer-Olkin) )检验检验 KMOKMO检验的统计量是用于比较变量

24、间简单相关系数矩阵检验的统计量是用于比较变量间简单相关系数矩阵和偏相关系数的指标,数学定义为:和偏相关系数的指标,数学定义为: KMO KMO与与MSAMSA区别是它将相关系数矩阵中的所有元素都加入区别是它将相关系数矩阵中的所有元素都加入到了平方和计算中。到了平方和计算中。KMOKMO值越接近值越接近1 1,意味着变量间的相,意味着变量间的相关性越强,原有变量适合做因子分析;越接近关性越强,原有变量适合做因子分析;越接近0 0,意味,意味变量间的相关性越弱,越不适合作因子分析。变量间的相关性越弱,越不适合作因子分析。 KaiserKaiser给出的给出的KMOKMO度量标准:度量标准:0.90

25、.9以上非常适合;以上非常适合;0.80.8表示表示适合;适合;0.70.7表示一般;表示一般;0.60.6表示不太适合;表示不太适合;0.50.5以下以下表示极不适合。表示极不适合。ijijijijijijiprrKMO2222022-7-425cxt7.37.3 因子载荷阵的估计因子载荷阵的估计因子载荷矩阵求解的方法:因子载荷矩阵求解的方法: (1 1)基于主成分模型的主成分分析法)基于主成分模型的主成分分析法 (2 2)基于因子分析模型的主轴因子法)基于因子分析模型的主轴因子法 (3 3)极大似然法极大似然法 (4 4)最小二乘法)最小二乘法 (5 5)因子提取法因子提取法 (6 6)映

26、象分析法)映象分析法2022-7-426cxt基于主成分模型的提取基于主成分模型的提取 设随机向量 的协方差为 , , 为的特征根, 为对应的标准化特征向量,则pxxx,21x021pp21u,u,u12p = UUAA +D2022-7-427cxto 上式给出的上式给出的 表达式是精确的,然而,它实际上是毫无表达式是精确的,然而,它实际上是毫无价值的,因为我们的目的是寻求用少数几个公共因子解价值的,因为我们的目的是寻求用少数几个公共因子解释,故略去后面的释,故略去后面的p-mp-m项的贡献,有:项的贡献,有:p2uuuuuuppp21122111100p212ppuuuuuu21111mm

27、mmmmp1122ppu uu uu uuuu u2022-7-428cxto 上式有一个假定,模型中的特殊因子是不重要上式有一个假定,模型中的特殊因子是不重要的,因而从的,因而从 的分解中忽略了特殊因子的方差。的分解中忽略了特殊因子的方差。12 mmm1122AA + Du uu uu uD22212(,)pdiagD其中221miiiijjsa1121122 mmp mpmmp2uuuuuDAADu2022-7-429cxt 例例: : 假定某地固定资产投资率假定某地固定资产投资率 ,通货膨胀率,通货膨胀率 ,失业率失业率 ,相关系数矩阵为,相关系数矩阵为试用主成分分析法求因子分析模型。试

28、用主成分分析法求因子分析模型。1x2x3x15/ 25/ 15/ 215/ 15/ 15/ 112022-7-430cxt(1)(1)求解特征根求解特征根(2)(2)求解特征向量:求解特征向量:(3)(3)因子载荷矩阵:因子载荷矩阵:(4)(4)因子分析模型:因子分析模型:55. 11 85. 02 6 . 03 6 . 0707. 085. 0331. 055. 1629. 06 . 0707. 085. 0331. 055. 1629. 0085. 0883. 055. 1475. 0A707. 0331. 0629. 0707. 0331. 0629. 00883. 0475. 0U54

29、8. 0305. 0783. 0548. 0305. 0783. 00814. 0569. 0211814. 0569. 0FFx3212548. 0305. 0783. 0FFFx3213548. 0305. 0783. 0FFFx2022-7-431cxt 可取前两个因子可取前两个因子F1F1和和F F2 2为公共因子,第一公因为公共因子,第一公因子子F F1 1物价就业因子,对物价就业因子,对X X的贡献为的贡献为1.551.55。第一公因。第一公因子子F F2 2为投资因子,对为投资因子,对X X的贡献为的贡献为0.850.85。共同度分别。共同度分别为为1 1,0.7060.706,

30、0.7060.706。2022-7-432cxt(2 2)基于因子分析模型的主轴因子法)基于因子分析模型的主轴因子法Principal Principal axis factoringaxis factoring 是对主成分方法的修正,假定我们首先对变量进是对主成分方法的修正,假定我们首先对变量进行标准化变换。则行标准化变换。则 R=AA+DR=AA+D R R* *=AA=R-D=AA=R-D称称R R* *为约相关矩阵,为约相关矩阵,R R* *对角线上的元素是对角线上的元素是 , ,而不是而不是1 1。2ih2022-7-433cxt 直接求直接求R R* *的前的前p p个特征根和对应

31、的正交特征向个特征根和对应的正交特征向量。得如下的矩阵:量。得如下的矩阵:2112122122212ppppphrrrhrRrrhR-D*1122ppAuuu*10pR特征根:*12,pu uu正交特征向量:2022-7-434cxt当特殊因子当特殊因子 的方差的方差已知:已知:i21222pRR*11*221122*ppppuuuuuu*1122mmAuuu2121100phhD2022-7-435cxt方差矩阵未知,估计的方法有如下几种:方差矩阵未知,估计的方法有如下几种:2iR 1 1)取)取 ,在这个情况下主因子解与主成分解等价;,在这个情况下主因子解与主成分解等价; 2 2)取)取

32、, 为为x xi i与其他所有的原始变量与其他所有的原始变量x xj j的复相关的复相关系数的平方,即系数的平方,即x xi i对其余的对其余的p-1p-1个个x xj j的回归方程的判定系数,的回归方程的判定系数,这是因为这是因为x xi i 与公共因子的关系是通过其余的与公共因子的关系是通过其余的p-1p-1个个x xj j 的线的线性组合联系起来的;性组合联系起来的; 3 3)取)取 ,这意味着取,这意味着取x xi i与其余的与其余的x xj j的简单相关系数的绝对值最大者;的简单相关系数的绝对值最大者;12ih22iiRh )( |max2ijrhiji 4 4)取)取 ,其中要求该

33、值为正数。,其中要求该值为正数。 5 5)取)取 ,其中,其中 是是 的对角元素的对角元素。pjijijirph, 121121/iiihriir1R2022-7-436cxt7.4 7.4 因子旋转因子旋转一、为什么要旋转因子?一、为什么要旋转因子? 因子分析目的不仅仅要找出公共因子以及对变因子分析目的不仅仅要找出公共因子以及对变量进行分组,更重要的要知道量进行分组,更重要的要知道每个公共因子的意义每个公共因子的意义,以便进行进一步的分析,如果每个公共因子的含义以便进行进一步的分析,如果每个公共因子的含义不清,则不便于进行实际背景的解释。不清,则不便于进行实际背景的解释。 每个公共因子的含义

34、主要取决于因子载荷阵,每个公共因子的含义主要取决于因子载荷阵,由于因子载荷阵是不惟一的,总可以对所求的载荷由于因子载荷阵是不惟一的,总可以对所求的载荷阵右乘一个正交阵得到新的载荷阵(同时对因子向阵右乘一个正交阵得到新的载荷阵(同时对因子向量左乘这个正交阵的逆矩阵),这相当于对所求的量左乘这个正交阵的逆矩阵),这相当于对所求的因子坐标进行旋转,故称为因子旋转。因子坐标进行旋转,故称为因子旋转。 因子旋转目的是因子旋转目的是使因子载荷阵的结构简化,使使因子载荷阵的结构简化,使每每个变量在尽可能少的因子上有比较高的载荷,即让个变量在尽可能少的因子上有比较高的载荷,即让每个变量在某个因子上的载荷趋于每

35、个变量在某个因子上的载荷趋于1 1,而在其他因,而在其他因子上的载荷趋于子上的载荷趋于0 0。即:即:使载荷矩阵每列或行的元使载荷矩阵每列或行的元素平方值向素平方值向0 0和和1 1两极分化。两极分化。2022-7-437cxt奥运会十项全能运动项目奥运会十项全能运动项目得分数据的因子分析得分数据的因子分析 百米跑成绩百米跑成绩 跳远成绩跳远成绩 铅球成绩铅球成绩 跳高成绩跳高成绩 400400米跑成绩米跑成绩 百米跨栏百米跨栏 铁饼成绩铁饼成绩 撑杆跳远成绩撑杆跳远成绩 标枪成绩标枪成绩 15001500米跑成绩米跑成绩 1X2X3X4X5X6X7X8X9X10X102. 017. 002.

36、 001. 039. 018. 008. 009. 007. 0124. 034. 018. 013. 017. 044. 021. 011. 0124. 033. 023. 039. 024. 036. 020. 0132. 017. 027. 073. 031. 028. 0134. 046. 036. 052. 040. 0129. 019. 049. 063. 0138. 051. 034. 0142. 035. 0159. 012022-7-438cxt因因子子载载荷荷矩矩阵阵 因子载荷矩阵可以看出,除第一因子在所有的变量因子载荷矩阵可以看出,除第一因子在所有的变量在公共因子上有较大

37、的正载荷,可以称为一般运动因子。在公共因子上有较大的正载荷,可以称为一般运动因子。其他的其他的3 3个因子不太容易解释。第二因子似乎是跑和投掷的个因子不太容易解释。第二因子似乎是跑和投掷的能力对比,第三因子似乎是长跑耐力和短跑速度的对比。能力对比,第三因子似乎是长跑耐力和短跑速度的对比。于是考虑旋转因子,得下表于是考虑旋转因子,得下表2022-7-439cxt旋转变换后的因子载荷矩阵旋转变换后的因子载荷矩阵2022-7-440cxt 通过旋转,因子有了较为明确的含义。通过旋转,因子有了较为明确的含义。 百米跑,百米跑, 跳远和跳远和 400400米跑,需要爆发力的项目在米跑,需要爆发力的项目在

38、 有较大的载有较大的载荷,荷, 可以称为短跑速度因子;可以称为短跑速度因子; 铅球,铅球, 铁饼和铁饼和 标枪在标枪在 上有较大的载荷,可上有较大的载荷,可以称为爆发性臂力因子;以称为爆发性臂力因子; 百米跨栏,百米跨栏, 撑杆跳远,撑杆跳远, 跳远和为跳远和为 跳高在跳高在 上有较大的载荷,上有较大的载荷, 爆发腿力因子;爆发腿力因子; 长跑耐力因子。长跑耐力因子。2X5X1F1F3X7X9X2F6X8X2X4X3F3F4F1X2022-7-441cxt二、因子旋转的方法二、因子旋转的方法1.1.正交旋转正交旋转 对初始载荷矩阵对初始载荷矩阵A A左乘一正交矩阵,左乘一正交矩阵,目的是使目的

39、是使新的载荷系数尽可能的接近于新的载荷系数尽可能的接近于0 0或或1,旋转后旋转后的新的公因子仍保持独立性。主要有以下方法:的新的公因子仍保持独立性。主要有以下方法:varimaxvarimax: :方差最大旋转。简化对因子的解释方差最大旋转。简化对因子的解释quartmaxquartmax: :四次最大正交旋转。简化对变量的解释四次最大正交旋转。简化对变量的解释equamaxequamax: :等量正交旋转等量正交旋转2022-7-442cxt(1 1)方差最大法()方差最大法(varimaxvarimax)方差最大法从方差最大法从简化因子载荷矩阵的每一简化因子载荷矩阵的每一列列出发,使和每

40、个出发,使和每个因子有关的因子有关的载荷的平方的方差载荷的平方的方差最大。当只有少数几个最大。当只有少数几个变量在某个因子上有较高的载荷时,对因子的解释最变量在某个因子上有较高的载荷时,对因子的解释最简单。其直观意义是希望通过因子旋转后,使每个因简单。其直观意义是希望通过因子旋转后,使每个因子上的载荷尽量拉开距离,一部分的载荷趋于子上的载荷尽量拉开距离,一部分的载荷趋于 1 1,另,另一部分趋于一部分趋于0 0。2122211211ppaaaaaaA221122212122121111FaFaXFaFaXFaFaXppp2022-7-443cxtcossinsincosT设旋转矩阵为:coss

41、insincosAATB则cossinsincoscossinsincos112112111211ppppaaaaaaaa211211ppbbbb2022-7-444cxtmax)1(21 112222 mjpipiiijiijhbphbV简化准则为:222222211111()maxppmmijijjijiiibbVpphh 2022-7-445cxt(2 2)四次方最大旋转()四次方最大旋转(quartmaxquartmax) 从从简化载荷矩阵的简化载荷矩阵的行行出发,通过旋转初始因子,出发,通过旋转初始因子,使使每个变量每个变量只在一个因子只在一个因子上有较高的载荷上有较高的载荷,而在其

42、,而在其它的因子上尽可能低的载荷。如果每个变量只在一它的因子上尽可能低的载荷。如果每个变量只在一个因子上有非零的载荷,这时的变量解释个因子上有非零的载荷,这时的变量解释是最简单是最简单的。的。 四次方最大法通过使因子载荷矩阵中每一行的四次方最大法通过使因子载荷矩阵中每一行的因子载荷平方的方差因子载荷平方的方差达到最大。达到最大。2022-7-446cxt(3 3)等量最大法)等量最大法 等量最大法把四次方最大法和方差最大法结合,等量最大法把四次方最大法和方差最大法结合,求行和列因子载荷平方的方差的加权平均最大。求行和列因子载荷平方的方差的加权平均最大。2.2.斜交旋转斜交旋转 目的使新的载荷系

43、数尽可能的接近于目的使新的载荷系数尽可能的接近于0 0或或 1 1 ;只是在旋转时,放弃了因子之间彼此独立的限制,只是在旋转时,放弃了因子之间彼此独立的限制,旋转后的新公因子更容易解释。主要有以下方法:旋转后的新公因子更容易解释。主要有以下方法:direct direct obliminoblimin: :直接斜交旋转。允许因子之间具有直接斜交旋转。允许因子之间具有相关性相关性;promaxpromax: :斜交旋转方法。允许因子之间具有相关性斜交旋转方法。允许因子之间具有相关性;2022-7-447cxt1.1.旋转变换后的变量共同度旋转变换后的变量共同度设 =( ) mm为正交矩阵,做正交

44、变换为正交矩阵,做正交变换 AB 1()()mijp pilljp plbaBmjmjmlljilijiabh111222)()(B2211111mmmmmilljilitljtjjljltt laa a 2222111()( )mmmilljililjlaahA旋转变换后的变量共同度没有变化!旋转变换后的变量共同度没有变化!三三 、旋转以后的特征、旋转以后的特征ij2022-7-448cxt2.2.旋转变换后因子的贡献旋转变换后因子的贡献设 mm为正交矩阵为正交矩阵,做正交变换,做正交变换 AB 1()()mijp pilljp plbaB222111( )()ppmjijilljiilSb

45、a B2211111ppmmmilljilitljtjililtt laa a 2222111( )pmmilljljlillaSA旋转变换后因子的贡献发生了变化旋转变换后因子的贡献发生了变化!2022-7-449cxt7.57.5、因子得分、因子得分一、因子得分的概念一、因子得分的概念 前面我们主要解决了用公共因子的线性组合来表示前面我们主要解决了用公共因子的线性组合来表示一组观测变量的有关问题。如果我们要使用这些因子做一组观测变量的有关问题。如果我们要使用这些因子做其他的研究,比如把得到的因子作为自变量来做回归分其他的研究,比如把得到的因子作为自变量来做回归分析,对样品进行分类或评价,这就

46、需要我们对公共因子析,对样品进行分类或评价,这就需要我们对公共因子进行测度,即给出进行测度,即给出公共因子的值公共因子的值。2022-7-450cxt因子分析的数学模型为:因子分析的数学模型为: 原始变量被表示为公共因子的线性组合,当载荷阵旋原始变量被表示为公共因子的线性组合,当载荷阵旋转转之后,公共因子可以做出解释,通常的情况下,之后,公共因子可以做出解释,通常的情况下,我们还想反过来把公共因子表示为原变量的线性组我们还想反过来把公共因子表示为原变量的线性组合。合。即因子得分函数:即因子得分函数:mpmppmmnFFFXXX2121222211121121pjpjjXXF11mj, 1 要求

47、得每个因子的得分,必须求得分函数的系数,要求得每个因子的得分,必须求得分函数的系数,而由于而由于pmpm,所以不能得到精确的得分,只能通过估计。所以不能得到精确的得分,只能通过估计。2022-7-451cxt二、因子得分的二、因子得分的计算:计算:1. Thomson 1. Thomson 回归法:回归法:nmnmnnmmnFFFXXX212121222211121121pjpjjXbXbF11mj, 1mmpmmppbbbbbbbbbbbb212122221112112022-7-452cxt)(jiFxijFXEji)(11pjpjiXbXbXEipjpijbb11jpjjipiibbbr

48、rr2121则,我们有如下的方程组:则,我们有如下的方程组:pjjjjpjjppppppaaabbb2121212222111211j=1,2,m2022-7-453cxt111212122212pppppp为原始变量的相关系数阵个因子得分函数的系数为第 jbbbjpjj2112jjpjaaja为 载 荷 矩 阵 第 列11111211221222212jpjjpjjppppppjbababa则:则:其中:其中:2022-7-454cxt2. 2. BartlettBartlett法法( (加权最小二乘法)加权最小二乘法)把每个样品的p个变量的取值当作因变量,把因子载荷阵A作为自变量的数据阵,

49、对于每个样品在公因子上的得分f当作未知参数,而特殊因子的取值看作误差e,于是得到如下的线性回归模型: x*=Af+e。对第对第i个样品有:个样品有:1111122112211222221122immimmippppmmmxa fa fafxa fafafxafafaf221 12 21()/minpijiiim mijxa fa fa f由于特殊因子的方差相异,所以用由于特殊因子的方差相异,所以用加权最小二乘法加权最小二乘法求得分,每求得分,每个样品各作一次,要求出所有样品的得分,需要作个样品各作一次,要求出所有样品的得分,需要作n n次。次。2022-7-455cxt7.6 7.6 因子分析

50、的上机操作因子分析的上机操作问题问题题题 项项从未从未使用使用很少很少使用使用有时有时使用使用经常经常使用使用总是总是使用使用1 12 23 34 45 5A1A1电脑电脑A2A2录音磁带录音磁带A3A3录像带录像带A4A4网上资料网上资料A5A5校园网或因特校园网或因特网网A6A6电子邮件电子邮件A7A7电子讨论网电子讨论网A8A8CAICAI课件课件A9A9视频会议视频会议A10 A10 视听会议视听会议2022-7-456cxt 题目题目编号编号A1A1A2A2A3A3A4A4A5A5A6A6A7A7A8A8A9A9A10A1001011 15 55 51 11 11 11 11 11

51、11 102022 25 55 52 22 22 21 12 21 11 103034 43 33 33 34 43 31 14 41 11 104044 43 34 44 44 44 42 24 42 22 205054 44 43 33 34 44 41 14 41 11 106064 43 33 33 33 34 42 23 32 21 107074 44 44 44 43 33 32 24 41 11 108081 15 53 31 11 11 11 11 11 11 109094 44 45 54 44 44 42 24 41 11 110105 54 43 35 55 54 43

52、35 53 33 311115 54 43 34 44 44 42 25 52 22 212125 54 45 54 44 44 43 35 52 22 213133 35 55 52 22 22 21 13 31 11 114145 53 34 43 33 33 32 25 52 22 215154 45 55 53 33 33 32 25 52 22 216164 44 44 44 43 35 51 14 41 11 117175 54 44 45 55 55 54 45 54 44 418185 54 44 42 23 34 41 15 51 11 119195 54 45 55 55

53、55 53 35 53 33 320205 54 44 45 55 55 52 25 52 21 12022-7-457cxt2022-7-458cxt 选选SPSS SPSS AnalyzeAnalyze菜单菜单中的(中的(Data ReductionData Reduction)(FactorFactor), ,出现出现【 Factor AnalysisFactor Analysis】对话框;对话框;在在【 Factor AnalysisFactor Analysis】对话框中左边的原始变量中,选对话框中左边的原始变量中,选择将进行因子分析的变量选入(择将进行因子分析的变量选入(Varia

54、blesVariables)栏。栏。 2022-7-459cxt在在【 Factor AnalysisFactor Analysis】框中选框中选【 DescriptivesDescriptives】按按钮,出现钮,出现【 DescriptivesDescriptives 】对话框;对话框;选择选择 Initial solution Initial solution (未转轴的统计量)选项未转轴的统计量)选项选择选择KMO KMO 选项选项点击(点击(ContiueContiue)按钮确定。按钮确定。2022-7-460cxt2022-7-461cxt 在在【 Factor AnalysisF

55、actor Analysis】框中框中点击点击【ExtractionExtraction】按钮按钮, ,出现出现【 Factor Analysis:Factor Analysis:ExtractionExtraction】对话框;对话框;在在Method Method 栏中选择(栏中选择(Principal componentsPrincipal components)选项;选项;在在Analyze Analyze 栏中选择栏中选择Correlation matrixCorrelation matrix选项;选项;在在Display Display 栏中选择栏中选择UnrotatedUnrot

56、ated factor solution factor solution选项;选项;在在Extract Extract 栏中选择栏中选择EigenvaluesEigenvalues over over 并填上并填上 1 1 ;点击(点击(ContiueContiue)按钮确定,回到按钮确定,回到【 Factor AnalysisFactor Analysis】对话框中。对话框中。2022-7-462cxt2022-7-463cxt2022-7-464cxt 在在【 Factor AnalysisFactor Analysis】对话框中,点击对话框中,点击【RotationRotation】按钮

57、,出现按钮,出现 【 Factor Analysis:Rotation Factor Analysis:Rotation 】(】(因子分析:旋因子分析:旋转)对话框。转)对话框。 在在Method Method 栏中栏中选择选择 VarimaxVarimax(最大变异法)最大变异法) 在在DisplayDisplay栏中栏中选择选择 Rotated solutionRotated solution(转轴后的解)转轴后的解) 点击(点击(ContiueContiue)按钮确定,回到按钮确定,回到【 Factor AnalysisFactor Analysis】对话框中。对话框中。 2022-7-

58、465cxt2022-7-466cxt 在在【 Factor AnalysisFactor Analysis】对话框中,点击【对话框中,点击【ScoresScores】按钮,出现按钮,出现 【 Factor Analysis: Scores Factor Analysis: Scores 】(】(因素分析:分因素分析:分数)对话框。数)对话框。 一般取默认值。一般取默认值。 点击(点击(ContiueContiue)按钮确定,回到按钮确定,回到【 Factor AnalysisFactor Analysis】对话框。对话框。2022-7-467cxt2022-7-468cxt在在【 Facto

59、r AnalysisFactor Analysis】对话框中,单击对话框中,单击【OptionsOptions】按钮,出按钮,出现现 【 Factor Analysis:Options Factor Analysis:Options 】(】(因素分析:选项)对话框。因素分析:选项)对话框。在在Missing Values Missing Values 栏中选择栏中选择Exclude cases Exclude cases listwiselistwise( (完全排除完全排除缺失值缺失值) )在在Coefficient Display Format(Coefficient Display Fo

60、rmat(系数显示格式系数显示格式) )栏中选择栏中选择Sorted Sorted by sizeby size(依据因素负荷量排序)项;依据因素负荷量排序)项;在在Coefficient Display Format(Coefficient Display Format(系数显示格式系数显示格式) )勾选勾选“Suppress Suppress absolute values less than”absolute values less than”,其后空格内的数字不用修改,默认其后空格内的数字不用修改,默认为为0.10.1。如果研究者要呈现所有因素负荷量,就不用选取如果研究者要呈现所有因素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论