版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章第六章 因子分析因子分析 6.1 因子分析的基本思想因子分析的基本思想 6.2 因子载荷的求解因子载荷的求解 6.3 因子分析的基本步骤因子分析的基本步骤 6.4 因子分析的上机实现因子分析的上机实现 因子分析(factor analysis)模型是主成分分析的推广。它也是利 用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具 有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方 法。相对于主成分分析,因子分析更倾向于描述原始变量之间的相关关系; 因此,因子分析的出发点是原始变量的相关矩阵。因子分析的思想始于 1904年Charles Spearman对学生考试
2、成绩的研究。近年来,随着电子计算 机的高速发展,人们将因子分析的理论成功地应用于心理学、医学、气象、 地质、经济学等各个领域,也使得因子分析的理论和方法更加丰富。本章 主要介绍因子分析的基本理论及方法,运用因子分析方法分析实际问题的 主要步骤及因子分析的上机实现等内容。 1. 因子分析的基本思想因子分析的基本思想 因子分析的基本思想是根据相关性大小把原始变量分组,使得同组 内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变 量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结 构就称为公共因子。 例如:如何反应物价变动的情况?例如:如何反应物价变动的情况? 对各种商品的价
3、格做全面调查固然可以达到目的,但不可取。 实际上,某一类商品中其价格之间存在明显的相关性,只要选择几 种主要商品的价格或对这几种商品的价格进行综合综合商品的价格 (因子),就足以反映某一类物价的变动情况。只要抓住少数几个主要 因子(代表经济变量间的相互依赖的一种经济作用),就可以帮助我们 对复杂的经济问题进行分析和解释。 6.1 因子分析的基本思想因子分析的基本思想 1、一个典型案例:、一个典型案例: 1904年Spearman研究了33名学生在 古典语(C)、法语(F)、英语(E)、数 学(M)、判别(D)和音乐(Mu)这6门考 试成绩的相关性,得到如右的相关 矩阵R: 2. 因子分析的基本
4、理论及模型因子分析的基本理论及模型 CFEMDMu C10.830.780.70.660.63 F0.8310.670.670.650.57 E0.780.6710.640.540.51 M0.70.670.6410.450.51 D0.660.650.540.4510.4 Mu0.630.570.510.510.41 数据Xi都是标准化后的标准化指标,E(Xi)=0,D(Xi)=1 他从中发现了一个有趣的规律:任意两列的元素(不考虑对角元素)大 致成比例。 则每一科的考试成绩都遵从以下形式: 其中F是公共因子,对各科考试成绩都有影响,均值为0,方差为1。ei是特 殊因子,仅对某科有影响,且F
5、与ei相互独立。 0.830.700.660.63 1.2 0.670.640.540.51 iii Xa Fe 在上述的假设条件下, cov(,)()() ijiijjij XXE a Fea Fea a cov(,) cov(,) ijj ikk XXa i XXa 与 无关 22 var()var()var( )var( )var( ) iiiiiii XaFeaFeae且 22 var( )1 iiii aeaa于是, 称 为因子载荷, 为共同度。 ppp FaX FaX FaX 222 111 斯皮尔曼最初使用因子分析方法对学生的 考试成绩进行研究时,发现学生的古典文学、 法语、英语
6、、数学、判别以及音乐测验成绩相 关,这些成绩变量的相关性表明存在一个潜在 的“智力”因子。因子分析方法就是要确认原 始变量与潜在因子之间的这样一种结构是否存 在。 3. 一般因子分析模型一般因子分析模型 下面给出更为一般的因子分析模型:设有n个样品,每个样品观测p 个指标,这p个指标之间有较强的相关性(只有相关性较强才能从原始变 量中提取出“公共”因子)。 为了便于研究,并消除量纲及数量级不同造成的影响,将样本观察 数据标准化,不失一般性,记:Xi,即E(Xi)=0,D(Xi)=1。F1,F2,.,Fm 表示标准化的公共因子,即E(Fi)=0,D(Fi)=1。 因子分析模型的条件:因子分析模型
7、的条件: (1) 是可观测的随机向量。 是不可观测的量。 ( ),cov( )EX0XR且 1 (2)(,)() m FFmpF( ),cov( )EF0FI且 1 2 (3)( ,) ( ),cov( )(),1,2,., p ii Ediagip F 0 与相互独立,且 ),.,( 1 p XXX 则模型 称为因子模型因子模型,模型的矩阵形式为: 式中为因子载荷矩阵。 pmpmppp mm mm FaFaFaX FaFaFaX FaFaFaX 2211 222221212 112121111 AFX 公因子F1公因子F2 x1=代数10.8960.341 x2=代数20.8020.496
8、x3=几何0.5160.855 x4=三角0.8410.444 x5=解析几何0.8330.434 因子分析案例因子分析案例 该案例是对数学专业的五 门专业课进行相关性因子 分析 F1 体现逻辑思维和运算能力,F2 体现空间思维和推理能力 (1) (1)因子负荷量(或称因子载荷)因子负荷量(或称因子载荷)-是指因子结构中原始变量与因子 分析时抽取出的公共因子的相关程度。 即aij是i与j的协方差 * ii1 1i2 2im mi xFFFaaa m * ijj i 1 m ji i 1 ij Cov(x ,F )cov(,F ) cov(,F )cov( ,Fj) ikki ikk a F a
9、 F a )var(*)var( )*,cov( r ij ji ji Fx Fx r 4.4.几种统计量的统计意义几种统计量的统计意义 注意:注意: 在各公共因子不相关的前提下, (载荷矩阵中第i行,第j列的 元素)是随机变量xi与公共因子Fj的相关系数,表示xi依赖于Fj的程 度。反映了第i个原始变量在第j个公共因子上的相对重要性。因此 绝对值越大,则公共因子Fj与原有变量xi的关系越强。 ij a ij a (2)(2)共同度共同度-又称共性方差或公因子方差(community或common variance)就是观测变量的方差中由公因子决定的比例。当因子正交 时,等于每个公共因子之负荷
10、量的平方总和(一行中所有因素负荷量 的平方和)。变量 的共同度是因子载荷矩阵的第i行的元素的平方 和。记为 。 m j iji ah 1 22 从共同性的大小可以判断这个原始实测变量与公共因子间之关系 程度。特殊因子方差(剩余方差)特殊因子方差(剩余方差)-各变量的特殊因素影响大小就 是1减掉该变量共同度的值。 i X 统计意义统计意义: 两边求方差 imimi FaFaX 11i )()(.)()( 2 1 2 1imimii VarFVaraFVaraXVar 222 1 2 1 iii m j ij ha 所有的公共因子和特殊因子对变量的贡献为1。 反映了全部公 共因子对变量Xi的影响,
11、是全部公共因子对变量方差所做出的贡献,或 者说Xi对公共因子的共同依赖程度,称为公共因子对变量Xi的方差贡献。 接近于1,表明该变量的原始信息几乎都被选取的公共因子说明 了。 特殊因子的方差,反映了原有变量方差中无法被公共因子描述的 比例。 2 i h 2 i h 2 i 公因子F1公因子F2共同度hi特殊因子i x1=代数10.8960.3410.9190.081 x2=代数20.8020.4960.8890.111 x3=几何0.5160.8550.9970.003 x4=三角0.8410.4440.9040.096 x5=解析几何 0.8330.4340.8820.118 第一个观测变量
12、共同度: 同时,它的剩余方差是: 919. 0)341. 0()896. 0( 222 1 h 081. 0919. 01 2 i (3)特征值特征值-是第j个公共因子Fj对于X的每一分量Xi所提供的方差的 总和。又称第j个公共因子的方差贡献。即每个变量与某一共同因子之因 子负荷量的平方总和(因子载荷矩阵中某一公共因子列所有因子负荷量 的平方和)。 如右案例中F1的特征值 : 113. 3833. 0841. 0516. 0802. 0896. 0 22222 )()()()()(G 如上案例中如上案例中F F1 1的贡献率为的贡献率为3.113/5=62.26%3.113/5=62.26%
13、(4 4)方差贡献率)方差贡献率 实际中更常用的指标:方差 贡献率(指每个因子所解释的方 差占所有变量总方差的比例,即 公共因子对实测变量的贡献)变 量方差贡献率=特征值,是 衡量公共因子相对重要性的指标, Gi越大,表明公共因子Fj对的贡 献越大,该因子的重要程度越高 公因子F1公因子F2共同度hi特殊因子i x1=代数10.8960.3410.9190.081 x2=代数20.8020.4960.8890.111 x3=几何0.5160.8550.9970.003 x4=三角0.8410.4440.9040.096 x5=解析几何0.8330.4340.8820.118 特征值G3.113
14、1.4794.9590.409 方差贡献率 (变异量) 62.26%29.58%91.85% 联系:联系:(1)因子分析是主成分分析的推广,是主成分分析的逆问 题。(2)二者都是以降维为目的,都是从协方差矩阵或相关系 数矩阵出发。 区别区别:(1)主成分分析模型是原始变量的线性组合,是将原始变 量加以综合、归纳,仅仅是变量变换;而因子分析是将原始变量加 以分解,描述原始变量协方差矩阵结构的模型;只有当提取的公因 子个数等于原始变量个数时,因子分析才对应变量变换。(2)主成 分分析,中每个主成分对应的系数是唯一确定的;因子分析中每个 因子的相应系数即因子载荷不是唯一的。(3)因子分析中因子载荷
15、的不唯一性有利于对公共因子进行有效解释;而主成分分析对提取 的主成分的解释能力有限。 目的不同!一个侧重降维,一个侧重解释!目的不同!一个侧重降维,一个侧重解释! 5.5.主成分分析分析与因子分析的联系和差异主成分分析分析与因子分析的联系和差异 6.2 因子载荷的求解因子载荷的求解 1. 1. 因子载荷矩阵求解的方法:因子载荷矩阵求解的方法: (1)主成分分析法 (2)主轴因子法 (3)极大似然法 (4)最小二乘法 (5)a因子提取法 (6)映象分析法 在此主要介绍主成分分析法主成分分析法和主轴因子法。主轴因子法。 p21 ,YYY pppppp pp pp XXXY XXXY XXXY 2
16、2 1 1 22221212 12211111 pppppp pp pp YYYX YYYX YYYX 2211 22221122 12211111 一、一、 主成分分析法主成分分析法 假定从相关矩阵出发求解主成分,设有p个变量,则我们可以找 出p个主成分。将所得的p个主成分按由大到小的顺序排列,记 为 , ,则主成分与原始变量之间存在如下关系式: 式中,rij是随机向量X的相关矩阵的特征值所对应的特征向量的分量, 因为特征向量彼此正交,从X到Y的转换关系是可逆的,很容易得出由Y到 X的转换关系为: 对上面每一等式只保留前m个主要成分而把后面的部分用 代替,则上 式变为: i pmmpppp
17、mm mm YYYX YYYX YYYX 2211 222221122 112211111 上式在形式上已经与因子模型相一致,且 之间相互独立, 为了把 转化成合适的公共因子,现在要做的工作是把主成分 变为方 差为1的变量。则将 除以其标准差,则上式变为: )(miY, 2 , 1 i i Y i Y i Y mmpmppp mm mm FaFaFaX FaFaFaX FaFaFaX 2211 222221212 112121111 这与因子模型完全一致,这样就得到了载荷矩阵A和一组初始公共因子。 则载荷矩阵A的一个解为: 共同度的估计为: ),( 2211mm A 22 2 2 1 2 im
18、iii aaah 那么如何确定公因子的数目m呢?一般而言,这取决于问题的 研究者本人,对于同一问题进行因子分析时,不同的研究者可能会 给出不同的公因子数;当然,有时候由数据本身的特征可以很明确 地确定出因子数目。当用主成分法进行因子分析时,也可以借鉴确 定主成分个数的准则,如所选取的公因子的信息量的和达到总体信 息量的一个合适比例为止。但对这些准则不应生搬硬套,应按具体 问题具体分析,总之要使所选取的公因子能够合理地描述原始变量 相关阵的结构,同时要有利于因子模型的解释。 二、主轴因子法二、主轴因子法 是对主成分方法的修正,假定我们首先对变量进行标准化变换。 则: AAR 式中,A为因子载荷矩
19、阵; 为一对角阵,其对角元素为相应特殊因子 的方差。则称 为调整相关矩阵,显然R* 的主对角元 素不再是1,而是共同度 。 分别求解R*的特征值与标准正交特征向量,进而求出因子载荷矩 阵A。假设R*有m个正的特征值。设 为R*的特征根, 为对应的标准正交化特征向量。则因子载荷矩阵A的一个 主轴因子解为: AARR * 2 i h * m * 2 * 1 * 2 * 1 , m rrr ),( * 2 * 2 * 1 * 1mmr rrA, 2. 2. 因子旋转因子旋转 由于因子载荷阵是不惟一的,由此引出了因子分析的第二根本步 骤因子旋转。建立因子分析模型的目的不仅在于要找到公共因子, 更重要的
20、是知道每一个公共因子的意义,以便对实际问题进行分析。 然而我们得到的初始因子解中各主因子的典型代表量不是很突出,容 易使因子的意义含糊不清,不便于对实际问题进行分析。出于该种考 虑,可以对初始公共因子进行线性组合,即进行因子旋转,以期找到 意义更为明确,实际意义更明显的公共因子。 经过旋转后,公共因子对Xi的贡献 并不改变,但由于载荷矩 阵发生变化,公共因子本身就可能发生很大的变化,每一个公共因子 对原始变量的贡献 不再与原来相同,从而经过适当的旋转我们就 可以得到比较满意的公共因子。 2 i h 2 i g (1 1)正交旋转)正交旋转 由初始载荷矩阵A右乘一正交矩阵得到。经过正交旋转得到的
21、心的公 共因子仍然保持彼此独立的性质。 (2 2)斜交旋转)斜交旋转 放弃了因子之间彼此独立这个限制,可以得到更为简洁的形式。 无论是正交旋转还是斜交旋转,都应当使新的因子载荷系数要么尽 可能地接近于0,要么尽可能地远离0. 因子旋转包括两种:因子旋转包括两种: 3. 3.因子得分因子得分 当因子模型建立起来之后,我们往往需要反过来考察每一个样品的 性质及样品之间的相互关系。比如当关于企业经济效益的因子模型建立 起来之后,我们希望知道每一个企业经济效益的优劣,或者把诸企业划 分归类。这就需要进行因子分析的第三步骤的分析,即因子得分。顾名 思义,因子得分就是公共因子F1,F2,.,Fm在每一个样
22、品点上的得分。 具体方法如下: 用回归的思想求出线性组合系数的估计值,即建立如下公共因子为 因变量,原始变量为自变量的回归方程: j=1,2,.,m 在最小二乘意义下,可以得到F的估计值 式中,A为因子载荷矩阵;R为原始变量的相关矩阵;X为原始变量 向量。这样,在得到一组样本值后,就可以带入上面的关系式求出公共 因子的估计得分,从而用少数公共因子去描述原始变量的数据结构,用 公共因子得分去描述原始变量的取值。 , 221pjPjji XXXFj XRAF 1 一、因子分析的步骤一、因子分析的步骤 进行因子分析应包括如下几步: 1.根据研究问题选取原始变量; 2.对原始变量进行标准化并求其相关阵,分析变量之间的相关性; 3.求解初始公共因子及因子载荷矩阵; 4.因子旋转; 5.因子得分; 6.根据因子得分值进行进一步分析。 6.3 因子分析的基本步骤因子分析的基本步骤 二、因子分析的逻辑框图二、因子分析的逻辑框图 例:对企业经济效益指标体系的八项指标建立因子分析模型 6.4 因子分析的上机实现因子分析的上机实现 n由spss输出方差解释表及碎石图可看出,前三个特征值较大,其余五 个特征值均较小。前三个公共因子对样本方差的贡献和为8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电工电子技术(第3版) 课件 3.6 三相异步电机结构
- 2024年无纺布及其制品项目资金申请报告
- 银行内部控制审计办法制度
- 采购部门内部管理与沟通协作制度
- 议论散文《门》课件
- 销售工作总结大全(15篇)
- 《设备的维修与养护》课件
- 论坛推广高级解决方案-案例(倩碧)
- 《供配电线路》课件
- 广东省东莞市第七中学2025届高三下学期联合考试英语试题含解析
- 《中小企业生存之道》课件
- 前程无忧招聘测评题库及答案
- 人教版-六年级上册数学-百分数(一)单元测试(含答案)
- 盆腔脓肿护理病例讨论
- 2024年决战行测5000题言语理解与表达(培优b卷)
- 正确看待苦与乐课件
- 【培训课件】建设工程施工工地消防安全管理
- 广东省深圳市2023-2024学年高一上学期期末考试物理试题(含答案)
- 《LED照明知识》课件
- 绿色建筑概论学习通超星期末考试答案章节答案2024年
- GB/T 44481-2024建筑消防设施检测技术规范
评论
0/150
提交评论