版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
演讲者:XXX第十五章因子分析管理统计学Managementstatistics北京理工大学管理与经济学院1.因子分析的基本概念2.因子分析的基本步骤3.SPSS因子分析的操作步骤目录北京理工大学Beijinginstituteoftechnology管理统计学Managementstatistics因子分析的基本概念1因子变量的特点:1.因子变量的数量远少于原有变量,减少了分析计算的工作量;2.因子变量是对原始变量的重新组构,能够反映原始变量的绝大部分信息;3.因子变量间没有线性相关关系,避免了原始变量的共线性问题。
4.因子变量具有命名解释性。2因子变量:代表各类信息的综合指标,也称公因子。3因子分析的优点:
能以较少的因子变量和最小的信息损失来解释变量之间的结构。4因子分析:利用各变量间存在一定的相关关系,用较少的综合指标分别综合存在于各变量中的相关关系,而综合指标之间彼此不相关。北京理工大学管理与经济学院因子分析的基本概念12将关系错综复杂的原始变量综合为少数几个因子(不可观测,相互独立的随机变量),以再现因子与原始变量之间的内在联系。因子分析的主要应用:寻求基本结构,简化观测系统用于分类对p个变量或n个样品进行分类。北京理工大学管理与经济学院因子分析的基本概念12因子分析的分类:
根据研究对象,可分为R型因子分析和Q型因子分析。
两者的处理方法相同,只是出发点不同。R型因子分析:研究变量之间的相关关系。通过研究变量相关阵或协差阵的内部结构,找出控制所有变量的几个公共因子,用以对变量或样品进行分类。Q型因子分析:研究样品之间的相关关系,通过研究样品相似矩阵的内部结构,找出控制所有样品的几个主因子。北京理工大学管理与经济学院例题:
为了解青年对婚姻家庭的态度,随机访问100人,询问30个问题,把这些问题归结于不可测的因子变量,即对外型的重视、对孩子的教育观点、对家庭的重视、对金钱的重视等其它方面。因子分析的目的:
建立一个模型,用不可测的、所有原始变量共有的因子变量和每个原始变量所特有的特殊因子来描述可测的原始变量,进而分析和解释青年人对婚姻家庭的态度。北京理工大学Beijinginstituteoftechnology管理统计学Managementstatistics因子分析的基本模型设是可观测的向量,是不可观测的公共因子向量,又与F相互独立,(即F
的各分量方差为1,且互不相关)北京理工大学管理与经济学院北京理工大学Beijinginstituteoftechnology管理统计学Managementstatistics因子分析的基本模型因子分析模型可构造成:上式的矩阵形式为:其中矩阵
北京理工大学管理与经济学院矩阵是待估系数矩阵,称为因子载荷矩阵,系数a11是变量X1在因子F1上的载荷。
为公共因子,一般对X每个分量Xi都有作用;为Xi的特殊因子,起残差的作用,只对Xi起作用。因子分析模型:因子分析的基本模型123北京理工大学管理与经济学院四个关键性的假设:因子分析的基本模型特殊因子互不相干,且;特殊因子与公共因子不相干,即;
1234即向量F的协方差阵为m阶单位阵;即向量ε
的协方差阵为p阶对角阵;北京理工大学管理与经济学院因子分析的基本步骤北京理工大学管理与经济学院因子分析的标准分析步骤:根据具体问题,判断原始变量是否适合作因子分析,并采用某些检验方法来判断数据是否符合分析要求。选择提取公因子的方法,并按一定标准确定提取的公因子数目。考察公因子的可解释性,并在必要时进行因子旋转,以寻求最佳的解释方式。计算出因子得分等中间指标进一步分析使用。1234因子分析的基本步骤北京理工大学管理与经济学院判断原始变量是否适合进行因子分析:1
因子分析有一个默认的前提条件,就是原始各变量间必须有较强的相关性,否则根本无法从中综合出能反映原始变量结构的因子变量。
所以一般在进行因子分析前,需先对原始变量进行相关分析。计算变量之间的相关系数矩阵并进行统计检验。
如果相关系数矩阵中的大部分相关系数都小于0.3且未通过统计检验,那么就不适合作因子分析。最简单的方法:除此之外,SPSS还提供了几种帮助判断变量是否适合作因子分析的方法:(1)巴特利特球度检验;(2)反映象相关矩阵检验;(3)KMO检验。原假设H0:
相关阵是单位阵,即各变量各自独立。检验的统计量:根据相关系数矩阵的行列式计算得到。判断方法:如果该统计量值较大且对应的相伴概率值小于显著性水平,则拒绝H0,认为相关系数矩阵不太可能是单位阵,适合作因子分析;如果该统计量值较小且对应的相伴概率值大于显著性水平,则不能拒绝H0,认为相关系数矩阵可能是单位阵,不适合作因子分析。(1)巴特利特球度检验(Bartletttestofsphericity)因子分析的基本步骤北京理工大学管理与经济学院判断原始变量是否适合进行因子分析1基本思想:将偏相关系数矩阵的每个元素取反,得到反映象相关阵。
如果变量之间确实存在较强的相互重叠传递影响,由于计算偏相关系数时是在控制其它变量对两变量影响的条件下计算出来的净相关系数。判断方法:如果变量中确实能够提取出公共因子,那么偏相关系数必然很小,则反映象相关矩阵中的有些元素的绝对值比较大,则说明这些变量可能不适合作因子分析。(2)反映象相关矩阵(Anti-imagecorrelationmatrix)检验因子分析的基本步骤北京理工大学管理与经济学院判断原始变量是否适合进行因子分析1基本思想:KMO统计量是比较各变量间简单相关系数和偏相关系数的大小。判断方法:
KMO统计量的取值在0和1之间,KMO统计量越接近1,则越适合作因子分析,KMO统计量越小,则越不适合作因子分析。
一般认为,KMO值大于0.9就非常适合,0.7以上效果一般;0.6则不太适合,0.5以下不适合。(3)KMO(Kaiser-Meyer-Olkin)检验因子分析的基本步骤判断原始变量是否适合进行因子分析北京理工大学管理与经济学院12因子分析的基本步骤北京理工大学管理与经济学院提取公因子和确定公因子数目常用提取公因子的方法:主成分分析法,最大似然法,α因子提取法等。在此仅简单解释应用最广泛的主成分分析法。主成份分析法的目的:从原始的多个变量取若干线性组合,使得能尽可能多地保留原始变量中的信息。2因子分析的基本步骤北京理工大学管理与经济学院提取公因子的方法(主成分分析法)主成份分析法的手段:通过坐标变换手段,将原始变量转换到新变量是一个正交变换(坐标变换)。设有是一个p维随机变量,记考虑它的线性变换:该方程组要求:2因子分析的基本步骤北京理工大学管理与经济学院其中,依照以下两个原则来确定:(1)与互不相关;(2)是的一切线性组合中方差最大的;
是与不相关的的一切线性组合中方差最大的;
同理,是与不相关的的一切线性组合中方差最大的。在实际应用中,一般选取前面几个方差最大的主成分。称为原始数据的第一、第二、…、第p主成分。对原始变量的保留信息最多,因为其在总方差中所占的比重最大,其余的主成分保留的原始信息相应地递减。提取公因子的方法(主成分分析法)因子分析的基本步骤北京理工大学管理与经济学院主成分数学模型的系数求解步骤归纳如下:2(1)将原有变量数据进行标准化处理;(2)计算变量的简单相关系数矩阵;(3)求解协方差阵的特征根,并将特征值从大到小排序并重新编码:(4)按预先规定所取的P个公因子的累计方差贡献率达到的百分比m%;定义为主成分的贡献率,为主成分的累计贡献率。提取公因子的方法(主成分分析法)因子分析的基本步骤北京理工大学管理与经济学院主成分数学模型的系数求解步骤:2(5)确定所选定的前k个特征值,并求出相应的单位特征向量。(6)写出因子负荷阵。提取公因子的方法(主成分分析法)因子分析的基本步骤北京理工大学管理与经济学院2确定公因子数目的方法(1)根据特征根来确定特征根在某种程度上可看成是表示公因子影响力度大小的指标,如果特征根小于1,说明该公因子的解释力度还不如直接引入一个原变量的平均解释力度大。因此在SPSS中默认用特征根大于1作为纳入标准。(2)根据公因子的累积方差贡献率来确定公因子的累积方差贡献率就是主成分分析中的主成分的累积贡献率。
一般来说,提取公因子的方差累积贡献率达到85%-90%以上就比较满意了,可以此决定需要提取多少个公因子。大量实践表明,根据方差累积贡献率确定公因子数往往较多,而用特征根来确定又往往偏低,许多时候应当将两者结合起来。重点在于提取出的公因子的可解释性上。如果有实际意义,即使贡献率较小,也可以考虑保留。而如果特征根大于1,但是找不到合理的解释,则也可考虑将该公因子去除。因子分析的基本步骤北京理工大学管理与经济学院2确定公因子数目的方法提取公因子数量的原则:因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3某个原始变量xi同时与几个公因子都有比较大的相关关系,即xi的信息要由若干个公因子共同解释;同时,虽然一个公因子能够解释许多原始变量的信息,但它都只是解释每一个原始变量的一部分信息,而不是任何一个变量的典型代表。
这样在按照默认的分解方式,各因子可能难以找到所代表的实际意义。实际分析中的常见问题:因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3因此,可以利用这一特点对因子载荷矩阵进行适当的旋转,使公因子载荷系数向更大(向1)或更小(向0)方向变化,使得对公因子的命名和解释变得更加容易,但保持因子载荷矩阵A各行的元素的平方和即变量X的共同度不变。因子模型的一个特点:因子载荷阵不唯一。实现以上目的是通过因子轴的旋转进行变换的。因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3设从公因子F旋转到公因子G,则模型变为:其中,b11仍称为因子载荷。比较旋转前后的模型,可看出旋转并不影响公因子的提取过程和结果,只会改变原始变量的信息量在不同因子上的分布,即改变因子载荷阵。因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3常用的旋转方法分类:正交旋转和斜交旋转。正交旋转:在因子旋转过程中如果因子轴仍相互正交。斜交旋转:在因子旋转过程中如果因子轴之间不是相互正交的。进行正交变换可以保证变换后各因子仍正交,这是比较理想的情况。最常用的斜交旋转:方差最大化正交旋转(Varimax)旋转原则:各因子仍保持直角正交,但使得因子间方差的差异达到最大,即使得在每个因子具有较高载荷的变量个数最小化。这种方法一般能简化对因子的解释。因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3如果正交变换后对公因子仍然不易解释,也可以进行斜交旋转,或许可以得到比较容易解释的结果。最常用的斜交旋转:倾斜旋转(Promax)旋转原则:在方差最大化正交旋转的基础上进行斜交旋转,计算速度较快,旋转后允许因子间存在相关(交角非直角)。因子分析的基本步骤北京理工大学管理与经济学院公因子的命名解释3因子命名有一些原则:(1)因子分析的命名必须简明、用尽量少的词(2~3个)去解释因子。(2)必须要注重不同因子荷载高的变量之间的相似性(3)可以根据因子中包含什么样的变量来给因子命名。对因子矩阵进行旋转后,就必须给不同的因子进行命名。因子分析的基本步骤北京理工大学管理与经济学院计算因子得分4在因子分析中,还可以将公因子表示为原始变量的线性组合,这样就可以从原始变量的观测值估计各个公因子的值,此值就是因子得分。称为因子得分模型,每一个式子都是因子得分函数。由此可以得到以下模型:因子分析的SPSS实现北京理工大学Beijinginstituteoftechnology管理统计学Managementstatistics1.选择Analyze→DataReduction→Factor3.可选一变量作为样本的筛选变量移入到SelectionVariable框中。选
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《凡客发展现状》课件
- 2024年江沙区域产品购销协议版B版
- 房屋装修工程承包合同(2篇)
- 2024年版铁路客运服务协议范本一
- 2024实木家俱定制与家具维护保养服务合同2篇
- 2025年泸州道路运输从业资格证考哪些项目
- 2025年凉山州驾驶员货运从业资格证模拟考试题
- 2025年河北道路运输从业人员从业资格考试
- 《改善提案》课件
- 2024年建筑土建主体工程分包劳务协议样本版B版
- 智慧医疗信息化建设项目技术标准建设方案
- 工程建设监理收费标准(发改价格【2007】670号)
- 摩托车品牌文化营销与品牌故事的构建
- 2024江苏南京大数据集团有限公司招聘笔试参考题库附带答案详解
- FZT 73032-2017 针织牛仔服装
- 企业并购与资产重组智慧树知到期末考试答案2024年
- 货物包装承诺函
- 治疗用碘131I化钠胶囊-临床用药解读
- 2024人教版五年级上册数学期末口算题训练
- 2024外研版初中英语单词表汇总(七-九年级)中考复习必背
- 安徽省合肥市包河区2023-2024学年三年级上学期期末英语试卷
评论
0/150
提交评论