




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、探索性因子分析,探索性因子分析的基本理论,2,目 录,实例演示,因子分析, 概念 用于分析影响变量、支配变量的共同因子有几个且各因子本质为何的一种统计方法。它是一类降维的相关分析技术,用来考察一组变量之间的协方差或相关系数结构,并用以解释这些变量与为数较少的因子之间的关联。, 基本思想 通过分析变量间的相关系数矩阵内部结构,将原变量进行重新组合,利用数学工具将众多的原变量组成少数的独立的新变量。,探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。 特点: (1)利用因子分析来确定因子个数降维 (2)完全
2、依赖资料数据,探索性因子分析的理论假设,主要包括: 所有的公共因子都相关(或都不相关); 所有的公共因子都直接影响所有的观测变量; 特殊(唯一性)因子之间相互独立; 所有观测变量只受一个特殊(唯一性)因子的影响; 公共因子与特殊因子(唯一性)相互独立。,探索性因子分析基本原理,探索性因子分析模型的一般表达式为 其中,Xn表示观测变量,FM代表公因子,它是各个观测变量所共有的因子,解释变量之间的相关;Un代表特殊因子,它是每个观测变量所特有的因子,只对一个原始变量起作用;WM代表因子载荷,是每个变量在公因子上的相关系数;而en代表了每一观测变量的随机误差。,忽略特殊因子,可以使用主成分分析法进行
3、因子分析,探索性因子分析模型,应用范围,探索性因子分析主要应用于三个方面 寻求基本结构,解决多元统计分析中的变量间强相关问题 数据化简,将具有错综复杂关系的变量综合为少数几个因子(不可观测的、相互独立的随机变量) 发展测量量表,探索性因子分析步骤,收集观测变量,判断是否适合作因子分析,构造相关矩阵,确定因子个数,因子旋转,提取因子,解释因子结构,计算因子得分,便于对因子结构进行合理解释,做进一步的研究,如聚类分析、评价,特征值大小、因子累计贡献率、碎石图,判断变量是否适合做因子分析,1. KMO(Kaiser-meyer-olkin)检验 KMO统计量是用来比较各变量间简单相关系数和偏相关系数
4、的大小。在01之间取值,越接近1,越适合作因子分析。 2. 巴特利特球形检验 巴特利特球形检验原假设H0为:相关阵是单位阵,既各变量各自独立。 3. 反映象相关矩阵检验 反映象相关矩阵检验是将偏相关系数矩阵的每个元素取反得到的。如果变量中确实能够提取出公共因子,那么偏相关系数必然很小,则反映象相关矩阵中的有些元素的绝对值比较大,则说明这些变量可能不适合作因子分析。,确定因子个数,主成分分析的主要统计量,确定因子个数的方法(一),特征根 特征根可以看成是表示公因子影响力度大小的指标,一般取特征值大于1的成分作为主成分,特征根小于1,不引入 公因子的累积方差贡献率 根据累计贡献率达到的百分比确定,
5、实际上累积贡献率是一个次要指标。主要指标是特征值, 在前一指标达到的情况下,只要累计贡献率不是太差都可以接受。即使70%也不是太大的问题。实际处理中,很少碰到累计贡献率太低的情况,如果问卷设计和数据收集没有太大问题的前提下。,确定因子个数的方法(二),碎石图 碎石图是按特征值大小排列因子,横轴表示因子序号,纵轴表示特征值大小。,确定因子个数的方法(三),公因子提取方法,主成分分析法 假设变量是因子的纯线性组合,第一成分有较大的方差,后续成分其可解释的方差逐个递减。 最大似然法 该方法不要求多元正态分布,给出参数估计。,因子命名,因子载荷阵显示了原始变量与各主成分之间的相关程度。根据他们的相关程
6、度的大小,综合出各因子的含义。如果每个因子与原始变量相关系数没有很明显的差异,对因子命名就比较困难。 Example,因子分析的一个重要目的在于对原始变量进行分门别类的综合评价。如果因子分析结果保证了因子之间的正交性,但对因子不易命名,可以通过对因子模型的旋转,得到容易解释的结果。,因子旋转(一),所谓旋转就是一种坐标变换。因子旋转的目的是为了便于理解和解释因子的实际意义,在旋转后的新坐标系中,因子载荷将得到重新分配,使得对公因子的命名和解释更加容易。 因子旋转通常分为两类: 正交旋转 Varimax方差最大旋转,它使每个因子上的具有最高载荷的变量数最小,可简化对因子的解释。 斜交旋转,正交旋
7、转的基本假定是,因子分析中被提取出来的因子之间是相互独立的,因子间并不相关。它的目的是要获得因子的简单结构,即使每个变量在尽可能少的因子上有较高的负载;而斜交旋转中,因子间的夹角是任意的,也就是说斜交旋转对因子间是否相关并无限定,这种因子旋转的结果就会使各因子所解释的变量的方差出现一定程度的重叠。,比起斜交旋转,正交旋转更具有一般性。,因子旋转(二),因子得分,因子得分就是每个观测量的公共因子的值。根据因子得分系数和原始变量的标准化值,可以计算每个观测量的各因子的得分数,并可以据此对观测量进行进一步的分析。 计算因子得分的基本思想是将因子变量表现为原有变量的线性组合,即通过以下的因子得分函数计算: (j=1,2p),回归法 因子得分的均值为0,方差等于估计因子得分与实际得分之间的多元相关的平方 Bartlett法 因子得分均值为0,超出变量范围的特殊因子平方和被最小化 Anderson-Rubin法 因子得分的均值为0,标准差为1,且彼此不相关。是为了保证因子的正交性而对Bartlett因子的调整。,估计因子得分的方法,Example,旋转后的因
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖南生物机电职业技术学院《临床微生物》2023-2024学年第二学期期末试卷
- 川北医学院《实践白俄罗斯语》2023-2024学年第一学期期末试卷
- 2025届四川省长宁县培风中学高考预测密卷(1)(语文试题)试卷含解析
- 2025年河北省秦皇岛市昌黎汇文二中高三3月适应性月考(八)历史试题含解析
- 广东工商职业技术大学《轨道交通运营安全与事故分析》2023-2024学年第二学期期末试卷
- 2025届广东省佛山市南海区重点中学初三下学期第三次联考英语试题试卷含答案
- 湖南工业大学《模型技术》2023-2024学年第一学期期末试卷
- 浙江省金华市六校联谊2025届下学期初三年级期中考试英语试题试卷含答案
- 汉中市2025届三下数学期末质量检测模拟试题含解析
- 汽车美容师技术交流考试试题及答案
- 电力系统中电磁环境监测系统的设计与实施
- 全国公安移动警务视频应用建设指南(征求意见稿)-正式-来源广东
- 【生物】人的生殖课件-+2024-2025学年人教版生物七年级下册
- 健康日用品设计与研发趋势
- 【化学】常见的盐(第1课时)-2024-2025学年九年级化学下册(人教版2024)
- 儿童故事绘本愚公移山课件模板
- 《罗秀米粉加工技术规程》 编制说明
- 2024年江苏省无锡市中考英语试卷
- 《湖南省房屋建筑和市政工程消防质量控制技术标准》
- 充电桩安全巡查记录表
- 《公路工程现浇泡沫聚合土应用技术规程》
评论
0/150
提交评论