第十三章(因子分析)_第1页
第十三章(因子分析)_第2页
第十三章(因子分析)_第3页
第十三章(因子分析)_第4页
第十三章(因子分析)_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/2/2中国人民大学六西格玛质量管理研究中心1第十三章因子分析

目录上页下页返回结束

§13.1因子分析的基本思想§13.2因子载荷的求解§13.3因子分析的步骤与逻辑框图§13.4因子分析的上机实现2023/2/2中国人民大学六西格玛质量管理研究中心2第十三章因子分析

目录上页下页返回结束

因子分析(factoranalysis)模型是主成分分析的推广。它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。相对于主成分分析,因子分析更倾向于描述原始变量之间的相关关系;因此,因子分析的出发点是原始变量的相关矩阵。因子分析的思想始于1904年CharlesSpearman对学生考试成绩的研究。近年来,随着电子计算机的高速发展,人们将因子分析的理论成功地应用于心理学、医学、气象、地质、经济学等各个领域,也使得因子分析的理论和方法更加丰富。本章主要介绍因子分析的基本理论及方法,运用因子分析方法分析实际问题的主要步骤及因子分析的上机实现等内容。2023/2/2中国人民大学六西格玛质量管理研究中心3§13.1因子分析的基本思想

目录上页下页返回结束

一、因子分析的基本思想

因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。对于所研究的某一具体问题,原始变量就可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。在经济统计中,描述一种经济现象的指标可以有很多,比如要反映物价的变动情况,对各种商品的价格做全面调查固然可以达到目的,但这样做显然耗时耗力,为实际工作者所不取。2023/2/2中国人民大学六西格玛质量管理研究中心4§13.1因子分析的基本思想

目录上页下页返回结束

实际上,某一类商品中很多商品的价格之间存在明显的相关性或相互依赖性,只要选择几种主要商品的价格或进而对这几种主要商品的价格进行综合,得到某一种假想的“综合商品”的价格,就足以反映某一类物价的变动情况,这里,“综合商品”的价格就是提取出来的因子。这样,对各类商品物价或仅对主要类别商品的物价进行类似分析然后加以综合,就可以反映出物价的整体变动情况。这一过程也就是从一些有错综复杂关系的经济现象中找出少数几个主要因子,每一个主要因子就代表经济变量间相互依赖的一种经济作用。抓住这些主要因子就可以帮助我们对复杂的经济问题进行分析和解释。2023/2/2中国人民大学六西格玛质量管理研究中心5§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心6§13.1因子分析的基本思想

目录上页下页返回结束

(一)CharlesSpearman提出因子分析时用到的例子为了对因子分析的基本理论有一个完整的认识,我们先给出CharlesSpearman1904年用到的例子。在该例中Spearman研究了33名学生在古典语(C)、法语(F)、英语(E)、数学(M)、判别(D)和音乐(Mu)六门考试成绩之间的相关性并得到如下相关阵:二、因子分析的基本理论及模型2023/2/2中国人民大学六西格玛质量管理研究中心7§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心8§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心9§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心10§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心11§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心12§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心13§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心14§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心15§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心16§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心17§13.1因子分析的基本思想

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心18§13.2因子载荷的求解

目录上页下页返回结束

因子分析可以分为确定因子载荷,因子旋转及计算因子得分三个步骤。首要的步骤即为确定因子载荷或是根据样本数据确定出因子载荷矩阵。有很多方法可以完成这项工作,如主成分法,主轴因子法,最小二乘法,极大似然法,因子提取法等。这些方法求解因子载荷的出发点不同,所得的结果也不完全相同。下面我们着重介绍比较常用的主成分法、主轴因子法与极大似然法。2023/2/2中国人民大学六西格玛质量管理研究中心19§13.2因子载荷的求解

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心20§13.2因子载荷的求解

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心21§13.2因子载荷的求解

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心22§13.2因子载荷的求解

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心23§13.2因子载荷的求解

目录上页下页返回结束

那么如何确定公因子的数目m呢?一般而言,这取决于问题的研究者本人,对于同一问题进行因子分析时,不同的研究者可能会给出不同的公因子数;当然,有时候由数据本身的特征可以很明确地确定出因子数目。当用主成分法进行因子分析时,也可以借鉴确定主成分个数的准则,如所选取的公因子的信息量的和达到总体信息量的一个合适比例为止。但对这些准则不应生搬硬套,应按具体问题具体分析,总之要使所选取的公因子能够合理地描述原始变量相关阵的结构,同时要有利于因子模型的解释。2023/2/2中国人民大学六西格玛质量管理研究中心24§13.2因子载荷的求解

目录上页下页返回结束

二、主轴因子法2023/2/2中国人民大学六西格玛质量管理研究中心25§13.2因子载荷的求解

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心26§13.2因子载荷的求解

目录上页下页返回结束

三、极大似然法2023/2/2中国人民大学六西格玛质量管理研究中心27§13.2因子载荷的求解

目录上页下页返回结束

四、因子旋转2023/2/2中国人民大学六西格玛质量管理研究中心28§13.2因子载荷的求解

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心29§13.2因子载荷的求解

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心30§13.2因子载荷的求解

目录上页下页返回结束

五、因子得分2023/2/2中国人民大学六西格玛质量管理研究中心31§13.2因子载荷的求解

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心32§13.2因子载荷的求解

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心33§13.2因子载荷的求解

目录上页下页返回结束

六、主成分分析与因子分析的区别1、因子分析把展示在我们面前的诸多变量看成由对每一个变量都有作用的一些公共因子和一些仅对某一个变量有作用的特殊因子线性组合而成。因此,我们的目的就是要从数据中探查能对变量起解释作用的公共因子和特殊特殊因子,以及公共因子和特殊因子组合系数。主成分分析则简单一些,它只是从空间生成的角度寻找能解释诸多变量变异绝大部分的几组彼此不相关的新变量(主成分)。2、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成各变量的线性组合。2023/2/2中国人民大学六西格玛质量管理研究中心34§13.2因子载荷的求解

目录上页下页返回结束

3、主成分分析中不需要有假设,因子分析则需要一些假设。因子分析的假设包括:各个公共因子之间不相关,特殊因子(specificfactor)之间也不相关,公共因子和特殊因子之间也不相关。4、抽取主因子的方法不仅仅有主成分法,还有极大似然法等,基于这些不同算法得到的结果一般也不同。而主成分只能用主成分法抽取。5、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,主成分一般是固定的;而因子分析中因子不是固定的,可以旋转得到不同的因子。

2023/2/2中国人民大学六西格玛质量管理研究中心35§13.2因子载荷的求解

目录上页下页返回结束

6、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。

7、和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这种区分不是绝对的。2023/2/2中国人民大学六西格玛质量管理研究中心36§13.3因子分析的步骤与逻辑框图

目录上页下页返回结束

上面我们介绍了因子分析的基本思想及基本的理论方法,下面我们把因子分析的步骤及逻辑框图总结如下,以帮助读者能更加清楚因子分析各步之间的脉络关系及更好的运用因子分析方法解决实际问题。2023/2/2中国人民大学六西格玛质量管理研究中心37§13.3因子分析的步骤与逻辑框图

目录上页下页返回结束

一、因子分析的步骤进行因子分析应包括如下几步:1.根据研究问题选取原始变量;2.对原始变量进行标准化并求其相关阵,分析变量之间的相关性;3.求解初始公共因子及因子载荷矩阵;4.因子旋转;5.因子得分;6.根据因子得分值进行进一步分析。2023/2/2中国人民大学六西格玛质量管理研究中心38§13.3因子分析的步骤与逻辑框图

目录上页下页返回结束

二、因子分析的逻辑框图2023/2/2中国人民大学六西格玛质量管理研究中心39§13.4因子分析的上机实现

目录上页下页返回结束

在上一章中,我们用SPSS的FactorAnalysis模块实现了主成分分析,实际上,FactorAnalysis主要是SPSS软件进行因子分析的模块,由于主成分分析与因子分析(特别是因子分析中的主成分法)之间有密切的关系,SPSS软件将这两种分析方法放到同一模块中。例13.1(数据见表12-6)对企业经济效益指标体系的八项指标建立因子分析模型。(详细因子分析上机实现见例13.2)

由spss输出方差解释表及碎石图可看出,前三个特征值较大,其余五个特征值均较小。前三个公共因子对样本方差的贡献和为87.085%,于是我们选取3个公共因子。2023/2/2中国人民大学六西格玛质量管理研究中心40§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心41§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心42§13.4因子分析的上机实现

目录上页下页返回结束

因子载荷的估计如下:2023/2/2中国人民大学六西格玛质量管理研究中心43§13.4因子分析的上机实现

目录上页下页返回结束

上表可得出企业经济效益指标体系的因子分析模型(特殊因子忽略不计):(13.24)

2023/2/2中国人民大学六西格玛质量管理研究中心44§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心45§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心46§13.4因子分析的上机实现

目录上页下页返回结束

例13.2中心城市的综合发展是带动周边地区经济发展的重要动力。在我国经济发展进程中,各个中心城市一直是该地区经济和社会发展的“引路者”。因而,分析评价全国35个中心城市的综合发展水平,无论是对城市自身的发展,还是对周边地区的进步,都具有十分重要的意义。下面应用因子分析模型,选取反映城市综合发展水平的12个指标作为原始变量,运用spss软件,对全国35个中心城市的综合发展水平作分析评价。2023/2/2中国人民大学六西格玛质量管理研究中心47§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心48§13.4因子分析的上机实现

目录上页下页返回结束

指标的选取参考了《中国城市统计年鉴》中指标的设置。数据来源于《中国城市统计年鉴(2004)》。数据见表13-1。2023/2/2中国人民大学六西格玛质量管理研究中心49§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心50§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心51§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心52§13.4因子分析的上机实现

目录上页下页返回结束

2.计算运行结果将标准化后的数据导入到spss软件,依次点选Analyze-DataReduction-Factor进入FactorAnalysis对话框。把12个指标变量选入variables中,点击extraction按钮,在method选项中选择principalcomponents(这时,因子分析等同于主成分分析,如果是主成分分析,则只能选择此项),点击continue按钮,回到主对话框点击ok。2023/2/2中国人民大学六西格玛质量管理研究中心53§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心54§13.4因子分析的上机实现

目录上页下页返回结束

按照特征根大于1的原则,选入3个公共因子,其累计方差贡献率为87.1%,特征根及累计贡献率、碎石图、因子载荷矩阵如下:2023/2/2中国人民大学六西格玛质量管理研究中心55§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心56§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心57§13.4因子分析的上机实现

目录上页下页返回结束

此时得到的未旋转的公共因子的实际意义不好解释,因此,对公共因子进行方差最大化正交旋转。在factorAnalysis对话框中,点击rotation按钮,进入rotation对话框,选中varimax进行方差最大化正交旋转。(若是主成分分析就选择none)2023/2/2中国人民大学六西格玛质量管理研究中心58§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心59§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心60§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心61§13.4因子分析的上机实现

目录上页下页返回结束

结果如下:2023/2/2中国人民大学六西格玛质量管理研究中心62§13.4因子分析的上机实现

目录上页下页返回结束

最后,计算因子得分,以各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总,得出各城市的综合得分F,即在factoranalysis主对话框中点击按钮scores进入factorscores对话框,选中saveasvariables,在method中选择regression计算因子得分,如图所示:2023/2/2中国人民大学六西格玛质量管理研究中心63§13.4因子分析的上机实现

目录上页下页返回结束

得到运行结果并计算综合得分,结果如下表:2023/2/2中国人民大学六西格玛质量管理研究中心64§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心65§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心66§13.4因子分析的上机实现

目录上页下页返回结束

其操作步骤如下:在spss中点选graphs,在出来的下拉菜单中点击scatter,进入scatterplot对话框,选择simple,点击define按钮,如图:在弹出的simplescatterplot对话框中,分别选择fac1_1,fac2_1作为x轴与y轴,点击ok,即可得到如上因子得分图。操作图如下:2023/2/2中国人民大学六西格玛质量管理研究中心67§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国人民大学六西格玛质量管理研究中心68§13.4因子分析的上机实现

目录上页下页返回结束

2023/2/2中国

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论