![数学建模因子分析_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-11/15/24ec9dca-918e-43ef-b422-fb2a5eeffe27/24ec9dca-918e-43ef-b422-fb2a5eeffe271.gif)
![数学建模因子分析_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-11/15/24ec9dca-918e-43ef-b422-fb2a5eeffe27/24ec9dca-918e-43ef-b422-fb2a5eeffe272.gif)
![数学建模因子分析_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-11/15/24ec9dca-918e-43ef-b422-fb2a5eeffe27/24ec9dca-918e-43ef-b422-fb2a5eeffe273.gif)
![数学建模因子分析_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-11/15/24ec9dca-918e-43ef-b422-fb2a5eeffe27/24ec9dca-918e-43ef-b422-fb2a5eeffe274.gif)
![数学建模因子分析_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-11/15/24ec9dca-918e-43ef-b422-fb2a5eeffe27/24ec9dca-918e-43ef-b422-fb2a5eeffe275.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十四讲第十四讲 因子分析因子分析n第一部分第一部分 主成分分析主成分分析n第二部分第二部分 因子分析因子分析主成分分析的基本原理主成分分析的基本原理 主成分的概念由主成分的概念由karl pearson在在1901年提出的。年提出的。他是考察多个变量间相关性一种多元统计方法他是考察多个变量间相关性一种多元统计方法 研究如何通过少数几个主成分研究如何通过少数几个主成分(principal component)来解释多个变量间的内部结构。即从原来解释多个变量间的内部结构。即从原始变量中导出少数几个主分量,使它们尽可能多地始变量中导出少数几个主分量,使它们尽可能多地保留原始变量的信息,且彼此间互不
2、相关。保留原始变量的信息,且彼此间互不相关。 主成分分析的目的:数据的压缩;数据的解释主成分分析的目的:数据的压缩;数据的解释l常被用来寻找判断事物或现象的综合指标,并对综合指常被用来寻找判断事物或现象的综合指标,并对综合指标所包含的信息进行适当的解释标所包含的信息进行适当的解释什么是主成分分析?什么是主成分分析?(principal component analysis)n对这两个相关变量所携带的信息对这两个相关变量所携带的信息(在统计上信息往往是在统计上信息往往是指数据的变异指数据的变异)进行浓缩处理进行浓缩处理n假定只有两个变量假定只有两个变量x1和和x2,从散点图可见两个变量存,从散点
3、图可见两个变量存在相关关系,这意味着两个变量提供的信息有重叠在相关关系,这意味着两个变量提供的信息有重叠主成分分析的基本思想主成分分析的基本思想 ( (以两个变量为例以两个变量为例) )n如果把两个变量用如果把两个变量用一个变量来表示,一个变量来表示,同时这一个新的变同时这一个新的变量又尽可能包含原量又尽可能包含原来的两个变量的信来的两个变量的信息,这就是降维的息,这就是降维的过程过程主成分分析的数学模型主成分分析的数学模型n数学上的处理是将原始的数学上的处理是将原始的p个变量作线性组合,作为新的个变量作线性组合,作为新的变量变量n设设p个原始变量为个原始变量为 ,新的变量,新的变量(即主成分
4、即主成分)为为 ,主成分和原始变量之间的关系表示为,主成分和原始变量之间的关系表示为主成分分析的数学模型主成分分析的数学模型ppppppppppxaxaxayxaxaxayxaxaxay22112222121212121111主成分分析的数学模型aij为第为第i个主成分个主成分yi和原和原来的第来的第j个变量个变量xj之间的之间的线性相关系数,称为载线性相关系数,称为载荷荷(loading)。比如,。比如,a11表示第表示第1主成分和原主成分和原来的第来的第1个变量之间的个变量之间的相关系数,相关系数,a21表示第表示第2主成分和原来的第主成分和原来的第1个个变量之间的相关系数变量之间的相关系
5、数pxxx,21pyyy,.21n选择几个主成分?选择几个主成分?选择标准是什么?选择标准是什么?n被选的主成分所代表的主轴的长度之和占了主轴被选的主成分所代表的主轴的长度之和占了主轴总程度之和的大部分总程度之和的大部分n在统计上,主成分所代表的原始变量的信息用其在统计上,主成分所代表的原始变量的信息用其方差来表示。因此,所选择的第一个主成分是所方差来表示。因此,所选择的第一个主成分是所有主成分中的方差最大者,即有主成分中的方差最大者,即var(yi)最大最大n如果第一个主成分不足以代表原来的个变量,在如果第一个主成分不足以代表原来的个变量,在考虑选择第二个主成分,依次类推考虑选择第二个主成分
6、,依次类推n这些主成分互不相关,且方差递减这些主成分互不相关,且方差递减主成分的选择主成分的选择n究竟选择几个主成分才合适呢?究竟选择几个主成分才合适呢?n一般要求所选主成分的方差总和占全部方差的一般要求所选主成分的方差总和占全部方差的80%以上就可以了。当然,这只是一个大体标准以上就可以了。当然,这只是一个大体标准,具体选择几个要看实际情况,具体选择几个要看实际情况n如果原来的变量之间的相关程度高,降维的效果如果原来的变量之间的相关程度高,降维的效果就会好一些,所选的主成分就会少一些,如果原就会好一些,所选的主成分就会少一些,如果原来的变量之间本身就不怎么相关,降维的效果自来的变量之间本身就
7、不怎么相关,降维的效果自然就不好然就不好n不相关的变量就只能自己代表自己了不相关的变量就只能自己代表自己了主成分的选择主成分的选择主成分分析的步骤主成分分析的步骤n 对原来的对原来的p个指标进行标准化,以消除变量个指标进行标准化,以消除变量在水平和量纲上的影响在水平和量纲上的影响n 根据标准化后的数据矩阵求出相关系数矩根据标准化后的数据矩阵求出相关系数矩阵阵n 求出协方差矩阵的特征根和特征向量求出协方差矩阵的特征根和特征向量n 确定主成分,并对各主成分所包含的信息确定主成分,并对各主成分所包含的信息给予适当的解释给予适当的解释主成分分析的步骤主成分分析的步骤根据我国根据我国31个省市自治区个省
8、市自治区2006年的年的6项主要项主要经济指标数据,进行主成分分析,找出主成经济指标数据,进行主成分分析,找出主成分并进行适当的解释分并进行适当的解释主成分分析主成分分析 ( (实例分析实例分析) )用用spssspss进行主成分分析进行主成分分析第第1步步 选择【选择【analyze】下拉菜单,并选择【】下拉菜单,并选择【data reduction-factor】,进入主对话框】,进入主对话框第第2步步 在主对话框中将所有原始变量选入【在主对话框中将所有原始变量选入【variables】第第3步步 点击【点击【descriptives】,在【】,在【correlation matrix】下
9、选择【】下选择【coefficirnts】,点击【】,点击【continue】回到主对话框回到主对话框第第4步步 点击【点击【extraction】,在【】,在【display】下选择】下选择【scree plot】,点击【】,点击【continue】回到主对话框】回到主对话框第第5步步 点击【点击【rotation】,在【】,在【display】下选择】下选择【loading plot】,点击【】,点击【continue】回到主对话框】回到主对话框 点击【点击【ok】单变量描述统计分析。单变量描述统计分析。输出单变量的基本统输出单变量的基本统计量,包括每个变量计量,包括每个变量的均值、标准差
10、及其的均值、标准差及其有效例数有效例数初始解。默认选项。初始解。默认选项。输出因子分析的初始输出因子分析的初始解,显示初始公共因解,显示初始公共因子方差、特征值及其子方差、特征值及其解释变量的百分比。解释变量的百分比。1、相关系数矩阵;、相关系数矩阵;2、显著性水平;、显著性水平;3、相关系数矩阵的行、相关系数矩阵的行列值;列值;4、相关系数矩阵的逆、相关系数矩阵的逆矩阵;矩阵;5、再生相关系数矩阵。、再生相关系数矩阵。输出因子分析的估计量输出因子分析的估计量相关系数矩阵,并显示相关系数矩阵,并显示参差值,即原始相关系参差值,即原始相关系数矩阵与再生相关系数数矩阵与再生相关系数矩阵之间的差值;
11、矩阵之间的差值;6、反映射相关系数矩、反映射相关系数矩阵。包括负片相关系数阵。包括负片相关系数矩阵。反映射相关系数矩阵。反映射相关系数矩阵的对角线可以显示矩阵的对角线可以显示变量的抽样适度测试值变量的抽样适度测试值kmo和球形和球形bartlett检验。检验。分析矩阵选项:分析矩阵选项:1、相关系数、相关系数矩阵。用于指矩阵。用于指定利用分析变定利用分析变量相关矩阵为量相关矩阵为提取因子的依提取因子的依据,当参与分据,当参与分析的变量测度析的变量测度单位不同时,单位不同时,选择该选项选择该选项分析矩阵选项:分析矩阵选项:2、协方差矩、协方差矩阵。指定利用阵。指定利用分析变量的协分析变量的协方差
12、矩阵为提方差矩阵为提取因子的依据。取因子的依据。选择和因子提选择和因子提取方法有关的取方法有关的输出选项:输出选项:1、非旋转因、非旋转因子解。要求显子解。要求显示未经旋转的示未经旋转的因子载荷、公因子载荷、公共因子方差和共因子方差和特征值;特征值;选择和因子提选择和因子提取方法有关的取方法有关的输出选项:输出选项:2、碎石图。每、碎石图。每个因子的方差个因子的方差图,该图利用图,该图利用特征值为两个特征值为两个坐标轴。碎石坐标轴。碎石图可以决定保图可以决定保留因子的数量留因子的数量提取因子的准提取因子的准则:则:1、特征值:该、特征值:该选项指定因子选项指定因子的特征值;的特征值;2、指定提
13、取公、指定提取公因子的数目。因子的数目。收敛的最大迭代次数收敛的最大迭代次数因子旋转方式:因子旋转方式:1、不进行旋转;、不进行旋转;2、方差最大正交旋转、方差最大正交旋转法;法;3、直接斜交旋转方法;、直接斜交旋转方法;4、四分位最大正交旋、四分位最大正交旋转法;转法;5、等量正交旋转法;、等量正交旋转法;6、斜交旋转法、斜交旋转法输出与因子旋转相关输出与因子旋转相关的信息:的信息:1、旋转解;、旋转解;2、因子载荷散点图。、因子载荷散点图。spssspss的输出结果的输出结果各变量之间的相关系数矩阵各变量之间的相关系数矩阵变量之间的存在较强的相关关系,适合作主成分分析变量之间的存在较强的相
14、关关系,适合作主成分分析 spssspss的输出结果的输出结果( (选择主成分选择主成分) )表表3 各主成分所解释的原始变量的方差各主成分所解释的原始变量的方差该表是选则主成分的主要依据该表是选则主成分的主要依据n“initial eigenvalues”(初始特征根初始特征根) l实际上就是本例中的实际上就是本例中的6个主轴的长度个主轴的长度l特征根反映了主成分对原始变量的影响程度,表示引入特征根反映了主成分对原始变量的影响程度,表示引入该主成分后可以解释原始变量的信息该主成分后可以解释原始变量的信息l特征根又叫特征根又叫方差方差,某个特征根占总特征根的比例称,某个特征根占总特征根的比例称
15、为主为主成分方差贡献率成分方差贡献率l设特征根为设特征根为 ,则第,则第i个主成分的方差贡献率为个主成分的方差贡献率为l比如,第一个主成分的特征根为比如,第一个主成分的特征根为3.963,占总特征根的的,占总特征根的的比例比例(方差贡献率方差贡献率)为为66.052%,这表示第一个主成分解释,这表示第一个主成分解释了原始了原始6个变量个变量66.052%的信息,可见第一个主成分对原的信息,可见第一个主成分对原来的来的6个变量解释的已经很充分了个变量解释的已经很充分了根据什么选择主成分?根据什么选择主成分?piii1n根据主成分贡献率根据主成分贡献率l一般来说,主成分的累计方差贡献率达到一般来说
16、,主成分的累计方差贡献率达到80%以上的前以上的前几个主成分,都可以选作最后的主成分几个主成分,都可以选作最后的主成分l比如表比如表3中前两个主成分的累计方差贡献率为中前两个主成分的累计方差贡献率为95.57%n根据特特征根的大小根据特特征根的大小l一般情况下,当特征根小于一般情况下,当特征根小于1时,就不再选作主成分了,时,就不再选作主成分了,因为该主成分的解释力度还不如直接用原始变量解的释因为该主成分的解释力度还不如直接用原始变量解的释力度大力度大l比如表比如表3中除前两个外,其他主成分的特征根都小于中除前两个外,其他主成分的特征根都小于1。所以所以spss只选择了两个主成分只选择了两个主
17、成分l就本例而言,两个主成分就足以说明各地区的经济发展就本例而言,两个主成分就足以说明各地区的经济发展状况了状况了根据什么选择主成分?根据什么选择主成分?nspss还提供了一个更还提供了一个更为直观的图形工具来帮为直观的图形工具来帮助选择主成分,即碎石助选择主成分,即碎石图图(scree plot)n从碎石图可以看到从碎石图可以看到6个个主轴长度变化的趋势主轴长度变化的趋势n实践中,通常结合具体实践中,通常结合具体情况,选择碎石图中变情况,选择碎石图中变化趋势出现拐点的前几化趋势出现拐点的前几个主成分作为原先变量个主成分作为原先变量的代表,该例中选择前的代表,该例中选择前两个主成分即可两个主成
18、分即可根据什么选择主成分?根据什么选择主成分? ( (scree plotscree plot) )拐点怎样解释主成分?怎样解释主成分?主成分的因子载荷矩阵主成分的因子载荷矩阵 l表表1中的每一列表示一个主成分作为原来变量线性组合的系数,也就是中的每一列表示一个主成分作为原来变量线性组合的系数,也就是主成分分析模型中的系数主成分分析模型中的系数aijl比如,第一主成分所在列的系数比如,第一主成分所在列的系数0.670表示第表示第1个主成分和原来的第一个个主成分和原来的第一个变量变量(人均人均gdp)之间的线性相关系数。这个系数越大,说明主成分对该之间的线性相关系数。这个系数越大,说明主成分对该
19、变量的代表性就越大变量的代表性就越大n根据主成分分析模型和因子载荷,可以得到根据主成分分析模型和因子载荷,可以得到两个主成分与原来两个主成分与原来6个变量之间的线性组合个变量之间的线性组合表达式如下表达式如下 怎样解释主成分?怎样解释主成分?( (主成分与原始变量的关系主成分与原始变量的关系) )65432126543211263. 0721. 0728. 0351. 0055. 0725. 0950. 0674. 0633. 0896. 0976. 0670. 0 xxxxxxyxxxxxxy注意:表达式中的不是原始变量,而是标准化变量n 载荷图载荷图(loading plot)直观显示直观
20、显示主成分对原始主成分对原始6变量的解释情况变量的解释情况n 图中横轴表示第一个主成分与原图中横轴表示第一个主成分与原始变量间的相关系数;纵轴表示始变量间的相关系数;纵轴表示第二个主成分与原始变量之间的第二个主成分与原始变量之间的相关系数相关系数n 每一个变量对应的主成分载荷就每一个变量对应的主成分载荷就对应坐标系中的一个点,比如,对应坐标系中的一个点,比如,人均人均gdp变量对应的点是变量对应的点是(0.670,0.725)n 第一个主成分很充分地解释了原第一个主成分很充分地解释了原始的始的6个变量个变量(与每个原始变量都与每个原始变量都有较强的正相关关系有较强的正相关关系),第二个,第二个
21、主成分则较好地解释了居民消费主成分则较好地解释了居民消费水平、人均水平、人均gdp和年末总人口和年末总人口这这3个变量个变量(与它们的相关关系较与它们的相关关系较高高),而与其他变量的关系则较,而与其他变量的关系则较弱弱(相关系数的点靠近坐标轴相关系数的点靠近坐标轴)怎样解释主成分?怎样解释主成分? (loading plot)(loading plot)相关系数的点越远离坐标轴,主成分对原始变量的代表性就越大。这3个点远离主成分2的坐标第二部分第二部分 因子分析因子分析因子分析的意义和数学模型因子分析的意义和数学模型因子分析的步骤因子分析的步骤因子分析的应用因子分析的应用因子分析的意义和数学
22、模型因子分析的意义和数学模型n由由charles spearman于于1904年首次提出的年首次提出的n与主成分分析类似,它们都是要找出少数几个新的与主成分分析类似,它们都是要找出少数几个新的变量来代替原始变量变量来代替原始变量n不同之处:主成分分析中的主成分个数与原始变量不同之处:主成分分析中的主成分个数与原始变量个数是一样的,即有几个变量就有几个主成分,只个数是一样的,即有几个变量就有几个主成分,只不过最后我们确定了少数几个主成分而已。而因子不过最后我们确定了少数几个主成分而已。而因子分析则需要事先确定要找几个成分,也称为因子分析则需要事先确定要找几个成分,也称为因子(factor),然后
23、将原始变量综合为少数的几个因子,然后将原始变量综合为少数的几个因子,以再现原始变量与因子之间的关系,一般来说,因以再现原始变量与因子之间的关系,一般来说,因子的个数会远远少于原始变量的个数子的个数会远远少于原始变量的个数什么是因子分析?什么是因子分析? (factor analysis)(factor analysis)n因子分析可以看作是主成分分析的推广和扩展,但因子分析可以看作是主成分分析的推广和扩展,但它对问题的研究更深入、更细致一些。实际上,主它对问题的研究更深入、更细致一些。实际上,主成分分析可以看作是因子分析的一个特例成分分析可以看作是因子分析的一个特例n简言之,因子分析是通过对变
24、量之间关系的研究,简言之,因子分析是通过对变量之间关系的研究,找出能综合原始变量的少数几个因子,使得少数因找出能综合原始变量的少数几个因子,使得少数因子能够反映原始变量的绝大部分信息,然后根据相子能够反映原始变量的绝大部分信息,然后根据相关性的大小将原始变量分组,使得组内的变量之间关性的大小将原始变量分组,使得组内的变量之间相关性较高,而不同组的变量之间相关性较低。因相关性较高,而不同组的变量之间相关性较低。因此,因子分析属于多元统计中处理降维的一种统计此,因子分析属于多元统计中处理降维的一种统计方法,其目的就是要减少变量的个数,用少数因子方法,其目的就是要减少变量的个数,用少数因子代表多个原
25、始变量代表多个原始变量什么是因子分析?什么是因子分析? (factor analysis)(factor analysis)n因变量和因子个数的不一致,使得不仅在数学因变量和因子个数的不一致,使得不仅在数学模型上,而且在实际求解过程中,因子分析和模型上,而且在实际求解过程中,因子分析和主成分分析都有着一定的区别,计算上因子分主成分分析都有着一定的区别,计算上因子分析更为复杂析更为复杂n因子分析可能存在的一个优点是:在对主成分因子分析可能存在的一个优点是:在对主成分和原始变量之间的关系进行描述时,如果主成和原始变量之间的关系进行描述时,如果主成分的直观意义比较模糊不易解释,主成分分析分的直观意义
26、比较模糊不易解释,主成分分析没有更好的改进方法;因子分析则额外提供了没有更好的改进方法;因子分析则额外提供了“因子旋转因子旋转(factor rotation)”这样一个步骤,可这样一个步骤,可以使分析结果尽可能达到易于解释且更为合理以使分析结果尽可能达到易于解释且更为合理的目的的目的因子分析的数学模型因子分析的数学模型n原始的原始的p个变量表达为个变量表达为k个因子的线性组合变量个因子的线性组合变量n设设p个原始变量为个原始变量为 ,要寻找的,要寻找的k个因子个因子(kp)为为 ,主成分和原始变量之间的关系表示为,主成分和原始变量之间的关系表示为因子分析的数学模型因子分析的数学模型因子分析的
27、数学模型系数aij为第个i变量与第k个因子之间的线性相关系数,反映变量与因子之间的相关 程 度 , 也 称 为 载 荷(loading)。由于因子出现在每个原始变量与因子的线性组合中,因此也称为公因子。为特殊因子,代表公因子以外的因素影响pkpkpppkkkkfafafaxfafafaxfafafax2211222221212112121111kfff,21pxxx,21n共同度量共同度量(communality)n因子的方差贡献率因子的方差贡献率 因子分析的数学模型因子分析的数学模型( (共同度量共同度量communalitycommunality和公因子的方差贡献率和公因子的方差贡献率 )
28、 )221(1 2)piijjhaik,221(1 2)kjijigajp,变量xi的信息能够被k个公因子解释的程度,用 k个公因子对第i个变量xi的方差贡献率表示第j个公因子对变量xi的提供的方差总和,反映第j个公因子的相对重要程度因子分析的步骤因子分析的步骤n因子分析要求样本的个数要足够多因子分析要求样本的个数要足够多l一般要求样本的个数至少是变量的一般要求样本的个数至少是变量的5倍以上。同时,样本倍以上。同时,样本总数据量理论要求应该在总数据量理论要求应该在100以上以上n用于因子分析的变量必须是相关的用于因子分析的变量必须是相关的l如果原始变量都是独立的,意味着每个变量的作用都是不如果
29、原始变量都是独立的,意味着每个变量的作用都是不可替代的,则无法降维可替代的,则无法降维n检验方法检验方法l计算各变量之间的相关矩阵,观察各相关系数。若相关矩计算各变量之间的相关矩阵,观察各相关系数。若相关矩阵中的大部分相关系数小于阵中的大部分相关系数小于0.3,则不适合作因子分析,则不适合作因子分析l使用使用kaiser-meyer-olkin检验检验(简称简称kmo检验检验)和和 bartlett球度检验球度检验(bartletts test of sphericity)来判断来判断(spss将两种将两种检验统称为检验统称为“kmo and bartletts test of spheric
30、ity”)因子分析的步骤因子分析的步骤( (数据检验数据检验) )nbartlett球度检验球度检验l以变量的相关系数矩阵为基础,假设相关系数矩阵是单位以变量的相关系数矩阵为基础,假设相关系数矩阵是单位阵阵(对角线元素不为对角线元素不为0,非对角线元素均为,非对角线元素均为0)。如果相关矩。如果相关矩阵是单位阵,则各变量是独立的,无法进行因子分析阵是单位阵,则各变量是独立的,无法进行因子分析nkmo检验检验l用于检验变量间的偏相关性,用于检验变量间的偏相关性,kmo统计量的取值在统计量的取值在01之间之间l如果统计量取值越接近如果统计量取值越接近1,变量间的偏相关性越强,因子,变量间的偏相关性
31、越强,因子分析的效果就越好分析的效果就越好lkmo统计量在统计量在0.7以上时,因子分析效果较好;以上时,因子分析效果较好;kmo统统计量在计量在0.5以下时,因子分析效果很差以下时,因子分析效果很差因子分析的步骤因子分析的步骤( (数据检验数据检验) )因子分析的步骤因子分析的步骤( (因子提取因子提取) )n因子数量的确定因子数量的确定l用公因子方差贡献率提取:与主成分分析类似,用公因子方差贡献率提取:与主成分分析类似,一般累计方差贡献率达到一般累计方差贡献率达到80%以上的前几个因子以上的前几个因子可以作为最后的公因子可以作为最后的公因子l用特征根提取:一般要求因子对应的特征根要大用特征
32、根提取:一般要求因子对应的特征根要大于于1,因为特征根小于,因为特征根小于1说明该共因子的解释力度说明该共因子的解释力度太弱,还不如使用原始变量的解释力度大太弱,还不如使用原始变量的解释力度大n实际应用中,因子的提取要结合具体问题而实际应用中,因子的提取要结合具体问题而定,在某种程度上,取决于研究者自身的知定,在某种程度上,取决于研究者自身的知识和经验识和经验 因子分析的步骤因子分析的步骤( (因子提取因子提取) )n 因子命名是因子分析重要一步因子命名是因子分析重要一步l一个因子包含了多个原始变量的信息,它究一个因子包含了多个原始变量的信息,它究竟反映了原始变量的哪些共同信息?竟反映了原始变
33、量的哪些共同信息?l因子分析得到的因子的含义是模糊的,需要因子分析得到的因子的含义是模糊的,需要重新命名,以便对研究的问题作出合理解释重新命名,以便对研究的问题作出合理解释l可通过考察观察因子载荷矩阵并结合实际问可通过考察观察因子载荷矩阵并结合实际问题完成题完成l命名已经不是统计问题。它需要研究者自身命名已经不是统计问题。它需要研究者自身的专业素质和对实际问题背景的了解程度,的专业素质和对实际问题背景的了解程度,这需要更多的实践经验这需要更多的实践经验因子分析的步骤因子分析的步骤( (因子命名因子命名) )n观察因子载荷矩阵观察因子载荷矩阵l如果因子载荷如果因子载荷aij的绝对值在第的绝对值在
34、第i行的多个列上都有较行的多个列上都有较大的取值大的取值(通常大于通常大于0.5),表明原始变量与多个因子,表明原始变量与多个因子都有较大的相关关系,意味着原始变量都有较大的相关关系,意味着原始变量xi需要由多个需要由多个因子来共同解释因子来共同解释l如果因子载荷如果因子载荷aij的绝对值在第的绝对值在第j列的多个行上都有较列的多个行上都有较大的取值,则表因子大的取值,则表因子fi能共同解释许多变量的信息,能共同解释许多变量的信息,而对每个原始变量只能解释其中的少部分信息,表而对每个原始变量只能解释其中的少部分信息,表明因子不能有效代表任何一个原始变量,因子的含明因子不能有效代表任何一个原始变
35、量,因子的含义模糊不清,难以对因子给出一个合理的解释义模糊不清,难以对因子给出一个合理的解释l需要进行因子旋转,以便得到更加合理的解释需要进行因子旋转,以便得到更加合理的解释因子分析的步骤因子分析的步骤( (因子命名因子命名) )n因子旋转因子旋转(factor rotation)的目的是使因子的含的目的是使因子的含义更加清楚,以便于对因子的命名和解释义更加清楚,以便于对因子的命名和解释n旋转的方法有正交旋转和斜交旋转两种旋转的方法有正交旋转和斜交旋转两种l正交旋转是指坐标轴始终保持垂直正交旋转是指坐标轴始终保持垂直90度旋转,这样度旋转,这样新生成的因子仍可保持不相关新生成的因子仍可保持不相
36、关l斜交旋转坐标轴的夹角可以是任意的,因此新生成斜交旋转坐标轴的夹角可以是任意的,因此新生成的因子不能保证不相关。因此实际应用中更多地使的因子不能保证不相关。因此实际应用中更多地使用正交旋转用正交旋转lspss提供提供5种旋转方法,其中最常用的是种旋转方法,其中最常用的是varimax(方差最大正交旋转方差最大正交旋转)法法因子分析的步骤(因子命名旋转)nvarimax(方差最大正交旋转方差最大正交旋转):最常用的旋转方法。:最常用的旋转方法。使各使各因子保持正交状态,但尽量使各因子的方差达到最大,因子保持正交状态,但尽量使各因子的方差达到最大,即相对的载荷平方和达到最大,从而方便对因子的解释
37、即相对的载荷平方和达到最大,从而方便对因子的解释nquartimax(四次方最大正交旋转四次方最大正交旋转):该方法倾向于减少和:该方法倾向于减少和每个变量有关的因子数,从而简化对原变量的解释每个变量有关的因子数,从而简化对原变量的解释nequamax(平方最大正交旋转平方最大正交旋转):该方法介于方差最大正:该方法介于方差最大正交旋转和四次方最大正交旋转之间交旋转和四次方最大正交旋转之间ndirect oblimin(斜交旋转斜交旋转):该方法需要事先指定一个因:该方法需要事先指定一个因子映像的自相关范围子映像的自相关范围npromax:该方法在方差最大正交旋转的基础上进行斜交:该方法在方差
38、最大正交旋转的基础上进行斜交旋转旋转因子分析的步骤因子分析的步骤( (因子命名因子命名旋转旋转) )n因子得分因子得分(factor score)是每个因子在每个样本是每个因子在每个样本上的具体取值,它由下列因子得分函数给出上的具体取值,它由下列因子得分函数给出因子分析的步骤因子分析的步骤( (计算因子得分计算因子得分) )因子得分函数因子得分是各变量的线性组合 pkpkkkppppxbxbxbfxbxbxbfxbxbxbf22112222121212121111因子分析的应用根据我国31个省市自治区2006年的6项主要经济指标数据,进行因子分析,对因子进行命名和解释,并计算因子得分和排序因子
39、分析因子分析 ( (实例分析实例分析) )用用spss进行因子分析进行因子分析第第1步步 选择【选择【analyze】【data reduction-factor】主对话框。将所主对话框。将所 有原始变量选入【有原始变量选入【variables】第第2步步 点击【点击【descriptives】【correlation matrix】【kmo and bartletts test of sphericity】(其他选项根据需要其他选项根据需要) 【continue】 第第3步步 点击【点击【extraction】,在【】,在【method】框中选择因子的提取方法】框中选择因子的提取方法(本例本
40、例 使用隐含的使用隐含的principal components);在【;在【extract】中输入选择因子】中输入选择因子 的最小特征根的最小特征根(隐含的是特征根大于隐含的是特征根大于1);在【;在【display】下选择】下选择 【scree plot】 【continue】第第4步步 点击【点击【rotation】,在【】,在【method】框中选择因子旋转方法】框中选择因子旋转方法(隐含的不隐含的不 旋转,本例选择【旋转,本例选择【varimax】);在【;在【display】下选择【】下选择【loading plot】 【continue】 第第5步步 点击【点击【scores】,
41、并选中【】,并选中【display factor score coefficient matrix】(spss隐含的估计因子得分系数的方法是隐含的估计因子得分系数的方法是regression) 【continue】 【ok】 数据的相关性检验数据的相关性检验因子分析因子分析 ( (实例分析实例分析) )kmo检验和检验和bartlett球度检验球度检验 bartlett球度检验统计量为球度检验统计量为277.025。检验的。检验的p值接近值接近0。表明表明6个变量之间有较强的相关关系。而个变量之间有较强的相关关系。而kmo统计量为统计量为0.695,接近,接近0.7。适合作因子分析。适合作因子
42、分析 共同度量共同度量 因子分析因子分析 ( (实例分析实例分析) )变量共同度量变量共同度量所有变量的共同度量都在所有变量的共同度量都在80%以上,因此,提取出以上,因此,提取出的公因子对原始变量的解释能力应该是很强的的公因子对原始变量的解释能力应该是很强的 因子方差贡献率因子方差贡献率因子分析因子分析 ( (实例分析实例分析) )各因子所解释的原始变量的方差各因子所解释的原始变量的方差 除最后除最后3列外,其余部分与主成分分析中的表相同。列外,其余部分与主成分分析中的表相同。 “rotation sums of squared loadings”部分是因子旋转后对原始变量方差的解释情况。旋
43、转部分是因子旋转后对原始变量方差的解释情况。旋转后的累计方差没有改变,只是两个因子所解释的原始变量的方差发生了后的累计方差没有改变,只是两个因子所解释的原始变量的方差发生了一些变化。一些变化。 因子分析因子分析 ( (实例分析实例分析) )旋转后的因子载荷矩阵旋转后的因子载荷矩阵 第一个因子与年末总人口、固定资产投资、社会消费品零售总额、财政收入这第一个因子与年末总人口、固定资产投资、社会消费品零售总额、财政收入这几个载荷系数较大,主要解释了这几个变量。从实际意义上看,可以把因子几个载荷系数较大,主要解释了这几个变量。从实际意义上看,可以把因子1姑且命名为姑且命名为“经济水平经济水平”因子。而
44、第二个因子与人均因子。而第二个因子与人均gdp、居民消水平这两、居民消水平这两个变量的载荷系数较大,主要解释了这两个变量,从实际意义看,可以将因子个变量的载荷系数较大,主要解释了这两个变量,从实际意义看,可以将因子2姑且命名为姑且命名为“消费水平消费水平”因子因子 (是否合理读者自己评判是否合理读者自己评判)因子分析因子分析( (实例分析实例分析) )因子分析的数学模型表达式中的xi已经不是原始变量,而是标准化变量 216215214213212211349.0922.0980.0117.0213.0941.0247.0931.0622.0755.0981.0112.0ffxffxffxffx
45、ffxffx因子分析因子分析 ( (实例分析实例分析) )旋 转 后 的 因旋 转 后 的 因子 载 荷 系 数子 载 荷 系 数更 加 接 近 于更 加 接 近 于1(如果旋转如果旋转后 的 因 子 载后 的 因 子 载荷系数向荷系数向01分化越明显,分化越明显,说 明 旋 转 的说 明 旋 转 的效果越好效果越好),从 而 使 因 子从 而 使 因 子的 意 义 更 加的 意 义 更 加清楚了清楚了 因子分析因子分析 ( (实例分析实例分析) )因子得分系数矩阵因子得分系数矩阵根据因子得分系数矩阵可将因子表示为变量的线性组合 n由因子得分系数矩阵,可以将公因子表示为各变量由因子得分系数矩阵
46、,可以将公因子表示为各变量的线性组合。得到的因子得分函数为的线性组合。得到的因子得分函数为因子分析因子分析 ( (实例分析实例分析) )上面表达式中的上面表达式中的xi标准化变量。根据这一表达式便可以计算每个标准化变量。根据这一表达式便可以计算每个地区对应的第一个因子和第二个因子的取值,也称为因子得分地区对应的第一个因子和第二个因子的取值,也称为因子得分(factor score)。有了因子得分,就可以对每个地区分别按照前面。有了因子得分,就可以对每个地区分别按照前面命名的命名的“经济水平经济水平”因子和因子和“消费水平消费水平”因子进行评价和排序因子进行评价和排序 65432126543211022. 0429. 0237. 0026. 0171. 0430. 0281. 0104. 0372. 0300. 0180. 0105. 0 xxxxxxfxxxxxx
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 按揭手房买卖协议书
- 灰土挤密桩施工承包合同
- 2025年南宁货运从业资格试题答案大全
- 2025年青海货运从业资格试题题库
- 2025年鹤岗b2货运资格证模拟考试
- 电工承包简单合同(2篇)
- 2024-2025学年四年级语文上册第二单元6天安门广场教案1苏教版
- 浙教版数学七年级上册《2.1 有理数的加法》听评课记录
- 七年级英语上册 Module 8 Choosing presents Unit 3 Language in use说课稿 (新版)外研版
- 2024-2025学年高中物理课时分层作业2库仑定律含解析教科版选修3-1
- 勇者斗恶龙9(DQ9)全任务攻略
- 经颅磁刺激的基础知识及临床应用参考教学课件
- 小学语文人教四年级上册第四单元群文阅读“神话故事之人物形象”PPT
- 乡村振兴汇报课件
- 红色记忆模板课件
- ISO 31000-2018 风险管理标准-中文版
- 油气藏类型、典型的相图特征和识别实例
- 丽声三叶草分级读物第四级A Friend for Little White Rabbit课件
- DBJ61_T 179-2021 房屋建筑与市政基础设施工程专业人员配备标准
- 三年级下册脱式计算题
- 建筑消防设施基础知识PPT通用课件
评论
0/150
提交评论