因子分析与对应分析_第1页
因子分析与对应分析_第2页
因子分析与对应分析_第3页
因子分析与对应分析_第4页
因子分析与对应分析_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于因子分析与对应分析第一页,共五十八页,2022年,8月28日主成分分析是将多个指标化为少数相互无关的综合指标的统计方法,通常数学上的处理就是将原来的p个指标做线性组合,作为新的综合指标,记第一个综合指标为F1。选取这个线性组合的原则是令F1的方差最大,称F1为第一主成分;然后选取第二主成分F2,且F1与F2的协方差为0,类似构造其余的主成分。主成分分析——【Factor】过程对观测量数目没有严格要求第二页,共五十八页,2022年,8月28日第一节因子分析——【Factor】过程

主成分分析的推广和发展,对观测量数目要求至少是变量的5倍以上,且越多越好

一、因子分析简介做什么?因子分析是多元统计分析中处理降维的一种统计方法,它主要将具有错综复杂关系的变量或者样品综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系。基本思想:(1)首先,通过变量(或样品)的相关系数矩阵(或相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量(常称为因子)去描述多个变量(或样品)之间的相关(相似)关系;(2)然后,根据相关性(或相似性)的大小把变量(或样品)分组,使得同组内的变量(或样品)之间的相关性(或相似性)较高,但不同组的变量相关性(或相似性)较低。第三页,共五十八页,2022年,8月28日依据处理的对象不同,可以分为两类:

R型因子分析,对变量做降维处理

Q型因子分析,对样本做降维处理R型因子分析第四页,共五十八页,2022年,8月28日第五页,共五十八页,2022年,8月28日因子分析的几个概念:1、因子载荷第六页,共五十八页,2022年,8月28日2、变量共同度

第七页,共五十八页,2022年,8月28日3、公因子Fj的方差贡献第八页,共五十八页,2022年,8月28日4、因子旋转因子旋转的目的是为了使得因子载荷阵的结构简化,便于对公共因子进行解释。这里所谓的结构简化是使每个变量仅在一个公共因子上有较大的载荷,而在其余公共因子上载荷比较小。这种变换因子载荷阵的方法称为因子轴的旋转。旋转的方法有很多种,如正交旋转,斜交旋轴等。第九页,共五十八页,2022年,8月28日5、因子得分第十页,共五十八页,2022年,8月28日因子分析的一般步骤第十一页,共五十八页,2022年,8月28日二、引例(练习一)例1利用因子分析过程分析各个城市的市政设施建设情况。数据文件:“各地区城市市政设施.sav”,下表是部分数据。第十二页,共五十八页,2022年,8月28日【Analyze】/【DataReduction】/【Factor】要求:选入分析变量(因子分析的变量)(定义记录旋转条件)第十三页,共五十八页,2022年,8月28日要求:输出相关系数矩阵;进行因子分析适用条件的检验Descriptives:选择需要输出的统计量(统计量)单变量描述统计量:各分析变量的均值、标准差及观测数原始分析结果:原变量的公因子方差、与变量相同个数的因子、各因子的特征根及其所占总方差的百分比和累计百分比(相关矩阵)所有变量间的相关系数矩阵显著性水平相关系数矩阵的行列式值KMO检验和Bartlett球形检验相关系数矩阵的逆矩阵再生相关系数矩阵反映像协方差阵和相关阵第十四页,共五十八页,2022年,8月28日要求:输出碎石图Extraction:选择因子提取的方法(选择公共因子的提取方法)公共因子的提取方法:(1)主成分分析法(默认);(2)不加权最小二乘法;(3)广义最小二乘法;(4)极大似然法;(5)主轴因子法;(6)因子法;(7)影像因子法相关矩阵协方差矩阵(设定公共因子提取标准)显示未经旋转变换的因子提取结果显示碎石图,体现各因子重要程度自定义提取因子的数量以特征根大于指定数值为提取标准(收敛时的最大迭代次数)第十五页,共五十八页,2022年,8月28日Rotation:选择因子旋转的方法方差最大化正交旋转斜交旋转法四分旋转法平均正交旋转法斜交旋转法(设置旋转解的输出)(因子旋转的方法)输出主成分转换矩阵输出二维或三维的因子载荷图第十六页,共五十八页,2022年,8月28日要求:输出因子得分系数矩阵FactorScores:因子得分(在数据文件中建立一个新变量,用于保存各观测量的因子得分)(因子得分计算方法)回归法巴特列特法安德森-鲁宾法(输出因子得分系数矩阵及因子协方差矩阵)第十七页,共五十八页,2022年,8月28日要求:用均值代替缺失值Options对话框(选择缺失值处理方法)(选择系数的输出方式)因子载荷矩阵和结构矩阵按数值大小排序不显示绝对值小于指定数的载荷系数第十八页,共五十八页,2022年,8月28日变量间相关性很高结果解读:1、相关系数矩阵表第十九页,共五十八页,2022年,8月28日接近0.9,适合做因子分析拒绝原假设,认为各变量之间不独立2、KMO检验和Bartlett球形检验结果表注:

KMO检验用于检验变量间的偏相关系数是否过小,一般,KMO大于0.9时效果最佳,小于0.5时不适宜做因子分析。

Bartlett球形检验用于检验相关系数矩阵是否是单位阵,如果结论是不拒绝该假设,则表示各个变量都是各自独立的。第二十页,共五十八页,2022年,8月28日该变量95.4%的信息已经被提取3、变量共同度表给出了提取公共因子前后各变量的共同度(衡量公共因子的相对重要性指标)说明:比如变量X1的共同度位0.954,即提取的公共因子对变量X1的方差做出了95.4%的贡献。第二十一页,共五十八页,2022年,8月28日4、主成分表列出了所有的主成分,且按照特征根从大到小次序排列。说明:第一主成分特征根为5.280,方差贡献率为88.001%,前两个主成分的累计贡献率为94.504%,根据提取因子的条件——特征值大于1,本例只选出一个因子。第二十二页,共五十八页,2022年,8月28日提取一个主成分即可5、碎石图按照特征根大小排列的主成分散点图。纵坐标为特征值,横坐标为因子数。第二十三页,共五十八页,2022年,8月28日6、因子负荷矩阵用来反映各个变量的变异主要由哪些因子解释。第二十四页,共五十八页,2022年,8月28日7、因子得分系数矩阵得出用各个变量的线性组合表达的主成分。第二十五页,共五十八页,2022年,8月28日8、因子得分的协方差矩阵反映各因子间的联系程度。注:本例只提取了一个公共因子,故表格内容无实际意义。第二十六页,共五十八页,2022年,8月28日例2利用因子分析过程分析一年内各个城市的日照情况。数据文件:“主要城市日照数.sav”。【Analyze】/【DataReduction】/【Factor】要求:选入分析变量第二十七页,共五十八页,2022年,8月28日要求:输出因子分析适用条件的检验第二十八页,共五十八页,2022年,8月28日要求:输出碎石图第二十九页,共五十八页,2022年,8月28日要求:输出因子得分系数阵第三十页,共五十八页,2022年,8月28日要求:采用方差最大化正交旋转;输出因子载荷图第三十一页,共五十八页,2022年,8月28日结果解读:1、KMO检验和Bartlett球形检验结果表说明:KMO检验结果为0.798,大于0.5,比较适合作因子分析;Bartlett球形检验的Sig.值为0,各变量不独立。第三十二页,共五十八页,2022年,8月28日2、变量共同度表说明:变量“Jan”的共同度为0.915,即选取的公共因子提取了变量“Jan”91.5%的信息。第三十三页,共五十八页,2022年,8月28日3、主成分表说明:第一主成分特征根为6.854,方差贡献率为57.041%,前3个主成分的累积贡献率为84.421%,根据提取因子的条件——特征值大于1,本例选出3个因子。第三十四页,共五十八页,2022年,8月28日4、碎石图说明:前3个主成分的特征根都在1以上。第三十五页,共五十八页,2022年,8月28日5、因子载荷矩阵给出各变量的因子表达式。第三十六页,共五十八页,2022年,8月28日6、旋转后因子载荷矩阵经过正交旋转后的因子载荷矩阵,给出旋转后的各变量的因子表达式。说明:第一主因子主要由前5个变量决定,第二主因子主要由中间4个变量决定,第三主因子主要由最后3个变量决定。第三十七页,共五十八页,2022年,8月28日7、因子转换矩阵旋转前的因子载荷矩阵乘以因子转换矩阵等于旋转后的因子载荷矩阵。第三十八页,共五十八页,2022年,8月28日8、因子旋转后的因子载荷图图中的坐标轴就是各个主因子。第三十九页,共五十八页,2022年,8月28日9、因子得分系数矩阵得到因子得分表达式。第四十页,共五十八页,2022年,8月28日10、因子得分的协方差矩阵说明:因子得分的协方差矩阵为单位阵,得出提取的3个公共因子之间是不相关的。第四十一页,共五十八页,2022年,8月28日第二节简单对应分析

——【CorrespondebceAnalysis】过程

又称列联表对应分析一、对应分析简介对应分析是通过进行主成分分析来描述两个或多个分类变量各水平间相关性的分析方法,它的分析结果主要采用反映变量间相互关系的对应分析图来表示。对应分析在SPSS中分为两类:

简单对应分析——【CorrespondebceAnalysis】过程:主要研究两个分类变量之间的关系。

多元对应分析——【OptimalScaling】过程第四十二页,共五十八页,2022年,8月28日对应分析表(列联表):第四十三页,共五十八页,2022年,8月28日

最后分别对行剖面点集和列剖面点集做主成分分析,以判断两个变量的联系情况。第四十四页,共五十八页,2022年,8月28日例2利用简单对应分析过程分析不同年龄段选民的倾向。数据文件:voter.sav二、引例(练习二)第四十五页,共五十八页,2022年,8月28日【Analyze】/【DimensionReduction】/【CorrespondenceAnalysis】要求:选入行变量(取值范围为1~3)与列变量(取值范围为1~4)(行变量)定义行变量取值范围(列变量)定义列变量取值范围第四十六页,共五十八页,2022年,8月28日Model:模式子对话框(设置分析结果维数)(选择距离测量方式)卡方距离欧氏距离,主要用于连续变量(变量的标准化方式)(正则化方法)对称法(默认)第四十七页,共五十八页,2022年,8月28日Satistics:设置需要输出的统计量输出对应分析表(列联表)输出行点概述表输出列点概述表输出行轮廓表输出列轮廓表指定的前n个维度输出基于行列得分的原始表格(输出行点和列点的标准差、以及各维度坐标间的相关系数)第四十八页,共五十八页,2022年,8月28日Plots:设置需要输出图形(输出对应分析图)双变量散点图行点图列点图限制标签长度输出各行变量分类对应于行得分的散点图输出各列变量分类对应于列得分的散点图(图形维度)输出分析结果的所有维度限制输出维度的数目第四十九页,共五十八页,2022年,8月28日结果解读:1、对应分析表给出不同年龄阶段的人群分别投票给三位总统候选人的人数。第五十页,共五十八页,2022年,8月28日2、结果汇总表列出维数、奇异值(惯量的平方根)、惯量(又指特征根)、总的卡方检验及Sig.值维数奇异值特征根总的卡方检验注:惯量用于说明对应分析各个维度的结果能够解释列联表中两个变量联系的程度。说明:表中两个维度分别解释了总信息量的99.6%和0.4%,说明二维图形完全可以表示两个变量间的信息,且观察时以第一维度为主。第五十一页,共五十八页,2022年,8月28日3、行点概述表给出行变量的3个分组在两个维度中的分值每组所占百分比每组所对各个维度的贡献量(点对维度惯量的贡献量)(维度对点惯量的贡献量)分组在第一、第二维度的坐标值第五十二页,共五十八页,2022年,8月28日4、列点概述表给出列变量的4个分组在两个维度中的分值每组所占百分比分组在第一、第二维度的坐标值每组所对各个维度的贡献量(点对维度惯量的贡献量)(维度对点惯量的贡献量)第五十三页,共五十八页,2022年,8月28日5、对应分析图首先看同一变量的不同分组在某一侧维度上靠的远近程度,较近表示这些分组在该维度上区别不大,比如第二维度;然后看不同变量的各分组间的位置,从图形中心(0,0)出发,相同方位上大致相同的区域内的不同变量的分组彼此有联系。说明:可看出45~64岁这个阶段的选民都倾向于克林顿,其他的没有明显的倾向性。第五十四页,共五十八页,2022年,8月28日第三节最优尺度分析

——【OptimalScaling】过程初步认识【Analyze】/【DimensionReduction】/【OptimalScaling】多元对应分析分类变量主成分分析非线性典型相关分析分析变量中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论