版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第8讲 因子分析与对应分析,第12章 因子分析与对应分析,第8讲 因子分析与对应分析,主成分分析是将多个指标化为少数相互无关的综合指标的统计方法,通常数学上的处理就是将原来的p个指标做线性组合,作为新的综合指标,记第一个综合指标为F1。 选取这个线性组合的原则是令F1的方差最大,称F1为第一主成分;然后选取第二主成分F2,且F1与F2的协方差为0,类似构造其余的主成分。,主成分分析【Factor】过程 对观测量数目没有严格要求,第8讲 因子分析与对应分析,第一节 因子分析【Factor】过程主成分分析的推广和发展,对观测量数目要求至少是变量的5倍以上,且越多越好,一、因子分析简介 做什么? 因
2、子分析是多元统计分析中处理降维的一种统计方法,它主要将具有错综复杂关系的变量或者样品综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系。 基本思想: (1)首先,通过变量(或样品)的相关系数矩阵(或相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量(常称为因子)去描述多个变量(或样品)之间的相关(相似)关系; (2)然后,根据相关性(或相似性)的大小把变量(或样品)分组,使得同组内的变量(或样品)之间的相关性(或相似性)较高,但不同组的变量相关性(或相似性)较低。,第8讲 因子分析与对应分析,依据处理的对象不同,可以分为两类: R型因子分析,对变量做降维处理
3、 Q型因子分析,对样本做降维处理,R型因子分析,第8讲 因子分析与对应分析,第8讲 因子分析与对应分析,因子分析的几个概念: 1、因子载荷,第8讲 因子分析与对应分析,2、变量共同度,第8讲 因子分析与对应分析,3、公因子Fj的方差贡献,第8讲 因子分析与对应分析,4、因子旋转 因子旋转的目的是为了使得因子载荷阵的结构简化,便于对公共因子进行解释。 这里所谓的结构简化是使每个变量仅在一个公共因子上有较大的载荷,而在其余公共因子上载荷比较小。 这种变换因子载荷阵的方法称为因子轴的旋转。旋转的方法有很多种,如正交旋转,斜交旋轴等。,第8讲 因子分析与对应分析,5、因子得分,第8讲 因子分析与对应分
4、析,因子分析的一般步骤,第8讲 因子分析与对应分析,二、引例(练习一),例1 利用因子分析过程分析各个城市的市政设施建设情况。 数据文件:“各地区城市市政设施.sav”,下表是部分数据。,第8讲 因子分析与对应分析,【Analyze】/【Data Reduction】/【Factor】,要求:选入分析变量,(因子分析的变量),(定义记录旋转条件),第8讲 因子分析与对应分析,要求:输出相关系数矩阵;进行因子分析适用条件的检验,Descriptives:选择需要输出的统计量,(统计量),单变量描述统计量:各分析变量的均值、标准差及观测数,原始分析结果:原变量的公因子方差、与变量相同个数的因子、各
5、因子的特征根及其所占总方差的百分比和累计百分比,(相关矩阵),所有变量间的相关系数矩阵,显著性水平,相关系数矩阵的行列式值,KMO 检验和Bartlett球形检验,相关系数矩阵的逆矩阵,再生相关系数矩阵,反映像协方差阵和相关阵,第8讲 因子分析与对应分析,要求:输出碎石图,Extraction:选择因子提取的方法,(选择公共因子的提取方法),公共因子的提取方法: (1)主成分分析法(默认); (2)不加权最小二乘法; (3)广义最小二乘法; (4)极大似然法; (5)主轴因子法; (6) 因子法; (7)影像因子法,相关矩阵,协方差矩阵,(设定公共因子提取标准),显示未经旋转变换的因子提取结果
6、,显示碎石图,体现各因子重要程度,自定义提取因子的数量,以特征根大于指定数值为提取标准,(收敛时的最大迭代次数),第8讲 因子分析与对应分析,Rotation:选择因子旋转的方法,方差最大化正交旋转,斜交旋转法,四分旋转法,平均正交旋转法,斜交旋转法,(设置旋转解的输出),(因子旋转的方法),输出主成分转换矩阵,输出二维或三维的因子载荷图,第8讲 因子分析与对应分析,要求:输出因子得分系数矩阵,Factor Scores:因子得分,(在数据文件中建立一个新变量,用于保存各观测量的因子得分),(因子得分计算方法),回归法,巴特列特法,安德森-鲁宾法,(输出因子得分系数矩阵及因子协方差矩阵),第8
7、讲 因子分析与对应分析,要求:用均值代替缺失值,Options对话框,(选择缺失值处理方法),(选择系数的输出方式),因子载荷矩阵和结构矩阵按数值大小排序,不显示绝对值小于指定数的载荷系数,第8讲 因子分析与对应分析,变量间相关性很高,结果解读:,1、相关系数矩阵表,第8讲 因子分析与对应分析,接近0.9,适合做因子分析,拒绝原假设,认为各变量之间不独立,2、 KMO检验和Bartlett球形检验结果表,注: KMO检验用于检验变量间的偏相关系数是否过小,一般, KMO大于0.9时效果最佳,小于0.5时不适宜做因子分析。 Bartlett球形检验用于检验相关系数矩阵是否是单位阵,如果结论是不拒
8、绝该假设,则表示各个变量都是各自独立的。,第8讲 因子分析与对应分析,该变量95.4的信息已经被提取,3、变量共同度表 给出了提取公共因子前后各变量的共同度(衡量公共因子的相对重要性指标),说明:比如变量X1的共同度位0.954,即提取的公共因子对变量X1的方差做出了95.4%的贡献。,第8讲 因子分析与对应分析,4、主成分表 列出了所有的主成分,且按照特征根从大到小次序排列。,说明:第一主成分特征根为5.280,方差贡献率为88.001%,前两个主成分的累计贡献率为94.504%,根据提取因子的条件特征值大于1,本例只选出一个因子。,第8讲 因子分析与对应分析,提取一个主成分即可,5、碎石图
9、 按照特征根大小排列的主成分散点图。纵坐标为特征值,横坐标为因子数。,第8讲 因子分析与对应分析,6、因子负荷矩阵 用来反映各个变量的变异主要由哪些因子解释。,第8讲 因子分析与对应分析,7、因子得分系数矩阵 得出用各个变量的线性组合表达的主成分。,第8讲 因子分析与对应分析,8、因子得分的协方差矩阵 反映各因子间的联系程度。,注:本例只提取了一个公共因子,故表格内容无实际意义。,第8讲 因子分析与对应分析,例2 利用因子分析过程分析一年内各个城市的日照情况。 数据文件:“主要城市日照数.sav” 。,【Analyze】/【Data Reduction】/【Factor】,要求:选入分析变量,
10、第8讲 因子分析与对应分析,要求:输出因子分析适用条件的检验,第8讲 因子分析与对应分析,要求:输出碎石图,第8讲 因子分析与对应分析,要求:输出因子得分系数阵,第8讲 因子分析与对应分析,要求:采用方差最大化正交旋转;输出因子载荷图,第8讲 因子分析与对应分析,结果解读:,1、 KMO检验和Bartlett球形检验结果表,说明: KMO检验结果为0.798,大于0.5,比较适合作因子分析; Bartlett球形检验的Sig.值为0,各变量不独立。,第8讲 因子分析与对应分析,2、变量共同度表,说明:变量“Jan”的共同度为0.915,即选取的公共因子提取了变量“Jan”91.5%的信息。,第
11、8讲 因子分析与对应分析,3、主成分表,说明:第一主成分特征根为6.854,方差贡献率为57.041%,前3个主成分的累积贡献率为84.421%,根据提取因子的条件特征值大于1,本例选出3个因子。,第8讲 因子分析与对应分析,4、碎石图,说明:前3个主成分的特征根都在1以上。,第8讲 因子分析与对应分析,5、因子载荷矩阵 给出各变量的因子表达式。,第8讲 因子分析与对应分析,6、旋转后因子载荷矩阵 经过正交旋转后的因子载荷矩阵,给出旋转后的各变量的因子表达式。,说明:第一主因子主要由前5个变量决定,第二主因子主要由中间4个变量决定,第三主因子主要由最后3个变量决定。,第8讲 因子分析与对应分析
12、,7、因子转换矩阵 旋转前的因子载荷矩阵乘以因子转换矩阵等于旋转后的因子载荷矩阵。,第8讲 因子分析与对应分析,8、因子旋转后的因子载荷图 图中的坐标轴就是各个主因子。,第8讲 因子分析与对应分析,9、因子得分系数矩阵 得到因子得分表达式。,第8讲 因子分析与对应分析,10、因子得分的协方差矩阵,说明:因子得分的协方差矩阵为单位阵,得出提取的3个公共因子之间是不相关的。,第8讲 因子分析与对应分析,第二节 简单对应分析【Correspondebce Analysis】过程又称列联表对应分析,一、对应分析简介 对应分析是通过进行主成分分析来描述两个或多个分类变量各水平间相关性的分析方法,它的分析
13、结果主要采用反映变量间相互关系的对应分析图来表示。,对应分析在SPSS中分为两类: 简单对应分析【Correspondebce Analysis】过程:主要研究两个分类变量之间的关系。 多元对应分析 【Optimal Scaling】过程,第8讲 因子分析与对应分析,对应分析表(列联表):,第8讲 因子分析与对应分析,最后分别对行剖面点集和列剖面点集做主成分分析,以判断两个变量的联系情况。,第8讲 因子分析与对应分析,例2 利用简单对应分析过程分析不同年龄段选民的倾向。 数据文件:voter.sav,二、引例(练习二),第8讲 因子分析与对应分析,【Analyze】/【Dimension Re
14、duction】/【Correspondence Analysis】,要求:选入行变量(取值范围为13)与列变量(取值范围为14),(行变量),定义行变量取值范围,(列变量),定义列变量取值范围,第8讲 因子分析与对应分析,Model:模式子对话框,(设置分析结果维数),(选择距离测量方式),卡方距离,欧氏距离,主要用于连续变量,(变量的标准化方式),(正则化方法),对称法(默认),第8讲 因子分析与对应分析,Satistics:设置需要输出的统计量,输出对应分析表(列联表),输出行点概述表,输出列点概述表,输出行轮廓表,输出列轮廓表,指定的前n个维度输出基于行列得分的原始表格,(输出行点和列
15、点的标准差、以及各维度坐标间的相关系数),第8讲 因子分析与对应分析,Plots:设置需要输出图形,(输出对应分析图),双变量散点图,行点图,列点图,限制标签长度,输出各行变量分类对应于行得分的散点图,输出各列变量分类对应于列得分的散点图,(图形维度),输出分析结果的所有维度,限制输出维度的数目,第8讲 因子分析与对应分析,结果解读:,1、对应分析表 给出不同年龄阶段的人群分别投票给三位总统候选人的人数。,第8讲 因子分析与对应分析,2、结果汇总表 列出维数、奇异值(惯量的平方根)、惯量(又指特征根)、总的卡方检验及Sig.值,维数,奇异值,特征根,总的卡方检验,注:惯量用于说明对应分析各个维
16、度的结果能够解释列联表中两个变量联系的程度。,说明:表中两个维度分别解释了总信息量的99.6%和0.4%,说明二维图形完全可以表示两个变量间的信息,且观察时以第一维度为主。,第8讲 因子分析与对应分析,3、行点概述表 给出行变量的3个分组在两个维度中的分值,每组所占百分比,每组所对各个维度的贡献量,(点对维度惯量的贡献量),(维度对点惯量的贡献量),分组在第一、第二维度的坐标值,第8讲 因子分析与对应分析,4、列点概述表 给出列变量的4个分组在两个维度中的分值,每组所占百分比,分组在第一、第二维度的坐标值,每组所对各个维度的贡献量,(点对维度惯量的贡献量),(维度对点惯量的贡献量),第8讲 因
17、子分析与对应分析,5、对应分析图 首先看同一变量的不同分组在某一侧维度上靠的远近程度,较近表示这些分组在该维度上区别不大,比如第二维度;然后看不同变量的各分组间的位置,从图形中心(0,0)出发,相同方位上大致相同的区域内的不同变量的分组彼此有联系。,说明:可看出4564岁这个阶段的选民都倾向于克林顿,其他的没有明显的倾向性。,第8讲 因子分析与对应分析,第三节 最优尺度分析【Optimal Scaling】过程初步认识,【Analyze】/【Dimension Reduction】/【Optimal Scaling】,多元对应分析,分类变量主成分分析,非线性典型相关分析,分析变量中存在无序多分
18、类变量时,(确定是在不同变量间分析还是在几组变量间分析),(当数据中存在复选集变量时),(分析方法),第8讲 因子分析与对应分析,在SPSS中【Optimal Scaling】过程提供了三种分析方法: (1)多元对应分析(Multiple Correspondence Analysis) 所有变量均在名义测量时使用,用于分析多个无序分类变量间的关系。 (2)分类变量的主成分分析(Categorical Principal Components) 当一些变量为有序分类或者连续性变量时使用,该方法使用主成分提取方式,以尽量稍等主成分解释尽量多的原始信息。 (3)非线性典型相关分析(Nonlinear Canonical Correlation) 当分析变量中有复选集变量时,用于分析两个或多个变量集之间的关系,运行变
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年中国盐酸地尔硫章控释片行业投资前景及策略咨询研究报告
- 2024至2030年铝盒项目投资价值分析报告
- 2024至2030年疫苗注射器项目投资价值分析报告
- 2024年移动式电子平台称项目可行性研究报告
- 中国汽车前保险杠行业市场现状分析及竞争格局与投资发展研究报告(2024-2030版)
- 中国气动活塞振动器行业发展态势及投资动态预测研究报告(2024-2030版)
- 中国无功补偿行业未来趋势及前景动态预测研究报告(2024-2030版)
- 中国导电垫片行业发展动态及应用趋势预测研究报告(2024-2030版)
- 中国低钠盐市场深度调查研究报告(2024-2030版)
- 中国丁香罗勒行业市场深度调研及竞争格局与投资前景研究报告(2024-2030版)
- 胜任力模型及应用课件
- 浙教版数学七年级上44-46代数式复习课课件
- 颅脑损伤的脑保护措施
- 05 02 第五章第二节 吸收借鉴优秀道德成果
- 《出生缺陷》课件
- 动画场景镜头透视与应用课件
- 小学生卫生健康小常识-课件
- 藏式建筑简介
- 模块化机房技术方案
- 运动会报名表
- 小学语文组教研活动记录
评论
0/150
提交评论