




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
31.因子分析一、基本原理因子分析,是用少数起根本作用、相互独立、易于解释通常又是不可观察的因子来概括和描述数据,表达一组相互关联的变量。通常情况下,这些相关因素并不能直观观测。因子分析是从研究相关系数矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。简言之,即用少数不可观测的隐变量来解释原始变量之间的相关性或协方差关系。反映原有变量大部分的信息;原始部分变量之间多存在较显着的相关关系,重组变量(因子变量)之间相互独立;因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。析的目标是找出公共因素及特有因素,即公共因子与特殊因子。回归模型中的自变量是可观测到的,而因子模型中的各公因子是不可观测的隐变量,而且两个模型的参数意义也不相同。公共因子给出一种意义明确的名称,用来反映在预测每个可观察变量中这个公因子的重要性。该公因子的重要程度就是在因子模型矩阵中相应于这个因子的系数。载荷阵的结构简化向0和1两极分化,这样的因子便于解释和命名。每个样本都可以计算其在各个公因子上的得分因子得分以及该公因子的方差贡献比例,又可以计算每个样本的综合得分。二、因子分析实例例1(综合评价问题)对我国30个省市经济发展的8个指标进行分析和排序。数据文件如下:x1=GD;x2居民消费水平;x3固定资产投资;x4职工平均工资;x5=货物周转量;x6=居民消费价格;x7商品价格指数;x8=工业总产值。1.【分—【因子分析打窗口,将变量“x1-x”选入【变量】框;2.变量描述性析结果“KMO和Bartlett的球形度检验3.选“相关性矩阵【输出】勾选“未旋转因子解取】选“基于特征值:特征值大于‘1;点【继续(的线性组合,从解释变量的变异除非,尽量是变量的方差能被主成分所解释,适合大多数情况;(2)未加权的最小平方法:使相关矩阵和再生相关矩阵之差的平方和达到最小;(3)综合最小平方法:同(2),并用单值的倒数对相关系数加权;(4)最大似然法:要求数据服从多变量正态分布,此时生成的参数估计最接近观察到相关矩阵,适宜样本量较大情况;(5)主轴因子分解法:从原始变量的相关性出发,使变量间的相关程度尽可能地被公因子解释,但对变量方差的解释不太重视;(6将变量看出从潜在的变量空间中抽取出的样本,计算时尽量使得变量的α信度达到最大,适合不好的数据;(7)映像因子分解法:把一个变量看作是其它变量的多元回归,提取公因子。注2:计算特征值和特征向量时,可选择相关矩阵(不受量纲影响)或协方差矩阵(受量纲影响较大,需先进行变量标准化)计算主成分。但SPS对因子解释和方差贡献率的解释上是一致的。4.出】勾选“旋转解续;注1(相对载荷平方和)达到最大,方便对公因子解释;(2)最大四次方值法:各因子方差差异化更强,并减少和每个变量有关联的因子数,简化对原变量的解释;(3)最大平衡值法:介于方差最大正交旋转与次方最大正交旋转之间;(4)直接Oblimin法:斜交旋转方法,需先指定一个因子映像的自相关范围;(5)Promax:最常用的斜交旋转法,在方差最大正交旋转的基础上再进行斜交旋转,旋转后允许因子间存在相关,适合有具体的结果倾向时选用。5.用主成分法提取公因子,用回归法对因子进行估计。点【得分,打开“因子得分”子窗口,勾选“保存为变量”方法选“回归“显示因子得分系数矩阵;点【继续;另外若【选项子窗口勾按大小排序,将按载荷从大到小排列变量。点【确定】得到(部分与主成份分析结果相同,略)KMO和Bartlett的检验取样足够度的.620Kaiser-Meyer-Olkin度量。近似卡方Bartlett的球df 28形度检验Sig. .000KMO检验变量间的偏相关是否较大,该值越大越适合做因子分析,以上因子分析效果较好,以下不适合做因子分析。KMO值=<说明变量间的重叠可能不是特别高。Bartlet球形度检验判断相关系数矩阵是否是单位阵,原假设H:各0变量相互独立。P值<<,故拒绝原假设,即变量间有较强的相关性。公因子方差初始提取GDP .945居民消费水平 .799固定资产投资 .902职工平均工资 .873货物周转量 .857居民消费价格.957指数商品价格指数 .928工业总产值 .904提取方法:主成份分析。公因子方差,表示各变量中所含原始信息能被提取的公因子所表示的程度。基本都在以上,表示提取的公因子对各变量有较强的解释能力。解释的总方差 初始特征值 提取平方和载入 旋转平方和载入合计 合方差 积%积计的%%1234.4035.2146.1387.066 .8298.015 .183提取方法:主成份分析。【初始特征值】表示初步提取共同因素的结果:“合计”列为每一个主成分的特征值,其值越大表示该主成分在解8个变量的变异时越重要;“方差的%”列为每个提取因素可以解释的变异百分比;“累积%释的变异的累积百分比为8值=,8%即第一个“方差的%”值,累积百分比最终是100%.【提取平方和载入】给出了旋转前的特征值、解释变异量、累积解释变异量;主成分法默认只提取≥征值,共3个即3个公因子(3个是否合适借助碎石图判断),它们共可解释%的变异。【旋转平方和载入】给出了旋转后的特征值、解释变异量、累积解释变异量;旋转后,共同因素的特征值会改变,但总的特征值之和不变(解释的变异的累积百分比相同);共同性也不会改变,但每个变量在其共同因素中的负荷系数会改变。碎石图,可以帮助决定公因子的数目。碎石图将每个公因子的特征值(重要程度)从高到低排序绘制成一条坡度线,横轴为公因子数目。其判断标准是:取坡度线急剧下降的部分,去掉坡度线平坦的部分,从图中看选4个共同因素是合适的。另外也要参考选取的合理性选择的公因子包含的变量数不能太少。正常情况下需要将【抽取】的公因子数设为4重新做因子分析:在原窗口点【抽取,打开“抽取”子窗口,选择【抽取】下的“因子的固定数量,在【要提取的因子】框输入“4;点【继续但由于本例中变量数较少,故保持原来的3个公因子。成份矩阵a成份1 2 3GDP .884.385.120居民消费水平.606 .277固定资产投资.911职工平均工资.465货物周转量 .486
.163.213.362.737居民消费价格.257.794指数商品价格指数 .596.433工业总产值 .822.429.210:主成份。a.已提取了3个成份。旋转前(实际上是主成分分析的结果)荷矩阵,载荷值越大表示该变量与其共同因素的关联越大。由该矩阵可以计算每个变量的共同性、每个公因子的特征值、再生相关矩阵。公因子结构表达(因子模型前3项为共同因素ε为特殊因子iZ=*F1+*F2+*F3+εx1 1……Z=*F1+*F2+*F3+εx8 8其中,Z为x的标准化变量,Fi的表达式同【第30篇:主成份分析】中的xi i表示。资”的共同性为:++=公因子的特征值是该公因子上所有载荷的平方和,如公因子1的特征值为(注意这些特征值是从大到小排列):+++…+2=再生相关性GDP居民固定职工货物居民消商品工业消费资产平均周转费价格价格总产水平投资工资量指数指数值GDP.94a .341.894.176.680 .917.341.799a .515.814 .301.894.515.902a .383.503 .864.176.814.383.873a .148.680 .503 .857a .017.657.957a .814 .017.814.928a.917.301.864.148.657 .904aGDP .056.011 .004 .071.008.019.062.056 .013 .017.011 .013 .053 .020差 .071 .053 .027.005.002.008 .027 .017.004.019.017.020.005 .062 .002.017提取方法:主成份分析。a.重新生成的公因子方差b.将计算观察到的相关性和重新生成的相关性之间的残差有11%)个绝对值大于的非冗余残差。旋转成份矩阵a成份1 2 3GDP .955.124居民消费水平.219.841固定资产投资.872.351职工平均工资.048.925货物周转量 .751居民消费价格.969指数商品价格指数 .819工业总产值 .944.109提取方法:主成份。旋转法:具有Kaiser标准化的正交旋转法。a.旋转在5次迭代后收敛。了让载荷大的越大、小的越小(载荷平方和不变),从而更容易区分各变量的归属。由于是正交转轴,故表中系数可视为变量与共同因素的相关系数矩阵(因素结构或加权矩阵),等于旋转前的公因子载荷矩阵乘以成份转换矩阵。标准定为选择载荷大于的变量,可看出公因子1包含变量:GDP、工业总产值、固定资产投资、货物周转量;从而可命名为总量因子;公因2包含变量:职工平均工资、居民消费水平;从而,可命名为消费因子;公因3包含变量:居民消费价格指数、商品价格指数;从而,可命名为价格因子。成份转换矩阵成份 1 2 31 .817.4072 .548 .3313 .179.494.851:主成份。旋转法:具有Kaiser标准化的正交旋转法。成份得分系数矩阵成份1 2 3GDP .306居民消费水平.025固定资产投资.270职工平均工资货物周转量 .248
.011.047.387.040.129.075.451.096居民消费价格.070.180.653指数商品价格指数.077 .462工业总产值 .317.026.123提取方法:主成份。旋转法:具有Kaiser标准化的正交旋转法。成分得分矩阵给出了各主成分在每个变量上的载荷从而得到计算公式F1=ZZ+Z+Zx1 x2 x4 x5+Z+Z+x6 x7 x8F2=ZZ+Z+Zx1 x2 x3 x5+ZZx7 x8F3=Z++Z+Zx1 x3 x5+Z++Zx6 x8注:该计算公式本质上与利用“旋转成分矩阵”得到的主成分计算公式是等价的,区别是前者的标准差是1.成份得分协方差矩阵成份 1 2 31 .000.0002 .000 .0003
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度外墙保温劳务施工绿色环保合同
- 2025版电商企业大数据分析与用户洞察培训服务协议
- 2025版工矿企业安全生产责任书示范文本
- 2025年度建筑工程消防设施安装与维护合同范本
- 2025版私人定制车辆转让及维护保养服务合同
- 二零二五年度房地产股权及资产转让专项协议书
- 2025年度城市绿地防腐养护工程承包合同
- 2025版二手房买卖贷款法律咨询及维权服务合同
- 二零二五年智能家居改造房屋半包装修工程合同
- 二零二五年度工程造价咨询与工程保修服务合同
- 加工中心个人简历
- 水利工程建设项目招标投标管理规定课件
- ta600空地勤培训动力系统
- 2022年物流服务师职业技能竞赛理论题库(含答案)
- 招标代理方案90188
- 英式下午茶课件
- 2023年版-肿瘤内科临床路径
- 通信管道工程定额解读
- 产钳助产术考核标准
- T∕CCTA 30101-2021 喷气涡流纺棉本色纱
- 建筑施工项目叠合板吊装施工安装方案
评论
0/150
提交评论