版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章因子分析7.1 试述因子分析与主成分分析的联系与区别.答:因子分析与主成分分析的联系是:两种分析方法都是一种降维、简化数据的技术.两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解.因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析.因子分析也可以说成是主成分分析的逆问题.如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎.因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向, 归纳重要信息.而因子分析是从显在变量去提炼潜在因子的过程.此
2、外,主成分分析不需要构造分析模型而因子分析要构造因 子模型.7.2 因子分析主要可应用于哪些方面?答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法.目前因子分析在心理学、社会学、经济学等学科中都有重要的应用.具体来说,因子 分析可以用于分类.如用测试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等因子分析可以用于探索潜在因素.即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等.对我们进一步研究与探讨指示方向.在社会调查分析中十分常用.因子分析的另一个作用是用于时空分解.如研究几个不同地点的不同日期的气象状况,就用因子分析
3、将时间因素引起的变化和空间因素引起的变化别离开来从而判 断各自的影响和变化规律.7.3 简述因子模型二斗:中载荷矩阵A的统计意义.答:对于因子模型Xiai1F1 ai2F2 L aj Fj LaimFmi i 1,2,L , pa11a12La1ma21a22La2mLLL(A1,A2,L ,Am)Lap13p2La pm因子载荷阵为AXi与Fj的协方差为:mCov(Xi,Fj) Cov( aikFki,Fj)k 1m= Cov(aikFk, Fj) Cov( i, Fj)k 1= aij假设对Xi作标准化处理,=aij ,因此aij 一方面表示Xi对Fj的依赖程度;另一方面也反映了变量Xi对
4、公共因子Fj的相对重要性.m变量共同度h;aj2i 1,2,L , pj i2 2 2 2 2D(XJ aiD(Fi) ai2D(F2)LaD(Fm) D(J h i 说明变量 Xi 的方差由两局部组成:第一局部为共同度hi2 ,它描述了全部公共因子对变量 Xi的总方差所作的奉献, 反映了公共因子对变量 Xi的影响程度.第二局部为特殊因子i对变量Xi的方差的奉献,通常称为个性方差.p而公共因子Fj对X的奉献g2ai2j 1,2,L ,mi 1表示同一公共因子 Fj对各变量所提供的方差奉献之总和,它是衡量每一个公共因子相对重要性的一个尺度.7.4 在进行因子分析时,为什么要进行因子旋转?最大方差
5、因子旋转的根本思路是什么?答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释.但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义.这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释.这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比拟小.最大方差旋转法是一种正交旋转的方法,其根本思路为:A其中令 A* A r (a* )p m*- i pdij aj/hi djdij2p i 1A的第j列元素平方的相对方差可定义为pV 丄(dj2 dj)2p i 1 V V1 V2 L
6、Vm最大方差旋转法就是选择正交矩阵r,使得矩阵A*所有m个列元素平方的相对方差之和达到最大.7.5 试分析因子分析模型与线性回归模型的区别与联系.通过具体指标测评抽象因子的统答:因子分析模型是一种通过显在变量测评潜在变量,计分析方法的模型.而线性回归模型回归分析的目的是设法找出变量间的依存数量关系,用函数关系式表达出来.因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和.即XiaiiFiai2F2LamFm, i1,2,L, p该模型可用矩阵表示为:X AF £而回归分析模型中多元线性回归方程模型为:其中:是常数项,是偏回归系数,I是残差.因子模型满足:(1)mP
7、;(2)1Cov(F, 900,即公共因子与特殊因子是不相关的;(3)DfD(F)1I,即各个公共因子不相关且方差为1 ;mO012102(4)DD( 92,即各个特殊因子不相关,方差不要求相等.O02P而回归分析模型满足1正态性:随机误差即残差e服从均值为0,方差为2的正态分布;2等方差:对于所有的自变量 x,残差e的条件方差为 彳,且 为常数;3独 立性:在给定自变量 x的条件下,残差e的条件期望值为0 本假设又称零均值假设;4 无自相关性:各随机误差项 e互不相关.两种模型的联系在于都是线性的.因子分析的过程就是一种线性变换.7.6 设某客观现象可用 X='来描述,在因子分析时,
8、从约相关阵出发计算出特征值为.- m :1 : - Ji由于,所以找前两个特征值所对应的公共因子即可,又知对应的正那么化特征向量分别为0.707,-0.316,0.632及0, 0.899 , 0.4470 ',要求:1计算因子载荷矩阵 A,并建立因子模型.时认/ H2I3(2) 计算共同度.(3) 计算第一公因子对 X的“奉献.(V* 解:(1)根据题意,A=(0 936 D 104180.899 0,8370.4470/I建立因子模型为(2)(3)由于是从约相关阵计算的特征值,所以公共因子对X的“奉献为7.7利用因子分析方法分析以下30个学生成绩的因子构成,并分析各个学生较适合学文
9、科还是理科.序号数学物理化学语文历史英语1656172848179277777664705536763496567574806975747463574708084817467884756271647667167526557877715772867198310079416750108694975163551174808864736612678453586656138162695666521471649452615215789681808976166956677594801777908068666018846775607063196267837185772074657572907321917497
10、6271662272877279837623827083687785246370609185822574799559745926666177627364279082984771602877908568737629918284546260307884100516060解:令数学成绩为Xi,物理为X2,化学为X3,语文为X4,历史为X5,英语为X1,用SPSS 分析学生成绩的因子构成的步骤如下:1.在SPSS窗 口中选择 Analyze宀Data Reduction宀Factor,调出因子分析主界面,并将 六个变量移入Variables框中.图7.1因子分析主界面2.点击Descriptives按
11、钮,展开相应对话框,见图7.2.选择Initial solution复选项.这个选项给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比.单击Continue按钮,返回主界面.StatisticsUni /ardp terptk e?y | Initial solutionCorrelation MatriuZl G&fficierts- Inere| sigufican:e levels i_ Reproduced | miant' rti imagecancelKMD aid Badetrs hsst of sphericitycontinue图7.2 Descr
12、iptives子对话框3点击Extraction按钮,设置因子提取的选项,见图 7.3.在Method下拉列表中选择因子提取的方法,SPSS提供了七种提取方法可供选择,一般选择默认选项,即“主成分法.在Analyze栏中指定用于提取因子的分析矩阵,分别为相关矩阵和协方差矩阵.在Display栏中指定与因子提取有关的输出项,如未旋转的因子载荷阵和因子的碎石图.在Extract栏中指定因子提取的数目,有两种设置方法:一种是在Eigenvalues over后的框中设置提取的因子对应的特征值的范围,系统默认值为1,即要求提取那些特征值大于1的因子;第二种设置方法是直接在 Number of fact
13、ors后的矩形框中输入要求提取的公因子的数目.这里我们均选择系统默认选项,单击Continue按钮,返回主界面.图7.3Extraction子对话框4.点击Rotation按钮,设置因子旋转的方法.这里选择Varimax方差最大旋转,并选择Display栏中的Rotated solution复选框,在输出窗口中显示旋转后的因子载荷阵.单击 Continue按钮,返回主界面.图7.4 Rotation子对话框5点击Scores按钮,设置因子得分的选项.选中 Save as variables复选框,将因子得分作为新变量保存在数据文件中.选中Display factor score coeffic
14、ie nt matrix 复选框,这样在结果输出窗口中会给出因子得分系数矩阵.单击Continue按钮返回主界面.Factor Analysis: Factor Scores|Save as variablesMethod0 egrssioniO BartlettQ Anderson-Rubin网 Display factor sore coefficient matrixConBnyeCancelHelpb 图7.5 Scores子对话框6.单击OK按钮,运行因子分析过程. 结果分析:表7.1旋转前因子载荷阵表7.2旋转后因子载荷阵成份矩阵a成份12x1-.662.503x2-.530.47
15、8x3-.555.605x4.900.233x5.857.357|x6|.816 I.498 I旋转成份矩阵a提取方法:主成分分析法.成份12x1-.245.795x2-.152.698x3-.099.815x4.867-.335x5.904-.209x6.953-.072从表7.1中可以看出,每个因子在不同原始变量上的载荷没有明显的差异,为了便于对因 子进行命名,需要对因子载荷阵进行旋转,得表7.2.经过旋转后的载荷系数已经明显地两极分化了.第一个公共因子在后三个指标上有较大载荷,说明这三个指标有较强的相关性, 可以归为一类,属于文科学习水平的指标;第二个公共因子在前三个指标上有较大载荷,同
16、样可以归为一类,这三个指标同属于理科学习水平的指标.根据表7.3易得:F1 0.064X1 0.085X2 0.137X3 0.332X4 0.378X5 0.432X6F2 0.439X1 0.400X2 0.484X3 0.014X4 0.073X5 0.169X6表7.3因子得分系数矩阵17.0E4,085财.137.481,332-OU.370073Z6,432169将每个学生的六门成绩分别代入F1、F2,比拟两者的大小,F1大的适合学文,F2大的适合学理.计算结果为学号是1、16、24的学生适合学文,其余均适合学理.7.8某汽车组织欲根据一系列指标来预测汽车的销售情况,为了防止有些指
17、标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统.下表是抽查欧洲某汽车市场 7个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统.品牌价格发动机功率轴距宽长轴距燃料 容量燃料效率A215001.8140101.267.3172.42.63913.228A284003.2225108.170.3192.93.51717.225A420003.5210114.671.4196.63.85018.022B239901.8150102.668.2178.02.99816.427B339502.8200108.776.1192.03.56118.522B620004.23
18、10113.074.0198.23.90223.721C269902.51/0107.3C334002.8193107.3C389002.8193111.4D219753.1175109.0D253003.8240109.0D319653.8205113.8D278853.8205112.2E398954.6275115.3E396654.6275108.0E310103.0200107.4E462255.7255117.5F132602.2115104.1F165353.1170107.0F188903.1175107.5F193903.4180110.5F243403.8200101.1F
19、457055.7345104.5F139601.812097.1F92351.05593.1F188903.4180110.5G198402.5163103.7G244952.5168106.0G222452.7200113.0G164802.0132108.0G283403.5253113.0G291853.5253113.068.4176.03.1/916.62668.5176.03.19716.62470.9188.03.47218.52572.7194.63.36817.52572.7196.23.54317.52374.7206.83.77818.52473.5200.03.5911
20、7.52574.5207.23.97818.52275.5200.63.84319.02270.3194.83.77018.02277.0201.25.57230.01567.9180.92.67614.32769.4190.43.05115.02572.5200.93.33016.62572.7197.93.34017.02774.1193.23.50016.82573.6179.73.21019.12266.7174.32.39813.23362.6149.41.89510.34573.0200.03.38917.02769.7190.92.96715.92469.2193.03.3321
21、6.02474.4209.13.45217.02671.0186.02.91116.02774.4207.73.56417.02374.4197.83.56717.023解:令价格为X1,发动机为X2,功率为X3,轴距为X4,宽为X5,长为X6,轴距为X7,燃料容量为X8,燃料效率为X9,用SPSS找简化的指标系统的具体步骤同7.7.此时在系统默认情况下提取因子,结果是只抽取了一个成分,从方差奉献来看,前三个成分奉献了 90.9%,因此重复因子分析过程,并在第三步Extraction子对话框中的 Number offactors后的矩形框中输入 3,即为要提取的公因子的数目.因子分析结果如下:
22、表7.4旋转后的因子得分系数矩阵成伯存勺系封禅阵成悅123X1-.399.269342' 015.525-273x3-.080JOO-409.305-.344241妬.354-.338K0.599-.100*3325(7035-.251.494xa-135*.221.BS1-071.062-.239其简化了指标体系为 F1、F2、F3,从旋转后的因子得分系数矩阵得:F10.399X10.015X20.060X30.305X40.354X50.599X60.036X70.186X80.071X9F20.289X10.525X20.700X30.344X40.195X50.100X60.2
23、91X70.221X80.082X9F30.342X10.278X20.409X30.241X40.338X50.332X60.494X70.651X80.239X97.9根据人均GDP、第三产业从业人员占全部从业人员的比重、第三产业增加值占GDP的比重、人均铺装道路面积、万人拥有公共汽电车、万人拥有医生、百人拥有 机数、万人拥有高等学校在校学生人数、人均居住面积、百人拥有公共图书馆藏书、人均绿地面积等十一 项指标对目前我国省会城市和方案单列市的城市化进行因子分析,并利用因子得分对其进行排序和评价.数据可从?中国统计年鉴?查获略 7.10根据习题5.10中2003年我国省会城市和方案单列市的主
24、要经济指标数据,利用因子 分析法对其进行排序和分类,并与聚类分析的结果进行比拟.解:对其进行因子分析的步骤与7.7相同,结果如下:表7.5特征根与方差解释分析表辭釋的总肓差成昭初皓特征值施轻军肓和爺扎含计育差的换舉棋亟右茎的抵累踞合i+右差的別15 05856.1 9956.1995.06856.193561993.97244.1 3844.1 382.3902&.55102.7502.39026.55192.7503.17538 612627503.8149.04191.7904.341378496.575£.2482.75999,3336.1001.1 0S99.4117
25、.027.304呱24S.020.21999.9649.0030361110.000由表7.5可知,提取的两个因子方差奉献到达了82.75%.表7.6旋转后的因子得分系数矩阵感梢得分索數矩阵12划-093.315-.100.316167-.103X4-X97.219017X6246-.022>7-05729208616919233-ooe由上面的因子得分矩阵可知:F1 0.093X1 0.100X2 0.167X3 0.258X4 0.219X5 0.248X6 0.057X7 0.086X8 0.233X9F2 0.315X10.316X2 0.103X3 0.097X4 0.017X5 0.022X60.282X7 0.169X8 0.008X9与主成分分析中计算综合得分同理,用FF1F 2进行加权,得排序:F1F2F深圳382417.42392989.93385811.19上海157848.0352892.05124157.16厦门114461.78107589.61112255.81广州125604.8649740.69101252.46杭州94835.1745211.6478906.02宁波91203.3543854.8476004.48北京102885.8417864
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 44724-2024城市公共汽电车无障碍运营服务规范
- 房地产营销策划 -美的 -义乌 -宝龙世家年度传播方案
- 夫妻离婚股份分割的流程-生活日常
- 西宁-PEP-24年小学英语第五单元测验卷
- 湖南衡阳2025届高三一轮复习好题训练:10月第1周 地理试题(解析版)
- 2025届高三英语二轮复习专项 2024年全国新课标I卷易错题二次开发练习 (含答案)
- 2024年冻土共振柱试验机项目资金筹措计划书代可行性研究报告
- 强化安全管理制度建设-坚持以人为本
- 概念验证服务标准
- Python程序设计实践- 习题及答案 ch05 实验1 数据的输入和输出
- 管理学决策计算题
- 部编版四年级语文上册专项复习课外阅读专项
- 横道图施工进度计划
- 新国标电动汽车充电CAN报文协议解析
- 七年级一元一次方程经典题型计算题100道
- 华为公司经销商合作承诺书
- 员工每日考勤表
- 2020资料江苏省建筑与装饰工程计价定额详细目录
- 厦门厨余垃圾现状
- 煤矿建设工程施工技术资料
- 面试信息登记表
评论
0/150
提交评论