版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章因子分析7.i试述因子分析与主成分分析的联系与区别。答:因子分析与主成分分析的联系是:两种分析方法都是一种降维、简化数据的技术。两种分析的求加过程是狎鸣萍材一个协叮阵出发,利叫伊、特征向量求解。因子分析可以说是主成分分打的姐妹篇JI析也可以说成是主成分分析的逆问题。分析可以说是将原指标给予分解、演绎。因子分析与主成分分析的主要区别是:变换到变异程度大的方向上为止,在变量去提炼潜在因子的过程。子模型。将主成分分析向前推进岁更导致因子分析。因子分如果说主成分分析是将原指标综合、归纳,那么因子主成分分析本质上是一种线性变换,将原始坐标突出数据变异的方向,归纳重要信息。而因子分析是从显此外,主成
2、分分析不需要构造分析模型而因子分析要构造因7.2因子分析主要可应用于哪些方面?答:因子分析是一种通过显在变量现一上潜在变量,通过具体指标测评抽象因子的统计分析方法O目前因子分析在心理学、社会学、纣济学等学科中都有重要的应用分析可以用于分类。如用考试分数将学生的学习状况:以分类;具体来说,因子用空气中各种成分的比例对空气的优劣予以分类等筝2因卡可以川于探索潜在因景即是探索未能观察的或不能观测的的潜在因素是什么,起M乍用阳何等好我们进一步研究与探讨指示方向在社会调查分析中十分常用的气象状况,因子分析的另一个作用是用于时空分解O如研究几个不同地点的不同日期就用因子分析将时闻用素引起的变化和空间因素引
3、起的变化分离开来从而判断各自的影响和变化规律。7.3答:简述因子模型对于因子模型中载荷矩阵A的统计意义。aiFia2F2aimFmii1,2,因子载荷阵为aiia21ai2a22/m2m,Am)apiapmXi与Fj的协方差为:Cov(Xi,Fj)Cov(i,Fj)m=Cov(kaikFk,Fj)iCov(i,Fj)o=aij若对Xi作标准化处理,aij,因此aij一方面表示Xi对Fj的依赖程度;另一方面也反映了变量Xi对公共因子变量共同度h2iFJ的相对重要性。i1,2,2D ( X i ) ai iD (Fi )2ai 2 D (F2 )22aimD(Fm)D(i)hi2i说明变量Xi的方
4、差由、,,、一一一、,2两部分组成:第一部分为共同度2,它描述了全部公共因子对变量Xi的总方差所作的贡献,反映了公共因子对变量Xi的影则罩度。第二电分为N因子常称为个性方差。P而公共因子Fj对X的贡献g2ja”2j1,2,mi1对变量Xi的方差的贡献,通表示同一公共因子Fj对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。7.4在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主
5、要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。最大方差旋转法是一种正交旋转的方法,其基本思路为:A其中令A*Ar(aij*)pm,dija;/hdj1pdij2Pi1A*的第j列元素平方的相对方差可定义为Vj1p(dij2dj)2Pi1VV1V2Vm最大方差旋转法就是选择正交矩阵二使得矩阵A_所有m个列元素平方的相对方差之和达到最大。7.5试分析因子分析模型与线性回归模型的区别与联系。二其中 是常数项,.因子模型满足:(1) m p ;( 2)二 二I 11(3)D F D
6、(F)1;(4)D. 士 D(咛而回归分析模型满足(02 2V 2,即各个特殊因子不相关,方差不要求相等。2P a j1)正态性:随机误差(即残差)e服从均值为 0 ,方差为2的正III答:因子分析模型是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法的模型。而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系,用函数关系式表达出来。因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即XiailFiai2F2aimFmi,(i,2,1,p)该模型可用矩阵表示为:XAF£而回归分析模型中多元线性回归方程模型为:BynmQL、是偏回归系数
7、,是残差Cov(F,£)0,即公共因子与特殊因子是不相关的;0IIm,即各个公共因子不相关且方差为2态分布;(2)等方差:对于所有的自变量x,残差e的条件方差为,且为常数;(3)独立性:在给定自变量x的条件下,残差e的条件期望值为0(本假设又称零均值假设)丫(4)无自相关性:各随机误差项e互不相关。0两种模型的联系在于都是线性的。因子分析的过程就是一种线性变换。7.6设某客观现象可用X=()'来描述,在因子分析时,从约相关阵出发计算出特征值为征值所对应的公共因子即可,口对成的正则化特征向量分别为由于,所以找前两个特(0.707,-0.316,0.632),0.899,0.44
8、70)'(1)计算因子载荷矩阵A,型。17541=111,=0255.(2)计算共同度(3)计算第一公因子对(2)(3 )因为是从约相关阵计算的特征值所以公共因子对X的“贡献”为7.7利用因子分析方法分析下列30个学生成绩的因子构成,弁分析各个学生较适合学文科还是理科。序号数学物理化学语文历史英语1656172848179-2777776647055367634965675748069757474635747080848174678847562716476671675265578777157728671983100794167501086949751635511748088647366
9、126784535866561381626956665214716494526152157896818089761669566775948017779080686660188467756070631962678371857720746575729073219174976271662272877279837623827083687785246370609185822574799559745926666177627364279082984771602877908568737629918284546260307884100516060解:令数学成绩为X1,物理为X2,化学为X3,语文为X4,历史为X
10、5,英语为X1,用spss分析学生成绩的医子构成的步骤如下:1.在iSPSS窗口中选择AnalyzeDataReduction一>Factor,调出因子分析主界面,弁将八个变量趋,入Variables框中。图7.1因子分析主界面12 .点击Descriptives按钮,展开相应对话限,用图7.2。选择Initialsolution复选项。这个选项给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比。单击Continue按钮,返回主界面。4图卜7.22escriptives丁子阴谅框3 .点击Extraction按钮,设置因子提取的选项,见图7.3。在Method下拉列表中选择因
11、子提取的方法,SPSS提供了七种飕瞰方后可袒犍择,阿般选择默认选项,即“主成分法”。在Analyze栏中指定用于提取因子的分析矢I可分别为相关矩阵和协方差矩阵。在Display栏中指定与因子提取有关的输出项,如未旋转的因子载荷阵和因子的碎石图。在Extract栏中指定因子提取的数目,有两种设置方法:一种是在曰genvaluesover后的框中设置提取的因子对应的特征值的范围,系统默认值为1,即要求提取那些特征值大于1的因子;第二种设置方法是直接在Numberoffactors后的矩形框中输入要求提取的公因子的数目。这里我们均选择系统默认选项,单击Continue按钮,返回主界面。图7.3Ext
12、raction子对话框4 .点击Rotation按钮,设置因子旋转的方法。这里选择Varimax(方差最大旋转),并选择Display栏中的Rotatedsolution复选框,在输出窗口中显示旋转后的因子载荷阵。单击Continue按钮,返回主界面。图7.4Rotation子对话框5 .点击Scores按钮,设置因子得分的选项。选中Saveasvariables复选框,将因子得分作为新变量保存在数据文件中。选中Displayfactorscorecoefficientmatrix复选框,这样在结果输出窗口中会给出因子得四系数矩阵。单击Continue按钮返回主界面。切FactorFlacto
13、ricor«6 .单击OK按钮,运行因子分析过程。结果分析:表7.1旋转前因子载荷阵表7.2旋转后因子载荷阵x1x2成份矩阵a成份-.662-.530.503.478-.555.605x4x5.900.857.233.357x6.816.498提取方法:主成分分析法加袅成份如卜二成份12x1-.245.795x2-.152.698x3-.099.815x4.867-.335x5-90-.209x6.953-.072从表7.1中可以看由,每个因子在不同原始变量上的载荷没有明显的差别,为了便于对因子进行命名,需要对因子载荷阵进行旋转,得表7.2。经过旋转后的载荷系数已经明显地两极分化了。
14、第一个公共因子在后三个指标上有较大载荷,说明这三个指标有较强的相关性,可以归为一类,属于文科学习能力的指标;第二个公共因子在前三个指标上有较大载荷,同样可以归为一类,这三个指标同属于理科学习能力的指标。根据表7.3易得:F10.064X10.085X20.137X30.332X40.378X50.432X6F20.439X10.400X20.484X30.014X40.073X50.169X6表7.3因子得分系数矩阵耐偏分系晒成 18txl x2 x31 x5 建个学:,064DB5 137,332 u Imid*上的六门成439 400 .484 1,073绩分别伐”F1、F2,比较两者的大
15、小,F1大的适合学文,F2大的适合学理。计算结果为学号是1、16、24的学生适合学文,其余均适合学理7.8某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。下表是抽查欧洲某汽车市场7个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。品牌价格发动机功率轴距宽长轴距燃料容量燃料效率A215001.8140101.267.3172.42.63913.228A284003.2225108.170.3192.93.51717.225A420003.5210114.671.4196.63.85018.022&q
16、uot;=239901-8=150-102668-2=478-0-2998-B33950.2.8200.108.7.76.1.192.0.3.561.18.52722B62000卜4.2310113.074.0198.23.90223.721C269902.5170107.368.4176.03.17916.626C334002.8193107.368.5176.03.19716.624C389002.8193111.470.9188.03.47218.525D219753.1175109.072.7194.63.36817.525D253003.8240109.072.7196.23.543
17、17.523D319653.8205113.874.7206.83.77818.524D278853.8205112.273.5200.03.59117.525E398954.6275115.374.5207.23.97818.522E396654.6275108.075.5200.63.84319.022E310103.0200107.470.3194.83.77018.022E462255.7255117.577.0201.25.57230.015F132602.2115104.167.9180.92.67614.327F165353.1170107.069.4190.43.05115.0
18、25F188903.1175107.572.5200.93.33016.625F193903.4180110.572.7197.93.34017.027F243403.8200101.174.1193.23.50016.825F457055.7345104.573.6179.73.21019.122F139601.812097.166.7174.32.39813.233F92351.05593.162.6149.41.89510.345F188903.4180110.573.0200.03.38917.027G198402.5163103.769.7190.92.96715.924G24495
19、2.5168106.069.2193.03.33216.024G222452.7200113.074.4209.13.45217.026G164802.0132108.071.0186.02.91116.027G283403.5253113.074.4207.73.56417.023G291853.5253113.074.4197.83.56717.023解:令价格为X1 ,发动机为 X2功率为X3,轴距为X4,宽为X5,长为X6,轴距为X7,燃料容量为X8,燃料效率为X9,用SPSS找简化的指标系统的具体步骤同7.7。此时在系统默认情况下提取因子,结果是只抽取了一个成分, 成分贡献了 90.
20、9%,因此重复因子分析过程,弁在第三步从方差贡献来看,前三个Extraction 子对话框中的 Number offactors后的矩形框中输入3,即为要提取的公因子的数目。因子分析结果如下:其简化了指标体系为F1表7.4旋转后的因子得分系数矩阵J即24105 ijis I . 3尤F 3 ;从制转后的因子科分系数相降得:0.399 X 10.015 X 20.060 X 3J* jflfc jfcQ (J0.305 X 40.354 X 50.599 X 6 0.036X 70.186 X 80.071X 90.289X 10.525 X 20.700 X 30.344 X 40.195 X
21、 50.100 X 6q,0.291X 70.221X 80.082 X 90.342X 10.278 X 20.409 X 30.241X 40.338 X 50.332 X 6sl0.494 X 70.651 X 87.9重、根据人均GDP、第三产他从业,I员占身加从业人员用煌重、三产业增加值占0.239 X 9GDP的 比人均铺装道路面积、万人墉有公共丧电车、万人拥有医生、白人拥有电话机:数、万人拥有高等学校在校学生人数、人均居住面积、 百人拥有公共图书馆藏书、项指标对目前我国省会城市和计划单列市的城市化进行因子分析,人均绿地面积等十一 弁利用因子得分对其进行像岫总方祭略)2003瞬!国
22、省务械用即计划单列市的拒要经济指标据,利用区子分根据射题5.104中对其进口排呵?中,并存霜方,析明靠比较。行因子分析的步骤与17牛相同,结果如下:2759湛7.5M征粮与方差解释分析表成帆的系就睇由上面的因子得分矩阵可知:F10.093X10.100X20.167X30.258X40.219X50.248X60.057X70.086X80.233X9F2m0.315X10.316X20.103X30.097X40.017X50.022X60.282X70.169X80.008X9与主战分分析中并算综合得分同理,用下*1F12F2进行加枝,得排序:.F1三尸一F2F深圳382417.42392989.93385811.19上海157848.0352892.05124157.16厦门114461.78107589.61112255.81,广州125604.8649740.69101252.46杭州94835.1745211.6478906.02宁波91203.3543854.8476004.48北京102885.8417864.7375594.07102885.8417864.7375594.07天津89055.6632589.7070930.09海口89055.6632589.7070930.09南京82495.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论