主成分分析法及其在SPSS中的操作_第1页
主成分分析法及其在SPSS中的操作_第2页
主成分分析法及其在SPSS中的操作_第3页
主成分分析法及其在SPSS中的操作_第4页
主成分分析法及其在SPSS中的操作_第5页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、主成分分析基本原理概念:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析 方法。从数学角度来看,这是一种降维处理技术。思路:一个研究对象,往往是多要素的复杂系统。变量太多无疑会增加分析 问题的难度和复杂性,利用原变量之间的相关关系,用较少的新变量代替原来较 多的变量,并使这些少数变量尽可能多的保留原来较多的变量所反应的信息,这样问题就简单化了。原理:假定有n个样本,每个样本共有p个变量,构成一个nXp阶的数据 矩阵,记原变量指标为X11X12 X1p IX21X22X2pX =mmmXniXn2Xnp_Xi , X2,Xp,设它们降维处理后的综合指标,即新变量为 Z 1, Z2

2、, Z3,zm(mw p),则'Zi =liiX +:2X2+lipXpZ2 = l21X1l22X212 Pxpzm 一 lm1X1 l m2X2lmpXp系数l j的确定原则:Zi 与 Zj (i Wj ; i , j=1 , 2, , , m)相互无关;Zi是Xi,X2, , Xp的一切线性组合中方差最大者,Z2是与Zi不相关的Xi,X2, Xp的所有线性组合中方差最大者;Z m是与Zi, Z2, , , Zrnv 1都不相关的Xi,X2, , Xp ,的所有线性组合中方差最大者。新变量指标Zi, Z2, , , Zm分别称为原变量指标Xi, X2, , , Xp的第1 ,第2,

3、 第m主成分。从以上的分析可以看出,主成分分析的实质就是确定原来变量Xj (j=i ,2 , , , p)在诸主成分 Zi (i=i , 2, , , mm 上的荷载 l ij ( i=i , 2, , , m; j=i , 2 , , , p)0从数学上可以证明,它们分别是相关矩阵m个较大的特征值所对应的特征向里。二、主成分分析的计算步骤1、计算相关系数矩阵一rii12 ip_12122 2pR =二 二 :j =ji ,其计算公Jp1 p2 ppj (i , j =1, 2, , , p)为原变量Xi与Xj的相关系数,式为nrrij' (Xki -Xi)(Xj - Xj) k=1n

4、n- ( xki - xi ) - ( xkj - xj )k=1k=12、计算特征值与特征向量解特征方程 恒-R=。,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列7,之、之 p 0 ;p分别求出对应于特征值的特征向量e(i = 1,2,L,p),要求| ei=1 ,即工e2 = 1j 二1其中eij表示向量ei的第j个分量。3、计算主成分贡献率及累计贡献率贡献率:iP'1kk 1(i =1,2, L ,p)累计贡献率:,k k=1P 二,"k k =1(i =1,2, L, p)股取累计贡献率达 85%-95%J特征值,%,九2, L,Zm所对应的第1、第2

5、、,、第m (mep)个主成分。4、计算主成分载荷f-lij 二 p(Zi,xj) =、Mij(i, j =1,2,L, p)5、各主成分得分z11z2142z1mz2mZn2znm、主成分分析法在SPS。的操作1、指标数据选取、收集与录入(表1)闫,(JDf人出GDP宏业增一中工业揖巾值池三产业固定贵产世密屋率建徨投资零转总颠离美出 口总,地方IU政收入江宁M582uoaoI4S&3.3137.12258.4131J.9529,022Ml4)25.73997山东1。然MiiM31390 03502.53851.0J28B.71070J31S1.92U.16102河北6076.6904

6、7950.2UW.72«2 61M1J0597. L196&345.93023为津2022 622068R39822.896007Q3.7A61.9941.4115.7171.8江苏10601471122 63536.i3W7 22320.01141.33215.1川7643.7ka5406 fi40fi>78622196.2275SJI1970.277®32035.2320.5709.0衢江7tn.o16570tisao23S6.53,0226.6IIS0.62BT7,S2W.25«6.9黜建46S2013510663.0104741855.096

7、45357.91663.J1TJ.7272.9一东UTTO.Q150301033.94型步4TS3 63022.91275.5»13«1843.71腕力广电2437-5062"4M7.C9MJ542J皿了IOJ5.515J1B67光1 沿吉JQ卜疗卡经济”坛2、Analyze 一Data Reduction fFactor Analysis , 弹出 Factor Analysis 对话框:表2 Factor Analyze时话也与Cescnprives于小I工他V-jpjL pi rGDPiAi修人均8产卜为的工业训喃口町 广第三产业铲11值1 M,固N条产也与

8、工 勤甚本学带抖玲,r? 丸汁於潮5鼎杳障,5.切"白血B联仃。live:.£,Mtr«tonH何用m, j £cotis £由小.隔寸| gitinije厂 yivatiiti dvsctjtiv*.一一丁,Uwzw InAial sjbari一一一一一Hdp_ LjbiaburMdU117 oeltiEErts, ljr/a»isrtfcanice tewfca FlsproducedDetenriridH刍匐 旭电-KMO and EmifeM,lest of工才身冶打3、把指标数据选入 Variables 框,Descript

9、ives: Correlation Matrix 框组中选中Coefficients,然后点击 Continue,返回Factor Analysis对话框,单击OK注意:SPSS在调用Factor Analyze过程进行分析时,SPSS会自动对原始数据进行标准化处理,所以在得到计算结果后的变量都是指经过标准化处理后的变量,但SPSS并不直表E 机始囚于政尚在斗工通端1门itrit Xtitrix*接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。表3 超良亲收市拜Cn昵国七闻Ah扁GUP人均GDP农业埔加修E 业事加侑» 二产业 旧腐但 JE

10、航产带康耍岫孑 齿总假海大 ma 以财地力财政收入GDP1 ODD-00?4-0 0520.M7097?0.9230.9220 9410.6370.S26人场GDP-0Q941.000-0 L71Q H40 0740214Qtm-orm0 081O27i也蛇墙hl悔-0 052-0.171000-0 1P-0.050-0 09S-0.17fio.oii-0.125 CB6工业青知值Q.河0113-0.1J21.0000 9850 9630 9390 9J50 7050 898聃三产业幽加他。为00740,9£51.0000.9730.9400.9620.7140.913固定置产投蜜&

11、amp;92i034-00980 9650.9731 0000.9710.937O.7170 934平米升设投资0 9220 09?-0 17$0 9400 9711 ooo0 897O 6240S4S+1;三用寰砧雪普困顿0.941-0.9430 01J0.9J50.96209370 89/LOOPfl. 836U529薛美出口总建0.070 0«l-0 1250 705071407170 6240 8361 0000 882地方收入0273-0W0翻官0.910月MSS4 g0.920om1.000«4 方差分薜上成分提取外航太Tbal rinjice E卬】用ml1

12、l I H |lInrtiW F,旷rrchwKmm% 乐琳 嘛" kpofwi gctai廿CG3iixx>exitTrti、cfrwfLUnuLaCi %Tdal嘲. n£ VamixfQlnxilain w %1217.220723057220572 20572J2D5<jOP0 945口952184.55113512 146S4 551BP0412.0 824j0 877a. 76处O】g农业tfl加的0 IW0j6774Cl 5475 46698 i肥工业增加值097g-0 0055.H.U35O«54源找0前三产业普打败0 9860 0 7

13、060 0210,211阻850止般产投质09即-QO«J700120.11分蝇却0柱用走段校注0 947-5024gO.M20.0 IS99,988H元沿用总军产总融0 9770.17690.0010012100 OOO府戈山1 1总词osw-005110质DOO0 000too (W0埴右Mftff(人0 954,0420ExtiMtiEPiin臼尸I】CmpcTr- 4m1曾10a 2 mynetih从表3可知GDP与工业增加值,第三产业增加值、固定资产投资、基本建设 投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系 , 与海关出口总额存在着显著关系。可见许

14、多变量之间直接的相关性比较强,证明 他们存在信息上的重叠。主成分个数提取原则为主成分对应的特征值大于 1的前m主成分。特征值在 某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1, 说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。通过表4(方差分解主成分提取分析)可 知,提取2个主成分,即m=2,从表5(初始因子载荷矩阵)可知GDP工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海 关出口总额、地方财政收入在第一主成分上有较高载荷,说明第一主成分基本反 映了这些指标的信息;人均GDP和农业增加

15、值指标在第二主成分上有较高载荷, 说明第二主成分基本反映了人均GDP和农业增加值两个指标的信息。所以提取两 个主成分是可以基本反映全部指标的信息,所以决定用两个新变量来代替原来 的十个变量。但这两个新变量的表达还不能从输出窗口中直接得到,因为“ComponentMatrix ”是指初始因子载荷矩阵,每一个载荷量表示主成分与对应 变量的相关系数。用表5(主成分载荷矩阵)中的数据除以主成分相对应的特征值开平方根便 得到两个主成分中每个指标所对应的系数。将初始因子载荷矩阵中的两列数据输 入(可用复制粘贴的方法)到数据编辑窗口(为变量B1、B2),然后利用“TransformfCompute Vari

16、able ” , 在Compute Variable 对话框中输入 “A1=B1/SQR(7.22)” 注:第二主成分SQ照的括号中填1.235,即可得到特征向量A(见表6)。同理,可得到特征向量A。将得到的特征向量与标准化后的数据相 乘,然后就可以得出主成分表达式注:因本例只是为了说明如何在SPSS进行 主成分分析,故在此不对提取的主成分进行命名,有兴趣的读者可自行命名。Fi =0.353ZXi +0.Q42ZX: 5041ZX3 +0.364ZX; +0367型 +0.366次 +0.352ZX:地364吗 +0.298ZX, + 0.355ZXioF: =01757X1 -0.741Z

17、+0.609人 -0.004ZX, +0,063ZX< -0MIZX, -0,022ZX; M.158ZXs - 0.046巫 -0.115ZX10表 6 Compute Variable 对话 tSf 货根招%.U5-0.上出;i kmeix £叩f m. FX 1;<B1希做IsrjH Vmahk- hi21 月旻Seem: j J . E, Mi i IF J MJ£1W肘更等Lwsu,* . . dl.- ASyif*i( “<ba 一丫必 IJ,卜*-J 1 1 1 hkfnwq>r|/i G. II o i 拓TANjHMirmipti-

18、J一一中NOR川IuWbQK力一二上上U _2£Sj lCIX berhoulljuipi匚闻b_& ,标准化: 通过Analyze -Descriptive Statistics -Descriptives 对话框来 实现:弹出Descriptives对话框后,把XiXo选入Variables 框,在Savestandardized values as variables前的方框打上钩, 点击 “ OK , 经标准化的数据会自动填入数据窗口中,并以Z开头命名。R? : vUge表 7 neschptives Mpnjitid '. GDFIX1*次皿小口-本11喈加 IiJI r Tilthsrff

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论