主成分分析操作步骤_第1页
主成分分析操作步骤_第2页
主成分分析操作步骤_第3页
主成分分析操作步骤_第4页
主成分分析操作步骤_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS中主成分分析的基本操作Xiaowenzi22 与 pinksss 共同制作阐述主成分分析法的原理主成分分析是设法将原来众多具有一定相关性 (比如P个指标),重新组合 成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用Fi (选取的第 一个线性组合,即第一个综合指标)的方差来表达,即Var(Fi)越大,表示Fi包含的信息越多。因此在所有的线性组合中选取的Fi应该是方差最打的,故称Fi为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,Fi已有的信息

2、就不需要再出现再F2中,用数学语言表达就是要求 Cov(Fi, F 2)=0,则称F2为第二主成分,依 此类推可以构造出第三、第四,”,第 P个主成分。主成分模型:F i=aiiXii+a2iX2i+,F 2=812X12+822X22+,其中aii, a2i, ,api(i=i, ,m)为X的协差阵工的特征值多对应的特征向量,Xi, X2, , Xp是原始变量经过标准化处理的值(因为在实际应用中,往往存在指标的量纲不同,所以在计算之前先消除量纲的影响,而将原始数据标准 化)。A=( aij ) p m =( :'i,:'2,, , : m ), R i 二ii, R 为相关系

3、数矩阵,'i- :- i 是相应 的特征值和单位特征向量,> '2 > , > - p >0上述方程组要求:2 2 21、 a ii+a 2i +,+a =i (i=i, ,m)2、AA = I m (A=( aJp" =©i, «2,, ,%),A 为正交矩阵)3、Cov(Fi ,Fj )=, 0 r筍 i i i-i操作步骤:一、数据标准化1、jle Edit View Data TrarcForm電1|矗1 :省份|K1j北京3212 72天津|2061.13河北6122.E4山西2017±5|内累古|173

4、4.:6辽宁15430.27|吉林224G.18黒龙江3082.19|上海5408.7111 .sav - 5P55 DQtd EditorAnalyze Graphs IJtilides Whdo HelpP lx “I iE SEFrequerciee.,RecicrtsDescriptive 宝吕 tiaictlables匚smpare Mmfi5General Linear ModelMfeed ModelsCorrelateRegressionLagliriearClassifyData ReductiDnNon parametric TestsTime SeriesSurvival

5、Multiple RasDOFise即 scrjptT n-百才116258.006310032.00299357.00119683.001011699.00189990.0059926.00923959.0073曲Crosst&u, 嗣 tis.2、在弹出对话框中把需标准化的变量选进Variable去SB後国民生产息值Xi 1 砂居民消费水平仪2 固定资产投资仪3 秽职工平均工资x4 货物周转量油 嚕居民消费价格描数x国 後商品零售柳格指数X了 1 砂工业总产值何Yariables):» Save standardized values as variablesOK IPa

6、ste?ResetCancelHelpOptions.并在下面的提示前打钩Save standardized values as variables3、然后点“ OK”4、数据编辑窗内将出现结果 二、主成分分析基本操作1瞪299. Egg99J!5poridenct! Analy?!?. ial Scafing.nr-R71545'1497Factor-111Ir -ii ji02518.521332"21894'70054116 ,24E1 -3932e3S7 9S033723 9187 /06B4-.132405595? 7533 f-.5MMData Reduc

7、tion3、把标准化后的数据都选进Variables去4、点击38056-.2143424419-7116917423-.23561-.00795-.400152.580691.887242.445661 1729576833V90132.3G268-.312092、选择后弹出现下面的对话框Selection Vanable!Descriptives,Options.Extraction.» Rotation,Scores.99. C98.4100.;98. £100.SWindow HelpPasteResetCancelTrdrisformgrialyze Graphs

8、 UtitiesR.eQcrts>£scriptivs Statistic-;Table?Compare Means enercl Linear Model Mixed Mode)?CorrelateRegreision LcgJinear dassiFx5caleIJonpajarrietric TestsTime SeriesSurvlv JMultiple RlesponseHissing Value MaiysimVariables:>Zscore >Zsco re 初 Zscore >Zscore Zsco re >Zscore Zscore

9、Zsco re国民生产益值 居民渭费水平 固定资产投资 识工平均工熨 货物周转量hx 居民涓费价格U 商品零售价格推 工业忌产值ZX®飜省份1 彩国民生产总值XI 後居民消费水平仪町 後固定長产投费仪可 昜职工平垃工资1x4 货物周转ft x5 砂居民消费价格(x6| 後题品零售价格捋数伙C 莎工业息产值刈Valu<Extraction.5、弹出现下面的对话框6在对话框的空白处填0,记得上面的图中要选中前面的点Extract石 Eigenvalues over: 07、点击 continue 钮8、返回上个对话框9、如需要得到相关系数矩阵,点击Destriptives.10、弹

10、出下面的对话框-Statist! cs厂 Univariate descriptives17 Initial solutionCorrelation MatrixfvCoefficients厂InverseLSignificance levels厂ReproducedHDeterininant厂Anli-imagerKMO and Bartlett's test ofsphericity在Coefficients前的方框打上钩11、然后点击continue钮12、返回上个对话框,点击“ OKTotal Variance ExplainedComponent Total% of Vari

11、ance Cumulative %Total% of Variance Cumulative %13.84948.11848.1183.84948.11848.11821.80822.59470.7121.80822.59470.71231.30616.32987.0421.30616.32987.0424.5957.44394.485.5957.44394.4855.2893.60898.092.2893.60898.0926.078.97799.069.078.97799.0697.057.71899.787.057.71899.7878.017.213100.000Extraction

12、Method: Principal Component Analysis三、提取特征向量1、在计算主成分的步骤中将出现因子载荷矩阵,我们可以取得每个主成分的方差,即特征根,它的大小表示了对应主成分能够描述原来所有信息的多少(更多情况下是由方差贡献率来反映)。一般来讲,为了达到降维的目的,我们只提取 前几个主成分,由于前3个特征值累计贡献率达到87.042%,根据累计贡献率大 于85%勺原则,故选取前三个特征值。所以决定用三个新变量来代替原来的七个 变量。但这三个新变量的表达还不能从输出窗口中直接得到,因为“Compo nentMatrix ”是指因子载荷矩阵,每一个载荷量表示主成分与对应变量的

13、相关系数。Component Matrix aComponent12345671u? et2uXu ? Mx1).855.477-.025.049-.133-.098.069?6 ? ? ?(x2).747-.614.083.103.086.179.0881? xe2u?xe(x3).916.352-.030.103-.094-.007.089?° 1C?u 1Oxe(x4).554-.688.330.231.169-.169-.031? uxid?x5).627-.078.371-.680.028-.009-.021?6 ? ? ?合y(x6)-.379-.095.851.132-

14、.325.027.000e? - a? ?ey(x7)-.285.682.569.086.346.024.0461Cb Xu 2? y(x8).893.355.063.179.001.081-.183Extraction Method: Principal Component Analysis.a. 7 comp onents extracted.2、将前三个因子载荷矩阵输入(可 用复制粘贴的方法)到数据编辑窗口(为变 量B1、B2、B3),然后利用“ Transform ? compute” ,在对话框中输入“A仁B1/SQR3.849) ”注:第二主成分SQR后的括号中填1.808,第三主成分SQR后的括号中填1.306,即可得到特征向量 A1。同理,可得到A2、A3o然后 就可以得出主成分表达式。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论