版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
标准有用 试验七、利用SPSS进展主成分分析1原始数据〔未经标准化〕【例子】以全国318第一步:录入或调入数据图1原始数据〔未经标准化〕其次步:翻开“因子分析”对话框。沿着主菜单的“Analyze→DataReduction→Factor”的路径〔2〕翻开因子分析选项框图3。2翻开因子分析对话框的路径3因子分析选项框第三步:选项设置。首先,在源变量框中选中需要进展分析的变量,点击右边的箭头符号,将需要的变量调入变量Variable〕栏中图3。在本例中,全部8个变量都要用上,故全部调入图4Value”栏。下面逐项设置。4将变量移到变量栏以后Descriptives单击Descriptives按钮图4,弹出Descriptives对话框图。5描述选项框Statistics统计栏中选中Univariatedescriptives会给出原始数据的抽样均值〔这一栏结果可供检验参考Initialsolution〔这一栏数据分析时有用。CorrelationMatrixCoefficients关系数矩阵〔分析时可参考;选中Determinant复选项,则会给出相关系数矩阵的行列式,假设期望在Excel复选项一般不用,但在特别状况下可以用到〔本例不选。设置完成以后,单击Continue按钮完成设置图5。Extraction翻开Extraction〔图67Method栏中可以看到,系统默认的提取方法是主成分〔PrincipalComponent,因此对此栏不作变动,就是认可了主成分分析方法。AnalyzeCorrelationmatrix系数矩阵进展分析;假设选中Covariancematrix差矩阵进展分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。DisplayUnrotatedfactorsolution〔非旋转因子解〕复选项,则一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便比照。选中ScreePlo〔如山麓截面,故得名,以便我们直观地判定因子的提取数量是否准确。Extract〔因子〕的数目。一是依据特征根〔Eigenvalues〕的数值,系统默认的是c
1。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。假设默认c
1,则全部方差大于等于1分将被保存,其余舍弃。假设觉得最终选取的主成分数量缺乏,可以将c
值降低,例如取c
0.9;假设认为最终的提取的主成分数量偏多,则可以提高c
值,例如取 1.1。主成分数目是否适宜,要在进展一轮分析以后才能确定。因此,特征根数值c的设定,要在反复试验以后才能打算。一般而言,在初次分析时,最好降低特征根的临界值〔如取c
0.8〕,这样提取的主成分将会偏多,依据初次分析的结果,在其次轮分析过程中可以调整特征根的大小。其次种方法是直接指定主成分的数目即因子数目,这要选中Numberoffactors选项。主成分的数目选多少适宜?开头我们并不格外清楚。因此,首次不妨将数值设大88,不得超过此数。在我们第一轮分析中,承受系统默认的方法提取主成分。6提取对话框方法,系统默认的迭代次数252550100多。对于本例而言,变量较少,25设置完成以后,单击Continue按钮完成设置图6。Scores选中Saveasvariables栏,则分析结果中给出标准化的主成分得分〔在数据表的后面Regressio〕法即可。7因子得分对话框Displayfactorscorecoefficientmatrix,则在分析结果中给出因子得分系数矩阵及其相关矩阵。设置完成以后,单击Continue按钮完成设置图。⒋其它。可以不必设置;对于数据没有缺失的状况下,Option全部设置完成以后,点击OKSPSS很快给出计算结果图。8主成分分析的结果第四步,结果解读。对应的变量的算术平均值,计算公式为x 1n xj n i1Std.Deviation [j
1
n(xiji1
x)2]1/2jAnalysisNMeanStd.DeviationAnalysisN国内生产1921.0931474.8060330居民消费1745.933861.6419330固定资产511.5083402.8854830职工工资5457.6331310.2180530货物周转666.1400459.9669930消费价格117.28672.0253130商品零售114.90671.8980830工业产值862.9980584.5872630DescriptiveStatistics接下来是CorrelationMatrix(相关系数矩阵),一般而言,相关系数高的变量,大多会进入同一个主成分,但不尽然,除了相关系数外,打算变量在主成分中分布地位的Determinant=1.133E-0.4是相关矩阵的行列式值,依据关系式det(IR)0可知,det(λI)=det(DescriptiveStatisticsDeterminant=1.133E-0.4=λ*λ*λ*λ*λ*λ*λ*λ。这一点在后面将会得到验1 2 3a.Determinant=1.133E-04
4 5 6 7 8国内生产居民消费固定资产职工工资货物周转消费价格商品零售工业产值国内生产1.000.267.951.191.617-.273-.264.874居民消费.2671.000.426.718-.151-.235-.593.363固定资产.951.4261.000.400.431-.280-.359.792职工工资.191.718.4001.000-.356-.135-.539.104货物周转.617-.151.431-.3561.000-.253.022.659消费价格-.273-.235-.280-.135-.2531.000.763-.125商品零售-.264-.593-.359-.539.022.7631.000-.192工业产值.874.363.792.104.659-.125-.1921.000CommunalitiesExtractionMethod:PrincipalComponentCommunalitiesExtractionMethod:PrincipalComponentAnalysis.InitialExtraction国内生产1.000.945居民消费1.000.800固定资产1.000.902职工工资1.000.875货物周转1.000.857消费价格1.000.957商品零售1.000.929工业产值1.000.903i在TotalVarianceExplainedInitialEigenvalues〔初始特征根〕中,给出了按挨次排列的主成分得分的方差(Total),在数值上等于相关系数矩阵的各个特征根λ,因此可以直接依据特征根计算每一个主成分的方差百分比〔%ofi方差百分比为λ
/m=3.755/8=46.939,其次个特征根的百分比为λ1
/m=2.197/8=2InitialEigenvaluesExtractionSumsofInitialEigenvaluesExtractionSumsofSquaredLoadingsExtractionMethod:PrincipalComponentAnalysis.ComponentTotal%ofVarianceCumulative%Total%ofVarianceCumulative%13.75546.93946.9393.75546.93946.93922.19727.45974.3982.19727.45974.39831.21515.18689.5841.21515.18689.5844.4025.03194.6155.2132.66097.2756.1381.72498.99976.5E-02.81899.81781.5E-02.183100.000ScreePlot432101ScreePlot4321012345678ComponentNumbergE图8〔山麓图〕主成分的数目可以依据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特征根刚好等于主成分的方差,而方差是变量数据蕴涵信息的重要判据之一。依据λ值打算主成分数目的准则有三:只取λ>1的特征根对应的主成分从TotalVarianceExplained表中可见,第一、其次和第三个主成分对应的λ值都的。累计百分比到达80%~85%以上的λ值对应的主成分Explained表可以看出,前三个主成分对应的λ值累计百分比到达89.584%,这示意只要选取三个主成分,信息量就够了。依据特征根变化的突变点打算主成分的数量上可以看到,第4个λ值是一个明显的折点,这示意选取的主成分数目应有p≤4〔图8〕。那么,到底是3个还是4个呢?依据前面两条准则,选3个大致适宜〔但小有问题〕。在ComponentMatrix〔成分矩阵〕中,给出了主成分载荷矩阵,每一列载荷值都显0.885实际上是国内生产总值ComponentExtractionMethod:PrincipalComponentAnalysis.a.3componentsComponentExtractionMethod:PrincipalComponentAnalysis.a.3componentsextracted.123国内生产.885.384.121居民消费.607-.598.271固定资产.912.161.212职工工资.466-.722.368货物周转.486.738-.275消费价格-.509.252.797商品零售-.620.594.438工业产值.823.427.211下面将主成分载荷矩阵拷贝到Excel上面作进一步的处理:计算公因子方差和方差奉献。首先求行平方和,例如,第一行的平方和为h2=0.8842+0.3832+0.1202=0.94491这是公因子方差。然后求列平方和,例如,第一列的平方和为s1一组数据的平方和。明显,列平方和即方差奉献。事实上,有如下关系成立:相关系数矩阵的特征根=方差奉献=主成分得分的方差相关系数矩阵的特征根=方差奉献=主成分得分的方差至于行平方和,明显与前面Communalities表中的Extraction列对应的数据一样。假设i jλ。到此可以明白:在Communalities中,Initial对应的是初始公因子方差,实际上j取了3个主成分,故计算公因子方差时只考虑3个主成分。5543210y=0.0012x-2.2336R2=0.783值总产生内-10-2-3-4100020233000400050006000第一主成分图9〔GDP〕的与第一主成分的相关关系〔标准化数据〕ComponentExtractionMethod:PrincipalComponentAnalysis.a.8componentsextracted.12345678国内生产.885.384.121-.203-6.87E-021.143E-022.420E-029.192E-02居民消费.607-.598.271.409-7.61E-02.1575.525E-021.317E-02固定资产.912.161.212-.270-7.71E-028.271E-028.113E-02-7.36E-02职工工资.466-.722.368-.164.304-1.64E-02-7.62E-023.949E-03货物周转.486.738-.275.212.3052.254E-026.855E-02-6.02E-03消费价格-.509.252.797.0722.716E-02-.161.1072.435E-03商品零售-.620.594.438-.0273.531E-02.247-9.23E-021.634E-03工业产值.823.427.211.209-9.38E-02-.137-.157-2.30E-02图11微小,当公因子方差完全相等时,它们的方差为0,这就到达完善状态。实际应用中,只要公因子方差数值彼此接近〔不相差太远〕就行了。从上面给出的结果可以看出:提取33个主成分,居民消费方面的信息可能有较多的损失。至于方差奉献,反映对应主成分的重要程度,这一点从方差的统计学意义可以得到理解。在图11中,将最终一行的特征根全部乘到一起,得0.0001133,这正是相关系数矩阵的行列式数值〔在Excel中,求一组数据的乘积之和的命令是product〕。最终说明ComponentScoreCoefficientMatrix〔成分得分系数矩阵〕和ComponentScoreCovarianceMatrix〔成分得分协方差矩阵〕,前者是主成分得分系数,后者是主成分得分的协方差即相关系数。从ComponentScoreCovarianceMatrix可以看出,标准化主成分得分之间的协方差即相关系数为0〔j≠k〕或1〔j=k〕,这意味着主成分之间彼此正交即垂直。初学者常将ComponentScoreCoefficientMatrix表中的数据当成主成分得分或因果。在ComponentMatrix表中,将第一列数据分别除以λ=3.755,其次列数值分别除以1λ=2.197ComponentScoreCoefficienComponentScore2CoefficientMatrix表中的各列数据分别乘以λ=3.755,λ=2.197,…,则可将其复原1 2ComponentScoreComponentScoreCoefficientMatrixExtra
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国外安装合同范本
- 餐馆临时合同范本
- 美术课堂的开放性与包容性设计计划
- 证券业人员个人成长规划计划
- 陕西省咸阳市(2024年-2025年小学五年级语文)人教版专题练习(下学期)试卷及答案
- 阴极炭块委托加工合同范本
- 企业开户银行合同范本
- 引水管道购买合同范本
- 房车旅游合同范本
- 城市供电合同范本
- 2023年江西高考历史真题(含答案)
- 新苏教版科学三年级上册《河流与湖泊》教案
- 台账安全检查台账
- 城镇燃气-液化天然气供应安全检查表
- 建设银行纪检监察条线考试真题模拟汇编(共630题)
- 乡村振兴知识题库(含答案)
- 纳洛酮的临床应用课件
- 简单果苗购销合同
- 个体防护用品台账
- 国家开放大学应用写作(汉语)形考任务1-6答案(全)
- 宪法学知到章节答案智慧树2023年兰州理工大学
评论
0/150
提交评论