主成分分析操作步骤_第1页
主成分分析操作步骤_第2页
主成分分析操作步骤_第3页
主成分分析操作步骤_第4页
主成分分析操作步骤_第5页
免费预览已结束,剩余5页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主成分分析操作步骤1 1)先在 spssspss 中录入原始数据2 2)菜单栏上执行【分析】一一【降维】一一【因子分析】,打开因素分析对话框,将要分析的变量都放入【变量】窗口中。3 3)设计分析的统计量点击【描述】:选中“StatisticsStatistics”中的“原始分析结果”和“相关性矩阵”中的“系数”。 (选中原始分析结果,SPSSSPSS 自动把原始数据标准差标准化,但不显示出来;选中系数,会显示相关系数矩阵)然后点击“继续”。骑因子分析篁-相关性矩阵度闲迹逆蜃型叫点击【抽取】:“方法”里选取“主成分”;“分析”、“输出”、“抽取”均选中各自的第一个选项即可。因子片尹:拦或方法四)

2、:主成份,分析;|辎出相关性矩阵但)“未旋H的因1子解也。博方差矩阵性)二碎石图图)一抽取基于特征值0特征值大于强):l lJ因子的国定数量R;要提取的因子:最大收皴性送代次数理K15|.续,取.,帮助心地区I.I.JQmrJQmr- -E E.5.5J.-J.-馆食衣港住交娱4了/强述也).因子分标描述统讨*-Stansties-策变量中留述性也)“例始分析给果出行列式i原映象(3螂口和Bartell的叶脱度检麟显音性水平;挈画取消里助点击【得分】:选中“保存为变量”,方法中选“回归”;再选中“显示因子得分系数矩阵”点击【选项】:选择“按列表排除个案”。点击【旋转】:选取第一个选项“无”。(

3、当因子分析的抽取方法选择主成分法时,且不进行因子旋转,则其结果即为主成分分析)4)4)结果解读5)5)A.A.相关系数矩阵:是 6 6 个变量两两之间的相关系数大小的方阵。通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的关系。相性矩睡食品衣着燃料住房交通和通讯娱乐教育文化相食品1.000.692.319.760.738.556衣着.6921.000-.081.663.902.389燃料.319-.0811.000-.089-.061.267住房.760.663-.0891.000.831.387交通和通讯.738.902-.061.8311.000.326娱乐教育文化.556.3

4、89.267.387.3261.000B.B.共同度:给出了这次主成分分析从原始变量中提取的信息,可以看出交通和通讯最多,而娱乐教育文化损失率最大。Communalities起始撷取食品1.000.878衣着1.000.825燃料1.000.841住房1.000.810交通和通讯1.000.919娱乐教育文化1.000.584撷取方法:主元件分析C.C.总方差的解释:系统默认方差大于 1 1 的为主成分。如果小于 1,1,说明这个主因素的影响力度还不如一个基本的变量。 所以只取前两个, 且第一主成分的方差为 3.568,3.568,第二主成分的方差为 1.288,1.288,前两个主成分累加占

5、到总方差的 80.939%80.939%明的燮昊数女恩言十元件起始特徵值摄取平方和载入燮昊的累加燮昊的累加13.56859.47459.4743.56859.47459.47421.28821.46680.9391.28821.46680.9393.60010.00190.9414.3585.97596.9165.1422.37299.2886.043.712100.000撷取方法:主元件分析D.D.主成分载荷矩阵:元件矩睡a元件12食品.902.255衣着.880-.224燃料.093.912住房.878-.195交通和通讯.925-.252娱乐教育文化.588.488撷取方法:主元件分析a

6、.摄取2偃I元件。特别注意:该主成分载荷矩阵并不是主成分的特征向量,即不是主成分 1 1 和主成分 2 2 的系数。主成分系数的求法:各自主成分载荷向量除以各自主成分特征值得算数平方根。则第 1 1 主成分的各个系数是向量(0.925,0.902,0.880,0.878,0.588,0.093)0.925,0.902,0.880,0.878,0.588,0.093)除以J3.56J3.568 8后才得到的,即(0.490,0.478,0.466,0.465,0.311,0.049)0.490,0.478,0.466,0.465,0.311,0.049)才是主成分1 1的特征向量,满足条件是系数

7、的平方和等于1,1,分别乘以6 6个原始变量标准化之后的变量即为第1 1主成分的函数表达式(作业中不用写公式):Y Y1=0.490*Z=0.490*Z 交+0.478*Z+0.478*Z 食+0.466*Z+0.466*Z 衣+0.465*Z+0.465*Z 住+0.311*Z+0.311*Z 娱+0.049*Z+0.049*Z 燃同理可求出第 2 2 主成分的函数表达式。E.E.主成分得分系数矩阵元件押分彳系数矩睡元件12食品衣着燃料住房交通和通讯娱乐教育文化.253.247.026.246.259.165.198-.174.708-.152-.196.379撷取方法:主元件分析元件押分。

8、该矩阵是主成分载荷矩阵除以各自的方差得来的,的系数,在主成分分析中可以不考虑它。实际上是因子分析中各个因子元件 iff 分共建昊敷矩睡元件12121.000.000.0001.000.撷取方法:主元件分析元件押分。6 6)因子得分在之前的“得分”对话框中,由于选中了“保存为变量”,方法中的“回归”;又选中了“显示因子得分系数矩阵”,因此 SPSSSPSS 的输出结果和原始数据一起显示在数据窗口里:7 7)主成分得分特别提醒:后两列的数据是北京等 1616 个地区的因子 1 1 和因子 2 2 的得分,不是主成分 1 1 和主成分 2 2 的得分。主成分的得分是相应的因子得分乘以相应的方差的算数

9、平方根。即:主成分 1 1 得分= =因子 1 1 得分乘以 3.5683.568 的算数平方根主成分 2 2 得分= =因子 2 2 得分乘以 1.281.288 8 的算数平方根得出各地区主成分 1 1 和主成分 2 2 的得分如下表:屯士2小集1IBMSPiS舁京由 J文件箫辑(目视图敷据转接口)分析通】直群图形宦)实面广一厂门 t(=:H111:地区因子2主成分1主成5K1北京204910-22872387053-2595712神41770-10368073900-1.176673河北-103856-101863196175-1.156044山西-103619-131786-2.051

10、72L-149564内蒙-72763-110272-1.37481-1251486辽宁273624660151722.517537甜095661.36274180691546578里走-3827847057-.74193.534059行235563-43335444996-49181110江苏-05796-15654-10948-1776611浙江63552-.049901.20044-.0566312安监-.437签15917-627191.4660213福建-.377671.60656-71339F13233114江西-677561.490851.27986匚1.6919715山东-116

11、93-.56960-.22087-.6463316河南-91423-7G446-172690-.8676117数摄视图中变量根圉;V.,J后两列就是 1616 个地区主成分 1 1 和主成分 2 2 的得分。(有兴趣的同学可以验证一下:上面推导出来的主成分的函数关系式计算出来的主成分得分是否与该数据栏的的得分一致)8 8)综合得分及排序:每个地区的综合得分是按照下列公式计算的:3.56X1.2H8Y=*主成分1得分+*主成分2得分3.568+1.2883.568+1.288Y=0.73476*Y=0.73476*主成分 1 1 得分+0.26524*+0.26524*主成分 2 2 得分按照此

12、公式计算出各地区的综合得分 Y Y 为:化简得:文件(D篇相目视座I世)数据睛拉(B分析为直销网)图形实用程序窗名目培回1rsr 唐生=a蒯H痂阖地区因子1因子2主成分1主成分2Y13说2.04910.228723.S7DE8-.259572776092天泳4177Q-1036807S900-117667267633河北-1.03856-1.01863-1.96175-1.15604-1.74S054山西1.0BE19-1.317B6“205172.1495641904235内蒙72733-110272-1.37481-125U8-1.342106辽宁273B2,45601.51722,517

13、53,517301吉林095661.36274.180691.54657542988黑龙-.39278.47057-.741S3.53405-.40349g上海235683-433354M996-4916131392110江苏-.05796-.16654-.10948-.17766-.1275611浙江63552*04990120044-056633670212安索-437921.29176-.027191.46602-.2189413病建37767160658-7133918233104Q5514江西677561.49085-1.279851.69197-.4916115山东-.11693-

14、66950-22087-.646333337216河南-91423-7S446-1.72690-36761-149898按照综合得分 Y Y 的大小进行 1616 个地区的排序:点击【数据】一一【排序个案】士2琲序个案排序据):-YQ)a-排殛顶序一升序名)但降序。)保存已分送数据融保存带分类数据的文件(V)文件 gC:UsersAdministratortDesktop,11l.sav巴仓牌索引赠定粘贴坦)重置电山觥雨|察助.的地区/因子1夕因子2梆主成分1.主成分2的排序av:数据集团-IBMSPSS注据奏走器文件日编辑叵)(y)数据值)转换CD分析直销回图形&)实用程序军地区因子

15、1二因子2口主成分1主成分2Y|上海2.35583-.433354.44996-.491813.139212北京2.04910-228723.87053-.259S72.775093浙江3552.049301.20044-05663.367024吉林.09566136274.180691.54657.542985辽宁.273824660161722,51753517306天津.41770-103680.73900-1.17667.267637福建-.37767160658-.71339182331.04055a江苏-.05796-.15654-.10946-.17766-J27569安徽-.4

16、37921-29176-.827191.46602-.2139410山东-11693-569502208764633-.3337211黑龙.3927847057-.74193.53405-.4034912江西-677561.43085-1.2798519197-4916113内蒙*72783d10272-1.37481-1.25148-13421014河南-91423-76448-1.72690-.86761-1.4939816河北-1.03856J01BS3196175-1156M-1.7480516山西-1.08619-131786-2.05172-1.49564-1.90423特别提醒:1 1 .若主成分分析中有 n n 个变量,则特征值(或方差)之和就等于 n;n;2 2.特征向量(或主成分的系数)中各个数值的平方和等于 1,1,否则就不是特征向量,也不是主成分系数;3 3.主成分载荷向量各系数的平方和等于其对应的主成分的方差;本例中0.9250.9252+0.902

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论