手把手教你如何用SPSS分析数据_第1页
手把手教你如何用SPSS分析数据_第2页
手把手教你如何用SPSS分析数据_第3页
手把手教你如何用SPSS分析数据_第4页
手把手教你如何用SPSS分析数据_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、使用SPSS软件进行数据分析文档通过自己论证属实。【例子】以全国31个省市的8项经济指标为例,进行主成分分析第一步:录入或调入数据(图1)省份国内生生|居民泊舞固定受产斯上一资货物周转消费阶格商品零隹工业产值11394m2S05m5fg31日00373.=01173011260043.43292D112720.0334546650100342.E口1150110S3682.51现9521256.03704.074839.002033,3011520115.301234.05山西1田a431250.0J290.304721叩7三口116叩115.501597.25缸向宗832印13870J250

2、.23430071.70117SJ116.30419.39C辽宁2793372397.0J387.JQ4011.001371.7011610114.001M.其7吉林1129201372.00J20.4G4430.00497,可115201U.2J7G2.47r黑龙江2014g435734.延00024.f011010114JO124017g上海24325753430399640邙匚nil皿40IIS7口11900IQ423510江募5155251326031434.355943.001025.5011580MdR2026.SH11淅江JS24/y224a.UJlUUb.jybb19.CU旧J

3、:L11btU113.W31E.5912一撤200381JS40J44JU4blM口tLb.cL114601127J324.1413血21602m.u653.975857.00IzLU,L115J114.40433.BZU江西1235111102.03202.344211.00-11.7011390115力571.9415I*印02341527m12295551J5001196.601H111421?(I7图ie河南274113rn6701543JJ00-4如I1I1BS5111301379217湖北2391421527.00CT1.B9怖,QQss.co12000116.60122072It

4、湖南2135701Ji08.0J422.B14757ua1011,0115.60843.319东63S1722s99W1639.33026D.OOESELflD11400111BJ1396.3620广西1Q0B1S13140J982.59610.00fiSELOO1104011S4J5S4J721陶闰3G4.171314.01190.35匚。口23210113D1113364.3322SJII353400126103022.54拓眼00902.3011BfO117.011431.9123贵出I6300794203150.344Z750030110121ZOirpi324.72120668126

5、103334.DO51血口03104012130118.10TT6.65国藏55581110.0317J7丁30之004.2011730114.906.5726隈百1UU0C33883D0J74-39E.0D5UJ.9U119CU117,006W.?U27廿毫5s3351007.0J114.315招MWsoz.au11960116.5046B792E营海-155J11445.0J47765753L0061.6011BC01163。105.002i1站507900121.001V10115301t4403093457146900376兆53JE00339.001197D

6、iifi/a43876图1原始数据(未经标准化)第二步:打开“因子分析”对话框沿着主菜单的“Analyze-DataReduction-factor”的路径(图2)打开因子分析选项框(图3)国全国3U个省小区轻海&展的H域指标-SPSSDataEditor日uEdit出用ataIransfcrm|AnalyzeSrptisUt甫tiesflndowHelp闺0|副司|不|Reports卜DescriptiveStatistics卜CompareMears卜Gener己ILrerModel卜Correlate1卜安gr日tsion卜Classic卜凰由医N&n省份国内生工职工工资E1北京1的4W

7、118144.002天津920.116650100r3河北2晅EtaRedaction卜|FactarM-iI4山西109245cale卜MonparmetricTesti卜MultipleResponse卜u_ludrs内蒙史2比34134.006辽宁27S3.Se4911.00图2打开因子分析对话框的路径,FactorAnalysis产费产资转格售值生曹工周怖零产份内民定工物费昂业省国居固服贷消商工事合金*.做假唆专Variables:OKSelectionVrkble:1nValue.,Descriptive,+hExtraction,Rotation.Scores.Options.图3

8、因子分析选项框第三步:选项设置。首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。在本例中,全部8个变量都要用上,故全部调入(图4)。因无特殊需要,故不必理会Value”栏。下面逐项设置。图4将变量移到变量栏以后1 .设置Descriptives选项。单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。图5描述选项框在Statistics栏中选中Univariatedescriptives复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initia

9、lsolution复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。在CorrelationMatrix栏中,选中Coefficients复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant复选项,则会给出相关系数矩阵的行列式,如果希望在Excel中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选)。设置完成以后,单击Continue按钮完成设置(图5)。2 .设置Extraction选项。打开Extraction对话框(图6)。因子提取方法主要有7种,在Method栏中可以看到,系统默认的提取方法

10、是主成分(),因此对此栏不作变动,就是认可了主成分分析方法。在Analyze栏中,选中Correlationmatirx复选项,则因子分析基于数据的相关系数矩阵进行分析;如果选中Covariancematrix复选项,则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。在Display栏中,选中Unrotatedfactorsolution(非旋转因子解)复选项,则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。选中ScreePlo

11、t(“山麓”图),则在分析结果中给出特征根按大小分布的折线图(形如山麓截面,故得名),以便我们直观地判定因子的提取数量是否准确。在Extract栏中,有两种方法可以决定提取主成分(因子)的数目。一是根据特征根(Eigenvalues)的数值,系统默认的是c1。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认c1,则所有方差大于等于1的主成分将被保留,其余舍弃。如果觉得最后选取的主成分数量不足,可以将c值降低,例如取c0.9;如果认为最后的提取的主成分数量偏多,则可以提高c值,例如取c1.1。主成分数目是否合适,要在进行一轮分析以后才能肯定。因此,特征根数值的设定,要在反

12、复试验以后才能决定。一般而言,在初次分析时,最好降低特征根的临界值(如取c0.8),这样提取的主成分将会偏多,根据初次分析的结果,在第二轮分析过程中可以调整特征根的大小。第二种方法是直接指定主成分的数目即因子数目,这要选中Numberoffactors复选项。主成分的数目选多少合适?开始我们并不十分清楚。因此,首次不妨将数值设大一些,但不能超过变量数目。本例有8个变量,因此,最大的主成分提取数目为8,不得超过此数。在我们第一轮分析中,采用系统默认的方法提取主成分。图6提取对话框需要注意的是:主成分计算是利用迭代(Iterations)方法,系统默认的迭代次数是25次。但是,当数据量较大时,25

13、次迭代是不够的,需要改为50次、100次乃至更多。对于本例而言,变量较少,25次迭代足够,故无需改动。设置完成以后,单击Continue按钮完成设置(图6)3 .设置Scores设置选中Saveasvariables栏,则分析结果中给出标准化的主成分得分(在数据表的后面)。至于方法复选项,对主成分分析而言,三种方法没有分别,采用系统默认的“回归”(Regression)法即可。VSaveasvariables-MethodQRegressiianCBartlettrAnder&oh-Rubin匠Displayfactorscorecoefficienlmatrix图7因子得分对话框选中Disp

14、layfactorscorecoefficientmatrix,则在分析结果中给出因子得分系数矩阵及其相关矩阵。设置完成以后,单击Continue按钮完成设置(图7)。4 .其它。对于主成分分析而言,旋转项(Rotation)可以不必设置;对于数据没有缺失的情况下,Option项可以不必理会。全部设置完成以后,点击OK确定,SPSS很快给出计算结果(图8)FactorAnalysisDeuriptiw5tri.gwflhm小庄严压1Hg3L-30居民消费1745.93096L,6419330落住济立E11SQE3402.3ffiaBO期,11贷54ET831310133530IS物应需BGb.

15、lCO4阻5前汨30消酰那117396721025mL:30百品零辔114。算,7i.aceaa3011步值甑品囱5扫三S7非aoCunuidUuiiijtrlK*即3生卢匡区有群国核声职工工仔渭卷箭第群品零售工注声信Ccrrabujr国内生产i.oao.ZG7,951,191,&P-.Z/3-2&4,074驾星梏受,2b7Iwa恪J1日-.151-.235-.593.曲固定强声皿,426i.om.400.431-.280.702乳口赍,191,710,4031.DD0-.356-.135-.539.104生物周需,617出1,A31-360LDOO-.253.022消青除格-273.2352

16、HU一比*2S3i.iua.763-1S荀品零意.咨4-.no-5的.022.7531.000-102一蛀产值,S74M3,792,104,0:9-125施i.oro1Clbtliiridi.-1123E-CH*图8主成分分析的结果第四步,结果解读。在因子分析结果(Output)中,首先给出的DescriptiveStatistics,第一列Mean对应的变量的算术平均值,计算公式为xjnxiji1第二列Std.Deviation对应的是样本标准差,计算公式为n12,1/2j;(xijxj)n1i1第三列AnalysisN对应是样本数目。这一组数据在分析过程中可作参考。DescriptiveS

17、tatisticsMeanStd.DeviationAnalysisN国内生产1921.0931474.8060330居民消费1745.933861.6419330固定资产511.5083402.8854830职工工资5457.6331310.2180530货物周转666.1400459.9669930消费价格117.28672.0253130商品零售114.90671.8980830工业产值862.9980584.5872630接下来是CorrelationMatrix(相关系数矩阵),一般而言,相关系数高的变量,大多会进入同一个主成分,但不尽然,除了相关系数外,决定变量在主成分中分布地位的

18、因素还有数据的结构。相关系数矩阵对主成分分析具有参考价值,毕竟主成分分析是从计算相关系数矩阵的特征根开始的。相关系数阵下面的Determinant=1.133E-0.4是相关矩阵的行列式值,根据关系式det(IR)0可知,det(入I)=det(R),从而Determinant=1.133E-0.4=为*M*%*k*尢*%*万*?8。这一点在后面将会得到验证。CorrelationMatrixa国内生产居民消费固定资产职工工资货物周转消费价格商品零售工业产值国内生产1.000.267.951.191.617-.273-.264.874居民消费.2671.000.426.718-.151-.23

19、5-.593.363固定资产.951.4261.000.400.431-.280-.359.792职工工资.191.718.4001.000-.356-.135-.539.104货物周转.617-.151.431-.3561.000-.253.022.659消费价格-.273-.235-.280-.135-.2531.000.763-.125商品零售-.264-.593-.359-.539.022.7631.000-.192工业产值.874.363.792.104.659-.125-.1921.000a.Determinant=1.133E-04在Communalities(公因子方差)中,给

20、出了因子载荷阵的初始公因子方差(Initial)和提取公因子方差(Extraction),后面将会看到它们的含义CommunalitiesInitialExtraction国内生产1.000.945居民消费1.000.800固定资产1.000.902职工工资1.000.875货物周转1.000.857消费价格1.000.957商品零售1.000.929工业产值1.000.903ExtractionMethod:PrincipalComponentAnalysis.在TotalVarianceExplained(全部解释方差)表的InitialEigenvalues(初始特征根)中,给出了按顺序

21、排列的主成分得分的方差(Total),在数值上等于相关系数矩阵的各个特征根入,因此可以直接根据特征根计算每一个主成分的方差百分比(ofVariance)。由于全部特征根的总和等于变量数目,即有m=E=8,故第一个特征根的方差百分比为入1/m=3.755/8=46.939,第二个特征根的百分比为氾/m=2.197/8=27.459,,其余依此类推。然后可以算出方差累计值(Cumulative%)。在ExtractionSumsofSquaredLoadings,给出了从左边栏目中提取的三个主成分及有关参数,提取的原则是满足41,这一点我们在图6所示的对话框中进行了限定。TotalVariance

22、ExplainedComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%13.75546.93946.9393.75546.93946.93922.19727.45974.3982.19727.45974.39831.21515.18689.5841.21515.18689.5844.4025.03194.6155.2132.66097.2756.1381.72498.99976.5E-02.81899.81781.5E-02

23、.183100.000ExtractionMethod:PrincipalComponentAnalysis.ScreePlotepavneuEComponentNumber图8特征根数值衰减折线图(山麓图)主成分的数目可以根据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特征根刚好等于主成分的方差,而方差是变量数据蕴涵信息的重要判据之一。根据也决定主成分数目的准则有三:i只取入1的特征根对应的主成分从TotalVarianceExplained表中可见,第一、第二和第三个主成分对应的也都大于1,这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。ii累计百分比达到

24、80%85%以上的入值对应的主成分在TotalVarianceExplained表可以看出,前三个主成分对应的油t累计百分比达到89.584%,这暗示只要选取三个主成分,信息量就够了。iii根据特征根变化的突变点决定主成分的数量从特征根分布的折线图(ScreePlot)上可以看到,第4个才直是一个明显的折点,这暗示选取的主成分数目应有p1.19211-.61028.26259-51833-83667.48824-.34594858226666-.19950-,26604,09746,27330.22955-.6423B1.64990-2.211322.E15S3134235.05093,349

25、24,97196-.327612045Q,22957.08007*1,68897,21602-.52015-59561-.71726.20175-.479531.548011.39467,49539527421.4474485351-.14599.977271.03643-21177.71673.231082.3B062-.8741308630-.59311.2573333602-.29055-1.54444-2.18402,29371卜33351,77269-144632,396411108001.CU217.487711.71494-1.04023-1.36153.01475-.91716

26、.47E57,41703-1.09189.11265,62990-.72563,23914-111530-E7162-44176-S8905-.02915,92506其还原为未经标准化的主成分得分a.标准化的主成分得分得分一得分二|得分三84260-2.2350064870GG940-2.68230-1193101.381302.3905D-1.33560-100600,3953a59090-1.64950.73500-.307301,63230.96940-.634303931口-.43140d.2310053920.34440-721203.25260-3.331202.S30S03532

27、301.28340391BO1.91620-49320,22900,45300.12060-1.89400,42600-,9347066610-1.41400.30360-537503.052002.1029D,555901.040002.1814aj-.96620-.260101.472901.1S5W-.417601OBOIO259704.G9350-131G00.095G0-1.16950.38750,37720-67230-2.32D0D-2.45010,578902.0099,86720-20518059G8a124320-2.05520734701.923B0-205120-2.05220.01630-1.300307177

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论