地理学模型方法及应用_第1页
地理学模型方法及应用_第2页
地理学模型方法及应用_第3页
地理学模型方法及应用_第4页
地理学模型方法及应用_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

地理学模型方法及应用第1页,课件共52页,创作于2023年2月一、SPSS统计软件应用基础第2页,课件共52页,创作于2023年2月一、数据输入1.Name变量名称:首字必须是字母、变量名不多于8个字符。2.Type数据变量类型:Numeric标准、String字符、Date日期3.Width变量格式宽度:指数据窗口中变量列所占单元格的列宽度。不同于变量宽度。若变量宽度>变量格式宽度,在数据窗口中显示变量名的字符数不够,变量名将被截去尾部而不完全显示。输入的数据可能截去尾部,用“*”号代替。4.Decimals小数位数第3页,课件共52页,创作于2023年2月5.Label变量标签:是对变量的附加说明。6.Value值标签:是对变量的可能取值附加的进一步说明。如果将它定义为一个数字型变量,在值标签开关开启时,要输入部门名称,只需要输入它的值,就可显示出值标签。7.Missing缺失值:指没测到、没记录到、或结果明显错误的数据。系统默认的数值型缺失值为0,字符型缺失值为空格,我们也可自定义缺失值。如把小麦亩产量大于1500公斤的数据记为缺失值。8.Alignment单元格对齐格式:有左中右之分。9.Measurement测度:Scale定比测度(取值于一个区间或连续变量,如身高、收入),Ordinal定序测度(无论是数字型还是字符型,只要有顺序分类,如大中小、优良中差),Nominal定类测度(若是不具有某种内在顺序分类的字符型变量,如地理区域的划分、公司部门等,可设置为Nominal测度)。第4页,课件共52页,创作于2023年2月二、数据标准化1.标准化公式:Zi=(xi-x均)/s其中:x均为算术平均值;s为标准差(样本方差)S=[1/(n-1)Σ(xi-x均)2]1/22.方法Analyze→DescriptiveStatistics→Descriptives,打开Descriptives对话框,选SaveStandardizedValueVariables三、方差分析(一)单因素方差分析及其原理1.在科学研究中,需要在诸多因素中,分析哪些因素对该事物有显著影响?影响因素如何搭配效果最佳?影响因素间是否有交互作用?方差分析就是处理这类问题的统计分析方法。第5页,课件共52页,创作于2023年2月2.单因素方差分析基本原理研究因素影响是否显著,就是检验如下假设:H0:μ1=μ2=…=μr当p<0.05(系统默认的显著性概率值)时,推翻原假设,认为这些因素的影响是显著的,说明这些因素造成的均值差异有统计意义;否则认为影响是不显著的。3.方法Analyze→CompareMeans→One-WayAnalysisofVariance。分别输入因变量DependentList和因素变量Factor。Significanceleve确定显著性水平,一般选0.1,0.05,0.01,系统默认的显著性概率为0.05。4.结果分析表中第一列为方差来源:①组间(由于因素不同水平或位级所造成的差异);②组内(由于偶然或不可控制的随机因素所造成的差异);③总平方和。表中第一行:平方和;df为自由度;均方;F为组间均方除以组内均方的商;Sig.为F分目的显著性概率。第6页,课件共52页,创作于2023年2月(二)单变量多因素方差分析研究一个因变量与多个独立自变量或因素间的关系。1.多因素方差分析基本原理研究因素影响是否显著,就是检验各因素及它们之间的交互作用对总体均值影响是否显著,即检验如下假设均方差:H0A=σ1=σ2=…=σr;H0B=β1=β2=…=βr;

H0A×B=γ1=γ2=…=γr;2.方法Analyze→GeneralLinearModel→Univariate分别输入因变量DependentList和多个不变因素FixedFactor3.结果分析有2个表:表①为主因素变量信息表(Between-SubjectsFactors),含变量取值及频数N。第7页,课件共52页,创作于2023年2月表②为主效应方差分析表(TestsofBetween-SubjectsEffects).表中第一行分别为:Source为方差来源;TypeⅢSume为按系统默认Ⅲ型草方和计算出的离差平方和;df为自由度;MeanSquare为均方,即平方和与自由度之商;F为[Σ(xi-x均)2]1/2与[Σ随机误差平方和]1/2之比;Sig.为接受原假设的显著性概率。表中第一列分别为:修正模型;截距平方和(截距指线性模型中的截距);因素1;因素2;因素1*因素2交互效应;误差;因变量的总平方和;修正模型的总平方和。三、相关分析1.二元变量相关分析方法:Analyze→Correlate→Bivariate(二元变量),选了Flagssignificantecorrelations项,显著水平0.05以下显著相关的相关系数用*标记,显著水平0.01以下显著相关的相关系数用**标记。Pearson皮尔逊相关系数(|Rxy|≤1):Rxy=Σ(xi-x均)(yi-y均)/[Σ(xi-x均)2Σ(yi-y均)2]1/2第8页,课件共52页,创作于2023年2月Kendall’stau-b为肯德尔秩相关系数。Spearman为斯皮尔曼秩相关系数。Two-tailed为双尾假设检验。One-tailed为单尾假设检验。2.偏相关分析2.1偏相关系数定义指当其他变量被固定,给定的任意两个变量之间的相关系数。偏相关系数才是真正反映两个变量的相关关系的统计量。在多元分析相关分析中,Pearson皮尔逊相关系数只是从表面上反映两变量相关的性质,往往不能真实反映,甚至造成相关的假象。2.2方法Analyze→Correlate→PartialCorrelations(偏相关)输入两个或两个以上需要进行相关分析的变量移入Variable框内。再输入至少1个控制变量移入控制变量栏。或两个以上需要进行相关分析的变量移入Variable框内。第9页,课件共52页,创作于2023年2月选了Displayactualsigificance项,在显示相关系数的同时,也显示相关系数的实际显著性概率和自由度。如果不选,显著水平0.05以下显著相关的相关系数用*标记,显著水平0.01以下显著相关的相关系数用**标记。四、回归分析1.线性回归分析1.1方法

Analyze→Regression→Linear。输入两个或两个以上需要进行相关分析的变量移入Variable框内。再输入至少1个控制变量移入控制变量栏。或两个以上需要进行相关分析的变量移入Variable框内。回归模型中自变量进入方式选择:Enter为自变量全部进入;Stepwise为逐步回归;Remove为移除法,根据设定的条件剔除部分自变量;Backward向后剔除法,先将所有变量引入方程,再据F值逐一剔除;Forward第10页,课件共52页,创作于2023年2月向前剔除法,先将按偏相关系数最大的入,再引入次大的,直至将所有符合条件的变量全部引入方程为止。选项按钮中Statistic中Cofidenceintervals为回归系数B的95%置信区间。打开Plots按钮,选Produceallpartialplots绘制出散点图。打开Save按钮,选PredicatedValues中的非标准化或标准化的预测值。选Residuals保存残差。1.2结果分析(回归方程的建立)2.非线性回归分析Analyze→Regression→noLinear第11页,课件共52页,创作于2023年2月3.曲线估计3.1方法Analyze→Regression→CureEstimation3.2线型模型的选择方法线性模型,二次,复合y=a(b)t,生长曲线y=exp(a+bt),对数曲线y=a+blnt,三次曲线,S曲线y=exp(a+b/t),指数曲线y=aexp(bt),逆曲线y=a+b/t,幂指曲线y=a(t)b,逻辑曲线y=[1/u+a(b)t],选逻辑曲线时,必须在被激活的Upperbound框中输入u>0,且必须大于因变量的最大值,称u为上界。五、非参数检验5.1单个样本K-S检验:可检验一个样本是否服从正态、泊松、均匀和指数分布。5.1.1方法Analyze→NonparametricTests→1-SampleK-S打开One-sampleKolmogorov-SmirnovTest对话框。第12页,课件共52页,创作于2023年2月5.1.2检验概率分布选择方法Normal:正态分布;Poisson:泊松分布;Uniform:均匀分布;Exponetial:指数分布。5.1.3结果分析方法N:样本总数;Normalparameter(正态分布参数):均值,标准差;MostExtremeDifferences(最大的):绝对值,最大正极端差,最大负极端;Kolmogorov-SmirnovZ:K-S检验统计量Z值;Asymp.Sig.(2-tailed):双尾渐进显著性概率(大于0.05接受原假设,即μ=μ0,服从正态分布)。5.2多个独立样本检验:可检验多个独立样本是否来自具有相同分布总体的样本。(若多个样本来自等方差的正态总体时,才能用方差分析检验)5.2.1方法Analyze→NonparametricTests→KIndependentSample第13页,课件共52页,创作于2023年2月5.2.2检验方法选择有两种方法可选①克鲁凯-沃里斯H检验;中位数检验Median。5.2.3结果分析方法例1从某车间使用的4种不同操作方法下生产的产品中,分别抽查若干批进行检验,测得被抽查的各批产品的优等品率(%)的数据资料见表.试检验不同操作方法对产品优等品率有无显著影响。H检验有2个表:表1为平均秩(Ranks)表;表2为H检验结果表:①卡方统计量值为11.53,自由度df为3;②渐进显著性概率Sig.为0.009<0.05。因此认为这4种不同操作方法对产品优等品率有显著影响(拒绝原假设:4种样本属同分布)。第14页,课件共52页,创作于2023年2月六、聚类分析与判别分析分类问题可分为两种:

一种是事先不知道应将样品(Q-型聚类)、或指标(R-型聚类)分为几类,需要根据样品或变量的相似程度,归组并类,这种分类问题用聚类分析法(ClusterAnalysis)解决;

第二种是事先已经建立了分类,然后将新样品按照已知类别进行归类,解决这种分类问题用判别分析法(DiscriminantAnalysis)

。㈠聚类分析聚类分析分为动态聚类分析法、系统聚类分析法等。

动态聚类法也称为快速聚类法,或K-均值聚类法(K-MeansCluster),快速聚类的思想是:开始按照一定方法选取一批聚类中心(ClusterCenter),让样品向最近的聚心凝聚,形成初始分类,然后按最近距离原则不断修改不合理分类,直至合理为止。第15页,课件共52页,创作于2023年2月

系统聚类分析法也称为分层聚类法(HierarchicalCluster),分层聚类的思想是:开始将样品或指标各视为一类,根据类与类之间的距离或相似程度将最相似的类加以合并,再计算新类与其它类之间的相似程度,并选择最相似的类加以合并,这样每合并一次就减少一类,不断继续这一过程,直到所有样品或指标合并为一类为止。1.快速聚类分析(K-均值聚类法)⑴方法(以10湖泊水质评价为例)例2将聚类分析法用于湖泊富营养化评价。有10个湖泊样本,其透明度(SD)、总氮(TN)、总磷(TP)和化学需氧量(COD)等参数的标准化值如表所示。①Analyze→Classify→K-MeansCluster②从源变量栏选择一个或几个分析变量(数字型:numeric)移入Variables框中;选择一个字符型(String)标记变量(lake)移入LabelCaseby框中。③在NumberofCludter小框指定聚类数(系统默认聚类数为2)3。第16页,课件共52页,创作于2023年2月④从Method栏中选择一种聚类方法:Iterateandclassify:系统默认选项,表示在迭代过程中不断地更新聚类中心;Classifyonly:用初始聚类中心对观测量进行聚类,聚类中心始终不变。⑤单击Iterate(迭代):在MaximumIterations右边的文本框中,输入一个整数限定迭代步数,系统默认值为10。在ConvergenceCriterion右边的文本框中,输入一个不超过1的正数作为判定迭代收敛的标准。缺省的收敛标准值为0.02,表示当两次迭代计算的聚心之间距离的最大改变量小于初始聚心间最小距离的2%时终止迭代。⑥单击Save:Clustermembership:在工作文件中建立一个名为“gcl_1”的新变量,其值为观测量的类别。第17页,课件共52页,创作于2023年2月Distancefrimclustercenter:在工作文件中建立一个名为“gcl_2”的新变量,其值为各观测量与所属类聚心之间的欧氏距离。⑦打开Options:弹出对话框中Statistcs指定输出统计量值,包括:Initialclustercenters:系统默认选项,表示输出初始类聚心表。ANOVAtable:输出方差分析表。Clusterinformationforeachcase:显示每个观测量的聚类信息。包括各观测量最终被聚入的类别、各观测量与最终聚心之间的欧氏距离,以及最终聚心之间的欧氏距离。⑵结果分析①初始类聚心表Initialclustercenters②迭代史表IterationHistory:给出迭代过程中各聚心演变。表下注释指出聚类过程经2次就终止了。初始聚类中心之间最小距离为0.533。第18页,课件共52页,创作于2023年2月③样品隶属表Clustermembership:给出聚类后样品所隶属类型。Cluster列为隶属类别,Distance列为观测量与聚心之距离。④最终聚类中心表:给出最终的类中心之间距离。⑤每类中样品数NumberofcaseineachCluster。2.分层聚类分析(系统聚类分析法)Analyze→Classify→HierarchicalCluster①从源变量栏选择一个或几个分析变量(数字型:numeric)移入Variables框中;选择一个字符型(String)标记变量(lake)移入LabelCaseby框中。②在Cluster栏中选择聚类类型:Cases:计算观测量之间的距离,进行观测量聚类。Variables:计算变量之间的距离,进行变量聚类。③在Display栏中选择显示内容,其中两项皆为系统默认选项:第19页,课件共52页,创作于2023年2月Statistics:显示统计量,不选此项,对话框下

Statistics按钮将被关闭。Plots:显示图形,不选此项,对话框下Plots按钮将被关闭。④单击Statistics按钮:在Cludtermembership(样品隶属类型)栏中包括3个选项:None:不输出样品隶属类表,为系统默认选项。Singlesolution:选择此项并在右边的Cludters文本框中指定输出分类个数n(大于1的整数),则将输出各样品或变量隶属n类的隶属表。Rangeof

solutions:选择此项并在下边的From_though_clusters的两个小框中输入两个数m和n(2≤m<n),则将输出各样品或变量的分类数从m到n的所有(m-n类)分类的隶属表。第20页,课件共52页,创作于2023年2月⑤单击Plot按钮:Dendrogram:龙骨图,选择此项输出反映聚类结果的龙骨图。在Icile(冰柱图)栏中有3个选项:Allclusters:显示全部聚类结果的冰柱图。Specifiedrangeclusters:限制聚类解范围,在下面的Start(开始)、Stop(终止)、By(步长)的3个小框中分别输入3个正整数值m、n、k(m≤n,k≤n),表示从最小聚类解m开始,以增加量k为步长,到最大聚类解n为止。None:不输出冰柱图。⑥单击Method按钮,打开聚类方法选择对话框。⑦单击Save按钮打开保存新变量对话框,其中ClusterMemembership栏中三个选项与统计量对话框中的相应选项意义相同:None:不保存样品隶属类表,为系统默认选项。第21页,课件共52页,创作于2023年2月Singlesolution:选择此项并在右边的Cludters文本框中指定保存分类个数n(大于1的整数),则将保存各样品或变量隶属n类的隶属表。Rangeof

solutions:选择此项并在下边的From_though_clusters的两个小框中保存两个数m和n(2≤m<n),则将保存各样品或变量的分类数从m到n的所有(m-n类)分类的隶属表。第22页,课件共52页,创作于2023年2月㈡判别分析概念:事先已建立了分类,将新样品归为已知类别。方法:Analyze→Classify→Discriminant第23页,课件共52页,创作于2023年2月七、因子分析概念:观测数据指标太多,且众多变量间可能存在着相关性,实测数据包含的信息可能是重复的。因子分析法就是在尽可能不损失或少损失信息的情况下,将多个变量减少为少数几个潜在因子(datareduction降维)。7.1方法:例3根据江苏省主要城市1994年经济发展6个指标的数据建立的数据文件,其中x1:人均GDP(万元/人);x1:人均GDP(万元/人);x2:利用外资(亿美元);x3:公路密度(km/km2);x4:平均受教育年限(年);x5:乡镇工业比例(%);x6:人均固定资产净值(万元/人)。试利用这些资料对这些城市经济状况作因子分析。⑴Analyze→DataReduction→Factor。⑵从源变量表中移入若干作因子分析的变量。注:此时的分析变量(原变量)可以不标准化。第24页,课件共52页,创作于2023年2月⑶若需要用某参数的某部分样本值参与因子分析时,从源变量表中选此参变量移入SelectionVariable框中,单击右边的Value按钮,输入所要选择的那部分变量值。如果使用全部观测量,此步省略。⑷单击Descriptives,从中选择需要输出的统计量。①Statistics统计量子栏UnivariateDescriptives:单变量描述统计量。输出各变量的均值、标准差及样本数。Initialsolution:初始化解,为系统默认项。输出各分析变量的初始共同度、特征值及解释方差的百分比。②CorrelationMatrix(相关矩阵)子栏Coefficients:分析变量相关系数矩阵。第25页,课件共52页,创作于2023年2月Significancelevels:显著性水平。输出每个相关系数为0的单尾显著性水平。Determinant:相关系数矩阵的行列式值。KMOandBartlett’testofsphericity:KMO检验和Bartlett球形检验。前者给出抽样充足量的测度,检验变量间的偏相关系数是否过小。后者检验相关系数矩阵是否是单位矩阵,若是单位矩阵,则表明不适合采用因子模型。Inverse:相关系数矩阵的逆矩阵。Reporduced:再生相关系数矩阵。输出因子分析后的估计相关系数矩阵及残差(原始相关阵与再生相关系数矩阵的差)。Anti-image:反映像相关阵。包括偏相关系数的负数及偏协方差的负数,在一个好的因子模型中,反映像相关阵中,主对角线之外的元素应很小,主对角线上的元素用于测度抽样的充足量。第26页,课件共52页,创作于2023年2月⑸单击Extraction(提取),从中选择因子提取方法。①单击Method框箭头,展开下拉列表,从中选择公因子提取的方法。其中有:Principalcomponents:主成分分析法,系统默认。Unweightedleastsquares:不加权最小二乘法。Generalizedleastsquares:普通最小二乘法。Maximumlikelihood:极大似然法。Principalaxisfactoring:主轴因子法。Alphafactoring:α因子法。Imagefactoring:映像因子法。第27页,课件共52页,创作于2023年2月②Analyze(分析)子栏,用于选择分析内容。●Correlationmatrix:相关系数矩阵。此选项为系统默认。●Covariancematrix:协方差矩阵。⑹Display(显示)子栏,用于选择显示内容。●Unrotatedfactorsolution:显示未经旋转的因子解,即未经旋转的因子载荷矩阵、共同度以及特征值。此项为系统默认选项。●Screeplot:碎石图,它是与各因子关联的方差散点图,用它确定有多少因子应予以保留。图上有一个明显的分界点,它的左边陡峭的斜坡代表大因子,右边缓变的尾部代表其余的小因子(碎石)。第28页,课件共52页,创作于2023年2月⑺Extract(提取)子栏,用于选择提取公因子的数量。●Eigenvaluesover:选择此选项并在后面的矩形框中输入一数值(系统的默认值为1),凡特征值大于该数值的因子都将被作为公因子提取出来。●Numberoffactors:选择此选项在后面的矩形框中指定提取公因子的数量。⑻MaximumIterationsforConvergence:因子分析收敛的最大迭代步数,系统默认的最大迭代步数为25。⑼单击Rotation按钮,打开Rotation(旋转)对话框。从中选择旋转方法.①Method子栏。包括:●None:不进行旋转,是系统默认的选项。第29页,课件共52页,创作于2023年2月●Varimax:方差最大正交旋转。这种旋转方法使每个因子具有高载荷,以使因子的解释得到简化。●DirectOblimin:斜交旋转法。选择此项,在被激活的Delta(δ)小框中输入不超过0.8的数值。系统默认的δ值为0,表示因子分析的解最倾斜。δ值可取负值(≥-1),δ值越接近于-1,旋转越接近正交。●Quartimax:四分旋转法。是一种用最少的因子解释每个变量的旋转法。●Equamax:平均正交旋转法。它是将Varimax法和Quartimax法相结合,使高载荷因子的变量数和需解释变量的因子数都达到最小的旋转法。●Promax:斜交旋转法。它允许因子之间相关,比DirectOblimin法计算得更快,更适合第30页,课件共52页,创作于2023年2月大量数据的情况。选择此项,在被激活的Kappa(K)小框中输入控制斜交旋转的参数值,这个参数的默认值为4(此值最适合于分析)。②Display子栏,用于设置旋转解的输出。●Rotatedsolution:旋转解。当在Method栏中选择了一种旋转方法后,此选项才被激活。对正交旋转,输出‘旋转模型矩阵、因子转换矩阵。对斜交旋转,则输出模式、结构和因子相关矩阵。●Loadingplot(s):因子载荷图。选择此项,输出前两个公因子的二维载荷图,或前3个因子的三维载荷图,如果仅提取一个公因子,则不输出因子载荷图。当选择了一种旋转方法后,对话框中选项MaximumIterationsforConvergence(旋转收敛的最大迭代次数)被激活,允许在其后小框中指定最大迭代次数,系统默认值为25。第31页,课件共52页,创作于2023年2月⑽单击Scores按钮,打开FactorsScores(因子得分)对话框。●Saveasvariables:选择此选项时,对每个公共因子建立一个新变量(根据提取的公共因子的多少,默认的变量名为fac_i,i=1,2,…),将因子得分保存到当前工作文件中,供其他统计分析时使用。这时下方的Method子栏被激活,可以从中选择计算因子得分的方法。Regression:回归法。选择此项,则产生的因子得分的均值等于0,方差等于估计的因子得分与真实的因子值之间的复相关系数的平方。Bartlett:巴特列特法。选择此项,则产生的因子得分的均值等于0,变量范围之外的因子第32页,课件共52页,创作于2023年2月的平方和达到最小。Anderson-Rubin:安德森—鲁宾法。选择此项,则产生的因子得分的均值等于0,方差等于1。此方法是对Bartlett法的改进,它保证了被估计因子的正交性。对话框中还有一个选项:●Displayfactorscorecoefficientmatrix:显示因子得分系数矩阵,变量乘以该矩阵中的系数可获得因子得分,此矩阵也可以表示各因子得分之间的相关性。⑾单击Options按钮,打开Options对话框。

①MinssingValues子栏,用于设置缺失值的处理方式。●Excludecaseslistwise:剔除分析变量中的缺失值为系统默认选项。第33页,课件共52页,创作于2023年2月●Excludecasespairwise:成对地剔除含有缺失值的观测量。●Replacewithmean:用变量均值替代缺失值。②CoefficientDisplayFormat(系数显示格式)子栏,用于控制输出矩阵的外观。●Sortbysize:将因子载荷矩阵和结构矩阵按数值大小排序,使得对同一因子具有高载荷的变量在一起显示。●Suppressabsolutevalueslessthan:不显示那些绝对值小于指定数值的载荷系数,系统默认的指定值为0.1,也可以在小框内输入0~1之间的任意数值。上述各选项选择完毕,返回主对话框单击OK按钮运行。第34页,课件共52页,创作于2023年2月7.2结果分析方法例根据江苏省主要城市1994年经济发展若干指标的数据建立的数据文件(数据取自《数理统计与管理》1999年第1期),其中各变量的意义为x1:人均GDP(万元/人);x2:利用外资(亿美元);x3:公路密度(km/km2);x4:平均受教育年限(年);x5:乡镇工业比例(%);x6:人均固定资产净值(万元/人)。试利用这些资料对这些城市经济发展状况作因子分析。本例选项:⒈Description按钮①Coefficients(相关系数矩阵)第35页,课件共52页,创作于2023年2月②Significancelevels(显著性水平)③Determinant(相关系数矩阵的行列式值);⒉Extraction按钮(从中选择因子提取方法)①Screeplot(输出碎石图);⒊Rotation按钮:①Varimax(方差最大正交旋转)②Loadingplot(输出因子载荷图);⒋Scores按钮①Displayfactorscorecoefficientmatrix(显示因子得分系数矩阵)。第36页,课件共52页,创作于2023年2月本例因子分析输出结果共有8个表,2个图:⑴相关系数矩阵及显著性检验结果表。①CorrelationMatrix(相关系数矩阵)表1表1的上半部分为各变量之间的相关系数矩阵,下半部分为各变量不相关的单尾显著性水平,显著性检验矩阵中的空格表示0。由此表可以看出多数变量之间存在高度的相关关系,因此有必要进行因子分析。表下注释给出了相关系数矩阵的行列式值等于1.004E-5。②表Communalities(变量共同度)表2表2中给出了提取公共因子前后各变量的共同度,根据变量共同度的统计意义,它刻划了全部公共因子对于变量xi的总方差所作的贡献,它说明了全部公共因子反映出原变量信息的百分比。例如,第37页,课件共52页,创作于2023年2月提取公共因子后,变量x1的共同度为0.991,即提取的公共因子对变量x1的方差Var(x1)作出了99.1%的贡献。从Extraction一列的数值看出,各个变量的共同度都比较大,说明变量空间转化为因子空间时,保留了比较多的信息,因此,因子分析的效果是显著的。表下注释指出了提取公共因子的方法是主成分分析法。③总方差分解(或总方差解释)表3。表3为TotalVarianceExplained(总方差分解)表,表中包括:

Component:因子序号。

InitialEigenvalues:初始特征值。其中Total一列为相关系数矩阵的全部特征值;%ofVariance为各个特征值的方差贡献率;Cumulative%为累积贡献率,前两个因子的累积贡献率已达到88.821%。第38页,课件共52页,创作于2023年2月ComponentInitialEigenvaluesExtractionSumsofSquaredLoadings(未经旋转)RotationSumsofSquaredLoadings(旋转后)Total%OfVarianceCumulative%(方差贡献率)Total%OfVarianceCumulative%(方差贡献率)Total%OfVarianceCumulative%(方差贡献率)13.75862.63362.6333.75862.6362.6332.87247.87447.87421.57126.18888.8211.57126.18888.8212.45740.94788.82130.457.49796.31840.2063.42799.74550.013980.23399.97860.0013150.0219100表3TotalVarianceExplained(总方差分解)表ExtractionMethod:PrincipalComponentAnalysis(因子提取方法:主成分分析)第39页,课件共52页,创作于2023年2月●ExtractionSumsofSquaredLoadings:未经旋转提取因子的载荷平方和。由于相关系数矩阵有两个最大的特征值分别为3.758和1.571(据因子提取对话框的设定,提取特征值大于1的因子),提取两个公共因子。●RotationSurnsofSquaredLoadings:旋转后提取因子的载荷平方和.④碎石图,如图1所示。碎石图的纵坐标为特征值(Eigenvalue),横坐标为因子数(ComponentNumber),从图中可以看出前两个因子的特征值大(皆大于1),图中折线陡峭,从第三个因子以后,线平缓。因此,选择两个公共因子。第40页,课件共52页,创作于2023年2月图1碎石图⑤因子载荷矩阵如表4所示。由表4可知,提取了两个公共因子,如设F1和F2分别为第一、第二主因子,从而得出因子模型为:x1=0.985F1+0.144F2x2=0.714F1+0.519F2第41页,课件共52页,创作于2023年2月Component12X1人均GDP(万元/人)0.9850.144X2利用外资额(亿美元)0.7140.519X3公路密度(km/km20.608-0.691X4平均受教育年限(年)0.819-0.43X5乡镇工业比例(%)0.5260.772X6人均固定资产净值(万元)0.981-0.149ExtractionMethod:PrincipalComponentAnalysis.a2componentsextracted,表4ComponentMatrix(因子载荷矩阵)第42页,课件共52页,创作于2023年2月x3=0.608F1-0.691F2x4=0.819F1-0.43F2x5=0.526F1+0.772F2x6=0.981F1-0.149F2

从因子载荷矩阵和建立的因子模型看到,各因子的典型代表变量(除个别变量外)并不突出,不能对因子作出很好的解释。因此,对因子载荷矩阵施行旋转是非常必要的。注意,SPSS作因子分析时,将变量和各公共因子进行标准化处理,即因子模型中的变量x1~X6都是均值为0,方差为1的变量(即变量的Z得分),这里仍沿用原来的变量名。而在最初输入时的变量(原变量)可以不标准化,只是用因子模型计算时必需是标准化变量。⑥因子旋转后的因子载荷矩阵如表5所示。第43页,课件共52页,创作于2023年2月表5RotatedComponentMatrix(旋转后的因子载荷矩阵)

Component12X1人均GDP(万元/人)0.6680.738X2利用外资额(亿美元)0.220.854X3公路密度(km/km20.909-0.146X4平均受教育年限(年)0.9060.189X5乡镇工业比例(%)-0.085960.93X6人均固定资产净值(万元)0.8510.509

ExtractionMethod:PrincipalComponentAnalysis.

RotationMethod:VarimaxwithKaiserNormalization.

aRotationconvergedin3iterations.第44页,课件共52页,创作于2023年2月表5是对表4的因子载荷矩阵施行方差最大正交旋转后的结果,由此不难建立旋转后的因子模型。可以看出,第一主因子主要由变量x3、x4和x6决定,它们在主因子上的载荷分别为:0.909、0.906和0.851;第二主因子则主要由变量x1、x2和x5决定,它们在主因子上的载荷分别为:0.738,0.854和0.930。表下注释:提取公因子方法是主成分分析法;旋转方法为方差最大正交旋转法;旋转经3步迭代得到。⑦因子转换矩阵如表6所示。表6ComponentTransformationMatrix(因子转换矩阵)Component1210.77120.63620.6360.771第45页,课件共52页,创作于2023年2月旋转前的因子载荷矩阵乘以因子旋转矩阵等于旋转后的因子载荷矩阵。⑧因子载荷图如图2所示。由于本问题中提取了两个公因子,所以输出二维平面图。从因子载荷图上可以看到,旋转后在主因子为坐标轴的二维平面上原变量的位置。⑨因子得分系数矩阵如表7所示。因子模型将变量表示成公共因子的线性组合,自然也可以将公共因子表示成原始变量的线性组合。据选择计算因子得分的回归方法,即将公因子对变量X1~X6作线性回归,得到系数的最小二乘估计就是所谓的因子得分系数:

C=ATR-1其中矩阵A为旋转后的因子载荷矩阵,R-1为相关系数矩阵的逆矩阵。第46页,课件共52页,创作于2023年2月表7

ComponentScroreCoefficientMatrix(因子得分系数矩阵)Component12X1人均GDP(万元/人)0.1440.238X2利用外资额(亿美元)-0.0640.376X3公路密度(km/km20.405-0.236X4平均受教育年限(年)0.342-0.073X5乡镇工业比例(%)-0.2050.468X6人均固定资产净值(万元)0.2620.093ExtractionMethod:PrincipalComponentAnalysis.RotationMethod:VarimaxwithKaiserNormalization.ComponentScores.第47页,课件共52页,创作于2023年2月根据因子得分系数和原始变量的观测值可以计算出各个观测量的因子得分:

F=A’R-1X或者F1=0144X1-0.064X2+0.405X3+0.342X4-0.205X5+0.262X6F1=0.238X1+0.376X2-0.236X3-0.073X4+0.468X5+0.093X6

由于在Save对话框中选择了Saveasvariables选项,所以在工作文件中,保存了两个新变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论