




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、列联分析与对应分析 第八章列联分析与列联分析与对应分析对应分析列 联 分析二维列联表二维列联表例例8.1关于某项政策调查所得结果关于某项政策调查所得结果:table7.sav观点:不赞成观点:赞成合计男女231835475865合计4182123表表8.1列联表列联表前面就是一个所谓的二维前面就是一个所谓的二维列联表列联表(contingency table).列联表是由两个或两个以上的变量列联表是由两个或两个以上的变量进行交叉分类的频数分布表。进行交叉分类的频数分布表。这些变量中这些变量中每个都有两个或更多的每个都有两个或更多的可能取值可能取值。这些取值也称为这些取值也称为水平水平;比如观点
2、有两个水平,性别有两个比如观点有两个水平,性别有两个水平等。水平等。列联表列联表一般将横向变量的划分类别视为一般将横向变量的划分类别视为R R,纵,纵向变量的划分类别视为向变量的划分类别视为C,C,则可以将列则可以将列联表称为联表称为R RC C列联表。列联表。上上表即为表即为2 22 2列联表。列联表。在在SPSSSPSS数据中,收入的数据中,收入的“低低”、“中中”、“高高”用代码用代码1 1、2 2、3 3代表;代表;性别的性别的“女女”、“男男”用代码用代码0 0、1 1代代表;观点表;观点“赞成赞成”和和“不赞成不赞成”用用1 1、0 0代表。代表。列联表的分布列联表的分布列联表有两
3、个分布:列联表有两个分布:一个是一个是观察值的分布观察值的分布;一个是一个是期望值的分布期望值的分布;sex * opinion Crosstabulationopinion不赞成不赞成赞成赞成sex女18476565% within sex27.6972.31 100.00%100.00%男 Count23355858% within sex39.6660.34 100.00%100.00%TotalCount4182123123% within sex33.3366.67 100.00%100.00%观察值的分布观察值的分布事实上,事实上,表表8.28.2就是一个最简单的观察值就是一个最简
4、单的观察值的分布。的分布。观察值分布虽然反映了数据的分布,但观察值分布虽然反映了数据的分布,但因为基数不同,因为基数不同,不适合于进行对比不适合于进行对比。为了能在此相统的基数上比较,使列联为了能在此相统的基数上比较,使列联表中的数据提供更多的信息,表中的数据提供更多的信息,可以计算可以计算相应的百分比。相应的百分比。期望值的分布期望值的分布如果我们想进一步了解不同性别的人对如果我们想进一步了解不同性别的人对这项政策的观点是否存在着显著的差异,这项政策的观点是否存在着显著的差异,就要进行检验。就要进行检验。从逻辑上讲,如果男女性别的人对这项从逻辑上讲,如果男女性别的人对这项政策的看法相同,那么
5、男性不赞同方案政策的看法相同,那么男性不赞同方案的人应为:的人应为:5833.3%=19人人,女性不赞同,女性不赞同方案的人应为:方案的人应为:6533.3%=22人。人。这这19人和人和22人就是本例中的期望值,由人就是本例中的期望值,由此可以计算出期望值的分布。此可以计算出期望值的分布。期望值的分布期望值的分布 表表8.3 8.3 期望值分布表期望值分布表观点:不赞成观点:赞成合计男女5833.3%=196533.3%=2258 66.7%=3965 66.7%=435865合计4182对比分布表对比分布表表表8.4 8.4 观察值与期望值频数对比分布表观察值与期望值频数对比分布表观点:观
6、点:不赞成不赞成观点:观点:赞成赞成男:男:观察值观察值 期望值期望值女:女:观察值观察值 期望值期望值2319182235394743期望值的分布期望值的分布如果男女性别对该性政策的观点相同,如果男女性别对该性政策的观点相同,就应有:就应有:那么表那么表8.4中,观察值和期望值就应当非中,观察值和期望值就应当非常接近。常接近。对于这个假设的检验,可以采用对于这个假设的检验,可以采用 分布分布进行进行 检验。检验。女男PPH:022 分布与分布与 检验检验22用用f f0 0表示观察值频数,表示观察值频数,f fe e表示期望值表示期望值的频数,则的频数,则 统计量为:统计量为:2 统计量统计
7、量2eefff202)(由于由于 值的大小与观察值与期望值的配值的大小与观察值与期望值的配对数,即对数,即R RC C有关,所以,有关,所以, 统计量的统计量的分布与自由度有关。自由度分布与自由度有关。自由度=(R-1)(C-1)=(R-1)(C-1)22分布分布202468100.00.10.20.30.40.52(2)2(3)2(5)检验检验 检验可在交叉汇总分析中进行:检验可在交叉汇总分析中进行:SPSS选项:选项: AnalyzeDescriptive Statistics Crosstabs然后选择然后选择statistics,再选,再选 检验即可。检验即可。222C Ch hi i
8、- -S Sq qu ua ar re e T Te es st ts s1.974b1.1601.4721.2251.9751.160.183.1131.9581.162123Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 table
9、a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 19.33.b. 检验结果检验结果2检验检验实际上有不止一个实际上有不止一个X X2 2检验统计量。包括检验统计量。包括Pearson XPearson X2 2统计量统计量和和似然比似然比(likelihood ratiolikelihood ratio)X X2 2统计量统计量;它们它们都有渐近的都有渐近的X X2 2分布。分布。根据计算可以得到(对于这两个统计量根据计算可以得到(对于这两个统计量均有)均有)p p- -值大于值大于
10、0.050.05。2此外还有精确的统计量此外还有精确的统计量FisherFisher精确检精确检验验;它不是;它不是X X2 2分布,而是分布,而是超几何分布超几何分布。对本问题对本问题, ,计算计算FisherFisher统计量得到的统计量得到的p p- -值也值也大于大于0.050.05。聪明的同学必然会问,既然有精确检验聪明的同学必然会问,既然有精确检验为为什么还要用近似的什么还要用近似的X X2 2检验呢?检验呢?这是因为当数目很大时,超几何分布计算这是因为当数目很大时,超几何分布计算相当缓慢(比近似计算会差很多倍的时相当缓慢(比近似计算会差很多倍的时间);而且在计算机速度不快时,根本
11、无间);而且在计算机速度不快时,根本无法计算。因此人们多用大样本近似的法计算。因此人们多用大样本近似的X X2 2统计统计量。量。我们以上介绍的是列联表中一致性的检验,我们以上介绍的是列联表中一致性的检验,但是列联表分析中用的更多的是但是列联表分析中用的更多的是检验变量检验变量之间是否存在相关关系,即独立性检验。之间是否存在相关关系,即独立性检验。我们仍用我们仍用table7.sav的例子:的例子:观观 点点 * * 收收 入入 C Cr ro os ss st ta ab bu ul la at ti io on nCount715194145251282524031123不赞成赞成观点To
12、tal123收入TotalC Ch hi i- -S Sq qu ua ar re e T Te es st ts s20.456a2.00021.1902.00020.2901.000123Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)0 cells (.0%) have expected count less than 5. Theminimum expected count is 10.33.a. 观点与收入是否相关的检验观点与
13、收入是否相关的检验H H0 0:观点和收入这两个变量不相关观点和收入这两个变量不相关;H H1 1:这两个变量相关。这两个变量相关。列联表中的相关测量列联表中的相关测量利用检验对列联表中变量之间的相互关利用检验对列联表中变量之间的相互关系进行检验之后,系进行检验之后,如果认为拒绝原假设,如果认为拒绝原假设,变量之间存在联系,变量之间存在联系,那么,接下来的问题就是那么,接下来的问题就是它们之间的相它们之间的相关程度有多大?关程度有多大?列联表中的相关测量列联表中的相关测量SPSS中提供了多种相关检验的方法:中提供了多种相关检验的方法:定距变量与定距变量相关的检验定距变量与定距变量相关的检验名义
14、变量与名义变量相关的检验名义变量与名义变量相关的检验序次变量与序次变量相关的检验序次变量与序次变量相关的检验S Sy ym mm me et tr ri ic c M Me ea as su ur re es s.408.000.408.000.378.000-.641.101-4.935.000-.407.079-4.898.000c-.408.080-4.913.000c123PhiCramers VContingency CoefficientNominal byNominalGammaSpearman CorrelationOrdinal byOrdinalPearsons RInte
15、rval by IntervalN of Valid CasesValueAsymp.Std. ErroraApprox. TbApprox. Sig.Not assuming the null hypothesis.a. Using the asymptotic standard error assuming the null hypothesis.b. Based on normal approximation.c. X2分布的期望值准则分布的期望值准则利用利用X2分布进行检验时,要求样本容量必须分布进行检验时,要求样本容量必须足够大,特别是每个单元中的期望频数不足够大,特别是每个单元中的
16、期望频数不能过小,否则应用能过小,否则应用X2检验可能会得出错误的检验可能会得出错误的结论。结论。一项准则是:如果只有两个单元,每个单一项准则是:如果只有两个单元,每个单元的期望频数必须是元的期望频数必须是5或以上。或以上。另一准则是:如果有两个以上的单元,如另一准则是:如果有两个以上的单元,如果果20%的单元期望频数小于的单元期望频数小于5,则不能应用,则不能应用X2检验。检验。X2分布的期望值准则分布的期望值准则例如表例如表8.5中的数据可以计算,因为中的数据可以计算,因为6个单个单元中只有元中只有1个单元的期望频数小于个单元的期望频数小于5。类别f0feABCDEF28491869220
17、26472348825合计213213X2分布的期望值准则分布的期望值准则但是表但是表8.6中的数据不能应用检验。中的数据不能应用检验。类别f0feABCDEFG301108623554321138724241合计263263X2分布的期望值准则分布的期望值准则如果我们仔细观察会发现,表如果我们仔细观察会发现,表8.6中的中的f0与与fe非常接近,非常接近,最大的差别只是最大的差别只是3,应当说期望,应当说期望值与观察值拟合得很好值与观察值拟合得很好,它们之间,它们之间并无显并无显著差别。著差别。然而,用然而,用X2检验得到的结果检验得到的结果却是拒绝原假设,却是拒绝原假设,差异显著。差异显著
18、。解决的方法是:解决的方法是:将小单元合并,使得将小单元合并,使得fe大于大于5。对应分析行和列变量的相关问题行和列变量的相关问题在因子分析中,或者对指标(列中的变在因子分析中,或者对指标(列中的变量)进行分析,或者对样品(观测值或量)进行分析,或者对样品(观测值或行中的变量)进行分析。行中的变量)进行分析。另外,在处理实际问题中,样品的个数另外,在处理实际问题中,样品的个数远远大于指标个数。如有远远大于指标个数。如有100个样品,每个样品,每个样品测个样品测10个指标,要做样品的因子分个指标,要做样品的因子分析,就要计算(析,就要计算(100100)阶相似系数阵)阶相似系数阵的特征根和特征向
19、量,这对于计算机来的特征根和特征向量,这对于计算机来说也是一想耗时费力的事情。说也是一想耗时费力的事情。行和列变量的相关问题行和列变量的相关问题然而,在很多情况下,所关心的不然而,在很多情况下,所关心的不仅仅是行或列本身变量之间的关系,仅仅是行或列本身变量之间的关系,而是行变量和列变量的相互关系;而是行变量和列变量的相互关系;这就是因子分析等方法所没有说明这就是因子分析等方法所没有说明的了。先看一个例子。的了。先看一个例子。例例7.1数据文件:数据文件:ChMath.sav在研究读写汉字能力与数学的关系的研在研究读写汉字能力与数学的关系的研究时,人们取得了究时,人们取得了232232个美国亚裔
20、学生的个美国亚裔学生的数学成绩和汉字读写能力的数据。数学成绩和汉字读写能力的数据。关于汉字读写能力的变量有三个水平:关于汉字读写能力的变量有三个水平:“纯汉字纯汉字”可以完全自由使用纯汉可以完全自由使用纯汉字读写,字读写,“半汉字半汉字”读写中只有部分汉字读写中只有部分汉字(比如日文),(比如日文),“纯英文纯英文”只能够读写英文而不会只能够读写英文而不会汉字。汉字。而数学成绩有而数学成绩有4 4个水平(个水平(A A、B B、C C、D D)。)。 例例7.1数据文件:数据文件:ChMath.sav这项研究是为了考察汉字具有的抽这项研究是为了考察汉字具有的抽象图形符号的特性能否会促进儿童象图
21、形符号的特性能否会促进儿童空间和抽象思维能力。空间和抽象思维能力。该数据以列联表形式展示在表中:该数据以列联表形式展示在表中:人们可以对这个列联表进行前面所说的人们可以对这个列联表进行前面所说的X X2 2检验来考检验来考察行变量和列变量是否独立。结果在下面表察行变量和列变量是否独立。结果在下面表(通过(通过Analyze-Descriptive Statistics-Crosstabs)对应分析对应分析由于所有的检验都很显著,看来两个变由于所有的检验都很显著,看来两个变量的确不独立。量的确不独立。但是如何用象因子分析的载荷图那样的但是如何用象因子分析的载荷图那样的直观方法来展示这两个变量各个
22、水平之直观方法来展示这两个变量各个水平之间的关系呢?这就是本章要介绍的对应间的关系呢?这就是本章要介绍的对应分析(分析(correspondence analysiscorrespondence analysis)方法。)方法。对应分析是将指标型的因子分析与样品对应分析是将指标型的因子分析与样品型的因子分析结合起来进行的统计分析。型的因子分析结合起来进行的统计分析。对应分析对应分析它是从指标型因子分析出发,而直接获它是从指标型因子分析出发,而直接获得样品因子分析的结果。得样品因子分析的结果。概括起来,因子分析可以提供三方面的概括起来,因子分析可以提供三方面的信息:信息:指标之间的关系;指标之间
23、的关系;样品之间的关系;样品之间的关系;指标与样品之间的关系。指标与样品之间的关系。对应分析的基本思想对应分析的基本思想由于指标型的因子分析和样品型的因子由于指标型的因子分析和样品型的因子分析都是反映一个整体的不同侧面,以分析都是反映一个整体的不同侧面,以它们之间一定存在内在的联系。它们之间一定存在内在的联系。对应分析就是通过一个过渡矩阵对应分析就是通过一个过渡矩阵Z将两者将两者有机的结合起来:有机的结合起来:即:首先给出指标变量点的协差阵即:首先给出指标变量点的协差阵A=ZZ和样品点的协差阵和样品点的协差阵B=ZZ,由于两者有相,由于两者有相同的非零特征根,记为:同的非零特征根,记为:12m
24、如何得到过渡矩阵Z?设有n个样品,每个样品有p个指标,原始资料阵为:npnnppxxxxxxxxxX212222111211假定矩阵X的元素都0如何得到过渡矩阵Z?.2 .1 .21. 222221. 111211xxxxxxxxxxxxxxxxpnnpnnpp1p :iij.jijxxp且令如何得到过渡矩阵Z?1.2 .1 .21. 222221. 111211pnnpnnppppppppppppppppp如果我们将n个样品看成是p维空间的点,则其n个点的坐标用下面的形式表示:表示nippppppiipiiii, 1,.2.1称为n个样品点如何得到过渡矩阵Z?如果要对样品分类,就可以用样品点
25、的距离远近来刻划.若引入欧氏距离则任两个样品点K与L之间的欧氏距离为:2.2)(),(pjlljkkjppppLKD为了消除各变量的数量级不同,如第k各变量有较大的数量级,在计算距离时就会抬高这个变量的作用尺度差异的影响。如何得到过渡矩阵Z?所以再用系数 去乘距离公式就得到一个加权的距离公式。2.2.2)(/)(),(pjljljkjkjjpjlljkkjpppppppppppLKDjp./1如何得到过渡矩阵Z?也可以说上式是坐标为nipppppppppipipiiii, 1,.2 .2.1 .1的n个样品点群中两个样品点K与L之间的距离。如何得到过渡矩阵Z?类似,两个变量i与j之间的加权距离
26、为:21.2)(),(nkjkkjikkippppppjiD通过计算两两样品点或两两变量点之间的距离,可以对样品点或变量点进行分类,但是这样还不能用图表示出来。为了能直观地表现出变量点与样品点之间的关系,必须计算出变量点的协差阵和样品点的协差阵。如何得到过渡矩阵Z?为得到协差阵,必须先给出样品点中第j个变量的均值:jjjniijjiniijijppppppppp.1.1.1因此,可以写出样品空间中变量点的协差阵,即第i个变量与第j个变量的协差阵为:)(ijaA 如何得到过渡矩阵Z?naajaiajajajnaaiaiaiajajajnaaiaiaiajajajnaiaiaiijzzpppppp
27、pppppppppppppppppppppppa1.1.1.1.其中令令Z=(zZ=(zijij),), 则有则有: : A=ZZA=ZZ即变量点的协差阵可以表示成即变量点的协差阵可以表示成ZZZZ的形式的形式类似类似, ,可以得到样品点的协差阵可以得到样品点的协差阵: : B=ZZB=ZZA A与与B B两矩阵明显的存在这简单的对应关系两矩阵明显的存在这简单的对应关系, ,而且将原始数据而且将原始数据变换成变换成z zijij后后, , z zijij对于对于i,ji,j是对等的是对等的, ,即即z zijij对变量和样品具对变量和样品具有对等性有对等性. .而且而且A A与与B B的非零特
28、征根相同的非零特征根相同. .如果如果A的特征根的特征根 对应的特征向量为对应的特征向量为则则B的特征根的特征根 对应的特征向量就是对应的特征向量就是ZU.根据这个结论,可以很方便的借助指标根据这个结论,可以很方便的借助指标型因子分析而得到样品型因子分析的结型因子分析而得到样品型因子分析的结论。论。iiUi.ZZZU(ZU)(ZU) ZZ:ZUZUZ:,ZZU的特征向量是则得两边左乘则有的特征向量是因为对应分析的基本思想对应分析的基本思想如果对每组变量选择前两列因子载荷,如果对每组变量选择前两列因子载荷,那么两组变量就可以画出两个因子载荷那么两组变量就可以画出两个因子载荷的散点图。的散点图。由
29、于这两个图所表示的载荷可以配对,由于这两个图所表示的载荷可以配对,于是就可以把这两个因子载荷的两个散于是就可以把这两个因子载荷的两个散点图画到同一张图中,并以此来直观地点图画到同一张图中,并以此来直观地显示各行变量和各列变量之间的关系。显示各行变量和各列变量之间的关系。下面通过对下面通过对ChMath.sav数据的计算和结数据的计算和结果分析来介绍对应分析。果分析来介绍对应分析。首先看对应分析结果的一个主要首先看对应分析结果的一个主要SPSSSPSS展示,然后展示,然后再解释该图的来源和解释。再解释该图的来源和解释。运用纯汉字的点和最好的数学成绩运用纯汉字的点和最好的数学成绩A最接近,而不会汉
30、字最接近,而不会汉字只会英文的点与最差的数学成绩只会英文的点与最差的数学成绩F(或者(或者D,虽然在纵坐,虽然在纵坐标稍有差距)最接近,而用部分汉字的和数学成绩标稍有差距)最接近,而用部分汉字的和数学成绩B接近。接近。S Su um mm ma ar ry y.552.305.939.939.047.174.141.020.0611.000.065.32575.312.000a1.0001.000Dimension12TotalSingularValueInertiaChiSquareSig.AccountedforCumulativeProportion ofInertiaStandardD
31、eviation2CorrelationConfidenceSingular Value6 degrees of freedoma. 对应分析输出对应分析输出各维汇总表各维汇总表表中的术语表中的术语Singular Value奇异值(是惯量的平奇异值(是惯量的平方根),反映了是行与列各水平在二方根),反映了是行与列各水平在二维图中分量的相关程度,是对行与列维图中分量的相关程度,是对行与列进行因子分析产生的新的综合变量的进行因子分析产生的新的综合变量的典型相关系数。典型相关系数。Inertia惯量惯量, 实际上就是常说的特征实际上就是常说的特征根,表示的是每个维度对变量各个类根,表示的是每个维度
32、对变量各个类别之间差异的解释量。别之间差异的解释量。表中的术语表中的术语Chi Square就是关于列联表行列独立性就是关于列联表行列独立性x2检验的检验的x2统计量的值,和前面表中的相同。统计量的值,和前面表中的相同。其后面的其后面的Sig为在行列独立的零假设下的为在行列独立的零假设下的p-值,注释表明自由度为值,注释表明自由度为(4-1)(3-1)=6,Sig.值很小说明列联表的行与列之间有较强的值很小说明列联表的行与列之间有较强的相关性。相关性。Proportion of Inertia惯量比例,是各维惯量比例,是各维度(公因子)分别解释总惯量的比例及累度(公因子)分别解释总惯量的比例及
33、累计百分比,类似于因子分析中公因子解释计百分比,类似于因子分析中公因子解释能力的说明。能力的说明。 输出结果解释输出结果解释从该表可以看出,由于第一维的惯量比例占了从该表可以看出,由于第一维的惯量比例占了总比例的总比例的93.9%93.9%,因此,其他维的重要性可以,因此,其他维的重要性可以忽略(虽然画图时需要两维,但忽略(虽然画图时需要两维,但主要看第一维主要看第一维横坐标横坐标)。)。在对应分析中,每个变量的类别差异是通过直在对应分析中,每个变量的类别差异是通过直观图上的分值距离表现出来的,但这个距离并观图上的分值距离表现出来的,但这个距离并不是我们通常所说的距离,而是经过加权的距不是我们
34、通常所说的距离,而是经过加权的距离,在加权的过程中,以卡方值的差异表现。离,在加权的过程中,以卡方值的差异表现。行变量的有关内容行变量的有关内容O Ov ve er rv vi ie ew w R Ro ow w P Po oi in nt ts sa a.349-.897 -.240.158.509.142.982.0181.000.366.102.491.015.007.627.144.8561.000.284.970 -.338.152.485.231.970.0301.0001.00.3251.01.000汉字使用纯汉字半汉字纯英文Active TotalMass12Score inD
35、imensionInertia12Of Point toInertia ofDimension12TotalOf Dimension toInertia of PointContributionSymmetrical normalizationa. 行变量的有关内容行变量的有关内容第一部分是关于行变量每一类别在两个维度第一部分是关于行变量每一类别在两个维度上的分值情况,实际上就是每一类别在坐标上的分值情况,实际上就是每一类别在坐标途中的坐标,途中的坐标, MassMass为行与列的边缘概率为行与列的边缘概率 。第二部分(第二部分(Contribution of Point to Inertia
36、 of Dimention)是说明行变量各个类别对每)是说明行变量各个类别对每一维度特征值的影响,数值越大的类别,说一维度特征值的影响,数值越大的类别,说明它对类别间差异的影响越大。明它对类别间差异的影响越大。第三部分(第三部分(Contribution of Dimention to Inertia of Point)是说明每一维度对行变量)是说明每一维度对行变量各个类别特征值的影响。各个类别特征值的影响。 O Ov ve er rv vi ie ew w C Co ol lu um mn n P Po oi in nt ts sa a.341 -.693-.3.096.296.288 .9
37、40 .0601.000.319 -.340 .438.029.067.433 .703 .2971.000.207.928 .203.100.323.061 .988 .0121.000.134 1.140-.5.100.315.218 .957 .0431.0001.000.325 1.0001.000数学成绩数学A数学B数学C数学FActive TotalMass12Score inDimensionInertia12Of Point toInertia ofDimension12TotalOf Dimension toInertia of PointContributionSymmet
38、rical normalizationa. 列变量的有关内容列变量的有关内容 Row Points for 汉字使用Symmetrical NormalizationDimension 11.0.50.0-.5-1.0Dimension 2.6.4.20.0-.2-.4纯英文半汉字纯汉字Column Points for 数学成绩Symmetrical NormalizationDimension 11.51.0.50.0-.5-1.0Dimension 2.6.4.2-.0-.2-.4-.6数学F数学C数学B数学ARow and Column PointsSymmetrical Normal
39、izationDimension 11.51.0.50.0-.5-1.0Dimension 2.6.4.2-.0-.2-.4-.6数学成绩汉字使用数学F数学C数学B数学A纯英文半汉字纯汉字对应分析的对应分析的SPSSSPSS实现实现首先对数据进行加权首先对数据进行加权SPSS选项:选项:AnalyzeData ReductionCorrespondence Analysis然后把然后把“汉字使用汉字使用”选入选入RowRow(行),再点击(行),再点击Define RangeDefine Range来定义其范围为来定义其范围为1(Minimum 1(Minimum value)value)到到
40、3(Maximum value)3(Maximum value),之后点击,之后点击UpdateUpdate。类似地,点击类似地,点击ContinueContinue之后,把之后,把“数学成绩数学成绩”选入选入Column (Column (列列) ),并以同样方式定义其范围,并以同样方式定义其范围为为1 1到到4 4。由于其他选项可以用默认值,就可以直接点击由于其他选项可以用默认值,就可以直接点击OKOK来运行了。这样就得到上述表格和点图。来运行了。这样就得到上述表格和点图。 例例7.2 7.2 数据文件:数据文件:收入等级与消费支出收入等级与消费支出.sav.sav 众所周知,收入水平不同
41、,消费支出的众所周知,收入水平不同,消费支出的结构也会不同。结构也会不同。现将收入等级分为:现将收入等级分为:困难户、最低收入困难户、最低收入户、低收入户、中等偏下户、中等收入户、低收入户、中等偏下户、中等收入户、中等偏上户、高收入户、最高收入户、中等偏上户、高收入户、最高收入户。户。将消费支出分为:食品、衣着、家庭设将消费支出分为:食品、衣着、家庭设备、医疗、交通通讯、文娱、居住、杂备、医疗、交通通讯、文娱、居住、杂项。项。SpssSpss对应分析结果对应分析结果S Su um mm ma ar ry y.170.029.962.962.005.086.031.001.031.993.005
42、.012.000.005.998.006.000.001.999.005.000.0011.000.003.000.0001.000.000.000.0001.000.0301241.0.000a1.0001.000Dimension1234567TotalSingularValueInertiaChiSquareSig.AccountedforCumulativeProportion ofInertiaStandardDeviation2CorrelationConfidenceSingular Value49 degrees of freedoma. 分析结果解释分析结果解释由汇总表中可知
43、,第一维惯量所占比例由汇总表中可知,第一维惯量所占比例达到达到96.2%96.2%,前两维惯量的累积比例为,前两维惯量的累积比例为99.3%99.3%,说明前两维惯量能很充分地代表,说明前两维惯量能很充分地代表数据的信息。数据的信息。而且由于第一维所占比例很高,所以第而且由于第一维所占比例很高,所以第一维的横坐标表现了绝大部分的差异,一维的横坐标表现了绝大部分的差异,而纵坐标则可以忽略。而纵坐标则可以忽略。 行变量的有关内容行变量的有关内容O Ov ve er rv vi ie ew w R Ro ow w P Po oi in nt ts sa a.376-.418.031.011.387.
44、012.998.001.999.099.241-.4.001.034.444.695.298.993.085.808.275.010.329.212.979.020.999.064.065-.1.000.002.006.607.079.686.086.409-.1.003.085.011.977.004.982.130.067-.2.000.003.099.370.350.721.105-.188.242.001.022.201.753.225.978.055.655.091.004.139.015.992.003.9951.00.0301.0001.000消费项目食品衣着家庭设备医疗交通通讯
45、文化娱乐居住杂项ActiveTotalMass12Score inDimensionInertia12Of Point toInertia ofDimension12TotalOf Dimension toInertia of PointContributionSymmetrical normalizationa. 行变量的有关内容行变量的有关内容由行变量有关内容可知:在第一维度上由行变量有关内容可知:在第一维度上食品、家庭设备和杂项的差异影响最大,食品、家庭设备和杂项的差异影响最大,而且从坐标上的分值来看来,食品与家而且从坐标上的分值来看来,食品与家庭设备和杂项处于两个不同的方向。说庭设备和
46、杂项处于两个不同的方向。说明在消费上食品与家庭设备和杂项的差明在消费上食品与家庭设备和杂项的差异最大。异最大。第一维度解释了大部分的消费项目的差第一维度解释了大部分的消费项目的差异,只有衣着、文化娱乐和居住的差异异,只有衣着、文化娱乐和居住的差异主要由第二维度解释。主要由第二维度解释。行变量的有关内容行变量的有关内容从表中的最后一列可知,这两个维度对从表中的最后一列可知,这两个维度对每项消费水平的解释程度。每项消费水平的解释程度。其中:食品、衣着、家庭设备、交通通其中:食品、衣着、家庭设备、交通通讯、杂项的差异解释程度已高达讯、杂项的差异解释程度已高达99%以以上;居住差异的解释程度也达到了上;居住差异的解释程度也达到了97.8%;而解释程度较差的是医疗和文化娱乐,而解释程度较差的是医疗和文化娱乐,只有只有70%左右,说明居民在这两项消费左右,说明居民在这两项消费的差异没有完全体现的差异没有完全体现。Row Points
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 邵阳市重点中学2024-2025学年初三5月毕业班模拟考试数学试题含解析
- 江苏省盐城市响水实验、一中学2025届初三下学期零诊模拟生物试题含解析
- 廊坊卫生职业学院《成衣制作工艺》2023-2024学年第二学期期末试卷
- 江西师范大学科学技术学院《prote软件设计》2023-2024学年第二学期期末试卷
- 延寿县2025届数学四年级第二学期期末质量检测模拟试题含解析
- 天府新区航空旅游职业学院《欧美设计规范释义一双语》2023-2024学年第二学期期末试卷
- 天津石油职业技术学院《珠宝专业英语》2023-2024学年第二学期期末试卷
- 塔里木职业技术学院《测井资料解释课程设计》2023-2024学年第一学期期末试卷
- 辽宁税务高等专科学校《影像诊断学》2023-2024学年第二学期期末试卷
- 文山壮族苗族自治州马关县2024-2025学年数学三下期末综合测试模拟试题含解析
- 美国学生阅读技能训练
- 网络安全服务项目服务质量保障措施(实施方案)
- 生产加工型小微企业安全管理考试(含答案)
- 青少年科技创新比赛深度分析
- 世界近代武器革新图鉴(1722-1900)英国篇
- 安标受控件采购管理制度
- 亚低温的治疗与护理
- 危险化学品企业设备完整性 第2部分 技术实施指南 编制说明
- 防高坠自查自纠台账
- GB/T 4437.1-2023铝及铝合金热挤压管第1部分:无缝圆管
- 市政工程消耗量定额 zya1-31-2015
评论
0/150
提交评论