版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元统计分析中的降维方法在四川省社会福利中的应用由于计算机的发展和日益广泛的使用,多元分析方法也很快地应用到社会学、农业、医学、经济学、地质、气象等各个领域。在国外,从自然科学到社会科学的许多方面,都已证实了多元分析方法是一种很有用的数据处理方法;在我国,多元分析对于农业、气象、国家标准和误差分析等许多方面的研究工作都取得了很大的成绩,引起了广泛的注意。在许多领域的研究中,为了全面系统地分析问题,对研究对象进行综合评价,我们常常需要考虑衡量问题的多个指标(即变量),由于变量之间可能存在着相关性,如果采用一元统计方法,把多个变量分开,一次分析一个变量,就会丢失大量的信息,研究结果也会偏差很大。因
2、此需要采用多元统计分析的方法,同时对所有变量的观测数据进行分析。多元统计分析就是一种同时研究多个变量之间的相互关系,经过对变量的综合处理,充分提取变量之间的信息,进行综合分析和评价的统计方法。多元统计分析法主要包括降维、分类、回归及其他统计思想。一多元统计分析方法中降维的方法1.概述多元统计分析方法是同时对多个变量的观察数据做综合处理和分析。在不损失有价值信息的情况下,简化观测数据或数据结构,尽可能简单地将被研究对象描述出来,使得对复杂现象的解释变得更容易些。同时,采用多元统计分析中的聚类分析或判别分析可以对变量或样品进行分类与分组。根据所测量的特征和分类规则将一些“类似的”对象或变量分组。多
3、元统计分析也可以研究变量间依赖性。即对变量间关系的本质进行研究。是否所有的变量都相互独立?还是一个变量或多个变量依赖于其他变量?它们又是怎样依赖的?通过观测变量数据的散点图,我们可以建立多元回归统计模型,确定出变量之间具体的依赖关系,进而可以根据某些变量的观测值预测另一个或另一些变量的值对事物现象的发展作预测。最后我们需要构造假设,并对所建立的以多元总体参数形式陈述的多种特殊统计假设进行检验。在多元统计分析方法中数据简化或结构简化,实质上就是数学中的降维方法。多元统计分析中的降维方法主要包括聚类分析、判别分析、主成分分析、因子分析、对应分析和典型相关分析等几种方法。其中主成分分析和因子分析是在
4、作综合评价方面应用最广泛、较为有效的方法。本文主要介绍这两种多元统计分析方法的应用。2主成分分析2.1主成分分析的基本思想在大部分实际问题中,需要考察的变量多,变量之间是有一定的相关性的,主成分分析就是以损失很少部分信息为代价,保留绝大部分信息的前提下,将原来众多具有一定线性相关性的p个指标压缩成少数几个互不相关的综合指标(主成分),并通过原来变量的少数几个的线性组合来给出各个主成分的具有实际背景和意义的解释。由于主成分分析浓缩了众多指标的信息,降低了指标的维度,从而简化指标的结构,深刻反映问题的内在规律。主成分分析的数学模型设对某一事物的研究涉及指标(变量):X,X,X,这p项指标构成p维1
5、2P的随机向量X=(X,X,12,xy,其均值和协方差矩阵分别是的随机向量X=(X,X,12对X对X进行线性变换,X的线性组合可以形成新的综合P变量,用Y表示,满足:=uX+变量,用Y表示,满足:=uX+uX+1111122=uX+uX+2211222+u.X.1pp+uX2ppp11p2矩阵表示为:Y=UX,其中Y=(Y,Y,Y),U= HYPERLINK l bookmark412puu1112由于不同的线性变换得到的综合变量u由于不同的线性变换得到的综合变量u丿Y的统计特性不同,为了达到较好的效果,我们希望Y=uX的方差尽可能大且新的综合变量Y之间相互独立。由以下ii原则来确定新的综合变
6、量Y:i(1)uu=u2+u2+iii1i2(2(1)uu=u2+u2+iii1i2(2)Y与Y相互独立,ijip即无重复信息cov(Y,Y)=0(ij;i,j=1,2,p);lj(3)Y是X,X,X白的一切戋性组合(系数满足上述方程组)中方差最大的TOC o 1-5 h z112P是与Y不相关的X,X,X的一切线性组合中方差最大的,Y与112PpY,Y,Y都不相关的X,X,X的一切线性组合中方差最大的。12p-112P在实际应用时,通常勃匕选前几个方差比较大的主成分,虽然这样做会丢失一部分信息,但它使我们抓住了主要矛盾进行深入分析,并从原始数据中进一步提出了某些新的的信息,因而在某些实际i矗
7、的研究中得益比较大,这种既减少了变量的个数又抓住了主要矛盾的做法有利于问题的分析和处理。2.3总体主成分的导出及性质在实际求解主成分时,常常是从原始变量的协方差矩阵或相关矩阵的结构出发,而从两个出发点求解出的主成分不同。从协方差矩阵出发求解主成分性质1:设矩阵A,=A,将A的特征值”,”,,”依大小顺序排列,不妨设12nX,,为矩阵A各特征值对应的标准正交特征向量,则对TOC o 1-5 h z12n12pxAx.xAx彳士意冋里x有max,minrxX1x圭0 xxnx0I性质2:设随机向量X(X,X,X)的协方差矩阵为S,九为12p12pS的特征值,,,,为矩阵E各特征值对应的标准正交向量
8、,则第i个主成12p分为:Y,X+,X+,X(i1,2,p),此时var(Y),Y,=,i1i12i2pipzillcov(Y,Y)=,E,0。i/ii由以上性质,我们把原始变量X(X,X,X)的协方差矩阵E的非零特 HYPERLINK l bookmark5012p征值0对应的标准化特征向量,分别作为系数向量,12p12p,X)的第一主成p即Y,X,Y,X,Y,X分别为X,X)的第一主成p1122pp分、第二主成分,第p主成分的充要条件是:1)Y1)YuX,uuI,即u为p阶正交阵;2)3)于是随机向量X(X,X,X2)3)于是随机向量X(X,X,X)与随机向量Y(Y,12u1u2Y)之间存
9、在关p系式:YuXWpuu11122122uup1p2X)X)111X2=f2X2Xf1lbX丿Vp丿h丿p丿upup由于在无论:的裤征值是否存在相等的情况,对应的标准化特征向量“,丫,,总是存在,所以总是可以找到对应的各特彳征直的相互正交的特征向12pY的分量Y,Y,Y之间相互独立;12pYY的p个分量Y,Y,Y方差依次递减。12p量。故将主成分的求解转换为求解原始变量(X,X,X)的协方差阵:的12p特征值和特征向量。性质3:第k个主成分Y的方差贡献率为吕(k1,2*,p,反映主成kkii=1分Y提取原始变量总信息的百分比。k迓性质4:主成分Y,Y,Y的累积贡献率为a(k),(kp),反映
10、TOC o 1-5 h z12k另ii,1主成分Y,Y,Y解释原始变量彳信息的百分比。12k性质5:Y,rX+rX+rX,其中Yr2,1,称r为主成分Y在原始iii12i2pipjijii变量X上的载荷。它度量了X对Y的重要程度。性质6:第i个主成分Y与原始变量X的相关系数p(Y,X)称为因子负荷量,ij则原始变量进行标准化变换为:Z则原始变量进行标准化变换为:Z,(B2)-1(X-卩)表示主成分Y中包含原始变量X信息的百分比,它与载荷r成正比。ijji从相关矩阵出发求解主成分为了消除原始变量不同量纲与数量级的影响,对原始变量作标准化变换:i,1,2,p,其中卩,o分别表示变量X的期望和方差。
11、iii显然有cov(Z),(Bt)-显然有cov(Z),(Bt)-1S(B2)-1=P12P121PXX0,其相应的特征向量记为,,则相对于Y12p12picov(Y,Y)二cov(X,X)二0ijijcov(Y,Y)二cov(X,X)二0ijij,Y彼此不相关,并且Y的方piiii由此可有新的综合变量(主成分)Y,Y,12差为,则Y=X,Y=X,Y=X分别为X二(X,X,X)的i1122pp12p第一主成分、第二主成分,第p主成分。主成分的方差贡献就等于R的相应特征值。利用样本数据求解主成分的过程就转化为求解相关阵R或协方差阵S的特征值和特征向量的过程。2.5主成分分析的步骤2.5.1将原始
12、变量进行标准化处理Z2.5.1将原始变量进行标准化处理Z二i计算标准化指标的相关系数矩阵R2.5.3求解相关系数矩阵R的特征向量u二(u)和特征值0;jpxp12p2.5.4计算各个主成分的方差贡献率a及累积贡献率a(k);k2.5.5确定主成分的个数;通常根据实际问题的需要由累计贡献率a(k)85%的前k个成分来代替原来p个变量的信息,或选取所有特征值大于1的成分作为主成分,也可根据特征值的变化来确定,即根据SPSS输出的碎石图的转折点来决定选取主成分的个数。对确定出的主成分作出实际意义的解释;利用所确定出的主成分的方差贡献率计算综合评价值,从而对被评价对象进行排名和比较。综合得分=工(各主
13、成分得分x各主成分所对应的方差贡献率)3因子分析因子分析的基本思想因子分析是根据相关性大小把原始变量进行分组,使得同组内的变量之间相关性高,而不同组的变量之间的相关性低。每组变量代表一个基本结构(即公共因子),并用一个不可观测的综合变量来表示。对于所研究的某一具体问题,原始变量分解为两部分之和。一部分是少数几个不可观测的公共因子的线性函数,另一部分是与公共因子无关的特殊因子。因子分析的数学模型设有p个指标,则因子分析数学模型为:+rY1pp+rY2pp,+rY1pp+rY2ppTOC o 1-5 h z1111122XrY+rY+2211222XrY+rY+rYIpp11p22.p.其中,X,
14、X,X是已标准化的可观测的评价指标。F,F,F出现在每个指12p12k标X的表达式中,称为公共因子,公共因子是不可观测的,其含义要根据具体i问题来解释。是各个对应指标X所特有的因子,故称为特殊因子,它与公共ii因子之间彼此独立。r是指标X在公共因子F上的系数,称为因子载荷,因子ijijij载荷r的统计含义是指标X在公共因子F上的相关系数,表示X与F线性相关ijij程度。用矩阵形式表示为XAF+其中X(X,X,2其中X(X,X,2A(r11r21r12r22,X),pr)1m,F),(j2,A称为因子载荷矩阵。rp1rp2A中的第A中的第i行元素r,r,i1i2,r说明了指标X依赖于各个公共因子
15、的程度。imi,r说明了公共因子F与各个指标的联系程度。故常mJjA中第,r说明了公共因子F与各个指标的联系程度。故常mJj1j2j根据该列绝对值较大的因子载荷所对应的指标来解释这个公共因子的实际意义。A中的第i行元素r,r,r的平方和h2=2称为指标X的共同度。TOC o 1-5 h zi1i2imijij1A中第j列元素r,r,r的平方和g2二另r2表示公共因子F对原始指1j2jm/jjji1标所提供的方差贡献的总和,衡量各个公共因子的相对重要性。称八冬丄乙的方差贡献率,a越大,公共因子F越重要。jppijjjji=1因子分析的步骤3.3.1将原始变量数据进行标准化处理Z=邑M;i厅II3
16、.2.2计算标准化指标的相关系数矩阵R;3.2.3求解相关系数矩阵R的特征向量u=(u)和特征值XX0;jpp12p3.2.4确定公共因子的个数,设为m个,即选择特征值1的个数m或根据累积方差贡献率85%的准则所确定的个数m为公共因子个数;3.2.5求解初始因子载荷矩阵A=(a)=(u);jppjpxp常用的方法有:主成分法、主轴因子法、极大似然法等。本文用主成分法寻找公因子的方法如下:设从相关矩阵出发求解主成分,设有p个变量,则可以找出p个主成分,将所得的p个主成分由大到小排列,记为Y,Y,Y,则主成分与原始变量TOC o 1-5 h z12p之间有Y1Y11111221pp HYPERLI
17、NK l bookmark0=rX+rX+rX22112222ppY=rX+rX+*X*p11其中r是随机变量X的相关矩阵的特征值所对应的特征向量的分量,特征向量之ij间正交,从X到Y的转换关系的可逆得到由Y到X的转换关系X=rY+rY+rY11111221ppX=rY+rY+rYV22112222ppX=rY+rY+*+*Ypp11p22磴p只保留前m个主成分,而把后面的p,m个主成分用特殊因子代替,即i+rY+1mm1+rY+rY+1mm1+rY+2mm21111122X=rY+rY+V2211222X=rY+rY+Y啤pp11p22.pmm.p为了把Y转化为合适的公因子,需要把主成分Y亲
18、为方差为1的变量,故aijaijX=aF,aF,aF+1111221mm1X=aF,aF,aF+2112222mm2X=aF,aF+上F+pp11p22.mm.p设样本相关系数矩阵R的特征值为X0,其相应的标准正交特征向量为丫,丫,丫,设mp,则因子载荷矩阵A的一个估计值为:12pA=A=(Y1斤2込,YmT=u1mu2mupm,a2。im共同度的估计为:h=a2,a2。imii13.2.6建立因子模型=aF+a,=1,2,ijjiij=1其中F,F,F为公共因子,=(&,&,&)为特殊因子。12k12p先要对A作3.2.7对公共因子进行重新命名,并解释公共因子的实际含义当初始因子载荷矩阵先要
19、对A作2.8对初始因子载荷矩阵进行旋转由于因子载荷矩阵不唯一,旋转变换可以是使初始因子载荷矩阵的每列或每行的元素的平方值趋于0或1,从而使得因子载荷矩阵结构简化,关系明确。如果初始因子之间不相关,公共因子F的解释能力能够用其因子载荷平方的方差来j度量时,则可采用方差极大正交旋转法;如果初始因子之间相关,则需要进行斜交旋转,通过旋转后,得到比较理想的新的因子载荷矩阵A=(r“)。1ijpk3.2.9将公共因子变为变量的线性组合,得到因子得分函数Z=”Z+”Z+”Z,i=1,2,m-i-ijjilli22ippj=1系数”=B系数”=B“A“Ri,1估计值为F,iZ,均为标准化的原始变量和公共因子
20、。因子得分函数的(bb,rx,111p1、bmlbmp丿Xv“丿F=AR-iX二1其中A为因子载荷矩阵,为原始变量的相关矩阵,为原始变量向量。13.2.10求综合评价值,即总因子得分古计值为八八Z二ZFiii=1其中i其中iiZj=1时第i个公共因子F的归一化权重。即:i综合得分=工(各因子得分X各因子所对应的方差贡献率)工综合得分=2.11根据总因子得分估计值为就可以对每个被评价的对象进行排名,从而进行比较。4主成分分析与因子分析的联系和区别区别侧重点不同;主成分分析是通过变量的线性变换,忽略方差较小的主成分,提取前面几个方差较大的主成分来解释总体大部分的信息;而因子分析是忽略特殊因子8=(
21、8,8,8),而重视少数不可观测的公共因子F,F,F所代表的总体信12p12k息。1.2数学模型不同;主成分分析中的主成分是原始变量的线性组合:Y=UX,其中U为系数矩阵,即Y=丫丫X(i,j=1,2,p)其中丫是相关矩阵的特征值所对应的特征向Zijjjj=1量矩阵中的元素,Xj表示原始变量的标准化数据;而因子分析中的共同因子是将原始变量分解成公共因子和特殊因子两部分,X=AF+8,其中A为因子载荷矩阵,即:X=ZaF+8(i=1,2,p,mp),m是公共因子的个数,p是原iijjij=1始变量的个数,a是因子分析过程中的初始因子载荷矩阵中的元素,F是第个公共因子,8是第个原始变量的特殊因子。
22、i4.1.3主成分的各系数丫是唯一确定的、正交的,不可以对系数矩阵进行任何的旋转,且系数大小并不代表原变量与主成分的相关程度;而因子模型的系数矩阵是不唯一的、可以进行旋转的,且该矩阵表明了原变量和公共因子的相关程度。4.1.4因子旋转;主成分分析,可以通过可观测的原变量X直接求得主成分Y,并具有可逆性;因子分析中的载荷矩阵是不可逆的。只能通过可观测的原变量去估计不可观测的公共因子,即公共因子得分的估计值等于因子得分系数矩阵与原观测变量标准化后的矩阵相乘的结果。还有,主成分分析不可以像因子分析那样进行因子旋转处理。4.1.5综合排名;主成分分析一般依据第一主成分的得分排名,若第一主成分不能完全代
23、替原始变量,则需要继续选择第二个主成分、第三个等等,主成分得分是将原始变量的标准化值,代入主成分表达式中计算得到;而因子分析中因子得分是将原始变量的标准化值,代入因子得分函数中计算得到。4.2联系因子分析是主成分分析的扩展,两种方法的出发点都是变量的相关系数矩阵,都是在损失较少的信息的前提下,把多个存在较强相关性的变量综合成少数几个综合变量,这几个综合变量之间相互独立,能代表总体绝大多数的信息,从而进行深入研究总体的多元统计方法。由于上文提到主成分可表示为原观测变量的线性组合,其系数为原始变量相关矩阵的特征值所对应的特征向量,且这些特征向量正交,因此,从X到Y的转换关系是可逆的,便得到如下的关
24、系:X=,Y,X=,aF是因子分析中iijjiijjj=1j=1未进行因子载荷旋转时建立的模型,故如果不进行因子载荷旋转,许多应用者将容易把此时的因子分析理解成主成分分析,这显然是不正确的。然而此时的主成分的系数阵即特征向量与因子载荷矩阵确实存在如下关系:=丄。5主成分分析和因子分析的实例分析本文利用SPSS软件对2006年四川省18个主要城市的社会福利发展情况进行主成分分析、因子分析方法及二者分析结果的比较。(除阿坝藏族羌族自治州、甘孜藏族自治州、凉山彝族自治州)针对所研究的问题,根据指标选择的针对性、可操作性、全面性等原则,选取了以下反映各城市社会福利发展水平的15项指标:城市低保资金(万
25、元)、农村低保资金(万元)、最低生活保障家庭数(户)、最低生活保障人数、养老保险征缴率()、失业保险征缴率()、医疗保险征缴率()、工伤保险征缴率()、生育保险征缴率()、基本养老保险参保人数(人)、基本医疗保险参保人数(人)、失业保险参保人数(人)、社会福利院数(个)、社会福利院床位数(个)社区服务设施数(个)分别记为原始指标变量X,X,X。数据来1215源于2007年四川省统计年鉴。原始数据见附录表1表5。1原始指标数据处理由于各个指标都是正向指标,无需对指标的符号做处理。为了消除指标量纲和数量级的影响,对原始指标数据做了标准化处理。标准化后的数据见附录表6。5.2运用SPSS软件进行分析
26、本文从相关矩阵出发,采用主成分分析方法来提取公共因子,并根据来确定因子个数。指标变量之间的相关性的分析结果和分析指标变量的相关系数矩阵见附录表7。由SPSS因子分析的输出结果可知:表8KMOandBartlettsTestKaiser-Meyer-OIkinMeasureofSamplingAdequacy.647BartlettsTestofSphericityApprox.Chi-Square299.916df105Sig.000KMO统计量是0.647,且Bartletts球面检验值为299.916,卡方统计量的显著性水平为0.0000.01,都说明各个指标之间存在着较高的相关性,即说明
27、所选取的15个指标适合作因子分析。因子分析的初始结果表9CommunalitiesInitialExtraction城低保金1.000.942乡低保金1.000.926低保家数1.000.969低保人数1.000.973养老保率1.000.859失业保率1.000.910医疗保率1.000.896工伤保率1.000.940生育保率1.000.916养老保数1.000.947医疗保数1.000.964失业保数1.000.956福利院数1.000.796福利床位1.000.928服务设施1.000.816ExtractionMethod:PrincipalComponentAnalysis.表9中
28、第一列为15个原始指标名,第二列为根据因子分析的初始解计算出来的变量共同度,反映了5个因子提取每个原始指标变量信息的百分比。如:这5个因子提取指标城市最低保障资金信息的0.942。因子分析的因子提取和旋转结果及碎石图:表10TotalVarianceExplainedComponenExtractionSumsofSquaredRotationSumsofSquaredtInitialEigenvaluesLoadingsLoadings%ofVarianeeCumula%ofVarianeeCumulative%Total1234561234567891011121314156.71944.
29、79344.7932.94619.63864.4311.66311.08875.5191.3889.25284.7711.0236.81791.588.4342.89094.478.3032.01896.497.2521.681198.989.074.49499.483.039.26399.745.016.10899.853.013.08899.942.005.03599.976.004.024100.00Total%ofVarianee6.71944.7932.94619.6381.66311.0881.3889.2521.0236.817Cumulative%Total44.7935.37
30、264.4313.62275.5192.01384.7711.50391.5881.227Varianceve%35.81535.81524.14759.96213.42173.38310.02383.4058.18391.588%ofCumulatiExtraetionMethod:PrineipalComponentAnalysis.根据特征值大于1的原则,提取了5个公共因子(主成分),它们的累积方差贡献率为91.588,说明这5个公因子(主成分)提取了原始指标数据91.588的信息,可以用这5个公因子(主成分)来代表四川省18个城市的社会福利发展状况。图1ScreePloteulavne
31、giComponentNumbereulavnegiComponentNumber从上面的碎石图(图1)也可以判定选取5个公因子(主成分)做主成分分析和因子分析比较合适。因子载荷矩阵:表11ComponentMatrix(a)Component12345乡低保金Z(X2).920.076-.193.112-.157医疗保数Z(X11).899.295-.240.056-.090福利床位Z(X14).893-.029-.324-.073.142失业保数Z(X12).890.286-.260.059-.106养老保数Z(X10).876.311-.279.045-.041城低保金Z(X1).801
32、-.440.302.114-.038福利院数Z(X13).758-.273.151-.343.077服务设施Z(X15).737.271-.062-.200.395养老保率Z(X5)-.006.843.115.362.063低保人数Z(X4).610-.669.380.090-.006生育保率Z(X9).231.663.644-.015.093低保家数Z(X3).635-.638.362.165-.022医疗保率Z(X7).134.095.276.847.275失业保率Z(X6).227.447.551-.552.225工伤保率Z(X8).224.343.342-.031-.809Extrac
33、tionMethod:PrincipalComponentAnalysis.a5componentsextracted.根据因子载荷矩阵建立因子分析的模型TOC o 1-5 h zX0.920f+0.076f0.193f+0.112f0.157f112345X0.899f+0.295f0.240f+0.056f0.09f212345“0.224f+0.343f+0.342f0.031f0.809f卞12345其中X(i1,2,15)为原始变量数据,f(j1,2,18)为提取的公共因子。ij计算各个特征值所对应的特征向量,建立主成分表达式由于主成分的系数阵的特征向量与因子载荷矩阵存在的关系:Y丄
34、,故ij也可利用主成分的系数矩阵和因子载荷初始矩阵,计算出各个寺征值所对应的特征向量:表12各个特征值所对应的特征向量表12345乡低保X20.3549240.044279-0.149660.095066-0.15523医疗保X110.3468230.171872-0.186110.047533-0.08898福利床X140.344508-0.0169-0.25125-0.061960.140395失业保X120.3433510.166629-0.201620.050079-0.1048养老保X100.3379490.181194-0.216350.038196-0.04054城低保X10.3
35、09015-0.256350.2341860.096763-0.03757福利院X130.292427-0.159050.117093-0.291140.076129服务设X150.2843250.157889-0.04808-0.169760.390534养老保X5-0.002310.4911470.0891770.3072660.062288低保人X40.23533-0.389770.2946710.076392-0.00593生育保X90.0891170.3862750.49939-0.012730.091949低保家X30.244975-0.371710.2807130.140052-
36、0.02175医疗保X70.0516950.0553490.2140240.7189330.271891失业保X60.0875740.260430.427273-0.468540.222456工伤保X80.0864160.1998380.265204-0.02631-0.79985特征值6.7192.9461.6631.3881.023是,可以建吉立主成分表艮达式:15,Y0.354924X,Y0.354924X+0.346823X+1120.044279X+0.171872X+212=0.15523X-0.08898X+5125.2.5因子旋转+0.086416X+0.199838X15-0
37、.7998毁15表13RotatedComponentMatrix(a)1Component5234养老保数X10.957.089.089.071.099医疗保数XII.953.131.090.077.154失业保数X12.952.124.064.068.160福利床位X14.889.316.001-.092-.174乡低保金X2.885.325-.033.068.180服务设施X15.731.134.434-.004-.276低保人数X4.145.975-.030.032-.003低保家数X3.184.960-.060.100.022城低保金XI.409.871.046.093.076福利院
38、数X13.487.634.261-.290-.068失业保率X6.076.021.935-.167.041生育保率X9.106-.063.829.366.283医疗保率X7.027.166-.032.928-.076养老保率X5.200-.542.363.590.213工伤保率X8.133.030.187-.024.941ExtractionMethod:PrincipalComponentAnalysis.RotationMethod:VarimaxwithKaiserNormalization.aRotationconvergedin6iterations.因子分析后因子的协方差矩阵:表1
39、4ComponentScoreCovarianceMatrixComponent1234511.000-1.082E-16.000.000.0002-1.082E-161.000.000.000.0003.000.0001.000.000.0004.000.000.0001.000.0005.000.000.000.0001.000ExtractionMethod:PrincipalComponentAnalysis.RotationMethod:VarimaxwithKaiserNormalization.ComponentScores.上表中各个因子之间的协方差都很小,可以看出各个因子之间
40、是正交、几乎是不相关的。5.2.6根据因子分析后因子的得分系数矩阵,建立因子得分函数表15ComponentScoreCoefficientMatrix12Component345城低保金X1-.025.258.015.080.064乡低保金X2.175.001-.124.017.129低保家数X3-.081.312-.011.108.044低保人数X4-.093.320.019.063.026养老保率X5.057-.163.096.341.054失业保率X6-.076.041.542-.174-.095医疗保率X7-.040.092-.052.664-.144工伤保率X8-.034.034-
41、.046-.116.816生育保率X9-.076.035.405.177.087养老保数X10.217-.087-.061.007.026医疗保数X11.207-.070-.067.008.076失业保数X12.210-.074-.083.002.086福利院数X13.025.154.163-.199-.076福利床位X14.196-.021-.042-.065-.181服务设施X15.138-.039.228-.021-.345ExtractionMethod:PrincipalComponentAnalysis.RotationMethod:VarimaxwithKaiserNormali
42、zation.ComponentScores.由于TOC o 1-5 h zX0.025f,0.258f,0.015f,0.08f,0.064f112345X0.175f,0.001f0.124f,0.017f,0.129f2123450.138f0.039f,0.228f0.021f0.345f12345阵,该案例是利用回归方法计算出因子得分函数的系数,根据因子得分系数矩建立因子得分函数:阵,f=0.025X,0.175X,0.196X,0.138XTOC o 1-5 h z1121415f=0.258X,0.001X0.021X0.039X12121415fe=0.064X,0.129X0
43、.181X0.345X5.2.7根据得分函数,计算出我省每个城市的?个因子的得分分别为:表16地区f1f2f3f4f5成都市3.877290.164070.223580.051130.37273自贡市-0.273110.39873-0.20045-0.71405-0.90083攀枝花市-0.23072-1.48921-0.118720.205330.71715泸州市0.26232-0.5067-1.437580.385940.80061德阳市0.19276-0.352630.897480.29315-0.64035绵阳市0.06510.562090.014630.57244-0.0196广元市
44、-0.38301-0.05635-0.504230.836851.27443遂宁市-0.54066-0.240410.82219-0.121131.22832内江市-0.204740.006181.154210.26845-1.68444乐山市-0.130320.0753-0.537250.67266-0.38832南充市-0.587683.089210.88479-0.258640.94691眉山市-0.46725-0.807510.180580.104980.76801宜宾市-0.41260.269290.36250.801461.15569广安市-0.06741-0.166131.689
45、970.34626-1.63425达州市-0.156061.27741-2.41736-0.3877-1.04469雅安市-0.61556-1.155240.36576-0.286990.19222巴中市-0.29656-0.54882-1.298220.82102-1.30925资阳市-0.03178-0.51926-0.08189-3.591150.165675.2.8计算综合评价得分:主成分分析TOC o 1-5 h z总因子得分估计值为少=工f(j=1,2,18)jiii=1其中=九是第i个公共因子f的方差贡献率。iii亠分别计算出18个城市的综合评价得分为表17地区flf2f3f4f
46、5综合得分排名南充市-0.587683.089210.88479-0.258640.94691294.26971成都市3.877290.164070.223580.051130.37273203.51222宜宾市-0.41260.269290.36250.801461.15569200.66433广元市-0.38301-0.05635-0.504230.836851.27443132.42174遂宁市-0.54066-0.240410.82219-0.121131.22832128.95215绵阳市0.06510.562090.014630.57244-0.019683.058426眉山市-0
47、.46725-0.807510.180580.104980.7680127.193397德阳市0.19276-0.352630.897480.29315-0.6403517.420878广安市-0.06741-0.166131.689970.34626-1.63425-9.158589乐山市-0.130320.0753-0.537250.67266-0.38832-19.039510泸州市0.26232-0.5067-1.437580.385940.80061-20.966111攀枝花-0.23072-1.48921-0.118720.205330.71715-23.463412内江市-0.2
48、04740.006181.154210.26845-1.68444-54.147213雅安市-0.61556-1.155240.36576-0.286990.19222-70.807614自贡市-0.273110.39873-0.20045-0.71405-0.90083-142.64315巴中市-0.29656-0.54882-1.298220.82102-1.30925-190.23116达州市-0.156061.27741-2.41736-0.3877-1.04469-234.40417资阳市-0.03178-0.51926-0.08189-3.591150.16567-322.6318
49、因子分析总因子得分估计值为i=,f(j=1,2,18)jiii=1其中=寻是第i个公共因子f的归一化权重。分别计算各城市的综合分为:nn=1表18地区f1f2f3f4f5综合得分排名南充市-0.587683.089210.88479-0.258640.946910.8550551成都市3.877290.164070.223580.051130.372730.5913422宜宾市-0.41260.269290.36250.801461.155690.5830673广元市-0.38301-0.05635-0.504230.836851.274430.3847764遂宁市-0.54066-0.240410.82219-0.121131.228320.3746945绵阳市0.06510.562090.014630.57244-0.01
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年二手车销售协议:全面细化版版B版
- 2024年不动产权益测绘服务协议版
- 2024年大型云计算中心建设项目合同
- 2024协议起诉离婚的法律程序
- 江南大学《复变函数与积分变换》2022-2023学年第一学期期末试卷
- 江南大学《产品工程设计基础》2023-2024学年第一学期期末试卷
- 佳木斯大学《美学概论》2021-2022学年第一学期期末试卷
- 佳木斯大学《儿科学实验》2021-2022学年第一学期期末试卷
- 暨南大学《金融数学》2019-2020学年第一学期期末试卷
- 暨南大学《歌曲作法》2023-2024学年第一学期期末试卷
- 柴油安全技术说明书
- 市政雨水管道清淤检测方案
- 2023年运动治疗法技术及理论知识试题库(附含答案)
- 护理文书书写规范
- 会计英语大全
- 2023年山东公务员考试申论真题及答案解析B卷完整版
- 学生手机(电子手表)携带申请表
- 巴厘岛旅游介绍
- 太平间管理流程
- GB/T 23446-2009喷涂聚脲防水涂料
- GB/T 11032-2010交流无间隙金属氧化物避雷器
评论
0/150
提交评论