主成分分析法综合评价指标时的信息融合_第1页
主成分分析法综合评价指标时的信息融合_第2页
主成分分析法综合评价指标时的信息融合_第3页
主成分分析法综合评价指标时的信息融合_第4页
主成分分析法综合评价指标时的信息融合_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主成分分析法综合评价指标时的信息融合

一、确定综合评价函数近年来,主要成分法已成为最重要的综合评价方法之一。目前为止,较为普遍采用的做法为:1.设某综合评价使用p项指标,先将指标同趋势化,即将逆向指标转为正向指标,一般用指标值的倒数代替原指标。2.将p项指标的原始数据标准化。设标准化后的p项指标记为x1,x2,…,xp,即E(xi)=0,D(xi)=1,i=1,2,…,p。3.计算指标的相关矩阵R,求R的p个特征值记为:λ1≥λ2≥…≥λp≥0相应的正则化特征向量ui=(ui1,ui2,…,uip),i=1,2,…,p。4.设方差贡献率αi=λip∑k=1λkαi=λi∑k=1pλk,当累计贡献率m∑i=1αi∑i=1mαi达到一定数值(一般取≥85%)时,取m个主成分Fi=ui1x1+ui2x2+…+uipxp(i=1,2,…,m),进而得到综合评价函数:F=α1F1+α2F2+…+αmFm5.将每一个单位的标准化指标值代入上式求得各单位的综合评价函数值,根据综合评价函数值对各单位进行排序。由于主成分Fi是x1,x2,…,xp的线性组合,所以实际上综合评价函数F也可以表示为x1,x2,…,xp的线性组合(但可能是由于F的意义不好解释,许多文献都回避这一点)。不少学者认为:主成分分析法有许多优点,并将其作为综合评价的首选方法。然而,通过对主成分分析法的深入研究,仍然可以发现用主成分分析法进行综合评价时存在一些问题,而导致所得结果往往不正确。这也正是笔者所要讨论的问题。二、综合评价函数用主成分分析法进行综合评价存在许多问题,其中最关键的问题(其它问题多数由此而引起)是主成分分析法不能消除指标重叠信息。而恰恰相反,却强化了指标重叠信息,使综合评价结果与指标相关性结构关系十分密切,其具体表现在:(一)若评价指标体系中存在一部分变量高度相关、其它变量相关程度较低,则综合评价函数中权系数分配存在一个明显的集结倾向。权系数明显向相关性较高的变量倾斜,这些变量的权系数明显大于其它变量的权系数。一般来说,同一类指标(如经济效益评价时的利税类指标)的相关系数往往较大,可认为其中包含较多的重叠信息,不相同类指标的相关系数往往较小,所包含的重叠信息也少。若选用的某一类属性指标数量越多,则在用主成分分析法时,这一类指标所占的总权重系数就越大。这一点可通过下例得以说明:例1某综合评价有4项指标,其中x1,x2,x3为同一类的指标,x4为另一类的指标(具体数据略),则x1,x2,x3之间的相关系数较高,x4与x1,x2,x3的相关系数较低。其相关矩阵为:其特征值为:λ1=2.814λ2=1.004λ3=0.173λ4=0.00961而前两个主成分的方差贡献率已达到了95.44%,其主成分分别为:综合评价函数为:F=0.405x1+0.4036x2+0.3561x3+0.2984x4可以看出:x1,x2,x3的系数都比x4的系数大,x1,x2,x3作为同一类的指标在综合评价函数中占据着绝对优势。而在实际问题中,就单个指标而言,x1,x2,x3则不一定比x4重要,相反有可能x4是关键性指标,而x1,x2,x3都是辅助性指标。所以综合评价函数F强化了x1,x2,x3之间的信息重叠,致使评价结果无法真实地反映实际情况。在此也顺便指出:主成分分析法显然不能确定指标的重要程度,只能在假设各指标在综合评价中的重要性相同的情况下,讨论其权系数的合理性(以下均作此假设)。(二)若综合评价中有两类指标,分别记作S1和S2。其类内指标两两高度相关且两类指标的个数及相关程度相当,而类间指标两两低度相关,则在综合评价函数中,S1中指标与S2中指标的权系数相差很大,而类内指标的权系数相差不大。例2设某综合评价有6项指标,指标集S1由x1,x2,x3组成,S2由x4,x5,x6组成,其相关系数矩阵为:其中前两个特征值为λ1=3.129,λ2=2.672,前两个主成分为(累积方差贡献率已达96.68%):综合评价函数为:显然x1,x2,x3的权系数比x4,x5,x6的权系数大得多,这是不合理的。(三)当各指标相互之间都低度相关时,所得综合评价函数也不合理。例3设某综合评价有3个指标x1,x2,x3,相互之间都低度相关,其相关矩阵为:R=[1.0000.1640.0130.1641.0000.2710.0130.2711.000]则可得其特征值为:λ1=1.3232λ2=0.9883λ3=0.6884需取全部主成分为:F1=0.3808x1+0.7005x2+0.6036x3F2=0.8556x1-0.0193x2-0.5173x3F3=0.3507x1-0.7134x2+0.6066x3综合评价函数为:F=0.5303x1+0.1389x2+0.2351x3x1的系数远大于x2与x3的系数,这也是不合理的。(四)当各指标相互之间都高度相关时,所得综合评价函数才比较合理。例4取例1中的评价指标x1,x2,x3,则其特征值为λ1=2.8045,第一主成分的方差贡献率已达93.48%,取第一主成分作综合评价函数为:F=0.587x1+0.586x2+0.558x3各指标的系数比较均衡。从以上较特殊的例子可见:用主成分分析法进行综合评价其所决定的指标权系数基本上是不正确的,所得结果很可能是完全错误的。有许多学者都提出只用第一主成分进行综合评价,认为只有第一主成分才含有“评价信息”。然而事实上,若只用第一主成分作为综合评价函数,则各指标的权系数有时会更加不合情理。如例1中第一主成分中指标x4的系数仅为0.0709,与指标x1,x2,x3的系数相比极小。也就是说,如用F1作为综合评价函数,指标x4几乎不起作用,这显然极不合理。故再分析一下方差贡献率的意义,笔者认为第一主成分的方差贡献率大,主要原因是:第一主成分的系数基本上都是正的,后面的主成分有较多的负系数,而且越后面的主成分其系数之和越倾向于接近0(因正负相抵);后面的主成分的方差小,因而其方差贡献率小,是由其值分布在均值0附近的内在结构决定的,已经在其数值中得以体现。所以,原主成分分析法将主成分乘以方差贡献率再相加来构建综合评价函数,从理论上讲也是不合理的,还不如将主成分直接相加更合理。但计算表明,将主成分直接相加有时也不合理。三、改进的主成分分析法由主成分分析的理论和实际计算可知:前面几个主成分中的每一个都代表评价指标体系中的某几个指标,一般来说,每一个指标都能被某个主成分所代表。笔者通过大量实例计算发现:若把前面几个主成分所代表的各指标连同它们的系数组合在一起,作为综合评价函数,则所得综合评价函数都很合理,故重新分析上面各例:在例1中:第一主成分F1中x1,x2,x3的系数均比x4大得多,故F1代表指标x1,x2,x3;而第二主成分F2中x4的系数远大于其它指标的系数,即F2代表指标x4。将F1中的0.586x1+0.5866x2+0.5544x3与F2中的0.990x4相加即得综合评价函数为:F=0.586x1+0.5866x2+0.5544x3+0.990x4因为x1,x2,x3的相关系数较大,包含许多重复信息,就单个指标来说它们的系数都比x4的系数小得多;而作为同一类指标,它们的系数之和比x4的系数大,这是比较合理的,并消除了x1,x2,x3之间重叠的信息。在例2中:第一主成分F1中x4,x5,x6的系数较大,F1代表x4,x5,x6;而第二主成分F2中x1,x2,x3的系数较大,F2代表指标x1,x2,x3。所以综合评价函数为:F=0.4817x1+0.4575x2+0.4960x3+0.4805x4+0.4980x5+0.4550x6因x1,x2,x3之间所包含的重叠信息量与x4,x5,x6之间所包含的重叠信息量相近,所以各指标的系数相近。在例3中:第一主成分F1中x2,x3的系数较大,F1代表x2,x3,而F2则代表x1,所以综合评价函数为:F=0.8556x1+0.7005x2+0.6036x3因为x2与x3之间的相关程度较高,信息重叠较多,所以权系数比x1的小。该例也表明:尽管F1和F2的累积方差贡献率才77.05%,但已能代表所有三个指标。在例4中:第一主成分的各系数相近,第一主成分就可以代表全部三个指标,所以其综合评价函数即为第一主成分,并与原来相同。故再借用参考文献中一个实际评价工业企业经济效益的例子,说明改进后的主成分分析法的合理性:例5对某市大中型工业企业的经济效益进行综合评价,选用7个经济效益指标:固定资产产值率x1;固定资产利税率x2;资金利润率x3;资金利税率x4;流动资金周转天数x5;销售收入利税率x6和全员劳动生产率x7。根据实际数据用SPSS软件可算得相关矩阵为:R=[1.0000.8500.8560.8600.0840.5850.4930.8501.0000.0920.8490.3120.9040.5980.8560.9021.0000.9880.1210.7670.3290.8600.8490.9881.0000.1070.6830.2650.0840.3120.1210.1071.0000.3750.4800.5850.9040.7670.6830.3751.0000.4970.4930.5980.3290.2650.4800.4971.000]特征值λ1=4.660λ2=1.316λ3=0.559相应的主成分为:从权系数较大的指标看,F1代表x1,x2,x3,x4,x6;F2代表x5,x7,可得综合评价函数为:F=0.411x1+0.456x2+0.435x3+0.419x4+0.720x5+0.400x6+0.524x7因指标x1,x2,x3,x4,x6之间的相关系数较大,亦即它们之间的信息重叠较多,所以它们的系数较小;x5与其它变量的相关程度最小,所以其权系数最大,这是比较合理的。当然,笔者是在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论