主成分综合评价方法研究综述_第1页
主成分综合评价方法研究综述_第2页
主成分综合评价方法研究综述_第3页
主成分综合评价方法研究综述_第4页
主成分综合评价方法研究综述_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主成分综合评价方法研究综述

自20世纪80年代以来,随着我国经济利益综合评价理论和实践的发展,在各种主题上的综合评价中越来越多地使用主成分法,这已成为最广泛使用的一种复杂的统计综合评价方法。根据对国内几本主要杂志十多年来有关文献的检索统计,在《统计研究》、《数理统计与管理》、《系统工程理论与实践》等杂志上发表的关于主成分综合评价理论及应用方面的文章不下百余篇,有些文章甚至将主成分综合评价方法称为“最优综合评价模型”,将其作为综合评价的首选方法。到目前为止,对主成分综合评价方法的理论问题研究得最为系统的,当首推邱东教授1和苏为华教授2。邱东教授的研究工作对20世纪90年代以来主成分综合评价理论及应用的研究有着极为重要的影响,苏为华教授则对90年代以来主成分综合评价理论与应用研究的状况及出现的问题进行了全面的剖析。笔者认为主成分综合评价方法还存在若干理论及应用方面的问题,需要作进一步的探讨。一些学者认为:各主成分之间是相互独立的,主成分综合评价方法能消除指标之间的重复信息;主成分的方差贡献率表示主成分所包含的评价信息量,进而将其等同于综合评价的把握程度;主成分综合评价方法具有降维作用。本文将对上述三个问题进行深入探讨,并提出不同的观点。一、运用主成分分析法进行综合评价邱东教授指出:“主分量分析将原来相关的各原始变量作数学变换,使之成为相互独立的分量,然后再对分量计算综合评价值。与其他直接综合各指标评价值的方法相比,这就消除了指标间相关对被评价对象的重复信息,这是主分量分析进行多指标综合评价的最大特点,也是它的最主要优点。”(P144)这个结论被后来众多学者所引用,并把其作为综合评价的首选方法。然而,通过对主成分分析法的深入研究,我们发现主成分综合评价方法并不能消除指标之间的重复信息。由于各主成分都是评价指标的线性组合,因此各主成分中都包含了指标之间的重复信息,作为主成分线性组合的综合评价函数也往往不能消除指标间相关对被评价对象的重复信息,相反却突出了指标体系中相关程度较高指标的影响。这可以通过实际例子得以充分说明:例1设有10名同学的语文、数学、综合科和英语4门课程的考试成绩如表1所示,用主成分分析法进行综合评价。记4门课程标准化后的成绩分别为x1、x2、x3、x4。经计算,其相关矩阵为x1x2x3x4x1x2x3x4⎡⎣⎢⎢⎢⎢10.9270.9190.0270.92710.9550.1240.9190.95510.1680.0270.1240.1681⎤⎦⎥⎥⎥⎥x1x2x3x4[10.9270.9190.0270.92710.9550.1240.9190.95510.1680.0270.1240.1681]易见x1、x2、x3之间的相关系数很高,x4与x1、x2、x3的相关系数很低。其特征值为λ1=2.885,λ2=0.993,λ3=0.078,λ4=0.0443,前两个主成分的方差贡献率分别为72.13%和24.83%,累积方差贡献率已达96.96%,其主成分分别为F1=0.5674x1+0.5782x2+0.5781x3+0.0978x4F2=–0.1424x1–0.0373x2+0.0097x3+0.9891x4将F1、F2按方差贡献率加权平均得综合评价函数为F=0.3739x1+0.4078x2+0.4194x3+0.3162x4(1)可见在综合评价函数中,x1、x2、x3的权系数都明显比x4的权系数大,x1、x2、x3作为“重复”变量,它们的总权重更是大大超过x4的权重。这说明,主成分综合评价方法并没有消除指标体系中指标相关所造成的重复信息,相反,却强化了这种重复信息。有许多学者提出只用第一主成分进行综合评价,3认为只有第一主成分才含有“评价信息”,第二及更后面的主成分都是一些“形状因子”。然而,笔者认为,若只用第一主成分作为综合评价函数,则各指标的权系数有时会更加不合情理。如例1中,第一主成分中指标x4的系数仅为0.0978,与指标x1、x2、x3的系数相比极小,也就是说,若用第一主成分作为综合评价函数,则在综合评价中英语成绩几乎不起作用,这是与常理相悖的。显然,用两个主成分的加权和作为综合评价函数时,第二主成分对第一主成分起到了“调节”作用,比只用第一主成分作综合评价函数要合理一些。二、确定的权系数:确立了主成分的方差贡献率邱东教授认为:主成分Fi的方差λi的大小反映了各个主成分在描述被评价对象上所起作用的大小,而ai=λi∑λiai=λi∑λi,表示每个主成分说明原始变量的信息量,即方差贡献率。(P130)据此,有许多学者将主成分的累积方差贡献率与综合评价的把握程度等同起来,认为第一主成分的“方差贡献率已接近75%,用第一主成分作综合评价就有75%的把握了”;“前三个主成分包含原始数据的信息总量已达90%,这说明用y1、y2、y3(注:指三个主成分)代表原来的8个指标评价企业经济效益已有足够的把握”。(P312)这里,有关学者混淆了两个不同的概念:主成分的“方差信息量”和“说明原始变量的信息量”。主成分的“方差信息量”表示各样本点该主成分值的离散程度,也表示该主成分区分样本的能力,所以主成分的“方差信息量”可称为“分辨信息量”或“区分度”。就各主成分相比较而言,方差贡献率大的主成分区分样本的能力强。而主成分的“说明原始变量的信息量”,应是指通常所说的“评价信息量”,可进一步理解为综合评价的把握程度。众所周知,在指标的无量纲化方法确定后,综合评价的关键是各指标权系数的确定,综合评价的准确与否,应看其确定的权系数是否准确反映了各评价指标对综合评价的实际影响程度。“评价信息量”的概念若用来描述综合评价的把握程度,应是指有多大的把握确定正确的权系数。若认为主成分的方差贡献率表示综合评价的把握程度,则会得出:在主成分综合评价中,第一主成分的方差贡献率较大,说明其确定的权系数已基本准确。但事实上,第一主成分的方差贡献率大,其所确定的权系数不一定就有较大的把握正确。如例1中,第一主成分的方差贡献率达72.13%,但其第一主成分F1中x4的权系数与其它三个指标的权系数相比极低,而在实际中,英语课程的重要程度并不一定小于其它3门课程。按照例1中的分析,主成分F1大大强化了x1、x2、x3中的重复信息,其确定的权系数是完全不正确的,也就不能说用F1作综合评价就有72%的把握了。从数学机理分析,各主成分都是原始指标的线性组合,第一主成分中各指标权系数的选取目标是使其有最大的方差,最能区分原始样本点,但这并不能保证所确定的权系数能准确反映各评价指标对综合评价的实际影响程度。另一方面,通常我们所称的主成分Fi的方差λi即为相关矩阵的特征值,而这是以指标的系数向量有单位长度为条件的,该条件又是为消除主成分方差的不确定性而作的人为规定。这种规定虽然为讨论主成分的特性提供了极大的方便,却不一定符合综合评价的要求。通常在综合评价中,都规定各指标的权系数(绝对值)之和为1,在此条件下,各主成分的方差将与原来大不相同,方差贡献率也完全不同。此时,例1中4个主成分的方差分别为0.8695、0.7150、0.0259和0.0203,方差贡献率则分别为53.32%、43.85%、1.59%和1.24%,与原方差贡献率完全不同,特别是前两个主成分的方差贡献率与原来的相差很大。以上分析说明,主成分的方差贡献率随着主成分中指标权系数所满足条件的变化而变化,因而方差贡献率不能客观反映主成分对综合评价的贡献大小。另外,若累积方差贡献率表示综合评价的把握程度,则所选主成分个数越多,把握程度应越大。特别地,如果将全部主成分都包含进去,把握程度应达最大值1,而事实并非如此。下列例子说明:几个主成分的累积方差贡献率越大,所得综合评价函数中指标的权系数不一定就有越大的把握正确,有时,取较多个主成分的综合反而降低指标权系数的正确程度。例2若例1中4门课的成绩如表2所示,用主成分分析法进行综合评价。经计算,其相关矩阵为⎡⎣⎢⎢⎢⎢10.0630.1370.9230.06310.9550.1240.1370.95510.1680.9230.1240.1681⎤⎦⎥⎥⎥⎥[10.0630.1370.9230.06310.9550.1240.1370.95510.1680.9230.1240.1681]易见语文与英语、数学与综合科的相关系数很高,其它相关系数均很低。其特征值为λ1=2.186,λ2=1.694,前两个主成分的方差贡献率分别为54.66%和42.35%,累积方差贡献率已达97.01%。其第一主成分为F1=0.4724x1+0.5022x2+0.5287x3+0.4951x4前两个主成分按方差贡献率加权综合为F=0.5500x1-0.0023x2+0.0326x3+0.5468x4F中指标x2、x3的系数极小,若用F作综合评价函数,数学与综合科的成绩几乎不起作用。可以看出,不论从指标相关引起信息重复的角度,还是从直观的角度,用F1作综合评价函数要比用F合理得多。也就是说,累积方差贡献率从54.66%提高到97.01%时,综合评价函数中指标权系数的正确程度反而大大下降。三、从主成分的方差贡献率看综合评价函数的构建主成分综合评价方法具有降维作用,是由于将几个主成分用加权线性和的方法合成综合评价函数时,取方差贡献率为权系数得来的。但是,笔者认为,这里取方差贡献率作为权系数是不合理的。许多学者认为,“方差越大的变量越重要,自然应具有较大的权数”。(P308)其实,方差大小只表示该变量区分样本的能力强弱,并不能反映该变量的重要性程度。我们知道,当几个变量直接相加(即取相同的权系数)时方差大的变量对综合评价也具有较大的影响,也就是说,只要选择相同的权系数就能体现“方差越大的变量越重要”,因而,方差大的变量不一定要有较大的权系数。在主成分综合评价方法中,若将几个主成分直接相加,也能体现出方差较大的主成分对综合评价的影响较大;将主成分乘以方差贡献率再相加来构建综合评价函数时,则进一步强化了前面几个方差大的主成分的作用,降低了后面方差小的主成分的作用,这种强化的必要性是没有理论依据的。退一步说,就算确实需要进一步强化方差大的主成分的作用,又为什么是乘以“方差贡献率”而不是乘以“标准差贡献率”呢?在许多综合评价方法中,为消除各指标方差的不同对综合评价造成的影响,常将指标值标准化,也即将指标值除以标准差。从这个角度分析,在主成分综合评价方法中,为进一步强化方差大的主成分的作用,也应该将主成分乘以“标准差贡献率”才更合理。另一方面,根据第二部分中的分析,主成分的方差贡献率随着主成分中指标权系数所满足条件的变化而变化,因而所得综合评价函数也随着主成分中指标权系数所满足条件的变化而变化。例如,当例1中主成分中各指标的权系数(绝对值)之和为1时,将F1、F2按方差贡献率加权平均可得综合评价函数为F=0.1131x1+0.1554x2+0.1728x3+0.3966x4(2)式(2)与式(1)中的指标权系数相差很大,也完全不成比例。根据上述分析,将几个主成分用加权线性和的方法合成综合评价函数时,取方差贡献率为权系数是完全不合理的。事实是,由于取方差贡献率为权系数,降低了后面主成分的作用,使得后面的主成分对样本排序的影响很小,甚至不产生影响,因此可以将其舍去。这就是主成分综合评价方法的“降维作用”。由于取方差贡献率为权系数是不合理的,因而所谓的降维作用也是不存在的。综合上述分析,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论