10多元综合评价分析方法_第1页
10多元综合评价分析方法_第2页
10多元综合评价分析方法_第3页
10多元综合评价分析方法_第4页
10多元综合评价分析方法_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

10多元综合评价分析方法多元统计分析的应用范围很广,无论自然科学还是社会科学,无论是开发研究还是实际预测和决策,都有许多成功的案例。本章简要介绍多元统计分析的相关基础和常用的多元统计分析评价基本方法。方差分析在评价系统研究中,我们所关心的参数往往是受多因素影响的,如作物产量的高低、城市空气质量的好坏等。如果要提高产量或者要改善环境条件,就必须对影响生产或环境的多因素进行分析,确定哪些因素是主要的,以及将这些因素控制在哪个水平或位级上就能使农作物产量提高或环境质量改善。作为影响研究参数结果的因素,有些是可控的,这些可控制因素一般可以在有控制的重复该试验或观测所获得的数据中得到反映。方差分析就是通过对试验或观测所获得的数据之间的差异,分析推断各影响因素所起作用的一种数理统计方法。英国统计学家费歇尔在20世纪20年代首先把方差分析应用到农业试验中。这里仅介绍单因素和双因素的方差分析,主要讨论方差分析的一些具体算法,对涉及概念、计算公式的数学原理只作简单介绍。单因素方差分析A单因素方差分析模型态),分别进行了n,・1设影响研究结果的因素只有一个,令其为A。对A态),分别进行了n,・1n次重复试验(观测),共得到N=£n个观测数据x,k i iji=1i=1,2,,k;j=1,2,,n。试验(观测)的目的是要分析因素A的不同水平对i试验所研究的结果是否有显著的影响。假设x有如下的数据结构式:ijx=N+a+£ (i=1,2,,k;j=1,2,,n) (10-1)TOC\o"1-5"\h\zij iij i式中,口表示总体均值;a.表示水平A对观测数据的影响,即水平A的效应;8表i i i ij示第i个水平在第j次试验(观测)中的随机误差。假定8相互独立,且8nMO,52)。ij ij于是,根据模型式(10-1),上述试验(观测)的目的可归结为检验假设:H:a=a==a=0 (10-2)\o"CurrentDocument"0 1 2 kB方差分析原理基本思想是:根据所设的数据结构将总偏差平方和分解为各个不同水平效应的偏差平方和及随机误差所引起的偏差平方和,然后利用正态分布假设,构造F统计量进行显著性检验。令:X=-£x表示水平A的样品平均值;in ij iij=1彳=N££xj表示全部观测值的总平均。i=1 j=1总偏差平方和可分解为:工工(x-工工(x-X)2iji=1 j=1£n(x—x)2+ii-i=1£工(xiji=1 j=1—x)2i-/(10-3)TOC\o"1-5"\h\z式中,S工£(x-x)2工£(£-E.)2表示各组内随机因素而产生的偏差E ij1- ij1i=1j=1 i=1j=1平方和,简称组内平方和(或误差平方和)。(10-4)S=££(彳-x)2=£n(r-x)2=£n(a+E-E)2(10-4)A i- ii- iiii=1j=1 i=1 i=1表示由各组不同水平之间的差异而产生的偏差平方和,简称组间平方和。\o"CurrentDocument"在上述关于模型式(10-1)的假设下,统计量S./52,S%2,S*2分别服T' E' A'从自由度为N-1,N-k,k-1的殍分布,且S与S相互独立,故统计量:EASS52(k-1)F*-\,N-k)(10-5)FF*-\,N-k)(10-5)S52(N-k)□E则拒可用来检验假设H。对于给定的显著性水平a,若计算值F>F(k-1,N-k),则拒0 a绝H0,即认为因素A的不同水平对所研究的指标值的影响有显著差异。一般,当a=0.05时,F>F表示水平效应显著,记作F*;当a=0.01时,F>F表示水平效应高度显著,a a记作F**。C单因素方差分析计算步骤方差分析的计算和检验程序可按下列方差分析表10-1进行。(1)计算样品(观测值)均值彳及总均值x;i*(2)计算组间平方和S及误差平方和S;A E(3)计算均方r=S/(k-1),F=S/(N-k)及F=S~/S~。AA- EE' AE表10-1单因素方差分析表方差来源平方和自由度均方F组间S=£n(x-x)2A ii-i=1k-1S=S/(k-1)A AfS~sAE

S工工(-X)2E iji'i=1 j=1S=S+STEAN—kN-1S~=S/(N-k)E E-D算例为了考察用来处理水稻种子的4种不同药剂对水稻生长的影响,选择一块各种条件(如土质、气候、管理)基本均匀的土地,将其分成16块。在每4块试验地里种下用同一种药剂处理过的水稻种子。试验结果—一苗高见表10-2。试验中唯一的可控因素一一药剂用A表示,用4种不同的药剂处理称为A的4个不同TOC\o"1-5"\h\z水平,分别记为A,A,A,A。这里每个水平的试验(观测)次数均相同,k=4,N=16。12 3 4其参数计算见表10-2,方差分析见表10-3。表10-2不同药剂处理的苗高X药剂A重复试验次数、不同水平下的苗高X参数A1A2A3A4123212022219241825321271927413201526总和Ti769272100T=340平均Xi19231825X=21.25i表10-3不同药剂处理的水稻苗高的方差计算表方差来源平方和自由度均方和F组间(因素A)131343.34组内(误差)114129.54.60总和24515设显著水平a=0.05,查F分布临界值表有:TOC\o"1-5"\h\zF(k-1,N—k)=F(4-1,16—4)=3.49a 0.05由于4.60>3.49,故拒绝H,即不同药剂对水稻的生长有显著影响。同样查表有0F(4-1,16-4)=5.95,则F<F,表示不同药剂对水稻的生长不存在高度显著。0.01 0.0110.1.2多因素方差分析A无交互作用的方差分析实际问题中常会遇到两个或两个以上因素同时影响试验(观测)结果的情形。通过对两个因素的方差分析,能确定两个因素各自的主效应及它们的交互效应;通过对3个因素的方差分析,能确定3个因素各自的主效应、两两交互效应及3个因素的交互效应等。由于多因

素多水平的方差分析涉及较繁的符号书写,下面仅以两因素无重复试验的情形为例,说明多因素方差分析的数学原理。设因素A有a个不同水平,因素B有b个不同水平。对A与B的每一个水平组合做一次试验(观测),得N=ab个值,数据见表10-4。表10-4多因素方差分析数据表因素Bx=1£xi-b ijj=1因素ABB1 bA1**X・・x11 1b•・ :X1*•*Aa••••X Xa1 ab•Xa-T=1£x-baiji=1•••X X-1 -b•••(10-6)表中,x表示A的第i水平与B的第(10-6)x=N+a+P+£(i=1,2,,a;j=1,2,,b)TOC\o"1-5"\h\zj ij ij其中,口表示总体均值,a,山分别表示A丁B的主效应,£为随机误差。各£相ij ij ij ij互独立,且£nN(0,52)。与单因素方差分析情形相比可知统计假设为:ij(10-7)H:a=a==a=(10-7)V 01 1 2 a >H:P=P==P=0l 02 1 2 …b J同理,总偏差平方和可分解为:S立工(1X)2T iji=1j=1=£ £(x-=£ £(x-fiji-i=1j=1——、尸/——、 yz--、一X.+X)2+b乙(X一X)2+a乙(x.一X)2i-i=1(10-8)j=1其中,X=-1££xabiji=1j=1二£二£(xiji=1j=1一X一X+X)2

i- -J记S=b£(X-X)2,A i-i=1则式(10-8)可简写为:

S=a£(X一X)2,B -jj=1(10-9)在假设式(10-9)在假设式(10-7)成立下,可以证明S/2口%2(”1),y2口殍(b-1),S=S+S+STABES吟2殍((〃—1)(b—1)),且S,S,S相互独立,因而有:E ABEF=AF=BS(a-1) A 「S(a-1)(b-1)口EF=AF=BS(a-1) A 「S(a-1)(b-1)口ES(b-1) B S(a-1)(b-1)口E产(a-1,(a-1)(b-1))F(b-1,(a-1)(b-1))(10-10)若计算值Fa>f.(a-1,(a-1xb-1)),则拒绝假设H01,认为A的主效应显著;若计算值F>F(b-1,(a-1)(b-1》,则拒绝假设H,认为B的主效应显著。Ba 02B有交互作用的方差分析实践中,当试验结果受两个或多个因素影响时,不仅每个因素对试验结果起作用,而且因素的水平搭配不同,试验结果也不同。因而方差分析既要确定各因素的主效应,也要确定水平搭配的交互效应。为了分出交互效应,对各水平组合必须进行重复试验。设因素A有a个不同水平,因素B有b个不同水平,各水平组合重复m次试验。记Xijk为A的第i水平与B的第j水平组合的第k次试验观测值,假定相应的数据结构为:x=R+a+P+y+£ (i=1,2,,a;j=1,2, ,b;k=1,2,,m) (10-11)ijk ijijijk其中,口,a,p含义同式(10-6),Y为A与B搭配的交互效应,各8相互独立

ij ijij ijk二口N(0,52)。类似上述分析,要检验假设:H:a=a==a=0、01 1 2 aH:「=「==P=002 1 2 ••bH:Y二二Y二003 11 •mb J(10-12)而S=S+S..+S+STAB AxB E(10-13)其中S立XX(X -X)2T ijki=1j=1k=1SA=工X(XXX)2

mb jijk,(XXXX)

abm jijkSB1(XXXX)

abm jijkS=mXX(X-X-X+X)2AxB iji• •jij=1XX(XX)--1X(XXX)2-±X(XXX)2+,(XXXX)2

m jbm jam ijkabm ijkijk ijk jik ijkS=SEE(X -F)2=S-S-S+SE ijkij- TABAxBijk这里:Xi••统计量:bmjkXijkx=,ZZZ这里:Xi••统计量:bmjkXijkx=,ZZZXabm ijkijk相应的,F=AIF=BFAxBSA(a_1)Sab(m一1)口\(b-1)Sab(m一1)口EF(a-1,ab(m-1))Fdb((m-1))(10-14)S (a-1)(b-1)A~B^ 门Sab(m-1) 口EF((a-1)(b-1),ab(m-1))可以分别检验假设式(10-12)。若计算值F>F(a-1,ab(m-1)),则拒绝假设HTOC\o"1-5"\h\zAa 01认为A的主效应显著;若计算值Fb>Fa(b-1,ab(m-1)),则拒绝假设H02,认为B的主效应显著。若计算值F >F((a-1)(b-1),ab(m-1)),则拒绝假设H,认为A与B的AxB a 03交互效应显著。具体计算步骤可按方差分析表10-5进行。表10-5两因素有交互效应的方差分析表方差来源平方和自由度均方FASAa—1S=S/(a-1)A A'f=snrA AEBSBb-1S=S/(b-1)B B'f=snrB B'EAxBSAxB(a-1)(b-1)S…S SF=AxBAxBSEQ AxBAxB (a—1)(b—1)ESEab(m-1)S=S]ab(m-1)E E:TSabm-1T计算中,把交互作用项看作因素输入。对于两因素以上的方差分析,可仿上述方式类推。C算例TOC\o"1-5"\h\z施用A,A,A三种肥料于B,B,B三种土壤,以小麦产量为试验指标做盆栽试1 2 3 1 2 3验。每种肥料和土壤组合试种3盆,得产量结果见表10-6,试做方差分析(a=0.05)。表10-6三种肥料施于三种土壤的小麦产量(g)肥料种类盆号土壤种类B B B1 2 3Xi--

121.419.617.6A221.218.816.61320.116.417.5x1j•20.918.317.218.8112.013.013.3A214.213.714.02312.112.013.9x2j•12.812.913.713.1112.814.212.0A213.813.614.63313.713.314.0x3j•13.413.713.513.5x•j•15.715.014.8x=15.16这里a=3,b=3,m=3。方差分析见表10-7。表10-7三种肥料三种土壤的小麦产量方差分析方差来源平方和自由度均方和FA179.38289.69B3.9621.9896.4AxB19.2444.812.13E16.70180.935.17总和219.2826F(2,18)=3.550.05对FA和F查F 分布表有:;;对F查F 分布表有:F(4,18)=2.93。AxB 0.05由于F>F(2,18),F<F(2,18),F>F(4,18),故土壤类别间无显著差异,A0.05 B0.05 AxB 0.05肥料类别和交互作用AxB都是显著的。相关分析评价系统中常常涉及多个要素,对某个研究对象而言,与之相关的要素也是多样化的,但事物均是有联系的,我们往往要判断哪些因素是相关的,或者判断哪些统计量是相关的。相关分析的任务就是揭示系统因素之间相互关系的密切程度,而这种要素间的相关密切程度的测定,主要是通过对相关系数的计算与检验来完成的。这里,主要介绍两要素间的相关分析问题。样本相关系数的计算与检验A相关系数的计算对于两个要素X与Y,如果它们的样本值分别为x和y(i=1,2,,n),这里n为样本ii大小,即抽样观测次数。由一般统计原理可知,它们之间的相关系数定义为:(10-15(10-15)式中K亍一一分别为两个要素的样本平均值,X二1乙,7二1Zyninii=1 i=1,——要素X与Y之间的相关系数。相关系数,是反映两要素之间相关程度的统计指标,其值在[-1[]区间之内。.0,表示两要素正相关,即两要素同向发展;或<0,表示两要素负相关,即两要素异向发展。厂的绝对值越接近1,表示两要素的关系越密切;厂越接近0,表示两要素的关系越不密XY XY切。如果记:LXYi=1Z.y-iii=11(工)(Zy)

如果记:LXYi=1Z.y-iii=11(工)(Zy)

nii

i=1 i=1LXXZ(一X)2=iZx2-ii=11(ZX)2nii=1i=1LYYZi=11(Zy)2nii=1则式(10-15)可以进一步简化为:rXY如果研究问题涉及到XJX2rXY如果研究问题涉及到XJX2,Xn等n个要素,则对于其中任何两个要素X,和Xj按照式(10-15)或式(10-16)计算它们的相关系数rj,这样就可得到多要素的相关系数矩11 12 1n(10-17)

由相关系数的定义可知,R中有:r=1(i=1,2,,n);r=r(i=1,2,,n;j=1,2,,n)ii ijjiB相关系数的检.验 ... ...当要素之间的相关系数求出以后,还需要对其进行检验。这是因为这里的相关系数式是根据研究要素之间的样本值计算的,它随样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系数检验的临界值r来完成的。查相关系数临界值时,自由度为r来完成的。查相关系数临界值时,自由度为n-2,a为置信水平,按自由度和置信水平查出的值为相关系数等于零的临界值r。当计算|r>r时,两要素X,Y不相关的可能性

a XYa只有a,即X,Y在置信水平a下相关。一般而言,当r|<r时,则认为两要素X,Y不相关,这时的样本相关系数就不能XY1 0.1反映两要素之间的关系。C算例我国长江流域部分县(市)7月下旬历史最大降雨量与常年同期平均降雨量见表10-8,试对该两要素做相关性分析。表10-8长江流域7月下旬降雨量统计表(mm)县(市)名历史最大降雨量常年平均降雨量县(市)名历史最大降雨量常年平均降雨量武汉31435南昌14026黄石50141婺源23057英山26053铜鼓17649孝感20630景德镇19837岳阳18330九江14232桑植39146安庆19446常德16241屯溪21938芷江15643凯里14757这里设7月下旬历史最大降雨量为X,常年同期平均降雨量为Y。由表10-8数据可得:LXYy)=1676.07i^ILxy」(ZxLXYy)=1676.07i11nii=1 i=1 i=1LXX=Zx2-1(ZiiLXX=Zx2-1(Zii=1ni=1x)2=148060.44iLYY=Zy2-1(Zini=1y)2=1381.438ii=1rXYrXY=0.11719按式(10-16)可得:L 1676.07XY=—LL <148060.44x1381.438XXYY

查表有丫=0.4259,有卜<r时,则认为该两要素X,Y不相关,即长江流域70.1 1XY0.1月下旬历史最大降雨量与常年平均降雨量无相关关系。等级相关系数的计算与检验统计数列有时无法或不适宜直接以数量确定其差异大小,只能依照排列次序以定其高低,例如:智力高低、颜色深浅、服务态度、味道好坏、事态轻重等。根据等级分配的两组资料之间的相关关系,称为等级相关,等级相关测定方法又称为等级差异法。A等级相关系数的计算等级相关系数,又称顺序相关系数,与前述相关系数一样,它也是描述两要素之间相关程度的一种统计指标,不过在计算方法上有所不同。等级相关系数是将两要素的样本值按其大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。设两个要素X与Y有n对样本值,令N代表要素X的序号,N代表要素Y的序号,X Yd2=(N—N)(i=1,2,,n),代表要素X与Y的同一组样本位次差的平方。i Xi Y由式(10-16)变换可得:①d2ir=1——^-1—— (10-18)XY n(n2-1)B等级相关系数rXY的检验与相关系数一样,等级相关系数是否显著,也需要检验。表10-9给出了等级相关系数检验的临界值。表中n代表样本个数,a代表不同的置信水平,表中数值为临界值(。t=t=r. XYY1—r2(n-2为自由度)(10-19)表10-9等级相关系数检验的临界值n显著水平an显著水平a0.050.010.050.0141.000160.4250.60150.9001.000180.3990.56460.8290.943200.3770.53470.7140.893220.3590.50880.6430.833240.3430.48590.6000.783260.3290.465100.5640.746280.3170.448120.5060.712300.3060.432140.4560.645等级相关系数点的检验也可以采用t-检验,其公式为:XY0.05一般认为,当t>t时,两要素相关显著;当t>t时,两要素相关高度显著。0.050.01

所以rXY6^d2ii—所以rXY6^d2ii—1 =1一n(n2—1)6x5812x(122—1)―0.80当n=12时,1.05=2.228;'0.03169按式(10-19)计算有:由于"/0.01,所以两因素高度显著相关。某公司服务员工龄与工作效能的等级相关。计算数据见表10-10。表10-10服务员工龄与工作效能的等级相关计算服务员服务年限服务年限次序工作效能次序dd2A57.561.52.25B211.5120.50.25C10211.01.00D8495.025.00E6682.04.00F4954.016.00G12121.01.00H211.5101.52.25I7532.04.00J57.570.50.25K9341.01.00L310111.01.00这里n=12,£d2=58.00用等级相关检验也可得到同样结果。主成分分析评价方法主成分的基本思想设有n个指标X1,X2,,<它反映了n个客观对象的特性,因此每个对象观测到的n个指标值就是一个样本值(1,%,,%),它是一个n维向量。如果观察了m个对象,i1i2 in就有m个n维向量,共mn个数据,用矩阵表示有:

x11x21x11x21x12X22X1nX2n(10-20)X*nmX*nm,nrl每一行就是一个样本的观察值。已知数据矩阵X,若能找到一个线性函数Y=ZaX,iii=1能最好地反映n个指标(X,X,,X)的变化状况,即用此线性函数来综合表示n个变量在m个样本上的差异,则此函数就是一个代表性很好的指标,它就是这n个变量的主要成分,找出这个主要成分的方法就被称为主成分分析方法。主成分的基本思想是,先对m个点(X,X,,X)求出第一条“最佳”拟合直线,i1i2in使得这m个点到该直线的垂直距离的平方和最小,并称这条直线为第一主成分。然后再求与第一主成分相互独立(或者说垂直)的,且与m个点(X,X,,X)的垂直距离平方i1i2 in和最小的第二主成分。以此类推,可以得到其他的主成分。主成分的求法把n个指标(X,X,,X)看成随机变量,他们的期望值和协方差矩阵是:EX二EXEX二EX1X2EX1.EX2N1N2(10-21)EXnV={)}=V={)}=Cov(X,Y)=ij ijU11U21U12U22U1nU2n(10-22)U•nnUU•nn•m2U就是第i个变量的方差,因此这n个变量总的变化状况可以用ZU来反映。现在ij iii=1考虑其线性函数Y=ZaX的方差D(Y)考虑其线性函数Y=ZaX的方差D(Y)=D^iii=1i=1aX=ZZvaa=t Aii iiiji=1j=1VA要寻找最能反映这些X变化的,

i就要求D(Y)尽可能大,从D(Y)=加诿可以看出,对向量A的长度要作一些限制,否则D(Y)可以无限增大而没有意义,自然限制AtA=Za2=1。因此,数学问题就是:已知协方差矩阵V,求满足约束ii=1

条件ArA=1的向量A,使4忆4达到最大值。这是一个条件极值问题,可用拉格朗日乘子法求解。令f(A)=Ar^4-2%(ArA-1)由M=2VA-2九A=0,得:aaVA二九A,ArA=1这表示A是矩阵V的特征向量,因此有:(10-23)D(AtX)=ArV4=%ArA(10-23)由此可见,特征根九就是AtX的方差,因此只要求出最大特征根九所对应的特征向max量A,就可以确定第一主成分。一般的称Y为第j主成分(j=1,2,,n)。j在实际应用时,协方差矩阵往往未知,这时就用v的估计值V来代替。在实际计算时可能遇到的麻烦是X的n个分量表示不同性质的量,其度量单位不同,此时协方差矩阵V的值就会发生改变,相应的特征根也就要发生变化,特征向量也相应的改变,最后导致主成分的改变。为了消除变量不同单位的影响,通常将X的n个分量标准化,即令i(10-24(10-24)X’的协方差矩阵DX'实际上就是相关矩阵R。从R可以求出相应的主成分,该主成分一i般不同于直接从V求得的主成分。在实际求R时,不必求出X'只需直接从V=〈}求i j出R={r},因为:ju(10-25)r— .—ij—=(i,j—1,2, ,n)(10-25)j此<°力综上所述,主成分的求解步骤如下:先求出样本的协方差矩阵V=t}ju-1先求出样本的协方差矩阵V=t}ju-1工ijnk=1(x-x)(x-x),x-LZkiikjjink=1xi;利用式(10-25)求R=3};j⑶求R(或V"特征根九产其对应的特征向量『八彳J;⑷求。工『jk%,就是要求的主成分分量。k=1这里值得注意的是,当第一主成分的系数Yi卜出现负值时,应针对其原因进行调整:(1)与该系数对应的指标*k是反向指标,这时令一Xk代替Xk作为指标参评,则其系数转换为正值。(2)与该系数对应的指标X与其他指标的相关性很大,说明这类指标在参与综合评k价时,产生重复影响,应该删除一部分指标;(3)若系数Y的负值较多,由于Y与一Y都是九的特征向量,则将所以系数的符号1k jjj同时改向,使负系数的数量减少。10.3.3主成分个数(1)一般地,协方差矩阵的特征根及其向量的个数与其阶数相等,即与指标的个数相等。因此,协方差矩阵的特征根有n个,可以得到的主成分的数量有n个。因此,有必要衡量各个主成分反映原来n个变量变化状况的程度。九九一来衡量主成分的贡献率,贡献率越大就表明Y『X“综合”一来衡量主成分的贡献率,贡献率越大就表明Y『X“综合”iii=1 i=1的能力强。将特征值从大到小排列,记为,d>^>0,则y=Ytx=ZYX,1 2 n jj jkkk=1♦♦♦TOC\o"1-5"\h\zi=1,2,,n,且Z九=Zu。这表明y,y,,y是彼此不相关的,而且,其方差正好i ii 1 2ni=1 i=1••• •••是X,X,,X的全部方差,y,y,,y全面反映了X,X,,X的变化状况,所以1 2 n 1 2 n 1 2 ny,y,,y.称为x,x,,x的全部主成分分量。 …1 2 n 1 2 n••••••(2)当最大特征值九在工九中占的百分比超过85%,则其对应的主成分1尸1」y=ZYx能较好地放映选用的评指标X,X,,X。若九在Z九中占的百分比不超1 1kk 12 n 1 jk=1 j=1•••过85%,这个主成分就不是很理想。若九在Z九中占的百分比不超过50%,这个主成分1j=1j就不是很不好,则这个主成分不能反映X,X,,X的变化状况,这时就要考虑第二个、1 2 n第三个主成分分量,把它们放在一起分析、比较,再做出评价。()当第一主成分的贡献率达不到理想要求时,需采用多个主成分,通常以累计贡献率的大小决定选几个主成分,一般说只有累计贡献率超过85%就足够了。10.3.410.3.4例题10.3.410.3.4例题率;现分析安徽省16个地区宏观经济发展的情况,选用的评价指标有:x1:固定资产利税率;X2:流动资金利税率;X3:销售收入利税率;X4:净资产的利税率;X5:总产值的利税率;X6:人均的利税率;X7:全员劳动生产率;X8的利税率;X6:人均的利税率;原始数据见表10-11。表10-11安徽省16个地区宏观经济发展原始数据X1X2X3X4X5X6X7X81.合肥市0.4610.3340.1640.5340.1460.3592.4500.2022.芜湖市0.5370.3720.1770.5490.1470.3352.2810.2013.蚌埠市0.6070.4190.2040.7120.1920.4692.2440.2634.淮南市0.0210.0440.0190.0710.0180.0271.4540.0255.马鞍山市0.2980.5200.1820.6080.1770.4082.3130.2496.淮北市0.0540.1680.0600.3250.0740.0811.1040.0957.铜陵市0.1520.2060.1010.3440.0860.1742.0280.1148.安庆市0.3270.3640.1280.5370.1190.2702.2730.1539.黄山市0.1850.1640.0840.3020.0830.1281.5460.11410.阜阳地区0.4670.3360.1540.5220.1390.2771.9870.19011.宿县地区0.2320.2110.0910.3910.0830.1391.6850.10512.滁县地区0.5140.4010.1490.5390.1290.2992.3240.16913.六安地区0.1320.1830.0800.2840.0690.0841.2240.09114.宣城地区0.2020.2750.1240.4150.1130.1781.5750.15615.巢湖地区0.2460.2910.1180.4300.1040.1441.3920.13616.池州地区0.1530.1850.0860.3300.0820.1191.4520.110均值0.2870.2800.1200.4300.1100.2181.8450.148方差0.03260.01490.00250.02430.00200.01680.21530.0039标准差0.1800.1220.0500.1560.0440.1300.4640.062将表中的数据记为x,i表示地区号,j表示指标号,于是X=(x)是1x的矩阵。

j j求出均值向量及协方差矩阵。这里为了消除各指标之间因度量单位不同引起的差异,将数据标准化后的协方差矩阵,也就是原数据的相关矩阵记为V一10.794700.902380.875960.7947010.936770.945170.902380.9367710.964180.875960.945170.9641810.857110.943330.985090.974490.883860.917420.961720.938560.830270.789480.826250.790370.84280-0.933720.981380.95733V=0.857110.943330.985090.9744910.965360.791340.997110.883860.917420.961720.938560.9653610.907160.961910.830270.789480.826250.790370.791340.9071610.78619_0.842800.933720.981380.957330.997110.961910.786191 _从V矩阵看出,这些指标的相关性非常高,大部分相关系数都在0.85以上,而且都是正相关的。求V矩阵的特征根,得到8个特征根的值及其各自相应的贡献率,见表10-12。表10-12评价指标的贡献率入i7.32280.34830.18620.08670.03520.01750.00320.000044贡献率/%91.5354.352.331.080.440.220.040.005累计贡献率/%91.53595.88598.21599.29599.73599.95599.955100从贡献率看,选用第一主成分就已经足够好了,它相应的特征向量为:(0.3770,0.3411,0.3654,0.3601,0.3636,0.3641,0.3235,0.3612)因此,综合评价函数为:y=0.3770X-0.3411X'+0.3654X—0.3601X'+TOC\o"1-5"\h\z112 3 40.3636X—0.3641X'+0.3235X'+0.3612X'5 6 7 8这里变量用的是标准化后的变量,即:所以将上述公式代入y的表达式后,才能得到原始指标X,X,,X表示的综合评价1 1 2 8函数。 …y=8.7889+2.0944X+2.8782X+7.3082X+2.3085X+1 12 3 48.2634X+2.8011X+0.6973X+5.8256X5 6 7 8从上述两个表达式可以看出:对标准化变量X'而言,相应的系数差别很小,几乎就是j一样的,表明相关性很强的指标,其任一加权平均与算术平均数的相关性很大。但是还原到原来的变量X1,X2,,X8时,其系数就与\,0Xj成反比,标准差、DXT越大,相应的系数就越小,实际」=在某种意义下是反映指标工的“精度”,这就表示精度高的,它的’系数就大,就更应该重视,这是合理的。利用y的表达式,可以计算各地区的评价值及相应的名次,见表10-13,由此可对评价1系统的地区进行排序。表10-13各地区排序值区号评价值名次区号评价值名次19.3494.91229.53108.56311.61115.51141.916128.95510.42134.21463.915146.5875.710156.2988.07164.871310.4因子分析评价法因子分析法是主成分分析的一种自然延伸,通过对多个变量的实际观测值的相关矩阵进行计算,依次提取方差贡献率最大的各个主成分,以达到约简变量的目的。它主要从假定的因子模型出发,把数据看成由公共因子、特殊因子和误差3部分构成。因子分析中应用了主成分分析法,不同的是其特征值的计算是从相关矩阵出发,由于每个变量处于同一度量,从而使特征向量相对均匀,且将主成分转换为因子。因子分析的流程图可表示为:原始数据f相关矩阵f主因子解《正交因子旋转》正交因子解f因子计量因子分析的具体计算步骤如下:(1)输入原始数据。设观察了m个对象,每个观察对象有n个指标X,X,,X,11 2nij为第i个对象的第j个变量的观测值,有观测值矩阵式(10-20); ...(2)按式(10-24)将变量标准化,并按式(10-25)求相关矩阵R;(3)求矩阵R的特征值九及其相应的特征向量Y=()t;j jjk(4)确定公共因子个数p:选择特征根大于等于1的个数p为公共因子数或根据特征值累计百分比大于等于85%确定p;(5)计算初始因子载荷矩阵A=(a);jknxp因子分析的最简单的数学模型为如下线性模型'z=aF+aF+aF+CU111 121 1pp11< (10-26)…z=aF+aF+aF+CUl..外...../>1..1....丸2.•2 np>. n•其中,F( )与每个变量都有关系,被称为公共因子,其含义要根据具体问题来k解释。( ,)仅与一个变量有关,被称为特殊因子。系数a,j j jk( … )称为因子载荷。系数a构成的矩阵为因子载荷矩阵j jkA=(a).•;a=y匹 )2所以因子模型的矩阵形式为:jknxp jkjkyj♦♦•♦♦♦A AAA(10-27)=(z,z,z)T;二(F,F,,F)T;(U,U,,U)T1 2n1 2p12n・«,aaa...一C0…0一11121p1aaaA0C0A=2122… 2P—;一2•••aa…V00…C」L♦ni,n@••• •npJ1-•••• n其中(6)计算公共因子方差:

(10-28)h2=2a(10-28)j jkk=1(7)求正交因子解一一方差极大正交旋转:1)用h除A的各个元素,将因子载荷矩阵正规化;

j2)将p个因子轴,两两组合进行旋转,共旋转2pa(P-1)次。第Y个和第s个公共因子旋转后的载荷由式(10-30)决定,其中①的符号由式(10-31)决定,或查表10-14。表10-14①的符号中的符号cos4中的符号49所在的象限9的变化范围分子9(与sin4①)分母Otan4中++++I:0<49<900 00「22.50□ 0+II:90<49<1800 022.5「45。口。+III:180<49<2700 0—45 —22.5O O++W:270<49<360O 0—22.5「0oD0取正交矩阵P’,(10-29)1:(10-29)Isin①cos①/一.•一•一.一'acos①+asin①一asin①+acos中(10-30)(acos①+asin(acos①+asin①一asin①+acos①nrnsnrnsIbnrb)ns(10-31)tang?(10-31)6其中9=222aa(a—a)—222aa2,jrjsjrjs jrjsnjTjrjsj=jrjsj=1jrjs6=2[(a2—a2)2—(2aa)2]—{[2[(a2—a2)]2—(22aa)2}

jrjsjrjs(r=1, ,(p—1);s=r+1, ,p)得到正交变换P=PPP得到正交变换P=PPP1 1213P'rsPP(p—1)p,旋转因子载荷矩阵为B1=AP1,因子载荷平方的方差为:(10-32)L=1工工(b h>-£Zb2"2(10-32)n jk■j jk'jk=1j=1 k=pj=13)以B作为新的因子载荷矩阵,重复2),直至前后两次的L之差绝对值小于精度1要求为止。4)将最后求得的旋转因子载荷矩阵进行正规化还原,得G=(b*h)即为正交因jkj子解。(8)计算因子得分:求RT,按式(10-33)估计F。(10-33)A (10-33)F=S'R-1Zkk其中,S'=(rF,rF,,rF)。k z1kz2k znk11数据包络分析技术DEA方法概述DEA(DataEnvelopmentAnalysis)方法又称为数据包络分析方法,是对多指标投入和多指标产出的相同类型部门,进行相对有效性综合评价的一种方法,也是研究多投入多产出生产函数的有力工具。在社会、经济和管理领域中,常常需要对具有相同类型的部门、企业或者同一企业在不同时期的相对效率进行评价,这些部门、企业或时期称为决策单元(DMU),亦称为评价单元。评价的依据是评价单元的一组投入指标数据和一组产出指标数据。投入指标是指评价单元在社会、经济和管理活动中需要消耗的经济量,例如固定资产原值、流动资金平均余额、技术研发资金、投入的人力资源量、占用土地等。产出指标是指评价单元在某种投入要素组合下,表明经济活动产生成效的经济量,例如总产值、销售收入、利税总额、产品数量、劳动生产率、产值利润率等。DEA方法就是根据投入指标数据和产出指标数据评价决策单元的相对效率,即评价部门、企业或时期之间的相对有效性,它是评价多指标投入和多指标产出评价单元相对有效性的多目标决策方法。DEA方法是美国著名运筹家查恩斯(A.Charnes)和库伯(W.W.Cooper)教授在“相对效率评价”概念基础上发展起来的一种新的系统分析方法。1978年,查恩斯、库伯和罗兹(E.Rhodes)提出了第一个DEA模型,评价部门间的相对有效性,这个模型被命名为C2R模型。用这个模型评价多投入多产出生产部门的规模有效性和技术有效性是十分有效的。1986年,查恩斯、库伯和中国人民大学魏权玲教授为了进一步的估计有效生产前沿面,提出了评价无穷多个评价单元的一种新的C2W模型。此后,又有多种DEA模型相继提出,DEA方法正在不断的完善和进一步发展,有关的理论研究不断深入,应用领域日益广泛,可以说,DEA现已成为管理科学与工程领域一种重要而有效地分析工具。DEA基本模型基本概念在多投入和多产出的评价系统中,某种“生产”活动可以用一组投入指标值和产出指标值表示,评价单元DMUj的一组投入指标值xj和产出指标值yj用向量表示为:X=(%,x,...,x)T (11-1)j 1j2j mjY=(4,y,...,y.)T (ii—2)j 1j2j mj (口々一般称集T={(x,y)|产出y能用输入x生产出来}为所有可能的生产活动构成的生产可能集,有(x. ,y,)£ ……根据实际情况和研究问题的方便,一般都假设生产可能集满足下面条公理:() 凸性:对任意的(x,y)£和(%,,y,)eT,以及ae[0,1],有( )a,,e即如果分别以x和x,的。和(a)倍之和作为新的输入,则可得到原产出相同比例之和的新产出,凸性表明T是一个凸集。()锥性:若(,)eT及k>0,贝Uk(x,y)=(kx,ky)eT (11-4)即若以原输入的k倍为新的输入,则得到原产出的k倍是可能的。()无效性:设(,y)eT若x'>工,则(x',y)eT若y'«y,则(x,y')eT这说明在原来的生产活动的基础上增加投入或减少产出进行生产总是可能的。() 最小性:生产可能集T是满足上述条件的所有集合的交集。在满足(1)~(4)的基础上,对于已有的观测值(x,y)(j=1,2,…,n)jj可得:jji=1jji=1T={(x,y)1k£ax<x,k£ay>y,a>0,Ea=1,k>0}jji=1jji=1若令ka=九 (j=1,2,…,n),则有:jj

(11-6)T={(x,y)Ik£Xx<x,£Xy>y,九>0}(11-6)jj jj jj=1 j=1若把公理条件(2)去掉,则为:T={(x,y)IT={(x,y)Ik£九x<九£九y>y入>0,£九=1jjj=1jjj=1j jj=1(11-7)11.2.2基本C2R模型11.2.2基本C2R模型AC2R模型设有n个部门或企业,称为n个评价单元DMUJ(j=1,2,…,n),每个评价单元都有m种投入和p种产品,分别用不同的经济指标表示,这样,构成了有n个评价单元的多指标投入和多指标的评价系统,如图11-1所示。图中,x表示DMUt评价单元第i种投入指标,x>0;ij J ijy”表示DMUJ评价单元第r种产出指标的产出量,y,>0;v表示第i中投入指标的权系数,V>0;

i i11.2.2基本C2R模型AC2R模型设有n个部门或企业,称为n个评价单元DMUj(j=1,2,……,n),每个评价单元都有m种投入和p种产出,分别用不同的经济指标表示,这样,构成了有n个评价单元的多指标投入和多指标产出的评价系统,如图11-1所示。图中,xij表示DMUj评价单元第i种投入指标,xij>0;yrj表示DmU,评价单元第r种产出指标的产出量,yrj>0;v:表示第i种投入指标的权系数,vi>0; "12■一 n(评价单元)v11 _ ►x11x12… x1n(投入)V22 , ►X21x22… x2nFvmrm .Xm1xm2,3xmny11y12… y1nju11y21y22… y2nu2 P-2(产出)■ »**ym1ym2…ymmnPup图11-1 DEA评价系统的构成ur表示第r种产出指标的权系数,u图11-1 DEA评价系统的构成ur表示第r种产出指标的权系数,ur>0(i=1,2,……,m;j=1,2,……,p)。xij和yrj是向量xj=(x1j,x2j, ,xmj)T和yj=(y1j,y2j, yj中的分量,可以根据历史资料、统计数据和预测计算得到。ur,vi是指标权系数。在图11-1所示的评价系统中,设投入指标和产出指标的权系数向量分别为v=(v1,v2, ,vm)T (11-8)u=(u1,u2, ,up)T (11-9)对评价单元DMUj,定义其效率评价指标为:PEuryrjhj=r-^1 (j1,2;)n (11-10)m、,•••EviXiji-1由此定义,我们有:总可以适当地选取口>,使hj<1;粗略地说,对于评价单元DMUj0,hj0越大,表明DMUj0能够用相对较少的输入得到相对输入较多的输出。 JJ J要评价现在第j0个评价单元相对有效性,即如果我们想了解DMUj0在这n个DMU中来说是不是“最优”的,须建立评价系统的C2R模型。 J设第j0个评价单元的投入向量和产出向量分别为:x0=(x1j0,x2j0,"■Xmj0)Ty0=(y1j0,y2j0,■-ypj0)T效率指标h0=hj0。在效率评价指标hj<1(j=1,2,数u和丫,使得h;达到最大值。构造最优化模型:一,n)的约束条件下,选择一组最优权系Euy.maxh=r=1rr00E…vxVXiiji=1(11-11)Euy(11-11)s.t.errj0<1(j=1,mVXv>0 (i=12,m)iu>0 0=12,p)r此模型称为C2R模型,是最基本的DEA模型。用C2R模型评价第j0个评价单元相对有效性,是相对于其他评价单元而言的,故称为评价相对有效性的DEA模型。模型式(11-11)可以表示为矩阵形式。记xj=(x1j,x2j,…,xmj)♦^=3也,…,ypj)T有: JJJ JJJ,PJ…iuTymaxh=o0vTx

ouTys.t.」<1(j=1,,n)vTx*jv>0,u>0 …(11-12)(P)是一个分式规划,利用Charnes-Cooper变换,可以转化为一个等价的线性规划问题。若令:(11-13)则有uTy从Ty= 00 vTx0uTy uTy——j=——j<1(j=1,wTx vTxj jwTx=10w>0,N>0(11-14)于是(P)可变换成下面的线性规划模型:maxNTy=V0ps.t.wTx-NTy>0(j=1,,n)j jWTx=10…w>0,N>0(11-15)由于(p)可以表示成:定义定义11.2如果线性规划(P)的最优解30,旦0满足条件/ 、/0)TOC\o"1-5"\h\zmax(wt,从t) =Vo)s.t.WTX—NTy>01 1WTX—NTy>0

2 2((11-16)wtx—wtx—nTy>0

n nWTX-10w>0,N>0故根据线性规划对偶理论知,(p)的对形式为:min(X/,1-vD(D(D')〈(11-17)j-1j-1—ZNy>yjj0j-1NY0,0符限制j引入新的变量s+,s-,并令—X'-X,可将(D')表示成:

jj〃minV=0Ds.s.tZxj九+s—=0Xj=1(11-18)ZyX—s+=y(11-18)jj 0j-1X>0(j'=1,,n)js+>0,s->0其中,松弛变量s-=(s1-,s2-,…,sJ)T,s+=(s+,s+,,:s+)T。

1 2 p一般直接称(D)为线性规划(P)的对偶规划问题。例11.1设有4个评价单元,2个投入指标和1个产出指标的评价系统,其数据如图11-2所示。写出第一个评价单元相对效率的C2R模型。1 2 3 413343132r11 1 2 1解:由式(11-16)和式(11-18)知,评价第一个评价单元DMU1相对效率的C2R模型的线性规划(P),对偶规划(D)分别为:maxV=日p1S.t.3+33一目>0TOC\o"1-5"\h\z12 133+3一目>01 2 1《33+33一2日>01 2 143+23—日>01 2 13+33=1123,3>0,日>0112 1minV=0Ds.t入+3入+3入+4入+s-=01 2 3 4 1(。乂 3入+入+3入+2入+s-=30\o"CurrentDocument"1 2 3 4 2\o"CurrentDocument"入+入 +2入 +入 一s+ =11 2 3 4 1入,入,入,入>0,s-,s-,s+>012 3 4B评价系统的DEA有效性用模型(P)给出评价决策单元j0为DEA有效的定义。定义11.1如果线性规划(P)的最优解30,N0满足条件V=日Ty=1 (11-19)p 0则称评价单元DMUj0为弱DEA有效。V=NTy=1 (11-20)po并且①0>0,即>0,则称评价单元DMUj0为DEA有效。由定义11.1和定义11.2可知,如果一个评价单元DMUj0为DEA有效,则也是弱DEA有效。由线性规划(P)和分式规划由)的等价性可知,最优解①0,即使小)取得最优值Vp,同时也使(P)取得最优值V,并且两个等价问题的最优值V=V=h『1.因此,评价系统DEA有效,就是指评价单元pp0DMUjn相对于其他评价单元,效率评价指标取得最优值,在多指标投入和多0指标产出情况下,取得最佳经济效率。对于C2R模型,线性规划(P)及其对偶规划(D)都有可行解,有下述定理,限于篇幅这里不加证明。定理11.1线性规划(P)及其对偶规划(D)都有可行解,因而都有最优解,并且最优值VD=Vp<1 (11-21)根据线性规划的对偶理论,判定评价单元的DEA有效性,也可以利用对偶规划(D)。定理11.2关于对偶规划(D)有:(1)如果(D)的最优值VD=1,则评价单元DMUj0,为弱DEA有效;反之亦然。如果(D)的最优值V-并且每个最优解入。二(九0,九0,,九0)T,s0-,D=1 12 ns0+,6。都满足条件S0-=0,s0+=0,则评价单元DMUj;为DEA有效;反之亦然。在实际应用中,评价系统的投入和产出指标均有不同的量纲。关于最优效率指标和量纲的关系,有下面的定理。定理11.3评价单元的最优效率指标V与投入指标1及产出指标值y的量p ij rj纲选取无关。11.3 DEA有效地经济意义与规模效益分析生产函数2 2 1 3图11-32 2 1 3图11-3生产函数曲线图11-3所示为单输入单输出的生产函数y=f(x)的曲线,它表示生产处于理想状态时,投入量为x时所能获得的最大产出量为y。因此,生产函数曲线上的点A(x1,yj、C(x3,y3)代表的DMU都处于“技术有效”的理想状态,而点B(x2,y2)不在生产函数曲线上,是非技术有效的。一般生产函数是增函数,即随着投入量的增加,产出量也在增加,但根据边际产出递减规律,在生产函数上,总有这样一个点(如图11-3中的A点):在该点的左边,了>0,y〃>0,即随着投入量的增加,产出量加速增加,此时称为规模有效的(收益递增);在该点的右边,了>0,H<0,即随着投入量的继续增加,产出的增加开始减少,此时称为非规模有效的(收益递减)。图11-3中,A(x1,y1)、B*(x2*,y2)、C(x3,y3)均在生产函数曲线上,即其代表的评价单元DMU均为技术有效的。但A(x1,y1)是生产函数的拐点,对应的评价单元DMU既是技术有效的,也是规模有效的,此时减少投入量或增加投入量都不是最佳生产规模;B*(x2*,y2)位于规模收益递增区,对应的评价单元DMU是技术有效的,但非规模有效,可以增加投入可获得更大的产出效益;C(x3,y3)位于规模收益递减区,对应的评价单元DMU是技术有效的,也非规模有效。B*(x2*,y2)为B(x2,y2)在减少投入的情况下在生产函数上的投影,实际是有效地,即非技术有效的B(x2,y2)点对应的评价单元DMU可以通过减少投入或增加产出而得到改进称为技术有效的评价单元。通过带有8的模型(DJ,用定理11.4.容易判定评价单元DMUDEA的有效性,但要判断其是否为模型有效,有如下定理判断。定理11.5设线性规划(D)的最优解为九0,so-,s0+f08有:(1)e0=1当且仅当评价单元DMUjo为最大产出规模点;⑵若eo£入厂⑵若eo£入厂1j=1,则评价单元DMUjo的规模收益不变;(3)若e1o£九尸1

j=1,则评价单元DMUjo的规模收益递增;(4)若1-£入o>1,则评价单元DMUj的规模收益递减。eo j oj=1DEA生产函数构成根据DEA的原理,DEA有效地DMU在给每个投入指标和每个产出指标乘以一个加权数(即该DMU得权变量的解)后,其产出加权和与投入加权和只比是最大的,因为所有的其他DMU用同样的加权系数算出这一比值都不会超过1.所以,DEA有效地评价单元可以认为已经处于理想状态,在其相应的投入规模上已经达到最大产出量。实际上,可以把这样的投入产出关系认为是生产函数上的一点,由各不同规模上DEA有效的投入产出关系就能得到完整的生产函数。这样的生产函数与用回归分析得到的生产函数不同的是,它是由本行业优秀的单位投入产出关系组成,而不是回归分析方法中求出的生产函数反映的本行业的平均水平。从生产函数的严格定义来看,DEA方法算出的才是真正的生产函数。另外一点不同的是,DEA方法不能直接求出一个经验公式。在单指标投入和单指标产出的情况下,DEA方法能在一组样本中筛选出在生产函数上的点,可以再用回归分析方法求出一个经验公式。但在多指标投入和多指标产出的情况下,DEA有效地所有的DMU不能落在一条曲线上,而是形成一个超平面,它是生产函数的扩展,DEA方法称之为生产前沿面。图11-4所示为单指标投入和单指标产出的情况。图11-4生产前沿面11.3.3 DEA有效性的经济含义现在来讨论DEA有效性的经济含义。事实上,我们通过minV=0Ds.t工九jjj=1£y入jjj=1入>0j<0x0>y0(j=1,来评价决策单元DMUj0的有效性,这表明⑴)力图在输入可能集中,在保持产出不变的前提下,将投入的各个分量按同一比例减少。如果这一点能够实现,则表明可以用比DMUj更少的投入而使产出不变。这正说明了眼下的DMUj必不是有效的生产活0 0动反之则表明DMUj0是有效的生产活动。为了使DEA有效性的经济含义更清楚,我们把问题(P)的目标函数maxuTy0-=VVTX P0取其倒数而改为:min竺"=忆 (11-26)VTX p0并类似地令t= ,3=tv,H=tuuTy0这样,就得到一个与(P)等价的线性规划(P)':(P)minotx=V'0pS.t3tx-HTy>0j=< jjuTy=1

03>0,H>0(11-27)以及(P)'的对偶规划模型TOC\o"1-5"\h\z\o"CurrentDocument"s.t2九x+s—二x

jj 0j=1(11-28)\o"CurrentDocument"2九y-s+=ayjj o(11-28)jT\o"CurrentDocument"九>0(j=1, ,n)js+>0,s->0规划问题(D)与(D)'的最优解之间有着非常密切的关系。一般地,设九*,ss*+,0*为(D)的最优解,而九**,s**-,s**+,a*为(D)'的最优解,则有九**s*九**s*-s*+ s**+0*'(11-29)一般情况下,模型(P)与(D)主要是研究单元DMU输入的有效性,而(P)'和(D)'则主要是研究DMU输出的有效性。11.5评价单元的排序从前面的分析可知,在应用DEA进行有效性评价时,如果评价单元DMUj的效率指0数为1就称DMUj为DEA有效的,否则即为非DEA有效的。但是,非有效的DMU之间0的优劣性无法简单地从效率指数值的大小进行排序对比分析,也即位于生产前沿面之外的评价单元无法直接对比。

对DEA评价单元进行排序的研究方法有多种,这里介绍两种简单实用的方法。(1)分级评价法。分级评价方法是运用DEA评价模型反复对评价对象进行有效性判断,从而将评价对象分出不同级别的优先序。首先,对所有评价单元DMU进行第1次有效性评价;然后,剔除DEA有效的DMU,再对其余非DEA有效单元,即没有达到生产前沿面的评价单元DMU进行第2次评价。如此往复进行,当所剩余DMU均为非DEA有效的或均为DEA有效时停止。其中,第1次效率指数为1的评价单元DMU称为第1级有效,第2次效率指数为1的评价单元DMU称为第2级有效,依此类推,就可以得到DEA分级有效评价结果。该方法的最大优点是不需要构造新的评价模型,解算简单。但它只是对所有的评价单元进行了级别划分,在每一级别内,即在同一次评价中,效率指数为1的多个(若存在)评价单元则无法进行有效排序。(2)虚拟单元法。虚拟单元法将线性规划(。)的最优解中00的值作为评价系统的8排序判断值,即00的大小顺序即该评价单元DMUj的优劣顺序。但在运用一般意义上的0DEA模型对系统进行评价时,对于效率指数为1,即DEA有效的评价单元则不能加以有效排序区分。为了克服这一不足,特引入一个虚拟的评价单元DMU替代一般模型约束条n+1件中的评价单元DMUj,以有效区分各评价单元之间差异程度。设DMU的输入输出为0 n+1(x ,y),其中x=max元(i=1,2,…,m),y=miny(i=1,2,…,p)。该虚i,n+1k,n+1 i,n+1]<j<nij k,n+11<j<nkj拟的评价单元实际上就是一个最差的评价单元,使得评价系统中的原来的各评价单元相对于这个虚拟评价单元变得更为有效,这样就达到了可以进一步比较各评价单元效率的差异程度,从而进行排序的目的。引入一个虚拟的评价单元DMU后,评价系统的评价单元排序效率指数由下述n+1规划问题求出:min[0-8(ets-+eTs+)]=VD8,n+1;j丰j)0••,n+1;j丰j)0(11-33)s.t.n+1,n+1;j丰j)0••,n+1;j丰j)0(11-33)jT2y九-s+=y(j=1,2,jj 0jT九>0(1<j<n+1)(j=t,-2,js+>0,s->0可以证明该模型的相关DEA理论都是成立的。该模型通过吧虚拟评价单元的输入、输出替代约束条件中评价单元DMUj的输入、输出,使评价单元既利用了虚拟评价单元的有0关信息,有利用了其他评价单元的有关信息,其评价效率值在虚拟评价单元的基础上都有所增加,效率值越大,说明与虚拟评价单元的差距也越大,该评价单元DMUj相对也就越好。0评价效率值的大小顺序即该评价系统中评价单元DMUj0的优劣顺序。11.6DEA评价应用分析DEA评价特点和步骤ADEA方法的优越性及特点根据各评价单元DMU观测数据判断其是否对DEA有效,本质上是判断评价单元DMU是否位于生产可能集的前沿面上。生产前沿面是经济学中生产函数向多产出情况的一种推广,使用DEA方法可以确定生产前沿面的结构,因此又可将DEA方法看作是一种非参数的统计估计方法。使用DEA对评价单元DMU进行效率评价时,由于DEA方法对输入、输出指标有较大的包容性,可以接受那些在一般意义很难定量的指标。因此,他在处理评价问题时比一般的常规统计方法更有优越性,主要表现在如下方几面:可以同时计算多种输入和输出指标,输入和输出的数据可以为不同计量单位的指标,不需预先确定指标间的关系和赋予指标主观权重;计量经济学中采用的长期趋势外推的统计方法,是对整个生产前沿面所进行的平均意义的操作,得到的分析结果只能是“平均意义”上的统计结果,不能对经济发展的各个阶段做出有效的评价。DEA方法改变了过去评价方法中将有效与非有效混为一谈的局面,估计出确实有效地生产前沿面;致力于每个评价单元DMU优化而不是对整个集合的统计回归优化,与传统的计量经济学方法相比较,DEA方法不需要一个预先已知带有参数的生产函数形式;不仅可排序,还可以提供非DEA有效单元的具体改进建议。B应用DEA模型得到的评价信息设计出科学的效率评价指标体系;确定各评价单元DMU的DEA有效性(技术有效性与规模有效性);算出各评价单元DMU在有效生产前沿面上的“投影”,为今后生产效率和管理水平提供参考信息。分析各评价单元DMU的有效性对各输入、输出指标的以来情况,了解其在输入和输出方面的优势和劣势;分析各评价单元DMU之间DEA有效性的依赖关系;各评价单元DMU进行“类序”分析,为宏观决策提供参考。CDEA评价过程步骤定评价目的。DEA方法的基本功能是“评价”,特别是进行多个同类样本间的“相对优劣性”的评价。这样,就有一系列的问题需要明确,如哪些评价单元DMU能够或适宜在一起进行评价,通过什么样的输入/输出指标体系进行评价,选择什么样的DEA模型进行评价等等。择评价单元DMU。选择评价单元DMU就是确定参考集。由于DEA方法是在同类型的评价单元DMU之间进行相对有效性比较,因此选择评价单元DMU的一个基本要求就是DMU的同类型。同类型一般指具有相同的环境、相同的输入和相同的任务等物理背景;并不是评价单元DMU的个数越多越好,过多难以做到同类性,通常认为参考集元素的个数不少于输入/输出指标总数的2倍为好。立输入/输出指标体系。输出向量与输入向量的选择要服务、服从于评价的目的,并能全面反映评价目的。一般一个评价目的需要多个输入和多个输出才能较为全面地描述,缺少某个或某些指标常会使评价目的不能完整地得以实现;充分考虑到输入向量、输出向量之间的联系;要考虑输入/输出指标体系的多样性。(4)DEA模型的选择。根据输入(出)指标的可控性和可处理性,选用基于输入的DEA模型或选用基于输出地DEA模型,具有非阿基米德无穷小的DEA模型在判定评价单元DMU是否为(弱)DEA有效以及将原来无效的评价单元DMU“投影”到相对有效面上均有方便之处,所以在实际中这一模型常被应用。有特殊要求的系统要有针对性的选择模型。D模型运算与评价后分析一般模型运算可借助一定的计算机运算程序,在运算中要注意对运算模型及程序的验证。具体问题的研究,很重要的一步是针对特定问题对计算结果进行分析解释,从计算结果中提炼出问题的实质。应用案例A组织绩效评价大型医院的经

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论