![基于协方差矩阵的多指标系统排序评估_第1页](http://file4.renrendoc.com/view/c5973102f8b44886e4661d48201c6d76/c5973102f8b44886e4661d48201c6d761.gif)
![基于协方差矩阵的多指标系统排序评估_第2页](http://file4.renrendoc.com/view/c5973102f8b44886e4661d48201c6d76/c5973102f8b44886e4661d48201c6d762.gif)
![基于协方差矩阵的多指标系统排序评估_第3页](http://file4.renrendoc.com/view/c5973102f8b44886e4661d48201c6d76/c5973102f8b44886e4661d48201c6d763.gif)
![基于协方差矩阵的多指标系统排序评估_第4页](http://file4.renrendoc.com/view/c5973102f8b44886e4661d48201c6d76/c5973102f8b44886e4661d48201c6d764.gif)
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于协方差矩阵的多指标系统排序评估
0评价方法的选择在实际统计中,经常存在多指标系统分类评估的问题。由于主成分分析方法能浓缩信息,简化指标的结构,使分析问题的过程简单、直观,故广泛应用于各个领域。传统的主成分综合评价是一种加性加权和法。这种通过计算主成分“综合得分”的方法看似合理,似乎可以提高信息含量(增加方差贡献率),其实这只是一种错觉。文献用严格的数学推导公式指出传统主成分分析用于综合评价的误区,即综合得分的方差小于第一主成分的方差。但是,当第一主成分的方差贡献率不够高时(≤85%),即信息含量不够大时,对于多指标系统评估中的排序问题,仅按第一主成分得分对样本排序评价存在一定的片面性。在实际应用中,原始数据各指标间往往呈现出非线性关系。而从本质上讲,传统主成分分析是一种线性映射方法,对于指标间的非线性关系往往得到并不理想的效果。为此专家、学者已提出了一系列的非线性主成分分析方法。文献对15个副省级城市专利(见表1)的综合发展状况进行了评价,其中使用了“主成分综合得分”“主成分聚类”。本文使用核主成分分析方法(KPCA)进行重新评价,可以得到方差贡献率很高(≥85%)的第一主成分,因此可以仅按照第一主成分得分对样本进行排序评价。最后本文结合传统的聚类分析方法,将得到的方差贡献率足够高的第一主成分作为权值,计算出聚类后每个类别中各指标的加权平均值。由此得到的加权值可以更准确的表示出每一类中各指标的平均取值水平,以便于进一步的分析和应用。1综合评价15家市级专利发展原始数据如表1所示。1.1培养np的协方差矩阵设原始数据:X=(xij)n×p,令,i=1,2,…,n;j=1,2,…,p,其中…,p,得到均值化数据矩阵Y=(yij)n×p,设Y=(yij)n×p的协方差矩阵为U=(uij)p×p,由于Y中每个列向量的均值为1,则有:其中sij为原始数据的协方差矩阵,i,j=1,2,…,p,特别的,,即均值化数据的协方差矩阵主对角元为各指标间变异系数的平方。设Y=(yij)n×p中各指标的相关系数为r*ij,则:其中rij为原始数据各指标间的相关系数。由此可见,使用“均值化”方法得到的新数据的协方差矩阵不仅消除了量纲的影响,还包含了原始数据的全部信息。从而对表1的数据进行均值化处理,得到的结果如表2所示。1.2模型a确定主观聚类KPCA的基本思想是首先通过非线性变换将输入空间变换到高维空间,然后高维空间就成为线性可分的。而这种非线性变换是通过定义适当的内积函数实现。设xi∈Rp(i=1,2,…,n)为样本点,把输入空间Rp通过非线性变换准映射到特征空间F,即:F中的样本点记为准(xi),(i=1,2,…,n)。假设映射已经中心化,即F空间中样本的协方差矩阵为:根据求C的特征值λ和λ所对应的特征向量V∈F\{0},C的特征值均为非负。由(3)式看到,计算C需要知道准(xi)和准(xj),而准是未知的,所以无法计算C。不失一般性,设C的特征值为0≤λ1≤λ2≤…≤λn,对应的特征向量分别记为v1,v2,…,vn。另外,v1,v2,…,vn可由F空间中的样本准(xi)张成。记考虑等式将(3)(5)代入(6)并令K=(kij)n×n=(准(xi)·准(xj))(i=1,2,…,n)得其中K称为核矩阵,是n×n矩阵。nλi是K的特征值,α1,α2,…,αn是对应的特征向量。按一定的标准(前几个特征值占总特征值的比例≥85%),取前m(m<n)个特征值和对应的标准化后特征向量α1,α2,…,αm,其中此时F空间中样本准(xj)(j=1,2,…,n)在vr上投影:称gr(xj)为对应ɸ的第r个非线性主元分量。将所有的投影值形成一个矢作为样本的特征值。根据Mercer定理,用核函数K(xi,xj)=(ɸ(xi)·ɸ(xj))代替F空间中的内积运算,(8)式可写为:当假设(2)式不成立时,需要对映射进行调整,设经过变换,假设(2)式成立,那么就可定义矩阵有对均值化后的矩阵采用KPCA,选择多项式核函数K(x,y)=[c(x·y)+m]d,且c=0.1,m=0,d=0.4,得到一个新的矩阵K。用Matlab计算,得K矩阵的前三个最大特征值为(3.49410.28560.0522),第一方差贡献率达到91.38%。指标信息丢失量较低,因此仅用第一主成分的得分对样本作出排序,结果如表3所示。文献中使用“主成分得分”“主成分聚类”对表1中的数据进行了评价,下面给出各种方法的排序结果以做比较,见表4。从原始数据分析可以看出,济南在三个指标上略高于长春,而长春也在一个指标上比济南高,二者相差不大,实力相当,从KPCA所得到的主成分得分可以看出两者的接近程度。西安在两个指标上略高于大连,而大连在另外两个指标上略高于西安,二者的得分亦十分接近。主要问题在沈阳和深圳的排名上,虽然深圳在三个指标上都高于沈阳,但最后一个指标———发明专利授权量沈阳却远远高于深圳,理应排在深圳的前面。而传统的主成分综合得分和主成分聚类都存在一定的局限性,不能很好的说明这一点。1.3等级结构因子分析进一步,对核主成分分析方法选取的第一主成分进行系统聚类分析,得到图1所示的结果:根据此聚类结果可以将城市划分成四个大类别。在每个类别中取各个样本的第一主成分得分(由KPCA方法得到的作为权值分别计算出这四个类别中各个指标的加权平均值。例如,记类别1中西安、大连、哈尔滨、青岛、成都的第一主成分得分值分别为f11,f12,f13,f14,f15,指标X1的取值分别为x11,x12,x13,x14,x15(均值化后的矩阵),若记类别1中指标X1的加权平均值为X11,则有依此算出其他类别中各指标的加权平均值,并对其进行排名,得到的结果如表5所示。类别4中只含有广州一个城市,广州市的各项指标几乎都处于最高水平,所以单独成一类。其他三个类别中各个类别所包含的城市实力基本相当,因而聚为一类。相对于传统的取类别中各指标的平均值的计算结果,加权后的值能更准确的表示出每一类别中各个指标的大小。经加权得到的上述矩阵,可以更准确的表示出类内各指标的平均取值情况,若要将该分类结果合并为更小的类,那么就可以在上述矩阵的基础上再采用我们前面叙述的核主成分的方法对其进行排序聚类。这种方法对数据量较大的矩阵的分类有更好的适用性。2基于核主成分和加权聚
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- racemic-6-7-Epoxy-cannabichromene-生命科学试剂-MCE-6900
- Gluconapin-生命科学试剂-MCE-5096
- 25B-NB3OMe-hydrochloride-生命科学试剂-MCE-6391
- 施工日志填写样本外墙装饰工程
- 跨代沟通与家庭关系中的文化融合
- DB15T 3843-2025新能源分布式电源并网技术规范
- 云计算建设项目服务合同
- 事业单位与员工停薪留职合同范本
- 个人车位交易合同范例
- 个人企业房屋租赁合同模板
- 苏州2025年江苏苏州太仓市高新区(科教新城娄东街道陆渡街道)招聘司法协理员(编外用工)10人笔试历年参考题库附带答案详解
- 搞笑小品剧本《大城小事》台词完整版
- 物业服务和后勤运输保障服务总体服务方案
- 2025年北京市文化和旅游局系统事业单位招聘101人笔试高频重点提升(共500题)附带答案详解
- 中学学校2024-2025学年第二学期教学工作计划
- 人大代表小组活动计划人大代表活动方案
- 《大模型原理与技术》全套教学课件
- 2023年护理人员分层培训、考核计划表
- 《销售培训实例》课件
- 2025年四川省新高考八省适应性联考模拟演练(二)地理试卷(含答案详解)
- 【经典文献】《矛盾论》全文
评论
0/150
提交评论