数学建模之主成分分析法_第1页
数学建模之主成分分析法_第2页
数学建模之主成分分析法_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主成分分析主成分分析的主要目的是希望用较少的变量去解释原来资料中的大局部变量, 将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大局部资料中的变异的几个新变量, 即所谓主成 分,并用以解释资料的综合性指标。1、主成分分析的应用1我国各地区普通高等教育开展水平综合评价。2投资效益的分析和排序等。2、主成分分析法的步骤 对原始数据进行标准化处理a表示第i个评价对象对应于第用Xi,X2,Xm表示主成分分析指标的m个变量,评价对象有n个,j个指标的取值。将每个指标值aij转化为标准化指标aij,aijaj jSj,(i1,2,n; j 1,2,,m)式

2、中:naij ,Sj(ajj)21相应地,标准化指标变量为XjXjj,( j 1,2,m)Sj 计算相关系数矩阵Rnaki akjrij口,(i,j1,2,,m)n 1其中:rii1,rijrji, rij是第i个指标和第j指标之间的相关系数 计算相关系数矩阵的特征值与特征向量解特征方程I I R 0,得到特征值i(i 1,2,m) !2,m 0 ;再求出相对应的特征值i的特征向量Ui(i 1,2,,m),其中Uj (Uij,U2j,,Umj)T,由特 征向量组成的m个新的指标变量为yi U1ixi U21X2Umixmy2U12X1U22X2 Um2Xmym U1m Xl U2mX2UmmX

3、m其中:Vi为第1主成分,y2为第1主成分,?,ym为第m主成分 选择p (p< m个主成分,计算综合评价值。(1)计算特征值j(j 1,2,,m)的信息奉献率和累积奉献率用bj表示主成分yi的信息奉献率,那么有bj 帀(j 1,2,,m)用ap表示主成分必,yp的累积奉献率,那么有ap假设ap接近于1 (一般ap的围为85%95%时,那么用前p个指标变量 %2,yp作为p个主成分,代替原来m个指标变量,再对p个主成分进行 综合分析。计算综合得分用bj表示第j个主成分的信息奉献率,那么有pZbjyjj 1根据综合得分值进行评价。例题:高等教育是依赖高等院校进行的,高等教育的开展状况主要表

4、达在高等院校的 相关方面。遵循可比性原那么,从高等教育的五个方面选取十项评价指标, 具体如 图1。?中国统计年鉴,1995?和?中国教育统计年鉴,1995?除以各地区相应的人 口数得到十项指标值见表1。其中:&为每百万人口高等院校数;X2为每十万人 口高等院校毕业生数;X3为每十万人口高等院校招生数;X4为每十万人口高等院 校在校生数;X5为每十万人口高等院校教职工数;X6为每十万人口高等院校专职 教师数;X7为高级职称占专职教师的比例;X8为平均每所高等院校的在校生数;高教发廣水平X9为国家财政预算普通高教经费占国生产总值的比重;X10为生均教育经费母+万人口芈业生数毎十万人招生敕犀

5、十万人口在校生数髯十万人口敎貝日丄数数爲十迈人!讶职教师数数I高级职称占专段報冲的比例 因家财政预卑内普過莊琴教趣贯占' 帀替.亡总邂!車, 平均谢自歸筋J图1高等教育的十项评价指标表1我国各地区普通高等教育开展状况数据地垃斗l屯兀些斗齐X9切北京596310401155793131944.3626152.20136313 39234303103549S161JS023052.£X)12665天津2.351S72297132951093B4O30J1.B69385琳卩1 35811H36415055304526991.227«8l辽中1.50831284211445

6、654302 80S.547733l.b7Sb120 一J70153A3i.$3221s7480黒 Jfcl T117632M11744巧?2252S劭TO湖北0567汇2971154332,892835仗7262.95阴SM28710239J1543 QOS397786厂嬴旳397120S2434.5029蔣.3711355RJIISd40571776i23i262314055山*:.5758641S157>252.953202.286S05.71426219066262«432657.-J7282湖阳.7442011946124261S.47&477渐ZL4?71期

7、(W26?Q 37価?577041.294773265114斗625.932060.375719101SJ7121E632629.0120SM>7106山两S551652L87dSO25 33255S435580i«JJL.814J6613S612329.822313315704.593547L46462032.832488335623云南菊40130441923 551974.489106江西.774363L94672S28LS12515344085海南.703551165471S27.342344.287928内蒂占&44348171652927.652032325

8、581西蔵1 692645137r 7512.108101 0014199河南,5552羽L30441723412341如5714广西602843129391731.932146.2451391394S6120877342.701500.425577庸州.64233293371628.121469345415杳海1483846151 61po17.S710243S7i6S请对各地区高教开展水平进行综合评价值与排序。解:定性考察反映高等教育开展状况的五个方面十项评价指标,可以看出,某些指标之间可能存在较强的相关性。 比方每十万人口高等院校毕业生数、 每十万 人口高等院校招生数与每十万人口高等院校

9、在校生数之间可能存在较强的相关 性,每十万人口高等院校教职工数和每十万人口高等院校专职教师数之间可能存 在较强的相关性。为了验证这种想法,计算十个指标之间的相关系数。可以看出 某些指标之间确实存在很强的相关性, 如果直接用这些指标进行综合评价, 必然 造成信息的重叠,影响评价结果的客观性。主成分分析方法可以把多个指标转化 为少数几个不相关的综合指标,因此,可以考虑利用主成分进行综合评价。利用MATLAB件对十个评价指标进行主成分分析,相关系数矩阵的前几个特 征根与其奉献率如表2。表2主成分分析结果序号特征根虫献率累计奉献率7.502275.021675.0216产i1.57715 7(5999

10、0.791530.53625 362196.1531540.20642 06389S.217450.1451 450099.6674£0 02220.2219?9S893可以看出,前两个特征根的累计奉献率就到达 90沖上,主成分分析效果很好F面选取前四个主成分累计奉献率就到达 98%进行综合评价。前四个特征根 对应的特征向量见表3。表3标准化变量的前4个主成分对应的特征向量第1特 征向0,34970.3 5 W03621O3W50.3 6020-241Q-12010.2452漑特-3.1972&.C1430.0291OjOB<-0.0507-C.tk6460.701-0

11、.1M1取2M5簷向-0,1639-0.10S-1090Q1138-0. 1534-a, 14=|0 039?Q3577O. 12040. S637卸特1E向-0 10220.22W-0 1692-0,16074 04424).0032Q. 08120.07030. S999:.::-由此可得四个主成分分别为:y 0.3497% 0.359X2 O.2452X10y20.1972x1 0.034% 0.286x10y30.1639X, 0.1084X2 0.8637&y40.1022Xi 0.2266X2 0.2457Xi0从主成分的系数可以看出,第一主成分主要反映了前六个指标 学校数

12、、学生 数和教师数方面的信息,第二主成分主要反映了高校规模和教师中高级职称的 比例,第三主成分主要反映了生均教育经费,第四主成分主要反映了国家财政预算普通高教经费占国生产总值的比重。把各地区原始十个指标的标准化数据代入 四个主成分的表达式,就可以得到各地区的四个主成分值。分别以四个主成分的奉献率为权重,构建主成分综合评价模型:Z 0.7502% 0.1577y2 0.0536y3 0.0206y4把各地区的四个主成分值代入上式,可以得到各地区高教开展水平的综合评价值 以与排序结果如表4。表4排名和综合评价结果地区湖北江2广东134678310评价值4473SZ7U1OJ1M|0.76210.5SS40 29710.2455Q.G51L0.005 &地区也川山东甘席譎閘睛江:描农山起江北安晝11121314151617101920评价值-O26S-0,364$-0.4S79-:: r?-0. 7016-0. 7423-0.7S97-0, T965PL 3S95-Q. SS17怛区二南拇南内歿讦西歳河南广西中肚13州咔212325:S寿30 1-评价值-O.95S7-L«147-L12«-L.140-2059-1 2250-).2513-1 6514-L6B分析:各地区高等教育开展

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论