版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主成分分析法介绍主成分分析法介绍主成分分析法介绍主成分分析法介绍编制仅供参考审核批准生效日期地址:电话:传真:邮编:
主成分分析方法
我们进行系统分析评估或医学上因子分析等时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息事实上,这种想法是可以实现的,本节拟介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。第一节主成分分析方法的原理主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的数据矩阵:…………(1)如何从这么多变量的数据中抓住事物的内在规律性呢要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。如果记原来的变量指标为,它们的综合指标——新变量指标为,(m≤p)。则在(2)式中,系数lij由下列原则来决定:(1)zi与zj(i≠j;i,j=1,2,…,m)相互无关;(2)z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差最大者;……;zm是与z1,z2,……zm-1都不相关的x1,x2,…,xp的所有线性组合中方差最大者。且(2)式要求:这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一,第二,…,第m主成分。其中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p)。同时,不是别的,而恰好是x1,x2,…,xp的相关矩阵的特征值所对应的特征向量。且z1方差取到最大就是x1,x2,…,xp相关矩阵在第一个特征值所对应特征向量处达到。zm方差取到最大就是x1,x2,…,xp相关矩阵在第m个特征值所对应特征向量处达到。第二节主成分分析的解法主成分分析的计算步骤通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:(1)计算相关系数矩阵………(3)在公式(3)中,(i,j=1,2,…,p)为原来变量与的相关系数,其计算公式为…….(4)因为R是实对称矩阵(即rij=rji),所以只需计算其上三角元素或下三角元素即可。(2)计算特征值与特征向量首先解特征方程|λI-R|=0求出特征值λi(i=1,2,…,p),并使其按大小顺序排列,即λ1≥λ2≥…,≥λp≥0;然后分别求出对应于特征值λi的特征向量ei(i=1,2,…,p)。(3)计算主成分贡献率及累计贡献率。一般取累计贡献率达85-95%的特征值,所对应的第一,第二,……,第m(m≤p)个主成分。(4)计算主成分得分矩阵由此可以进一步计算主成分得分矩阵:Z=(5)进一步还可以根据式:计算各主成分得分:(6)和总得分:(7)主成分分析应用实例实证研究1本文是对实施西部大开发以来的经济增长状况作实证研究,把西部地区10个省(自治区、直辖市)的经济增长状况作为研究对象集,即={重庆,四川,贵州,云南,西藏,陕西,甘肃,青海,宁夏,新疆}选取17个经济指标值:即:地区生产总值、财政收入、固定资产投资、城市用水普及率、城市燃气普及率、每万人拥有交通公共车辆、人均城市道路面积、普通高等学校数、每千人医疗卫生机构床位数、居民收入与消费指标等17个经济指标。进行主成分分析:西部地区2011横向因子分析解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积%123主成分载荷量表:西部地区2011年横向主成分.173.045.186.110.151.002.172.041.240.028.085.199.091.294.100.093.163.016.037.258.261.232.330.066.056.050.138.152.034.086.025.006主成分得分函数:各地区主成分得分表:因子得分因子得分因子得分因子综合得分排名重庆3四川1贵州5云南4西藏10陕西2甘肃7青海9宁夏8新疆6第一类主成分:经济实力、社会基础以及对外开程度是影响经济增长的主要因素(地区生产总值、财政收入、固定资产投资、普通高校数、客运量和货运量等)第二类主成分:居民消费水平、城镇居民人均可支配收入、人均公园绿地面积、人均生产总值。第三类主成分有:城市用水普及率、城市燃气普及率、每万人拥有交通公共车辆数、每千人医疗卫生机构床位数等。例:投资项目的风险评估模型现在针对具体的综合投资项目,假设请N名专家对可能次年在的M项风险指标进行打分评估,采用10分制,分支越低,风险越小。具体打分数据统计表形式如表5-13所示:某项目投资分先评估打分表风险指标专家序号政策风险技术风险市场风险管理风险环境风险1684432573523492714464835753526364837545638764239474611067554>>Matlab命令窗口中输入语句:p=[68443;49271;…];>>princomp(p)风险指标特征值方差贡献率(%)累计贡献率(%)12345100从上表可知,前3个主成分的累计贡献率达到%,因此取前三个主成分:所以最终风险综合评估函数:主成分分析实例2对于某区域地貌-水文系统,其57个流域盆地的九项地理要素:x1为流域盆地总高度(m)x2为流域盆地山口的海拔高度(m),x3为流域盆地周长(m),x4为河道总长度(km),x5为河等表2-14
某57个流域盆地地理要素数据道总数,x6为平均分叉率,x7为河谷最大坡度(度),x8为河源数及x9为流域盆地面积(km2)的原始数据如表2-14所示。张超先生(1984)曾用这些地理要素的原始数据对该区域地貌-水文系统作了主成分分析。下面,我们将其作为主成分分析方法在地理学研究中的一个应用实例介绍给读者,以供参考。表2-15相关系数矩阵(1)首先将表2-14中的原始数据作标准化处理,由公式(4)计算得相关系数矩阵(见表2-15)。(2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表2-16)。由表2-16可知,第一,第二,第三主成分的累计贡献率已高达%,故只需求出第一,第二,第三主成分z1,z2,z3即可。表2-16
特征值及主成分贡献率(3)对于特征值λ1=,λ2=,λ3=分别求出其特征向量e1,e2,e3,并计算各变量x1,x2,……,x9在各主成分上的载荷得到主成分载荷矩阵(见表2-17)。表2-17
主成分载荷矩阵从表2-17可以看出,第一主成分z1与x1,x3,x4,x5,x8,x9有较大的正相关,这是由于这六个地理要素与流域盆地的规模有关,因此第一主成分可以被认为是流域盆地规模的代表:第二主成分z2与x2有较大的正相关,与x7有较大的负相关,而这两个地理要素是与流域切割程度有关的,因此第二主成分可以被认为是流域侵蚀状况的代表;第三主成分z3与x6有较大的正相关,而地理要素x6是流域比较独立的特性——河系形态的表征,因此,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 立体栽培收入来源与盈利模式
- 2024关于中国的劳动合同模板格式范文
- Sparfloxacin-Standard-生命科学试剂-MCE
- 2024布匹买卖合同范本
- 童装纸样设计
- 景区安全工作汇报材料(10篇)
- 观后感500字唐人街探案(万能模板8篇)
- 设计珠宝合同范本
- 2023届新高考新教材化学鲁科版一轮限时训练-第8章第27讲 盐类的水解
- vocs工程合同范本
- 仁爱英语九年级下册Unit5Topic1sectionA的教学设计
- 《色彩基础知识》PPT课件(详解)
- 鲁东教师心理健康期末考试复习题及参考答案
- 【教师必备】部编版五年级语文上册第五单元【集体备课】
- 商业空间设计PPT课件
- 相容性独立性完全性
- 市政工程创优汇报
- A4横线稿纸模板(可直接打印)-a4线条纸
- 动土作业许可证(标注)
- 球墨铸铁铸造工艺
- 10kV电缆迁移工程施工方案
评论
0/150
提交评论