



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、主成分分析方法简介在经济问题的研究中,我们常常会遇到影响此问题的很多变量,这些变量多且又有一定的相关性,因此我们希望从中综合出一些主要的指标,这些指标所包含的信息量又很多。这些特点,使我们在研究复杂的问题时,容易抓住主要矛盾。 那么怎样找综合指标?主成分分析是将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标的统计方法,也是数学上降维的一种方法.一. 主成分分析法简介主成分分析是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分析。在实际问题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个
2、问题的某些信息。但是,在用统计分析方法研究这个多变量的问题时,变量个数太多就会增加问题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此问题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映问题的信息方面尽可能保持原有的信息。信息的大小通常用离差平方和或方差来衡量。主成分分析的基础思想是将数据原来的p个指标作线性组合,作为新的综合指标(F1,F2, ,FP)。其中F1是“信息最多”的指标,即原指标所有线性组合中使va
3、r(F1)最大的组合对应的指标,称为第一主成分;F2为除F1外信息最多的指标,即cov(F1,F2) 0且var(F2)最大,称为第二主成分;依次类推。易知F1,F2, ,FP互不相关且方差递减。实际处理中一般只选取前几个最大的主成分(总贡献率达到85%),达到了降维的目的。主成分分析是一种进行信息压缩的方法。通过这种方法,可以将原来相关的若干变量,变换成不相关的变量。二.求主成分方法步骤:(1)对样本数据的标准化设有n个样品,P个指标,得到的原始资料矩阵为了实现样本数据的标准化,应求样本数据的均值和方差。样本数据的标准化是基于数据的均值和方差进行的。 因为在实际应用中,往往存在指标的量纲不同
4、,所以在计算之前须先消除量纲的影响,而将原始数据标准化。对数据矩阵Y作标准化处理,即对每一个指标分量作标准化变换,变换公式为:其中:样本均值样本标准差得标准化后的数据矩阵称为标准化矩阵。(2)计算相关矩阵对于给定的n个样本,求样本间的相关系数。相关矩阵中的每一个元素由相应的相关系数所表示。称为相关性矩阵。其中(3)求特征值和特征向量设求得的相关矩阵为R ,求解特征方程:|R-i|=0通过求解特征方程,可得到m个特征值 (i=1m),和对应于每一个特征值的特征向量:ai=(ai1,ai2,.,aip) i=1m且有 设相应123m0 Ai=(1i,2i,.,pi) i=1m 1的特征向量(4)求
5、主成分 (取线性组合)根据求得的m个特征向量,m个主要成分分别为:F1=11x1+12x2+ . +1pxpF2=21x1+22x2+ . +2pxp. . . . . .Fm=m1x1+m2x2+ . +mpxp上式就是主成分分析的模型,其通式为:Fi=i1x1+i2x2+ . +ipxp i=1,2,. m 称为主成份,称F1是第一主成份,F2是第二主成份,i是第i主成份。 求各主成份的关键是求特征根()及其相应的特征向量( )。主成分分析以较少的m个指标代替了原来的p个指标对系统进行分析,这F给我们对系统的综合分析评价带来了很大的方便。(5)定义:称1为第一主成分的贡献率。这个值越大,表明第i主成分综合pii=1信息的能力越强。 称i=1i=1pmi为前m个主成分的累计贡献率。表明取前几个主成分基本包含了全部测i量指标所具有信息的百分率。保留多少个主成分取决于保留部分的累积方差在方差总和中所占百分比(即累计贡献率),它标志着前几个主成分概括信息之多寡。实践中,粗略规定一个百分比便可决定保留几个主成分;如果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年新手备考证券从业资格试题及答案
- 异常货物处理的标准流程计划
- 多种媒介在美术创作中的应用计划
- 班主任与家长沟通的技巧计划
- 中医药学对康复领域的支持试题及答案
- 秘书如何建立有效的支持系统计划
- 老年财务规划的注意事项计划
- 班主任沟通中的语言艺术计划
- 学生参与的课外实践活动设计
- 2025年新浪微博生态合作协议书
- 部编版五年级语文下册第六单元测试卷及答案
- 安全用电-触电与急救课件
- 幼儿园绘本故事:《十二生肖》 课件
- 女性外阴肿瘤
- 公司组织架构图(可编辑模版)
- 外研版(2019) 必修第二册 Unit 5 On the road Coast to Coast P57PPT( 共8张)
- 罗马帝国衰亡史pdf罗马帝国衰亡史史
- 北师大版生物七年级下册12.2感受器与感觉器官(第1课时)导学案(无答案)
- 最新露天矿山安全培训课件(经典)
- 环境学概论 考验知识点归纳刘陪同
- 室内设计施工图详细说明及制图规范说明ppt(智囊书屋)
评论
0/150
提交评论