![主成份分析的分析和步骤_第1页](http://file4.renrendoc.com/view14/M04/01/0A/wKhkGWZpSoiAGaTVAAIRJXTRShY133.jpg)
![主成份分析的分析和步骤_第2页](http://file4.renrendoc.com/view14/M04/01/0A/wKhkGWZpSoiAGaTVAAIRJXTRShY1332.jpg)
![主成份分析的分析和步骤_第3页](http://file4.renrendoc.com/view14/M04/01/0A/wKhkGWZpSoiAGaTVAAIRJXTRShY1333.jpg)
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
====Word行业资料分享--可编辑版本--双击可删====源-于-网-络-收-集主成分分析的概念与步骤1.主成分分析基本思想主成分分析是数学上对数据降维的一种方法。其基本思想是设法将原来众多的具有一定相关性的指标(比如p个指标),重新组合成一组新的互不相关的综合指标来代替原来指标。通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标。但是这种线性组合,如果不加限制,则可以有很多,应该如何去选取呢?在所有的线性组合中所选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来p个指标的信息,再考虑选取F2即选第二个线性组合。为了有效地反映原有信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0。称F2为第二主成分,依此类推可以构造出第三、第四、…、第p个主成分。2.主成分分析的数学模型设有n个样品(多元观测值),每个样品观测p项指标(变量):X1,X2,…,Xp,得到原始数据资料阵:其中Xi=(x1i,x2i,…,xni)',i=1,2,…,p。用数据矩阵X的p个列向量(即p个指标向量)X1,X2,…,Xp作线性组合,得综合指标向量:简写成:Fi=a1iX1+a2iX2+…+apiXpi=1,2,…,p为了加以限制,对组合系数ai'=(a1i,a2i,…,api)作如下要求:即:ai为单位向量:ai'ai=1,且由下列原则决定:1)Fi与Fj(i≠j,i,j=1,…,p)互不相关,即Cov(Fi,Fj)=0,并有Var(Fi)=ai'Σai,其中Σ为X的协方差阵2)F1是X1,X2,…,Xp的一切线性组合(系数满足上述要求)中方差最大的,即,其中c=(c1,c2,…,cp)'F2是与F1不相关的X1,X2,…,Xp一切线性组合中方差最大的,…,Fp是与F1,F2,…,Fp-1都不相关的X1,X2,…,Xp的一切线性组合中方差最大的。满足上述要求的综合指标向量F1,F2,…,Fp就是主成分,这p个主成分从原始指标所提供的信息总量中所提取的信息量依次递减,每一个主成分所提取的信息量用方差来度量,主成分方差的贡献就等于原指标相关系数矩阵相应的特征值i,每一个主成分的组合系数ai'=(a1i,a2i,…,api)就是相应特征值i所对应的单位特征向量ti。方差的贡献率为,i越大,说明相应的主成分反映综合信息的能力越强。3.主成分分析的步骤(1)计算协方差矩阵计算样品数据的协方差矩阵:Σ=(sij)pp,其中i,j=1,2,…,p(2)求出Σ的特征值及相应的特征向量求出协方差矩阵Σ的特征值12…p>0及相应的正交化单位特征向量:则X的第i个主成分为Fi=ai'Xi=1,2,…,p。(3)选择主成分在已确定的全部p个主成分中合理选择m个来实现最终的评价分析。一般用方差贡献率解释主成分Fi所反映的信息量的大小,m的确定以累计贡献率达到足够大(一般在85%以上)为原则。(4)计算主成分得分计算n个样品在m个主成分上的得分:,i=1,2,…,m(5)标准化实际应用时,指标的量纲往往不同,所以在主成分计算之前应先消除量纲的影响。消除数据的量纲有很多方法,常用方法是将原始数据标准化,即做如下数据变换:其中,,j=1,2,…,p。标准化后的数据阵记为X*,其中每个列向量(标准化变量)的均值为0,标准差为1,数据无量纲。标准化后变量的协方差矩阵(CovarianceMatrix)Σ=(sij)pp,即原变量的相关系数矩阵(CorrelationMatrix)R=(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025人教版初中七下数学湖北专版8.1第2课时-算术平方根及其应用【课件】
- 小学一年级数学两位数加减一位数质量监控例题
- 小学三年级数学五千以内加减法综合考核口算题大全附答案
- 11.3 动能和势能 提升练习含解析-八年级物理下册(人教版)
- 实习转正申请书
- 餐饮业季度盘点
- 研究之路模板
- 医患调解申请书
- 转临床专业申请书
- 限价房申请书
- 餐券模板完整
- 2023年节能服务行业市场分析报告及未来发展趋势
- 小区排水管网修复施工方案
- 智慧城市发展-人工智能技术在城市管理中的应用
- 因产品质量买卖合同纠纷起诉状
- GB/T 6892-2023一般工业用铝及铝合金挤压型材
- 评估胎儿健康的技术
- 实验室危险废物处理废液分类与收集
- 全自动甘蔗剥叶装置的设计
- 生物技术制药课件
- T-CSAE 11.3-2021 商用车润滑导则 第3部分:润滑脂的选用
评论
0/150
提交评论