主成分分析课程设计_第1页
主成分分析课程设计_第2页
主成分分析课程设计_第3页
主成分分析课程设计_第4页
主成分分析课程设计_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据分析课程设计姓名学号班级成 绩 评 定(等 级 记 分: a-20 b-18 c-15 d-12 e-10)选题的适宜性 a b c d e功能的完备性 a b c d e作业的独立性 a b c d e编程的规范性 a b c d e代码的正确性 a b c d e综 合 评 定1、需求分析主成份所关心的问题,是通过一组变量的几个线性组合来解释这组变量的方差-协方差结构,它的一般目的是数据的压缩以及数据的解释。虽然要求n个成分可以再现全系统的变异性常常只用少数m个主成分就可以说明。出现这种情况时,m个主成分所包含的信息和n个变量所包含的几乎一个样多。所以m个主成分就可以代替初始的n个变量

2、。主成分常常揭示出一些不曾预想到的关系,因而会对数据做出不同寻常的解释 。所以编写一套直接得出数据主成分的程序很有必要.在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太 多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。2、系统设计(1)运

3、行环境:程序设计语言为matlab,运行环境为安装windows系统和matlab系统的pc机。(2)结构设计:原始数据矩阵标准化后的数据矩阵矩阵的相关系数矩阵的特征向量与特征值方差贡献率累计方差贡献率主成分分析3、程序代码pca.m %主成分分析(principal component analysis)function x0,x1,x3,x4=pca(x)%pca分析数据矩阵进行标准化处理,得出相关系数,特征值,特征向量排序%x为nxm维的数据矩阵%调用语法为x0,x1,x3,x4=pca(x)%x为原始数据矩阵%x0为标准化之后的矩阵%x1为标准化之后的数据矩阵的相关系数%x2为特征向量

4、%lambda为特征值%x3方差贡献率%x4累计方差贡献率%-标准化数据矩阵-zeros(size(x);nr,nx=size(x); %nr,nx分别为矩阵的行与列for mk=1:nr x0(mk,:)=(x(mk,:)-mean(x)./std(x);end%-求相关系数-fprintf( x0为标准化之后的矩阵n x1为标准化之后的数据矩阵的相关系数n x2为特征向量n lambda为特征值n x3方差贡献率n x4累计方差贡献率n)x1=corrcoef(x0);%-求相关系数矩阵的特征值与特征向量-x2,lambda=eigs(x1)%-方差贡献率;累计方差贡献率- xsum=su

5、m(sum(lambda,2),1); for i=1:nx x3(i)=lambda(i,i)/xsum; end for i=1:nx x4(i)= sum(sum(lambda(1:i,1:i),2),1)/xsum; end 4、程序测试下面为北京,天津,河北,山西,内蒙古,辽宁,吉林,黑龙江,上海,江苏,浙江,安徽,福建12个省市的专项收入,行政事业性收费收入,罚没收入,国有资本经营收入国有资源(资产)有偿使用收入及其他收入的数据地区专项收入行政事业性收费收入罚没收入国有资本经营收入国有资源(资产)有偿使用收入其他收入 北 京44.0144.0144.0144.0144.0144.0

6、1 天 津16.44100.698.1623.7542.7715.92 河 北60.8949.8153.8530.1111.5721.57 山 西115.1546.8736.011.346.4418.10 内蒙古109.7642.5421.9170.7120.708.41 辽 宁45.6793.7641.89145.6669.4610.80 吉 林18.9343.6429.8017.6611.824.14 黑龙江49.9262.0422.6930.6921.3410.67 上 海42.3085.2720.01-9.286.3027.24 江 苏91.33159.6877.19184.7846.

7、1814.88 浙 江67.1141.9478.97-46.3811.475.58 安 徽47.0585.4328.3417.4447.169.19输入a=结果为a=调用主成分分析函数:x0,x1,x3,x4=pca(a)结果为:x0为标准化之后的矩阵 x1为标准化之后的数据矩阵的相关系数 x2为特征向量 lambda为特征值 x3方差贡献率 x4累计方差贡献率x2 = 0.0750 -0.7198 0.0009 0.5940 0.2554 0.2413 0.5649 0.0845 0.2889 -0.2115 -0.1248 0.7280 0.2464 -0.5696 -0.2519 -0.

8、6996 0.1430 -0.2039 0.5889 -0.0701 -0.0199 0.2841 -0.5958 -0.4606 0.5173 0.3655 -0.1923 0.1566 0.7049 -0.2012 0.0111 -0.1089 0.9032 -0.0885 0.2165 -0.3430lambda = 2.4475 0 0 0 0 0 0 1.4517 0 0 0 0 0 0 1.1665 0 0 0 0 0 0 0.6059 0 0 0 0 0 0 0.1750 0 0 0 0 0 0 0.1535x0 = -0.4719 -0.9417 -0.7508 -0.8979

9、 -0.0613 -0.3537 -1.3372 0.8300 -1.2494 -0.1956 0.7968 0.4185 0.0579 -0.5778 0.7631 -0.1011 -0.7526 1.2576 1.7608 -0.6592 -0.0227 -0.5285 -1.0074 0.7423 1.5916 -0.7790 -0.6438 0.5021 -0.2992 -0.6967 -0.4198 0.6382 0.2363 1.6157 2.1224 -0.3418 -1.2591 -0.7486 -0.2962 -0.2861 -0.7402 -1.3309 -0.2864 -

10、0.2395 -0.6094 -0.0925 -0.2674 -0.3611 -0.5256 0.4033 -0.7274 -0.6863 -1.0144 2.0996 1.0132 2.4622 1.7912 2.1970 0.9662 0.2641 0.2531 -0.7956 1.8696 -1.2375 -0.7576 -1.1170 -0.3765 0.4077 -0.3605 -0.2893 1.0149 -0.5809x1 = 1.0000 -0.0389 0.3872 0.2399 -0.2068 0.0819 -0.0389 1.0000 0.2497 0.7241 0.6373 0.2746 0.3872 0.2497 1.0000 0.2980 0.0238 -0.1151 0.2399 0.7241 0.2980 1.0000 0.6805 -0.0075 -0.2068 0.6373 0.0238 0.6805 1.0000 -0.2175 0.0819 0.2746 -0.1151 -0.0075 -

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论