应用多元分析主成分分析作业_第1页
应用多元分析主成分分析作业_第2页
应用多元分析主成分分析作业_第3页
应用多元分析主成分分析作业_第4页
应用多元分析主成分分析作业_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、应用多元分析主成分分析6.1试述主成分分析的基本思想。答:在处理多指标变量问题的过程中,由于多个变量之间往往存在着一定程度的相关性,人们可以通过线性组合的方式,从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合继续这个快速提取的过程,如此继续下去,直到提取的信息与原指标差不多时为止,这就是主成分分析的基本思想。6.5试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。 答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的,而实际表明,这种差异有时很大。根据协方差矩阵进行主成分分析的,其结果受变量单位的影响。不同的变量往往有不同的单位,对同一

2、变量单位的改变会产生不同的主成分,主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用R代替,在采用R代替后,可以看作是用标准化的数据做分析,而且在研究单位变量大都不统一的经济问题是,会使得主成分有现实经济意义,不仅便于剖析实际问题,又可以避免突出数值大的变量。6.6已知X=(X1,X2,X3)的协差阵为 113/23/23/221/453/43/253/431/4 试进行主成分分析。解:令|-E|=11-=0计算得-64(-4)(-8)(-12)=0即特征值分

3、别为1=12,2=8,3=4所以DY1=12,DY2=8,DY3=4当1=12时,(-E)=-17经过一系列的初等行变换可化为10-203-1000则特征向量为1=23,1,3同理,当2=8时,2=(-2,3,3)当3=4时,3=(0,-3,1)易知1,2,3相互正交,通过单位化向量可得T2=1|1|=32 ,14 ,34, T2=2|2|=-12 ,34 ,34, T3=3|3|=0 ,-32 ,12而Y1=T1X ,Y2=T2X , Y3=T3X所以,带入数据可得第一主成分为Y1=32 X1+14 X2+34X3,DY1=12第二主成分为Y2=-12 X1+34 X2+34X3,DY2=8

4、第三主成分为Y3=-32 X2+12X3, DY3=46.7 设X=(X1,Xp)的协方差阵(pp)为 =21 1 1 , 0p1证明:1=21-1-为最大特征根,其对应的主成分为Y1=1i=1pxi证明:令-E=2-2 222- 2 22 2-=(p-1)2+2-2 2 (p-1)2+2-2- 2 (p-1)2+2- 2 2-=p-12+2- 2 2 0 21- 2 0 0 21-=0=p-12+2-(21-)p-1又00则1=1-1-p 2 为最大特征根当1=1-1-p 2时,-1E=21-p 2 2 2 2(1-p) 2(1-p) 2 2 2(1-p)=01 000 0 00 0所以特征

5、向量为1=1,1,,1通过标准化可得T1=1p,1p,1p 即证得,Y1=1i=1pxi6.8通过对各地区的六个指标进行主成分分析,然后对各地区城市设施水平进行综合评价和排序。解:将原始数据输入spss编辑窗口,将六个变量分别命名为X1X6,在spss窗口选择AnalyseData ReductionFactor菜单项,调出因子分析界面,并将六个变量移入Variable框中,其他均保持系统默认选项,单击ok按钮,执行因子分析过程,如下图所示。得到特征根和方差贡献率表(表一)和因子载荷阵(表二)Total Variance ExplainedComponentInitial Eigenvalue

6、sExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %12.15535.91735.9172.15535.91735.91721.56626.09362.0101.56626.09362.01031.23020.50782.5171.23020.50782.5174.61710.28092.7975.2584.29997.0966.1742.904100.000Extraction Method: Principal Component Analysis.表

7、一Component MatrixaComponent123城市用水普及率(%).770.444-.349城市燃气普及率(%).857.113-.208每万人拥有公共交通车辆(标台).246.839.291人均城市道路面积(平方米).633-.396.359人均公园绿地面积(平方米).605-.642.275每万人拥有公共厕所(座)-.019.286.881Extraction Method: Principal Component Analysis.a. 3 components extracted.表二将表二中的因子载荷阵中的数据输入spss数据编辑窗口,分别命名为a1,a2,a3,如下图

8、为了计算第一个特征向量,点击菜单中的TransformComputer,调出Computer variable对话框,在对话框中输入等式:z1=a1/SQRT(2.155)点击ok按钮,即可在数据编辑窗口中得到以z1为变量名的第一特征向量,如下图再次调出Computer variable对话框,在对话框中输入等式:z2=a2/SQRT(1.566)点击ok按钮,即可在数据编辑窗口中得到以z2为变量名的第二特征向量再次调出Computer variable对话框,在对话框中输入等式:z3=a2/SQRT(1.230)点击ok按钮,即可在数据编辑窗口中得到以z3为变量名的第三特征向量如此得到了如下

9、图所示的特征向量矩阵z1z2z3x10.525 0.355 -0.315 x20.584 0.090 -0.188 x30.168 0.670 0.262 x40.431 -0.316 0.324 x50.412 -0.513 0.248 x6-0.013 0.229 0.794 根据特征向量矩阵可以得到主成分的表达式Y1=0.525x1+0.584x2+0.168x3+0.431x4+0.412x5-0.013x6Y2=0.355x1+0.090x2+0.670x3-0.316x4-0.513x5+0.229x6Y3=-0.315x1-0.188x2+0.262x3+0.324x4+0.248x5+0.794x6分别计算出以上三项后,利用公式Y=1i=13iY1+2i=13iY2+3i=13iY3得到Y=0.435Y1+0.316Y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论