应用多元统计分析习题解答主成分分析_第1页
应用多元统计分析习题解答主成分分析_第2页
应用多元统计分析习题解答主成分分析_第3页
应用多元统计分析习题解答主成分分析_第4页
应用多元统计分析习题解答主成分分析_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主成分分析6.1 试述主成分分析的基本思想。答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取止。这就是主成分分析的基本思想。6.2 主成分分析的作用体现在何处?答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”6.3 简述主成分分析中累积贡献率的具体含义。答:主成分分析把个原始变量的总方差分解成了个相互独立的变量个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来太

2、大的影响。这里我们个主成分,则称 为主成分的累计贡献率,累计贡献率表明综合的能力。通常取,使得累计贡献率达到一个较高的百分数(如85以上)。答:这个说法是正确的。即原变量方差之和等于新的变量的方差之和6.5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。从协方差矩阵出发的,其结果受变量单位的影响。主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。实际表明,这种差异有时很大。我6.6 已知X=(X1,X2,X3)的协差阵为 113/23/23/221/453/43/2

3、53/431/4 试进行主成分分析。解:-E=11-3/23/23/2214-53/43/253/4314-=0计算得-64-4-8-12=01=12, 2=8, 3=4DY1=1=12, DY2=2=8, DY3=3=4当1=12时,(-1E)-423623-2753653-17-12631812-5433012103-34-2330-31000-20-203-100010-203-1000 1=23,1,3'同理,计算得2=8时,2=(-2,3,3)' 3=4时,2=(0,-3,1)'易知1,2,3相互正交单位化向量得,T1=11=(32 ,14 ,34)'

4、T2=22=(-12 ,34 ,34)' T3=33=(0 ,-32 ,12)'Y1=T1'X ,Y2=T2'X , Y3=T3'X综上所述,第一主成分为Y1=32 X1+14 X2+34X3 DY1=12第二主成分为Y2=-12 X1+34 X2+34X3 DY2=8第三主成分为Y3=-32 X2+12X3 DY3=46.7 设X=(X1,Xp)的协方差阵(p×p)为 =21 1 1 , 0<p<1证明:1=21-1-为最大特征根,其对应的主成分为Y1=1i=1pxi 。证明:-E=2-2 222- 2 22 2-=(p-1)2+

5、2-2 2 (p-1)2+2-2- 2 (p-1)2+2- 2 2-=(p-1)2+2- 2 2 0 2(1-)- 2 0 0 2(1-)-0<<1, 1=p-1+1 2, 2= 2(1-p)1-2=p>0 1=p-1+1 2 为最大特征根当1=p-1+1 2时,-1E=21-p 2 2 2 2(1-p) 2(1-p) 2 2 2(1-p)(1-) 0 (1-) (1-)0 00- 0 00 -01 000 0 00 01=(1,1,1,)' T1=1p,1p,1p' 所以,Y1=1i=1pxi分分析法,综合评价六个工业行业的经济效益指标。单位:(亿元)行业名

6、称资产总计固定资产净值平均余额产品销售收入利润总额煤炭开采和选业石油和天然气开采业33877黑色金属矿采选业有色金属矿采选业248非金属矿采选业其它采矿业0解:令资产总计为X1,固定资产净值平均余额为X2,产品销售收入为X3,利润总额为X4,用SPSS对这六个行业进行主成分分析的方法如下:1. 在SPSS窗口中选择AnalyzeData ReductionFactor菜单项,调出因子分析主界面,并将变量移入Variables框中,其他均保持系统默认选项,单击OK按钮,执行因子分析过程(关于因子分子在SPSS中实现的详细过程,参见)。得到如表6.1所示的特征根和方差贡献率表和表6.2所示的因子载

7、荷阵。第一个因子就可以解释86.5%表6.1 特征根和方差贡献率表表6.2 因子载荷阵2. 将表6.2中因子载荷阵中的数据输入SPSS数据编辑窗口,命名为a1。点击菜单项中的TransformCompute,调出Compute variable对话框,在对话框中输入等式:z1=a1 / SQRT(),计算第一个特征向量。点击OK按钮,即可在数据编辑窗口中得到以z1为变量名的第一特征向量。 表6.3 特征向量矩阵z1x10.509 x20.537 x30.530 x40.413 的表达式:3. 再次使用Compute命令,调出Compute variable对话框,在对话框中输入等式: 根据六个

8、工业行业计算所的y1的大小可得石油和天然气开采业的经济效益最好,煤炭开采和选业其次,接着依次是黑色金属、非金属、有色金属和其他采矿业。6.9 下表是我国2003年各地区农村居民家庭平均每人主要食品消费量,试用主成分方法对各主要食品和地区进行分类。地区粮食蔬菜食油猪牛羊肉家禽蛋类及其制品水产品食糠酒北京天津10河北山西内蒙辽宁吉林黑龙江上海江苏浙江安徽福建江西山东1河南湖南湖北广东广西海南解:令粮食为X1,蔬菜为x2,食油为x3,猪牛羊肉为x4,家禽为x5,蛋类及其制品为x6,水产品为x7,食糠为x8,酒为x9,用SPSS进行主成分分析的具体方法参见6.8,分析结果如下:表6.4 特征根和方差贡

9、献率表表6.5 因子载荷阵表6.6 特征向量矩阵z1z2z3x19x296x3199x441x59x636x7156x823x96根据表的表达式:分别计算出以上三项后,利用公式得到综合得分并排序如下表:地区y1y2y3y北京14.92 -90.42 67.81 -10.16 天津11.80 -93.48 54.76 -15.31 上海24.39 -115.46 57.85 -16.51 福建24.55 -129.93 68.56 -19.17 浙江25.14 -126.00 59.51 -19.43 辽宁19.55 -154.56 118.72 -19.47 黑龙江13.27 -131.90

10、76.07 -23.38 湖南23.53 -169.91 108.84 -24.97 广东29.80 -167.06 88.93 -25.29 广西19.18 -144.89 72.06 -25.99 内蒙15.93 -130.47 48.84 -27.33 海南24.93 -154.57 60.04 -29.19 山东11.81 -152.64 81.06 -30.09 湖北21.71 -179.61 100.93 -30.74 安徽14.06 -143.12 56.46 -30.92 江苏18.07 -164.93 76.08 -32.51 河北7.10 -129.83 40.94 -32

11、.73 山西6.20 -141.44 55.18 -34.15 吉林14.54 -166.90 78.26 -34.32 江西18.74 -185.62 97.04 -34.94 河南8.32 -156.36 66.62 -35.93 最后的分类可以根据最终得分Y的值来划分,由于没有给出具体的分类标准,具体分类结果根据各人的主观意愿可以有多种答案。6.10 根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。解:用SPSS进行主成分分析的具体方法参见6.8,分析结果如下:表6.7 特征根和方差贡献率表表6.8 因子载荷阵表6.6 特征向量

12、矩阵z1z2x10.29 0.47 x20.28 0.48 x30.14 -0.29 x40.31 -0.37 x50.40 -0.20 x60.40 -0.27 x70.31 0.39 x80.39 0.12 x90.39 -0.24 青岛35237.27 14552.46 28597.44 大连31830.56 17629.53 27272.03 济南25149.73 16499.39 22372.97 福州22734.16 16326.97 20677.45 乌鲁木齐22284.54 15284.68 20037.59 沈阳23184.99 12310.22 19694.19 武汉23909.27 9770.56 19370.75 长春21524.95 14179.21 19166.96 成都33808.79 -17638.73 17294.14 太原19445.42 9809.99 16352.45 郑州18561.81 9822.90 15756.62 兰州165

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论