应用多元统计分析习题解答主成分分析_第1页
应用多元统计分析习题解答主成分分析_第2页
应用多元统计分析习题解答主成分分析_第3页
应用多元统计分析习题解答主成分分析_第4页
应用多元统计分析习题解答主成分分析_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主成分分析6.1试述主成分分析的基本思想。答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相尖性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取止。这就是主成分分析的基本思想。6.2主成分分析的作用体现在何处?答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”6.3简述主成分分析中累积贡献率的具体含义。答:主成分分析把P个原始变量X.,X2AI,XP的总方差tr (习分解成了 P个相互独立的变量p个主成分的,忽略一些带有较小

2、方差的主成分将不会给总方差带来太大的影响。这里我们m/ Pm ( : : : p)个主成分,则称一:八/工儿k为主成分Yi,|l|,Ym的累计贡献率,累计贡献率k 土 土表明丫n,Ym综合X.,X2A|,XP的能力。通常取m,使得累计贡献率达到一个较高的百分数(如85%以上)。答:这个说法是正确的。即原变量方差之和等于新的变量的方差之和6.5试述根据协差阵进行主成分分析和根据相尖阵进行主成分分析的区别。答:从相尖阵求得的主成分与协差阵求得的主成分一般情况是不相同的。从协方差矩阵出发的,其结果受变量单位的影响。主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃

3、小数”的问题。实际表明,这种差异有时很大。我6.6已知X=(人忑忑丫的协差阵为解:|I-AE|=问 211-X需/23/2J-A 5八/4 =0Cll需/23/20tj = (2A,1,|W*同理,计算得鼻二 8 时,&=(2,3 Y爲=4时,巴= iy易知r % TW V 1 V TCV第一主成分为 Yl=TXl+ ; X2 + aX3 岖)=12244第二主成分为Y疔壮+汎+押叫二8第三主成分为号二一;沧+广3IXVa)二、6.7设X= (%f屈,;)的协方差阵(p囂鬥为证明:十::为最大特征根,其对应的主成分为a3-X pu2 .pcfpa2 a A “ papa3 m a3 -Al p

4、a(p l)pa2 + a5 -2 ptf. pCFz(p l)pa3 + a -1 as-1 per31: ME (p-l)pa2 lu3 A pa?(J3- (p - l)pa: +(JS - A paz H-per0护(1 一 p) Xn7 ()pL钉-內-环卜J血_:-:为最大特征根:时,AP(1-P)pa pa*1jsp(l-p) a2p(l- p)IT-l.FU Pff:*pI pfiP)P +tlQP(l-P)p(pPK aQO0* O.*11 OP(l- P)/ M)PEcti = 144/:6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。单位:(亿元)行业名称资产

5、固定资产净产品销利润总计值平均余额售收入总额煤炭开采和选业6917.23032.7683.361.6石油和天然气开采业5675.93926.2717.533877黑色金属矿采选业768.1221.296.513.8有色龛雇矿采诜业622.4248116.421.6非金属矿采选业699.9291.584.96.2其它采矿业1.60.50.30解:令资产总计为X1,固定资产净值平均余额为X2,产品销售收入为X3,利润总额为X4,用SPSS寸这六个行业进行主成分分析的方法如下:1.在SPSS窗口中选择Analyze Data ReductionA Factor菜单项,调出因子分析主界面,并将变量XA

6、 X5移入Variables框中,其他均保持系统默认选项,单击0K按钮,执行因子分析过程(尖于因子分子在SPSS中实现的详细过程,参见 7.7)。得到如表6.1所示的特征根和方差贡献率表和表6.2所示的因子载荷阵。第一个因子就可以解释86.5%表6.1特征根和方差贡献率表解秤的总育差初皓特征值桿取平有和载入EW台计肓弟的累執隔合计君差的13.46086.49996.4993.46086.49908.4992.53713.43499.S333.002.06099.9934.000.007100.000表6.2因子载荷阵成棉1泊X3则.047.999.6867692将表6.2中因子载荷阵中的数据输

7、入SPSS数据编辑窗口,命名为 al。点击菜单项中的Transforms Compute,调出Compute variable对话框,在对话框中输入等式:z1=a1 / SQRT3.46),计算第一个特征向量。点击0K按钮,即可在数据编辑窗口中得到以z1为变量名的第一特征向量。表6.3特征向量矩阵z1X10.509x20.537x30.530x40.413根据表6.3得主成分的表达式:Y1 =0.509X1 0.537X2 0.530X3 0.413X43.再次使用Compute命令调出Compute variable对话框在对话框中输入等式:y1 =0.509* x1 0.537* x2 0

8、.53* x3 0.413* x4煤炭幵采根据六个工业行业计算所的yi的大小可得石油和天然气开采业的经济效益最好,和选业其次,接着依次是黑色金属、非金属、有色金属和其他采矿业。6.9下表是我国2003年各地区农村居民家庭平均每人主要食品消费量,试用主成分方法对 各主要食品和地区进行分类。地区粮食蔬菜食油猪牛羊 肉家禽蛋类及 其制品水产品食糠酒134.0592.789.1514.62.1710.134.252.9214.42150.269.991011.070.8410.88.350.7210.14216.7255.976.597.10.546.362.250.657.29218.9180.87

9、5.725.360.246.150.471.152.59207.370.772.7921.181.413.821.451.3410.77194.39178.595.916.452.519.594.490.7310.8255.99115.26.2711.423.238.643.60.7513.64虽龙江195.08111.77.627.852.616.263.350.915.09189.4476.68.5916.377.47.5116.112.1216.77251.98109.128.2712.054.56.729.091.38.82208.4683.915.8116.426.035.3314.

10、642.1324.15228.3580.976.879.074.275.045.431.4210.61198.2799.925.1916.515.143.5513.32.3516.84264.8144.228.7713.243.313.55.191.137.31229.06118.196.968.092.711.614.01110.81236.97100.114.226.481.238.011.351.134.23227.39159.769.419.862.743.868.10.927.29247.21149.448.3517.513.893.286.891.134.02233.75130.2

11、26.7322.2710.42.8313.32.163.33205.65108.944.9214.447.331.123.571.186.14236.3186.615.715.49.771.3114.751.243.88解:令粮食为X1,蔬菜为x2,食油为x3,猪牛羊肉为x4,家禽为x5,蛋类及其制品为x6,水产品为x7,食 糠为x8,酒为x9,用SPSSS行主成分分析的具体方法参见6.8,分析结果如下:表6.4特征根和方差贡献率表解齋她总肓差初始特征值提取平方和载入舍计累镇監舍计育差的俯累與12.92732.52132.5212.92732.52132.52122.22024.67157 1

12、922.22024.6715719231.34414.93672.1201.34414 93672.1284801890531.0335.6547.25338 2966.3964.39992,6941335372796.422E2222 47299.894e/001.105100.000表6.5因子载荷阵123XI.002.G20-006.093-.477.715009.276SOSX4780-.113.194-.212064-.503.608312灯.857177130.664.496-.151.241-.023表6.6特征向量矩阵z1z2z3X10.001169-0.55035-0.005

13、18x20.054359-0.320140.616746x30.0052610.1852390.697829x40.455914-0.075840.167341x50.509689-0.14229-0.05521x6-0.329080.4080630.269126x70.5009210.1187950.112136x80.3881120.332893-0.13025x90.1408660.4933-0.01984根据表6.6得主成分的表达式:Y1 =0.001X1 0.054X2 0.005X3 0.456X4 0.51X5 -0.329X6 0.501X7 0.388X8 0.141X9Y2

14、 =-0.55X1 -0.32X2 0.185X3-0.076X4 -0.142X5 0.408X6 0.119X7 0.333X8 0.493X9Y3 = -0.005X1 0.617X2 0.698X3 0.167X 4 0.055X 5 0.269X60.112X7 0.130X8 0.02X9分别计算出以上三项后,利用公式八宀丫 1 宀丫 2八丫彳得到综合得分并排序如下表:地区yiy2y3y北京14.92 90.4267.81-10.16犬津11.80 93.4854.76-15.31上海24.39-115.4657.85-16.51福建24.55-129.9368.56-19.17浙

15、江25.14-126.0059.51-19.43辽宁19.55-154.56118.72-19.47黑龙江13.27-131.9076.07 23.38湖南23.53-169.91108.84-24.97I乐29.80-167.0688.93 25.29丿西19.18-144.8972.06 25.99内蒙15.93-130.4748.84 27.33海南24.93-154.5760.04 29.19Lh东11.81-152.6481.06-30.09湖北21.71-179.61100.93 30.74安徽14.06-143.1256.46-30.92江苏18.07-164.9376.08-3

16、2.51河北7.10-129.8340.94 32.73lLj西6.20-141.4455.18 34.15吉林14.54-166.9078.26 34.32江西18.74-185.6297.04 34.94河南8.32-156.3666.62-35.93最后的分类可以根据最终得分丫的值来划分,由于没有给出具体的分类标准,具体分类结果根据各人的主观 意愿可以有多种答案。6.10根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地 区进行分类。解:用SPSS进行主成分分析的具体方法参见6.8,分析结果如下:表6.7特征根和方差贡献率表 解齋的总育差初始

17、特征值提取平育和载入台计启差的累和舍计育差的隔累頼15.05856.1995B.1995.05856.1 995613922 39026.551827502.39026.55182.7503.8149.04191.7904.3413.78495.5755.2482.7699B.33361001.10B99.4417.027.3049S.744G.02021S99.964g003.036100.000表6.8因子载荷阵12X1B55722X2.629.736x3.315-444X4.694-.571x590S-.302x6一曲-.419x7.687.607.683180y9.882-.370表6.6特征向量矩阵z1z2X10.290.47x20.280.48x30.14-0.29x40.31-0.37x50.40-0.20x60.40-0.27x70.310.39x80.390.12x90.39-0.24青岛35237.2714552.4628597.44大连31830.5617629.5327272.03济南25149.7316499.3922372.97福州22734.1616326.9720677.45乌鲁木齐22284.5415284.6820037.59沈阳23184.9912310.2219694.19武汉23909.279770.5619370.75长

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论