




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数学建模提高班第三次作业【作业1】全国重点水泥企业经济效益综合评价例。利用主成分综合评价全国重点水泥企业的经济效益。原始数据(数据来自1984年中国统计年鉴) 见表5-1 Oo1. 利用一般的Mat lab命令将数据标准化:2. 利用Mat lab命令计算出相关矩阵的方差及特征值;3 写出主成分的线性表达式;4. 利用统计工具箱中命令得到如上结果;5. 利用SPSS进行主成分分析:6. 对得到的结果作出解释。解:仁利用一般的Mat I ab命令将数据标准化根据題意利用MATLAB编程如下:load dsctxt;n, p=size(dsc);MEAN=mean( dsc) ; %求各变量的均值
2、STD=std( dsc); %求冬变量的标准差MEAN=ones (n,p)*d iag(MEAN);STD=ones (n, p) *d i ag (STD);x=(dsc-MEAN). /STD%原始数据标准化求解得标准化后的数据为:X =-0. 3767-0.3579-0. 1136-0. 3667-0.0388-1.1777-1 3633-0. 27710.0882-0.29390. 0508-0.28730. 3562-1.1777-0. 40732. 2531-0. 6046-0.62290. 0568-0. 5810-0.42770. 29441.6425-0. 7741-1.
3、8223-1 7643-1.6884-1.7200T 1725-0. 14721 0792-0. 54821.58911 99441.21632. 14141 28790. 8833-1 86580. 60392. 12480.91002. 29811.16810. 7553-1.9138-0.41901.64320. 96410.51770. 62160. 54210. 858700. 26351.2591-0.6277-0.9322-0.8054-0. 7824-2. 87141.91380. 2565-0. 27710. 1066-0.19740. 1210-0.19110. 32191
4、.17771.0442-0. 09640. 30830.31040. 98020. 4389-0. 0857-0. 14720. 0975-0.3223-0.3660-0.2021-0. 4453-0. 28430. 1121-0. 7361-1.0711-0. 7967-0.5076-0.2567-0. 9264-0.46290. 4385-0. 2944-0. 4471-0. 6160-0. 3998-0. 1222-0.0164-0. 1454-0.20950. 88330.6795-1.27110. 47921.8441-0. 23161.47870.84490-0.5452-0. 6
5、838-0. 9556-0.8270-1. 1177-0. 9481-0. 16980. 44161 0559-0. 09642.利用Mat lab命令计算出相关矩阵的方差及特征值根据题意利用MATLAB编程如下:R=cov(x)$注释:由于数据已经过标准化处理,故x的协方差矩阵等于其相关系数矩阵,即 R=corrcoef (x)V, D=eig(R) ; %注释:函数eig的功能是对矩阵R进行正交对角化变换,矩阵D是以R的特征值为对角元的对角矩阵(对角元按从小到大的顺序排列),矩阵V是正交变换矩阵。DD= ;%将特征值对角矩阵D改写为列向:i DDfor i=p:-1:1%此处要注意eig函
6、数的输出D中特征值的排列顺序DD=DD;D(i, i);endOFFER=DD/sum(DD) ;%计算特征值的方差贡献率cumOFFER=cumsum(DD)/sum(DD); %计算特征值的方差累计贡献率0UTC0ME=DD, OFFER, cumOFFER %综合输出计算结果pri=1;for i=1:pif cum0FFER(i)85%,故应选取前三个作为主成分, 此时对应的特征变量分别为:PCACOV =0.4337-0.0621-0.25800.4088-0. 34130. 11750.38950.0116-0.37970.4211-0. 31760.01910. 35860. 0
7、6570.2220-0.1835-0.7250-0. 3187-0.2944-0.0355-0. 63540. 25860. 4975-0. 4696主成分的线性表达式为:片=0.4337 不 + 0.4088 x2 + 0.3895+ 0.4211 x4 + 0.3586 x5 一 0.1835 兀 一 0.2944 x7 + 0.2586 x8F2 = -0.0621 兀一 0.3413 x2 + 0.0116 - 03167 x4 + 0.0657 x5 一 0.725 兀 一 0.0355 x7 + 0.4975 x8F, = -0.258 + 0.1175 x2 一 0.3797 “
8、 + 0.0191 x4 + 0.222 一 0.3187 兀 一 0.6354 x7 一 0.4696 x8 4.利用统计工具箱中命令得到如上结果:根据题意利用MATLAB编程如下:(1)利用原始数据进行主成分分析:【参数说明】x原始数据矩阵(样本点X变量)PC主成分系数向量(列)SCORE样本点的主成分得分latent x的协方差矩阵的特征值tsquare 每一个样本点的Hotel I ingT2统计量的值PC=pr i ncomp (x)PC,SCORE, Iatent,tsquare=pr i ncomp (x)求解得:PC =0.43370. 0621-0.25800. 08130.
9、 12830.03910.84500. 05340.40880. 34130. 1175-0. 0650-0. 0930-0.5009-0. 1143-0. 65250.3895-0.0116-0.3797-0.03600. 56780.4317-0. 4071-0. 16790.42110. 31760.01910. 01640.0104-0.3338-0. 26760. 73350. 3586-0. 06570.2220-0. 6520-0. 45680.4278-0. 00120. 0321-0.18350. 7250-0. 31870. 2273-0. 38020. 3741-0.03
10、51-0. 0426-0.29440. 0355-0. 6354-0. 62330. 0265-0.34240.02400. 03660. 2586-0. 4975-0. 46960.3498-0. 5463-0.0978-0. 1837-0. 0324PC =0.43370. 0621-0.25800. 08130. 12830.03910.84500. 05340.40880. 34130. 1175-0. 0650-0. 0930-0.5009-0. 1143-0. 65250.3895-0.0116-0.3797-0.03600. 56780.4317-0. 4071-0. 16790
11、.42110. 31760.01910. 01640.0104-0.3338-0. 26760. 73350. 3586-0. 06570.2220-0. 6520-0. 45680.4278-0. 00120. 0321-0.18350. 7250-0. 31870. 2273-0. 38020. 3741-0.0351-0. 0426-0.29440. 0355-0. 6354-0. 62330. 0265-0.34240.02400. 03660. 2586-0. 4975-0. 46960.3498-0. 5463-0.0978-0. 1837-0. 0324SCORE =0.0235
12、-1.02251.45430.50110. 49740. 2747-0.0734-0. 02850. 86332. 1992-0.42690. 5619-0. 8921-0. 1006-0.2183-0. 0492-1.63050. 2496-0. 8188-0.96900. 5565-0.0527-0. 1356-0. 0026-3.7463-0. 96070.2294-0.1343-0. 1265-0.2148-0.05740. 10173. 88511 63450.30990. 7261-0. 57250.3345-0. 14160. 06593. 8507-1 4825-1.0193-
13、0.04150. 9788-0. 18050. 19790. 02771 6561-0. 2719-0.9816-0.2524-0. 63900.01980. 13140. 0033-2. 82441.1268-0.93692. 07600. 2830-0.21730.1066-0.0192-0.50070. 7948-1.0224-0. 6127-0. 41570. 44920. 1155-0. 02450. 71140. 3158-0.2896-0. 17430. 84560. 0396-0.2247-0.0112-0.2500-0.35951.54850. 14330. 35150. 2
14、0690.11760. 0001-0.6972-0. 20711.2082-0.2885-0. 33580. 15410.2137-0.0134-1.05701.1980-0.0706-0.55720. 42160.2195-0.0593-0. 02371 7808139681.0643-0.4985-0. 2531-0.88370.0042-0. 0248-2. 0647-0. 2130-0.2485-0.4800-0. 6998-0.04870.0235-0. 0016latent =4. 85281 24400. 87020.55180.35700.10200. 02070.0015 t
15、square =5.955211 05594. 856911.231312.175511.41993. 836212.96375.94424. 87394. 34324. 83463. 465312.21772. 8265由以上结果可知:利用统计工具箱中的命令得到的协方差矩阵特征值为:latent =4. 85281 24400. 87020.55180.35700.10200. 02070.0015(2)利用原始标准化后的数据进行主成分分析:【参数说明】R 原始数据相关系数矩阵(样本点X变量) PC主成分系数向董(列)latent 相关矩阵R的特征值explained 每一个主成分的方差贡献
16、率PC=pcacov (R):PC, Iatent, exp lained=pcacov (R) 求解得:PC =-0.43370. 0621-0.25800. 0813-0. 12830.0391-0.8450-0. 0534-0.40880. 34130. 1175-0. 06500. 0930-0.50090. 11430. 6525-0.3895-0.0116-0.3797-0.0360-0. 56780.43170. 40710. 1679-0.42110. 31760.01910. 0164-0.0104-0.33380. 2676-0. 7335-0.3586-0. 06570.
17、2220-0. 65200. 45680.42780.0012-0. 03210.18350. 7250-0. 31870. 22730. 38020. 37410. 03510. 04260. 29440. 0355-0. 6354-0. 6233-0. 0265-0.3424-0. 0240-0. 0366-0.2586-0. 4975-0. 46960.34980. 5463-0.09780.18370. 0324latent =4. 85281 24400. 87020.55180.35700.10200. 02070.0015explained =60. 659615.549510.
18、87776. 89754. 46301 27490.25890.0189由以上结果可知:利用统计工具箱中的命令得到的相关矩阵R的特征值为:latent =4. 85281 24400. 87020.55180.35700.10200. 02070.0015主成分相关系数为:PC =-0.43370. 0621-0.25800. 0813-0. 12830.0391-0.8450-0. 0534-0.40880. 34130. 1175-0. 06500. 0930-0.50090. 11430. 6525-0.3895-0.0116-0.3797-0.0360-0. 56780.43170.
19、40710. 1679-0.42110. 31760.01910. 0164-0.0104-0.33380. 2676-0. 7335-0.3586-0. 06570.2220-0. 65200. 45680.42780.0012-0. 03210.18350. 7250-0. 31870. 22730. 38020. 37410.03510. 04260. 29440. 0355-0. 6354-0. 6233-0. 0265-0.3424-0.0240-0. 0366-0.2586-0. 4975-0. 46960.34980. 5463-0.09780.18370. 0324根据第三问,
20、取前三个主成分,可得主成分的线性表达式为:F、= 0.4337 X + 0.4088+ 0.3895 + 0.4211 x4 + 03586 x5 - 0.1835 兀 一 0.2944 x7 + 0.2586 x8F2 = 0.0621 町一 0.3413 x2 + 0.0116- 0.3167+ 0.0657 x5 - 0.725 一 0.0355 x7 + 0.4975 x8F, = -0.258 + 0.1175 一 0.3797 “ + 0.0191 x4 + 0.222 一 0.3187 兀 一 0.6354 x7 一 0.4696 x8 5.利用SPSS进行主成分分析;标准化后的
21、原始数据进行主成分分析如下:lritial Eiqenvalues:traction Sums of Squared LoadincComponeTotalo of Variancecumulative 7Totalo of VarianceCumulative 乡14.85360.65960.6594.85360.65960.65921.24415.55076.2091.24415.55076.2093.87010.87887.087.87010.87887.0874.5526.89893.9845.3574.46398.4476.1021.27599.7227Component Matri
22、x a於mnn朋?x11.000.976X21.000.968 / Nd一 1NOO.774.544-.317-.344.5314.000.688-.106-.592.329Total Variance ExplainedComponent123x1.197.056277x2.186.306-.126x3.177-.010.407Component Score Coefficient Matrix241-.110.354-.018-207Component12311.000.000.0002.0001.000.0003.000.0001.000Component Score Covarianc
23、e MatrixExtraction Method: Principal Comp on ent Ana Component Scores.297.593438I勺情况,SPSS默认保留特征 .分集中了原始8个变量信息差比例的87. 087%85%,可 f界了原来指标的信息,这样 I选取四个主成分时,就保留利用SPSS得出的主成分系数为标准主成分系数,将其化为主成分系数如下:将Conponent Score Coefficient Matrix中的1-3列数字分别在SPSS中建立新的散列b1,b2,b3输入$刃(4.853), b2(1.244) , b广SQRT(0.87)得到原始数据主成分
24、系数易:00. 06690. 26120.41860. 3458-0. 12130. 3965-0.01120. 38240.41860. 3235-0.01870. 3525-0.0669-0.2239-0. 17620. 72500. 3171-0. 28640. 03350. 63430.2644-0.50190.4664故主成分的线性表达式为:耳=0兀 + 0.4186+ 0.3965 x3 + 0.4186 x4 + 0.3525 x5 - 0.1762 兀 一 0.2864 x7 + 0.2644 x8F2 = 0.0669 y + 0.3458 x2 - 0.0112 x3 +
25、0.3235 x4 - 0.0669 x5 + 0.7250 % + 0.0335 x7 - 0.5019 x8 F3 = 0.2612 不一 0.1213 + 0.3824- 0.0187 x4 一 0.2239 x5 + 03171 兀 + 0.6343 x7 + 0.4664 x8将各个主成分得分乘以相应的sqrt (入)即特征根的二次方根可以将其还原为未经标准化的主成 分得分.这里同样使用compute命令还原为主成分得分pscore1=FAC1J*SQRT(X1),所得pscorel, pscore2, pscore3数据分别为:0.02-1.03-1.450.87-2.200. 4
26、3-1.620. 250. 82-3. 74-0. 96-0. 233.891.63-0.313.85-1.481.021.66- 270. 98-2. 831. 140. 93-0. 500. 801.020.710. 310. 29-0. 25-0. 36-1.55-0. 70-0. 20-1.21-1.061.190. 071.781.39-1.06-2. 07-0. 220. 25综合评价:重新进入Compute对话框,在Target Var iable栏中输入Z,在Numer ic expression栏中输入表 达式如下:(0. 60659*pscore1+0. 15550*psc
27、ore2+0.10878*pscore3)/0.87087点击0K得Z的值为:-0. 350.26-0. 99-2. 812.962.551.23-1.65-0. 080.59-0. 43-0. 67-0. 521.36-1.45 6.对得到的结果作出解释(1)由MATLAB求解结果得主成分系数分别为:Graph2.00-1.00- o.oo-o u-1.00-2.00-4.00-2.000.002.004.00pscorel由图可知分布在第一象限内的是琉璃河、邯郸.湘乡这三个企业,说明这三个企业的经济效益 在全国来说是比校好的;分布在第四象限的哈尔滨、柳州、蛾嵋,因为第四象限的主要特征是 第
28、一主成分,第一主成分占信息总量的比重最大,所以这三个企业的经济效益也算比较好。分 布在第二象限和第三象限的地区可属同一类,经济效益较差。【作业2】文件pcaexe. xIs是世界上55个国家和地区某年7个田径项目上的女子记录。要求1. 分别用mat lab和spss做主成分分析,并解释第一主成分和第二主成分的意狡。2. 基于第一主成分对个国家和地区排序。3. 恳于主成分综合评价排序。解:1.用matlab做主成分分析,并解释第一主成分和第二主成分的意艾。用MATLAB做主成分分析编程如下:(1)原始数据标准化:load dectxt n, p=size(dec);MEAN=mean (dec)
29、 ; %求各变莹的均值STD=std(dec);%求各变量的标准差MEAN=ones (n, p)*diag(MEAN);STD=ones(n, p) *d i ag(STD);x=(dec-MEAN)./STD;%原始数据标准化-0.0189-0. 63150. 40850.68040. 31450.41650. 1685-0.9256-1. 1625-0.8684-0.8904-0. 5880-0.4436-0. 6920-0.4169-0.4965-1.0401-0.7980-0. 3172-0. 1286-0. 4617-0.4612-0. 5415-0. 5249-0.7056-0.
30、 5579-0.7828-0.5117-0.3506-0.5325-0.03950. 77280. 76570.4408-0. 1125-0.6823-0. 4245-0. 22620. 21840. 49500. 3923-0. 15301.15310. 74560.59520. 95760. 37470. 07730. 5799-1.3678-1.2525-1.2492-0.7056-0. 7985-0.7707-0. 78810. 84350. 79060. 5579-0.2436-0. 2871-0.0923-0. 06640. 73300. 69160.58400.03360.013
31、7-0. 1650-0. 1619-0. 04100. 3225-0.05440.31080. 07380.0167-0. 26262. 83383. 11272.61142. 06641.54792. 00361 96860. 75510. 86261.80871 23481 06651.1919-0.0526-1.1688-1 5045-2.0221-1.7220-0. 5579-0. 6375-0. 4788-0. 4391-0. 10950.0725-0.4284-0. 4376-0.8919-0. 71240.37910. 36750. 98721.51201 24700. 5377
32、1.0031-1.0804-1. 1265-1.2193-0.4284-0. 6782-0.6375-0. 6308-1.0361-0. 9465-0.6257-0.7056-0. 5579-0.5648-0. 5966-1.7880-1 7386-1.9586-1.3524-1 0994-0.8434-0.5173-1.3457-1. 1265T. 3650-1. 1676-0. 8888-1.0373-0.8184-1.3678-1 3605-1.0999-0.8904-0. 8888-1.0009-0.77920.37910. 39450. 5691-0.05880. 07380.513
33、50.28960. 48970. 80861.00221.88161 60801.32521.3716-0.3727-0.5235-0. 7116-0. 6132-0. 5579-0. 5648-0. 56040.73300. 57460.07250. 2184-0.01640.64670.48150.51180. 53860.72221.32720. 85600.69520.9175程序运行结果为:x =(3)求得特征值及相应的单位特征向量V, D=eig(R) ; %注释:函数eig的功能是对矩阵R进行正交对角化变换,矩阵D是以R的特征值为对角元的对角矩阵(对角元按从小到大的顺序排列),矩
34、阵V是正交变换矩阵。程序运行结果为:-0.0522-0. 6188-0.24010.31540. 28840.48800. 36860.11030. 7115-0.0321-0.07860. 23400.53480. 3655-0.2100-0. 19720. 5694-0.3551-0. 50870. 24940. 38170.31480. 0250-0. 6216-0. 0543-0. 5830-0. 15140. 3848-0.68960. 2304-0.02780.4365-0. 0236-0.35760.38930. 6006-0.01870.46200. 36480. 1438-0
35、.34670.3892-0.0746-0. 1334-0.1282-0. 66460. 4921-0.37770.3657D =0. 022600000000. 039300000000.053800000000. 126300000000. 303100000000. 656600000005.7983(4)选取主成分:DD= ;%将特征值对角矩阵D改写为列向量DDfor i=p:-1:1%此处要注意eig函数的输出D中特征值的排列顺序DD=DD;D(i, i);endOFFER=DD/sum(DD) ;%计算特征值的方差贡献率cumOFFER=cumsum(DD)/sum(DD);%计算特
36、征值的方差累计贡献率0UTC0ME=DD, OFFER, cumOFFER%综合输出计算结果pri=1;for i=1:pif cumOFFER(i)=0. 85pri = i+1; %取前几个特征值?累计方差贡献超过85%endendPCAC0V=V(:, end:-1:end-pr i +1) %输出对应特征值的正交单位化的特征向量,此处要注意eig 函数的输出D中特征值的排列顺序和特征向量的排列顺序PCASC0RE=x*PCAC0V;%主成份得分Z=PCASCORE*OFFER (1 :pr i)/cum0FFER (pri); %综合评分ZZ, l=sort(Z, descend) ;
37、 %样本排序matrix I.scatter (ZZ, I);程序运行结果为:OUTCOME =Y, I = SORT(X, DIM, MODE) also returns an index605.79830. 65660.303150(O0.12630.05380. 0393400. 022630PCAC0V =200. 36860. 36550. 38170.384810(-(o 85%,因此用取前两个主成分即可。 主成分系数为PCAC0V =0. 36860. 36550. 38170.38480. 38930. 38920. 36570. 48800. 53480. 2494 -0.
38、1514 -0.3576 -0.3467 -0.3777故主成分的线性表达式为% = 0.3686 兀 + 0.3655+ 0.3817+ 0.3848 x4 + 0.3893 x5 + 0.3892 x6 + 0.3657 x7F2 = 0.488為 + 0.5348 x2+0.2494 x3 - 0.1514 x4 - 0.3576 x5 - 0.3467 x6 - 03777 x7 (5)对第一主成分和第二主成分的意义进行分析:主成分系数为PCACOV =0. 36860. 48800. 36550. 53480. 38170. 24940. 3848-0. 15140. 3893-0.
39、35760.3892-0.34670. 3657-0.3777由于第一主成分的线性组合中所有变莹的系数相当,所以第一主成分可看成是x1, x2, x3, x4, x5, x6, x7的综合变量。可以解释为第一主成分反映了工业生产中投入的资金、劳动力所产生 分所占信息总量为68. 3%,在我国目前的工业CommunalitiesCorrelation Matrixx3 | x4 | x5 I x6Scree PlotI x7.682.680.699-48OConponmt12xl.153.602x2.152.660x3.159.308x4.160-.187x5.162-.441x6.162428
40、x7.152-.466Component MatrixComponent Score Coefficient MatrixExtraction Method: Principal Component Analysis. Componmt Scores.i Numberoadi ivej32M2iponent Score Covariance MaComponer1211.000.0002.0001.000Extraction Method: Principal ComponerComponent Scores.利用SPSS得出的主成分系数为标准主成分系数,将其化为主成分系数如下:(1) 将Component Score Coeff icient llatrix中的1、2列数字分别在SPSS中建立新的散列b1, b2输入*57 (5.798), b2 丁(0.657)得到如下数据:.368.366.383.385.390.390.366.488.535.250- 152- 357 - 347 - 378片=0.368 不 + 0.366 兀 + 0.383
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《分数的初步认识》(教学设计)-2023-2024学年五年级下册数学西师大版
- 马工学管理学中的参与式管理策略试题及答案
- 届九年级化学上册 2.3 制取氧气教学实录2 (新版)新人教版
- 数控加工加工工艺编程复习试题附答案
- 汽车维修工复习试题附答案
- 马工学与身心健康管理试题及答案
- 免疫功能知识培训课件
- 某公司招聘管理制度内含18个附件
- 培训学校招生方案
- 患者搬运法操作考核标准
- 医疗(安全)不良事件
- 公安机关办理刑事案件程序规定
- 《学前心理学》课程期末考试复习题库(含答案)
- 城市轨道交通服务礼仪PPT完整全套教学课件
- 浙江 医院麻醉科术后镇痛治疗管理的规范
- 食材配送计划
- 洗胃术-教学讲解课件
- 机动车检测站应急预案
- 电动单梁桥式起重机起重机械检查维护记录表
- 广东省简介PPT-广东省PPT介绍
- 农村人居环境整治文明积分制试点方案
评论
0/150
提交评论