一组空气污染数据的主成分分析_第1页
一组空气污染数据的主成分分析_第2页
一组空气污染数据的主成分分析_第3页
一组空气污染数据的主成分分析_第4页
一组空气污染数据的主成分分析_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精心整理一组空气污染数据的主成分分析【说明】下面的多元统计分析练习题摘自R.A John so n等编写的应用多元统计分析(第五版),原书为:thRichardA.JohnsonandDeanW.WichernAppliedMultivariateStatisticalAnalysis(5 Ed).PearsonEducation,Inc.2003o我看的是中国统计出版社(ChinaStatisticsPress 2003年发行的影印本。第一题为原书第1.6题,即第1章的第6题,第二题为原书第8.12题,即第8章的第12题。第二题用的是第一题的数据。1习题/ I1.6.Thedata in T

2、able1.5are42measureme ntson air-polluti onv ariablesrecordedat12:0 0noonin theLos An gelesarea on differe ntdays.(a) Plotthemarginaldotdiagramsforallthevariables.(b) Constructthex ,Sn,andRarrays,andinterprettheentriesiR.TABLE1.5 AIR-POLLUTIONDATAWin d(x”Solarradiati on(X2)CO(X3)NO(X4)NO2(X5)O3(X6)HC

3、(X7)89872128271074395371034356310885281546914281038905212124984741215557264211447825111113864521394671541033691421273772741810310704211731072418103977419103876417738715316449674213239693395310625314449884276388042131145303352368351102348843276367842111138792171036624398310373172387141107375241128454

4、8658436754110243103541692885419102586316122586721318277974925377952862668621114384043652Source:DatacourtesyofProfessorG.C.Tiao.8.12.C on sidertheair-polluti on datalistedi nTable1.5.Yourjobistosummarizethesedatai nfewerthap=7dime ns ion sifpossible.C on ductapri ncipalcomp onen ta nalysisofthedataus

5、i ngboththecovaria ncematSa ndthecorrel ati onm atrix R .Whathaveyoulearned?Doesitmakea nydiffere ncewhichmatrixischose nforan alysis?Ca nthedat abesummarizedi nthreeorfewerdime nsio ns?Ca ny oui nterpretthepri ncipalcomp onen ts?2部分解答2.1部分统计参数利用Excel计算的平均值(x )和标准差WindSolarradiati onCONONO203HCAvera

6、ge7.573.8571434.5476192.190476210.0476199.40476193.0952381Stdev1.581138817.3353881.23372091.08735743.37098375.56583450.6917466Excel给出的协方差矩阵SWind Solarradiati onCONONO2O3HCWind2.4404762Solarradiation -2.714286293.36054CO-0.3690483.81632651.4858277NO-0.452381-1.3537410.6575964 1.154195NO2-0.5714296.60

7、204082.25963721.062358311.092971O3-2.17857130.0578232.7545351 -0.7913830521542 30.24093HC0.16666670.6088435 0.1383220.17233561.01927440.58049890.4671202Excel给出相关系数矩阵RWindSolarradiati onCONONO2O3HCWind1Solarradiation -0.1014421CO-0.1938030.18279341NO-0.269543-0.073569 0.50215251N02-0.1098250.115732 0

8、.55658380.2968981103-0.253593 0.3191237 0.4109288-0.133952 0.16664221HC0.1560979 0.0520104 0.1660323 0.2347043 0.4477678).1544506 1从相关系数矩阵可以看出,CO与NO、NO2相关性明显,03与Solarradiation、CO相关性明 显。后面的主成分分析将 CO与NO、NO2归并到一个主成分,将 O3与Solarradiation归并到一个 主成分,将HC、Wind归并到一个主成分。HC与Wind的相关系数并不高,但从正相关的角度看, 二者的数值倒是最高的。方差极

9、大正交旋转之后,HC与CO、NO、NO2归并到一个因子,因为HC与NO2的相关系数较高,与CO、NO的相关系数高于其他变量。2.2主成分分析之一数据未经标准化下面是从相关矩阵R出发,SPSS给出的结果。原始数据未经标准化。所谓从 R出发,就是在 SPSS的 FactorAnalysis:Extraction Analysis 选项中选中 CorrelationMatrix。SPSS给出的相关系数矩阵(CorrelationMatrix),与Excel计算的结果一样。公因子方差(Communalities)表如下。公因子方差变化于 0.5440.795之间,相差不是很大。 但是,公因子方差值没有

10、达到 0.8以上的,可见每一个变量体现在三个主成分中的信息都不超过80%。特征根与方差贡献(TotalVarianceExplained)如下表。可见提取三个主成分可以解释原来7格变量的70.384%。主成分载荷矩阵(ComponentMatrix)见下表。将上表从SPSS中复制到Excel中,进行涂色分类,结果如下表所示。Comp onent12VWIND-0.362020.3278091 0.706084Solarradiati on0.31424-0.619970.24631CO0.842417-0.00803-0.12466NO0.577243:0.511736i -0.44671NO

11、2:0.7612940.235183:0.215682O30.496126i -0.667490.175399HC0.4882570.362466i 0.593692主成分分类如下:第一主成分的主要相关变量: CO、NO、NO2。第二主成分的主要相关变量:Solarradiation、O3。第三主成分的主要相关变量:Wind、HC。在主成分载荷图(ComponentPlot)中,三个变量分别落入三个不同的主成分代表的区域。主成分得分表如下。最后一栏对几个典型的样本给出了简单的解释。注意解释的时候看清主成分载荷矩阵中载荷值的正负号。Casesf1f2f3典型的说明S1 :0.61591-0.81

12、86-0.38418;S20.03194-0.36015-0.26343 1S3-0.34752-0.54481-0.49701 ;S4 :0.2425-0.302931.80367样本4代表的区域 Wind、HC污染严重S5-0.12729-0.91941-0.4042S60.72612-0.192781.21954S7 :2.036860.899821.4607样本7和8代表的区域与CO、NO、NO2污染有明显的关系S82.573090.77732-0.34124 S90.09802-0.817360.30334S10 :0.506640.788030.88735S110.39040.97

13、744-1.48345S120.14485-0.45848-0.27016S13 :1.924770.88883-0.66029S14-0.506620.631390.91242S15-0.89378-0.170361.19632S16 :-0.66037-0.398620.93758S17:-0.87787-0.36350.3701S180.887331.53060.65731S19 :-0.429351.092530.48155S20 :-0.7510.924240.11384S210.428261.961331.18659样本21代表的区域 Solarradiation、O3污染较小S2

14、2 :-0.69373-0.097470.51522S230.414840.206811.21242 , iS24-1.162631.39047-2.12097S25 :0.86691-1.703350.91799C1jf IS26-0.91899-0.139150.18106S270.09994-0.51948-0.37202S28 1-1.32458-0.69110.65186S29-0.104720.39184-1.08681S30-1.85931.379330.6047S31 1-0.62672-0.083470.47051S32-0.142640.649410.72066S330.6

15、74211.56899-2.63096样本33代表的区域 Wind、HC污染较小S34 10.24874-1.956810.22088S35-1.714290.39216-0.08554S36-0.80238-1.13269-0.0517S37 1-1.00653-1.92662-1.17569样本37和38代表的区域 Solarradiation、:S38 11.29486-1.77265-1.3235703污染严重S391.68145-1.04272-0.66334S40-0.48079-0.49683-1.07633S41:0.72122-0.53042-0.57934S42-1.177

16、760.98919-1.555382.3主成分分析之二一一数据未经标准化下面是从协方差矩阵S出发,SPSS给出的结果。原始数据未经标准化。所谓从 S出发,就是在 SPSS的 FactorAnalysis:ExtractionAnalysis 选项中选中 CovarianceMatrix。公因子方差(Communalities)表如下。在未经处理的(Raw)公因子方差一栏,其Initial数值 都是原始数据的方差。不过与前面Excel给出的协方差矩阵有所不同,Excel给出的是总体方差,SPSS给出的是抽样方差。例如以 Wind的Initial值为例,2.4404762X 42/41=2.5,或

17、者2.5X41/42=2.4404762 (对照前面的协方差矩阵)。重标的(Rescaled结果是Extraction值与Initial值之比。公因子方差的合计结果如下:In itialExtractio nIn itialExtractio nWIND2.50.030665110.012266Solarradiation 300.51568 300.1336710.9987288CO1.5220674 0.060166610.0395295NO1.1823461 0.006750210.0057091NO211.363531 0.179005910.0157527O330.978513 3.

18、845942810.1241487HC0.4785134 0.001667110.0034839合计348.54065 304.2578671.1996188精心整理RawRescaled特征根与方差贡献(TotalVarianceExplained)如下表。在 Raw 一栏中显示,提取一个主成分似乎可以解释原来7格变量的87.295%。但重标之后显示的数值却是 17.137%。根据公因子方差表和合计结果,重标之前,全部的方差解释为304.25786/348.54065*100=87.295%重标之后,全部的方差解释为1.1996188/7*100= 17.137%。主成分载荷矩阵(Compo

19、nentMatrix)见下表。可以看来,由于变量Solarradiation的方差很大, 它绝对地控制了第一主成分。2.4主成分分析之三数据经过标准化下面是从协方差矩阵S出发,SPSS给出的结果。原始数据经过标准化。可以看到所有的结果 重标前后一样,并且与从相关矩阵 R出发计算的结果一样。公因子方差(Communalities)表如下,重标前后的结果一样。特征根与方差贡献(TotalVarianceExplained)如下表。重标前后结果一样。主成分载荷矩阵(ComponentMatrix)见下表,重标前后一样。可以看到,第一主成分的相对 重要性受到标准化的极大影响。结论自然是:如果在极其不同的范围内测量变量,或者测量单位的量纲不同,变量必须经过标准化。否则,应该从

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论