主成分分析的计算步骤_第1页
主成分分析的计算步骤_第2页
主成分分析的计算步骤_第3页
主成分分析的计算步骤_第4页
主成分分析的计算步骤_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、葡萄酒的评价摘要本文通过聘请一批有资历的评酒员对葡萄酒的质量进行评价,从而得出不同组别、不同样品葡萄酒的质量。然后分析酿酒葡萄与葡萄酒质量的理化指标对葡萄质量的影响,以及它们之间的联系。对于问题1,我们采用了单因素方差分析和检验对评判两组评酒员的评价结果进行了显著性检验。对于问题2,我们首先对酿酒葡萄的理化指标进行主成分分析,得出各个样品的综合得分;然后,根据附表1中品酒员对各个样品的综合评分对葡萄酒进行模糊综合评判处理,得出各葡萄酒样品质量的模糊评判分数;再据有关资料提供的酿酒葡萄与葡萄酒的权重系数进行综合处理,得出酿酒葡萄的分级情况为:对于问题3,我们先采用灰色关联度分析得出了酿酒葡萄理化

2、指标X1与葡萄酒的理化指标(X2)的关联度,比较了各理化指标的关联程度大小;然后再采用一元多项式回归得出X1与X2的具体函数关系为: 对于问题4,我们先用残差分析剔除了一些异常数据后,再对有关数据进行处理,逐个分析了酿酒葡萄对葡萄洒质量、葡萄酒对葡萄洒质量的单因素影响,再采用多元线性回归得出了酿酒葡萄、葡萄酒的理化指标对葡萄酒质量的综合影响。我们得出:单因素影响:综合因素影响:关键词:检验、主成分分析、Matlab编程、灰色关联度分析、一、问题重述11、问题背景:葡萄酒是一种健康饮料,口味独特,酒精含量又低,深受大家的欢迎。然而确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒

3、员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。因此,确定酿酒葡萄和葡萄酒的质量之间的关系是非常必要的。1.2需要解决的问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析题目要求根据葡萄酒和酿

4、酒葡萄检测的理化指标来反映葡萄酒和葡萄的质量。2.1问题一的分析:问题一要求我们根据附件1中两组评酒员的评价结果,判断哪一个更为可信。首先,本文采用了Excel统计原理求出每一个组每一个样品的总平均分,然后用单因素方差分析不同组别的同类葡萄,得出F比,然后进行比较得出两组评酒员的评价结果有无显著性差别。然后,用t检验进一步证明。根据上面所得出的数据求出均值差的置信水平为0.95的置信区间。然后,根据置信水平,评判哪一组结果更可信。2.2问题二的分析:对问题二,对问题2要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。本文采用了主成分分析法,根据附件2葡萄和葡萄酒的理化指标表,选取

5、一级指标,有多次测量数据则取其平均值。运用Matlab编程,计算得到主成分的个数,以及主成分的得分,再对它们求和得出每一个样品的综合得分。接着,运用Excel统计原理求出每种葡萄酒样品的质量的总平均分,根据统计原理得出它们权重关系。然后求出每个样品在两种因素下的总得分,再根据得分情况对酿酒葡萄分级。2.3问题三的分析:对问题三,采用主成分分析法求出葡萄酒的理化指标的主成分得分。然后,求出每个样品的总得分。采用灰色关联度分析酿酒葡萄与葡萄酒的理化指标的关联度。最后,采用一元多项式回归求出两者的具体函数关系,并得出置信区间。2.4问题四的分析:对问题四,采用一元线性分析分别得出酿酒葡萄和葡萄酒的理

6、化指标与葡萄酒质量的函数关系。然后,采用多元线性分析得出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的函数关系,期间采用了残差分析,剔除不可置信点。三、模型假设1.假设二级指标对一级指标的影响不大;2.四、符号说明1. :指标变量的个数; 2.rij:(i,j=1,2,p):为原变量的xi与xj之间的相关系数; 3.R:实对称矩阵; 4.:主成分; 5.:特征值;6.:特征向量;7.:主成分载荷;8.:因素集;9.:评语集;10.:权重集;11.:单位矩阵;五、模型的建立与求解(一)对于问题一:分析附件1中两组评酒员的评价结果的显著性差异,判断哪组更可信。首先用采用excell统计学原理求出每一组每

7、个样品的总得分。然后采用单因素试验的方差分析分析两组评酒员的评价结果有无显著差异。再采用t检验进一步验证。根据得出的数据求均值差的置信水平为0.95的置信区间。第一种方法:采用方差分析 一般地为了考虑因素A是否对试验指标有影响,我们在因素的不同水平A1、A2,Ar下进行试验,如果在每一水平Ai下,进行了ni次观察,从而得到ni个数据,把因素每一水平下的试验指标看成一个随机变量,则这ni个数据就是的一个容量为ni的样本的值。现在我们要研究的是这r个总 体是否具有相同的分布,或r个样本()是否来自同一个总体。检验假设(=0.05);:,:不全相等,通过计算因素平法和、误差平法和、总和、自由度。再通

8、过matlab可以得到均方、F比的值,从而可以确定有无显著的差异,其得出的表格及图像如下 方差来源 平法和 自由度 均方 F比 因素 误差 S-1 n-s = = 总和 n-1 =经查表得(9,10)=3.02>2.87故各因素存在显著差异。同理可以得出两组评酒员对其他样品的得分有无显著差异,经过多次应用matlab得到数据可以看出基本上无显著差异。这里=-(T=),=-, = - ,然后再算出其置信区间,通过置信区间看哪一组更可信。(方差)=/(n-s),代表均值。代表总平均,均值差的估计:(n-s),(n-s)第二种方法:采用检验法当总体呈正态分布,如果总体标准差未知,而且样本容量&

9、lt;30,那么这时一切可能的样本平均数与总体平均数的离差统计量呈分布。检验是用分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。相关样本平均数差异的显著性检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。相关样本的检验公式为: 。在这里,分别为两样本平均数; ,分别为两样本方差; 为相关样本的相关系数。 第一步 建立原假设=;第二步 计算值,根据表(9)的数据我们可以计算出t=0.58第三步 判断 根据自由度26,查值表1.7058,2.4786.由于实际计算出来的=0.58<2.4786=,则p>

10、;0.99,故原假设成立。结论为:两次测验成绩无显著地差异。2.对于问题二: 主成分分析的计算步骤:1计算相关系数矩阵 其中,rij(i,j=1,2,p)为原变量的xi与xj之间的相关系数,其计算公式为 因为R是实对称矩阵(即rij=rji),所以只需计算上三角元素或下三角元素即可。2计算特征值与特征向量首先解特征方程,求出特征值,并使其按大小顺序排列,即;然后分别求出对应于特征值的特征向量。这里要求=1,即,其中表示向量的第j个分量,即为单位向量。3 计算主成分贡献率及累计贡献率主成分的贡献率为累计贡献率为5.确定主成分个数:一般取累计贡献率达8595%的特征值所对应的第一、第二,第m(mp

11、)个主成分。6. 计算主成分载荷其计算公式为 (3)7.得到各主成分的载荷以后,可按照下式计算各主成分的得分 (4)模型的求解:本文在Matlab软件中通过编程来实现主成分分析。计算结果如下:特征值贡献率累计贡献率6.93830.216820.216825.05880.158090.374914.29980.134370.509282.67360.0835510.592832.0080.0627510.655581.97720.0617870.717371.57710.0492840.766651.3670.0427180.809371.1130.0347810.844150.91760.02

12、86750.872830.825130.0257850.898610.662330.0206980.919310.521250.0162890.93560.442340.0138230.949420.383480.0119840.961410.292790.009150.970560.256780.0080250.978580.221970.0069370.985520.145620.0045510.990070.0984250.0030760.993140.0801060.0025030.995650.0577420.0018040.997450.0454740.0014210.998870

13、.0177320.0005540.999430.0130830.0004090.999840.005260.00016413.13E-169.79E-181由表可得前十个成分的累计贡献率达到87.283,即前十个主成分包含了原来四个指标的87.283的信息。可以确定主成分的个数为10较合理。主成分载荷表z1z2z3z4z5x1-0.372180.5583-0.07523-0.350660.23639x2-0.63121-0.393990.35325-0.20983-0.17873x30.13676-0.372820.17201-0.017130.55541x4-0.82821-0.06111-

14、0.008220.22165-0.10492x5-0.372750.193790.35515-0.25619-0.30696x6-0.309590.373560.106950.54711-0.11055x7-0.252480.273030.327280.42068-0.37237x8-0.313390.047645-0.218790.63267-0.25323x9-0.40404-0.140940.11470.658020.042719x10-0.77426-0.373860.19957-0.197240.05431x11-0.88146-0.12751-0.02433-0.233230.03

15、5451x12-0.77788-0.13683-0.139670.072020.20776x13-0.75233-0.2484-0.01644-0.279040.012686x140.0265540.145190.8542-0.031330.2339x15-0.560440.0562180.0842020.23460.16316x16-0.23740.75421-0.28133-0.23542-0.09672x17-0.055340.72765-0.27612-0.11085-0.1212x18-0.239880.69354-0.43777-0.13623-0.11498x19-0.28075

16、-0.200010.2716-0.71783-0.13424x200.2650.31449-0.67216-0.008350.38084x21-0.348730.0544360.43867-0.006-0.57369x22-0.353450.82106-0.33388-0.05691-0.08511x230.29654-0.50773-0.13427-0.13188-0.55873x240.46867-0.46899-0.39719-0.15569-0.22264x25-0.57446-0.142950.252590.324430.36694x26-0.57042-0.16767-0.1481

17、2-0.254890.03827x270.18165-0.39016-0.527790.13337-0.28245x280.57432-0.303430.330960.09226-0.07094x290.436070.438080.67447-0.053570.052892x300.244270.625460.49782-0.02105-0.15203x31-0.082490.11432-0.064520.018360.10475x320.423580.390690.70991-0.054460.067643z6z7z8z9z10x1-0.337650.235520.077472-0.0154

18、10.11338x2-0.050510.189430.172180.08166-0.13101x30.063688-0.01992-0.025580.261170.5952x40.27146-0.23047-0.106790.044250.052262x5-0.168410.254660.47722-0.285020.08522x60.40047-0.38175-0.1886-0.03420.1408x70.06870.177460.40481-0.205590.26144x8-0.054090.1131-0.058080.42213-0.28878x9-0.248650.19482-0.09

19、793-0.045640.091923x100.150880.15755-0.18029-0.09674-0.19219x110.12072-0.08082-0.2124-0.18204-0.11852x120.316940.14901-0.02552-0.119020.13707x130.236060.057622-0.20579-0.26199-0.14763x140.120950.19763-0.231790.0471060.050131x15-0.369180.50408-0.190280.033130.10021x16-0.123360.023743-0.25660.150770.0

20、29686x17-0.140350.027181-0.031660.109890.037652x18-0.083910.035027-0.268010.0704280.029274x19-0.24035-0.09854-0.086850.2880.10883x200.248850.224970.034186-0.20207-0.00602x21-0.17123-0.2438-0.158830.142390.18306x22-0.027270.10104-0.023990.05310.068788x230.192310.29099-0.035560.127040.1633x240.212410.

21、21698-0.23826-0.063220.040502x25-0.31780.053707-0.0170.072289-0.07145x260.42839-0.064540.0821330.327180.17561x270.0487540.493-0.31305-0.106780.21258x28-0.311030.15122-0.307340.071764-0.10293x290.256860.18024-0.1771-0.00467-0.06915x300.439730.13219-0.10054-0.117980.057796x310.466150.414380.398140.501

22、35-0.21387x320.214840.17461-0.194620.038311-0.1096计算各主成分得分第一主成分得分第二主成分得分第三主成分得分第四主成分得分第五主成分得分-1459.68898.372429735.52552776-705.0975375326.0219698-1697.05825.6983014144.4038168-306.6210668388.6696323-3743.6440674414.07666-396.3077267-2844.7726171867.39894-1236.314624976.926694532.27809855-785.692185

23、7401.2348894-1229.067626776.159572281.05010894-628.217701312.9044346-1715.4265971689.695682-62.59072638-1206.604888705.6270397-1435.8682271083.4663138.99551013-622.695375481.0850037-1829.092597679.3189256191.701503150.189352374.9236545-1667.552433917.4341399126.0441464-598.1870409393.5972153-1078.00

24、4727477.2342466143.0994781-273.4789592241.9755527-1273.9653991094.09541126.7018678-865.9051769454.8984115-1354.2209921216.809492-4.587788519-890.8059637510.2901028-1015.435755536.3320408114.4708884-526.0584188214.9034954-1373.012418311.4105744225.2873476151.0085459199.7216057-1261.470153987.98703653

25、6.86805067-740.6207441412.73343-1221.451805564.7260645151.3402484-293.7275559271.3815688-1095.435172722.554238278.58338871-605.1795904299.3020808-1326.3116011115.82030315.16094439-815.9354834468.9858881-1451.6465251129.22888925.23911952-798.8039304471.7236987-1260.824921036.52719635.47718097-842.747

26、506434.3960589-2883.7254313293.923853-254.0251134-2186.242031387.979844-1505.8395811182.26220825.53495534-694.6728755520.8452142-1553.5071961047.6804259.15127011-617.4291103459.7351879-1130.215077682.939286178.65444717-547.0908957276.9149418-968.3550784554.584241897.72926382-493.6212724233.2828955-7

27、82.7255598232.0239276148.4814974-335.077781883.10802908-1027.139564332.7286656168.0799706-90.9400365182.9347185第六主成分得分第七主成分得分第八主成分得分第九主成分得分第十主成分得分综合得分-596.6551658486.190821204.989648244.65083704172.3537132-593.3277566-880.452357721.3186846176.43452493.351933486233.8500228-390.3965075-2889.3866482107

28、.455288710.8300903-81.21176867904.116208548.55435916-746.7088773602.1766931241.811965315.61123185181.3405083-317.3356057-656.7840316550.2550493219.252446828.35218703144.4034727-401.6920871-1204.47999926.4927581340.91146372.298257425322.0564146-202.0205857-922.5314634727.4909999220.1791018-5.38011532

29、8244.7128568-190.5453989-944.0113152766.462273291.84629841-14.6602869269.1462031-264.1759887-840.7668009696.786278233.584469716.72104871213.6050186-508.7339578-589.7558824504.7395724149.755140810.71418329131.4033671-282.3180277-842.1517847674.7061825268.84547366.869202866203.1839261-252.7218852-912.

30、2394975716.0831458267.73434273.048971792234.5617236-213.3264628-517.6377114456.9860545197.978839136.3393115786.33573437-415.7855212-657.9882782570.838043587.283001366.30861765149.6435137-329.4994463-787.6361324634.4443912239.531449112.94977442189.6299013-275.5829961-668.457215567.1797102165.48487084

31、.647916386150.0745574-308.8016393-622.1816045520.8149294209.358057620.32885086133.8638105-337.9910105-864.1062581685.8497431253.6811389.648789306214.753099-242.4534376-879.196038699.5464481252.438697613.42143778224.9951933-313.05301-812.7008303655.5781725262.05120611.69647227190.898918-289.6480513-2

32、197.7483271624.236649566.9083882-54.04499633665.3442148-37.3929492-974.1366684762.7232896234.8117166-8.489879169264.7677748-192.1938457-890.0308025708.1733698217.85264491.330699221243.3898914-323.6536251-576.7873159482.8105433190.737678620.94594819135.2171495-385.8732941-524.8805417451.252443182.656

33、426622.97779964101.5018571-342.871965-323.9148473319.3838209154.305163745.0156971222.14956062-437.2504925-543.2868154474.4832253117.66452918.064375159108.015547-269.3953841葡萄酒特征值贡献率累计贡献率5.32590.591770.591771.66220.184690.776460.759810.0844230.860880.705550.0783950.939280.303560.0337290.973010.143760

34、.0159730.988980.0398850.0044320.993410.030580.0033980.996810.0287270.0031921主成分载荷表z1z2z3x1-0.827120.34790.26326x2-0.939420.03892-0.09648x3-0.98083-0.01853-0.0681x4-0.919140.00442-0.08787x5-0.46187-0.612920.11609x6-0.96185-0.10514-0.11255x70.856950.17041-0.25403x80.28195-0.748580.52898x90.011971-0.75

35、042-0.54621计算主成分得分第一主成分得分第二主成分得分第三主成分得分综合得分-827.7980208323.0187949259.9445507-244.835-436.8249716128.2072392141.188774-167.429-332.327524682.01522819109.2308265-141.081-115.87446074.76163418553.35689069-57.7559-202.23943137.3159371282.95757423-81.9659-51.35180547-10.5553799231.25095084-30.6562-21.45

36、931985-19.9901073516.53636217-24.9131-770.528377280.6265856249.7542976-240.147-329.803701382.59462388107.167415-140.042-63.354301866.66764069947.61037987-9.0762859.48766347-4.633481491-24.5589894230.29519-23.62200729-23.487831817.49840133-29.6114-128.305759617.3595472661.30652416-49.6397-185.663072621.9234695969.5435019-94.1961-49.37041369-6.43695853738.2804621-17.5269-93.2291490

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论