版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、. . . . 酿酒葡萄与葡萄酒理化指标与其质量的分析与评估摘要 本文通过运用SPSS首先对两组品酒员对葡萄酒的评价进行了差异显著性分析以与评Cronbach 系数分析对品酒员评价的可信度进行了分析,得到了两组品酒员评价之间存在显著性差异,并且第一组品酒员的评价结果更为可信。接下来我们取第一组评酒员给每个样品酒所给出的总分的平均分表示该样品葡萄酒质量的量化指标进行相关讨论 我们通过对葡萄与葡萄酒的理化指标归一化处理,将它们之间的联系现实的更为明显,紧接着我们利用因子分析、主成分分析将决定葡萄酒质量的因素维度较低,从而达到简化模型的目的,并通过分析将各成分因子重新命名,再将命名后的主成分和评论员
2、对葡萄酒的评价作为依据对酿酒葡萄等级评定,并引入层次分析法对评定体系进行改进构想。最后利用MATLAB求解主成分因子与葡萄酒质量之间的函数关系,并用BP人工神经网络进行验证与讨论。最后我们在每一个问题后面进行了深入的反思与总结,得出了一些具体的改进思路与方法,并得出在原有问题上的修正。关键字 SPSS MATLAB Cronbach 系数分析 主成分分析 层次分析法 BP人工神经网络 模型的改进与修正1. 问题重述随着经济的日益发展,人们生活水平的不断提高,葡萄酒的受众随之增加,品酒行业逐渐专业化。品质是现代葡萄酒生产追求的目标之一,针对酒类的质量检测也成为食品行业工作的重中之重。根据已有数据
3、,运用数学建模的方法,对葡萄酒进行评价是一个重要问题。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。从上述相关关系出发,参考相关数据,针对酿酒葡萄与葡萄酒的理化指标和葡萄酒的质量这几个变量,进行分析并建立数学模型,讨论关于葡萄酒的评价问题:特别注意指出模型中的优点和不足之处,并做出改进方向。2. 符号说明符号说明符号说明第i个品酒员对第j款酒所给的总分S香气指标K整个品尝的次数第i
4、类芳香物质(1i8)总得分的方差Q其他影响因素所有在第i位品酒师打分的方差k香气指标关于芳香物质函数的常系数Y葡萄酒的单宁M测得葡萄酒评分X1葡萄酒的总酚Z葡萄酒标准分值(真实葡萄酒评分)X2葡萄酒的黄酮醇U外观指标第一组的总平均分V口感指标理化指标向量W整体评价指标代表原来数据群体的因子香气指标占总分的权重两类新的性质因子外观指标占总分的权重口感类物质成分因子口感指标占总分的权重色泽类物质成分因子整体评价指标占总分的权重3. 模型建立与求解3.1. 数据处理3.1.2. 数据预处理 由于试题中给出的附件酒样品未按照顺序排列,我们首先将数据进行了预处理,每组数据均按照样品号和品酒员号顺序排列,
5、加和得到每一剂量酒样品的总评分数,并求得各项明细指标的平均值;其次将多组同类理化指标取平均值,以便分析讨论,进行模型的建立与求解。3.1.3. 数据处理方法数据的预处理和部分图示,采用办公软件Microsoft Excel 2010;数据的归一化处理,采用办公软件Microsoft Excel 2010;数据结果的显著差异分析,采用SPSS 19.0;数据结果的信度分析,采用SPSS 19.0;数据结果的主成分分析,采用SPSS 19.0;数据处理的拟合分析,采用MATLAB2012a3.2. 问题1.1:附件1中两组评酒员评价结果的显著性差异分析要比较两组评论员之间是否具有显著性差异,而每组
6、有10个评论员,27或28个葡萄酒样品,由于附件中的数据都是单项给出的,整体可比性不强,所以我们先用EXCEL将数据进行了初步的整理(求出每个品酒员对各样品的总分,以与各个明细样品的平均值),以第一组对红葡萄酒样品一的评价为例,处理结果如表1所示:表1. 红葡萄酒样品一的评价项目品酒员12345678910平均值葡萄酒样品 1外观分析澄清度544443432433.5色调1088666686666.6香气分析纯正度655545544544.6浓度867767774646.1质量161412121414121412121212.8口感分析纯正度655545644554.8浓度8667668666
7、66.3持久性876767876666.6质量221916191616191916161617.2平衡/整体评价11109109109999109.4总分1008478827579848169757277.93.2.1. 初步分析:针对处理后的数据,我们初步的想法是将每组中各个品酒员对每项样品的总分作为一个样本,因此每个样本里将有270项数据。针对红葡萄酒评价的两组样本,利用SPSS进行一次相互独立样本之间的T检验,探测两个样本是否具有显著性差异。但随后通过查阅统计分析中T检验法的一些特性得到了相反的结论:鉴于本题样本是每十个总分针对一个葡萄酒样本,并不满足独立样本T检验方法的适用围,每组样本
8、中的数据是有一定关联的,因此我们采用了另外一种检验方法配对样本T检验法。3.2.2. 二次分析 首先,我们对红葡萄酒的评价进行差异性分析(白葡萄酒的处理方法与其一致),将每项葡萄酒样品各项明细评分的平均分作为一个样本(包括总分的平均分),则每个样本里共有1127=297项数据,两组数据之间都是针对一样的样品和指标进行评价,所以两组中每项数据都是一一配对,互相关联的。其次,我们对两组葡萄酒的全部总分数据共27*10*2=540组,进行综合处理并作图1、图2所示,可以得知两组数据在数值上差异较大,初步判断两组数据具有显著性差异,关于信度分析下文将给出分析讨论。 图1 图2 再次,我们以两组红葡萄酒
9、样品1为例,对其数据做了归一化处理,利用雷达图表示,如图3所示。加强了上述关于显著性差异的推论。图3. 红葡萄酒样品归一化雷达图表示因此通过以上对数据和检验方法的分析,我们采用配对T检验法对两组样本进行差异显著性分析。3.2.3. 基本假设:1. 每组评论员对各项酒的评价分数成正态分布。2. 评论员都具有一定的专业品酒技术,对每种酒的各个指标的评价不会有大的偏差(保证评分的关联度)。3.2.4. 模型的建立与求解:将处理后的数据导入到SPSS软件中,针对两组红葡萄酒评价中的各项指标评分的平均值进行配对样本T检验法,设定置信度区间为95,得到结果如下:表2.成对样本统计量均值N标准差均值的标准误
10、对 1红葡萄酒各项平均分113.285629719.397301.12555红葡萄酒各项平均分212.820929718.634121.08126表3.成对样本相关系数N相关系数Sig.对 1红葡萄酒各项平均分1 红葡萄酒各项平均分2297.996.000表2为描述性统计表,给出了红葡萄酒的各项平均分的平均值,标准差以与标准误。表3为样本间的配对性的测验结果,可以看到测出的P值(即sig值)等于0<0.001,因此在95%的置信水平上差异显著,即两组红葡萄酒的各项平均分的平均值显著相关,验证了我们之前的推论,因此也符合配对样本T检验的前提条件。表4.成对样本检验成对差分TdfSig.(双
11、侧)均值标准差均值的标准误差分的 95% 置信区间下限上限对 1红葡萄酒各项平均分1 红葡萄酒各项平均分2.464681.88444.10935.24949.679884.250296.000表4为最终的配对样本T检验结果报表。其中t表示用公式:所计算出的值,是最终计算出P值的依据。df为自由度,sig(双侧显著性概率)则为我们所需要的P值。可以看到最终结果是P=0.000<0.001,因此在95%的置信水平上差异显著,所以两组评论员评分无显著性差异的假设不成立,即两组评论员对红酒的评分具有显著性差异。图四为以上结果的综合图形描绘。图4. 结果的综合图形描绘对于白葡萄酒的组,利用同样的方
12、法进行差异性分析,在SPSS软件里同样也得到如下结果,如表5、表6、表7所示:表5.成对样本统计量均值N标准差均值的标准误对 1白葡萄酒各项平均分113.501930819.645421.11940白葡萄酒各项平均分213.914930820.210871.15162表6.成对样本相关系数N相关系数Sig.对 1白葡萄酒各项平均分1 白葡萄酒各项平均分2308.996.000表7.成对样本检验成对差分TdfSig.(双侧)均值标准差均值的标准误差分的 95% 置信区间下限上限对 1白葡萄酒各项平均分1 白葡萄酒各项平均分2-.412991.93277.11013-.62969-.19628-3
13、.750307.000图5.白葡萄酒成对样本检验 如图5所示,此时P值仍小于0.001,因此两组评论员对白葡萄酒的评价在95%的置信水平上也具有差异显著性,从而可得出结论:无论是针对红葡萄酒还是白葡萄酒,两组评酒员的评价结果都有显著性差异。3.2.5. 问题反思: 对于该问题,我们将每项葡萄酒评分做了平均化处理,再把处理出来的平均分作为样本,这样每个样本中的数据变成了与每个指标得分情况对应的一元数值,然后用配对样本T检验法对其进行差异显著性分析。通过这种方法处理出来的结果具有一定的科学性与准确性。但是由于数据是进行了平均化处理后的数据,因此模型所反映出的情况不具有完整性,对此我们便有了下面这种
14、改进思路:将每组中10名品酒师对27项样品的评价总分作为一个的矩阵(其中第i个品酒员对第j款酒所给的总分)。每个矩阵分别对应该组品酒师的评分具体情况,再用这两组数据构成的矩阵进行多元数据的T检验,如此处理出的结果就应该更具有完整性与可靠性。但由于本组成员所了解的统计学知识还不足以去运用这样多元性的、更为精确的处理手段,因此就将这作为一个以后改进的思路。3.3. 问题1.2:附件1中两组评酒员评价结果的信度分析我们针对两组中每位品酒师对每种酒所给出的总分得出的矩阵对其中的元素逐行进行可信度分析。3.3.1模型讨论首先我们根据品酒师打分为主观作用,我们选择评价评分者信度的Kendall W协同检验
15、模型,通过SPSS对红白葡萄4组数据进行模拟分析,得到的渐进显著性系数p均小于0.05(等于0.00),协同系数均为0.50左右,无法得出明确的结论。经过思考,我们发现Kendall模型对于采用等级评定方式评分的情况是可取的,然而当评分者用其他非等级评定的方式(如百分制)评定时,其信度系数是不合适的,因为其信度系数仅能反映评分者之间的相对一致性,并没有考虑评分者之间存在的评分绝对差别,在这种情况下评分者之间的系统误差也看会被成是随机误差,此时计算出的信度系数不能正确反映评分者信度的高低。所以我们选择部一致性信度分析。3.3.2. 问题假设为简化模型,排除品酒员主观因素和个人偏好不同而造成的影响
16、,我们做出如下假设:1、每位品酒员鉴定的同一种葡萄酒特质完全一样。 2、对于每一种类葡萄酒被任何一品尝相当于对其质量进行一次客观的测试,每一项指标的评价,相当于一道题目的得分。3、葡萄酒的特质可以从品酒员的品尝时考虑的方面(即客观测试的一系列“题目”)测量出来。3.3.3. 模型的建立与求解对于抽象出来的测试模型,由于每道测试题目表示一个特质指标的评价,所以我们不能采用简单的二分法计分。因而我们选择Cronbach 系数分析。其中式中,K为整个品尝的次数;为总得分的方差;为是所有在第i位品酒师打分的方差。我们先用EXCEL进行数据处理,得到的矩阵,以红葡萄酒为例。表8. 第一组红葡萄酒 表9.
17、 第二组红葡萄酒如表8、表9所示,不难看出对于红葡萄酒,第一组标准化Cronbachs Alpha较高,即第一组品酒师对红葡萄酒的评价更为可靠。同样地对于白葡萄酒,第一组标准化Cronbachs Alpha比第二组更高,如表10、表11所示。表10. 第一组白葡萄酒 表11. 第二组白葡萄酒即第一组更为可信。再对第一组进行进一步讨论,对于第一组十位品酒师对红白葡萄酒的评价的项已删除的 Cronbach's Alpha 值(详见附录)进行分析,没有任何一位品酒师对于整体的标准化Cronbachs Alpha有明显影响,所以十位品酒师的评价分数也均可信。综上所述,无论对于红葡萄酒还是白葡萄
18、酒,两组品酒师的评价均存在显著差异,其中第一组品酒师的评价结果更可信,并且第一组十位品酒师的评价都属于可信围。3.4. 问题2:根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级3.4.1. 问题分析如果单用葡萄酒为酿酒葡萄打分,则直接在葡萄酒的外观、香气、口感质量权重中赋予权值,所得之和即可作为对酿酒葡萄的评分。而本题却引入了另一类变量,就是葡萄的理化指标。这是一项很庞大杂乱的数据,所以我们想到利用主成分分析法对这些数据进行主要因子分析,找出这些指标的公共因子,求的每一样品在这些因子上的成份得分系数矩阵,给数据降低维度,再以此作为研究酿酒葡萄等级评定的依据。3.4.2. 模型建立(以红葡
19、萄为例)首先对数据进行归一化处理,再用SPSS因子分析对处理后的数据进行因子分析。并选择具有 Kaiser 标准化的正交旋转法进行处理。得到的结果如表12所示:表12.成份矩阵a成份12345678花色苷.852总酚.851单宁.759DPPH自由基.734葡萄总黄酮.704果梗比.585蛋白质.584L-.578黄酮醇.562-.524百粒质量-.542出汁率.533干物质含量.847总糖.792还原糖.777可溶性固形物.758氨基酸总量.559白藜芦醇.812A.724可滴定酸-.599果皮质量-.597.530B.500.590褐变度.618.673多酚氧化酶活力.661苹果酸.639
20、酒石酸果穗质量.610VC含量-.546固酸比柠檬酸-.571提取方法 :主成份。 a. 已提取了 8 个成份。 SPSS经过因子分析和旋转处理后一共得到了8个主成分,但在8个主成分之中,葡萄的理化指标所载负荷主要是分配在前四个成分当中。而观察这四个成分的高负荷指标,成分一中高负荷的指标主要有单宁、酮类酚类物质以与蛋白质等,而这些物质,特别是单宁,在很大程度上影响到了葡萄酒的口感,因此可将该成分命名为“口感类物质”;成分二中高负荷的指标有糖类、氨基酸类、VC含量等营养成分类物质的指标,可命名为“营养类物质”;成分三主要有a、b色泽,以与果皮含量指标,可命名为“色泽类物质”;成分四主要有苹果酸,
21、酒石酸等指标,可命名为“酸类物质”。这样通过软件做出的成份得分系数,就可求得对应的因子变量解,如表13所示:表13.成份得分系数矩阵成份12345678氨基酸总量-.004.129-.173-.069.000.210-.059.052蛋白质.089-.041-.113.027-.041.053.139.140VC含量.039-.155-.002-.107.086.071-.212-.110花色苷.115-.007.178.004.002-.064.012-.014酒石酸.009-.005-.165-.015-.048-.009.017.464苹果酸.024.000.319-.018.120-.
22、140-.039-.043柠檬酸-.076-.065.142.067.022.021-.122.509多酚氧化酶活力-.108.061.229.111-.100.142.106-.040褐变度-.030-.051.285-.024-.023.065.006-.036DPPH自由基.186-.013-.060.082.096.096.042-.065总酚.197.047-.041-.002.022-.021.070-.115单宁.171-.041.065.047.062.042-.220.074葡萄总黄酮.233.031-.077.064.075-.043.046-.095白藜芦醇.045-.0
23、41-.019.014.357.157-.003-.103黄酮醇-.043.052.004.130.063.460-.058.020总糖.022.245-.041.020.046.017.125-.180还原糖-.047.178-.010-.001-.016.009.024.008可溶性固形物.014.234.005.061.018.030.065-.144可滴定酸.033.032.005.051.033.012-.391.058固酸比-.006.084.040.015-.004-.090.424-.084干物质含量.005.189.023.016.012.016-.050.056果穗质量.0
24、29-.003-.004.342.044-.026.074.121百粒质量.053.013-.015.296.065-.015-.025-.073果梗比-.049-.064.033-.120-.056.298-.026-.036出汁率.199-.014.002-.021.003-.184-.050-.021果皮质量.017.047.057.411.059.172-.098.028L-.118-.006-.034.107.080.192.199-.207B.048.045.065.106.358-.088-.064.082A.007.013.001.052.360.019-.010-.054提取
25、方法 :主成份。旋转法 :具有 Kaiser 标准化的正交旋转法。构成得分。并据此算得每个样品在每类成分上的得分,结果如表14所示:表14.基于四类主成分负荷的样本得分表样品口味类物质营养类物质色泽类物质酸类物质1.00 1.31 0.17 3.05 -1.01 2.00 1.41 0.30 0.22 -0.79 3.00 0.68 2.21 -1.11 -0.66 4.00 -0.88 -0.23 -0.32 -0.60 5.00 0.43 -0.02 -0.23 1.79 6.00 0.02 1.36 -0.31 0.08 7.00 -1.01 0.54 0.41 -1.31 8.00 -
26、0.35 -0.13 2.94 0.99 9.00 2.78 -0.73 -0.89 -0.73 10.00 0.11 -2.66 -0.39 -0.82 11.00 -1.06 0.05 -0.13 -0.36 12.00 -0.84 1.74 -0.14 0.48 13.00 -0.27 -0.76 -0.74 -0.57 14.00 -0.38 -0.29 1.22 0.52 15.00 -0.18 -0.38 0.24 0.08 16.00 -0.31 -0.74 0.17 -1.27 17.00 0.53 0.93 -0.25 2.06 18.00 -0.84 0.96 -0.04
27、-0.19 19.00 -0.06 -0.14 -0.27 -0.69 20.00 -0.40 -0.05 -0.99 1.02 21.00 -0.23 0.49 -1.18 -1.32 22.00 -0.48 0.75 0.26 -0.98 23.00 2.40 -0.09 -0.34 0.93 24.00 0.21 -0.07 -0.08 1.18 25.00 -0.48 -1.68 -0.61 0.42 26.00 -0.86 -1.01 -0.42 1.72 27.00 -1.27 -0.52 -0.06 0.04由于要求对葡萄进行评级,因此我们决定用百分制的得分来作为评级的依据,由于
28、时间关系我们对评分的系统只能做一个简单化的处理。现在我们掌握的数据一共有4个主成分因子得分,还有一个葡萄酒质量得分(由于在一问中已经论证了第一组的评论员打分更可信,于是这里葡萄酒质量得分以第一组为标准),所以我们将赋予主成分与葡萄酒所得分数1:1:1:1:6的权重,以此求得酿酒葡萄的最终评分。如此,则每个成份所占分数为10分,评论员评价所占分数为60分。最后的等级评价我们将效仿目前权威的葡萄酒评分系统-美国著名的葡萄酒评论家罗伯特·帕克推崇的是葡萄酒100分制评分体系,帕克的评分系统会给每一款酒一个基础的分数(50分)。在50分的基础上,按酒的质量特点加分,将酒的品质分成四类。而我们
29、也效仿这一模式对酿酒葡萄进行分级,将葡萄分成如下六个等级:96-100 Extraordinary 顶级:各类指标全面优秀的酿酒葡萄。90-95 Outstanding优秀:营养成分饱满,味道纯正的酿酒葡萄。80-89Above average优良:综合指标尚佳的酿酒葡萄。70-79Average一般:略有瑕疵,尚无大碍的酿葡萄。60-69Below average低于一般:不值得推荐 50-59 Unacceptable次品根据成份得分系数以与评论员评价数据处理后各样品的酿酒葡萄得分明细以与对应等级如表15所示:表15. 酿酒红葡萄得分明细与等级样品口味类物质营养类物质色泽类物质酸
30、类物质瓶酒员评价最总得分等级1.00 6.35 5.82 10.25 0.94 37.62 60.99 低于一般2.00 6.61 6.09 3.39 1.57 48.18 65.84 低于一般3.00 4.82 10.00 0.18 1.96 48.24 65.19 低于一般4.00 0.95 4.99 2.08 2.14 41.16 51.33 次品5.00 4.18 5.43 2.30 9.21 43.98 65.11 低于一般6.00 3.18 8.27 2.12 4.15 43.32 61.04 低于一般7.00 0.64 6.58 3.87 0.04 42.90 54.02 次品8
31、.00 2.27 5.20 10.00 6.84 43.38 67.68 低于一般9.00 10.00 3.96 0.71 1.75 48.90 65.32 低于一般10.00 3.40 0.00 1.93 1.49 44.52 51.34 次品11.00 0.51 5.56 2.55 2.85 42.06 53.53 次品12.00 1.07 9.05 2.51 5.34 32.34 50.31 次品13.00 2.46 3.92 1.06 2.22 44.76 54.42 次品14.00 2.18 4.87 5.82 5.46 43.80 62.13 低于一般15.00 2.68 4.68
32、 3.44 4.15 35.22 50.17 次品16.00 2.36 3.94 3.26 0.17 44.94 54.68 次品17.00 4.45 7.38 2.25 10.00 47.58 71.66 一般18.00 1.06 7.44 2.77 3.36 35.94 50.57 次品19.00 2.98 5.18 2.20 1.87 47.16 59.39 次品20.00 2.15 5.37 0.47 6.94 47.16 62.09 低于一般21.00 2.55 6.48 0.00 0.00 46.26 55.29 次品22.00 1.95 7.00 3.49 1.01 46.32
33、59.77 次品23.00 9.05 5.27 2.03 6.66 51.36 74.37 一般24.00 3.66 5.33 2.66 7.42 46.80 65.86 低于一般25.00 1.95 2.01 1.38 5.15 41.52 52.02 次品26.00 1.01 3.39 1.84 9.01 44.28 59.53 次品27.00 0.00 4.41 2.71 4.04 43.80 54.96 次品3.4.3. 针对白葡萄的模型建立依照对红葡萄的等级评价,我们也首先对白葡萄进行了主成分分析(结果见附件),同样也将白葡萄指标分成了对应的4个主成分,并求得了样品在每个成分上的得分
34、,最后进行归总评分,得出表16的结果:表16.酿酒白葡萄得分明细与等级白葡萄口味类物质营养类物质色泽类物质酸类物质瓶酒员评价最总得分等级1.00 4.20 5.53 5.97 2.86 49.20 67.76 低于一般2.00 5.77 6.06 4.38 8.69 44.52 69.43 低于一般3.00 4.47 7.89 6.02 10.97 51.18 80.54 优良4.00 5.32 10.00 5.89 7.61 47.64 76.47 一般5.00 7.26 8.43 4.54 6.52 42.60 69.35 低于一般6.00 3.39 8.12 7.91 5.96 41.0
35、4 66.43 低于一般7.00 3.72 7.49 9.37 2.61 46.50 69.70 低于一般8.00 0.72 5.29 4.50 9.13 42.84 62.49 低于一般9.00 7.47 6.76 7.21 9.63 43.74 74.81 一般10.00 7.77 7.24 7.23 6.19 44.58 73.01 一般11.00 0.99 8.51 6.39 12.61 43.38 71.89 一般12.00 5.91 7.45 7.12 10.00 37.98 68.47 低于一般13.00 0.00 7.87 8.79 7.91 39.54 64.11 低于一般1
36、4.00 5.13 8.63 4.69 5.28 43.20 66.92 低于一般15.00 2.41 4.88 7.55 5.46 43.44 63.74 低于一般16.00 3.61 0.00 5.71 5.21 44.40 58.94 次品17.00 2.43 8.58 6.35 9.27 47.28 73.91 一般18.00 1.67 7.74 7.79 4.54 43.86 65.59 低于一般19.00 5.27 2.23 4.81 10.76 43.32 66.40 低于一般20.00 6.98 7.19 4.77 4.86 46.68 70.48 一般21.00 5.49 8
37、.93 3.62 6.93 45.84 70.81 一般22.00 6.66 4.49 8.39 8.79 42.60 70.92 一般23.00 6.81 7.22 5.53 8.04 45.54 73.14 一般24.00 8.51 7.64 10.54 7.88 43.98 78.55 一般25.00 7.85 4.33 4.95 8.07 46.26 71.47 一般26.00 10.00 6.48 7.36 8.09 48.78 80.72 优良27.00 5.68 5.21 13.62 9.44 38.88 72.83 一般28.00 8.14 8.25 6.87 6.55 48.
38、78 78.60 一般3.4.4. 模型的改进构想我们对于酿酒葡萄的评级把标准主要是建立的数据的归一化以与主成分提取的基础之上,由于时间关系,对影响酿酒葡萄等级的给个因素只是进行了一个简单的权重化处理,所以我们对此的改进构想是运用层次分析法将各个因子构建一个多层次,决定权重因素更多,更为复杂的等级评价系统,将作为各因素的比较矩阵;作为权重向量;利用求得其最大特征向量,并以此作为排序求得最终的权重向量,最后再进行评级处理,这样将使得评定结果更具可靠性。3.5. 问题3:分析酿酒葡萄与葡萄酒的理化指标之间的联系先将葡萄酒以与酿酒葡萄的指标整合在一起,总共包括35组指标。经过对数学建模中相关性的研究
39、,得知在SPSS软件中共有三种研究相关性的方法,分别为双变量相关性分析、偏变量相关性分析以与距离相关性分析。而前两种方法主要是针对两组或三组数据进行关联度测试,而本题中是要求对多项指标进行对比,因此我们先采用距离相关分析法对这35组指标进行初步的关联度探测。通过SPSS的处理,得到了各指标间的相似性距离,也就是Pearson相关系数。可以看到葡萄酒与酿酒葡萄各项指标之间存在较多Pearson相关较大的组合,比如酒的花色苷与葡萄的花色苷,酒的总酚、酒总黄酮与葡萄的DPPH自由基,酒的单宁与果梗比由于具有相似性的指标太多,所以我们抽取几组具有代表性的指标进行更进一步的分析。3.5.1. 色酒的色泽
40、与酿酒葡萄的颜色比较,由于花色苷是影响酒和酒的酿酒葡萄的重要因素,所以酒中花色苷与葡萄中花色苷的理化指标的联系反映了葡萄的颜色对葡萄酒色泽的影响。于是我们对以上两组理化指标做了一次双因素相关性分析,结果如表17所示:表17.相关性花色苷W花色苷花色苷WPearson 相关性1.923*显著性(双侧).000N2727花色苷Pearson 相关性.923*1显著性(双侧).000N2727*. 在 .01 水平(双侧)上显著相关。两者在0.01的置信水平上显著相关,且相关系数为0.923,说明酒的花色苷含量跟葡萄花色苷有很密切的关系,或者说,酒的色泽从很大程度上取决与葡萄的颜色。下面用MATLA
41、B对它们进行二次拟合,处理数据如下:Linear model Poly2: f(x) = p1*x2 + p2*x + p3Coefficients (with 95% confidence bounds): p1 = 0.000412 (-0.002904, 0.003728) p2 = 2.22 (0.9547, 3.485) p3 = 22.21 (-63.17, 107.6)Goodness of fit: SSE: 2.041e+005 R-square: 0.8516 Adjusted R-square: 0.8393 RMSE: 92.22该拟合结果在95%的置信区间,准确性较高
42、。最终对应的公式为:图6.拟合对比图3.5.2. 味单宁是决定酒味道的主要理化指标,而在通过上面的处理方法我们得知酒的单宁指标与酿酒葡萄的总酚,总黄酮指标具有很高的相似性,Pearson相关系数分别为0.817、0.684.于是这里我们将研究酒的风味与酿酒葡萄的总酚,总黄酮的关系。用SPSS中多元线性回归分析对酒的单宁,葡萄的单宁、总分以与黄酮醇进行处理,得到结果如表18所示:表18. 相关性酒的单宁葡萄总酚黄酮醇Pearson 相关性酒的单宁1.000.817.579葡萄总酚.8171.000.346黄酮醇.579.3461.000Sig. (单侧)酒的单宁.000.001葡萄总酚.000.
43、039黄酮醇.001.039.N酒的单宁272727葡萄总酚272727黄酮醇272727这里三组数据之间处理后的sig值都为0,它们在置信区间显著相关,因此对它们做回归拟合的可靠性很高。下面是线性回归分析对这三组数据进行的回归分析,所得系数如表19所示:表19.系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量)1.893.6942.727.012葡萄总酚.307.046.7016.683.000.8811.136黄酮醇.024.008.3363.206.004.8811.136a. 因变量: 酒的单宁 对应的酒的单宁(Y)与葡萄总酚(X1)、黄酮醇(X2
44、)的线性关系式如下:拟合结果与原数据对比图形如下:图7. 拟合结果与原数据对比同样对白葡萄中酒的单宁(y)与葡萄总酚(x1)、黄酮醇(x2)进行多元化回归分析,所得结果如表20:表20.系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)1.222.3943.100.005白葡萄总酚.063.066.254.953.350白葡萄总黄酮.102.116.235.881.387a. 因变量: 白葡萄酒单宁 回归后的残差统计如表21:表21.残差统计量a极小值极大值均值标准偏差N预测值1.55183.07211.8506.3286028残差-.938142.23665.00000.64
45、10628标准预测值-.9093.717.0001.00028标准残差-1.4083.357.000.96228a. 因变量: 白葡萄酒单宁 3.6. 问题4.1:因子分析简化模型寻求函数关系的拟合3.6.1. 问题分析 从葡萄和葡萄酒的理化指标来看,其成分较为复杂,如果直接对所有理化指标和葡萄酒品质的关系进行分析,其对应关系过于复杂,难以得出结论。为简化模型,我们对其进行如下处理:1.我们以品酒师信度较高的第一组的总平均分作为代表每一个样品酒品质的标准。2.对于各种理化性质,我们只考虑一级指标,暂时不考虑芳香类物质(后文会提出所求函数关系关于芳香类物质的修正)3.为减少变量个数,我们通过因子
46、分析、主成分分析与其嵌套将原来与得分相关联的理化指标向量简化为两个可以代表原来数据群体的因子4.我们通过Matlab 对总平均分与因子的关系进行三维的拟合,最终得到近似的关系=3.6.2. 数据处理与模型建立:首先,因为影响葡萄酒质量的应该是各理化成分的相对含量,为了结果的准确性,所以我们有必要对所有葡萄酒所得总平均分进行归一化处理。另一方面为了减小变量向量的维度,我们利用SPSS对红白葡萄理化性质指标进行因子分析分析,所得旋转成分矩阵见附录。对于红葡萄我们得到8个因子即可以看成一个8维的特征向量,对于白葡萄我们的到了9个因子即一个9维的特征向量。虽然对于原来红白葡萄所含的理化性质指标的数量有
47、了显著的减少,但是对于寻求一个与葡萄酒相关的固定的关系依旧存在较大困难。于是我们进行了二次因子分析,将原来的8维向量和9维向量简化为2维,以便拟合出较为准确的函数关系。由于红葡萄与白葡萄各方面类似,为了简洁起见,下面我们一红葡萄与红葡萄酒为例,来分析红葡萄理化性质、红葡萄酒理化性质与红葡萄酒质量的关系。1.红葡萄的理化性质与红葡萄酒质量的关系首先我们利用SPSS对红葡萄31种一类理化指标进行因子分析(主成分分析),得出8个性质因子,即8种代表性成分。其旋转成分矩阵与成分得分系数矩阵详见附录。通过对其旋转成分矩阵系数分析根据前面问题的分析可将它们命名为口感类物质、营养类物质、色泽类物质、酸类物质等。表22 表23为进一步简化模型,便于得出简洁可靠的结果,我们对于以上8类物质再次进行主成分分析,其旋转成分矩阵,成分得分系数矩阵如表22、表23所示,两类新的性质因子我们将其命名为,MATLAB custom equation进行拟合,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年战略用友软件分销合同
- 八年级生物下册第八单元降地生活第三章了解自己增进降综合训练新版新人教版
- 2024年修订版:3D打印技术在医疗器械制造领域的应用合作协议
- 2024-2025学年高中物理第六章万有引力与航天4万有引力理论的成就2教案新人教版必修2
- 九年级数学下册第4章概率章末复习教案新版湘教版
- 2024-2025学年高中历史第四单元20世纪以来中国的重大思想理论成果10孙中山的三民主义课时分层作业含解析北师大版必修3
- 2024年工程贷款结算合同
- 2024年工程项目安全防护费用协议
- 2024年互联网金融借贷合同:含P2P、消费分期等产品
- 2024年企业数据共享与保密合同
- AQL抽样检验表(标准版本2(1).0)
- 桶装水领用登记表
- 安阳师范学院校级教学团队推荐表
- 企业中层管理人员素质测评(附答案)
- 《新概念英语》第二册(电子版)
- 活性焦过滤吸附法污水深处理技术
- 国民经济动员中心申报材料
- 初中英语学科关键能力的培养策略
- 高血压健康教育知识讲座(完整版)
- 社区卫生服务中心公共卫生绩效考核及奖金分配制度
- 外贸_询盘的分析与回复(精)
评论
0/150
提交评论