版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
尊敬的各位评委老师,同学们,大家好!尊敬的各位评委老师,1多元统计分析在葡萄酒评价中的应用昆明学院多元统计分析在葡萄酒评价中的应用昆明学院2本文在葡萄酒评价中针对多组指标的多组数据,在数据处理上应用了标准化处理、主成分分析等多重方法,应用了多元统计分析中的方差分析、聚类分析、回归模型中的趋势面分析等多种方法对葡萄酒进行评价。本文在葡萄酒评价中针对多组指标的多组数据,在数3主要内容:
一问题的理解与分析
二模型的建立与求解
三模型的评价主要内容:4一问题的理解与分析问题一要求是对两组评酒员的评价结果有无显著性差异进行分析,并判断哪一组的结果更可信。我们建立单因素方差分析模型,经过求解,假设与检验,计算得到结果来分析这两组评酒员的评价结果有无显著性差异,然后又经过比较两组评酒员所打分数的平均值与方差,来比较哪组结果更可信。一问题的理解与分析问题一5问题二我们首先用葡萄酒中的芳香物质来定量分析葡萄酒的质量,对数据进行无量纲化以及主成分分析法进行处理,然后对每一个酿酒葡萄及葡萄酒样本进行相对性的综合评分,最后用这两组数据进行二维的聚类分析来对酿酒葡萄进行分级。问题二6问题三我们对于分析酿酒葡萄与葡萄酒的理化指标之间的联系这一问题,通过分析酿酒葡萄与葡萄酒之间相对应的理化指标,以及它们之间的协方差和相关系数确定出了酿酒葡萄与葡萄酒的理化指标之间的相关关系。
问题三7问题四我们利用问题二中算出的数据,以及问题二中的方法来计算葡萄酒相应于其理化指标的综合得分,然后用酿酒葡萄相应于其理化指标的得分,葡萄酒质量相应于所含芳香物质的得分,以及葡萄酒相应于其理化指标的得分这三组数据进行趋势面分析得到拟和的曲面图以及酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响函数关系式,最后用检验法得出红酒和白酒可否认为能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。问题四8二模型的建立与求解问题一对于分析两组评酒员的评价结果有无显著性差异这一问题,由于两组评酒员在评分上有差异,因此分别计算红、白葡萄酒中每一个品酒员对所有样品打分的平均值作为影响因素,并且设各正态总体具有相同的方差。建立了如下单因素方差分析模型:二模型的建立与求解问题一9下面经过显著性检验假设(取显著性水平),利用附件1中所给数据经过无量纲化处理之后,并且所有的均减去,用Excell辅助求解得到如下方差分析表:下面经过显著性检验假设10红葡萄酒方差来源平方和自由度均方F值临界值显著性因素A128.80914.311.0653.02低误差134.341013.434总和263..1419方差来源平方和自由度均方F值临界值显著性因素A0.087590.00971.30303.02低误差0.0747100.0075总和0.162219白葡萄酒根据模型的结果有,F值均小于临界值,因此接受假设,即这两组评酒员的评价结果无显著差异。红葡萄酒方差来源平方和自由度均方F值临界值显著性因素A12811又计算出两组评酒员所打分数的平均值及方差如下:红葡萄酒第一组第二组平均值73.0555670.51481方差13.0557112.59578白葡萄酒第一组第二组平均值73.9321476.53214方差70.9250126.68692综合两组评酒员所打分数的平均值及方差,因为第二组的方差更小,也就是该组专家的意见相对更一致,所以说第二组评酒员的结果更可信。又计算出两组评酒员所打分数的平均值及方差如下:12问题二本问题中涉及了葡萄酒的质量,我们通过查阅文献(葡萄酒芳香物质研究进展)得到芳香物质对葡萄酒的质量有重要的影响,所以用葡萄酒中的芳香物质来定量的分析葡萄酒的质量。对于酿酒葡萄的理化指标,它分为一级、二级等多级指标。它的指标都是检测了三次,所以我们对其求平均值并以此作为指标的数值。而二级指标中除了H、C两个二级指标外其余的每一类二级指标的和都等于所对应的一级指标值,所以我们不考虑二级指标(除H、C)。问题二本问题中涉及了葡萄酒的质量,我们通过查阅文献13首先我们对所有的数值用标准化变换进行无量纲化处理,由于葡萄酒中的芳香物质及酿酒葡萄中的理化指标很多,就需要把这些很复杂的数据集简化,因此我们应用主成分分析法在DPS软件中分别对它们进行主成分分析,找出几个综合因子来代表原来众多的变量。分析结果(1)分析结果出来后,一般建议是取当特征值累积贡献率达80%,或者特征值大于1时的主成分个数。我们根据特征值大于1时的主成分个数对葡萄酒中的芳香物质及酿酒葡萄中的理化指标取得主成分(2)。首先我们对所有的数值用标准化变换进行无量纲化处理,由14在主成分分析结果出来后,我们将前个特征值较大的主成分,按照公式:
计算个主成分的“综合值”,每一个酿酒葡萄及葡萄酒样本都对应一个“综合值”,而这个“综合值”充分利用了所有的信息,于是这个“综合值”就能用来作为每一个酿酒葡萄及葡萄酒样本相对性的综合得分。在DPS中计算可得每一个酿酒葡萄及葡萄酒样本的得分(3)。
在主成分分析结果出来后,我们将前个特征值较大的主15表中酿酒葡萄的得分依赖于它的理化指标,这个得分能相应的定量反映出理化指标的信息;同样葡萄酒的得分依赖于它的芳香物质,而芳香物质又决定了葡萄酒的质量,所以这个得分就能定量的反映出葡萄酒质量的信息。因此用每个酿酒葡萄样本的综合得分和葡萄酒质量的综合得分,分为两组变量,并对这两组变量进行二维的聚类(在DPS中实现),分析得出红葡萄和白葡萄的聚类结果图如下:表中酿酒葡萄的得分依赖于它的理化指标,这个得分能相应16(红葡萄)(红葡萄)17(白葡萄)(白葡萄)18最后根据聚类结果图可以对红、白葡萄进行如下分级:分类样品第一类红葡萄样品1第二类红葡萄样品27第三类红葡萄样品2,21,3,9,8,第四类红葡萄样品4,24,10,5,16,11,22,19,7,14,13,15,17,20,25,26,6,23,12,18,(红葡萄)最后根据聚类结果图可以对红、白葡萄进行如下分级:分类19分类样品第一类白葡萄样品1,6,26,7,24,11,12,15,13,17,2,14,18第二类白葡萄样品19,27,25,4,16,10,8,22,5,23,9,20,3,21,28(白葡萄)分类样品第一类白葡萄样品1,6,26,7,24,11,12,20问题三对于分析酿酒葡萄与葡萄酒的理化指标之间的联系这一问题,我们观察附件3所给数据,选择了花色苷、单宁、总酚、酒(葡萄)总黄酮、白藜芦醇、DPPH半抑制体积、色泽(L*(D65、a*(D65)、b*(D65)、H(D65)、C(D65))这些对应的理化指标为研究对象,建立了下述两个简单的模型,分别用协方差及相关系数对酿酒葡萄与葡萄酒的理化指标之间的联系进行了简单分析。问题三21建立了如下模型:其中是期望值,,是相应理化指标值的平均值。建立了如下模型:其中是期望值,,是相应理化指标值的平22用Excell辅助求解,结果如下:红协方差联系相关系数联系花色苷mg/100g鲜重0.8846正相关0.9226正相关(强)单宁(mmol/L)0.6914正相关0.718正相关总酚(mmol/L)0.8427正相关0.8751正相关(强)(葡萄)酒总黄酮(mmol/L)0.7924正相关0.8228正相关(强)白藜芦醇(mg/L)0.013正相关0.1351正相关DPPH半抑制体积(IV50)1/IV50(uL)0.7494正相关0.7783正相关色泽L*(D65)0.4754正相关0.4937正相关a*(D65)-0.522负相关-0.542负相关b*(D65)0.0244正相关0.0254正相关H(D65)-0.275负相关-0.285负相关C(D65)-0.468负相关-0.456负相关用Excell辅助求解,结果如下:红协方差联系相关系数联系花23白协方差联系相关系数联系单宁(mmol/L)0.55333正相关0.573825正相关总酚(mmol/L)0.527225正相关0.546757正相关(葡萄)酒总黄酮(mmol/L)0.671808正相关0.696689正相关白藜芦醇(mg/L)-0.2052负相关-0.2128负相关DPPH半抑制体积(IV50)1/IV50(uL)0.372512正相关0.386309正相关色泽L*(D65)-0.13536负相关-0.14037负相关a*(D65)-0.02888负相关-0.02995负相关b*(D65)0.268985正相关0.278946正相关H(D65)0.280558正相关0.290948正相关C(D65)0.483919正相关0.501848正相关白协方差联系相关系数联系单宁(mmol/L)0.55333正24问题四我们充分利用模型二中的方法应用DPS数据处理软件得出葡萄酒中理化指标的主成分分析结果(见附件1),主成分如下:红葡萄酒理化指标主成分特征值百分率%累计百分率%花色苷(mg/L)5.450349.548349.5483单宁(mmol/L)2.456622.332771.881总酚(mmol/L)1.695315.411987.2929问题四红葡萄酒理化指标主成分特征值百分率%累计百分率%花色苷25白葡萄酒理化指标主成分特征值百分率%累计百分率%单宁(mmol/L)3.508135.080635.0806总酚(mmol/L)3.001730.017565.0981酒总黄酮(mmol/L)1.199311.993177.0912再利用模型二中的综合打分法得到红、白葡萄酒每个样本的具体得分(4)。这个得分能定量的反映出其理化指标的信息,也就能用来分析每个葡萄酒样本的理化指标。表16白葡萄酒理化指标主成分特征值百分率%累计百分率%单宁(mmo26再利用模型二中的酿酒葡萄相应于其理化指标的得分以及葡萄酒质量相应于所含芳香物质的得分,以及葡萄酒相应于其理化指标的得分。把这三组数据分为(葡萄酒质量相应于所含芳香物质的各个样品得分)、(酿酒葡萄相应于其理化指标的各个样品得分)、
(葡萄酒相应于其理化指标的各个样品得分),用回归分析中的趋势面分析(在DPS中实现)分别得出红、白葡萄酒的曲面拟合图如下:再利用模型二中的酿酒葡萄相应于其理化指标的得27年数学建模A题答辩课件28进一步得出酿酒红葡萄和红葡萄酒的理化指标对红葡萄酒质量的影响函数关系式:酿酒白葡萄和白葡萄酒的理化指标对白葡萄酒质量的影响函数关系式:进一步得出酿酒红葡萄和红葡萄酒的理化指标对红29势面的适度问题关系到趋势面分析的应用效果,从统计学观点来看,趋势面拟合程度的高低是回归效果好坏的关键。我们用检验来检验趋势面的适度(在DPS中实现),结果如下:酒类型残差标准差拟合度红0.0017442290499.84%白0.02389640484183.92%势面的适度问题关系到趋势面分析的应用效果,从统30分析该表可得出红酒的残差标准差很小,说明数据可靠,而拟合度相当高说明应用效果高,而白酒的相对于红酒的有一小点差异,应用效果没有红酒的高,但是它的应用效果也是相当可行的。综合红酒和白酒的检验结果可以认为能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。分析该表可得出红酒的残差标准差很小,说明数据可31三模型的评价模型一:优点:对于单因素方差分析模型而言,该模型较好的排除了随机因素的影响,公平合理的对两组评酒员的结果进行了评价。模型二:优点:本模型中我们对多指标进行了集简化,不考虑二级指标只对一级指标进行分析、对数据进行无量纲化处理、对指标进行主成分分析,这些处理数据的方法简化了我们的运算,更利于我们的分析。在进行分级时应用了聚类分析法处理,结果可以图形化,更清晰明了。三模型的评价模型一:32缺点:在实际中可能有一些二级指标不能忽略,所以忽略了可能会造成一定的误差。模型三:优点:应用单一变量逐个分析,更能体现其中的相关性。模型四:优点:趋势面分析拟合回归模型针对二维变量拟合度较高,结果能达到足够的准确性。检验法简洁明了,实用性很强。缺点:在实际中可能有一些二级指标不能忽略,所以33谢谢大家!谢谢大家!谢谢大家!谢谢大家!34尊敬的各位评委老师,同学们,大家好!尊敬的各位评委老师,35多元统计分析在葡萄酒评价中的应用昆明学院多元统计分析在葡萄酒评价中的应用昆明学院36本文在葡萄酒评价中针对多组指标的多组数据,在数据处理上应用了标准化处理、主成分分析等多重方法,应用了多元统计分析中的方差分析、聚类分析、回归模型中的趋势面分析等多种方法对葡萄酒进行评价。本文在葡萄酒评价中针对多组指标的多组数据,在数37主要内容:
一问题的理解与分析
二模型的建立与求解
三模型的评价主要内容:38一问题的理解与分析问题一要求是对两组评酒员的评价结果有无显著性差异进行分析,并判断哪一组的结果更可信。我们建立单因素方差分析模型,经过求解,假设与检验,计算得到结果来分析这两组评酒员的评价结果有无显著性差异,然后又经过比较两组评酒员所打分数的平均值与方差,来比较哪组结果更可信。一问题的理解与分析问题一39问题二我们首先用葡萄酒中的芳香物质来定量分析葡萄酒的质量,对数据进行无量纲化以及主成分分析法进行处理,然后对每一个酿酒葡萄及葡萄酒样本进行相对性的综合评分,最后用这两组数据进行二维的聚类分析来对酿酒葡萄进行分级。问题二40问题三我们对于分析酿酒葡萄与葡萄酒的理化指标之间的联系这一问题,通过分析酿酒葡萄与葡萄酒之间相对应的理化指标,以及它们之间的协方差和相关系数确定出了酿酒葡萄与葡萄酒的理化指标之间的相关关系。
问题三41问题四我们利用问题二中算出的数据,以及问题二中的方法来计算葡萄酒相应于其理化指标的综合得分,然后用酿酒葡萄相应于其理化指标的得分,葡萄酒质量相应于所含芳香物质的得分,以及葡萄酒相应于其理化指标的得分这三组数据进行趋势面分析得到拟和的曲面图以及酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响函数关系式,最后用检验法得出红酒和白酒可否认为能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。问题四42二模型的建立与求解问题一对于分析两组评酒员的评价结果有无显著性差异这一问题,由于两组评酒员在评分上有差异,因此分别计算红、白葡萄酒中每一个品酒员对所有样品打分的平均值作为影响因素,并且设各正态总体具有相同的方差。建立了如下单因素方差分析模型:二模型的建立与求解问题一43下面经过显著性检验假设(取显著性水平),利用附件1中所给数据经过无量纲化处理之后,并且所有的均减去,用Excell辅助求解得到如下方差分析表:下面经过显著性检验假设44红葡萄酒方差来源平方和自由度均方F值临界值显著性因素A128.80914.311.0653.02低误差134.341013.434总和263..1419方差来源平方和自由度均方F值临界值显著性因素A0.087590.00971.30303.02低误差0.0747100.0075总和0.162219白葡萄酒根据模型的结果有,F值均小于临界值,因此接受假设,即这两组评酒员的评价结果无显著差异。红葡萄酒方差来源平方和自由度均方F值临界值显著性因素A12845又计算出两组评酒员所打分数的平均值及方差如下:红葡萄酒第一组第二组平均值73.0555670.51481方差13.0557112.59578白葡萄酒第一组第二组平均值73.9321476.53214方差70.9250126.68692综合两组评酒员所打分数的平均值及方差,因为第二组的方差更小,也就是该组专家的意见相对更一致,所以说第二组评酒员的结果更可信。又计算出两组评酒员所打分数的平均值及方差如下:46问题二本问题中涉及了葡萄酒的质量,我们通过查阅文献(葡萄酒芳香物质研究进展)得到芳香物质对葡萄酒的质量有重要的影响,所以用葡萄酒中的芳香物质来定量的分析葡萄酒的质量。对于酿酒葡萄的理化指标,它分为一级、二级等多级指标。它的指标都是检测了三次,所以我们对其求平均值并以此作为指标的数值。而二级指标中除了H、C两个二级指标外其余的每一类二级指标的和都等于所对应的一级指标值,所以我们不考虑二级指标(除H、C)。问题二本问题中涉及了葡萄酒的质量,我们通过查阅文献47首先我们对所有的数值用标准化变换进行无量纲化处理,由于葡萄酒中的芳香物质及酿酒葡萄中的理化指标很多,就需要把这些很复杂的数据集简化,因此我们应用主成分分析法在DPS软件中分别对它们进行主成分分析,找出几个综合因子来代表原来众多的变量。分析结果(1)分析结果出来后,一般建议是取当特征值累积贡献率达80%,或者特征值大于1时的主成分个数。我们根据特征值大于1时的主成分个数对葡萄酒中的芳香物质及酿酒葡萄中的理化指标取得主成分(2)。首先我们对所有的数值用标准化变换进行无量纲化处理,由48在主成分分析结果出来后,我们将前个特征值较大的主成分,按照公式:
计算个主成分的“综合值”,每一个酿酒葡萄及葡萄酒样本都对应一个“综合值”,而这个“综合值”充分利用了所有的信息,于是这个“综合值”就能用来作为每一个酿酒葡萄及葡萄酒样本相对性的综合得分。在DPS中计算可得每一个酿酒葡萄及葡萄酒样本的得分(3)。
在主成分分析结果出来后,我们将前个特征值较大的主49表中酿酒葡萄的得分依赖于它的理化指标,这个得分能相应的定量反映出理化指标的信息;同样葡萄酒的得分依赖于它的芳香物质,而芳香物质又决定了葡萄酒的质量,所以这个得分就能定量的反映出葡萄酒质量的信息。因此用每个酿酒葡萄样本的综合得分和葡萄酒质量的综合得分,分为两组变量,并对这两组变量进行二维的聚类(在DPS中实现),分析得出红葡萄和白葡萄的聚类结果图如下:表中酿酒葡萄的得分依赖于它的理化指标,这个得分能相应50(红葡萄)(红葡萄)51(白葡萄)(白葡萄)52最后根据聚类结果图可以对红、白葡萄进行如下分级:分类样品第一类红葡萄样品1第二类红葡萄样品27第三类红葡萄样品2,21,3,9,8,第四类红葡萄样品4,24,10,5,16,11,22,19,7,14,13,15,17,20,25,26,6,23,12,18,(红葡萄)最后根据聚类结果图可以对红、白葡萄进行如下分级:分类53分类样品第一类白葡萄样品1,6,26,7,24,11,12,15,13,17,2,14,18第二类白葡萄样品19,27,25,4,16,10,8,22,5,23,9,20,3,21,28(白葡萄)分类样品第一类白葡萄样品1,6,26,7,24,11,12,54问题三对于分析酿酒葡萄与葡萄酒的理化指标之间的联系这一问题,我们观察附件3所给数据,选择了花色苷、单宁、总酚、酒(葡萄)总黄酮、白藜芦醇、DPPH半抑制体积、色泽(L*(D65、a*(D65)、b*(D65)、H(D65)、C(D65))这些对应的理化指标为研究对象,建立了下述两个简单的模型,分别用协方差及相关系数对酿酒葡萄与葡萄酒的理化指标之间的联系进行了简单分析。问题三55建立了如下模型:其中是期望值,,是相应理化指标值的平均值。建立了如下模型:其中是期望值,,是相应理化指标值的平56用Excell辅助求解,结果如下:红协方差联系相关系数联系花色苷mg/100g鲜重0.8846正相关0.9226正相关(强)单宁(mmol/L)0.6914正相关0.718正相关总酚(mmol/L)0.8427正相关0.8751正相关(强)(葡萄)酒总黄酮(mmol/L)0.7924正相关0.8228正相关(强)白藜芦醇(mg/L)0.013正相关0.1351正相关DPPH半抑制体积(IV50)1/IV50(uL)0.7494正相关0.7783正相关色泽L*(D65)0.4754正相关0.4937正相关a*(D65)-0.522负相关-0.542负相关b*(D65)0.0244正相关0.0254正相关H(D65)-0.275负相关-0.285负相关C(D65)-0.468负相关-0.456负相关用Excell辅助求解,结果如下:红协方差联系相关系数联系花57白协方差联系相关系数联系单宁(mmol/L)0.55333正相关0.573825正相关总酚(mmol/L)0.527225正相关0.546757正相关(葡萄)酒总黄酮(mmol/L)0.671808正相关0.696689正相关白藜芦醇(mg/L)-0.2052负相关-0.2128负相关DPPH半抑制体积(IV50)1/IV50(uL)0.372512正相关0.386309正相关色泽L*(D65)-0.13536负相关-0.14037负相关a*(D65)-0.02888负相关-0.02995负相关b*(D65)0.268985正相关0.278946正相关H(D65)0.280558正相关0.290948正相关C(D65)0.483919正相关0.501848正相关白协方差联系相关系数联系单宁(mmol/L)0.55333正58问题四我们充分利用模型二中的方法应用DPS数据处理软件得出葡萄酒中理化指标的主成分分析结果(见附件1),主成分如下:红葡萄酒理化指标主成分特征值百分率%累计百分率%花色苷(mg/L)5.450349.548349.5483单宁(mmol/L)2.456622.332771.881总酚(mmol/L)1.695315.411987.2929问题四红葡萄酒理化指标主成分特征值百分率%累计百分率%花色苷59白葡萄酒理化指标主成分特征值百分率%累计百分率%单宁(mmol/L)3.508135.080635.0806总酚(mmol/L)3.001730.017565.0981酒总黄酮(mmol/L)1.199311.993177.0912再利用模型二中的综合打分法得到红、白葡萄酒每个样本的具体得分(4)。这个得分能定量的反映出其理化指标的信息,也就能用来分析每个葡萄酒样本的理化指标。表16白葡萄酒理化指标主成分特征值百分率%累计百分率%单宁(mmo60再利用模型二
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论