




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
葡萄酒的评价模型摘要如今,葡萄酒被越来越多的人所热爱,不仅因为它博大精深的酒文化及其上等的品质,更多的是由于葡萄酒的营养价值。葡萄酒质量的鉴别主要靠感官分析和理化指标分析的方法来确定,本文主要讨论了葡萄酒质量与酿酒葡萄理化指标、葡萄酒理化指标之间的联系,分析了葡萄酒人工品评中存在的不足,建立了科学的葡萄酒质量评价模型,对葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。对于问题一,本文将两组品酒员的打分结果看作两个配对样本,采取了配对样本T检验的方法,分别对红葡萄酒与白葡萄酒的打分情况进行显著性差异分析。根据结果可知,红、白葡萄酒的打分结果均存在显著性差异,且第二组品酒员打分结果的系统误差更小,更为可信。对于问题二,本文首先用置信区间法,将品酒员的打分结果进行转化处理,得到新的葡萄酒评分。接着,综合酿酒葡萄的理化指标并运用聚类分析法,分别以红葡萄酒与白葡萄酒的酒样作为研究对象,各项指标作为变量,对酒样进行分级。再通过酒样类别推出酿酒葡萄的分级情况。对于问题三,为了探寻酿酒葡萄理化指标与葡萄酒理化指标之间的联系,本文运用典型相关的分析方法,将酿酒葡萄的理化指标作为影响因子,试图找到葡萄酒理化指标对应的少量主要因子。运用SAS软件对相应的因子进行回归分析,得出相应因子的系数方程,以此判断因子的正负相关性,从而建立酿酒葡萄与葡萄酒理化指标之间的关系。对于问题四,分析了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。酿酒葡萄的理化指标是葡萄酒的理化指标的主要影响因素,在一定程度上,两个指标对葡萄酒质量的影响可以看作是相似甚至相等,于是本文选取葡萄酒的理化指标进行分析。接着,本文将乙醇与花色苷、单宁、酚类的比值作为新的理化指标,重新建立葡萄酒质量评价体系,进而分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。结果证明,仅仅用酿酒葡萄和葡萄酒的理化指标,并不能评价葡萄酒的质量。关键字:葡萄酒 理化指标 配对T检验 聚类分析 典型相关 多元回归1、 问题重述葡萄酒的评价确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2、 符号说明与模型假设2.1符号说明品酒员i 对酒样j 的评价第j种酒样的第i项指标在标准化后的数值 乙醇/花色苷 乙醇/单宁 乙醇/总酚 酒总黄酮 白藜芦醇 DPPH半抑制体积 L*(D65) a*(D65) b*(D65) 质量2.2模型假设1. 品酒员不带地区主观性,评判公正。2. 葡萄酒样品的品评得分合理、客观、全面。2.葡萄酒的制作过程、制作方法不会影响葡萄酒的质量。3、 问题分析3.1问题一:品评往往受到评酒人员的嗜好、习惯、情绪、年龄、经验等因素的影响,因为评定常有一定程度的主观性和不确定性,这是评分的可靠性受到影响。问题要求对两组品酒员的打分情况进行显著性差异分析,并得出哪一组的结果更为可信。首先,我们需要对题给数据进行处理简化,计算每一个酒品样本的平均得分,在一定程度下减小了主观打分的误差。接着,考虑运用配对样本T检验方法,得到较为直观的分析结果。3.2问题二:题目要求根据酿酒葡萄的理化指标和葡萄的质量来对葡萄进行分级。一方面,针对问题一用置信区间法得出的对葡萄酒的评分,我们将其作为葡萄酒的质量指标值;另一方面,由于葡萄本身的理化指标过多且复杂,每项理化指标对于葡萄生产成葡萄酒的影响也过于繁杂,故我们利用葡萄酒的理化指标来对葡萄进行分类。在进行聚类分析时,我们以酒样作为研究对象,各项指标作为变量对酒样进行聚类分析,再通过酒样得到的类别大致推出葡萄的分级情况,在此需说明的是红、白葡萄酒因葡萄品种不同分开讨论。3.3问题三:葡萄酒的酒酿过程是一个复杂的化学物理过程,葡萄与葡萄酒的理化指标在一定程度上显示了这一复杂的变化;但由于数据过于庞大繁杂,我们需要建立适当的模型来进行数据挖掘,从而分析理化指标之间的联系。首先,我们要对理化指标进行简化处理,并通过调阅文献,对各理化指标进行全面的理解。这样的准备工作有助于我们对理化指标的相互关系作出初步的判断。随后,通过建立模型对理化指标进行定量分析,将得到的结果与实际物化性质进行比较分析,得到全面、科学的结论。理化指标的相关性分析可采用典型相关性模型。3.4问题四:问题四需要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,而题目中所说“酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系”,恰恰表明酿酒葡萄的理化指标是葡萄酒的理化指标的主要影响因素,在一定程度上两个指标对葡萄酒质量的影响可以看做是相似甚至相等,于是可以选取指标较少的葡萄酒,以他的理化指标来分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。根据化学知识,花色苷、单宁、酚类均溶于乙醇,我们以乙醇/花色苷,乙醇/单宁,乙醇/总酚作为新的指标,处理数据。对于多个影响因素,本文以红葡萄酒作为实验对象,白葡萄酒作为检验对象,并将第一问中品酒员对酒评分的平均数作为某种葡萄酒的真实质量,采用多元线性回归方程,来线性描绘各指标对葡萄酒质量的影响,并通过图形检验及白葡萄酒检验,来判别上述回归方程的准确性。其中白葡萄酒的检验即为以多元回归方程估计28种葡萄酒的估计质量,并与真实质量相比较。对于第二问论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,本文以指标影响排名(即估计质量排名)与真实质量排名相比较,若在一定的误差允许范围内,排名有所波动,可以认为能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,反之,若误差较大,则不可以。4、 模型的建立与求解4.1问题一4.1.1利用T检验分析两组品酒员的评价差异性对于问题一,要求对两组品酒员的打分情况进行显著性差异分析。本文考虑运用多元统计学里的配对样本T检验方法。4.1.1.1配对T检验的基本实现思路配对样本是指对同一样本进行两次测试所获得的两组数据,或对两个完全相同的样本在不同条件下进行测试所得的两组数据。根据题给数据,两组品酒员均对27个红葡萄酒样本、28个白葡萄酒样本进行了打分评估,故可以将两组品酒员的打分结果看作两个配对样本(红葡萄酒与白葡萄酒),且样本打分的两个总体服从正态分布。两个独立样本的T检验,是根据样本数据,对两个配对样本来源总体的均值是否有显著性差异进行推断。因此,本文先根据附件一提供的品酒员对葡萄酒的评价结果,将每位品酒员对每种酒样的各项指标的得分相加,即可得到两组品酒员对红葡萄酒和白葡萄酒的评价总分及平均分(详见附录1)。在进行配对T检验分析显著性差异的时候,我们先引进一个新的随机变量对应的样本值为其中,。这样,检验的问题就转化为单样本t检验问题(即转化为检验Y的均值是否与0有显著差异)。第二步,建立零假设,第三步,构造t统计量第四步,运用Spss自动计算t值和对应的P值。第五步,作出判断:若P值显著水平,则不能拒绝零假设,即认为两总体均值不存在显著差异。4.1.1.2 模型的求解接下来我们用两组品酒员对两种葡萄酒样品(包括27种红葡萄酒和28种白葡萄酒)的平均分通过SPSS软件做显著性分析。可得如下: (1)红葡萄酒:成对样本统计量均值N标准差均值的标准误对 1第一组平均分73.056277.34261.4131第二组平均分70.515273.9780.7656成对样本相关系数N相关系数Sig.对 1第一组平均分 & 第二组平均分27.700.000成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分的 95% 置信区间下限上限对 1第一组平均分 - 第二组平均分2.54075.37191.0338.41574.66582.45826.021(2)白葡萄酒:成对样本统计量均值N标准差均值的标准误对 1第一组平均分74.011284.8040.9079第二组平均分76.532283.1709.5993成对样本相关系数N相关系数Sig.对 1第一组平均分 & 第二组平均分28.240.220成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分的 95% 置信区间下限上限对 1第一组平均分 - 第二组平均分-2.52145.0828.9606-4.4923-.5505-2.62527.014由以上图分析可知,在红葡萄酒中的评价中,对应达概率P值sig(双侧)=0.0210.05拒绝原假设,可认为两配对变量存在明显区别。即第一组品酒员和第二组品酒员的打分存在显著性差异。同理,白葡萄酒的评价中,sig(双侧)=0.0140.05同样存在显著性差异。而通过分析标准差,第二组的标准差较小点,故第二组的评价结果更可信。4.1.2 利用置信区间法进一步优化葡萄酒评价为了降低品酒员的异质性,可以计算所有品酒员对同一酒样的平均值() 及其标准差(),则有品酒员i(i=1,2,.10) 对酒样j(j=1,2,.27或28) 评价的置信区间为。其中,酒样j 的平均值,酒样j 的标准差。如果品酒员i 对酒样j 的评价()在其置信区间范围内就可以直接使用;如果其评价() 不在置信区间范围内, 则将品酒员的评价进行逐步调整, 使不同品酒员对同一酒样的评价值都处于范围内, 即:若,则(为调整后在置信区间内的酒样评价);若,则。根据以上算法,我们可以利用可信度较高的第二组品酒员的得分算出两种葡萄酒经置信区间转换后的数据(见附录2)。由以上置信区间法,我们可以大致得到一个关于红酒质量的评估(由优到劣排序):红葡萄酒:酒样9、酒样23、酒样20、酒样3、酒样17、酒样4、酒样2、酒样19、酒样21、酒样14、酒样5、酒样26、酒样27、酒样24、酒样22、酒样16、酒样1、酒样12、酒样10、酒样13、酒样25、酒样6、酒样15、酒样7、酒样8、酒样18、酒样11白葡萄酒: 酒样9、酒样25、酒样5、酒样21、酒样10、酒样28、酒样15、酒样17、酒样22、酒样1、酒样23、酒样19、酒样4、酒样3、酒样14、酒样18、酒样6、酒样27、酒样26、酒样24、酒样20、酒样2、酒样7、酒样13、酒样12、酒样11、酒样8、酒样16在对葡萄酒的感官评价中, 由于品酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同品酒员对同一酒样的评价差异很大,从而不能真实地反映不同酒样间的差异。因此,在对感官评价结果进行统计分析时,必须对品酒员的原始数据进行相应的处理,以真实反映样品间的差异。而置信区间法对原始数据进行调整,能有效地降低品酒员间的差异,真实地反映酒样间的客观差异。4.2问题二(聚类分析模型)4.2.1聚类分析模型原理简介聚类分析(又称群分析)是研究样品分类(或指标)问题的一种多元统计方法。聚类分析有多种,这里主要介绍系统聚类法(Hierarchical Cluster)和快速聚类法(K-Means Cluster)。系统聚类法是根据事物本身的特征研究个体分类的方法,原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。而快速聚类法是非系统聚类法中最常用聚类法,优点是占内存少、计算量小、处理速度快,适合大样本的聚类分析,但是其只能对观测量(样本)聚类,而不能对变量聚类,且使用的聚类变量必须都是连续变量。所谓聚类分析就是根据样品或指标的“相似”特征进行分类的一种多元统计分析方法,这里指的类就是“相似”元素的集合。进行聚类分析需要知道待分类的若干样品及其指标值,然后通过每一类指标数据的分析,进一步对各个结构进行优化。聚类分析的基本思想是定义样品之间的距离(或相似系数)和类与类之间的距离。一按开始将n个样品各自自成一类,这时类间的距离与样品间的距离是一致的,然后将距离最近的两个类进行合并形成一个新类,并计算新类与其他类之间的距离,再按距离最小准则并类。每并类一次,类的个数就减少。这个过程持续到所有样品都被归为一类为止。需要在此说明,聚类分析中距离的计算有多种方法,譬如,最短距离法、最远距离法、中间距离法、重心法、类平均法、离差平方法等,可根据各自不同特点在建模时自行选择特定的距离计算法,这里不再具体阐述。4.2.2数据处理在问题二中,题目要求用附件2所给的有关酿酒葡萄的理化指标和葡萄酒的质量来对葡萄进行分级。然而实际操作中我们无法知晓有关葡萄本身性质的理化指标对葡萄酒的影响(即正面影响或负面影响),故我们采用葡萄酒的理化指标和葡萄酒的质量对葡萄进行分级。在处理葡萄酒的理化指标时我们对进行过多次测试的指标值取平均值,并且将二级指标剔除在外,同时用问题一所得出的红、白两种葡萄酒的在置信区间内的平均分作为两种葡萄酒的质量指标值,因此我们对红、白葡萄进行聚类分析时,共有10或9个指标作为聚类的标准。但是由于各指标值在数量级上差异较大,并且在单位上均有不同,当作为指标变量来对酒样进行聚类时容易导致有较大的偏差,故我们先对数据进行标准化处理,标准化的公式为(i=1,2,.27或28,j=1,2,.10或9)在上述公式中,表示第j种酒样的第i项指标在标准化后的数值,即可得到处理后的数据(详见附录3)。在SPSS里进行聚类分析后,可得到酒样品的分类,从而推出出葡萄的分类或分级。4.2.3模型的求解在上述知识的基础上,我们通过SPSS软件求解上述问题,可得如下数据分析列表:有关红葡萄酒的相关数据:树状图: * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 酒样品15 15 -+ 酒样品16 16 -+ 酒样品18 18 -+-+ 酒样品13 13 -+ +-+ 酒样品10 10 -+-+ | 酒样品25 25 -+ | | 酒样品27 27 -+ +-+ 酒样品19 19 -+-+ | 酒样品24 24 -+ | | 酒样品4 4 -+ | | 酒样品22 22 -+-+ | +-+ 酒样品5 5 -+ | | | | 酒样品6 6 -+-+ | | 酒样品17 17 -+ | | 酒样品7 7 -+-+ | +-+ 酒样品12 12 -+ +-+ | | 酒样品14 14 -+-+ | | 酒样品26 26 -+ | | 酒样品11 11 -+-+ | 酒样品20 20 -+ | 酒样品1 1 -+-+ | 酒样品8 8 -+ | | 酒样品3 3 -+-+ +-+ 酒样品9 9 -+ +-+ | 酒样品2 2 -+ +-+ | 酒样品21 21 -+ +-+ 酒样品23 23 -+根据以上的树状图,我们可以根据葡萄酒的分类推出酿酒葡萄的分级(分类),即大致可将红葡萄分为四大类:第一类23,21,2,9,3,第二类8,1第三类20,11,26第四类14,12,7,17,6,5,22,4,24,19,27,25,10,13,18,16,15上面四大类的等级分别由优到劣。同理可得白葡萄酒的相关数据:树状图:* * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 酒样品2 2 -+ 酒样品6 6 -+ 酒样品1 1 -+ 酒样品21 21 -+-+ 酒样品19 19 -+ | 酒样品11 11 -+-+-+ 酒样品25 25 -+ | | 酒样品10 10 -+ | 酒样品12 12 -+-+ | 酒样品15 15 -+ +-+-+ 酒样品20 20 -+ | | 酒样品13 13 -+-+ | | 酒样品18 18 -+ +-+ +-+ 酒样品3 3 -+ | | 酒样品7 7 -+ | | 酒样品8 8 -+-+ | 酒样品16 16 -+ +-+ 酒样品4 4 -+ | | 酒样品9 9 -+-+ | | 酒样品23 23 -+ +-+ | +-+ 酒样品5 5 -+ +-+ | | 酒样品28 28 -+ | +-+ 酒样品17 17 -+ | | 酒样品14 14 -+-+ | | 酒样品22 22 -+ +-+ | 酒样品26 26 -+ | 酒样品24 24 -+-+ 酒样品27 27 -+根据以上的树状图,我们可以根据葡萄酒的分类推出酿酒葡萄的分级(分类),即大致可将白葡萄分为三大类:第一类27,24第二类26,22,14第三类17,28,5,23,9,4,16,8,7,3,18,13,20,15,12,10,25,11,19,21,1,6,2上述三大类的等级分别由优到劣。4.3问题三(典型相关性分析模型) 为了探寻酿酒葡萄理化指标与葡萄酒理化指标之间的联系,由于数据量大而繁杂,若单纯使用统计回归模型,拟合度将会很低,不能真实地反应回归函数。本文考虑运用典型相关的分析方法,试图找到单一理化指标对应的少量主要因子,运用SAS软件对相应的因子进行回归分析,得出相应因子的系数方程,以此判断因子的正负相关性,从而建立酿酒葡萄与葡萄酒理化指标之间的关系。4.3.1 模型的准备4.3.1.1典型相关分析 典型相关分析是统计方法家族中的年轻成员,是研究两组变量之间相关关系的一种多元统计方法。典型相关分析的基本思想类似于主成分分析,首先在每组变量中找出变量的线性组合,使其具有最大相关性,而从同一组内部提取的各主成分之间互不相关,用从两组之间分别提取的主成分的相关性来描述两组变量整体的线性相关关系。这样,讨论两组变量之间的相关就转化为只研究这些线性组合的最大相关,从而减少研究变量的个数。4.3.1.2典型相关分析计算步骤(一)根据分析目的建立原始矩阵一般,原始数据矩阵为(二)对原始数据进行标准化变化并计算相关系数矩阵 = 其中,分别为第一组变量和第二组变量的相关系数阵,= 为第一组变量和第二组变量的相关系数。(三)求典型相关系数和典型变量 计算矩阵以及矩阵的特征值和特征向量,分别得典型相关系数和典型变量。最后,检验各典型相关系数的显著性在步骤(一)中,与是两个相互关联的随机向量,利用主成分分析,分别在两组变量中选取若干有代表性的综合变量,使每一综合变量都是原变量的一个线性组合,即我们只考虑方差为1的,的线性函数,求使它们相关系数达到最大的这一组。若存在常向量,使得则称,是,的第一对典型相关变量。求出第一对典型相关变量之后,可以类似地去求第二对,第三对这些典型相关变量就反映了,之间的线性相关的情况。也可以按照相关系数绝对值的大小来排列各对典型相关变量之间的先后次序,使得第一对典型相关变量相关系数的绝对值最大,第二对次之判断各对典型相关变量相关系数的绝对值是否显著大于零,如果是,这一对综合变量就真的具有代表性;否则,这一对变量就不具有代表性,可以忽略。对于酿酒葡萄和葡萄酒的理化指标的分析,可以通过对少数典型相关变量的研究,代替原来两组之间的相关关系的研究,从而容易抓住关系的本质,尽可能给出较为深刻的分析结果。数据处理与结果分析 首先,我们将酿酒葡萄与葡萄酒的理化指标进行简化分类。本文在进行典型相关性分析时,保留了氨基酸总量、白藜芦醇(mg/kg)、黄酮醇(mg/kg)、总糖g/L、还原糖g/L等蓝色一级指标。一级指标已具有代表性,在酿酒过程中起到决定性作用。剔除了各类氨基酸、果糖g/L、葡萄糖g/L等若干红色二级指标,并不会对典型分析结果造成太大影响;若一个指标项目下有几列测量数据,取各列数据的平均值代替该理化指标;在进行典型分析的时候,暂不考虑果皮颜色与葡萄酒色泽两个理化指标,这两个理化指标影响着葡萄酒的色调,将作为色泽物理因素单独考虑。4.3.1.3酿酒葡萄与红葡萄酒的理化指标关系首先,模型将对红葡萄酒与对应的酿酒葡萄的理化指标进行分析。 典型相关分析可以通过SPSS和SAS实现,本文使用功能强大的SAS软件来实现理化指标的相关分析。SAS/STAT中的CANCORR模块是用来实现典型相关分析的。样本程序见表:读取数据,这里的一组变量表示酿酒红葡萄的理化指标,分别为氨基酸总量mg/100gfw(X1),蛋白质mg/100g(X2),VC含量(mg/L)(X3),花色苷mg/100g鲜重(X4),总酸(g/L)(X5),多酚氧化酶活力E(A/mingml)(X6),褐变度A/g*g*min*ml(X7),DPPH自由基1/IC50(g/L)(X8),总酚(mmol/kg)(X9),单宁(mmol/kg)(X10),葡萄总黄酮(mmol/kg)(X11),白藜芦醇(mg/kg)(X12), 黄酮醇(mg/kg)( X13), 总糖g/L(X14), 还原糖g/L(X15), 可溶性固形物g/l(X16), PH值(X17), 可滴定酸(g/l)(X18), 固酸比(X19), 干物质含量g/100g(X20), 果穗质量/g(X21), 百粒质量/g(X22), 果梗比(%)(X23), 出汁率(%)(X24), 果皮质量(g)(X25)。另外一组变量表示红葡萄酒的理化指标,分别为花色苷(mg/L)(Y1),单宁(mmol/L)(Y2),总酚(mmol/L)(Y3),酒总黄酮(mmol/L)(Y4),白藜芦醇(mg/L)(Y5),DPPH半抑制体积(IV50)1/IV50(uL)(Y6)。得到部分输出结果如下:SAS系统对酿酒红葡萄、红葡萄酒理化指标的分析Canonical StructureCorrelations Between the VAR Variables and the CanonicalVariables of the WITHVaricablesV1V2V3V4V5V6x10.1587-0.31160.40390.48-0.2373-0.1282x20.41560.03510.26710.24690.1359-0.1344x3-0.0712-0.15860.0334-0.0817-0.0188-0.0202x40.09610.72020.48460.27560.22870.0362x50.35180.460.27650.02350.0649-0.1412x6-0.02290.49620.24710.4140.04940.0562x70.10420.63650.405-0.05840.21040.1679x80.17510.28780.64430.28960.2546-0.0529x90.12810.29340.71670.31840.30870.0888x100.10650.38490.40590.47040.22020.0079x110.10180.24940.80520.07960.26760.0282x120.0431-0.0562-0.0860.09690.5711-0.0454x130.633-0.0350.17620.2109-0.0384-0.0271x140.0113-0.25030.2478-0.0230.32990.0384x150.1011-0.20870.47510.15260.05510.1409x160.1405-0.20570.14890.47240.55280.1391x17-0.2688-0.23660.28550.21690.17380.1424x180.0677-0.2632-0.00590.0579-0.2751-0.0407x19-0.02150.21990.16160.02660.32330.1325x200.1643-0.09960.40030.19080.00750.0161x21-0.03930.1235-0.226-0.1048-0.2809-0.009x22-0.3451-0.06130.0574-0.1099-0.1490.0781x230.14650.2801-0.08290.5342-0.0244-0.1736x24-0.12260.21350.3420.15360.17960.1885x250.0814-0.0495-0.0076-0.0702-0.19270.2127Correlations Between the with variablesand the canonical variables of the var variablesW1W2W3W4W5W6Y10.22060.74650.18360.57430.12730.0916Y20.29090.20140.60650.67360.21780.0047Y30.29740.43120.72890.3750.2174-0.0215Y40.08210.3360.71520.30290.43580.2088Y5-0.27570.1654-0.4074-0.04460.8379-0.0652Y60.27650.26820.79290.38810.1520.1779 输出结果表示原始变量间的相关关系。变量经过计算机的成分分析,被分为W2、W3、W4、W5四个典型相关变量,分别对应着各自的Xi典型相关因子。下面我们就根据模型的计算结果,对各个理化指标进行定量、定性的分析。葡萄酒中的花色苷(mg/L) 根据典型相关性分析的结果可知,花色苷(mg/L)(Y1)与酿酒葡萄中的VC含量(mg/L)(X3)、花色苷mg/100g鲜重(X4)、总酸(g/L)(X5),多酚氧化酶活力E(A/mingml)(X6),褐变度A/g*g*min*ml(X7)、可滴定酸(g/l)(X18)有较强的相关性。根据文献,葡萄组织中的酶可以破坏葡萄与葡萄酒中花色素苷,在花色苷降解过程中,涉及到的酶有糖苷酶和多酚氧化酶这两大类。维生素C 在氧化中可以产生H2O2,对2-苯基苯并吡喃阳离子的2位碳进行亲核进攻,从而产生无色的酯和香豆素等衍生物,最终产生褐色沉淀物(即褐变反应)。模型的结果与现实是高度符合的。葡萄酒中的总酚(mmol/L)、酒总黄酮(mmol/L)与 DPPH半抑制体积(IV50) 1/IV50(uL) 在第二对典型相关变量中,葡萄酒中的总酚(mmol/L)(Y3),酒总黄酮(mmol/L)(Y4),DPPH自由基1/IC50(g/L)(Y6)与酿酒葡萄中的DPPH自由基1/IC50(g/L)(X8),总酚(mmol/kg)(X9),葡萄总黄酮(mmol/kg)(X11),还原糖g/L(X15),PH值(X17),干物质含量g/100g(X20),出汁率(%)(X24)具有较强的相关性。 输出结果直观地体现了第二对典型相关变量之间相互联系。我们通过调阅文献,并结合化学知识可知,对结果进行进一步分析:酚类物质在一般条件下较难实现氧化还原,故本文判断:影响葡萄酒中总酚含量的主要因子为葡萄中的总酚含量,多酚氧化酶活力对酚类物质的影响并不显著。而对于酒总黄酮,在一般情况下,酸类物质难以被还原为酮类物质,且葡萄酒发酵过程为氧化反应,故酒总黄酮大部分为葡萄中原有的黄酮类物质,当然也不排除在有还原糖的情况下酸类物质可被还原为酮类。 考虑到DPPH自由基主要在多酚氧化酶作用下与酚类物质进行反应,在判断DPPH半抑制体积的影响因素时,我们取DPPH自由基、总酚作为影响因子。葡萄酒中的单宁(mmol/L) 第三对典型相关变量是一组复相关系数分析。根据输出结果可以判断,葡萄酒中的单宁(mmol/L)(Y2)与氨基酸总量mg/100gfw(X1)、单宁(mmol/kg)(X10)、可溶性固形物g/l(X16)、 果梗比(%)(X23)有着显著的相关性。 通过调阅文献我们可知,单宁是一类结构复杂的多元酚类的物质。单宁可溶于水和乙醇中, 生成胶状溶液,具有不稳定性。因此红葡萄在发酵时采用连皮带肉成为果浆时发酵, 其目的是为了获取更多的单宁和色素, 使葡萄果实的梗因含单宁星最高, 因此在果实破碎时必须除梗, 主要是果梗中的单宁粗糙且涩口, 会破坏酒质。模型的输出结果梗比(%)的影响系数达到了0.5342,为理化指标的联系提供了很好的依据。葡萄酒中的白藜芦醇(mg/L) 最后,我们找出第四对典型相关变量。葡萄酒中的白藜芦醇与酿酒葡萄中白藜芦醇(mg/kg)(X12)、总糖g/L(X14)、果穗质量/g(X21)含量有关,显示如下:已有的研究表明, 葡萄中白藜芦醇的生物合成途径同苯丙氨酸代谢途径密切相关。白藜芦醇原本是葡萄等植物受到逆境胁迫产生的次生代谢产物,用以抵抗逆境对自身的进一步破坏。由于植物防御体系的作用,它的出现往往伴随着植物体内多种与抗病相关的生物酶被激活。根据模型的分析结果可知,酿酒葡萄中的白藜芦醇直接影响着葡萄酒中的白藜芦醇含量。红葡萄酒中的色泽L 色泽作为一个较特殊的物理因素,极大影响着专业品酒员对葡萄酒外观色泽地评定。为了探究色泽理化指标与酿酒葡萄部分理化指标的联系,我们首先做出初步的相关性判断,对相应的因子进行回归分析,得出相应因子的系数。调阅文献可知,研究指出花色苷和单宁为葡萄酒色泽的最重要影响成分。红葡萄酒中的呈色物质主要是花色苷,它是决定红葡萄酒品质和感官质量的重要因素之一;褐变反应也是葡萄酒成色的一大原因;我们判断,影响葡萄酒色泽的主要因子有:花色苷、果梗比、果皮颜色、单宁、褐变度。本文运用SPSS软件,对色泽有关的理化指标进行分析,结果如下:模型汇总模型RR 方调整 R 方标准 估计的误差1.856a.733.67012.a. 预测变量: (常量), 果皮颜色L, 果梗比, 单宁, 褐变度, 花色苷。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)25.00258.136.430.672花色苷-.141.054-.592-2.592.017褐变度.002.011.027.162.873单宁.620.519-.188-1.194.246果梗比-2.7192.689-.143-1.011.324果皮颜色L1.8962.232.124.850.405a. 因变量: 色泽L得到葡萄酒中色泽L指数的对应函数: 4.3.1.4酿酒葡萄与白葡萄酒的理化指标关系运用典型相关性分析模型,我们可以对白葡萄酒与酿酒葡萄的理化指标进行相关性分析。通过比对数据我们发现,白葡萄酒中去除了花色苷(mg/L)这一与色泽显著相关的理化指标,且酿酒葡萄样品中,花色苷指标最大值仅为4.103mg/100g,固可以剔除这一指标的影响;其他理化指标的处理与红葡萄酒相同。运用SAS软件,计算得到白葡萄酒与酿酒葡萄的理化指标之间的函数关系。由于计算过程与数据分析方法与4.3.1.3相同,这里就不再累述。(见附录4)综合4.3.1.3,我们得出结论:酿酒葡萄与葡萄酒的理化指标之间存在显著联系,典型相关性模型的计算结果清晰地显现了这些特征,模型为葡萄酒的酒酿过程的科学分析提供了理论依据。4.4问题四(多元线性回归)问题四需要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,而题目中所说“酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系”,酿酒葡萄的理化指标是葡萄酒的理化指标的主要影响因素,在一定程度上两个指标对葡萄酒质量的影响可以看作是相似甚至相等,于是本文选取葡萄酒的理化指标,对指标做出必要的处理,来求出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度。4.4.1数据处理就常识而言,高质量的葡萄酒中酒精(即乙醇)的含量至关重要,但是这并不表示酒精的含量越多越好。查阅资料,我们知道,花色苷,单宁,酚类均溶于乙醇,若是乙醇过多必会导致花色苷,单宁,酚类的流失,进而对葡萄酒的色,香,味均会产生重要的影响。于是,本文选取乙醇与花色苷、单宁、酚类的比值作为新的理化指标,重新建立葡萄酒的理化指标与葡萄酒的质量关系(质量为题目所给的品酒员的打分的平均分)。数据处理(见附录5):4.4.2 预估计各因素与质量的关系(多元回归模型)由上述已处理的数据,本文运用SPSS进行多元回归方程的分析,得出各个理化指标对葡萄酒质量的影响。所以,各项指标x1,x2,x3,x4,x5,x6,x7,x8,x9对葡萄酒质量y的影响可以用多元回归方程表示,如下: 4.4.3 检验上述多元回归方程的可靠性及准确性 根据上述方程,本文以白葡萄酒作为检验项,来检验方程的可靠性,有方程求出各酒样品的估计质量,并与真实质量相比较,检验准确性。数据如下:品种编号估计质量实际质量酒样品161.4649577.9酒样品261.127175.8酒样品363.0908976.79369酒样品462.4907776.9酒样品555.6296180.47476酒样品658.3368476.45336酒样品773.5028974.2酒样品855.6142172.3酒样品940.0395981.43086酒样品1064.4364979.8酒样品1156.0797572.33714酒样品1267.4573773.5834酒样品1368.0344173.9酒样品1435.281676.70153酒样品1565.0788479.13515酒样品1680.5117267.3酒样品1759.4771579.05975酒样品1869.745776.7酒样品1961.9987476.91034酒样品2059.4317375.89258酒样品2154.6467980.0025酒样品2259.6770578.66788酒样品2355.5860477.4酒样品2470.9387776.1酒样品2560.9079880.53199酒样品2659.7269576.32879酒样品2771.5907676.40372酒样品2857.4269679.6图表三:白葡萄酒的估计质量与实际质量 由上表可知,估计质量与实际质量有着相同的趋势,基本符合一定的规律,说明该回归方程具有一定的准确性。然后,以估计质量作为自变量,实际质量作为因变量,建立二者关系,并通过一系列检验验证他们是否满足一定的关系。即证明上述的多元回归方程的准确性。通过上述检验,我们可以认为酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响满足改多元方程,即 所以各指标对质量的影响程度就可以通过该方程式反应出来。4.4.4论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量要论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,即可以用指标影响程度方程做出的预估计葡萄酒质量的排名和真实品酒员品评出来的葡萄酒的排名相比较,要是在一定的误差范围内可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 4《不做“小马虎”》(教学设计) 2023-2024学年统编版道德与法治一年级下册
- 河北对外经贸职业学院《生物合成药物学》2023-2024学年第二学期期末试卷
- 广州东华职业学院《织物产品结构与工艺(二)》2023-2024学年第二学期期末试卷
- 郑州工程技术学院《国外文学》2023-2024学年第二学期期末试卷
- 河源广东河源紫金县专门学校驻校教官招聘7人笔试历年参考题库附带答案详解
- 新疆农业大学《工作分析》2023-2024学年第二学期期末试卷
- 梅河口康美职业技术学院《缅甸语阅读》2023-2024学年第二学期期末试卷
- 冻土共振柱试验机项目效益评估报告
- Unit 5 In the Park Lesson 2(教学设计)-2024-2025学年人教新起点版英语二年级上册
- 重庆城市科技学院《建筑结构与平法识图》2023-2024学年第二学期期末试卷
- 心理评估与诊断简介课件
- 移动式压力容器充装复审换证考试重点题库(180题)
- 小班安全《汤姆走丢了》PPT课件教案反思微视频
- 作物栽培学课件棉花
- 最新小学二年级口算及竖式计算练习题
- 生产与运作管理-陈荣秋
- 金鸡冠的公鸡绘本课件
- 日影朝向及长短
- 沙盘游戏治疗(课堂PPT)
- (完整版)学生的自我评价的表格
- 朴素贝叶斯分类器完整
评论
0/150
提交评论