12年全国数学建模竞赛试卷_第1页
12年全国数学建模竞赛试卷_第2页
12年全国数学建模竞赛试卷_第3页
12年全国数学建模竞赛试卷_第4页
12年全国数学建模竞赛试卷_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2012高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,

2、在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 08057 所属学校(请填写完整的全名): 哈尔滨工程大学 参赛队员 (打印并签名) :1. 刘娟 2. 郭威 3. 张铮 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号

3、):全国评阅编号(由全国组委会评阅前进行编号): 酿酒葡萄与葡萄酒质量关系分析摘要本文围绕酿酒葡萄的理化指标与葡萄酒质量的关系问题,对两组评酒员的评价结果的差异性及可信度、酿酒葡萄的等级划分、酿酒葡萄的理化指标与葡萄酒的理化指标的联系以及酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响等问题分别进行了建模,对葡萄的理化指标与葡萄酒的理化指标及葡萄酒的质量关系问题进行了分析。对于问题一,运用配对t检验的方法对两组评价结果进行显著性差异的判断,算得两组的红葡萄酒和白葡萄酒的评价结果的P值均小于0.05=,即有显著性差异。对于两组评价结果的可信度,本文以评酒员的可靠性为检验标准,评酒员受心理、生理及外界

4、干扰等因素的影响越小,评价结果越公正越稳定。运用评分者信度检验中的Cronbach 检验模型对每一组的10个评论员进行可靠性检查,得到第一组的10个评酒员信度高,一致性好,因此第一组的评价结果可信。对于问题二,本文将附表2和3的数据进行整理,得到29个酿酒葡萄的理化指标,运用因子分析模型对29个变量进行降维处理,分别得到红酿酒葡萄有9个因子,白酿酒葡萄有10个因子,它们相互独立而且包含原有指标的信息。然后通过多元线性回归模型,将这些因子与葡萄酒的质量进行相关分析,得到有一些因子对结果的影响微小,可以略掉,最终得到红酿酒葡萄有6个因子、白酿酒葡萄有7个因子可以反映葡萄酒的质量。根据这些因子的权重

5、作聚类分析,最后将红白酿酒葡萄各分为四个等级。对于问题三,经过对比发现,随着酿酒葡萄酿成葡萄酒,酿酒葡萄的大部分指标都通过某些物理化学反应变成了其他指标,使得最后酿酒葡萄的理化指标的数目大大减少,并且葡萄酒中的每一个理化指标都不是单纯的与酿酒葡萄理化指标中的一个或几个有关系。运用多元线性回归模型,将葡萄酒的每一个理化指标都与酿酒葡萄和葡萄酒共有的所有理化指标建立线性关系,最后通过拟合的系数判断酿酒葡萄的理化指标与葡萄酒的理化指标的定性表达式。对于问题四,在问题二和问题三的基础上,我们已经确定了酿酒葡萄的理化指标与葡萄酒的质量有一定的相关关系,酿酒葡萄的理化指标也与葡萄酒的理化指标有相关关系,所

6、以酒和葡萄间相同的指标对就质量的影响也是线性相关的。我们把酿酒葡萄中的理化指标和葡萄酒中的理化指标当作自变量,评分结果作为因变量进行拟合,得出系数,用得到的关系式,代入以上所说的自变量,得到一组拟合后感官得分y,再对y和y进行显著性差异检验,得到结果,论证能否用理化指标评价葡萄酒质量。结果没有显著性差异,说明可以用酿酒葡萄和葡萄酒的理化指标来判断葡萄酒的质量。关键词:评分者信度 因子分析 多元线性回归 聚类分析问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质

7、量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?问题的分析葡萄酒的质量70%决定于原料的质量,30%决定于工艺和设备。酿酒葡萄的理化指

8、标对于葡萄酒的质量有着举足轻重的影响。本文针对酿酒葡萄与葡萄酒的质量关系,主要解决四个问题:感官评价葡萄酒质量的可靠性问题、酿酒葡萄的分级问题、酿酒葡萄与葡萄酒的理化指标之间的联系以及酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,以此来分析论证能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。2.1问题一:确定两组评酒员的评价结果有无显著差异,哪组更可信。问题一中要求对两组评酒员的评价结果进行统计分析,找出更可信的结果。我们以评酒员对每个酒样品各个分项指标的评分的总和的平均值作为每个组的评价结果。由于样本数量为27(红葡萄酒)、28(白葡萄酒)均小于30,我们可以用t检测来进行显著性检验。t

9、检测还包括单样本t检验,独立样本t检验以及配对样本t检验,分别适用于不用的样本类型。由于我们的两组数据是对同一样本的两次测量,满足配对样本t检验的前提条件,于是我们用SPSS中的配对样本t检验来实现对总评分的显著性检验。对于哪一组结果更可信,我们认为考察的是评酒员的可信程度。因为是感官分析,每个评酒员的生理、心理、品评环境的复杂性都对最终的评价结果有影响。一个好的经验丰富的评酒员,不受主观及人为因素的干扰,能够公正的评价酒样品的质量。我们将评酒员类比为量器,采用评分者信度法,考查评酒员的可靠性,可靠性高的一组评酒员对应的评价结果更可信。2.2问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡

10、萄进行分级附表2和附表3中酿酒葡萄的理化指标多且杂,而且有一些葡萄酒的理化指标都是有联系的,有隐性关系。根据降维的思想,我们得到酿酒葡萄的理化指标的内在联系,把多指标转化为几个相互独立而且包含原有指标大部分信息的综合指标。根据酿酒葡萄的理化指标和葡萄酒的质量的相关分析计算,最终确定酿酒葡萄中能包含全部信息的指标,然后通过聚类分析对酿酒葡萄进行分级。2.3问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系 针对酿酒葡萄与葡萄酒的理化指标之间的联系,我们首先分析酿酒葡萄和葡萄酒的各项理化指标。经过对比我们发现,随着酿酒葡萄酿成葡萄酒,酿酒葡萄的大部分指标都通过某些物理化学反应变成了其他指标,使得最后

11、酿酒葡萄的理化指标的数目大大减少,并且葡萄酒中的每一个理化指标都不是单纯的与酿酒葡萄理化指标中的一个或几个有关系。所以我们假设,葡萄酒的每一个理化指标都与酿酒葡萄和葡萄酒共有的所有理化指标有线性关系,并且共有指标的变化是由于其他指标的物理化学反应所得。该线性关系符合了多元线性回归分析的前提条件,所以我们采用SPSS中的多元线性回归拟合来验证我们的假设。2.4问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量由于有了问题二和问题三的基础,我们在分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响时,可以把酿酒葡萄中的理化指标分为两类:一类是

12、酿酒过程中发生物理化学反应变化成葡萄酒中成分的理化指标;一类为没有完全转化为葡萄酒指标,但是会对葡萄酒评分时的某些细则造成影响的理化指标(如百粒质量、果穗质量、果皮质量等等)。所以我们需要把酿酒葡萄的指标分别讨论。因为第三问中我们已经计算出酿酒葡萄中理化指标和葡萄酒中理化指标的线性关系,所以我们完全可以用葡萄酒中的理化指标综合第一类的指标,所以我们只要把葡萄酒中的所有理化指标和酿酒葡萄中的第二类指标放在一起作为自变量,把对应葡萄酒的质量评分作为因变量进行多元线性回归拟合即可。模型假设3.1条件假设1.所有的酒样品除了酿酒葡萄样品不同外,酿造葡萄酒的工艺和设备等因素均相同。2.附表1中第一组白葡

13、萄酒样品3中某一项指标出现了77分、附表3中葡萄样品12、13、21中的某些芳香类物质比其他样品高出几百倍,这些都与实际不符。我们将77改为7,芳香类物质改小。假设这些改变不影响结果的分析。(实际计算中反应影响不大)3.假设评酒员评价葡萄酒质量时,不受酒样品的序号、评价顺序的干扰。其他在模型中的假设在具体的模型建立与求解中给出。模型的建立与求解4.1问题一:确定两组评酒员的评价结果有无显著差异,哪组更可信。4.1.1模型I:配对t检验显著性差异模型模型的建立(1)两配对样本t检验是根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。一般用于同一研究对象分别给予两种中不同处理的效果

14、比较。配对样本是指对同一样本进行两次测试所获得的两组数据,或对两个完全相同的样本在不同条件下进行测试所得的两组数据。两组中的1-27号红葡萄酒以及1-28号白葡萄酒分别为相同的酒样品,由两组不同的10个评酒员对红、白葡萄酒进行品尝后对其分类指标打分,得到葡萄酒的评价结果。由此得到的样本符合配对样本的定义。因此用配对样本t检验进行显著性差异判断。配对t检验要求两样本来自的两个总体应该服从正态分布。检验数据的正态分布性有多种方法:频率分布直方图法、卡法检验法、P-P图(Q-Q图)等。本文利用SPSS统计软件,对样本数据绘制出P-P图,检验其正态分布性。图1 两组红白葡萄酒评分数据正态分布检验由图1

15、可以看出,样本数据的P-P图均近似显示为一条直线,所以可看作服从正态分布,可以用配对样本t检验考查是否有显著性差异。(2)配对样本t检验的基本实现思路假设总体服从正态分布,总体服从正态分布,分别从这两个总体中抽取样本()和(),且两样本相互配对。要求检验和是否有显著差异。第一步,引进一个新的随机变量,对应的样本值为(),其中,这样,检验的问题就转化为单样本t检验问题。即转化为检验Y的均值是否与0有显著差异。第二步,建立零假设 =0第三步,构造t统计量 第四步,SPSS自动计算t值和对应的P值第五步,做出推断:若P值显著水平,则不能拒绝零假设,即认为两总体均值不存在显著差异。其中=0.05。模型

16、的求解(1)红葡萄酒评分的显著性差异检验我们做出如下假设:评酒员对于两组红葡萄酒的评分没有显著性差异评酒员对于两组红葡萄酒的评分有显著性差异图2 成对样本统计量图2表明,第一组和第二组的评分的平均值没有较大差异,第二组的平均分略低于第一组的平均分。图3 成对样本相关系数图3中,第三列“相关系数”是两组红葡萄酒总平均分的简单相关系数,第四列“sig值”是相关系数检验的概率P-值,它表明在显著性水平为0.05时,第一组和第二组总平均分的相关程度较强。图4 成对样本检验图4中,均值是两组红葡萄酒总平均分的平均差异,相差了2.54分;另外还给出了差值样本的标准差,均值的标准误差以及95%置信区间的上下

17、限;t值是进行T检验统计量的观测值;从结果我们可以看出:在显著性水平为0.05时,由于,且可能性低于0.05的事件被称为小概率事件,不予考虑。所以拒绝假设,接受假设,即我们可以认为对于两组红葡萄酒的评分有显著性差异。(2)白葡萄酒评分的显著性差异检验我们同样做出如下假设:评酒员对于两组白葡萄酒的评分没有显著性差异评酒员对于两组白葡萄酒的评分有显著性差异用与红葡萄酒的检验方法一样的处理方法,可以得到:第一组和第二组白葡萄酒的评分的平均值没有较大差异,第二组的平均分略高于第一组的平均分。表明在显著性水平为0.05时,第一组和第二组总平均分没有太大的相关性。图7中,均值是两组红酒总平均分的平均差异,

18、相差了-2.52分;从结果我们可以看出:在显著性水平为0.05时,由于,且可能性低于0.05的事件被称为小概率事件,不予考虑。所以拒绝假设,接受假设,即我们可以认为对于两组白葡萄酒的评分有显著性差异。(3)结论:通过两组配对样本t检验的结果,我们可以得到,两组评酒员的评价结果有显著性差异。4.1.2 模型II:可靠性分析模型由以上分析可知,两组评酒员的评价结果有显著性差异,为了便于后续问题的分析我们需要确定哪一组评酒员的结果更加可信,也即确定两组评比结果的可信度。模型的建立在实际研究中,经常需要借助量表来了解对象的某一特性。有时候没有现成的量表可以采用,需要研究者自己编制量表进行测量。而对于自

19、己编制的量表,就需要对量表的可靠性进行分析。信度是评价结果的前后一致性,也就是评价得分使人们可以信赖的程度有多大。我们将10个评酒员类比为相同的量表,正如一个好的量表,它的结果是可靠的、稳定的。而10个评酒员各有自己的评价尺度和标准,而且是感官分析,这些差异可以类比为量表测量的随机误差,显然所有的评酒员受生理、心理、品评环境的影响越小,结果越稳定越可靠。在这样的类比下,信度分析可以用到我们的样本分析中。我们用评分者信度法来检验量表的等同性,考虑误差的来源是否是评分者之间的差异。评酒员人工评判时,测量误差来源于两方面:评酒员自身和评酒员之间,考察的指标分别是评酒员内信度和评酒员间信度。评分越一致

20、,评酒员的信度越高。当有两个以上评分者对同一测验任务评分时,评分者间信度的计算方法有:肯德尔和谐系数、Cronbach 和多联系相关分析。而如果采用等级评定的方式评价,用肯德尔和谐系数是可取的,当评分者用百分制或其他非等级评定的方式阅卷时,用这些系数不能反应评分者之间的评分绝对差别,在这种情况下,采用Cronbach 信度系数法。Cronbach 信度系数其公式为: 其中,在红白葡萄酒中分别为27个红葡萄酒样品10个评酒员评分结果的平均值,28个白葡萄酒样品10个评酒员的评分结果的平均值, 为第i个酒样品得分的样内方差, 为全部酒样品总得分的方差。我们用SPSS统计软件作信度可靠性分析。(2)

21、模型的求解由SPSS统计软件进行Cronbach 信度系数分析。以第一组红葡萄酒的评价结果表为例,进行说明,其他三个表格的处理相同。首先计算评酒员在酒样品评价中评价结果的均数与标准差。输出的结果文件中第二个表格为评酒员间的两两相关系数矩阵。图5 第一组评酒员评价红酒的两两相关矩阵从中可见,10号评酒员与其他评酒员的相关系数最低。第四部分显示将某一个评酒员剔除的情况下得到的平均得分、方差、每个评酒员评分与剩余各项目得分间的关系、以该项目为自变量所有其他项目为应变量建立回归方程的值以及内部一致性值各是多少。图6 其他统计值从中可见,去除品酒员10后 ,内部的评酒员评价结果的一致性最好,为0.916

22、。在每个项目得分与剩余项目得分间的相关系数中,评酒员2与其他评酒员的相关性最大,评酒员10最低。输出结果的最后一部分为评酒员的一致性检验。图7 第一组10个评酒员评价红葡萄酒的值该信度结果表明=0.912。信度较好。各评酒员的一致性较好。同样的处理方法,可以得到其他三个表的值。图8 第二组10个评酒员评价红葡萄酒的值由图7与图8可以看出,第一组的值较大,评酒员间的差异小,一致性好,因此第一组红葡萄酒的评价结果可信。图9 第一组评酒员评价白葡萄酒的值图10 第二组评酒员评价白葡萄酒的值由图9和图10可以得出,第一组的评酒员评价白葡萄酒的值大,信度高,内部一致性好,因此第一组的评价结果可信。(3)

23、结论:第一组的评价结果更可信。4.2问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级4.2.1模型I:降维模型模型的建立在根据酿酒葡萄的理化指标和葡萄酒的质量给酿酒葡萄分级之前,我们需要对附表2中红葡萄和白葡萄各理化指标进行数据处理,把所有多次测量的数据取平均值,并且只对蓝色的一级指标进行考虑。另外,由于芳香类物质会影响葡萄酒的香气方面的评分质量,我们又把附表3中芳香类物质的和作为另一个变量与附表2的其他变量进行合并。于是我们一共得到了29个变量。首先我们用SPSS软件对29个变量进行相关分析,证明它们有相关性。由于29个变量不是相互独立的,它们之间仍然存在着许多内在联系,有

24、些是显而易见的关系,如氨基酸和蛋白质;而有些则是隐藏在内部的内在联系,这是我们无法简单的判断的。本文将29个酿酒葡萄的理化指标作为因子分析的变量因子,建立指标体系:其中,是29个酿酒葡萄的理化指标,是公共因子,是特殊因子,它与公共因子之间彼此独立。是指标在公共因子上的载荷,因子载荷的统计含义是指标在公共因子上的相关系数,表示与线性相关程度。由因子分析得到的因子能够反映原有指标的大部分信息。但是对于最终的分级给予的标准不够明确。本文用多元线性回归的方法将因子与葡萄酒的质量建立关系,得出最终的分级指标。模型的求解首先对数据进行标准化处理。在SPSS中导入标准化处理后的29个理化指标的数据。通过指标

25、的相关矩阵可以看出变量间有一定的相关关系。通过公因子方差可以看出这些变量可以做因子分析。图11 第一组红葡萄酒旋转成分矩阵由图17列出了第一组红葡萄酒的旋转矩阵。 图12 公共因子碎石图图12所示是公共因子碎石图,它的横坐标为公共因子数,纵坐标为公共因子特征值。可见前面9个公共因子,特征值变化非常明显,以后的特征值变化趋于平稳。因此说明提取9个公共因子可以对原变量的信息描述有显著作用。从前面的旋转矩阵图中也可以看出这个结果。同样的处理方法,白酿酒葡萄的也是29个变量进行因子分析,得到公共因子碎石图。图13 白酿酒葡萄的理化指标的公共因子碎石图由图13可以看出,前面10个公共因子,特征值变化非常

26、明显,以后的特征值变化趋于平稳。因此说明提取10个公共因子可以对原变量的信息描述有显著作用。为了辅助和佐证因子分析,我们将葡萄酒的质量即各种样品葡萄酒作为一个变量加入到总的数据中,并通过控制序号来进行偏相关分析,从分析结果中我们得到了各个变量以及各变量与葡萄酒质量之间的相关性,并将相关性很强的变量进行了合并,结果与因子分析相似。以因子分析后的9个因子为自变量,分别为自变量。葡萄酒质量记为,用SPSS进行多元线性分析得到如下数据。图14 因子与红葡萄酒质量的多元线性系数经过回归拟合后,由于相关性太小,对最终结果的影响也很小,当作微小量舍去,得到最后的拟合关系式:将各系数进行归一化得到各变量所占权

27、重0.303,-0.1814,-0.1756,0.1071,0.1694,0.0636。用同样的处理方法对白酿酒葡萄的理化指标与白葡萄酒的质量进行多元线性回归分析。得到结果为:图15因子与白葡萄酒质量的多元线性系数其中对最终的结果影响很小,舍去不计。最终表达式为:4.2.2模型II:R型聚类模型模型建立聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。层次聚类分析中的R型聚类是对研究对象的观察变量进行分类,它使具有共同特征的变量聚在一起。聚类的主要过程可以分为四个步骤:数据预处理(标准化)构造关系矩阵(亲疏关系的描述)聚类确定最佳分类(类别数)模型求解用SPSS统计软

28、件结合权重进行聚类分析,对酿酒葡萄分了四个等级。图16 聚类分析图16表明全部样本都进入了聚类分析。图17 每个聚类中的案例数图18 27个红酿酒葡萄分等级结果注:红酿酒葡萄共分四个等级,第一等级最差,逐级质量提高,第四等级质量最好。用同样的处理方法对白酿酒葡萄进行聚类分析,得到:图19 白酿酒葡萄分级注:红酿酒葡萄共分四个等级,第一等级最差,逐级质量提高,第四等级质量最好。由图18、图19可以得出:红酿酒葡萄分为四个等级,第一等级质量最差,第四等级质量最好:11号红葡萄为第一等级葡萄,4、7、8、15、18号葡萄为第二等级,1、6、10、12、14、16、21、22、24、25、27号葡萄为

29、第三等级,2、3、5、9、13、17、19、20、23、26号葡萄为第四等级。白酿酒葡萄分为四个等级,与红葡萄类似,第一等级质量最差,第四等级质量最好:1、2、3、6、7、8、9、10、14、16、19、21、22、24号白葡萄为第一等级葡萄,12、13、27号葡萄为第二等级,11、15、23号葡萄为第三等级,4、5、17、18、20、25、26、28号葡萄为第四等级。同时由以上分析可以看出,酿酒葡萄的理化指标与葡萄酒的质量有相关关系,一些理化指标比较好,酿出来的葡萄酒的品质也比较高。4.3问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系 由酿酒葡萄经过发酵后酿成葡萄酒,酿酒葡萄的理化指标经过

30、变化后变为葡萄酒中的理化指标,我们假设,葡萄酒的每一个理化指标都与酿酒葡萄和葡萄酒共有的所有理化指标有线性关系,并且共有指标的变化时由于其他指标的物理化学反应得到。线性关系可以用多元线性回归法来处理。4.3.1多元线性回归模型模型的建立多元线性回归分析是在线性相关条件下,研究两个或两个以上自变量对一个因变量的数量变化关系。多元线性总体回归方程为:系数的表示在其他自变量不变的情况下,自变量变动一个单位时引起的因变量的平均变动单位。其他回归系数的含义类似。由于我们是对样本的参数进行拟合估计,所以我们使用无常数项的多元线性样本回归方程:式中为的估计值。本模型中的自变量为酿酒葡萄中与葡萄酒共有的理化指

31、标,因变量为葡萄酒的理化指标。为因变量的序数。多元线性回归方程中回归系数的估计同样可以采用最小二乘法。有残差平方和。根据微积分中求极小值的原理,可知残差平方和存在极小值。欲使SSE达到最小,对的偏导数必须等于零。将对求偏导数,并令其等于零,加以整理后可得到第个方程式: 通过求解这一方程组便可得到的估计值。另外,在实际求解回归系数的估计值的过程中,由于自变量个数较多,计算十分复杂,也需要测定方程的拟合程度、检验回归方程和回归系数的显著性。模型的求解经过SPSS中的多元线性拟合计算,我们得出了红葡萄酒中的花色苷与红酿酒葡萄各理化指标之间拟合的结果表。如图20到图25。图20描述性统计量(红葡萄酒中

32、花色苷)图20中,第一行为因变量的参数,第二行以下为红酿酒葡萄中10个自变量的参数。包括平均值、方差和个案数为27。图21 相关性(红葡萄酒中花色苷)图21中列出了各个变量之间的相关性及显著性检验结果,从中可以看出红酿酒葡萄中的花色苷与红葡萄酒中的花色苷之间的相关性最大。图22 输入/移去的变量(红葡萄酒中花色苷)图22中输出的是被引入或从回归方程中被剔除的各变量。该图说明变量已全部引入。图23 模型汇总(红葡萄酒中花色苷)图23输出的是常用统计量。从这部分可以看出相关系数,判定系数,调整的判定系数,和越接近1说明回归效果越好。图24 方差分析表(红葡萄酒中花色苷)从图24中可以看出:统计量,

33、F越大说明自变量造成的因变量的变动远远大于随机因素对因变量造成的影响,也就是说明回归的效果越好;相伴概率值。说明多个自变量与红葡萄酒中花色苷存在线性回归关系,即我们先前的假设成立。图25 拟合系数(红葡萄酒中花色苷)符号说明:假设红酿酒葡萄中的自变量依次为:花色苷,dpph,总酚,单宁,总黄酮,白藜芦醇,L,a,b,芳香物质假设红葡萄酒的各理化指标即因变量依次为:从图中可以看出该多远线性回归方程为:。(花色苷,单宁,总酚,酒总黄酮,白藜芦醇,DPPH,L,a,b,芳香物质)则该多元线性回归方程为:上式即为红葡萄酒中花色苷与红酿酒葡萄理化指标之间的联系。同理,根据同样的分析方法,我们可以得到红色

34、葡萄酒中其他的理化指标与红酿酒葡萄之间的关系,以及白葡萄酒中的理化指标与白酿酒葡萄之间的关系。下面我们将给出结果,具体表格将由附录中给出。假设白酿酒葡萄中的自变量依次为:(具体表格见附录)(dpph,总酚,单宁,酒总黄酮,白藜芦醇,L,a,b,芳香物质)另外,假设红葡萄酒的各理化指标即因变量依次为:从图中可以看出该多远线性回归方程为:。(单宁,总酚,酒总黄酮,白藜芦醇,DPPH,L,a,b,芳香物质)则白葡萄酒中的理化指标与白酿酒葡萄之间的关系式为:根据这些等式,我们可以分析出葡萄酒的各参数与酿酒葡萄各参数之间的关系,拿上式来说,它反应白葡萄酒中的芳香类物质质量与红酿酒葡萄各参数的线性关系,从

35、中我们可以看出,在同一单位的情况下,对白葡萄酒芳香类物质质量影响最大的是DPPH值、白藜芦醇含量、A*值、B*值以及总酚值,他们中有些起促进作用,有些起抑制作用;也有一些系数较小的影响量,此处为了精确计算没有略去,在大致估算时可以忽略这些参数简化计算。4.4问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量首先,将自变量数据和因变量数据共同做成一个矩阵,进行因子分析并进行旋转处理。因子分析是将多项指标重新组合成一组新的互相无关的几个综合指标,根据实际需要从中选取尽可能少的指标,已达到尽可能多的反映原指标信息的分析方法。通过SPSS因子分析旋转处理后的结果如下图。图26 旋转后因子与原指标的相关系数矩阵从上图可以看出,经过整合,原自变量的个数由17个变成了5个,且每个因子与哪些自变量接近也已经在上图中反应出,接下来我们将应用因子进行下一步的计算。接下来,我们使用多元线性回归分析将感官得分作为因变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论