高教社杯全国大学生数学建模竞赛A题 葡萄酒的评价_第1页
高教社杯全国大学生数学建模竞赛A题 葡萄酒的评价_第2页
高教社杯全国大学生数学建模竞赛A题 葡萄酒的评价_第3页
高教社杯全国大学生数学建模竞赛A题 葡萄酒的评价_第4页
高教社杯全国大学生数学建模竞赛A题 葡萄酒的评价_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2012高教社杯全国大学生数学建模竞赛葡萄酒的评价摘要本文以概率论与数理统计的相关知识为理论基础,综合运用正态分布和分级的原理,利用统计分析数据,研究了葡萄酒的评价指标体系,针对葡萄酒的质量评价问题,建立合理的数学模型用以评价。问题一:本问题的葡萄酒质量评价指标(即外观分析中的澄清度、色调,香气分析中的纯正度、浓度、质量,口感分析中的纯正度、浓度、持久度,平衡/整体分析),先对指标归类按顺序,统计并整理出相关的数据,再利用正态分布的思想,假设并验证质量评价指标为正态分布并进行差异性分析,对比找出附件1中两组评酒员的显著差异为:两组评酒员对红葡萄酒的评价结果有显著性差异的是外观分析中的色调、香气分析中的浓度,其他的无显著性差异;两组评酒员对白葡萄酒的评价结果有显著性差异的是口感分析中的纯正度、浓度,持久性、质量和平衡/整体评价,其他的无显著性差异。(2)本问题要求分析附件1中哪组指标更可信,这就要在问题(1)基础上分析两组指标的可信性,建立可信性分析模型,利用matlab软件编程计算得(程序见附件4):=0.0735,=0.0398。可见,因此第二组可信性高。问题二:此问题我们的总体思路是这样的:先根据样品葡萄酒的得分高低对葡萄酒进行分级,并且假设葡萄酒得分越高,那么酿酒葡萄就越好,等级就越高,于是我们利用一些分类模型就可以得到相应酿酒葡萄的级别差。根据这条思路,我们建立如下一些模型来讨论(见表6、7、8)。为了充分利用文中的数据,我们把第一组第二组葡萄酒品尝得分合并,这样就得到了一个更大的样本,对结论会更有说服力。为了能比较客观的对葡萄酒分划分合理的等级,我们需要一种能从总体上正确的反应葡萄酒的评分,这里我们利用已经单位化的综合了所有指标的葡萄酒品尝评分的所得分评价,它们的得分范围理论上包含在区间上,实际计算红葡萄的单位化归一化后的评分。下文图10为对酿酒葡萄进行的分级,关键词:正态分布评价指标体系问题重述本问题针对评酒员对葡萄酒品评的问题,要求根据葡萄酒评价指标来统计分析,以便更好的了解葡萄酒的质量。影响评酒员对葡萄酒的评价因素主要有外观分析中的澄清度、色调,香气分析中的纯正度、浓度、质量,口感分析中的纯正度、浓度、持久性、质量、整体评价等。已知葡萄酒的质量,主要与酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标也会在一定程度上反映葡萄酒和葡萄的质量,要求对如下四问进行解答:问题一要求设计出合理的评价葡萄酒模型优劣的指标体系,用以比较附件1中两组评酒员的评价结果有无显著差异,并判断哪一组的结果更可靠;问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,最后用第一问所给出的评价体系对该模型进行评价;问题三要求分析酿酒葡萄与葡萄酒的理化指标之间的联系,就要分析两者的相关性,从而进行判断;问题四要求分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?模型假设1、假设调查结果是可用的;=7、本文中的葡萄酒仅与酿酒葡萄有关,不考虑外界因素(比如温度、气候、病毒细菌等)和生产工艺带来的影响,并且假设除了酿酒葡萄本身外,其他一切条件一致;符号说明:表示第一组号品酒员对样品的打分,;:表示第二组号品酒员对样品的打分,;:表示等级中第个葡萄酒的理化指标平均值,;:表示等级中第个葡萄酒的理化指标平均值,;:表示等级中第个葡萄酒的理化指标平均值,;:表示等级中第个葡萄酒的理化指标平均值,;:外观分析指标;:外观分析指标下的澄清度指标;:外观分析指标下的色调指标;:香气分析指标;:香气分析指标下的纯正度指标;:香气分析指标下的浓度指标;:香气分析指标下的质量指标;:口感分析指标;:口感分:单位化后的香气分析指标;:单位化后的香气分析指标下的纯正度指标;:单位化后的香气分析指标下的浓度指标;:单位化后的香气分析指标下的质量指标;:单位化后的口感分析指标;:单位化后的口感分析指标下的纯正度指标;:单位化后的口感分析指标下的浓度指标;:单位化后的口感分析指标下的持久性指标;:单位化后的口感分析指标下的质量指标;:单位化后的平衡/整体评价指标;:表示随机变量的期望;:表示随机变量的方差;问题分析问题一:针对此问题,我们首先利用统计分析的知识对附件1中所给的数据按照样品的指标分类排序;然后按指标(即外观分析中的澄清度、色调,香气分析中的纯正度、浓度、质量,口感分析中的纯正度、浓度、持久度,平衡/整体分析)提炼出相应数据;然后对整理出来的数据进行分析,研究这些数据是属于什么分布形式;最后,根据概率论与数理统计相关知识,我们知道正态分布随机变量广泛的存在于客观世界中,当人们研究相应问题时,往往先考察它是否服从正态分布,这里我们也假设附件的数据服从正态分布,此题我们利用偏度、峰度检验,看我们给的假设是否合理,再进行可信性分析。从表1的结果来看,均有,因此,我们先前的假设是成立的,即样品的数据服从正态分布。我们以来评价可信性,结果表明=0.0735,=0.0398。可见,因此第二组可信性高。问题二:此问题是要我们根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,这里我们的总体思路是这样的:先根据样品葡萄酒的得分高低对葡萄酒进行分级,并且假设葡萄酒得分越高,那么酿酒葡萄就越好,等级就越高,于是我们利用一些分类模型就可以得到相应酿酒葡萄的级别。根据这条思路,我们建立如下一些模型来讨论。为了充分利用文中的数据,我们把第一组第二组葡萄酒品尝得分合并,这样就得到了一个更大的样本,对结论会更有说服力。为了能比较客观的对葡萄酒分划分合理的等级,我们需要一种能从总体上正确的反应葡萄酒的评分,这里我们利用已经单位化的综合了所有指标的葡萄酒品尝评分的所得分评价,它们的得分范围理论上包含在区间上,实际计算红葡萄的单位化归一化后的评分。葡萄酒的理化指标的问题三:问题四:模型建立与求解1.数学建模前的准备我们在针对问题1、2、3、4建模之前,先对已有的数据进行统计分析,首先,对附件1中所给的数据按样品序号排序,然后按所给的指标(即外观分析中的澄清度、色调,香气分析中的纯正度、浓度、质量,口感分析中的纯正度、浓度、持久度,平衡/整体分析)提炼出相应指标下的数据,对异常数据进行相应处理;并根据整理出来的数据进行分析(从新整理后的数据见附件1),研究这些数据是属于什么分布;最后,根据概率论与数理统计相关知识,我们知道正态分布随机变量广泛的存在于客观世界,当人们研究相应问题时,往往先考察它是否服从正态分布,这里我们也假设附件的数据服从正态分布,下面我们利用偏度、峰度检验,看我们给的假设是否合理。 2.正态分布的偏度、峰度检验首先,我们引用文献[1][2]中概念的给出具体的符合本文的随机变量的偏度和峰度的定义:随机变量的偏度:定义为随机变量的标准化变量的三阶中心矩;随机变量的峰度:定义为随机变量的标准化变量的四阶中心矩;其中,为随机变量的期望,为随机变量的方差。根据上面的定义,我们得到,(1).(2)当随机变量服从正太分布时,有,。设是来自总体的样本,则偏度和峰度的样本偏度和峰度分别是,.(3)其中是样本的阶中心矩,且有以下关系式,,,.若随机变量服从正态分布,则近似有不服从正态分布,取显著性水平为,的拒绝域化为或(4)其中,由确定。根据上面的模型,用matlab数学软件编程(程序见附件2),容易计算出外观分析中的澄清度、色调,香气分析中的纯正度、浓度、质量,口感分析中的纯正度、浓度、持久度,平衡/整体分析,各个的拒绝域。这里我们取,查正态分布表得;葡萄酒各个指标计算结果如下:表1红葡萄酒第一组红葡萄酒第二组白葡萄酒第一组白葡萄酒第二组澄清度=1.8756e-004=9.7833e-004=5.1680e-004=8.1276e-005=7.4664e-004=1.2744e-004色调=1.7380e-004=3.1364e-004=3.8855e-004=7.2923e-005=1.6260e-005=3.5570e-005=3.5317e-005=8.7971e-006纯正度=5.2219e-004=1.1271e-004=9.4290e-004=1.8824e-004=8.8531e-005;=8.8531e-005=1.0035e-004=2.4785e-005浓度=2.7649e-004=2.1289e-004=2.3662e-004=2.0587e-004=1.7962e-005=1.7156e-005=1.3004e-005=1.0809e-005质量=8.8857e-006=5.1263e-007=8.9274e-006=2.6072e-006=3.1439e-007=1.4507e-007=2.0037e-007=9.1347e-008纯正口感=1.9571e-004=1.0293e-004=4.3495e-004=2.0293e-004平衡分析=2.8871e-007=1.4245e-006=.4157e-006=1.9355e-007=1.8337e-007=6.6531e-008=1.9355e-007=7.4333e-008从表1的结果来看,均有,因此,我们先前的假设是成立的,即所取样本服从正太分布,图1,是用matlab数学软件做出的红葡萄酒第一、二组数据外观分析中的澄清度直方图,该图从直观上面说明了样本服从正态分布。图1:红葡萄酒第一、二组数据外观分析中的澄清度直方图问题一1.基于单指标的均值差显著性分析模型我们知道,不同的指标是不能进行比较的,因为他们的单位不一样,另外很容易根据品酒员按指标的评分而划分出各个指标,即外观分析中的澄清度、色调,香气分析中的纯正度、浓度、质量,口感分析中的纯正度、浓度、持久度,平衡/整体分析,根据如上假设,我们建立基于检验的显著性分析模型,模型建立如下:设来自正太总体的样本,来自正太总体的样本,记样本均值为,,样本方差为,,现在检验模型为:,(5)取显著性水平,并使用统计量作为检验统计量:,(6)其中.于是得到拒绝域,(7)其中,.根据(7)式我们可以各个独立的指标是否具有显著性。利用matlab软件编程(程序见附件3),计算结果如下:红葡萄酒:表2红葡萄酒的指标显著性检验值外观分析澄清度0.4675色调2.4239香气分析纯正度1.0403浓度2.0000质量1.2577口感分析纯正度0.5908浓度0.5908持久性1.3341质量0.9110平衡/整体评价0.3125白葡萄酒:表3白葡萄酒的指标显著性检验值外观分析澄清度0.9842色调0.4568香气分析纯正度0.9896浓度0.0941质量0.5380口感分析纯正度5.0046浓度2.0221持久性3.3180质量4.3924平衡/整体评价指标3.3484

取,查分布表估计1.6460,1.6448,其中,1.6460是两组评酒员对红葡萄酒的评价结果显著性差异的临界值,1.6448是两组评酒员对白葡萄酒的评价结果显著性差异的临界值。对比知:两组评酒员对红葡萄酒的评价结果有显著性差异的是外观分析中的色调、香气分析中的浓度,其他的无显著性差异;两组评酒员对白葡萄酒的评价结果有显著性差异的是口感分析中的纯正度、浓度,持久性、质量和平衡/整体评价,其他的无显著性差异。2.整体均值差的显著性分析以上我们只是对各个单独的指标进行显著性分析,下面我们综合各个指标,进行整体的显著性分析。首先我们对各个指标进行单位化并同时归一化处理,以消除不同单位的影响,单个样品葡萄酒品尝评分的单位化如下:,(8),(9)这里是我们得到的最终单个样品葡萄酒品尝评分的单位化得分,我们将所有的样品都进行这样的单位化,于是就得到了经过变换后无单位的随机样品的评分,记为,和,其余分析与单指标下的均值显著性分析一致,这里我们不再重复,沿用上面模型的记号就得了整体均值差显著性分析模型,模型同上。对本模型的计算:取,查分布表估计1.6460,1.6448。根据建模思路,利用matlab软件编程计算得(程序见附件4):红葡萄酒所以指标综合的的样本观察值=1.5986<1.6460;白葡萄酒所以指标综合的的样本观察值=2.0824>1.6448;由计算结果知,第一、二组两组评酒员对红葡萄酒的评价结果无显著性差异,而对白葡萄酒的评价结果存在显著性差异。3.可信性分析模型记样品葡萄酒品酒评分经过单位化后的得分为,其中(11)并记,,(12)(13)那么,于是可用来评价可信性,评价标准为:如果,那么第一组可信性高;如果,两组可信性一样;如果,第二组可信性高。模型计算:利用matlab软件编程计算得(程序见附件4):=0.0735,=0.0398。可见,因此第二组可信性高。4.两个正太总体方差的检验在两个正太总体均值差的检验中,假设2:两组评酒员的评分服从正太总体的方差相同;有可能不合理,因此还有进行方差显著性检验。设来自正太总体的样本,来自正太总体的样本,现在检验问题为:,取显著性水平,根据概率论与数理统计知拒绝域为5.整体方差的显著性分析模型利用单位化后的指标可以得到整体方差的显著性分析模型,模型同上。问题二:1.葡萄酒分类模型第二问是要我们根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,这里我们的总体思路是这样的:先根据样品葡萄酒的得分高低对葡萄酒进行分级,并且假设葡萄酒得分越高所以得酿酒葡萄就越好,于是利用一些分类模型我们就可以得到相应酿酒葡萄的级别。根据这条思路,我们建立如下一些模型:为了充分利用文中的数据,我们把第一组第二组葡萄酒品尝得分合并,这样就得到了一个更大的样本,对结论会更有说服力。为了能比较客观的对葡萄酒分划分合理的等级,我们需要一种能从总体上正确的反应葡萄酒的评分,这里我们利用已经单位化的综合了所有指标的葡萄酒品尝评分的所得分评价,它们的得分范围理论上包含在区间上,实际计算红葡萄的单位化归一化后的评分为:表4:第一组红葡萄酒酒样品综合评分酒样品123456789评分0.6270.8030.8040.6860.7330.7220.7150.7230.815酒样品101112131415161718评分0.7420.7010.5390.7460.730.5870.7490.7930.601酒样品192021222324252627评分0.7860.7920.7710.7720.8560.780.6920.7380.73表5:第二组红葡萄酒酒样品综合评分酒样品123456789评分0.6810.740.7460.7120.7210.6630.6530.660.782从以上数据可以看出,各个样品的得分分布比较集中,其中最大值为=0.8560,最小值为=0.5390,根据这些特征我们可以对葡萄酒的评价划分如下:差:;中:;良:;优:;其中,,这样我们就建立了针对红葡萄酒的等级划分模型。我们利用该模型对第一二组红葡萄酒酒样品分类可得:归为类的有(表6):第一组红葡萄酒酒样品1215第二组红葡萄酒酒样品归为类的有(表7):第一组红葡萄酒酒样品141825第二组红葡萄酒酒样品16781011121315161825归为类的有(表8):第一组红葡萄酒酒样品56781011131416第二组红葡萄酒酒样品212223242627归为类的有(表9):第一组红葡萄酒酒样品23923第二组红葡萄酒酒样品表中的空白表示没有数据。2.带权系数的欧氏距离分类模型现在我们来建立酿酒葡萄的等级模型,记:表示等级中第个葡萄酒的理化指标平均值,;:表示等级中第个葡萄酒的理化指标平均值,;:表示等级中第个葡萄酒的理化指标平均值,;:表示等级中第个葡萄酒的理化指标平均值,;利用已分级好的葡萄酒,分别计算各个等级中葡萄酒的理化指标的平均值,计算方式为:把所有归为同一等级的葡萄酒的第个理化指标求和,然后除以总个数,得到的即为平均值,注意,附录中只有一组的酒样品,而我们的酒样品分类模型中用到了第一二组的酒样品,因此,可以这样来做,某类中同时出现了同一数字就按两次计算。这样我们得到了各个等级中葡萄酒的各个理化指标的平均值,,,。在带权系数的欧氏距离分类模型中,我们将每一个样本看成维空间的一个点,以他们到不同集合几何中心的加权的欧氏距离作为判断依据,具体步骤:第一步:对酿酒葡萄同一理化指标下包含多组数据的进行求平均值处理,并对空格添加零。第二步:由于葡萄酒和酿酒葡萄相同的指标量纲不一样,我们先要消除量纲,为此进行归一化处理:对酿酒葡萄的归一化处理:,(16)这里:表示样品酿酒葡萄的理化指标平均值。第三步:对有一级指标和二级指标之分的进行进行加权处理,这里我们令具有一级指标特性的权系数为1,具有二级指标的权系数为,并记指标的权系数为,(17)第四步:计算样品酿酒葡萄到级数的加权欧式距离,按距离最近准则归类,即(18)具有唯一最小值时,样品酿酒葡萄就可以归类,当出现多个相同最小值时还需进一步判断。模型计算:根据上面模型描述的步骤,用matlab软件编程(程序见附件5)计算得:红葡萄样品距各中心点的带权欧式距离(表10):葡萄样品D(F,A)D(F,B)D(F,C)D(F,D)min等级10.19970.17870.18530.19460.1787B20.1620.1440.10540.14730.1054C30.09150.07850.08990.12640.0785B40.9370.94240.94110.95310.937A50.11140.10990.10870.16730.1087C60.38050.37660.38940.4030.3766B70.0780.10030.14430.20210.078

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论