版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2012高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,
2、在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号)
3、:多元统计分析在葡萄酒评价中的应用摘要本文在葡萄酒评价中针对多组指标的多组数据,在数据处理上应用了标准化处理、主成分分析等多重方法,应用方差分析、聚类分析、回归模型中的趋势面分析等多种多元统计的方法对葡萄酒进行评价。针对问题一,其要求是对两组评酒员的评价结果有无显著性差异进行分析,并判断哪一组的结果更可信。本文建立了单因素方差分析模型,经过求解,假设与检验,得到的结果是这两组评酒员的评价结果无显著性差异,然后又经过比较两组评酒员所打分数的平均值与方差,由于第二组的方差比第一组小,因此第二组的评价更可信。 针对问题二,首先用葡萄酒中的芳香物质来定量分析葡萄酒的质量,对数据进行无量纲化以及主成分分
4、析法进行处理,然后对每一个酿酒葡萄及葡萄酒样本进行相对性的综合评分,最后用着两组数据进行二维的聚类分析。我们的结论是酿酒红葡萄分为四类:酿酒白葡萄分为两类。针对问题三,对于分析酿酒葡萄与葡萄酒的理化指标之间的联系这一问题,本文通过分析酿酒葡萄与葡萄酒之间相对应的理化指标,并通过分析它们之间的协方差和相关系数确定出了酿酒葡萄与葡萄酒的理化指标之间的相关关系。 针对问题四,我们利用问题二中的算出的数据,以及问题而知那个的方法对葡萄酒相应于其理化指标的综合得分,然后用酿酒葡萄相应于其理化指标的得分以及葡萄酒质量相应于所含芳香物质的得分,以及葡萄酒相应于其理化指标的得分这三组数据进行趋势面分析得到了拟
5、和的曲面图以及酿酒红葡萄和红葡萄酒的理化指标对红葡萄酒质量的影响函数关系式,最后用检验法得出红的拟合度达99.84%,白的拟合度达83.92%,综合红酒和白酒的检验结果可以认为能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:单因素方差分析,主成分分析,聚类分析,相关性分析,趋势面分析1一 、问题重述葡萄酒的质量一般是经过一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。而酿酒葡萄的好坏所酿葡萄酒的质量与酿酒葡萄的好坏有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些
6、葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。需要建立数学模型讨论以下问题:1. 根据附件1中所给数据,对两组评酒员的评价结果有无显著性差异进行分析,并判断哪一组的结果更可信。2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、 问题分析 对于问题一,其要求是对两组评酒员的评价结果有无显著性差异进行分析,并判断哪一组的结果更可信。对问题二,通过分析影响葡萄酒质量的因素,从而定量的分析葡萄酒
7、质量。再对数据进行处理,然后定量的分析酿酒葡萄的理化指标,最后通过聚类分析对酿酒葡萄进行分类。 对问题三,首先利用问题二中的数据,对葡萄酒及酿酒葡萄对应的理化指标进行相关性分析后得出结论。 对于问题四,可以通过问题二中的数据以及方法得出三组数据,用趋势面分析对其进行拟合,得出函数关系后对它的拟合度进行检验。三 、模型假设 所给数据真实可靠; 评酒员所打分数服从正态分布; 各样本的观测值具有随机性; 各样本之间相互独立;5. 假设二级指标分析结果影响忽略不计;四 、符号说明符号说明第个主成分的特征值指标数量葡萄的质量酿酒葡萄的理化指标葡萄酒理化指标五、 模型的建立与求解问题一模型一: 单因素方差
8、分析模型对于分析两组评酒员的评价结果有无显著性差异这一问题,因为两组评酒员在评分上有差异,分别计算红、白中每一个品酒员对所有样品打分的平均值作为影响因素,并且设各正态总体具有相同的方差。令,为第个评酒员对应组的评分服从的正态总体的平均分。称为随机误差,则且相互独立。称为总平均,为水平的效应,反应了因素A的第个水平对的影响的大小,且满足。这时,单因素方差分析模型为: 因素效应的显著性检验单因素方差分析的主要目的之一就是根据观测数据推断因素A对因变量Y的影响是否显著,换句话说,就是除去随机因素的干扰在因素A的各水平下,Y的取值是否有显著差异。取显著性水平。需要检验假设将附件1中所给数据进行处理之后
9、,用Excell辅助求解,(在输入表格计算之前所有的均减去)评价组第一组(红)第二组(红)评酒员1-2.85185-0.62963-3.4814812.120718.1330590.3964338.52949223.111111-2.222220.8888890.7901239.6790124.93827214.6172831.4074074.7037046.11111137.345681.98079622.1248324.105624-6.11111-6.11111-12.2222149.382737.3456837.3456874.6913652.777778-7.74074-4.9629
10、624.6317.71604959.9190767.6351261.2962960.6666671.9629633.8532241.6803840.4444442.1248297-0.148150-0.148150.02194800.02194800.02194880.7407410.8148151.5555562.4197530.5486970.6639231.2126297.185185-1.851855.33333328.44444051.626893.42935555.05624103.148148-2.481480.6666670.44444409.9108376.1577516.0
11、6859总和-4.2963259.454264.0631 表1评价组第一组(白)第二组(白)评酒员11.0128571.0385712.0514294.2083591.025881.0786312.1045120.7528571.0271431.783.16840.5667941.0550221.62181631.1085711.0433332.1519054.6306941.2289311.0885442.31747540.8547621.0442861.8990483.6063820.7306181.0905331.82115151.011.0166672.0266674.1073781.
12、02011.0336112.05371160.9642861.0904762.0547624.2220460.9298471.1891382.11898571.0847621.0685712.1533334.6368441.1767081.1418452.31855380.9376190.841.7776193.1599290.8791290.70561.58472991.0766670.9909522.0676194.2750491.1592110.9819872.141198101.0552381.0442862.0995244.4081.1135271.0905332.20406总和20
13、.061940.4230820.28619 表2下面利用上述表中相应的数据计算平方和、自由度、均方、F值,相应,模型如下:分别代入数据求解,得到下面的方差分析表:红葡萄酒方差来源平方和自由度均方F值临界值显著性因素A128.80914.311.0653.02低误差134.341013.434总和263.1419 表3白葡萄酒方差来源平方和自由度均方F值临界值显著性因素A0.087590.00971.30303.02低误差0.0747100.0075总和0.162219 表4根据模型的结果有,F值均小于临界值,因此接受假设,即这两组评酒员的评价结果无显著差异。又两组评酒员所打分数的平均值及方差分
14、别为:红葡萄酒第一组第二组平均值73.0555670.51481方差13.0557112.59578 表5白葡萄酒第一组第二组平均值73.9321476.53214方差70.9250126.68692 表6综合两组评酒员所打分数的平均值及方差,因为第二组的方差更小,也就是该组专家的意见相对更一致,所以说第二组评酒员的结果更可信。问题二模型二:本问题中涉及了葡萄酒的质量,我们通过查阅相关文献(7)得到芳香物质对葡萄酒的质量有重要的影响,所以用葡萄酒中的芳香物质来定量的分析葡萄酒的质量。对于酿酒葡萄的理化指标,因为它分为一级、二级指标,而且很多。它的指标都是检测了三次,所以我们对其求平均值作为指标
15、的数值。而二级指标中出了H、C两个二级指标外其余的每一类二级指标的和都等于所对应的一级指标值,所以我们不考虑二级指标(除H、C)。首先我们对所有的数值用标准化变换进行无量纲化处理,由于葡萄酒中的芳香物质及酿酒葡萄中的理化指标很多,就需要把这些很复杂的数据集简化,所以应用主成分分析法在DPS软件中分别对他们进行主成分分析,找出几个综合因子来代表原来众多的变量。主成分分析的具体结果(见附件1):分析结果出来后,一般建议是取当特征值累积贡献率达80%,或者特征值大于1时的主成分个数。我们根据特征值大于1时的主成分个数对葡萄酒中的芳香物质及酿酒葡萄中的理化指标取的主成分如下:酿酒葡萄的理化指标主成分:
16、红葡萄理化指标主成分特征值百分率%累计百分率%氨基酸总量7.463623.323923.3239蛋白质mg/100g5.308116.587739.9116VC含量(mg/L)4.543514.198354.1099花色苷mg/100g鲜重2.84288.883762.9936酒石酸(g/L)2.01166.286369.2799苹果酸(g/L)1.86475.827275.1072柠檬酸(g/L)1.50944.716879.824多酚氧化酶活力1.30824.088283.9122 表7白葡萄理化指标主成分特征值百分率%累计百分率%氨基酸总量6.7721.156421.1564蛋白质mg/
17、100g4.985115.578436.7348VC含量(mg/L)3.768711.777348.5121花色苷mg/l00g2.24667.020555.5326酒石酸2.08716.522162.0548苹果酸1.68125.253867.3086柠檬酸1.51734.741472.05多酚氧化酶活力1.37424.294476.3444褐变度1.17943.685780.0301DPPH自由基1/IC50(g/L)1.06063.314483.3446 表8葡萄酒中芳香物质主成分:红酒芳香物质主成分特征值百分率%累计百分率%乙醛15.453221.168821.1688乙酸乙酯10.2
18、88914.094335.2632乙醇8.363711.457146.7202丙酸乙酯6.58889.025755.746乙酸正丙酯5.92238.112763.8587乙酸-2-甲基丙基酯4.73256.482970.3416丁酸乙酯3.26544.473174.81471-丙醇2.94894.039778.85432,3-乙酰基丙酮2.3933.278182.1324正十一烷2.15372.950385.08282-甲基-1-丙醇1.60512.198887.28153-甲基-1-丁醇-乙酸酯1.50792.065689.3471乙酸戊酯1.26081.727191.0743柠檬烯1.08
19、491.486292.5605 表9白酒芳香物质主成分特征值百分率%累计百分率%乙醛17.837624.435124.4351乙酸乙酯8.17811.202735.6379乙醇7.571910.372446.0103丙酸乙酯6.52748.941654.9519乙酸正丙酯4.42496.061561.0134乙酸-2-甲基丙基酯3.61334.949765.9631丁酸乙酯3.28964.506370.46941-丙醇2.92424.005774.4751正十一烷2.59253.551378.02642-甲基-1-丙醇2.36323.237281.26363-甲基-1-丁醇-乙酸酯2.0835
20、2.854184.1177乙酸戊酯1.7432.387786.5054柠檬烯1.52952.095288.60063-甲基-1-丁醇1.40121.919590.5201己酸乙酯1.1661.597392.1174苯乙烯1.12951.547393.6647 表10在主成分分析结果出来后,我们将前个特征值较大的主成分,按照公式: 计算个主成分的“综合值”,每一个酿酒葡萄及葡萄酒样本都对应一个“综合值”,而这个“综合值”充分利用了所有的信息,所这个“综合值”就能用来作为每一个酿酒葡萄及葡萄酒样本相对性的综合得分。具体每一个酿酒葡萄及葡萄酒样本得分(见附件2):表中酿酒葡萄的得分是依赖于它的理化指
21、标,这个得分就能相应的定量反映出理化指标的信息;同样葡萄酒的得分是依赖于它的芳香物质,而芳香物质决定了葡萄酒的质量,所以这个得分就能定量的反映出葡萄酒质量的信息。因此用每个酿酒葡萄样本的综合得分和葡萄酒的质量的综合得分分为两组变量,对这两组变量进行二维的聚类(在DPS中实现),分析得出红葡萄和白葡萄的聚类结果图如下:图1(红葡萄)图2(白葡萄)最后根据聚类结果图可以对红、白葡萄进行如下分级:分类样品第一类红葡萄样品1第二类红葡萄样品27第三类红葡萄样品2,21,3,9,8,第四类红葡萄样品4,24,10,5,16,11,22,19,7,14,13,15,17,20,25,26,6,23,12,
22、18,表11(红葡萄)分类样品第一类白葡萄样品1,6,26,7,24,11,12,15,13,17,2,14,18第二类白葡萄样品19,27,25,4,16,10,8,22,5,23,9,20,3,21,28表12(白葡萄)问题三模型三:对于分析酿酒葡萄与葡萄酒的理化指标之间的联系这一问题,我们观察附件3所给数据,选择了花色苷、单宁、总酚、酒(葡萄)总黄酮、白藜芦醇、DPPH半抑制体积、色泽(L*(D65、a*(D65)、b*(D65)、H(D65)、C(D65)这些对应的理化指标为研究对象,建立了下述两个简单的模型,分别用协方差及相关系数对酿酒葡萄与葡萄酒的理化指标之间的联系进行了简单分析。
23、协方差:其定义为,其中是期望值。从协方差的定义可以看出,它是的偏差与的偏差乘积的数学期望。由于偏差可正可负,也可为零,其具体表现如下:当时,称与正相关,这时两个偏差与同时增加或同时减少。由于与都是常数,故等价于与同时增加或同时减少,这是正相关的含义;当时,称与负相关,这时增加而减少,或增加而减少,这是负相关的含义;当时,称与不相关。相关系数:其定义为,其中刻画的是变量之间的线性关系,具体如下:当时,称与不相关,指与之间没有线性关系,但可能有其它函数关系;当时,称与完全正相关;当时,称与完全负相关;当时,称与有“一定程度”的线性关系;越接近1,则线性相关程度越高;越接近于0,则线性相关程度越低。
24、特别地,当时,认为两个变量有很强的线性相关性。用协方差建立的模型:,其中是期望值,是相应理化指标值的平均值。用Excell辅助求解,结果如下:红协方差联系相关系数联系花色苷mg/100g鲜重0.8846正相关0.9226正相关(强)单宁(mmol/L)0.6914正相关0.718正相关总酚(mmol/L)0.8427正相关0.8751正相关(强)(葡萄)酒总黄酮(mmol/L)0.7924正相关0.8228正相关(强)白藜芦醇(mg/L)0.013正相关0.1351正相关DPPH半抑制体积(IV50) 1/IV50(uL)0.7494正相关0.7783正相关色泽L*(D65)0.4754正相关
25、0.4937正相关a*(D65)-0.522负相关-0.542负相关b*(D65)0.0244正相关0.0254正相关H(D65)-0.275负相关-0.285负相关C(D65)-0.468负相关-0.456负相关表13白协方差联系相关系数联系单宁(mmol/L)0.55333正相关0.573825正相关总酚(mmol/L)0.527225正相关0.546757正相关(葡萄)酒总黄酮(mmol/L)0.671808正相关0.696689正相关白藜芦醇(mg/L)-0.2052负相关-0.2128负相关DPPH半抑制体积(IV50) 1/IV50(uL)0.372512正相关0.386309正相
26、关色泽L*(D65)-0.13536负相关-0.14037负相关a*(D65)-0.02888负相关-0.02995负相关b*(D65)0.268985正相关0.278946正相关H(D65)0.280558正相关0.290948正相关C(D65)0.483919正相关0.501848正相关 表14结果分析: 对红葡萄和红葡萄酒而言,根据协方差的结果来看,红葡萄酒与红葡萄中的花色苷、单宁、总酚、酒(葡萄)总黄酮、白藜芦醇、DPPH半抑制体积、色泽(L*(D65) 、 b*(D65))都呈正相关,即其相应含量同时增加或同时减少,而色泽(L*(D65、a*(D65)、H(D65)、C(D65)则呈
27、负相关,即相应的葡萄酒中的含量随着葡萄中的增加而减少;又根据相关系数的结果来看,同样,红葡萄酒与红葡萄中的单宁、总酚、酒(葡萄)总黄酮、DPPH半抑制体积、色泽(L*(D65 、 b*(D65),H(D65)、C(D65))都呈正相关,即其相应含量同时增加或同时减少,而色泽(L*(D65、a*(D65)、H(D65)、C(D65)则呈负相关,特别地,红葡萄酒与红葡萄中的花色苷、总酚、酒(葡萄)总黄酮都具有很强的线性关系。 对白葡萄和白葡萄酒而言,根据协方差的结果来看,白葡萄酒与白葡萄中的单宁、总酚、酒(葡萄)总黄酮、白藜芦醇、DPPH半抑制体积、色泽(L*(D65) 、 b*(D65))都呈正
28、相关,即其相应含量同时增加或同时减少,而白藜芦醇(mg/L) 、色泽(L*(D65、a*(D65)则呈负相关,即相应的葡萄酒中的含量随着葡萄中的增加而减少;又根据相关系数的结果来看,同样,白葡萄酒与白葡萄中的单宁、总酚、酒(葡萄)总黄酮、白藜芦醇、DPPH半抑制体积、色泽(L*(D65) 、 b*(D65))都呈正相关,即其相应含量同时增加或同时减少,而白藜芦醇、色泽(L*(D65、a*(D65)则呈负相关。问题四模型四:针对问题四,我们充分利用模型二中的方法应用DPS数据处理软件得出葡萄酒中理化指标的主成分分析结果(见附件1),主成分如下:红葡萄酒理化指标主成分特征值百分率%累计百分率%花色
29、苷(mg/L)5.450349.548349.5483单宁(mmol/L)2.456622.332771.881总酚(mmol/L)1.695315.411987.2929 表15白葡萄酒理化指标主成分特征值百分率%累计百分率%单宁(mmol/L)3.508135.080635.0806总酚(mmol/L)3.001730.017565.0981酒总黄酮(mmol/L)1.199311.993177.0912 表16再利用模型二中的综合打分法得到红、白葡萄酒每个样本的具体得分(见附件2)。这个得分能定量的反映出其理化指标的信息,也就能用来分析每个葡萄酒样本的理化指标。再利用模型二中的酿酒葡萄相应于其理化指标的得分以及葡萄酒质量相应于所含芳香物质的得分,以及葡萄酒相应于其理化指标的得分。把这三组数据分为(葡萄酒质量相应于所含芳香物质的各个样品得分)、(酿酒葡萄相应于其理化指标的各个样品得分)、(葡萄酒相应于其理化指标的各个样品得分),用回归分析中的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 资金支持合同
- 车辆借用合同范本示例
- 技术咨询服务协议书
- 创意垃圾桶购销合同
- 装修合同补充协议
- 生肉供应商合同
- 房产中介购房合同
- 药品购销合同的合同仲裁裁决执行
- 煤矿环境保护合作协议合同协议
- 鸡产品安全检测合同
- 智能工厂梯度培育要素条件
- 2024年人事科工作总结(五篇)
- 小班小主持课件
- 黑龙江省哈尔滨市2022-2023学年七年级上学期期末数学试题(含答案)
- 山东省青岛市2023-2024学年高一上学期1月期末物理试题 含解析
- 律师强制执行协议书模板
- 教学计划(教学计划)-2024-2025 学年六年级上册科学教科版
- 《积极心理学(第3版)》 课件 篇终 积极心理学的应用与展望
- 2024应急管理部国家自然灾害防治研究院公开招聘34人(高频重点复习提升训练)共500题附带答案详解
- 八年级英语上册 Unit 4 Whats the best movie theater(第1课时)说课稿
- 2023年山东省济南市章丘市枣园街道社区工作者招聘笔试题及答案
评论
0/150
提交评论