数学建模基于数理分析的酿酒葡萄及葡萄酒评价模型_第1页
数学建模基于数理分析的酿酒葡萄及葡萄酒评价模型_第2页
数学建模基于数理分析的酿酒葡萄及葡萄酒评价模型_第3页
数学建模基于数理分析的酿酒葡萄及葡萄酒评价模型_第4页
数学建模基于数理分析的酿酒葡萄及葡萄酒评价模型_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):基于数理分析的酿酒葡萄及葡萄酒评价模型摘要本文主要研究葡萄酒评价问题,根据题目中所给的数据及相关知识,运用、等相关软件对数据进行分析,使用配对检验法,主成分分析法,模糊数学等方法建立出可行的评价模型。针对问题一,首先,利用matlab软件对附件中的异常数据进行预处理;其次,由于品酒员在给葡萄酒打分时存在主观性因素,为此使用置信区间法对附件一中的评分数据进行调整,以降低品酒员对葡萄酒评分的主观性(即系统误差),通过计算各葡萄酒酒样评分的均值,利用对红葡萄酒进行配对t检验,得出双侧检验值为0.197,远大于显著性水平0.05,同理白葡萄酒的双侧检验值为0.036,小于显著性水平0.05,因此认为红葡萄酒的评价结果没有显著性差异,白葡萄酒的评价结果有显著性差异,即第二组的结果更可信。针对问题二,首先,利用软件对酿酒葡萄的理化指标进行主成分分析,得出5个主成分及各主成分的线性方程(见,,,),进而由各主成分与其贡献率的乘积得出酿酒葡萄的综合得分;其次,通过品酒员对葡萄酒的打分进行分析,运用熵权法重新确定了各评分指标的权重,由评分指标的权重和评分计算出红白葡萄酒各酒样质量的总得分;最后,运用模糊数学理论,根据酿酒葡萄和葡萄酒质量的综合得分对酿酒葡萄进行等级划分,划分结果如下:等级酿酒葡萄酒样序号1级1、2、3、8、9、212级5、7、11、13、14、15、16、19、22、233级4、6、10、12、17、18、20、24、25、26、27针对问题三,首先,由问题2主成分分析得到的酿酒葡萄综合得分为因变量,以葡萄酒的理化指标为自变量,通过Matlab编程(以红葡萄为例)进行统计回归分析,得知二者有较强的线性函数关系,其结果为;同理,对酿酒白葡萄的理化指标与白葡萄酒的理化指标进行二次回归拟合,得出其函数关系为:针对问题四,为得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先,运用灰色关联理论,把问题一中调整后的品酒员打分作为参考变量,将问题二中由酿酒葡萄5个主要的理化指标得出的综合得分与葡萄酒理化指标的综合得分作为比较变量,以红葡萄为例,利用Matlab软件编程对二者进行关联度分析,得出葡萄酒、酿酒葡萄的理化指标与葡萄酒质量的关联度分别为0.6072,0.6072,两个比较变量与参考变量的关联度不是很高,因此,认为酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量影响不大,不能用这两个指标来评价葡萄酒的质量。关键词:置信区间法t检验主成分分析统计回归模糊数学熵权法一问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。分析酿酒葡萄与葡萄酒的理化指标之间的联系。分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和萄酒的理化指标来评价葡萄酒的质量?二问题分析对于问题一在葡萄酒的感官分析评价中,由于品酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同品酒员对同一酒样的评价差异很大,从而不能真实地反映不同酒样间的差异。因此,在对感官评价结果进行统计分析时,必须对品酒员的原始数据进行相应的处理,反映出样品间的真实差异。我们利用置信区间法对数据进行处理,然后根据数据调整前后的变异系数作为判断标准。经过分析,处理后的数据变异系数明显变小,说明我们进行的处理是有效的。对于问题二酿酒葡萄具有多个理化指标,并且各指标之间有一定的相关关系的,而主成分分析法是对于原先提出的所有指标,建立尽可能少的新指标,使得这些新指标是两两不相关的,而这些指标同时又能尽可能多的反映原指标信息。首先,我们把葡萄的各指标运用主成分分析法,得出5个主要成分,再应用综合主成分分析法计算出酿酒葡萄的综合评分及其排名;然后,我们对品酒员打分情况进行分析,基于信息熵对各个评价指标权重进行了重新分配,根据以上信息熵重新确定的各个评价指标的权重,再根据权重和品酒员的评分就可以计算出每种葡萄酒质量的总得分;最后我们运用模糊数学,根据酿酒葡萄、葡萄酒质量综合得分及其排名模糊划分酿酒葡萄的等级。对于问题三本题要求分析葡萄和葡萄酒的理化指标之间的联系。我们根据第二问得出的每一种葡萄的得分跟葡萄酒各项指标之间的关系,运用回归统计的方法分析出各项指标与葡萄得分之间的关系。我们首先试着对得分与各项指标做线性回归,分析残差知,残差太大,关联程度不是很大;然后我们对得分与各项指标做二次回归,得出的残差符合回归标准,于是我们得出了得分与各项指标之间的二次关系。对于问题四通过对葡萄酒做主成分分析,得出对葡萄酒有主要作用的指标,然后计算出葡萄酒的综合得分。我们把酿酒葡萄的综合得分与葡萄酒的综合得分与品酒员的打分做灰色关联。然后根据分别得出的葡萄与葡萄酒对打分的关联度来确定葡萄与葡萄酒是否对葡萄酒的质量有影响。三模型假设题目提供的数据准确可靠;分析统计规律时的抽样符合随机性和独立性,样本中不含有数据坏点;假设各理化指标分布稳定,不考虑自身的反应变化;忽略葡萄酒的质量受到非评价因素的干扰。四符号的约定符号定义CV、FP品酒员i对酒样j的评分品酒员i对所有酒样评分的平均值品酒员i对所有酒样评分的标准差酒样j的平均值酒样j的标准差变异系数酿酒葡萄第i个主成分葡萄酒第j个理化指标酿酒葡萄各理化指标综合得分红葡萄酒的理化指标白葡萄酒的理化指标相关系数概率方差五模型的建立与求解5.1问题一的模型建立与求解5.1.1问题分析由于品酒员的评价标准存在异质性,比如评价尺度、评价位置和评价方向的差异,为此需要对品酒员给出的原始数据进行相应的处理,以降低品酒员的系统误差,真实反映样品间的差异性,所以我们选取置信区间法来降低同一酒样的变异系数.使不同品酒员对同一酒样的评价趋于一致。5.1.2相关理论置信区间法如果品酒员i对酒样j的评价()在其置信区间范围内就可以直接使用;如果其评价()不在置信区间范围内,则将品酒员的评价进行逐步调整,使不同品酒员对同一酒样的评价值都处于范围内,即:若,则;若,则。变异系数的公式配对样品t检验基本原理:求出每对的差值如果两种处理实际上没有差异,则差值的总体均数应当为0,从该总体中抽出的样本其均数也应当在0附近波动;反之,如果两种处理有差异,差值的总体均数就应当远离0,其样本均数也应当远离0。这样,通过检验该差值总体均数是否为0,就可以得知两种处理有无差异。该检验相应的假设为::两组评酒员评分结果无显著性差异;:两组评酒员评分结果存在显著性差异。5.1.3模型求解数据预处理附件1第一组红葡萄酒样品20品酒员4号对色调的打分缺失;附件1第一组白葡萄酒样品3品酒员7对持久性的打分为77,明显有误,怀疑多打了7;附件1第一组白葡萄酒样品8品酒员9对持久性的打分16而该项目满分为8,明显有误,怀疑多打了个1.对上述缺失数据项取平均值填补数据求解首先,我们通过Matlab编写程序,求得酒样的变异系数;再将不属于置信区间的评价()进行两次逐步调整,以第一组红酒举例。表1.1葡萄酒样品的变异系数酒样编号数据调整前数据调整后10.1160.02920.0970.03630.1420.03440.0740.01150.1200.04160.0500.01370.0570.01880.1110.03090.0880.024100.1090.036110.1070.024120.1510.043130.0900.032140.0920.032150.1180.035160.1530.052170.0790.029180.0840.017190.0920.030200.1660.038210.1070.035220.0670.019230.1580.050240.0760.031250.0700.021260.1400.048270.0820.044由上表可知,调整后的数据符合要求。我们根据调整后的数据进行配对t检验。用SPSS对调整后的数据进行双样本均值t检验平均值的标准误:表示各酒样得分的离散程度;:两组评酒员评分结果无显著性差异;:两组评酒员评分结果存在显著性差异;第一组红葡萄酒得分和第二组红葡萄酒得分进行独立样本t检验后结果表1.2成对样本统计量均值N标准差均值的标准误对1VAR0000172.9098277.374071.41914VAR0000270.8320273.92975.75628表1.3成对样本相关系数N相关系数Sig.对1VAR00001&VAR0000227.060.767表1.4成对样本检验组别成对差分tdfSig.(双侧)均值标准差均值的标准误差分的95%置信区间下限上限对1VAR00001-VAR000022.077728.145891.56768-1.144685.300131.32526.197由上表Sig=0.197>5%,接收假设;此时t=1.325,F=3.521,显著性概率=0.197>5%,两组方差差异不显著,从数据中可以看出第一组的标准差7.37407>第二组的标准差3.92975,且均值的标准误差值第一组1.41914>第二组0.75628,所以对于红葡萄酒的评价第二组更可信第一组白葡萄酒得分和第二组白葡萄酒得分独立样本t检验后结果:表1.5成对样本统计量均值N标准差均值的标准误对1V273.975000284.8278225.9123727V476.532143283.1709391.5992512表1.6成对样本相关系数N相关系数Sig.对1V2&V428-.139.480表1.7成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分的95%置信区间下限上限对1V2-V4-2.55714296.13414421.1592443-4.9357157-.1785701-2.20627.036由上表Sig=0.036<5%,接收假设。此时t=-2.206,F=2.318,显著性概率=0.036<5%,因此结论是两组方差差异显著,从数据中可以看出第一组的标准差4.8278225>第二组的标准差3.1709391,且均值的比准误差值第一组0.9123727>第二组0.5992512,所以对于白葡萄酒的评价第二组更可信。综上所述,两组评酒员对于红葡萄酒的评价没有显著差异,对白葡萄酒的评价有显著差异。第二组的结果更可信。5.2问题二的模型建立与求解5.2.1问题分析根据酿酒葡萄的理化指标对酿酒葡萄进行分级。酿酒葡萄具有多个理化指标,在用统计分析方法研究这个多指标的课题时,指标个数太多就会增加复杂性。然而葡萄的各个理化指标间是有一定的相关关系的,当两个指标之间有一定相关关系时,可以解释为这两个指标对葡萄质量的反映有一定的重叠,因此考虑采用主成分分析法。主成分分析是对于原先提出的所有指标,建立尽可能少的新指标,使得这些新指标是两两不相关的,而且这些新指标在反映葡萄的质量方面尽可能保持原有的信息,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。5.2.2数据预处理附件2酿酒白葡萄的百粒质量第三组数据太大,2226.1---226.1;原始数据中有多次测试的一级指标求平均,用均值代表这个指标;5.2.3基于SPSS的主成分分析的步骤及其因子分析用matlab将原始数据进行正向化、标准化处理,并计算相关系数矩阵,然后用SPSS20.0进行主成分分析,确定主成分个数。标准化处理计算相关系数矩阵;为原变量与的相关系数,,其计算公式为:;计算特征值与特征向量,首先解特征方程求出特征值,并使其按大小顺序排列,然后求出对应特征值的特征向量;计算主成分贡献率及累计贡献率:贡献率:累计贡献率:若前m个主成份的累计贡献率达到了85%,则这m个主成份能反映足够的信息,因这m个成分作为主成分。表2.1成份矩阵a成份12345F1.330.777-.078-.392-.159F2.867-.357.202-.159.164F3-.079-.679.169-.055-.604F4.967-.029-.125.172.041F5.629.363.427-.262.321F6.036.605.276.645-.046F7.227.408.551.421.309F8.329.180-.275.765.222F9.669.001.120.704-.070F10.905-.334.003-.141-.030F11.942-.024-.177-.192-.013F12.889-.047-.302.065-.172F13.896-.157-.191-.192.008F14-.002-.018.925-.100-.274F15.810.219.018.276-.172F16-.015.905-.259-.236.057F17-.213.894-.219-.146.084F18-.044.860-.424-.136.073F19.447-.320.195-.741.155F20-.463.419-.691.024-.279F21.459.036.608-.047.517F22.085.947-.279-.086.046F23-.380-.756-.209-.024.440F24-.547-.629-.477-.019.167F25.823-.060.224.277-.302F26.730-.220-.373-.320-.038F27-.247-.475-.710.318.217F28-.584-.553.429.168.042F29-.585.257.714-.105-.106F30-.539.509.570-.095.030已提取了5个主成份。表2.2五个主要成分主成分类别具体成分第一主成分蛋白质、花色苷、DPPH自由基、总酚、单宁、葡萄总黄酮第二主成分总糖、还原糖、可溶性固形物、干物质含量第三主成分白藜芦醇、颜色a*第四主成分多酚氧化酶活力、褐变度第五主成分固酸比、果穗质量由成分矩阵表,得到主成分与酿酒葡萄各指标的线性关系式:。表2.3解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积%110.13133.76933.76910.13133.76933.7699.39131.30431.30427.48524.95158.7207.48524.95158.7206.81022.69954.00335.00016.66775.3875.00016.66775.3874.13713.78867.79243.12310.41185.7983.12310.41185.7983.62412.08179.87351.5715.23691.0341.5715.23691.0343.34811.16191.0346.9343.11594.1497.5221.74195.8898.3841.28197.1709.223.74397.91410.208.69498.60811.161.53899.14612.093.31199.45713.060.20199.65814.037.12399.78115.023.07599.85616.017.05699.91217.015.05199.96318.004.01499.97719.004.01299.98920.001.00599.99421.001.00499.99722.000.00199.99923.000.001100.000245.465E-005.000100.000252.231E-0067.435E-006100.000263.096E-0151.032E-014100.000274.159E-0161.386E-015100.000282.078E-0166.927E-016100.000295.978E-0171.993E-016100.00030-2.759E-016-9.196E-016100.000以主成分与其方差贡献率构建出酿酒葡萄品质的综合得分模型,即表2.4综合得分排序综合得分酒样序号5.9235.8025.7574.9354.5413.8712.7161.5430.9910.8700.2980.248-0.358-0.857-1.369-1.407-1.680-2.076-2.113-2.418-2.435-2.511-2.603-3.904-4.156-4.349-5.2593912821141623221119137515624124171827202610255.2.4葡萄酒质量得分附件1已经给出评酒员的具体打分情况,但是百分制打分各单项指标的权重分配不一定合理。因此,首先我们以第2组可信度较高的评分数据,对各指标的权重进行重新分配。5.2.4.1基于信息熵对权重的重新分配检测权重的合理性我们以第2组的可信数据,对已知权重的合理性进行检验,若权重不合理,将重新确定权重。为了避免客观给定权重,我们可以根据基于信息熵的确定权重的方法重新计算信息熵并比较。基于信息熵的确定权重方法分析信息熵法是偏于客观的确定权重的方法,它借用信息论中熵的概念。适用于多属性决策和评价。本问题中各属性是葡萄酒的10项单指标(外观澄清度、气味浓度等),本问题的决策方案即是对27种红葡萄酒和27种白葡萄酒进行分级,也就是说对各属性确定权重,然后计算每种葡萄酒的总得分,最后进行排序分类。用信息熵确定各属性权重的具体步骤:以2组评酒员对红葡萄酒各项指标的评分的平均值为信息构造决策矩阵X,决策变量为27个红葡萄酒酒样,决策属性。上述10个指标属性都是效应型指标,利用公式对决策矩阵进行规范化处理,其中分别为10个属性得分的最高值。再由对规范化矩阵进行归一化处理。通过公式,(n=27)计算10个属性的信息熵通过公式计算我们确定的各单项的新的权重为:表2.5葡萄酒的重新确定的权重0.03340.41970.15340.12650.06070.03660.08080.01750.05590.01555.2.4.2

葡萄酒质量综合得分根据以上信息熵重新确定的各个评价指标的权重分,再根据权重和评酒员的评分就可以计算出每种葡萄酒质量的总得分,葡萄酒质量得分和排名如下表所示:表2.6红葡萄酒质量得分和排名排序后的综合得分序号7.546457.483097.023337.001126.998546.977396.946436.905116.870976.813896.791896.680346.610676.577966.554196.507126.474096.454036.388366.37976.275276.177695.893275.797925.313165.290884.953522221614721315202352419612513189262712101748115.2.5模糊综合评价综合两个排名,我们提出了基于模糊数学对酿酒葡萄等级的划分,这种划分方法充分尊重了两组数据,但是当两组数据对结果的影响因素相差很大是,评价结果将产生较大的误差。由表5.2.4、5.2.6,我们建立了评价标准。表2.7红葡萄质量评价标准一级标准二级标准三级标准酿酒葡萄5.71.7-4.7葡萄酒7.465.3建立评价集:。确定权向量在求解过程中,首先,利用表5.2.7中的数据,构建具有2项评价对象,4个评价指标的判断矩阵:之后,将判断矩阵进行归一化处理,得到归一化矩阵,的元素为:则得到矩阵:根据熵的定义,2个评价对象,4个评价指标,确定评价指标的熵值:其中:。显然,当时无意义,因此需要对进行修正,将其定义为:接着,利用熵值计算评价指标的熵权:式中,,且满足。当时,当时,当时,表2.8红葡萄等级排名模糊划分等级酿酒葡萄酒样序号1级1、2、3、8、9、212级5、7、11、13、14、15、16、19、22、233级4、6、10、12、17、18、20、24、25、26、275.3问题三模型的建立与求解5.3.1问题分析在问题2的主成分分析中我们已经得到酿酒葡萄的综合得分,因此我们以葡萄酒的指标为解释变量,以酿酒葡萄葡萄的综合得分为被解释变量,进行多元线性和非线性回归,得出酿酒葡萄各个理化指标与葡萄酒各项理化指标之间的关系,进而分析两者之间的联系。数据预处理为了消除各项指标的量纲差异,首先对每个酿酒葡萄的各项理化指标和葡萄酒的各项理化指标为标准化处理的公式如下:相关理论:、值越大,、值越小,回归模型拟合效果越好。模型1:多元线性回归酿酒红葡萄与红葡萄酒各理化指标的关系表达式为:表3.1检验红葡萄回归模型的统计量0.66065.28250.00180.4645图3.1红葡萄残差分布图残差的置信区间均包含零点酿酒白葡萄与红葡萄酒各理化指标的关系表达式为:表3.2检验白葡萄回归模型的统计量0.47703.19180.02190.6725图3.2白葡萄酒残差分布图白葡萄酒残差分布图,白葡萄酒除有1个数据外其余残差的置信区间均包含零点,将这个1个数据点视为异常点(图中红线),将其剔除后又生成新的异常数据点偏小,因此建立模型二进行了非线性回归分析。模型2:多元非线性回归酿酒红葡萄与红葡萄酒的理化指标多元二次项回归分析表3.3检验红葡萄回归模型的统计量0.79903.40800.01990.4354图3.3红葡萄残差分布图由上述四个系数知拟合度较好,该二次项回归模型可信度高。酿酒白葡萄与白葡萄酒的理化指标多元二次项回归分析表3.4检验白葡萄回归模型的统计量0.70923.04920.02220.5234图3.4酿酒白葡萄残差分布图剔除异常点后:表3.5白葡萄回归模型的统计量0.82835.22690.00290.2826图3.5剔除异常数据的残差分布图问题四的建模与求解模型求解我们根据酿酒葡萄理化指标和葡萄酒理化指标计算出葡萄酒质量的综合得分,运用SPSS主成分分析对红葡萄酒的理化指标降维处理,对酿酒红葡萄提取出一个主成分,得到红葡萄酒得分模型: 表4.1成份矩阵a成份1V1.964V2.993V3.999V4.991V5.479V6.995V7-.975提取方法:主成份。已提取了1个成份。根据上述得分模型计算出红葡萄酒综合得分,并由问题二中得到的酿酒红葡萄的综合得分进行对比分析。对比分析相似度分析我们把理化指标计算出的质量得分进行排名,与口感分析的葡萄酒质量排名进行相似度分析。图4.1葡萄酒质量排名相似性分析由图4.1知,由酿酒葡萄理化指标和葡萄酒的理化指标质量排名与品酒员口感分析质量排名的相似性在某些区间段好而在其他区间段不是很好,因此我们进行了灰色关联度分析来最终确定能否用酿酒葡萄理化指标和葡萄酒的理化指标来评价葡萄酒的质量。关联度分析我们把口感分析的葡萄酒质量得分作为参考量,分别把葡萄酒和酿酒葡萄的理化指标计算出的质量得分作为比较量,用Matlab编程对两者进行关联度分析得其葡萄酒、酿酒葡萄理化指标与葡萄酒质量关联度为0.6072,0.6072,结合2.1.1相似度分析我们认为不宜用酿酒葡萄理化指标和葡萄酒理化指标来评价白葡萄酒的质量。(对比如下图)表4.2红葡萄和葡萄酒的理化指标与葡萄酒质量对比酿酒红葡萄红葡萄酒红葡萄酒(口感分析)5.7574.9355.923-2.418-1.369-1.680-0.8574.5415.802-4.3490.298-2.113-0.3582.716-1.4071.543-2.435-2.5110.248-3.9043.8710.8700.991-2.076-5.259-4.156-2.6031.5501.113-0.322-0.168-0.273-0.9311.5301.401-0.585-0.908-0.645-0.407-0.389-0.968-0.7610.085-0.786-0.293-0.5500.6810.0171.966-0.226-0.578-0.871-0.498-0.4986.5547.5466.9465.3136.7926.5786.9995.2916.3885.8934.9546.1786.4747.0016.9057.0235.7986.4546.6116.8716.9777.4836.8146.6806.5076.3806.275表4.3白葡萄和葡萄酒的理化指标与葡萄酒质量对比酿酒白葡萄白葡萄酒白葡萄酒(口感分析)-3.5090.1750.9750.5563.0910.5751.272-5.7950.7301.620-1.9461.054-4.1980.657-0.701-6.847-3.290-0.342-3.4931.1640.662-1.5201.7494.7060.7972.9535.343-1.100-1.3930.9480.625-0.347-1.065-0.330-2.623-0.4850.965-0.5811.542-1.011-2.4581.389-1.5871.457-0.835-0.0360.299-1.532-2.469-1.1107.525-0.427-1.7145.6826.0435.2475.9665.8715.6606.3386.5456.1736.3646.1486.3046.1546.2055.9946.2406.1676.2886.2265.8936.3886.4256.4516.0875.8476.0966.5346.007模型的优缺点优点:在解决问题一时,我们考虑到了品酒员的评分喜好会比较大的影响人的判断,如评价尺度的差异,评价位置的差异,评价方向的差异。为了减少这种差异,应对评酒员的原始数据进行相应的处理,从而降低品酒员评分间的系统误差。我们运用了置信区间法,极大地降低了酒样间的差异系数,使不同评酒员对同一酒样的评价趋于一致,进而降低了品酒员评分间的差异,更真实地反应酒样客观差异。对于问题二,我们基于主成分分析法,避免了大量酿酒葡萄的理化指标数据处理的复杂同时也尽可能地获得了最大的信息量。接着,我们又利用熵值法重新确定了各项指标的权重系数,得到了各品种葡萄酒在新的权重下的得分,并得到排名。最后,综合两个排名,我们提出了基于模糊数学对酿酒葡萄划分等级简洁合理,这种划分方法充分尊重了两组数据,并利用信息熵充分利用数据信息。在分析问题四时,我们先运用灰色关联系数法,求出了所有因素对葡萄酒质量的影响,在运用因子分析法,找出影响葡萄酒质量的主要因素,从而最大程度上降低了问题的复杂性。本文在问题分析和数据处理时,大量运用Matlab进行模型的实现,而Matlab软件具有较强的仿真性,功能也十分强大,精确度也很高,从这个角度可证明我们结果的可靠性与方法的合理性。缺点:各模型的数据使用前基本都需要进行标准化处理,使结果出现一定程度上的误差。我们提出了基于模糊数学对酿酒葡萄等级的划分,这种划分方法充分尊重了两组数据,但是当两组数据对结果的影响因素相差很大时,评价结果将产生较大的误差。参考资料[1]赖国毅,陈超,SPSS17.0常用功能与应用实例精讲,北京:电子工业出版社,2010年[2]焦树锋,AHP法中平均随机一致性指标的算法及MATLAB实现,2006年[3]洪志国,李焱,范植华,王勇,层次分析法中高阶平均随机一致性指标()的计算,2002年[4]崔国生,翟春,利用成对比较矩阵解决一类教育评价问题,2005年[5]马艳霞,土地评价方法对指标权重的影响_以兰州市永登县和皋兰县为例,2010年[6]唐功爽,基于SPSS的主成分分析与因子分析的辨析,第2期,2007年[7]郭显光,如何用SPSS软件进行主成分分析,第2期,1998年[8]吕卫东,主成分分析法在酿酒葡萄质量评价中的应用,第23期,2012年[9]刘辉,利用T检验模型检验葡萄酒的评价差异,第1期,2013年[10]刘洋洋,酿酒葡萄分级的方法研究,第31期,2012年[11]李华,葡萄酒感官评价结果的统计分析方法研究,第2期,2006年附录附录1functionputao_1clear;file='均值、标准差、变异系数.xlsx';%%加载数据fprintf('正在读取数据...\n');%也可用disp函数x1_data=xlsread('葡萄酒品尝评分表.xls',1,'a1:j270');%第一组白葡萄品尝评分数x2_data=xlsread('葡萄酒品尝评分表.xls',2,'a1:j280');%第一组白酒品尝评分数x3_data=xlsread('葡萄酒品尝评分表.xls',3,'a1:j270');%第二组白葡萄品尝评分数x4_data=xlsread('葡萄酒品尝评分表.xls',4,'a1:j280');%第二组白酒品尝评分数fprintf('读取完毕!\n');n1=size(x1_data,1)/10;n2=size(x2_data,1)/10;m=size(x1_data,2);k=10;%每个洋酒有10个评分%saveputao1%%对每位品酒员对每个酒样的打分进行合计functionx=SUM(n,x_data)fori=1:nforj=(k*(i-1)+1):(k*i)ifj-k*(i-1)==1temp=zeros(10);j1=1;endtemp(j1,:)=x_data(j,:);%获得下一个酒样的打分j1=j1+1;ifj-k*i==0%该酒样得分获取完成fori1=1:10x(i,i1)=sum(temp(:,i1));%累加每位品酒员对每个酒样各项目的打分endendendendend%%对每个酒样求均值、标准差、变异系数function[M,S,cv]=mse(X)M=mean(X,2);S=std(X,0,2);cv=S./M;end%%合计每个酒样的10个总分X1=SUM(n1,x1_data);X2=SUM(n2,x2_data);X3=SUM(n1,x3_data);X4=SUM(n2,x4_data);%%计算数据调整前的均值、标准差、变异系数[x1_m1,x1_s1,x1_cv1]=mse(X1);[x2_m1,x2_s1,x2_cv1]=mse(X2);[x3_m1,x3_s1,x3_cv1]=mse(X3);[x4_m1,x4_s1,x4_cv1]=mse(X4);%%置信区间法调整数据functionY=myfun(X)fori=1:size(X,1)xm=mean(X(i,:));%每个酒样平均值xs=std(X(i,:));%每个酒样方差forj=1:size(X,2)ifX(i,j)>=(xm-xs)&X(i,j)<=(xm+xs)continue;elseifX(i,j)>(xm+xs)X(i,j)=X(i,j)-xs;endifX(i,j)<(xm-xs)X(i,j)=X(i,j)+xs;endendendendY=X;end%%利用置信区间法进行两次数据调整fort=1:2X1=myfun(X1);X2=myfun(X2);X3=myfun(X3);X4=myfun(X4);end%%计算数据调整后的均值、标准差、变异系数[x1_m2,x1_s2,x1_cv2]=mse(X1);[x2_m2,x2_s2,x2_cv2]=mse(X2);[x3_m2,x3_s2,x3_cv2]=mse(X3);[x4_m2,x4_s2,x4_cv2]=mse(X4);%%写入数据到exceltext1={'数据调整前';'均值'};text2={'标准差'};text3={'变异系数'};text4={'数据调整后';'均值'};fprintf('写入数据到excel...\n');text={'第一组红葡萄酒';'均值';'标准差';'变异系数'};xlswrite(file,text1,1,'a1');xlswrite(file,text2,1,'f2');xlswrite(file,text3,1,'k2');xlswrite(file,text4,1,'p1');xlswrite(file,text2,1,'u2');xlswrite(file,text3,1,'z2');xlswrite(file,x1_m1,1,'a3');xlswrite(file,x2_m1,1,'b3');xlswrite(file,x3_m1,1,'c3');xlswrite(file,x4_m1,1,'d3');xlswrite(file,x1_s1,1,'f3');xlswrite(file,x2_s1,1,'g3');xlswrite(file,x3_s1,1,'h3');xlswrite(file,x4_s1,1,'i3');xlswrite(file,x1_cv1,1,'k3');xlswrite(file,x2_cv1,1,'l3');xlswrite(file,x3_cv1,1,'m3');xlswrite(file,x4_cv1,1,'n3');xlswrite(file,x1_m2,1,'p3');xlswrite(file,x2_m2,1,'q3');xlswrite(file,x3_m2,1,'r3');xlswrite(file,x4_m2,1,'s3');xlswrite(file,x1_s2,1,'u3');xlswrite(file,x2_s2,1,'v3');xlswrite(file,x3_s2,1,'w3');xlswrite(file,x4_s2,1,'x3');xlswrite(file,x1_cv2,1,'z3');xlswrite(file,x2_cv2,1,'aa3');xlswrite(file,x3_cv2,1,'ab3');xlswrite(file,x4_cv2,1,'ac3');fprintf('写入完毕!\n');end附录22.1functionputao_2_dataclear;file1='指标总表.xlsx';file2='酿酒葡萄.xlsx';%text={'红葡萄';'白葡萄'};txt={'氨基酸总量';'蛋白质';'VC含量';'花色苷';'酒石酸';'苹果酸';...'柠檬酸';'多酚氧化酶活力';'褐变度';'DPPH自由基';'总酚';'单宁';...'葡萄总黄酮';'白藜芦醇';'黄酮醇';'总糖';'还原糖';'可溶性固形物';...'PH值';'可滴定酸';'固酸比';'干物质含量';'果穗质量';'百粒质量';...'果梗比';'出汁率';'果皮质量';'颜色L*';'颜色a*';'颜色b*';};%%载入数据fprintf('载入数据...\n');d1=xlsread(file1,1,'b3:b29');d2=xlsread(file1,1,'D3:E29');d3=xlsread(file1,1,'g3:h29');d4=xlsread(file1,1,'j3:l29');d5=xlsread(file1,1,'n3:n29');d6=xlsread(file1,1,'p3:p29');d7=xlsread(file1,1,'r3:r29');d8=xlsread(file1,1,'t3:v29');d9=xlsread(file1,1,'x3:z29');d10=xlsread(file1,1,'ab3:ad29');d11=xlsread(file1,1,'af3:ah29');d12=xlsread(file1,1,'aj3:al29');d13=xlsread(file1,1,'an3:ap29');d14=xlsread(file1,1,'ar3:ar29');d15=xlsread(file1,1,'at3:at29');d16=xlsread(file1,1,'av3:ax29');d17=xlsread(file1,1,'az3:az29');d18=xlsread(file1,1,'bb3:bd29');d19=xlsread(file1,1,'bf3:bh29');d20=xlsread(file1,1,'bj3:bl29');d21=xlsread(file1,1,'bn3:bp29');d22=xlsread(file1,1,'br3:bt29');d23=xlsread(file1,1,'bv3:bx29');d24=xlsread(file1,1,'bz3:cb29');d25=xlsread(file1,1,'cd3:cf29');d26=xlsread(file1,1,'ch3:cj29');d27=xlsread(file1,1,'cl3:cn29');d28=xlsread(file1,1,'cp3:cr29');d29=xlsread(file1,1,'ct3:cv29');d30=xlsread(file1,1,'cx3:cz29');dd1=xlsread(file1,1,'b34:b61');dd2=xlsread(file1,1,'D34:E61');dd3=xlsread(file1,1,'g34:h61');dd4=xlsread(file1,1,'j34:l61');dd5=xlsread(file1,1,'n34:n61');dd6=xlsread(file1,1,'p34:p61');dd7=xlsread(file1,1,'r34:r61');dd8=xlsread(file1,1,'t34:v61');dd9=xlsread(file1,1,'x34:z61');dd10=xlsread(file1,1,'ab34:ad61');dd11=xlsread(file1,1,'af34:ah61');dd12=xlsread(file1,1,'aj34:al61');dd13=xlsread(file1,1,'an34:ap61');dd14=xlsread(file1,1,'ar34:ar61');dd15=xlsread(file1,1,'at34:at61');dd16=xlsread(file1,1,'av34:ax61');dd17=xlsread(file1,1,'az34:az61');dd18=xlsread(file1,1,'bb34:bd61');dd19=xlsread(file1,1,'bf34:bh61');dd20=xlsread(file1,1,'bj34:bl61');dd21=xlsread(file1,1,'bn34:bp61');dd22=xlsread(file1,1,'br34:bt61');dd23=xlsread(file1,1,'bv34:bx61');dd24=xlsread(file1,1,'bz34:cb61');dd25=xlsread(file1,1,'cd34:cf61');dd26=xlsread(file1,1,'ch34:cj61');dd27=xlsread(file1,1,'cl34:cn61');dd28=xlsread(file1,1,'cp34:cr61');dd29=xlsread(file1,1,'ct34:cv61');dd30=xlsread(file1,1,'cx34:cz61');fprintf('载入完毕!\n');%%求各因子均值functionY=M(X)fori=1:size(X,1)m(i,:)=mean(X(i,:));endY=m;end%%均值d2=M(d2);d3=M(d3);d4=M(d4);d8=M(d8);d9=M(d9);d10=M(d10);d11=M(d11);d12=M(d12);d13=M(d13);d16=M(d16);d18=M(d18);d19=M(d19);d20=M(d20);d21=M(d21);d22=M(d22);d23=M(d23);d24=M(d24);d25=M(d25);d26=M(d26);d27=M(d27);d28=M(d28);d29=M(d29);d30=M(d30);dd2=M(dd2);dd3=M(dd3);dd4=M(dd4);dd8=M(dd8);dd9=M(dd9);dd10=M(dd10);dd11=M(dd11);dd12=M(dd12);dd13=M(dd13);dd16=M(dd16);dd18=M(dd18);dd19=M(dd19);dd20=M(dd20);dd21=M(dd21);dd22=M(dd22);dd23=M(dd23);dd24=M(dd24);dd25=M(dd25);dd26=M(dd26);dd27=M(dd27);dd28=M(dd28);dd29=M(dd29);dd30=M(dd30);%%写入数据到excelfprintf('写入数据到excel...\n');%xlswrite(file2,text(1),1,'a1');xlswrite(file2,txt',1,'a1');xlswrite(file2,d1,1,'a2');xlswrite(file2,d2,1,'b2');xlswrite(file2,d3,1,'c2');xlswrite(file2,d4,1,'d2');xlswrite(file2,d5,1,'e2');xlswrite(file2,d6,1,'f2');xlswrite(file2,d7,1,'g2');xlswrite(file2,d8,1,'h2');xlswrite(file2,d9,1,'i2');xlswrite(file2,d10,1,'j2');xlswrite(file2,d11,1,'k2');xlswrite(file2,d12,1,'l2');xlswrite(file2,d13,1,'m2');xlswrite(file2,d14,1,'n2');xlswrite(file2,d15,1,'o2');xlswrite(file2,d16,1,'p2');xlswrite(file2,d17,1,'q2');xlswrite(file2,d18,1,'r2');xlswrite(file2,d19,1,'s2');xlswrite(file2,d20,1,'t2');xlswrite(file2,d21,1,'u2');xlswrite(file2,d22,1,'v2');xlswrite(file2,d23,1,'w2');xlswrite(file2,d24,1,'x2');xlswrite(file2,d25,1,'y2');xlswrite(file2,d26,1,'z2');xlswrite(file2,d27,1,'aa2');xlswrite(file2,d28,1,'ab2');xlswrite(file2,d29,1,'ac2');xlswrite(file2,d30,1,'ad2');%xlswrite(file2,text(2),2,'a1');xlswrite(file2,txt',2,'a1');xlswrite(file2,dd1,2,'a2');xlswrite(file2,dd2,2,'b2');xlswrite(file2,dd3,2,'c2');xlswrite(file2,dd4,2,'d2');xlswrite(file2,dd5,2,'e2');xlswrite(file2,dd6,2,'f2');xlswrite(file2,dd7,2,'g2');xlswrite(file2,dd8,2,'h2');xlswrite(file2,dd9,2,'i2');xlswrite(file2,dd10,2,'j2');xlswrite(file2,dd11,2,'k2');xlswrite(file2,dd12,2,'l2');xlswrite(file2,dd13,2,'m2');xlswrite(file2,dd14,2,'n2');xlswrite(file2,dd15,2,'o2');xlswrite(file2,dd16,2,'p2');xlswrite(file2,dd17,2,'q2');xlswrite(file2,dd18,2,'r2');xlswrite(file2,dd19,2,'s2');xlswrite(file2,dd20,2,'t2');xlswrite(file2,dd21,2,'u2');xlswrite(file2,dd22,2,'v2');xlswrite(file2,dd23,2,'w2');xlswrite(file2,dd24,2,'x2');xlswrite(file2,dd25,2,'y2');xlswrite(file2,dd26,2,'z2');xlswrite(file2,dd27,2,'aa2');xlswrite(file2,dd28,2,'ab2');xlswrite(file2,dd29,2,'ac2');xlswrite(file2,dd30,2,'ad2');fprintf('写入完毕!\n')%%标准化数据fprintf('标准化数据...\n');data1=xlsread(file2,1,'a2:ad28');data2=xlsread(file2,2,'a2:ad29');data1=zscore(data1);%标准化data2=zscore(data2);xlswrite(file2,{'红葡萄标准化后'},3,'a1');xlswrite(file2,data1,3,'a2');xlswrite(file2,{'白葡萄标准化后'},4,'a1');xlswrite(file2,data2,4,'a2');%%计算相关系数矩阵fprintf('标准化完成!\n计算相关系数矩阵...\n');r1=corrcoef(data1);%计算相关系数矩阵r2=corrcoef(data2);xlswrite(file2,{'红葡萄相关系数矩阵'},5,'a1');xlswrite(file2,r1,5,'a2');xlswrite(file2,{'白葡萄相关系数矩阵'},6,'a1');xlswrite(file2,r2,6,'a2');fprintf('数据处理完毕!\n');end2.2functionscore%%载入数据fprintf('载入数据...\n');A1=xlsread('data_2.xlsx',1,'g2:aj28');B1=xlsread('data_2.xlsx',1,'a2:e31');A2=xlsread('data_2.xlsx',3,'i2:al29');B2=xlsread('data_2.xlsx',3,'a2:g31');fprintf('载入完毕!\n');%%计算得分fprintf('计算得分...\n');data1=A1*B1;%各主成分得分data2=A2*B2;score1=zonghe(1,data1);%综合得分score2=zonghe(2,data2);[s1,i1]=sort(score1,'descend');%降序排列[s2,i2]=sort(score2,'descend');fprintf('计算完毕!\n');%%综合得分functionY=zonghe(k,X)fori=1:size(X,1)ifk==1Y(i,:)=0.338*X(i,1)+0.25*X(i,2)+0.167*X(i,3)+0.104*X(i,4)+0.052*X(i,5);%红葡萄综合得分函数endifk==2Y(i,:)=0.299*X(i,1)+0.282*X(i,2)+0.14*X(i,3)+0.069*X(i,4)+0.048*X(i,5)+0.039*X(i,6)+0.034*X(i,7);%白葡萄综合得分函数endendend%%写入数据到excelfprintf('写入数据到excel...\n');text={'各主成分得分';'综合得分';'序号'};xlswrite('data_2.xlsx',text(1),2,'a1');xlswrite('data_2.xlsx',data1,2,'a2');xlswrite('data_2.xlsx',text(2:3)',2,'g1');xlswrite('data_2.xlsx',s1,2,'g2');xlswrite('data_2.xlsx',i1,2,'h2');xlswrite('data_2.xlsx',text(1),4,'a1');xlswrite('data_2.xlsx',data2,4,'a2');xlswrite('data_2.xlsx',text(2:3)',4,'i1');xlswrite('data_2.xlsx',s2,4,'i2');xlswrite('data_2.xlsx',i2,4,'j2');fprintf('写入完毕!\n');end附录33.1functionputao_3_data1file='葡萄酒.xlsx';data1=xlsread('指标总表.xlsx',2,'b3:t29');data2=xlsread('指标总表.xlsx',2,'e33:t60');%%求均值函数functionY=M(X)fori=1:size(X,1)Y(i,:)=mean(X(i,:));endendglobalf;f=@M;%%对j列数据求每行的均值,j可以是矩阵functiond=Mj(data,j)fort=1:size(data,1)d(t,:)=f(data(:,j));endend%%对红葡萄酒数据进行处理d1=M(data1(:,1:3));d2=M(data1(:,4:6));d3=M(data1(:,7:9));d4=M(data1(:,10:12));d5=data1(:,13);d6=M(data1(:,14:16));d7=M(data1(:,17:19));%%对白葡萄酒进行处理b1=M(data2(:,1:3));b2=M(data2(:,4:6));b3=M(data2(:,7:9));b4=data2(:,10);b5=M(data2(:,11:13));b6=M(data2(:,14:16));%%写入数据到excelfprintf('写入数据到excel...\n');text={'花色苷';'单宁';'总酚';'酒总黄酮';'白藜芦醇';'DPPH半抑制体积';'色泽'};xlswrite(file,text',1,'a1');xlswrite(file,d1,1,'a2');xlswrite(file,d2,1,'b2');xlswrite(file,d3,1,'c2');xlswrite(file,d4,1,'d2');xlswrite(file,d5,1,'e2');xlswrite(file,d6,1,'f2');xlswrite(file,d7,1,'g2');xlswrite(file,text(2:7)',2,'a1');xlswrite(file,b1,2,'a2');xlswrite(file,b2,2,'b2');xlswrite(file,b3,2,'c2');xlswrite(file,b4,2,'d2');xlswrite(file,b5,2,'e2');xlswrite(file,b6,2,'f2');fprintf('写入完毕!\n');data1=[];data2=[];data1=xlsread(file,1,'a2:g28');data2=xlsread(file,2,'a2:f29');data1=zscore(data1);data2=zscore(data2);cleartextxlswrite(file,data1,'红葡萄标准化','a1');xlswrite(file,data2,'白葡萄标准化','a1');r1=corrcoef(data1);r2=corrcoef(data2);xlswrite(file,r1,'红葡萄相关系数矩阵','a1');xlswrite(file,r2,'白葡萄相关系数矩阵','a1');end3.2functionputao_3_data2fprintf('载入数据...\n');njhpt=xlsread('data_2.xlsx',2,'g2:g28');njbpt=xlsread('data_2.xlsx',4,'i2:i29');njhpt=zscore(njhpt);%数据标准化njbpt=zscore(njbpt);hptj=xlsread('葡萄酒.xlsx',1,'a2:g28');bptj=xlsread('葡萄酒.xlsx',2,'a2:f29');hptj=zscore(hptj);bptj=zscore(bptj);fprintf('载入完毕!\n');hptj=[ones(size(hptj,1),1),hptj,hptj.^2];bp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论