下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2021年全国大学生数学建模大赛一等奖论文葡萄酒的评价摘要随着人民生活水平的提高,葡萄酒开始走进千家万户,而葡萄酒的优劣评定也成了人们热议的话题。葡萄酒的优劣评价一般通过聘请有经验的评酒员进行品评并做出评分。本文围绕葡萄酒的评价问题进行研究分析。针对问题一,首先我们对附录1数据进行整理分析。先利用matlab编程对数据进行正态性检验,得出样本均满足正态分布这一条件之后进一步运用SPSS对数据进行配对样本T检验,检验得出的两组p值都小标准0.05,判定两组品酒员的评价结果存在显著性差异。接着,对所给评分数据进行方差分析,并进一步运用组间离均平方和方法比较第一、二组P值和F值的波动性,并最终得出结论:第二组评酒员所给的评分更为可信。针对问题二,我们结合原问题附件中的数据,先采用因子分析方法提炼出对葡萄总体理化指标有显著影响的因子,分红葡萄和白葡萄两类之后采用聚类分析方法将葡萄分为五类。在问题一的基础上,利用可信度高的品酒员所评分数作为葡萄酒质量的衡量标准,为五类葡萄划分好坏。最终我们将红白葡萄都分为五个级别,分别是A级(极好),B级(较好),C级(普通),D级(较差),E级(最差)。图-红葡萄的分类针对问题三,由于葡萄的理化指标众多,首先利用sas软件分析葡萄与葡萄酒的理化指标之间的相关系数,选取与葡萄酒理化指标相关性较显著的葡萄理化指标,做典型相关分析。并对典型相关分析的结果进行分析。红葡萄和红葡萄酒间的典型相关分析结果说明:两组变量间,花色营、苹果酸、褐变度、色泽L*相关密切,特别是葡萄与葡萄酒间的花色苛指标可见显著相关:白葡萄与白葡萄酒的结果说明:白葡萄指标的黄酮醇、褐变度、单宁指标与白葡萄酒的总黄酮、单宁、总酚可见显著相关。针对问题四,针对问题四,利用酿酒葡萄和葡萄酒的理化指标与葡萄酒的质量构建多元线性回归模型,从而分析出哪些理化指标对葡萄酒的质量有显著影响。在最后,我们将酿酒葡萄和葡萄酒的感官指标当作变量引入回归方程,得到回归方程的拟合度为98.62%,而没加上感官指标时的拟合度为78.89%,所以加上感官指标后回归方程的拟合度明显变高,而11各个参数都通过了显著性检验,论证了不能用葡萄和葡萄酒的理化指标來评价葡萄酒的质量。关键词:样本T检验、聚类分析法、典型相关分析、多元线性回归1一、 问题重述1.1问题背景葡萄酒是用鲜葡萄酿制成的发酵酒,具有增进食欲、滋补、助消化等作用,适量饮用葡萄酒,对维持和调节人体的生理机能,都起到良好的作用。随着人们社交活动的增加、生活水半的提高,葡萄酒越來越受到人们的青睐,而对葡萄酒的评价也因此显得尤为重要。2基本信息本文旨在对葡萄酒的好坏进行评价。确定葡萄酒的质量。通过聘请一批有资质的评酒员进行品评后,让其各酒品分指标进行打分。打分共100分制。酿酒葡萄的好坏与所酿葡萄酒之间有直接关系,同时葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。1.3有关信息附件给出了评价结果、酿酒葡萄与葡萄酒的成分数据。包括:附件1:葡萄酒品尝评分表附件2:葡萄和葡萄酒的理化指标附件3:葡萄和葡萄酒的芳香物质1.4问题提出1) 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信。2) 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质1:的影响,并论证能否用葡萄和葡萄酒的理化指标來评价葡萄酒的质量。二、 问题分析1问题一:本小题要求我们对附件1中两组评酒员的评价结果是否存在显著性差异进行分析,并检验哪组结果更可信。故我们可将评酒员对红/白葡萄酒的各项评分项目作求平均值处理并将其结果相加得到不同酒种的分数,再运用matlab软件对数据进行正态性检验判断数据是否满足进行T检验的基本条件,在确认满足条件之后,我们对数据进行T检验得出最终所需结果。2.2问题二:题目要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级处理。对于附录中众多理化指标,我们利用spss软件进行因子分析,提炼出几个对葡萄总体理化指标有显著影响的因子。以这些因子代表原來的众多指标,接着对酿酒葡萄样本进行系统聚类分析得出样本的聚类谱系图,即可得出酿酒葡萄的分类情况。再结合葡萄酒的质量,这里需要注意的是,我们要用到问题一较为可信那一组的评分情况作为质量的标准,再用其來衡量几类葡萄的好坏2.3问题三:分析题意不难发现,这是两个有较多变量的指标样本。那么不能用多元线性回归來解决问题。由于葡萄的理化指标过多,直接进行典型相关分析无法实现,我们考虑用因子分析进行降维,之后利用降维后的指标进行系统聚类分析,在这里我们2考虑用离差平方法进行聚类。再找出能够衡量葡萄酒质量的标准来对聚类的结果进行分析,充实。2.4问题四:题目要求我们找出哪些酿酒葡萄和葡萄酒的理化指标对葡萄酒质量有影响,并11论证能否用葡萄和葡萄酒的理化指标來直接评价葡萄酒的质量。我们运用酿酒葡萄和葡萄酒的理化指标与葡萄酒的评分建立多元线性回归模型,得出通过了显著性检验的参数,从而判断出哪些理化指标对葡萄酒质量有显著影响。最后我们将酿酒葡萄和葡萄酒的感官指标当作变量引入回归方程,得到新回归方程的拟合度和显著性检验,然后判断出能否用葡萄和葡萄酒的理化指标來直接评价葡萄酒的质量。三、 模型假设品酒员之间的打分不会相互影响。品酒员个人对各酒甜的打分标准保持不变。3.酿酒工艺对不同葡萄酒的质量的影响保持一致。葡萄酒和酿酒葡萄的理化指标在短期内是稳定、保持不变的。四、 符号说明xl:氨基酸总量(mg/100gfw)x2:蛋白质(mg/100g)x3:VC含量(mg/L)x4:花色背(mg/100g)x5:酒石酸(g/L)x6:苹果酸(g/L)x7:柠檬酸(g/L)x9:褐变度(AA/g*g*min*ml)xlO:DPPH自由基(g/L)xll:总酚(mmol/kg)x21:固酸比x22:干物质含量(g/lOOg)x23:果穗质量(g)x24:白粒质量(g)x25:果梗比(%)x26:出汁率($)x27:果皮质量(g)x29:果皮颜色a*x30:果皮颜色b*yl:花色苛(mg/L)y2:单宁(mmol/L)y3:总酚(mmol/L)y4:酒总黄酮(mmol/L)y5:白藜芦醇(mg/L)y6:DPPH半抑郁体积(uL)y7:色泽L*(D65) y8:色泽a*(D65)y9:色泽b*(D65)x8:多酚氧化酶活力E(A/min•g•ml)x28:果皮颜色L*xl2:单宁(mmol/kg)xl3:葡萄总黄酮(mmol/kg)xl4:白藜芦醇(mg/kg)xl5:黄酮醇(mg/kg)xl6:总糖(g/L)xl7:还原糖(g/L)xl8:可溶性固形物(g/L)xl9:PH值x20:可滴定酸(g/L) 3五、 模型的建立与求解1问题一模型445.1.1问题一模型的准备1.样本配对T检验的理论两独立样本T检验就是根据样本数据对两个配对样本本來口的辆配对总体的均值是否有显著差异进行推断。两配对样本T检验的前提条件:两样本应该是配对的(两样本的观察值数目相同,两样本的观察只的顺序不能随意更改);样本來口的两个总体应该服从正太分布。⑴提出原假设两配对样本T检验的原假设H0为:两总体均值无显著差异,表述为H0:?l??2?0o?1,?2分别为第一个和第二个总体的均值。要检验的假设为:H0:?l??2 Hl:?l??2记SI??(Xi?X)(Xi?X)Ti?lnS2??(Yi?Y)(Yi?Y)Ti?lm采用统计量为T2?mn(m?n?2)(X?Y)T(S1?S2)?1(X?Y)m?n2.在此我们将会用到matlab工具箱的一个命令:h=normplot(x)此命令显示数据矩阵X的正态概率图,如果数据來口丁•正态分布,则图形显示出直线型形态,而其它槪率分布呈现曲线形态。有了以上知识我们利用matlab编程对数据进行正态性检验(程序见附录)5.1.2问题一模型的建立首先,我们对数据进行处理。附录1给出了10位品酒员分别对27种红葡萄酒和28种白葡萄酒关于外观分析、香气分析、口感分析和平衡/整体四方面数据的评分数据。我们首先将红葡萄酒与白葡萄酒的种类编号按从小到大顺序排好以便后续数据处理工作的顺利进展,通过观察我们可以发现,编号为3的白葡萄酒在第7位品酒员在口感分析中的持久性一项中数据岀现明显偏差,故我们将这一项剔除,所以最后均剩下27种红葡萄酒和27种白葡萄酒。接着,我们对10位品酒员对27种红/白葡萄酒的各项评分项目(其中包括外观分析的澄清度、色调,香气分析的纯正度、浓
度、质量,口感分析的纯正度、浓度、持久性和质量)作求平均值处理,再将各平均值相加,得到不同编号不同种类葡萄酒的各自分数,结果如下表1所示:表1品酒员品酒得分表第一组红酒第二组红酒第一组白酒第二组白酒162.768.1 82.077.92 80. 3 74. 0 74.275.8380.474.679.476.9468.6 71.2 71.081.5 573.372.1 68. 4 75. 5 672.266.377.574.2771.565.371.4 72.3 872.366.0 72.980.49 81. 5 78. 2 74.379.81074.268.872.371.41170. 161. 673.372.41253.968.365.973.91374.672.41253.968.365.973.91374.668.872.077.11473.072.672.478.41558.765.774.067.31674.969.978.880.31779.374.573.176.71860.165.472.276.41978.672.677.876.62079.275.876.479.22177.172.271.079.42277.271.675.977.42385.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年全自动打码机项目投资价值分析报告
- 北京林业大学《机电一体化系统设计》2023-2024学年期末试卷
- 借款协议模版
- 健康管理业务协议
- 2024至2030年中国塑料粉碎机刀片行业投资前景及策略咨询研究报告
- 权利股票配资合同
- 关于防范打击电信网络新型违法犯罪工作实施方案
- 机电安装综合课程设计
- 年度成本管控的实施方案
- 金沙遗址课程设计
- 配电网项目后评价实施办法
- 胸痛鉴别诊断
- 元明粉比重表
- 汽车行业各种缩写(共7页)
- 房地产项目投资成本测算参考表
- 大学英语四级改错题12篇
- 摩托车车架的焊接
- 防火封堵设计说明及施工大样图
- 旁站监理记录(高区空调)
- 外研(一起)五年级上册期中模拟测试英语试卷(附答案)
- 钢材质量检验工中级资料
评论
0/150
提交评论