下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
评酒员对红葡萄酒评分结果不存在显著性差异吗葡萄酒评价的差异分析与酿酒葡萄的分级方法2012年全国数学建模竞赛的数据分析
2012年9月,应全国大学生数学建模竞赛的邀请,本组由两名评酒员(每组10名)对27种葡萄糖和28种葡萄酒进行评估,并附上每个葡萄样品的物理和化学性质指标数据。有必要分析数据中两组评估结果的显著差异,并评估哪组的结果更可靠。另外,根据葡萄的理化指标和葡萄酒的质量给对应酿酒葡萄进行分级。葡萄酒成分复杂,它由新鲜葡萄或葡萄汁经过酒精发酵而成。葡萄酒的质量与其成分关系密切,是其外观、香气、口味、典型性的综合表现,主要依靠评酒员的感官进行评价。国内外普遍采用红外光谱等技术或运用常规检验(包括密度、酒精度和pH值等)来划分葡萄酒等级,这些方法往往由于需要许多复杂的专业知识和设计,导致执行困难,且结果难以解释。参考国内外的相关研究文献,对葡萄酒分级分类的相关文献颇多。例如,Moreno运用概率神经网络较好地对54种红葡萄酒样品成功进行了分类;Cortez采用支持向量机建立了葡萄酒质量分类模型,分级效果较好;李运等将统计学方法应用于葡萄酒质量分析与评价中,为葡萄酒的质量控制、区分等提供了一种有效的途径;王金甲等基于葡萄酒物理化学分析测试数据,提出了一种葡萄酒质量评价方法,其效果优于传统的神经网络和支持向量机方法,且具有可视化的优点;王百姓将模糊综合评价引入干红葡萄酒口感协调性品评中,应用模糊数学的隶属度来确定干红葡萄酒口感协调性质量等级,取得了比较理想的效果;刘延玲建立一种新的Hopfield神经网络分类器模型,可以直接处理葡萄酒的理化性质测试指标数据和专家的感官评价等级数据,实现葡萄酒质量的分类。关于葡萄的分级方法,目前国内主要根据葡萄的外形特征来完成,这样不但效率低而且难以做到客观准确。近年,有学者根据葡萄外形借助计算机技术对葡萄的分级进行了研究。例如,唐晶磊等通过选取葡萄的颜色、形状特性指标,建立了基于BP神经网络的葡萄干分级鉴定模型;陈英等设计了一套基于计算机视觉的葡萄检测分级系统,可实现葡萄外观品质分级。然而,依据葡萄品种的理化指标数据和对应葡萄酒的质量评分来确定葡萄等级的研究,在国内外不多见。基于上述研究和本次竞赛提出的要求,结合问题中提供的评酒员对红葡萄酒(白葡萄酒的处理方法相同)的评分结果和对应酿酒葡萄的理化指标数据,本研究采用相应的统计数据处理方法,成功解决了竞赛中提出的问题,并获得了较好的成绩。1两组评估结果的显著差异评价和可靠性分析1.1显著性差异的分析在两个样本显著性差异检验时,常用的方法是对试验的样本均值进行参数检验,如检验、方差分析等。然而,这些检验方法需明确样本总体所服从的分布,如正态分布、二项分布等,并且要求方差齐性。在本问题提供的两组品酒员的评价结果中,对其进行Lilliefors检验,发现红葡萄酒的270项评分中,只有16项才是两组同时服从正态分布。可见,难以确定总体的分布规律。因此,可采用非参数检验法中的Mann-whitney检验对评价结果的显著性差异进行检验。其求解步骤如下:①H0:两组评酒员评分结果无显著性差异;H1:两组评酒员评分结果存在显著性差异。②将两样本混合,按由小到大的顺序将其进行排列,统一编排等级,最小的数据等级为1,第二小的数据等级为2,以此类推(若有数据相等,则取这几个数据位序的平均值)。分别求出两样本的等级之和,记为T1、T2,作为两样本的等级。③根据T1和T2,求出Mann-whitney检验统计量:计算U1和U2,其中,式中,n1、n2分别为两个样本的样本容量。选择U1和U2中较小的值作为U值,得到Mannwhitney检验统计量为:④在显著性水平a下,查标准正态分布a/2分位数Za/2,当Z>Za/2时,拒绝H0,即认为两个样本存在显著性差异。否则,认为两个样本没有显著性差异。此处以红葡萄酒样品1的外观指标———澄清度为例,阐述其求解过程。按照大小顺序排列各个评酒员的评分,求出它们的等级(表1),分别计算T1=80.5、T1=129.5。样本量n1=n2=10,根据步骤③可分别算得,U1=74.5,U2=25.5,U2较小,令U=U2,代入(2)式得Z=-1.852,令a=0.05,查标准正态分布函数值及分位数表知,Za/2=1.96,则有Z<Za/2,即认为两组评酒员对红葡萄酒样品1澄清度的评价结果没有显著性差异。分别对两组评酒员各种酒样的各项评分进行Mann-whitney检验,通过数学软件Matlab编程计算,得到两组评酒员对红葡萄酒各评价指标没有显著性差异项数(表2)。结果表明,对于红葡萄酒共270项评分中,其中233项无显著性差异,占86.3%。可见,两组评酒员对红葡萄酒的各项评分中,没有显著性差异的评分项占很大比例。由此可认为,两组评酒员对红葡萄酒的评价结果没有显著性差异。1.2两组评酒员评分结果对比评酒员评分的可信度可由同组内不同评酒员对同一样品的同类评价结果的稳定性来进行判定。如果评价结果可信,则同组内各位评酒员对同一样品的同类指标的评分差距不会相差太大。数据的稳定性可用其标准差系数来表达,本问题处理过程如下:①计算两组评酒员对各酒样的各评价指标评分的标准差系数,分别记为SSTD1和SSTD2。分别比较两组评酒员对同一样品相同指标评分标准差系数的大小,统计SSTD1>SSTD2的项数(表3)。②分别计算两组评酒员对各评价指标评分标准差系数的均值,以各项评价指标在评分中的分值比重为权向量进行加权平均(表3),得到两组评酒员总评价结果的标准差系数加权平均值,比较该平均值的大小,较小的组其评价结果更稳定。表3表明,SSTD1>SSTD2的项数为166项,占61.48%。通过计算,第1组总标准差系数为0.1645,第2组为0.1462,由此可见,第2组的评价结果比第1组更加可信。2量评分对酿酒葡萄的分级根据已提供的多个理化指标(30个主要指标)和葡萄酒的质量评分对酿酒葡萄进行分级是本节的中心任务。由于数据中的理化指标繁多,不可能全部拿来建模,因此,可以采用主成分分析,提取能代表多个指标信息的少量几个主成分来进行综合评价。2.1计算相关系数矩阵在多元统计分析中,将多个变量通过线性变换以选出少数两两不相关的新变量,而且这些新变量所反映的信息尽可能保留原有的信息,这种方法便是主成分分析法,它包含以下几个求解步骤:①对原始数据进行标准化处理设有n个评价对象,p个评价指标,第i个评价对象的第j个指标值为xij,则原始数据矩阵为:对数据进行标准化处理,标准化变换公式为:式中,,σj分别是第j个指标的均值和标准差。②计算相关系数矩阵及其特征值和特征向量相关系数的计算公式为:式中,rwj=rjw,rjj=1,rwj为第w个指标对第j个指标的相关系数。相关系数矩阵为:计算R的特征值和特征向量。设R的特征值为λ1,λ2,…,λp(λ1>λ2>…>λp),对应的特征向量为u1,u2,…,up,其中uj=(uj1,uj2,…,ujp)(j=1,2,…,p),则有如下线性变换:③计算各成分yt(t=1,2,…,p)的贡献率求出相应成分yt的累计贡献率:当累计贡献率αt接近于1(>0.85)时,可选择前m个主成分代替原来的p个指标,从而计算综合得分。2.2酿酒葡萄的综合评分在主成分分析中,各评价指标应为正指标。对于数据中所提供的理化指标,有部分已经是正指标,还有另外一部分是适度指标和逆指标。对于适度指标和逆指标,可采用文献所述方法统一化成正指标。葡萄酒的质量由评酒员对其评分来决定。对于问题中所研究的红葡萄酒,求出每位评酒员的评价总分后再求均值,可得27种红葡萄酒的得分,将其作为评价酿酒葡萄等级的一个重要评价指标。另外,加上酿酒葡萄的主要理化指标共31个作为葡萄分级的评价指标,借助统计软件SPSS19.0,运用主成分分析求解。①把预处理后的数据即27个酿酒葡萄对应的31个评价指标的值作为原始数据,对其进行标准化处理,算出标准化后的矩阵,进而可得相关系数矩阵为:②求出各成分方差贡献率和累计贡献率(表4)。③当方差累计贡献率am接近于1(>0.85)时,可选择前m个主成分代替原来的p个指标。由表4可知,选择前13个指标作为主成分代替原来的31个指标,从而得到:对27种红葡萄样品数据采用上式计算,可得酿酒葡萄的综合评分(表5)。④根据表5结果,可将评分结果分为4段,分值0.3~0.6的为一等葡萄,它包含4种葡萄样品;分值0.0~0.3的为二等葡萄,它包含8种葡萄样品;分值为-0.2~0.0的为三等葡萄,它包含9种葡萄样品;分值-0.5~-0.2的为四等葡萄,它包含6种葡萄样品(表6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 春夜喜雨听评课记录
- 12份数学听评课记录
- 大一思想政治课件
- 1025t锅炉原理课程设计
- 专题五 职业生活中的道德与法律规范
- 《财务分析工商》课件
- 《旅游资源学绪论》课件
- 《诸子散文》课件
- 世界粮食日珍惜节约粮食主题127
- 《湖南凤凰垮桥事故》课件
- 【苏泊尔电器存货管理中存在的问题与对策8800字 (论文)】
- 环境检测实验室分析人员绩效考核方案
- 大学生劳动教育(高职版)智慧树知到期末考试答案章节答案2024年深圳职业技术大学
- 路基土石方数量计算表
- 双头专用车床液压系统设计说明书
- 2023人教版新教材高中物理必修第三册同步练习-全书综合测评
- 月主题活动幼儿园主题活动记录表
- (完整)20以内加减法练习题50题一套及答案【必刷】
- GB/T 44044-2024道路车辆3.5 t以下挂车支撑轮和升降装置要求
- 健美操智慧树知到期末考试答案章节答案2024年临沂大学
- GIS技术在智慧水务中的应用
评论
0/150
提交评论