高教社杯全国大学生数学建模竞赛葡萄酒的评价_第1页
高教社杯全国大学生数学建模竞赛葡萄酒的评价_第2页
高教社杯全国大学生数学建模竞赛葡萄酒的评价_第3页
高教社杯全国大学生数学建模竞赛葡萄酒的评价_第4页
高教社杯全国大学生数学建模竞赛葡萄酒的评价_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE22PAGE222012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A 我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):东北电力大学参赛队员(打印并签名):1.张鹏宁2.张学阳3.季本明指导教师或指导教师组负责人(打印并签名):日期:2012年9月10日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛 编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):PAGE21葡萄酒的评价摘要本文针对葡萄酒评价这个实际问题,以概率论数理统计和多元统计分析为基础,针对不同情况,分别建立了配对样本t检验模型、因子分析模型、典型相关性分析模型和逐步回归模型解决相关问题。针对问题(1),首先根据正态分布检验的Q-Q图得出评酒员对葡萄酒样品评定的平均分差值服从正态分布,再对分数平均分的差值进行配对样本t检验,在置信水平为0.05的情况下,求得两组评酒员对红葡萄酒和白葡萄酒的评价结果都有显著性差异;通过比较评酒员对葡萄酒的评分方差大小可得出第二组结果更可信。针对问题(2),为对酿酒葡萄进行分级,运用因子分析法,求出主因子,再进行因子旋转,应用因子分析模型去评价每种酿酒葡萄的重要性,算出酿酒葡萄的综合得分,根据综合得分的大小将酿酒葡萄分为4个级别,详细酿酒葡萄的分级情况见正文10页表4。针对问题(3),对酿酒葡萄与葡萄酒的理化指标进行典型相关性分析,分别在酿酒葡萄与葡萄酒的理化指标中提取有代表性的综合变量,利用综合变量之间的相关关系来反映两组指标之间的整体相关性,通过求解得出红葡萄酒与酿酒红葡萄的9个理化指标的相关系数都为1,说明两组指标具有很强的相关性;对白葡萄酒与酿酒白葡萄的理化指标应用相同方法分析,结果同样可以说明酿酒葡萄的理化指标与葡萄酒的理化指标正相关。针对问题(4),引入逐步回归模型,首先只考虑酿酒红葡萄和红葡萄酒的理化指标对红葡萄酒质量的影响,从回归结果来看,显著性水平小于0.05且最终残差为64.106,说明酿酒红葡萄和红葡萄酒的理化指标影响红葡萄酒的质量;再综合考虑酿酒红葡萄、红葡萄酒的理化指标及其芳香物质对红葡萄酒质量的影响,从回归结果来看,显著性水平小于0.05且最终残差为7.154,比只考虑酿酒红葡萄和红葡萄酒的理化指标所得到的残差小很多。文中也针对白葡萄酒及白葡萄给出了分析结果。综上说明虽然酿酒葡萄和葡萄酒的理化指标对葡萄酒的影响很大,但还不能完全用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,必需考虑芳香物质对葡萄酒质量的影响。关键词:理化指标;酿酒葡萄;葡萄酒;多元统计分析1.问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:(1)分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2.问题的分析在问题(1)中,已给出两组评酒员分别对27组红葡萄酒样品和28组白葡萄酒样品的评分,为分析评价结果有无显著差异,首先求出两组评酒员对每个葡萄酒样品所打总分,再求出两组评酒员对每个样品的平均分,分别对两组评酒员所评定的每个葡萄酒样品的平均分作差,再对红葡萄酒和白葡萄酒的平均分差值进行正态分布检验,因为差值服从正态分布且数据个数小于30个,所以对两组评酒员对葡萄酒平均分差值进行检验,通过t检验来判断两组评酒员对葡萄酒评价结果有无显著性差异;为了体现出两组中哪一组的结果更可信,分别对两组评酒员对红葡萄酒和白葡萄酒的评分求方差,通过比较评酒员对红葡萄酒的评分方差大小可得出第二组结果更可信。在问题(2)中,运用因子分析法,求出主因子解后,如果各个主因子的典型代表变量不是很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子,因子分析模型建立后,应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价,综合评价后可以求出各种酿酒葡萄的综合得分,按照综合得分的大小对酿酒葡萄进行分级。在问题(3)中,为了分析酿酒葡萄与葡萄酒的理化指标之间的联系,从总体上把握酿酒葡萄与葡萄酒的理化指标之间的相关联系,分别在酿酒葡萄与葡萄酒的理化指标中提取有代表性的综合变量,利用综合变量之间的相关关系来反映两组指标之间的整体相关性。在问题(4)中,引入逐步回归法对酿酒葡萄和葡萄酒的理化指标进行分析,逐步回归的基本思想是:考虑全部属性指标中按其对葡萄酒质量的贡献程度大小,由大到小地逐个引入回归方程,而对那些对葡萄酒质量作用不显著的属性指标不被引入回归方程。另外,已被引入回归方程的变量在引入新变量进行检验后失去重要性时,需要从回归方程中剔除。剔除后剩下的属性作为评价葡萄酒质量的指标,求出以酿酒葡萄和葡萄酒的代表属性指标为自变量,葡萄酒质量为因变量的回归方程,葡萄酒质量回归方程可以用酿酒葡萄和葡萄酒的理化指标对葡萄酒质量进行定量的评价,所以就可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。3.模型的假设与符号说明3.1模型的假设(1)评价两组评酒员的可信度时,忽略评酒员评总分差别不明显但单环节评分差别明显的的影响。(2)酿酒葡萄与葡萄酒的理化指标的高低与附录给出的各属性值有直接关系,数值越大,理化指标越高。(3)在一级指标能进行判断求解时,不考虑二级指标。3.2符号说明第一组评分中评酒员对第种酒的评分总和第二组评分中评酒员对第种酒的评分总和第一组中第种酒的平均得分第二组中第种酒的平均得分酒的种类数酿酒葡萄属性的相关矩阵酿酒葡萄的一级属性个数酿酒葡萄的载荷矩阵酿酒葡萄的第种属性的理化指标葡萄酒的第种属性的理化指标葡萄酒的一级属性个数公因子相对方差变量的共同度因子的贡献酿酒葡萄和葡萄酒的属性指标均值酿酒葡萄和葡萄酒的离差平方和4.模型的建立与求解4.1问题1的模型建立与求解4.1.1配对样本检验首先对两组评酒员对葡萄酒样品打分平均值进行正态分布检验,如果服从正态分布,则能对数据进行配对样本t检验。对两组数据进行比较时,由于数据是成对出现的且酒的品种之间存在差异,此时若采用二样本检验所得出的结论有可能是不对的,因此要转化为单样本检验,以红酒为例,首先求出第一组评分中评酒员对第种酒的评分总和和第二组评分中评酒员对第种酒的评分总和,每一组都对10个评酒员所得评分总和加权平均,求得两组评酒员对第种红葡萄酒评定的平均分为两组评酒员分别对第种红葡萄酒评的平均分差值为差值可以排除酒品质差异这个不可控制因素的影响,反映出两组评价结果的差异。通过对和的正态性分析,,,可知其中考察是否为零,即考察如下检验问题:根据单样本检验,检验的统计量为,其中为酒的种类数。给定显著性水平0.05,该检验问题的拒绝域是4.1.2模型的求解以红葡萄酒为例,首先对红葡萄酒每个样品的每组评酒员所评定的分数求平均值,对27个红葡萄酒的平均值进行正态分布检验,检验的Q-Q图如图1。从图形来看,点基本上在一条直线上,因此可认为评酒员对葡萄酒打分的均值服从正态分布。通过用MATLAB编程求得评酒员对红葡萄酒的统计量,显著性水平通过查t分布表可知,,故拒绝原假设,即两组评酒员对红葡萄酒的评价结果有显著性差异;求得评酒员对白葡萄酒的统计量,通过查t分布表可知,,故拒绝原假设,即两组评酒员对白葡萄酒的评价结果有显著性差异。图1正态分布检验的Q-Q图为了体现出两组中哪一组的结果更可信,分别对两组评酒员对红葡萄酒和白葡萄酒的评分求方差,求得的方差如下表所示:表1两组评酒员的评分求方差葡萄酒样品号第1组对红葡萄酒的评分方差第2组对红葡萄酒的评分方差第1组对白葡萄酒的评分方差第2组对白葡萄酒的评分方差19.63859.04869.60325.08726.30784.027714.17987.004836.76925.541819.108211.9369410.39446.42566.68666.488557.87473.695311.24485.126267.72874.595912.75584.7668710.1797.91696.25836.494486.63418.069113.54995.578795.73975.07289.631510.3086105.51366.014814.58358.3905118.41236.16813.30879.3714128.9255.012210.760511.834136.70323.910113.06786.83861464.81210.68753.9847159.25026.4311.47177.3515164.25444.483313.34179.0683179.38143.027712.00746.2013186.8717.089912.51185.4985196.88327.42676.81185.1034205.10346.25038.0257.07422110.7755.959113.1428.025227.11494.926111.77577.3212235.69994.97666.60723.4059248.65383.274510.54156.2084258.03886.61315.820510.3199265.59366.44648.538110.144277.05534.527712.01675.9628288.96975.0376为了更直观的体现出两组评酒员对红葡萄酒和白葡萄酒的评分的方差情况,用如下的图像反应出两组评酒员对酒评分的方差变化。图2评酒员对红葡萄酒的评分方差变化图3评酒员对白葡萄酒评分的方差变化通过对图1和图2图像的观察可以看出,第一组评酒员对红葡萄酒和白葡萄酒的评分方差曲线大致在第二组的之上,也就是第一组评酒员对红葡萄酒和白葡萄酒的评分方差除极个别外都比第二组评酒员的大,方差大的说明评分的波动性比较大,波动性大的反映出可信度比较小,所以第二组结果更可信。4.2问题2的模型建立与求解4.2.1因子分析法因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量来表示,通过此变量来对原始变量评价。针对此问题,把葡萄酒的质量看作是酿酒葡萄的一个附加指标,根据总的理化指标对酿酒葡萄分级。因子分析法求解分为以下步骤1)原始变量的选取。酿酒葡萄的一级指标为原始变量,多次求得的数据取平均值。2)对原始变量标准化处理并求相关阵。对于酿酒葡萄每列属性的数据进行标准化处理,并对于酿酒葡萄属性——酿酒葡萄属性结构求相关阵。3)求初始公共因子及因子载荷矩阵。设有个主成分,记为,酿酒葡萄理化指标记为,则主成分与原始变量之间存在如下关系式:(1)(1)式中,为随机向量的相关矩阵的特征值所对应的特征向量的分量,特征向量彼此正交,则矩阵可转化为:(2)对上面(1)(2)式只保留前个主成分而把后面的部分用代替,则(2)式变为:(3)之间相互独立,且与之间相互独立,把转化为公因子,令,则(3)式变为:即就得到了载荷矩阵和一组初始公因子。其中(4)因子旋转假设前提:公共因子的解释能力能够以其因子载荷平方的方差,即的方差来度量。用一个正交矩阵右乘,是旋转后的因子载荷阵结构简化,即使得每个变量仅在一个公共因子上有较大的载荷,而在其余的因子上载荷较小。下面求解正交阵。,为了计算方便,对于矩阵每次取两列进行全部配对旋转,为了说明问题先取列进行旋转令为正交阵。记经过如上变换,希望所得结果能使载荷矩阵的每一列元素的绝对值向1和0两极分化,或者说是因子的贡献尽量分散。这实际上就是希望把变量分成两部分,一部分主要与第一因子有关,另一部分主要与第二因子有关,也就是要求的方差要尽可能的大。定义相对方差为其中为变量的共同度,取是为了消除符号不同的影响,除以是为了消除各个变量对公共因子依赖程度不同的影响,现在要求总的方差达到最大,即要求使达到最大值,则求得其中而求解得到值,相似的再任取两列也进行相同的处理,一共进行次,所有的匹配都进行旋转,就完成了第一轮旋转,再根据所得结果进行第二轮旋转,直到相对方差改变不大时,停止旋转,得到新的一组公共因子及相应的因子载荷矩阵,使得其各列元素平方的相对方差之和最大。(5)因子得分建立以公共因子为因变量、原始变量为自变量的回归方程:用回归的思想求出线性组合系数的估计值,在最小二乘的意义下,得到的估计值其中,为转换后的载荷矩阵;为的酿酒葡萄——酿酒葡萄相关矩阵;为酿酒葡萄横向的原始向量,为公共因子的估计得分,用公共因子得分去描述原始变量取值,即可以根据此值对酿酒葡萄的排名。4.2.2模型的求解第一步,对原始数据标准化。因为酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄的分级有影响,为把问题简化,也把葡萄酒的质量作为酿酒葡萄的一个指标。第二步,用SPSS标准化的数据进行因子分析。第三步,对输出结果分析——选取主因子,具体选取因子的初始特征值数据如下表2所示。选择以主成分法作为因子提取方法,选定因子提取标准是:特征值≥1。由表2可知,有8个满足条件的特征值,它们对样本方差的累计贡献率达到了83.931%,代表了绝大部分信息,因此提取8个因子便能够对所分析的问题进行很好的解释。表2选取因子的初始特征值因子初始特征值特征根方差贡献率累计方差贡献率16.97723.25723.25724.65615.51938.77633.85012.83351.60942.9809.93361.54252.0476.82468.36561.7755.91874.28471.5035.00979.29381.3914.63883.931第四步,计算主因子得分和综合得分,根据计算每个样品的主因子得分,把主因子得分线性加和作为综合得分,其中主因子系数为主因子的贡献率占8个主因子贡献率的比值。表3主因子得分和综合得分样品号第1主因子第2主因子第3主因子第4主因子第5主因子第6主因子第7主因子第8主因子综合得分11.17610.01122.94220.1299-1.1200.0618-1.877-0.4160.6321.1830.52590.4550-0.733-0.8231.9612-0.361-0.3300.4630.7032.3410-0.766-0.150-0.6990.25222.5354-0.1050.564-0.636-0.328-0.309-0.279-0.422-0.568-0.438-0.033-0.4250.3589-0.091-0.216-0.1271.62400.1155-0.3451.00940.22第五步,把样品通过SPSS聚类后,以每类平均综合得分作为分级指标,将酿酒葡萄分为五个等级,综合得分在的为一级葡萄,综合得分在的为二级葡萄,综合得分在的为三级葡萄,综合得分小于0的为四级葡萄,分级结果如下表所示:表4酿酒葡萄的分级红葡萄序号综合得分葡萄等级白葡萄序号综合得分葡萄等级230.82一级270.95一级90.74一级240.68二级10.63二级30.29三级30.56二级100.29三级80.55二级50.28三级20.46二级260.27三级170.4二级280.2三级110.25三级90.18三级50.22三级250.13三级240.19三级230.12三级140.04三级220.12三级22-0.06四级120.11三级6-0.07四级200.05三级21-0.12四级150.05三级20-0.18四级170.01三级26-0.2四级20三级12-0.22四级21-0.01四级16-0.27四级19-0.04四级19-0.28四级6-0.07四级13-0.32四级13-0.11四级10-0.34四级11-0.19四级18-0.35四级4-0.26四级4-0.42四级1-0.34四级15-0.44四级18-0.43四级27-0.5四级14-0.44四级7-0.53四级7-0.52四级25-0.6四级8-0.63四级16-0.68四级4.3问题3的模型建立与求解4.3.1典型相关性分析为了从总体上把握两组指标之间的相关联系,分别在两组变量中提取有代表性的综合变量,利用综合变量之间的相关关系来反映两组指标之间的整体相关性,从而得出酿酒葡萄和葡萄酒理化指标的联系。在比较酿酒葡萄和葡萄酒的相关性时,将酿酒葡萄和葡萄酒看作是两个向量和,,属性的理化指标,借助主成分分析的思想,分别对酿酒葡萄和葡萄酒各属性的理化指标寻找线性组合如下:使生成的新的综合变量能代表原始变量。令则有,可求得的协方差矩阵为:其中,是阶矩阵,它是的协方差矩阵,是阶矩阵,它是的协方差矩阵,是与之间的协方差阵。根据典型相关分析的基本理论,在给定及给定的条件下,选取使与之间的相关系数为使得相关系数达到最大。由于随机变量乘以任意常数不改变它们的相关关系,则限定取标准化的随机变量是,并规定它们的方差为1,即得到在一切是方差为1的线性组合与中,其中两者相关系数最大的与称为第一对典型相关变量,它们的相关系数称为第一典型相关系数,以此来说明酿酒葡萄和葡萄酒的相关系数,由于相关变量与相关系数不是唯一的因此类似的可以求出第二典型相关系数、第三典型相关系数等,求出所有的相关系数,通过相关系数,能知道酿酒葡萄与葡萄酒的理化指标的相关性。4.3.2模型的求解通过MATLAB编程得到红葡萄的理化指标与红葡萄酒的理化指标典型相关系数和白葡萄的理化指标与白葡萄酒的理化指标典型相关系数如表5所示。表5典型相关系数11111111111111111红葡萄的理化指标与红葡萄酒的理化指标有9对典型相关向量,白葡萄的理化指标与白葡萄酒的理化指标有8对典型相关向量,红葡萄的典型相关向量相关图像如图4所示。图4第一对典型相关向量相关图,清晰表达了U(:,1)和V(:,1)的高相关性,通过两个典型相关系数,可得到酿酒葡萄的理化指标与葡萄酒的理化指标有很强的相关性,即酿酒葡萄的理化指标与葡萄酒的理化指标是正相关。图4第一对典型相关向量U(:,1)和V(:,1)的相关图4.4问题4的模型建立与求解4.4.1逐步回归法逐步回归分析时在考虑全部属性指标中按其对葡萄酒质量的贡献程度大小,由大到小地逐个引入回归方程,而对那些对葡萄酒质量作用不显著的属性指标不被引入回归方程。另外,已被引入回归方程的变量在引入新变量进行检验后失去重要性时,需要从回归方程中剔除出去,具体的计算方法如下:步骤1,根据全部自变量中按其对葡萄酒质量的贡献程度大小,根据方差贡献率大小取出酿酒葡萄和葡萄酒的30个比较重要的属性指标作为自变量,剩余的属性即为对葡萄酒质量作用不显著变量,不引入。计算酿酒葡萄和葡萄酒的属性指标的均值和离差平方和,记各自的标准化变量为其中为的算术平均值。步骤2,计算的相关系数矩阵步骤3,已经选上了30个变量:,确定,即引进与剔除变量的检验值,引进变量,求,即求算所有偏回归平方和通过结果得出的最大值;再进行变量检验,引入如果,则引进的第一个变量为;如果,则引进变量结束。步骤4,经求解求逆紧凑变换法可求得,再次引入一个变量,求算找出最大值,又引进变量检验,再求一个检验值如果则再引进变量,如果,则引进变量工作结束。步骤5,剔除变量,由于变量刚刚引进,现只需对作检验求取,再进行剔除检验,检验值计算如下式:当时,不应剔除变量,并继续引进新的变量;当时,应剔除变量,并对做变换,若时,则终止剔除检验,继续引进新的变量;如果时,则继续做剔除检验,直到没有不显著变量存在为止。反复进行第四步和第五步,直到引进变量结束为止。步骤6,最终选了个变量,经过变换后为求出的偏回归系数,则对应的回归方程为:4.4.2模型的求解表6红葡萄和红葡萄酒理化指标方差分析平方和df均方F显著水平1回归200.29381200.293823.71573.000a残差211.1403258.4456112回归261.12062130.560320.84608.000b残差150.3135246.2630623回归294.1551398.0516819.22926.000c残差117.279235.0990884回归331.1682482.7920522.69239.000d残差80.26589223.648455回归347.3282569.4656422.75578.000e残差64.10585213.05266通过SPSS中分析菜单中的回归做线性回归分析,用结果中的方差分析解释酿酒葡萄、葡萄酒的理化指标对葡萄酒质量的影响。表6中显著水平的值小于0.05,可以说这条回归直线在总体水平上也是合理的。从回归结果来看,显著性水小于0.05.说明二者的相关性是正相关且显著,最终残差为64.106。表7红葡萄理化指标感化指标方差分析平方和df均方F显著水平1回归200.29381200.293823.71573.000a残差211.1403258.4456112回归261.53262130.766320.93635.000b残差149.9015246.24589610回归398.85981039.8859850.75269.000j残差12.57423160.78588911回归401.82151136.5292357.00222.000k残差9.61258150.64083912回归404.28051233.6900465.93365.000l残差7.153564140.510969表7中显著水平的值小于0.05,可以说这条回归直线在总体水平上也是合理的。从回归结果来看,显著性水小于0.05.说明二者的相关性是正相关,且显著,最终残差为7.154,比表6中的残差小。表8白葡萄理化指标方差分析平方和df均方FSig.1回归73.23435173.234359.604663.005a残差198.2467267.624874表8中显著水平的值不小于0.05,回归直线在总体水平上不合理,最终残差为198.247。表9白葡萄理化指标感官指标方差分析平方和df均方F显著水平1回归73.23435173.234359.604663.005a残差198.2467267.6248742回归104.649252.324497.840891.002b残差166.8321256.673284表9中显著水平的值小于0.05,可以说这条回归直线在总体水平上也是合理的。从回归结果来看,显著性水小于0.05.说明二者的相关性是正相关,且显著,最终残差为166.832,比表8中的残差小。经过对上述4个表的分析可知,酿酒葡萄、葡萄酒和芳香物质的理化指标比酿酒葡萄和葡萄酒的理化指标更好的反映了葡萄酒的质量,虽然酿酒葡萄和葡萄酒的理化指标对葡萄酒的影响很大,但还不能完全用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。5.模型结果的分析与检验针对问题一,在规定显著性水平的情况下,红葡萄酒和白葡萄酒的统计量均比t分布表查得的数据大,说明评价结果有显著性差异,通过绘制两组结果的方差图,一组评分的方差几乎都比二组评分的方差大,说明二组的评分波动性小,可信度高。针对问题二,通过因子分析求出葡萄的综合得分,聚类后以每类平均综合得分作为分级指标,得到相应的级别。针对问题三,红葡萄与红葡萄酒的理化指标有9对典型相关向量,白葡萄与白葡萄酒的理化指标有8对典型相关向量,它们的相关系数均为1,则酿酒葡萄的理化指标与葡萄酒的理化指标是正相关关系。葡萄品质好,酿出酒质量高,与实际相符。针对问题四,酿酒葡萄和葡萄酒理化指标在一定程度上反映了葡萄酒的质量,与之是正相关关系,但还不能完全用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。这也与实际相符合,经查阅资料葡萄酒质量的好坏与葡萄酒的品质、酿酒葡萄的品质有关,但还与制作工艺、酒所含的芳香物质等因素的影响。6.模型的推广与改进方向针对问题一模型,根据对酒的平均得分和每个评酒员的打分可以求出评酒员之间的差异性和可信度。针对问题二模型,模型没有考虑二级指标,可以先根据一级指标分类后,再根据二级指标将同一类的葡萄分出子类,使分类结果更详细。针对问题三模型,可以求出酿酒葡萄与葡萄酒单一理化指标之间的联系,从而确定酒的属性是有葡萄的那些属性决定的。针对问题四模型,葡萄酒的质量不能真正的评价葡萄酒的价值,评价差异还与评酒员的自己的评价尺度、给分区间、评价方向有关、还可以通过标准化等方法消除或尽量减弱此差别,即消除因为评酒员的差异对葡萄酒最后质量的影响,使结果更有说服力。7.模型的优缺点优点:(1)针对成对出现的数据,相比其它方法成对数据检验方法准确性更高。(2)因子分析模综合因子的权重不是主观赋值而是根据各自的方差贡献率大小来确定的,避免了人为确定权重的随意性,使得评价结果唯一,而且较为客观合理。(3)典型相关分析将较多变量转化为少数几个典型变量,使问题简化。(4)逐步回归模型确定的方程中不包含不显著的自变量,使计算过程简化。缺点:(1)因子分析工作量比较大,分析中数据出现错误不易发现。(2)聚类分析模型对于分类结果不确定,唯一性较差。参考文献[1]姜启源.数学模型(第三版)[M].北京:高等教育出版社,1999.[2]韩中庚.数学建模方法及其应用(第二版)[M].北京:高等教育出版社,2009.[3]茆诗松.概率论与数理统计(第二版).北京:高等教育出版社,2011.[4]何晓群.多元统计分析(第二版).北京,中国人民出版社,2010.

附录附录一正态分布检验程序MATLAB程序loadmute=muW-muWW;a=te;figure(1);hist(a);figure(2);normplot(a);[muhat,sigmahat,muci,sigmaci]=normfit(a)[h,sig,ci]=ttest(a,muhat)附录二对平均分差值的t检验MATLAB程序clear,clcloadmatlabd=[51068166882211]';dd=[dddddddddd];ddd=[];fori=1:27ddd=[ddd;dd];endzR=R(:,2:end).*ddd;zRR=RR(:,2:end).*ddd;zW=W(:,2:end).*[ddd;dd];zWW=WW(:,2:end).*[ddd;dd];muR=[];muRR=[];muW=[];muWW=[];fori=1:27n=10*i-10;muR=[muR;mean(sum(zR(n+1:n+10,:)))];muRR=[muRR;mean(sum(zRR(n+1:n+10,:)))];endfori=1:28n=10*i-10;muW=[muW;mean(sum(zW(n+1:n+10,:)))];muWW=[muWW;mean(sum(zWW(n+1:n+10,:)))];endd1=mean(muR-muRR)d3=mean(muW-muWW)sd1=(sum(((muR-muRR)-d1).^2)/26)^(1/2)sd3=(sum(((muW-muWW)-d3).^2)/27)^(1/2)t1=d1/(sd1/sqrt(27))t3=d3/(sd3/sqrt(28))musR=[];musRR=[];musW=[];musWW=[];fori=1:27n=10*i-10;musR=[musR;std(sum(zR(n+1:n+10,:)))];musRR=[musRR;std(sum(zRR(n+1:n+10,:)))];endfori=1:28n=10*i-10;musW=[musW;std(sum(zW(n+1:n+10,:)))];musWW=[musWW;std(sum(zWW(n+1:n+10,:)))];endplot(1:27,musR,'--')holdonplot(1:27,musRR,':r')holdonxlabel('ÑùÆ·ºÅ')ylabel('·½²î')plot(1:28,musW,'--')holdonplot(1:28,musWW,':r')holdonxlabel('ÑùÆ·ºÅ')ylabel('·½²î')附录三对红葡萄的各项理化指标进行的标准化后得到的数据130313233342-0.39110.35623.0865-1.4103-0.6073-0.5259-1.11891.10240.98660.87614-0.249-0.31630.58861.00021.02695-0.13610.2333-0.3517-0.60680.17226-0.3255-0.04150.07130.03330.39857-0.10330.0308-0.6385-0.1165-1.059580.0569-0.0704-0.7529-0.2119-1.31099-0.3656-0.10662.8451-0.1029-1.134910-0.20530.02360.53961.15011.9319110.556-0.3091-0.54230.1559-0.4311124.82154.4635-1.096-0.4025-2.241130.04960.1031-0.7819-2.6088-0.556814-0.402-1.0394-0.27730.2103-0.431115-0.2418-0.0994-0.0522-0.00760.524216-0.19440.1031-0.6149-1.9551-1.210417-0.3438-0.3235-0.40250.2512-0.154618-0.31460.0886-0.12840.85041.0018190.63970.6165-0.8346-1.7917-1.285820-0.4603-1.1623-0.28270.75510.524221-0.2855-0.5115-0.82370.75511.328622-0.30730.29110.21650.55080.423623-0.12880.1682-0.05580.56440.272824-0.07420.05250.65221.70841.655425-0.39470.11760.02770.67340.247726-0.2126-0.808-0.4588-0.5251-0.581927-0.362-0.0921-0.48970.10140.3734附录四对红葡萄的各项理化指标进行的标准化后得到的数据3031321-0.84651.4880.431420.1748-0.0117-0.230930.93422.1224-0.29441.05510.98810.11652.5981-0.62691.566760.6885-1.1268-0.32557-0.2180.6228-0.73558-1.207-0.55-1.33479-0.498-0.26161.219810-0.11930.00761.0306110.2574-0.377-1.618512-1.342-2.1073-1.303113-0.788-1.6074-0.8301140.6341-0.43460.179115-0.357-0.35770.589116-2.186-0.0501-2.911517-0.26030.87271.1882180.0439-0.22320.052919-1.4548-0.3962-0.041720-0.03870.68050.0214211.0390.41130.841322-0.2663-0.62690.9044231.07730.31520.273724-0.4396-0.1847-0.136325-0.37710.54590.936260.55551.3534-0.703927-0.1777-1.81890.1475281.51841.35340.9675附录五红葡萄主因子得分及综合得分样品序号主因子1主因子2主因子3主因子4主因子5主因子6主因子7主因子8综合得分1.001.180.012.940.13-1.120.06-1.88-0.420.632.001.180.530.46-0.73-0.821.96-0.36-0.330.463.000.702.34-0.77-0.15-0.700.252.54-0.110.564.00-0.64-0.33-0.31-0.28-0.42-0.57-0.44-0.03-0.425.000.36-0.09-0.22-0.131.620.12-0.351.010.226.00-0.221.68-0.34-0.230.11-1.05-0.35-0.93-0.077.00-0.870.220.10-0.49-1.15-1.09-0.50-0.33-0.538.00-0.47-0.063.270.171.00-0.392.220.270.559.002.87-0.54-0.590.12-0.790.14-0.371.260.7410.000.22-1.83-0.600.91-0.54-0.290.48-2.97-0.3411.00-1.120.01-0.254.52-0.400.72-0.020.510.2512.00-1.111.87-0.10-0.250.26-0.38-0.86-0.21-0.2213.00-0.40-0.71-0.63-0.41-0.751.020.88-0.51-0.3214.00-0.37-0.701.09-0.300.490.411.580.580.0415.00-0.38-0.760.11-0.36-0.27-2.06-0.620.96-0.4416.00-0.54-0.410.18-0.38-1.131.26-0.940.88-0.2717.000.640.99-0.420.182.17-0.80-0.04-0.030.4018.00-1.060.900.030.06-0.08-0.70-1.00-0.38-0.3519.00-0.08-0.48-0.28-0.91-0.540.101.09-0.90-0.2820.00-0.390.10-1.02-0.601.111.72-0.30-0.70-0.1821.000.08-0.31-1.13-0.02-1.54-0.801.032.54-0.1222.00-0.511.080.07-0.21-0.750.97-0.53-0.39-0.0623.002.450.02-0.260.890.90-0.690.02-1.020.8224.000.460.03-0.360.201.24-0.40-0.830.820.1925.00-0.31-1.87-0.55-0.560.33-1.360.07-0.57-0.6026.00-0.71-1.15-0.18-0.421.861.82-0.570.70-0.2027.00-0.94-0.54-0.21-0.76-0.110.030.050.27-0.50附录六白葡萄主因子得分及综合得分序号主因子1主因子2主因子3主因子4主因子5主因子6主因子7主因子8主因子9主因子10主因子11综合得分10.13-0.45-1.77-1.280.84-0.110.820.12-0.88-0.790.24-0.3420.45-0.830.43-0.430.03-0.64-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论