数学建模2012a_第1页
数学建模2012a_第2页
数学建模2012a_第3页
数学建模2012a_第4页
数学建模2012a_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1概率统计在数学建模概率统计在数学建模 中的应用中的应用 以以20122012年全国大学生数年全国大学生数 学建模竞赛学建模竞赛( (本科组本科组) )A 题为例题为例2问题重述问题重述3问题问题1的求解的求解 在题目给出的原始数据中还有一个缺失值和一个异常值,在数据预测处理中在题目给出的原始数据中还有一个缺失值和一个异常值,在数据预测处理中可用正常值的平均值代替缺失值或异常值,这样问题可用正常值的平均值代替缺失值或异常值,这样问题1 1 就可以分解为统计中的就可以分解为统计中的“有两批产品,分别经过两次检验,求两批产品是否有显著差异有两批产品,分别经过两次检验,求两批产品是否有显著差异? ?

2、 哪次检验更可哪次检验更可靠靠”的经典模型。的经典模型。 仔细研究题目,看到仔细研究题目,看到“著性差异著性差异”的字眼,我们自然会想起概率论与数理统的字眼,我们自然会想起概率论与数理统计中的计中的“假设检验假设检验”和和“方差分析方差分析”部分。只要把问题转化为概率统计中假设部分。只要把问题转化为概率统计中假设检验或方差分析模型,便能得到相应的结论。检验或方差分析模型,便能得到相应的结论。 显然,对于第一问,可以转化为假设检验问题,也可以转化为方差分析问显然,对于第一问,可以转化为假设检验问题,也可以转化为方差分析问题。在做这些工作之前,需要对数据进行正态分布检验。由于所给数据是评分,题。在

3、做这些工作之前,需要对数据进行正态分布检验。由于所给数据是评分,在求解第一问时也可以用秩和检验模型。在求解第一问时也可以用秩和检验模型。 对于第二问,评分标准要求方差较小对于第二问,评分标准要求方差较小的结果更可靠。的结果更可靠。4问题问题2的求解的求解 在分类之前,必须给出分类标准,而题目不会给出相应标准,查阅相关资料给出在分类之前,必须给出分类标准,而题目不会给出相应标准,查阅相关资料给出的分类标准也未必满足本题的要求,因此需要自己建立一个分类标准。解决这一问题的分类标准也未必满足本题的要求,因此需要自己建立一个分类标准。解决这一问题的一个方法,可以考虑多元统计分析中的的一个方法,可以考虑

4、多元统计分析中的聚类分析聚类分析方法,把酿酒葡萄的相关数据方法,把酿酒葡萄的相关数据进行聚类,从聚类结果中分析每类的数据特征,最后得到相应的分类标准。进行聚类,从聚类结果中分析每类的数据特征,最后得到相应的分类标准。 问题问题2 2是对酿酒葡萄进行分级,这本质上是一个是对酿酒葡萄进行分级,这本质上是一个分类分类问题。问题。 在聚类分析之前需要问题解决在聚类分析之前需要问题解决: : (1) (1) 所给数据指标太多且有一级指标和二级指标所给数据指标太多且有一级指标和二级指标; ; (2) (2) 如何确定聚类分析中的类别数。如何确定聚类分析中的类别数。5 对于对于(1)(1),可以先用,可以先

5、用层次分析法层次分析法把不同级别的指标统一成同一级别的指标,把不同级别的指标统一成同一级别的指标,鉴于该方法在构造一致互反矩阵时主观因素较强,可以用多元统计分析中的鉴于该方法在构造一致互反矩阵时主观因素较强,可以用多元统计分析中的主主成分分析成分分析方法通过提取第一主成分把两个级别的指标统一到同一个级别,然后方法通过提取第一主成分把两个级别的指标统一到同一个级别,然后再一次用主成分分析方法对数据进行降维处理再一次用主成分分析方法对数据进行降维处理 对于问题对于问题(2) (2) 需要参考比较专业的聚类分析理论相关文献或其它行业标准需要参考比较专业的聚类分析理论相关文献或其它行业标准才能解决才能

6、解决6 为了研究酿酒葡萄与葡萄酒的理化指标之间的相关性,可以采用多元统计分析为了研究酿酒葡萄与葡萄酒的理化指标之间的相关性,可以采用多元统计分析中的中的典型相关分析典型相关分析方法,令酿酒葡萄为输入变量,葡萄酒为输出变量,建立方法,令酿酒葡萄为输入变量,葡萄酒为输出变量,建立典型相关分析模型,然后提取典型相关变量进行分析得到结论。典型相关分析模型,然后提取典型相关变量进行分析得到结论。 也可以对葡萄的也可以对葡萄的3030个理化指标进行个理化指标进行主成分分析法主成分分析法,得到葡萄一些具有代,得到葡萄一些具有代表性的理化指标,然后建立葡萄的理化指标与葡萄酒的表性的理化指标,然后建立葡萄的理化

7、指标与葡萄酒的7 7个理化指标之间的个理化指标之间的多元多元线性回归方程线性回归方程,进而得到了酿酒葡萄与葡萄酒理化指标之间的定量联系。,进而得到了酿酒葡萄与葡萄酒理化指标之间的定量联系。 还可以用还可以用偏最小二乘回归分析偏最小二乘回归分析法解答此问法解答此问问题问题3的求解的求解7问题问题4的求解的求解 本问题是分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能本问题是分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。由于所给的数据自变量太多,否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。由于所给的数据自变量太多,因此可以考虑多

8、元统计分析中的因此可以考虑多元统计分析中的逐步回归分析方法进行因子筛选逐步回归分析方法进行因子筛选,其,其具体过程如下具体过程如下: : (1) (1) 建立多元线性回归方程建立多元线性回归方程; ; (2) (2) 进行回归系数显著性检验,取进行回归系数显著性检验,取t t值对应最大概率值对应最大概率Pmax; Pmax; (3) (3) 判断判断PmaxPmax0.05( 0.05( 即取即取 = 0.05) = 0.05) 是否成立,若成立进入第是否成立,若成立进入第5 5 步,否则进步,否则进 入第入第4 4 步步; ; (4) (4) 接受接受H0H0,即这个指标与因变量线性关系不显

9、著,将指标剔除,返回第一步,即这个指标与因变量线性关系不显著,将指标剔除,返回第一步; ; (5) (5) 拒绝拒绝H0H0,则所有指标与因变量线性关系显著,输出方程,结束。,则所有指标与因变量线性关系显著,输出方程,结束。8问题问题1.1. 附件附件1 1中给出的是评酒员对中给出的是评酒员对2727种红葡萄酒和种红葡萄酒和2828种白葡萄酒的两组品评结种白葡萄酒的两组品评结果。这两组评酒员各不相同,两组中的每个酒样都取自相同葡萄酒厂家的同一批果。这两组评酒员各不相同,两组中的每个酒样都取自相同葡萄酒厂家的同一批次的产品。要求学生给出判断这两组评价结果好坏的原理、模型和方法,给出具次的产品。要

10、求学生给出判断这两组评价结果好坏的原理、模型和方法,给出具体的结果,并对结果进行说明。好的品评结果应该是对同一酒样评价时这些评酒体的结果,并对结果进行说明。好的品评结果应该是对同一酒样评价时这些评酒员之间的差距小、且这些酒样之间的区分度明确(注:一些学生的模型和方法仅员之间的差距小、且这些酒样之间的区分度明确(注:一些学生的模型和方法仅考虑评酒员的打分差距)。考虑评酒员的打分差距)。 参考:红酒中样品参考:红酒中样品2323是好酒,样品是好酒,样品1212是较差的酒。是较差的酒。评分要点评分要点9 在问题一中,答案是固定的,也就是显著和可信的问题,不管什么方法,但在问题一中,答案是固定的,也就

11、是显著和可信的问题,不管什么方法,但关键的还是说明假设检验的原理的判据,为什么要用这种方法,合适吗?所以,关键的还是说明假设检验的原理的判据,为什么要用这种方法,合适吗?所以,评分要点有以下几处:评分要点有以下几处: (1) (1) 数据的处理,包括缺失和异常数据,说明你处理的方法。数据的处理,包括缺失和异常数据,说明你处理的方法。 (2)(2)检验模型的假设进行检验,例如样本的正态分布检验等检验模型的假设进行检验,例如样本的正态分布检验等 (3)(3)在前面的基础上,有些统计的方法不太适用,这时候要介绍你的方法原理和在前面的基础上,有些统计的方法不太适用,这时候要介绍你的方法原理和为什么要这

12、么做。为什么要这么做。 (4)(4)显著性分析和可信性分析。这里面可能不同的方法结果不太一致,这时候要显著性分析和可信性分析。这里面可能不同的方法结果不太一致,这时候要利用多个检验方法进行综合分析和考虑,给出较好的结果。利用多个检验方法进行综合分析和考虑,给出较好的结果。 (5)(5)由于评酒员都是感官评价的结果,前面是分两组样本分析的,这里可以针对由于评酒员都是感官评价的结果,前面是分两组样本分析的,这里可以针对每组评酒员的差异进行分析,即给出每个评酒员的品酒差异进行分析。所以,第每组评酒员的差异进行分析,即给出每个评酒员的品酒差异进行分析。所以,第一问应该越详细越好。这一问解决的感官评价的

13、问题。一问应该越详细越好。这一问解决的感官评价的问题。 10问题问题2.2. 给出根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒给出根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级的原则、模型、算法和结果。确定酿酒葡萄质量好坏的葡萄进行分级的原则、模型、算法和结果。确定酿酒葡萄质量好坏的主要依据是问题主要依据是问题1 1中评酒员对酒的质量的评价结果,根据这个评价结中评酒员对酒的质量的评价结果,根据这个评价结果和酿酒葡萄的各种理化指标给出确定葡萄质量的模型,由此给出这果和酿酒葡萄的各种理化指标给出确定葡萄质量的模型,由此给出这些酿酒葡萄的分级结果。些酿酒葡萄的分级结果。 参考:分级结果

14、中好的红葡萄应包含样品参考:分级结果中好的红葡萄应包含样品2323,差的应该包含样品,差的应该包含样品1212。11 在问题二中,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行在问题二中,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。这里的方法较多,例如模糊综合评判,神经网络,聚类等。每种方法都有分级。这里的方法较多,例如模糊综合评判,神经网络,聚类等。每种方法都有自己的局限性,而且分级的个数也会有很大差异,这时候就要对自身的模型进行自己的局限性,而且分级的个数也会有很大差异,这时候就要对自身的模型进行分析和判断。分析和判断。关键点(关键点(1 1)无论哪种方法,酿酒葡萄

15、的理化指标和葡萄酒的质量必须要说明清楚)无论哪种方法,酿酒葡萄的理化指标和葡萄酒的质量必须要说明清楚(2 2)模型本身的优缺点和适用范围进行分析明确)模型本身的优缺点和适用范围进行分析明确(3 3)分级结果中应该对不同的酿酒葡萄进行明确的区分,例如哪种葡萄能造哪种)分级结果中应该对不同的酿酒葡萄进行明确的区分,例如哪种葡萄能造哪种级别的酒可以分析出来。参考答案中说明级别的酒可以分析出来。参考答案中说明2323和和1212其实是不一类的,只是一个参考,其实是不一类的,只是一个参考,不同的分级数和不同的方法可能分的不是很明显,但能把样本中大多数好坏分开不同的分级数和不同的方法可能分的不是很明显,但

16、能把样本中大多数好坏分开(4 4)最好能给出酿酒葡萄分级标准中影响较大的理化指标和相应的分级标准即哪)最好能给出酿酒葡萄分级标准中影响较大的理化指标和相应的分级标准即哪种理化指标对应哪种级别的酿酒葡萄等。这一问是问题的关键,建立了酿酒葡萄种理化指标对应哪种级别的酿酒葡萄等。这一问是问题的关键,建立了酿酒葡萄的分级标准,将酒的评价深入到理化指标和原料上。的分级标准,将酒的评价深入到理化指标和原料上。 12问题问题3.3. 给出分析酿酒葡萄与葡萄酒的成分之间关系的给出分析酿酒葡萄与葡萄酒的成分之间关系的原理、模型和方法,得到葡萄酒的理化指标是否与葡萄原理、模型和方法,得到葡萄酒的理化指标是否与葡萄

17、的理化指标相关的结论,相关时给出具体的依赖关系。的理化指标相关的结论,相关时给出具体的依赖关系。求解时最好先对葡萄的理化指标(包括芳香物质)进行求解时最好先对葡萄的理化指标(包括芳香物质)进行分类和筛选,然后进行评价。注:仅把葡萄的全部理化分类和筛选,然后进行评价。注:仅把葡萄的全部理化指标进行简单回归不够完整。指标进行简单回归不够完整。 13 在问题三中,结论是得到葡萄酒的理化指标是否与葡萄的理化指标相关,这里在问题三中,结论是得到葡萄酒的理化指标是否与葡萄的理化指标相关,这里有很多人开始困惑,芳香物质该不该用。但其实关键点不在这里,根据附件(有很多人开始困惑,芳香物质该不该用。但其实关键点

18、不在这里,根据附件(2 2)的数据和参考答案中的的数据和参考答案中的“分类葡萄的理化指标(包括芳香物质)分类葡萄的理化指标(包括芳香物质)”是有一定矛盾的,是有一定矛盾的,不过影响不大,因为在第四问中你必须要用到芳香物质的。这里的方法也有很多,不过影响不大,因为在第四问中你必须要用到芳香物质的。这里的方法也有很多,像相关性分析,主成分,逐步分析等。问题的评分点主要在以下几处像相关性分析,主成分,逐步分析等。问题的评分点主要在以下几处(1 1)求解时最好先对葡萄的理化指标进行分类和筛选,然后进行评价。例如主成)求解时最好先对葡萄的理化指标进行分类和筛选,然后进行评价。例如主成分分析,或者把理化指

19、标分为内部指标和外部指标等分分析,或者把理化指标分为内部指标和外部指标等(2 2)给出分析酿酒葡萄与葡萄酒的成分之间关系的原理、模型和方法,这点考察)给出分析酿酒葡萄与葡萄酒的成分之间关系的原理、模型和方法,这点考察了所引用方法的合理性,不是简单的把方法套下就得出结果了所引用方法的合理性,不是简单的把方法套下就得出结果(3 3)给出具体的依赖关系,例如函数式,并对结果进行检验,例如系数检验,残)给出具体的依赖关系,例如函数式,并对结果进行检验,例如系数检验,残差检验,拟合度等差检验,拟合度等(4 4)最好对红葡萄和白葡萄进行比较,回归出来的结果是有差异的。这里主要考)最好对红葡萄和白葡萄进行比

20、较,回归出来的结果是有差异的。这里主要考察的是一个筛选和回归的问题,最忌讳直接把所有指标进行拟合回归等。察的是一个筛选和回归的问题,最忌讳直接把所有指标进行拟合回归等。14问题问题4.4. 建立模型分析酿酒葡萄和葡萄酒的理化指标与葡建立模型分析酿酒葡萄和葡萄酒的理化指标与葡萄酒质量之间的关系,在模型的基础上给出具体结论,并萄酒质量之间的关系,在模型的基础上给出具体结论,并对结论给出详细的分析说明。对结论给出详细的分析说明。 注:评价葡萄酒质量时不一定需要包含所有的理化指标,注:评价葡萄酒质量时不一定需要包含所有的理化指标,但根据经验知道花色苷、总酚和单宁是红葡萄酒的重要指但根据经验知道花色苷、

21、总酚和单宁是红葡萄酒的重要指标。标。15 在问题四中,要求建立模型分析酿酒葡萄和葡萄酒的理化指标与葡萄酒质量在问题四中,要求建立模型分析酿酒葡萄和葡萄酒的理化指标与葡萄酒质量之间的关系,在模型的基础上给出具体结论,并对结论给出详细的分析说明。这之间的关系,在模型的基础上给出具体结论,并对结论给出详细的分析说明。这里面把葡萄酒的质量和酿酒葡萄和葡萄酒的理化指标联系起来,这和前面的前三里面把葡萄酒的质量和酿酒葡萄和葡萄酒的理化指标联系起来,这和前面的前三问是有联系的,第二问是葡萄酒质量与葡萄理化指标的联系,第三问是葡萄与葡问是有联系的,第二问是葡萄酒质量与葡萄理化指标的联系,第三问是葡萄与葡萄酒理

22、化指标的联系,第一问是品酒员感官评价的质量结果,而最终的要求是让萄酒理化指标的联系,第一问是品酒员感官评价的质量结果,而最终的要求是让你建立一套葡萄酒质量评价的综合模型。所以这一问是整道题的升华。主要是参你建立一套葡萄酒质量评价的综合模型。所以这一问是整道题的升华。主要是参考国内方面对于质量评价所引用的指标和自己分析出来的指标进行分析,显然芳考国内方面对于质量评价所引用的指标和自己分析出来的指标进行分析,显然芳香物质是必须考虑的。这里的要点估计应该有以下几点香物质是必须考虑的。这里的要点估计应该有以下几点(1)(1)考虑和分析芳香物质的作用和感官评价质量以及理化指标的关系考虑和分析芳香物质的作

23、用和感官评价质量以及理化指标的关系(2)(2)感官评价较为主观,最好给出部分感官评价中的一些感官评价指标感官评价较为主观,最好给出部分感官评价中的一些感官评价指标(3)(3)把芳香物质考虑进去后,建立质量与感官评价指标和理化指标的综合评价体系把芳香物质考虑进去后,建立质量与感官评价指标和理化指标的综合评价体系(4)(4)通过你的评价体系能鉴别出什么样的葡萄,感官指标的范围,理化指标的范围通过你的评价体系能鉴别出什么样的葡萄,感官指标的范围,理化指标的范围对质量的影响和相应的范围。对质量的影响和相应的范围。 16 很多人解决问题往往只是把问题解决,而没有考虑专家最终的目的是让你给很多人解决问题往往只是把问题解决,而没有考虑专家最终的目的是让你给出葡萄酒质量评价的较好方法。根据参考文献和经验得到:糖、酸、单宁、色素出葡萄酒质量评价的较好方法。根据参考文献和经验得到:糖、酸、单宁、色素和芳香物质是构成酿酒葡萄品质优劣的要素,另外芳香物是葡萄酒质量评价最重和芳香物质是构

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论