




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、葡萄酒的评价摘要本文通过对品酒员的葡萄酒评价结果、葡萄酒和酿酒葡萄的理化指标、芳香物质的数据统计分析,利用SPSS软件、EVIEWS软件、MATLAB软件,对葡萄酒作出评价。问题一:首先对缺失的数据采用热卡插值法填补,缺失值为2;其次我们对每一酒样品总分求均值,利用SPS漱件进彳T配对t检验,进行显著性差异分析,可知两组品酒员的评价结果之间存在显著性差异;然后我们采用方差分析法,对每组品酒员内部打分结果进行方差比较,利用MATLAB求解得出:对于红白葡萄酒,第二组的方差普遍都比第一组小,第二组的打分结果比较可信。问题二:通过SPSS软件的因子分析,分别对酿酒葡萄的一级理化指标和二级理化指标进行
2、主成分分析,得出可以囊括酿酒葡萄重要特征的重要主成分,其中红葡萄得到9种主成分,白葡萄得到10种主成分。再以主成分为自变量进行聚类,将具有共同特征的酿酒葡萄归为一类,再对葡萄样品进行聚类,对酿酒葡萄进行等级划分,红白葡萄均归为5类。最后结合在第一问中求得的可信组品酒师的葡萄酒的总评分,确定每一类酿酒葡萄的等级。分类红葡,萄样品编号白葡萄样品编号12,3,9,232,3,5,9,10,12,22,24,25,26,28210,13,19,20,25,26,272734,5,6,7,12,15,16,17,18,21,22,241,2,1541,8,144,6,7,11,14,17,18,20,2
3、1,235118,16,19通过SPSSt件对葡萄酒质量进行聚类,将聚类结果与对应的一级理化指标聚类结果比较,得到的红、白葡萄酒的吻合率分别为0.25926、0.37037,可见仅用酿酒葡萄的理化指标来评价葡萄酒质量不是很合理。问题三:首先通过pearson相关性分析,对酿酒葡萄和葡萄酒的理化指标进行初步的相关性判定,得出两者的理化指标大多数指标呈正相关,然后对葡萄酒的理化指标进行标准化,将酿酒葡萄的理化指标作为自变量,将葡萄酒的理化指标作为应变量,采用EVIEWS软件将标准化后的葡萄酒的理化指标和酿酒葡萄的主成份进行逐步回归,建立回归模型,分析得到白藜产醇等白葡萄相关关系式的R方值较小,可见
4、虽然存在着一定的线性关系,但是关系较弱。问题四:结合酿酒葡萄和葡萄酒的理化指标、芳香物质与葡萄酒质量,利用支持向量回归机分别对其进行回归分析和相关性分析,并对葡萄酒质量进行预测,将预测值与实际值比较发现拟合度较好,得出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量呈正相关,并从回归模型中可知,芳香物质与葡萄酒的质量有一定的关系,不能仅仅用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:葡萄酒;回归分析;配对t检验;聚类;支持向量回归机一.问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒
5、葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1 .分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2 .根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3 .分析酿酒葡萄与葡萄酒的理化指标之间的联系。4 .分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二.问题假设1 .假设每位品酒员之间是相互独立的,且评分
6、是绝对公正的。2 .假设每个样品酒都是随机取得的。3 .假设允许存在计算误差。4 .假设两组评酒员在进行评分时是只与自身专业评价标准有关。三.符号表不abf1f2w1i,i=1,2.11W2i,i=1,2用10%i,i=1,2用5%,i=1,2lll7129xlzJ=L28表示第一组品酒员表示第二组品酒员表示红酒的质量表示白葡萄酒的质量表示红葡萄酒中的芳香物质表示白葡萄酒中的芳香物质表示酿酒红葡萄中的芳香物质表示酿酒白葡.萄中的芳香物质表示红葡萄酒的九个理化指标表示酿酒红葡萄的八个主成分128JC-jj于11*j*a.=1、211al.a.9AR2表示红葡萄酒的残差表示白葡萄酒的八个理化指标表
7、示酿酒白葡.萄的九个主成分表示白葡萄酒的残差表示回归方程的系数表示方程的拟合度四.问题分析问题一:由于题目给出的数据中缺失评酒员4对酒样品20的色调评分,因此我们先用热卡插补法进行数据填补。再用统计的方法,计算出每组对每一个样品酒分类打分指标的平均值,利用SPSS软件对两组品酒员与对应酒样品评价之间进行配对t检验,对求得的P值进行显著性差异分析,判断两组品酒员的评价结果是否存在差异;然后计算出两组品酒员对每一酒样品的评价总分,分别计算两组品酒员对每一酒样品的方差,利用方差来表示组内评分结果的稳定性,比较分析两组品酒员的可信度。问题二:该问题要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行
8、等级划分,结合问题一得到的更可信的葡萄酒质量评分,综合考虑各类因素的情况进行综合评价。由于酿酒葡萄的理化指标较多,我们利用SPSS软件分别对一级理化指标和二级理化指标进行主成分分析,再利用K-聚类的方法分别对酿酒葡萄的理化指标进行聚类并结合葡萄酒的质量,对酿酒葡萄的质量进行分级。问题三:为分析酿酒葡萄与葡萄酒的理化指标之间的联系,首先定性的分析葡萄酒中比较重要的理化指标和酿酒葡萄中的理化指标,再利用SPSS软件对葡萄酒的理化指标进行标准化,采用EVIEWS软件将标准化后的葡萄酒的理化指标和酿酒葡萄的主成份进行逐步回归,得到酿酒葡萄和葡萄酒的理化指标之间的联系。问题四:为分析酿酒葡萄和葡萄酒的理
9、化指标对葡萄酒质量的影响,论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,分别随机选取20个标准化后的红、白葡萄和葡萄酒的理化指标和芳香物质与葡萄酒的质量之间回归分析,建立逐步回归模型,并将剩余的数据代入回归模型,预测葡萄酒的质量,将预测值与实际值比较;采用SVR对随机选取20个标准化后的红、白葡萄和葡萄酒的理化指标和芳香物质与葡萄酒的质量进行相关性分析,并对剩余的数据进行葡萄酒质量的预测,将预测值与实际值比较,绘制折线图,比较逐步回归模型和SVR预测的准确性。五.模型建立与求解问题一:分析两组品酒员的评价结果有无显著性差异,并判断哪一组更可信。1 .缺失数据的补充经过对数据缺失的分析,我
10、们认为该资料的缺失属于完全随机缺失。因此,我们选择热卡插补法,尽可能寻找和遗漏值相似的数值来替代之,算出4号评酒员所评价的其他样品酒与样品酒20的相关系数,从而确定整体数据与样品酒20相近的样品酒。对于X与Y两个变量,两者间的相关系数Pxy为门工(Xi-X)(Y-Y):XY-2-(Xi-X)、(Y-Y)2其中PxyW-1,1.如果Pxy>0,则X与Y成正相关关系;如果Pxy<0,则X与Y成负相关关系;如果pxy=0,则X与Y不想关。1PxYH1,则X与Y相关性越密切。运用matlab软件计算出其余样品酒与样品酒20的相关性,得到相关系数最高的是酒样品11,Pxy=0.9340,因此
11、,用酒样品的色调分数代替缺失数据,则4号评酒员对样品酒20的色调评分为2分。2 .两个样本的显著性差异检验正态分布检验数据服从正态分布的检验在对两样本显著性检验时,要确定样本的总体是服从正态分布,采用JB统计量对红(白)葡萄酒样品的评分均值服从正态分布。JB=JkS21(K-3)26II4')其中,S、K分别表示偏度和峰度。在正态分布的假设下,JB统计量服从自由度为2的十分布。如果这个概率值越大,认为样本的确来自正态分布的总体。采用EVIEW驮件,对红(白)葡萄酒样品的评分均值进行正态分布检验,得两组评酒员对红(白)葡萄酒的某个酒样品质量评分数据服从正态分布。表1.1JB正态分布检验结
12、果第一组白葡萄酒第二组白葡萄酒A组红葡萄酒第二组红葡萄酒JB值0.06375.5244.14580.3068概率P0.96860.06320.12580.8578配对样本t检验建立假设H0:%=0,H1:»#0,并构造t统计量tV-yt(n1)sy/,n-1在显著水平a=0.05的情况下,对白葡萄酒进行t检验得到的P=0.019<0.05,对红葡萄酒进行t检验得到的P=0.019<0.05,因此,在对白葡萄酒和红葡萄酒的评价中,两组评价结果存在显著性差异。分别根据品酒员对红(白)葡萄酒样品的分类打分指标,求出分类打分指标均值(详见附录),利用SPS欹件对红(白)葡萄酒的分
13、类打分指标均值进行配对样本t检验。计算得出,在显著水平a=0.05的情况下,两组评酒员对红(白)葡萄酒某个样品酒的评价结果有无显著差异见下表:表1.2两组红葡萄酒间显著性差异分析结果酒样品1234567891011121314差异否否否是是否是是否否酒样品15161718192021222324252627差异是是是否是否一是是是是否否否表1.2两组白葡萄酒间显著性差异分析结果酒样品1234567891011121314差异是否否否是是否是是否是是酒样品1516171819202122232425262728差异是是否否是否否否否否否否是否3.利用方差对两组品酒员的评价结果进行可信度分析方差表
14、示一组数据的稳定性,我们采用方差来比较两组内部十个品酒员之间评分的稳定行来判断该组的打分结果是否可信。对两组品酒员对红(白)葡萄酒的评分结果进行数据统计分析,计算方差(见附录),利用MATLAB软件对两组的方差进行比较(程序见附录),绘制散点图(图1.1)皿190加讪150100"J0'90a旬用C-考一省山手都百净百至05懂15a25»图1.1两组品酒员的评分方差散点图根据散点图可知:第二组对白葡萄酒和红葡萄酒的评分结果方差普遍比第一组小,方差越小表明组内品酒员评分结果越稳定,从而说明第二组品酒员的评价结果更可信。问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些
15、酿酒葡萄进行分1 .由于附件中酿酒葡萄一共有30个一级指标,27个二级指标,为了简化酿酒葡萄的理化指标,我们采用主成分分析法。第一步,对原始数据进行标准化处理。第二步,计算各个理化指标之间的相关系数矩阵:%Ap-r21r22r2pR=:Jp1rP2rpp_ri,j(i,j=1,2,p)n_'(Xki-Xi)(Xkj-Xj)rj的计算公式为:r.rjk1nn-'(Xki-x)2v(Xkj-Xj)2k1kd第三步,计算特征值与特征向量,由特征向量组成m个新的指标变量。第四步,计算主成分贡献率:贡献率:=12L,p)kk=1利用MATLAB对30个一级指标和27个二级指标进行主成分分
16、析后,得到八个红葡萄的理化指标主成分,九个白葡萄的理化指标主成分。表2.1红葡萄的一级理化指标主成分主成份主要理化指标贡献率(单位:%)A主成份蛋白质、花色昔、DPPH自由基、总酚、单宁、葡萄总黄酮、百粒质量、果梗比、出汁率、果皮颜色L23.228第二主成份氨基酸总量、总糖、还原糖、可溶性固形、干物质含量39.698第三主成份柠檬酸、白藜芦醇、可滴定酸、果皮颜色a、果皮颜色b52.145第四主成分苹果酸、多酚氧化酶活力、褐变度、PH值61.613第五主成分VC含量、固酸比、果穗质量68.279第六生成分黄酮醇74.084第七主成分果皮质量78.813第八主成分酒后酸83.044酿酒红葡萄中第一
17、主成分代表了红葡萄的结构与颜色,第二主成分体现了红葡萄的味感,第三主成分主要是红葡萄的风味与色泽,第四主成分代表了红葡萄的氧化程度等。表2.2红葡萄的二级理化指标主成分主成份主要理化指标贝献率(单位:)A主成分天门冬氨酸、丝氨酸、谷氨酸、丙氨酸、缴氨酸、蛋氨酸、异亮氨酸、亮氨酸、赖氨酸、组氨酸、精氨酸、H321.051第二主成分顺式白藜卢醇甘、C1、C2、C3、杨梅黄酮33.990第三主成分反式白藜芦醇背、反式白藜芦醇、棚皮素、山泰酚、异鼠李素45.995第四主成份脯氨酸、果糖、葡.萄糖54.863第五主成分甘氨酸62.565第六生成分酪氨酸、顺式白黎卢醇69.269第七主成分胱氨酸、H274
18、.151第八主成分H178.085第九主成分苯丙氨酸81.826酿酒红葡萄中第一主成分代表了红葡萄氨基酸,第二主成分体现了红葡萄的醇和酮,第三主成分主要是红葡萄的醇,第四主成分代表了红葡萄的糖等。表2.3白葡萄的一级理化指标主成分主要理化指标贡献率(单位:%)主成分一氨基酸总量、多酚氧化酶活力、单宁、总糖、还原糖、可溶性固形物干物质含量、果穗质量、百粒质量出汁率、果皮颜色L、果皮颜色b19.435主成分二蛋白质、酒石酸、DPPH自由基总酚、葡萄总黄酮、可滴定酸固酸比、果皮质量35.864主成分三VC含量、果梗比、果皮质量果皮颜色a47.957主成分四苹果酸、褐变度54.891主成分五黄酮醇61
19、.189主成分六白藜芦醇66.703主成分七柠檬酸71.787主成分八PH值76.048主成分九花色昔80.175酿酒白葡萄中,第一主成分主要是白葡萄的味感,第二主成分代表了白葡萄的结构,第三主成分代表了白葡萄的成熟程度,第四主成分体现了白葡萄的氧化程度等。表2.4白葡萄的二级理化指标主成分主要理化指标贡献率(单位:%)主成分一天门冬氨酸、丝氨酸、谷氨酸、脯氨酸、甘氨酸、丙氨酸、缴氨酸、蛋氨酸、异亮氨酸、亮氨酸、赖氨酸、组氨酸27.951主成分二反式白藜芦醇、果糖、葡萄糖、C1、C2、C339.296主成分三胱氨、酸、顺式白藜芦醇音、H1、H348.666主成分四反式白藜芦醇甘、杨梅黄酮、榔皮
20、、素、山茶、酚、异鼠李素57.558主成分五酪氨酸63.698主成分六精氨酸68.891主成分七H273.716主成分八苏氨酸77.890主成分九苯丙氨酸81.439主成分十顺式白藜芦醇84.489酿酒白葡萄中,第一主成分主要是白葡萄的氨基酸,第二主成分主要是白葡萄的醇和糖。主成分分析得到的新指标代替原来30个理化指标,得到的新指标关于样品的评价值(见附录)。2 .采用K-均值聚类的方法对样品进行聚类。利用SPSS软件,对红(白)葡萄的一、二级理化指标进行5次聚类,得到结果:表2.5葡萄一、二级指标聚类结果聚类1聚类2聚类3聚类4聚类5红葡萄一级指标样品1、8、14样品2、3、9、23样品11
21、样品4、5、6、7、12、15、16、17、18、21、22、24样品10、13、19、20、25、26、27红葡萄一级指标样品1、8样品2、6、10、12、14、16、18、24、25、26、27样品3、9、13、17、19、21、23样品11样品4、5、7、15、20、22白葡萄一级指标样品4、6、7、11、14、17、18、20、21、23样品1、13、15样品8、16、19样品27样品2、3、5、9、10、12、22、24、25、26、28白葡萄一级指标样品5、10、14、21样品2、6、7、8、15、22、23、26样品3、4、10、12、20、24、25、28样品1、11、13、1
22、6、17、18、19样品27由于二级指标不能较全面的观察葡萄的质量,故采用一级指标的聚类结果和葡萄酒质量的对比,做相应的等级划分,划分结果如下:表2.6对应级别葡萄酒质量的平均分聚类级别相应红葡萄酒质量的平均分等级划分相应白葡萄酒质量的平均分等级划分168.976.53较差275.975好76.73333333361.6差72差468.88462较差77较好571.1较好78.19091好根据上述表格可知,好白红葡萄样品有样品2、3、9、23,较好的红葡萄样品有样品10、13、19、20、25、26、27,一般的红葡萄样品有样品4、5、6、7、12、15、16、17、18、21、22、24,较
23、差的红葡萄样品有样品1、8、14,差的红葡萄样品有样品11;好的白葡萄样品有2、3、5、9、10、12、22、24、25、26、28,较好的白葡萄样品有27,一般的白葡萄样品有1、2、15,较差的白葡萄样品有4、6、7、11、14、17、18、20、21、23,差的白葡萄样品有8、16、19。利用SPSS软件对葡萄酒质量进行聚类(见附录),将其结果与对应的一级理化指标聚类结果比较,得到的红、白葡萄酒的吻合率分别为0.25926、0.37037,可见仅用酿酒葡萄的理化指标来评价葡萄酒的质量不是很合理。问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系。1 .根据问题和给出的数据可知,酿酒葡萄与葡萄
24、酒的理化指标发生了很大的变化,为了分析酿酒葡萄与葡萄酒的理化指标之间的联系,我们先分别分析红葡萄、白葡萄与相应的葡萄酒之间重要的理化指标的定性关系。根据资料可知,花色甘是红葡萄果实中重要的一类黄酮类物质,主要赋予葡萄和葡萄酒红色色调;单宁具有抗氧化性,使得红葡萄酒能长年熟成;酚类物质的含量与葡萄酒的色泽、香气和酒体特征等有密切的关系,这些理化指标均是酿洒葡萄与葡萄酒中重要的指标。而这些重要理化指标在葡萄与葡萄酒之间是否有关,我们先用MATLAB对这四个理化指标在27个红葡萄与红葡萄酒样品中进1000800600400200040302020101000.一一酿酒葡萄葡萄酒行绘图,得到如下图所示
25、的关系。花色昔302010单宁酿酒葡萄计葡萄酒011253005104f*科202530白藜芦醇30Hp-1-酿酒葡萄-葡萄酒051015202530图3.1葡萄酒与酿酒葡萄中指标的比较白藜芦醇是存在于葡萄皮中的一种物质,在酿造过程中被酒精溶解进入葡萄酒中,而不同葡萄之间其含量会由于酿造工艺的不同差异很大,因此,我们选用单宁、总酚、总黄酮、白藜芦醇这四个理化指标的含量来刻画白葡萄与白葡萄酒之间的关系,并用MATLAB进行绘图,结果如下图所示。10单宁总酚,.一酿酒葡萄T-葡萄酒20酿酒葡5540.430.320.2A0.100015白藜芦醇-酿酒葡萄葡萄酒1015DP
26、PH半抑制体积(20IV50)25酿酒葡萄UV(*1Ikr101520253030图3.2葡萄酒与酿酒葡萄中指标的比较由图可看出,白葡萄与白葡萄酒理化指标之间的联系并不如红葡萄与红葡萄酒之间密切,但总体趋势还是大致成正比关系。为了进一步寻找它们之间的函数关系,我们选用逐步回归分析进行探究。2 .建立逐步回归分析探究酿酒葡萄与葡萄酒理化指标的关系。逐步回归是一种从众多变量中有效地选择重要变量的方法。其基本思路是先确定一初始子集,然后每次从子集外影响显著的变量中引入一个对因变量影响最大的,再对原来子集中的变量进行检验,从变得不显著的变量中剔除一个影响最小的,直到不能引入和剔除为止。因此,葡萄酒中的
27、花色甘、单宁、总酚、酒总黄酮、白藜产醇、DPPH半抑制体积、三类颜色指标作为因变量,酿酒葡萄中的理化指标作为自变量。采用EVIEWS软件对酿酒葡萄的主成份和葡萄酒的一级理化指标做逐步回归分析,建立回归模型。1)红葡萄与红葡萄酒之间的回归模型:51、,口11堂12的3的4a154止以174说)叼鼻影也飘灯$町6a27出g孙.11、用%15升仪35%6a37&72a42%3%4%5口46%7fl4S工口813A-町1附3的三454町5町6357厘北X二工146=%4将/】%。必%4%5%07Z1575Ji7鼻孔鼻7m鼻74鼻75鼻76S丁丁金8*16外机日S3%4%5%6阳丁%出77必9,
28、卜知的鼻力须做的5%须7产18金对上述建立的线性回归模型进行求解,得到红葡萄与红葡萄酒的理化指标之问的函数关系。Mi=Q2906%-0.0508阳42680/+。0673务+01085%二03249西广GQ664电+0072访-。.0526邑+。1653间礼1316%加=Q.3174丽-1Q58隔+Q15Q温+Q144%fKlQ817x1g为二0.297%-。,049兀-Q0728电+QQ782&+0.1693瓦+0.213偏为二0.109%-0.1089年+Q211防-0.1053年尢二。2997/-0.08853+。1094勾+Q1226年+。13443+。1667犯)17=-0.
29、3163x11+0,0685xn+0,1288xE+0,0821x14+0,0671x15+0,0653x16为二一00965加Q1178而一Q2479飞+。邳6阳一。87比一0.2591%-Q3362做=04614x11+012071xu+0.15001-0,2788xw+0,1004xn-0,1411%表3.1红葡萄酒与红葡萄之间的拟合度拟合度yiiyi2yi3y14y15y16y17y18y19R20.8310030.8321680.7951020.7764450.2768040.7772160.8195100.6668250.4774472)白葡萄与白葡萄酒之间的回归模型:Y=AXiE
30、,乃J%4%ai6aiaIS1522X冬a2%出5ax力43%*4a3%F%4心136%/看*24Y=外x=心A=Al-43%a4445口崎仪椁包g&49Z=叼5%力的】町2as出4%与05*a3»*26均%他为4%国货。母%7为7程ana72%鼻75口府的7叼E1尊828W2SJ不03U&i%4密aS5侬口组%71%9J对上述建立的线性回归模型进行求解,得到白葡相匕白葡相酒的埋化指标之间的函数关系yn=01278孙-0.1286年-0.18245-0.3265取坳=Q,169%+0.189。3+0.2308瓯一(H429融+0.196%-。,153%珈=0.0602
31、殉+0.2487用+0.2734租0.1108修+081%+0.1143/+0.14。3物-00792%为二-0.0719孙-0.11963+0,2130与%=0,1。66Ml+0,1437&-Q.1456%+0825-。315Q物加=-02638盯+0.15653-0.097%+0.078%-0.2536%=-0,1476孙+0.24624+0,114%+0097(%-Q1706物Q1105凝为=02877题-Q206%+0,0533电-。,。77。访广。阴一°顺6厢+Q288%+!1134通表3.1白葡萄酒白红葡萄之间的拟合度拟合度y21y22y23y24y25y26y2
32、7y28R20.42670.66550.72820.11630.41360.64160.47340.7360根据逐步回归分析得到的关系式可以得到酿酒葡萄与葡萄酒的理化指标之间的函数关系,但葡萄酒中的白藜产醇指标与酿酒葡萄之间的相关性较低,为了分析该关系,我们运用相关系数进行计算,得到与白葡萄酒中白藜产醇指标相关程度比较大的酿酒葡萄理化指标为总糖、洒石酸,且均和白藜产醇成负相关关系,而正相关程度相对较大的酿酒葡萄理化指标为还原糖与a*(+红;-1)问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。对酿酒葡萄和葡萄酒的理化指标、芳香物质
33、与葡萄酒质量之间的相关性分析。1.利用SPS漱件对原始数据进行标准化,任意选取其中的20个酿酒葡萄样品标准化的理论指标和芳香物质和葡萄酒的质量,进行回归分析,建立回归模型。红色葡萄和葡萄酒的理化指标、芳香物质与葡萄酒质量的函数关系:力二0,286711-。,84。5用+Q165%-2.04咻4+L1861%+0.616%-0.5779%-5.374%+74%-1.6473外+1.4542为+1,。4。2姓-2.6222为-0.1558町+0.1681坨+0214帆+0,3424+0,151加+0.7536%+D1989%-0.178帆-0.5254所1+QQ909%+0.1197%-2,496
34、姒红色葡萄和葡萄酒的理化指标、芳香物质与葡萄酒质量的函数关系:£=Q1275/+Q3412X&+0,342%-Q1456加-0/1553必+Q3623%-Q2956%-0.1805-0.9414+0,9290-0,5154+0,15480375+0,3981-0,5。9附+。,575帆+0.9338叫也-Q1452%-1颂3/+。3030%将剩余的标准化数据代入回归方程,预测葡萄酒的质量。2.采用SVR支持向量回归机的方法,任意选取其中的20个样品对酿酒葡萄和葡萄酒的理化指标、芳香物质与葡萄酒质量之间的相关性分析。SV或持向量回归机的知识点:给定回归问题的训练集(xi,yi)
35、,(x2,y2),|,(X|,y)x产Rn,ywr.;支持向量回归机通常采用一不敏感损失函数,并极小化权向量的模,从而得到一个二次规划问题MinT(w,£,)=-+C£(。+。*)2ij(w(xj)b-yi_;*s*.yi(w仲(为)一bEw+-i*£>0;>0,®>0通过求解该优化问题得到最优解后,其回归函数可表示为lf(x)=w(x)b=%(二/-:i)ker(xi,x)bi1其中5和ct*为支持向量,ker为选取的核函数。由于支持向量回归机极小化结构风险,有效地克服了过学习现象,从而更加适用于小规模的回归问题(详细见参考文献)。由
36、于本文中的问题特征维数较高,因此我们选用带有线性核函数的支持向量回归机进行学习,具体操作软件为LIBSVM2.83版本。表4.1回归检验指标metrics计算公式SSE百三2:1(万一为SST知£身-丁SSRNMSEVw=s宓j=乙i:於府仆-2=皿=力皿凡5:工生一""内为00%m表4.2SVR计算结果SSE(回归平方和)SST(离差平方和)SSR(残差平方和)R2(拟合度)红葡萄酒2.3481.4370.980.68197634白葡萄酒2.4541.4240.8860.622191011对剩余的样品进行葡萄酒质量的预测,对预测值与实际值进行比较(见下图)图4.
37、1红葡萄预测值与实际值的比较图12345678图4.2白葡萄预测值与实际值的比较图根据上图可知,SVR寸数值的预测结果较回归分析好,能比较接近的反应葡萄酒的质量。葡萄酒的质量分类指标评分过程中含有香气的指标,故我们在相关性分析过程中考虑了葡萄酒和酿酒葡萄中的芳香物质,得到的结果能很好的来用葡萄酒和酿酒葡萄的理化指标、芳香物质来对葡萄酒质量的评价,即不能仅用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。六.模型评价优点:.本文在考虑到指标总表中多组数据成分来表示酿酒葡萄和葡萄酒的联系情况中,采用主成分分析法,把成分进行主要抽取,尽可能的压缩数据,从而得到简化,大大减少了计算量。本文的第四位采用了SV
38、R支持向量回归机方法,对酿酒葡萄和葡萄酒的理化指标、芳香物质与葡萄酒质量之间的相关性分析。作为经典方法,它的好处在于使所有样本点离超平面的“总偏差”最小。这时样本点都在两条边界线之间,求最优回归超平面同样等价于求最大间隔。缺点:本文在求解过程中忽略了部分实际情况,如评酒员的喜好对评分造成的影响。本文假设考虑的因素不够详细,致使所得结论还不能完全与实际相对应。模型的优化改进:在问题一上,对两组评分者的评分情况,我们没有对评分各组在同种样品酒上为什么存在评分差异进行细微的处理。依据样品酒评分不同,将其评分可分为客观性评分和主观性评分两类。评判过程中如果评分者严格要求依据一套评分标准,并且整个评分过
39、程中保持一致,这样的评分结果才是可信的。但事实是任何评分标准不一致,从而导致测量的误差,影响测量的精确性。根据测量误差来源,常用的方法可以我们可以进行考察的指标分别是评分者内信度和评分者问信度,用spearman相关系数法来计算。参考文献1姜启源、谢金星、叶俊编,数学模型(第四版),北京:高等教育出版社,20112周明华、周凯、邹学军、李春燕,MATLA改用教程,浙江工业大学出版3陈胜可编,SPSS统计分析从入门到精通,北京:清华大学出版社,20104郭志刚主编,社会统计学分析方法一SPSS软件应用,中国人民大学出版社,19995张晓炯编,Eviews使用指南与案例,机械工业出版社,20076
40、邓乃、,田英杰,数据挖掘中的新方法一支持向量机M,北京:科学出版社,2004:1321887Chang,C.C.andLin,C.J.LIBSVM:alibraryforsupportvectormachines,ACMTransactionsonIntelligentSystemsandTechnology(TIST),Volume2,Number3,Pages27,20118高铁梅,计量经济分析方法与建模Eviews应用及实例(第二版),北京:清华大学出版社,20099LIBSVM,/citation.cfm?id=1961199附录问题一1.第一组品酒员对
41、红葡萄酒样品的分类打分指标,求出分类打分指标均值外观澄后调香气纯香气浓香气质口感纯口感浓口感持口感质整体评清度巴胴正度度量正度度久度量价样品5.4样品6.518.49.6样品6.26.717.39.4样品4483.44.75.614.58.4样品5.912.644.95.314.88.6样品63.974.56615.18.6样品7样品8
42、2.774.76.45.814.28.4样品7.36.416.69.7样品105.915.48.8样品15.914.28.4样品92.84.5512.77.9样品5.86.1168.9样品11.645.85.916.38.7样品492.93.9512.47.6样品6615.79.1样品173.97.84
43、.85.96.417.29.2样品181.888952.95.1103.355.413.67.9样品193.984.66.416.39.2样品203.76.22222225.27.316.69.2样品213.584.46.4616.99.2样品223.984.56.75.815.79样品7.414.64.87718.110样品5.916.69.1样品2514.28.3样品263.67.
44、84.765.714.88.9样品25.611.84.466.11692.第二组品酒员对红葡萄酒样品的分类打分指标,求出分类打分指标均值整体评价外观澄清度色调香气纯正度香气浓度香气质量口感纯正度口感浓度口感持久度口感质量样品5.5613.68.4样品124.16616.69.1样品8.9样品5.35.715.18.8样品5.4样品63.
45、55.23.955.614.28.6样品73.514.58.4样品83.46.8455.513.98.4样品93.67.456.96169.4样品4.85.714.28.4样品5.912.48.1样品4.911.2465.715.48.7样品5.512455.513.98.6样品5.85.715.79.3样品153.66.43
46、.15.65.514.28.2样品5.111.845.55.815.18.8样品6.36.315.49样品4.85.915.18.8样品193.574.45.9615.78.7样品6.8616.99.3样品213.273.75.911.89样品223.4168.9样品6.75.815.18.9样品5.815.18.8样品4.85.613.98.6样品25.614.58.8样品25.4168.83.第一组品酒员对白葡锢酒样品的分类打分指标,求出分类打分指标均值:外观澄得度导色调香气纯正度香气浓度香气质量口感纯正度口感浓度口感持久度口感质量整体评价样品13.87.4576.517.89.7样品6.55.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025房屋租赁合同协议范文
- 2025股权分配协议建筑工程用地合同
- 2025年二建《市政公用工程管理与实务》通关必做强化训练试题库300题及详解
- 安徽省蚌埠市四校联考2025年3月高三下学期第一次月考
- 桥隧工技能鉴定理论资源高级技师习题(附答案)
- 试管婴儿护理健康计划
- 违纪学生协议合同书范例
- 基于主机的反弹shell检测思路
- 政府与中原证劵最紧密战略
- 车位转让协议与租赁合同
- 施工项目环境保护管理组织机构
- 辽宁省沈阳市郊联体重点高中2023-2024学年高二下学期4月月考化学试题
- 高中学籍档案课程学分填写样式-历史化学政治
- (正式版)JBT 2930-2024 低压电器产品型号编制方法
- 灭火器检查的流程与步骤详解
- 南京市旭东中学2023-2024学年中考语文全真模拟试卷含解析
- 厂内检验员基础知识培训
- 马工程《思想政治教育学原理 第二版》课后习题详解
- 部编版语文三年级下册第八单元 有趣的故事 大单元整体作业设计
- 员工雇主责任险操作管理规定
- 工业机器人基础及应用高职全套教学课件
评论
0/150
提交评论