数学建模葡萄酒的评价_第1页
数学建模葡萄酒的评价_第2页
数学建模葡萄酒的评价_第3页
数学建模葡萄酒的评价_第4页
数学建模葡萄酒的评价_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、葡萄酒的评价摘要葡萄拥有很高的营养价值,本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析,对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。针对问题一,我们首先分别计算每类葡萄酒样品在两组组评酒师评价下的综合得分,以此作为每组评酒师的最终评价结果。再运用统计学中的T检验进行假设与检验,得出两组评价结果具有显着性差异。最后通过计算各组评价员的评价结果的标准差,以此推算稳定性指标值P,P值较大的可信度较高,得出pn%2与培i%2,进而得出第二组的评价结果更加可信。针对问题二,我们分别对两组葡萄进行分类。在这里我们采用聚类分析法和主成分分析法,在m

2、atlab中实现对酿酒葡萄的分类。针对问题三,根据Z-对附件2中的数据进行标准化处理,排除单位不同的影响。以酿洒葡萄的30个一级理化指标作为自变量X,葡萄酒9个一级的理化指标作为因变量y,建立多元线性回归模型yX,得出酿酒葡萄的理化指标与葡萄酒的理化指标之间的联系即回归系数矩阵0针对问题四,用灰色关联度分析对两者的关系进行度量,求得理化指标对样品酒的的关联系数。然后根据葡萄酒综合得分及指标的相关系数得出样品酒的综合指标,通过MATLA歆件对综合指标与第二问中葡萄酒的分数进行指数拟合,拟合效果不佳,因此不能定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只能根据图像大致猜测综合指标与葡萄酒的质

3、量负相关。关键词:T检验聚类分析法主成分分析法Z分数多元线性回归一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1 .分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信2 .根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡

4、萄进行分级。3 .分析酿酒葡萄与葡萄酒的理化指标之间的联系。4 .分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量二、问题分析葡萄酒的评价是一个复杂的过程,需要综合考虑不同评价员的评分,而且葡萄酒和葡萄的组成成分非常复杂,它们也要影响葡萄酒的质量,对如此繁多的数据,我们就必须依靠计算机工具,运用数学统计学知识对它们进行处理,并找出各个含量之间的关系,联系生活实际,对葡萄酒作出有理有据的评价。对于问题一:要想得到两组评价员的评价结果有无显着差异,并对它们的可靠性作出判断,我们首先就应该将两组评价员的对27组红葡萄酒和28组白葡萄酒的评价结果整

5、理出来,求得葡萄酒的综合得分,再运用统计学中的T检验进行假设与检验,判断两组是否存在显着性差异,再通过计算各组评价员的评价结果的标准差和稳定性指标,进而判断谁的结果更加可信。对于问题二:需要对葡萄进行分级,由于葡萄酒的质量与酿酒葡萄的好坏有直接关系,所以我们可以根据葡萄酒的质量对酿酒葡萄做一个简单的分级,之后,我们用主成分分析法算出每一组样本葡萄的哪些指标该葡萄的主成分,然后通过数据分析判断出这些成分哪些对葡萄酒的质量作出了贡献,筛选出主要成分后,对不同葡萄的成分做加权求和,以此作为葡萄分级的另一个依据。对于问题三:要想得到葡萄与葡萄酒的指标间的联系,即得到它们之间的函数关系表达式,必须求出两

6、者指标之间的相关系数。但是,由于它们各自的指标太多,此处仅以一级指标作为相关因素进行分析。令酿酒葡萄的30个一级指标作为自变量,葡萄酒的9个一级指标作为因变量,建立线性回归模型,通过最小二乘法计算出回归系数,即酿酒葡萄的指标与葡萄酒的指标间的相关性。对于问题四:题中想要求出理化指标对质量的影响,即各理化指标与质量的线性或非线性关系,但是,由于理化指标太多,并且并非没个理化指标都会对葡萄酒的质量造成影响,所以首先必须进行数据的筛选,这里我们使用spss软件进行典型相关性分析,找出哪些指标与质量有较大的关系,然后将这些指标设为自变量,将质量设为因变量,对它们进行多元线性拟合,最后得到一个多元表达式

7、以后,我们就可以通过这个方程来对葡萄酒的质量进行验证,如果验证的结果与评价员打分的结果基本吻合的话,就说明可以用葡萄与葡萄酒的理化指标来对葡萄酒的质量进行评价。三、基本假设1、假设评酒员对每种葡萄酒的评价结果是大致符合正态分布的;2、假设酿酒葡萄与葡萄酒中的芳香物质主要成分是:低醇、酯类、苯等,其余成份忽略;3、假设酿酒葡萄与葡萄酒的理化指标中一级指标为主要影响。4、假设酿酒葡萄中存在的而葡萄酒中不存在的理化指标也会影响葡萄酒的理化指标及质量;5、假设不考虑多种葡萄可制成一种酒,只考虑一种葡萄制成一种酒;6、假设只考虑红葡萄制成红葡萄酒,白葡萄制成白葡萄酒,忽略去皮红葡萄可酿制白葡萄酒;7、假

8、设质量高的葡萄酒一定由质量好的酿酒葡萄制成,但是质量好的酿酒葡萄不一定能酿制成质量高的葡萄酒;8、Aj表示第i瓶酒的第j个指标无量纲化后的值9、Bj表示第i种酿酒葡萄的第j个指标无量纲化后的值10、Mi表示第i瓶酒的综合指标四符号说明T:统计量Takhij:第k组序号为h的样品第i个指标第j个品酒师的给分ai:序号为h的样品中第i个指标第k组io位品酒师给分的平均值&hi:第k组序号为h的样品第i个指标10位品酒师评分的标准差bki:第k组第i个指标所占权重线h:第k组序号为h的样品的稳定性指标Pik:第k组红葡萄酒的评分总平均稳定性指标Rk:第k组白葡萄酒的评分总平均稳定性指标Xj:为第i个

9、样品的第j个指标Si:第i个葡萄样品的总得分i:第i个样品葡萄理化指标得分为其中:第一个指标指澄清度,第二个指标指色调,第三个指标指香气纯正度,第四个指标指香气浓度,第五个指标指香气质量,第六个指标指口感纯正度,第七个指标指口感浓度,第八个指标指持久性,第九个指标指口感质量,第十个指标指平衡/整体评价。五模型建立与求解5.1问题一:葡萄酒评价结果的显着性差异及可信度分析5.1.1葡萄酒评价结果数据预处理对附件1中数据通过Excel筛选观察时可发现某些数据错误,如:第一组红葡萄酒品尝评分中洒样品20号下4号品酒员对于外观分析的色调评价数据缺失;第一组白葡萄酒品尝评分中酒样品3号下7号品酒员对于口

10、感分析的持久性评价数据为77,明显超过该项上限8;第一组白葡萄酒品尝评分中酒样品8号下9号品酒员对于口感分析的持久性评价数据为16,明显超过该项上限8等。对这些异常数据为减少其对于总体评价结果的影响,采取预处理:取该酒样对应误差项目其余品酒员评价结果平均值替代该异常数据。经过数据预处理可得出每一种类葡萄酒的综合得分,建立表1与表2。表1红葡萄酒总得分平均值红酒n12345678910第一组第二组746611121314151617181920第一组73第二组21222324252627第一组7873第二组72根据表1,用excel作出两组评酒师对每一类葡萄酒的评分折线图图1表2红葡萄酒总得分平

11、均值白酒n12345678910第一组8271第二组11121314151617181920第一组7274第二组2122232425262728第一组71第二组77根据表2,用excel作出两组评酒师对每一类葡萄酒的评分折线图。图2根据图1、图2可初步简单看出两组评酒师的评价结果存在有显着性差异5.1.2葡萄酒评价结果差异性分析与可信度分析模型建立与求解(1)t检验模型建立首先假定两个总体平均数间没有显着差异,即Ho:12查T值表,比较计算得到的T值与理论T值,推断发生概率(一般为95%。两个正态总体的均值检验模型彳贸设Xi,X2,.,Xn是来自总体1,12的样本Y1,Y,.,Yn是来自总体N

12、22的样本,且两样本独立。设均未知,其检验问题为12)1tnin2n2当H。为真时,统计量T的计算公式T1nn22.n2式中,S3n11S12n21S2n1n22查T值表,比较计算得到的T值与理论T值,推断发生概率(一般为95%,其中为显着性水,1-951000.05因此当T0.05则认为H0不成立,两组评酒员对红葡萄酒的评价结果有显着性差异。(2)两组评酒员对红葡萄酒的评价结果比较:分别计算出n127,X73.0556,S17.3426T0.02100.05,说明该两组评酒员对红葡萄酒的评价结果有显着性差异(3)两组评酒员对白葡萄酒的评价结果比较:分别计算出n128,X73.9786,S4.

13、8266T0.01290.05,说明该两组评酒员对白葡萄酒的评价结果有显着性差异5.1.3可信度分析模型建立与求解:第k组序号为h的样品第i个指标10位品酒师给分的平均值第k组序号为h的样品第i个指标10位品酒师的标准差算出第k组序号为h的样品的稳定性指标第k组红,白葡萄酒的评分总平均稳定性指标计算求得:比较红葡萄酒的两组总平均稳定性指标,因为pr1防2,所以第二组品酒师的评价结果更可信。同样,比较白葡萄酒的总平均稳定性指标,因为脸1%2,所以第二组品酒师的评价结果可信度更Mi。问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。问题二求根据酿酒葡萄的理化指标和葡萄酒的质量对酿

14、酒葡萄进行分级,葡萄酒由酿酒葡萄酿制而成,则酿酒葡萄的质量与葡萄酒的质量有着直接的关系,则可以根据葡萄酒的质量对酿酒葡萄做一个简单的分级,在根据主成分分析从葡萄的理化指标中筛选出对葡萄质量产生影响的主要因素,根据所得各主要因素的贡献率给个因素加权作为系数,求出葡萄中主成分的含量,并进行排名,之后将此排名与之前根据葡萄酒质量所得出的排名综合,进而得出较准确的对酿酒葡萄的分级。K均值法聚类分析模型k均值法的基本步骤:(1)选才k个葡萄酒样品作为初始凝聚点,或者将所有葡萄酒样品分成k个初始类,然后将这k个类的重心(均值)作为初始凝聚点。(2)对除凝聚点之外的所有葡萄酒样品逐个归类,将每个葡萄酒样品归

15、入凝聚点离它最近的那个类(通常采用欧氏距离),该类的凝聚点更新为这一类目前的均值,直至所有葡萄酒样品都归了类。(3)重复步骤(2),直至所有的葡萄酒样品都不能再分配为止。最终的聚类结果在一定程度上依赖于初始凝聚点或初始分类的选择。经验表明,聚类过程中的绝大多数重要变化均发生在第一次再分配中。也就是:先算各类的均值再算各类中样本到本类及其他类的均值的绝对值距离(欧氏距离)将葡萄酒样本重新归类到欧氏距离较小的类中(重新归类就得算均值)首先,根据第一问得出的结果,我们采用第二组评酒员的结果作为判断葡萄酒质量的依据,根据各葡萄酒的分数,我们得出了红葡萄酒和白葡萄酒的排名,虽然是葡萄酒质量的排名,但由于

16、葡萄酒的质量由酿酒葡萄的质量决定,所以上表可以看作是葡萄质量的排名,以上表中葡萄酒的分数作为酿酒葡萄质量的分数,可以对酿酒葡萄作出初步的分级,针对葡萄酒的成绩,我们用聚类分析的方法,得出了葡萄的初步分级,运行的得到的图样如下:图3表4白葡萄酒等级分类酒样品号根据上述结果,得出红、白葡萄酒的等级分类,建立表3,表4.表3红葡萄酒等级分类等级A1,10,12,13,16,25B4,5,14,19,21,22,24,26,27C6,7,8,11,15,18D2,3,9,17,20,235,9,10,15,17,21,22,25,287,8,11,12,13,261,2,3,4,6,14,18,19,

17、20,23,24,2716主成分一权值分级模型虽然酿酒葡萄所对应葡萄酒的质量能在一定程度上反映酿酒葡萄的质量,但葡萄的质量还应以葡萄本身的成分来区分其级别,为了得到更准确的分级,我们又对附件中所给酿酒葡萄中的理化指标做了一些分析。为了综合考虑酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,将附件3中芳香物质含量总和作为一个一级理化指标,设第i个样品葡萄理化指标得分为i,葡萄酒的质量总分为i,则第i个葡萄样品的总得分s可以表示为选取一个使得样品趋于较稳定值的,此时的可作为酿酒葡萄的分级权值。(1)首先对各理化指标进行归一化处理,酿酒葡萄一级理化指标中样本有n个,指标有m个,分别设为X1,

18、X2,.Xm,令Xj为第i个样品的第j个指标。做变换得到标准化的数据矩阵N(Nj)nm,其中(2)在标准化数据矩阵N的基础上计算个原始指标相关性系数矩阵n(Xki又)(XkjXj)其中rij1j2(XkiXi)(XkjXj)2k1,k1(3)求相关性系数矩阵R的特征值并排序,再求出R的特征值的相应的正交lkiXk单位化特征向量li(l1i,l2i,.lmi)T,则第i个主成分可表示为各指标Xk的线性组合Zim计算综合得分。首先计算得到第i个样本中第k个主成分的得分为FiklkiXj,再以个主j1m成分的方差贡献率为权重,求得第i个样品的综合得分fiFikk(i1,2,.n)i1模型求解表6葡萄

19、样综合得表5红葡箱样品主成份及具排序主成份序列1234567主成份花色甘缴氨酸干物质含量顺式白藜产醇甘PH值多酚氧化酶活力果梗比主成份序列89主成份酪氨酸百粒质量红品分荷样品号综合得分分数排序对应样品号样品分差值192233204225361276818911013111112213814261521165171018171927201621192224234242525142615277对综合得分相邻样品分差值进行分析,当其值达到及以上,认为两酿酒葡萄的品质差异较大,不能分在同一级,按照此方法,红葡萄可分成六级,一级到六级表示葡萄品质逐渐降低,具体情况如下表:表7红葡萄分级结果级数红葡萄样品

20、号一级923二级28111326四级521五级4710151617192425六级27本模型中主要以红葡萄样品的相关数据进行分级,按照同样的方法将白葡萄的相关数据代入,求得白葡萄分级如下:表8白葡萄分级结果级数白葡图样品号一级27二级14101518222328三级5612131720四级231416212425五级78911195.3问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系数据预处理标准化及综合理化指标在处理附件2中数据时可以发现某些存在异常的数据值,如:葡萄理化指标中白葡萄百粒质量的第三次检测值为2226.1g,明显超过其它两次的检测值。为避免异常数据值对

21、分级结果的影响,取其它两次值的平均值替代该异常值。同时对数据进行标准化处理,取其z分数:Z-:其中,x为变量值,为平均数,为标准差。Z分数表示的是此变量大于或小于平均数几个标准差。由于z分数分母的单位与分子的单位相同,故z分数没有单位,因而可以用Z分数来比较两个从不同单位总体中抽出的变量值。同时将原始数据直接转化为z分数时,常会出现负数和带小数点的值。5.3.2多元线性回归模型(1)模型建立观察所给附件中的数据易知,影响酿酒葡萄与葡萄酒理化指标的因素往往不止一个,所以建立多元线性回归模型求解酿酒葡萄与葡萄酒两者理化指标之间的联系设变量Y与变量Xi,X2,,Xp间有线性关系1X1PXP式中,N0

22、,2,0,i,p2是未知参数,P20设(Xi,%,Xp,y),i1,2,n是X1,X2,,XP,Y的n次独立观测值,则多元线性模型可表示yi01Xii2Xi2,,PXiPii1,2,n式中,iN0,2,且独立同分布可用矩阵形式表示,令则多元线性模型可表示为yX式中E0,Var2I(2)模型求解类似于一元线性回归,求参数的估计值,就是求最小二乘函数QyXTyX.达到最小的值,可以证明的最小二乘估计XTX1XTy.从而可得经验回归方程为Y01X12X2,PXP.将酿酒葡萄看做自变量,葡萄酒看做因变量。注意,计算时用的是经过处理后的Z分数表。我们用Xi1i30表示酿酒葡萄的30个一级指标,作为自变量

23、X;用丫1j9表示葡萄酒的9个一级指标,作为因变量y。其中,理化指标的编号顺序依照所给附件中的大小顺序。例如,红葡萄酒中理化指标顺序依次为花色甘、单宁、总酚、酒总黄酮、白藜产醇、DPP学抑制体积、L、a、b。经过MATLAB回归系数的最小二乘估计计算,得出回归系数,1,30,即自变量与因变量之间的联系,见附表。根据回归系数表得出两者之间的正负相关性,其中数字为酿酒葡萄理化指标编号。表9酿酒红葡萄与红葡萄酒正相关回归系数表10酿红萄花色昔单宁总酚酒总黄酮正用白藜芦醇关DPP年抑制体积L*a*b*酒葡与红101017171317221317葡萄负关171716122210262714酒相回1220

24、4423121168归米/r1616121611163054系效821141814209118201281420142518567105272121313442082542419167147134829812131310162815271424182419115127282824331320338328215112419599283019212977125231919131323924负相关“色昔单宁总酚酒总黄酮白藜芦醇DPPH抑制体积L*a*b*91519681823261929232920282927142518292873023128201592523182716424252592151

25、5617231512529251923293061115173010201527163062612721261815271511325261111301126225229223027261673028132622241429627221242110261013922221810816172411表11酿酒白葡萄与白葡萄酒正相关回归系数表12白葡白葡单宁总酚酒总黄酮正於白藜芦醇守关DPP年抑制体积L*a*b*酿酒萄与萄酒负相3018309202421关回422161221111830归系2332943181412数5.4152412151823179问题276111221620274灰29212

26、32313102415色关12215102430816联度1628927226629分析模型112627717221410235519291152674262575912102822195142642818208510176137314262325单宁总酚酒总黄酮负於白藜芦醇守关DPPH抑制体积L*a*b*12526131142272813125464232197810972871622152527262281328912291182728245815256158192331210134256121516132511141427139222491820291930191952218112118

27、5.4.1模型的建立若要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,则应该先求出它们的相关性。本题应用灰色关联度分析对系统两者的关系进行度量。灰色综合分析用以下模型RYW.R为M个被评价对象的综合评价结果向量:W为N个评价指标的权重向量:E为评判矩阵。i(k)为第i个被评价对象的第k个指标与第k个最优指标的关联系数。根据R的数值,进行排序。设Fji,j2,.jn,此最优序列的每个指标值可以是各个评价对象的最优值。式中jk为第i个葡萄样品第k个指标的原始数值由于评价指标间有不同的量纲和数量级,故不能直接进行比较,因此需要对原始指标进行规范处理。则可以用下式将原始数值变成无量纲值Ck(0,1

28、)ili.Ck一件,i=1,2,.m;k=1,2,.n.jk2jk根据灰色系统理论将C*C1*,C;,.C:.作为参考数列将CC;,C2,.Cn作为比较数列,则用关联分析法分别求得第i个被评价对象的第k个指标与第k个指标最优指标的关联系数,、即:miinmiinC;CkminminC;CkkiC;Ck|minminCki上式中:(0,1),一股取0.5.这样综合评价的结果为:如果关联度最大,说明C与最优指标C*最接近,据此可排出被评价对象的优劣次序。选取五种理化指标和六种葡萄酒进行研究,具体数据见表:部分理化指标数据乙醛乙醇1-己醇1-辛醇苯乙醇13,.617minminKCk|minmin|

29、X0(k)Xi(k)|0.0674.06171 X0(k)Xi(k)minmin|X0(k)Xi(k)|X(K)Xi(k)|4.0617.设分辨系数为将值带人i(k)3nmax中,运用matlab求得max1=2 =3=04=0,767205=0计算关联度R(X0,Xi),由公式110Ri(k).ni1分别计算出乙醛,乙醇,1-己醇,1-辛醇,苯乙醇的关联度R0.9980,R24.3142,R33.7854,R43.6344,R3.2244.得出结论R2R3R4R5R1.同理可得:白葡萄酒的关联度大小关系为:R4R3R2R,R5.由以上说明醇类物质等理化指标对葡萄酒的质量有重要影响,然而影响葡

30、萄及质量的因素不止这些。比如:葡萄果实中糖的成分的多少,是制约发酵后葡萄酒的酒精度的要素。因此我们建立了综合指标评价模型来论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。综合指标评价模型:模型建立:综合指标计算公式:每一瓶酒对应一个综合指标红葡萄酒有27个综合指标Mi(1i27)白葡萄酒有28个综合指标Mi(1i28)模型求解:利用计算机编程求解出每瓶葡萄酒的综合指标Mi(程序见附录)见下表:红葡锢酒编号分数综合指标白葡萄酒编号分数综合指标1351151262255943333781447092457751815326148961172540773086087359132963010688

31、1022911213115051220958123013489813284149146398158714152116951613176417376184553218772319881974672076532762015211621343221322266231572320241272418425140122529261596262257279782710212812利用matlab拟合综合指标的值与第二问中葡萄酒的分数得到下图:红葡萄酒:去除一个奇点后用指数函数拟合得下图:拟合结果:f(x)=a*exp(b*x)a=+011+013,+013)b=,R-square:白葡萄酒:用指数函数拟合后

32、如下图:拟合结果:f(x)=a*exp(b*x)a=1215+004,+004)b=,R-square:由R-square值可以看出两组曲线拟合的结果不好,变换拟合函数尝试数次后所得拟合结果均不理想,因此我们认为不能定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只能根据图像大致猜测综合指标与葡萄酒的质量负相关六模型评价优点:1 .本文在建模过程中,使用了建模与软件分析相结合的方法,提高了计算结果的准确性;2 .本文在求解是对同一问题使用两种不同方法,使模型得出的结果更加可靠;3 .本文在建模过程中使用的方法简单有效,在原模型的基础上又有一定的创新缺点:通过经验设定综合指标进行求解,简化了相

33、应的数学模型,只是缺少对综合指标设立的检验,依据性不强。七参考文献1陈光亭裘哲勇数学建模高等教育出版社2010年2月2王宏洲数学建模优秀论文清华大学出版社2011年9月3姜启源、谢金星、叶俊,数学模型(第四版),北京:高等教育出版社,2011年。4白凤山、么焕民等,数学建模(上册),哈尔滨:哈尔滨工业大学出版社,2003年。附录酿酒红葡萄与红葡萄酒理化指标的回归系数酿酒白葡萄与白葡萄酒理化指标的回归系数X(j)Y(i)123456789120000000003456789101112131415161718192021222324252627282930,12345678Y(i)1234567

34、89101112131415161718192021222324252627282930代码T检验functionH,P,CI=ttest(X,Y)%医示在显着性水平为下,H=1时能拒绝原假设,验的零假设HCfe两总体均值之间不存在显着差异%p拒绝H0t显着性差异%C的值小的置信区间不跨越0时说明有显着性差异Muhat,sigmahat,muci,sigmaci=normfit(X)%Muha妁均值muci为均值置信区间%sigmahat为标准差sigmaci标准差置信区问a=Muhat;b=sigmahat;Cx=b/a%X勺变异系数Muhat,sigmahat,muci,sigmaci=n

35、ormfit(Y)%Muha妁均值muci为均值置信区间%sigmahat为标准差sigmaci标准差置信区问a=Muhat;b=sigmahat;Cy=b/a%Y勺变异系数如果CxCy则说明x比y更可靠ifCxCydisp(x比y变异系数小,更稳定,结果更可靠)elsedisp(y比x变异系数小,更稳定,结果更可靠)endend聚类分析程序:x=746672;opts=statset(Display,final);%显示每次聚类的最终结果%将原始的5个点聚为3类,距离采用绝对值距离,重复聚类5次,显示每次聚类的最终结果idx=kmeans(x,4,Distance,city,Replicat

36、es,27,Options,opts)%*绘制聚类轮廓图*x=746672;%例中的观测数据%将原始的5个点聚为3类,距离采用绝对值距离,重复聚类5次idx=kmeans(x,4,Distance,city,Replicates,27);S,H=silhouette(x,idx)%绘制轮廓图,并返回轮廓值向量S?口图形句柄H%例中的观测数据opts=statset(Display,final);%显示每次聚类的最终结果%将原始的5个点聚为3类,距离采用绝对值距离,重复聚类5次,显示每次聚类的最终结果idx=kmeans(x,4,Distance,city,Replicates,27,Options,opts)%*绘制聚类轮廓图*x=746672;%例中的观测数据%将原始的5个点聚为3类,距离采用绝对值距离,重复聚类5次idx=kmeans(x,4,Distance,city,Replicates,27);S,H=silhouette(x,idx)%绘制轮廓图,并返回轮廓值向量Sft图形句柄Htitle(聚类分析(红葡萄酒心匀值聚类)%为X轴加标签主成分分析程序:*PHO=;%代入数据%*调用pcacov函数根据相关系数矩阵作主成分分析%返回主成分表达式的系数矩阵COEFF返回相关系数矩阵的特征值向量latent和主成分贡献率向量explainedCOEFF,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论