版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、葡萄酒的评价模型 摘要 近年来, 我国掀起了一场葡萄酒热, 对葡萄酒的需求与日俱增。 特别是随着食品科学 技术的发展,人们不再满足传统感官评价葡萄酒的水平。如何运用数据资料定量研究葡 萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。本文通过对感官评价 分析,结合葡萄酒和酿酒葡萄的理化指标和芳香物质的大量数据,建立了客观可靠的葡 萄酒质量综合评价模型。 针对问题一:本题需要检验两组品酒员的评价结果是否存在显著差异,并选出更可 靠的一组。 我们将各种葡萄酒的10个二级指标得分, 相加得到每种酒的总分。 在判断知每 组品酒员的评价总分均服从正态分布后, 用检验分析两组品酒员对各葡萄酒评价的
2、差异 性, 由此计算得到两组评价的显著性差异率为13.36%, 即总体上两组品酒员的评价不存在 显著差异。但由于两组品酒员的评价仍存在部分差异,我们比较两组品酒员对55种葡萄 酒评价的方差, 发现第二组评分的方差普遍小于第一组, 所以第二组的评价结果更可信。 针对问题二: 为了对酿酒葡萄进行分级, 我们将葡萄的理化指标作为媒介。 先根据国 际指标制定适用于本题评分的分级标准,将葡萄酒进行分级,再根据理化指标经标准化 之后的数值, 利用欧氏距离对酿酒的55种酿酒葡萄进行型聚类分析。 聚类得到红白葡萄 各六个分类后,再把各类酿酒葡萄对应至相应葡萄酒的等级,将酿酒红葡萄和酿酒白葡 萄各分为五级。 针
3、对问题三:由于各种酿酒葡萄的理化指标种类复杂, 我们用主成分分析的方法, 从 酿酒红葡萄和酿酒白葡萄的27个有效指标中各提取出了8个和9个主要成分。考虑到酿酒 葡萄经化学反应酿造成葡萄酒的过程中各项理化指标一般存在线性关系,我们建立多元 线性回归模型, 得出酿酒葡萄和葡萄酒各项有效理化指标的正负相关关系。 关键词:显著性检验; 聚类分析; 主成分分析; 多元回归。 1 一、 问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对 葡萄酒进行品尝后对其分类指标打分, 然后求和得到其总分, 从而确定葡萄酒的质量。 酿 酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒
4、和酿酒葡萄检测的理化指标会 在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果, 附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学 模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果有无显著性差异, 哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄 酒的理化指标来评价葡萄酒的质量? 二、 问题分析 1.问题一的分析: 已知两组品酒员分别对27个红葡萄酒样品和28个白葡萄酒样
5、品在10个 二级指标的评分, 利用二级指标的评分之和得到每个品酒员对每种酒的总分, 判断不 同品酒员对同一葡萄酒的总分是否符合正态分布,若符合,则用检验的双侧检验对 两组品酒员各葡萄酒的评价是否存在显著性差异。由于两组品酒员对相同葡萄酒的 评价可能存在显著差异, 我们认为对同种酒的评价总分方差普遍小的一组更可信。 2.问题二的分析: 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系, 而葡萄酒和酿酒 葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知55种葡萄酒的 质量评分和酿酒葡萄的理化指标, 需要对酿酒葡萄进行分级。 我们将葡萄的理化指标 作为媒介, 先根据国际指标将葡萄酒进行分级,
6、 再根据理化指标对酿酒的55种葡萄进 行聚类, 最后将各类酿酒葡萄对应至相应的等级。 对酿酒葡萄进行聚类前需要先进性 各理化指标数据的标准化处理,再利用欧氏距离定义类与类之间和样品与样品之间 的距离, 最后逐步聚类。 3.问题三的分析:由于各种酿酒葡萄的理化指标种类复杂,我们先用主成分分析的方 法提取出能清晰反映所有有效指标的几个新指标。首先对酿酒红葡萄和酿酒白葡萄 的27个有效指标中进行标准化处理,将标准化得到的矩阵导入,分别提取出累 计贡献率恰好大于80%的前几个主成分。 考虑到酿酒葡萄经化学反应酿造成葡萄酒的 过程中各项理化指标一般存在线性关系,随后我们建立葡萄酒新指标关于酿酒葡萄 的多
7、元线性回归模型, 得出酿酒葡萄和葡萄酒各项有效理化指标的正负相关关系。 三、 模型的假设 1.同种葡萄的各理化指标和质量均相同; 2.所有葡萄酒的酿造工艺和酿造环境相同; 3.酿造葡萄和葡萄酒中未测到的芳香物质含量为零。 2 四、 符号说明 符号意义 () 第个品酒员对第种酒的第个二级指标的评分 第个品酒员对第种酒的总分 品酒员对第种葡萄酒评价总分的均数 2 品酒员对第种葡萄酒评价总分的方差 第个酿酒葡萄 第个酿酒葡萄与第个酿酒葡萄之间的距离 第种葡萄的第项指标 葡萄酒的第项理化指标 五、 模型的建立与求解 5.1问题一: 两组品酒员评价的差异分析模型 5.1.1数据的预处理 1.数据的观察:
8、 在附件一葡萄酒品尝评分表中有两组品酒员分别对每种葡萄酒的评分, 每组均有10个品酒员, 评分标准分为4个一级指标, 一级指标下又分为10个二级指标, 每个二级指标的分值如下表, 各指标总分为100: 图1:葡萄酒指标及分值 观察数据发现: 第一组7号品酒员对白葡萄酒样品3的浓度评分77存在记录错误; 第一组4号品酒员对红酒样品20的色调评分缺失。 故用对应组其他品酒员的对应指标评分均值代替其评分。 2.总分的计算:() 为第个品酒员对第种酒的第个二级指标的评分, 将各个指标的得 分相加得到第个品酒员对第种酒的总分 = 10 =1 () (1) 得到红葡萄酒27 10的矩阵, = 111 .
9、. . . . 1 = 27, = 10 5.1.2差异分析模型的建立 1. 图检验是否符合正态分布 3 正态分布是利用t检验两个独立样本是否有显著性差异的前提, 我们利用图 检验总体是否服从正态分布, 具体方法如下: 将两组20个品酒员对同一样品的评价总分按开序排列使1 2 . . 20; 再计算样本均数: = 1 20 20 =1 (2) 标准差: = ( )2 20 1 (3) 分位数: = (4) 和正态分布表对应分位置, 其中 = 0.5 20 (5) 由、画出 图,与 = 比较,若 图与之吻合,则总体服从正态分 布, 否则不服从。 2.两个独立样本的t检验 假设0: 1= 2;1:
10、 1= 2 选用双侧检验, 置信区间为95%; 计算统计量: = 1 2 (11)2 1+(21) 2 2 1+21 ( 1 1 + 1 2) (6) 查表得 2, 若 2,则 0.05, 接受0,拒绝1两个独立样本不具有显著差异; 若 2, 则 0.05, 则两组品酒员对红葡萄酒样品1的评价不存在显著性差异。 同理对27种红葡萄酒和28种白葡萄酒进行t检验的分析。记两组品酒员对第种葡 萄酒的评价是否存在显著性差异为( = 1,2,.,55), 其中27种红葡萄酒对应 = 1,2,.,27,28种 白葡萄酒对应 = 28,29,.,55。当= 1时,存在显著性差异;当= 0时,不存在显著 性差
11、异。则55种葡萄酒检验的结果如下表: 5 表1:红、 白葡萄酒的显著性分析结果 3.两组品酒员的评价结果差异分析 计算两组品酒员评价结果的显著性差异率: = , = 55 =1 , = 55 =1 (7) 得到 = 13.36%十分小, 故两组品酒员的评价结果总体上无显著性差异。 5.1.3可信度分析模型的建立 由于两组品酒员对部分几种葡萄酒的评价结果存在显著性差异,我们需要建立模型 分析哪组的评价更加可信。我们利用方差可以反映同组10个品酒员对同种酒评价的波动 程度, 建立方差模型分析可信度。 代表同组品酒员对第种葡萄酒评价总分的均数,2 代表同组品酒员对第种葡萄酒 评价总分的方差。 = 1
12、 =1 (8) 2 = 1 1 =1 ( )(9) 方差越小, 即波动程度越小, 代表评价更客观。 5.1.4可信度分析模型的求解 求得两组各10个品酒员对55种葡萄酒评价总分的方差,以葡萄酒的种类为轴。方差 为轴, 画在同一张折线图中: 6 图3:两组品酒员评价的方差对比图 发现第二组10位品酒员对55种不同葡萄酒的评价总分方差折线整体明显低于第一组10 位品酒员对55种不同葡萄酒的评价总分方差折线,即第二组评分的波动程度普遍小于第 一组, 第二组的评价结果更可信。 5.2问题二:酿酒葡萄分级模型 5.2.1葡萄酒的分级 1.分级标准的制定 现在国际上对葡萄酒的分类流行用罗伯特帕克的分类方法
13、, 即: 表2:罗伯特帕克分类法 评分等级 96-100分顶级葡萄酒 90-95分具有高级品味特征和口感的葡萄酒 80-89分品质优良, 口感纯正 70-79分一般, 略有瑕疵 60-69分低于一般 50-59分次品可以认为是一款不合格的葡萄酒 由于国际分类法是对评分为50-100的葡萄酒的分类, 而本题中品酒员对葡萄酒的 评分分布在60-85分之间, 故我们将葡萄酒的分级作适当调整, 得到适用于本题的葡萄 酒分级标准: 7 表3:葡萄酒分级标准 评分等级 80-85分一级葡萄酒 75-80分二级葡萄酒 70-75分三级葡萄酒 65-70分四级葡萄酒 60-65分五级葡萄酒 2.葡萄酒的分级结
14、果 将55中葡萄酒根据评分对应至五个等级中, 得到红葡萄酒的分级如下表: 表4:红、 白葡萄酒的分级 5.2.2基于Q型聚类的酿酒葡萄分类模型的建立 1.数据标准化 由于不同理化指标的单位不同,我们需要利用标准分数先对各理化指标的数据进行 标准化: = (10) 得到矩阵, 其中表示第个品酒员对第种葡萄酒评价总分经标准化后的数据。 = 111 . . . . . 1 2.类间距离的定义 在对有个理化指标的酿酒葡萄进行聚类分析的过程中, 利用欧氏距离定义两类理化 指标样本的距离,为第个酿酒葡萄与第个酿酒葡萄之间的距离。 = =1 | |2(11) 3. Q型聚类的实现 8 将距离最近的两个类合并
15、为一个类, 类的数目减一, 直至当前的类数目为一。 5.2.2基于Q型聚类的酿酒葡萄分类模型的求解 1.酿酒葡萄的聚类图 图4:红葡萄聚类图 图5:白葡萄聚类图 2.酿酒葡萄的聚类分析 将红葡萄和白葡萄根据聚类图各分成六类: 9 表5:酒葡萄的分类 5.2.3酿酒葡萄的分级 酿酒葡萄的理化指标反映了葡萄的种类, 同类葡萄质量相似, 酿酒葡萄的质量又与葡 萄酒的质量有密切的关系。所以我们将葡萄酒的分级与酿酒葡萄的分类结合,得到酿酒 葡萄的分级。结果如下表: 表6:红、 白葡萄的分级 5.3问题三: 酿酒葡萄与葡萄酒理化指标联系模型 5.3.1基于主成分分析的降维模型的建立 1.数据标准化 由于各
16、指标的量纲和大小存在差异, 首先需要用标准分数对数据进行标准化处理, 方 法与5.2.2中第一步相同。 2.选取主成分 27个红葡萄样本标准化之后的理化指标构成矩阵,由于果皮颜色只对葡萄本身 的观赏性存在影响而对所酿葡萄酒的质量无明显影响,我们只对其他27个指标进行 了主成分分析。 将导入,得到个第( = 1,2,.,27)个主成分及其贡献率,越大,则主成 分对模型的贡献率越大。对 = 1,2,.,27分别称为第一主成分, 第二主成分,., 前 面几个主成分构成了样本空间的最大变化特征: 10 计算前个主成分的累计贡献率, = =1 (12) 使恰好 80%, 此时选取个主成分作为酿酒葡萄样本
17、的新指标。 5.3.2基于主成分分析的降维模型的求解 红、白葡萄酒分别选取前8个和前9个主成分时,主成分的累计贡献率分别为82.842% 和82.275%,恰好可以作为酿酒葡萄样本的新指标。红、白葡萄酒主成分的贡献率和到第 个主成分的累计贡献率分别如下表: 表7:红葡萄酒理化指标主成分 表8:白葡萄酒理化指标主成分 则对于红葡萄酒, 第一主成分主要反映了氨基酸、 总糖、 还原糖、 可溶性固形物和干 物质含量的信息,第二主成分主要反映了总酚、自由基和苹果酸的信息,第三主 成分主要反映了多酚氧化酶活力、褐变度的信息,第八个主成分主要反映了蛋白 11 质、 含量、 和出汁率的信息。 八个主成分可以简
18、洁地反映红葡萄酒的27个理化指标; 同 理, 白葡萄酒的九个主成分可以简洁地反映白葡萄酒的27个理化指标。 5.3.3葡萄酒理化指标关于酿酒葡萄的多元回归模型的建立 1.确定自变量、 因变量和多元线性模型 通过对酿酒葡萄理化指标的主成分分析,多个理化指标已经合并为几个具有代表性 的主成分作为新指标, 现我们将新指标对葡萄酒的每项理化指标进行多元回归。 多元 线性回归的模型为: = 0+ 11+ 22+ . + + (13) 其中( = 1,2,.,)为上一步提取出的酿酒葡萄主成分即为新指标,为葡萄酒的理 化指标,为测量误差向量,( = 1,2,.,)为回归系数。为葡萄酒的第项理化指标。 2.利
19、用最小二乘法得到会回系数的值, 得到多元线性回归方程 = 0+ 11+ 22+ . + (14) 5.3.4葡萄酒理化指标关于酿酒葡萄的多元回归模型的求解 对于红葡萄酒: 利用所有酿酒葡萄样本的八个主成分值, 对葡萄酒的七项一级理化指 标进行多元线性回归, 红葡萄酒各理化指标的回归结果为: 1= 0.21991 0.00142+ . + 0.12158 2= 0.37241 0.03522+ . + 0.12898 3= 0.42141 0.02282+ . + 0.17558 4= 0.25451 0.00432+ . + 0.14238 . 7= 09211+ 0.01412+ . 0.0
20、9218 (15) 其中1,2,.8为酿酒红葡萄提取出的八个主成分,( = 1,2,.7)为红葡萄酒的各项一级理 化指标。 由各回归系数的正负值和大小可得出结论: 酿酒红葡萄的第一、 三主成分与红葡 萄酒的理化指标存在较强的正相关关系, 即红葡萄中的氨基酸、 总糖、 还原糖、 可溶性固 形物、白藜芦醇、黄酮醇和可滴定酸等与红葡萄酒的理化指标存在较强的正相关性,果 梗比、果皮质量与红葡萄酒的理化指标存在负相关。对于红葡萄酒,各理化指标的回归 结果为: 1= 0.2191 1+ 0.0124 2+ . + 0.1901 9 2= 0.3724 1+ 0.0352 2+ . 0.1289 9 3= 0.4132 1+ 0.0197 2+ . 0.2031 9 4=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 货币资金报表范例
- Windows Server网络管理项目教程(Windows Server 2022)(微课版)10.3 任务2 DNS中继代理
- 大型机械设备管理制度与安全操作规程(修改版1)
- 煤化工艺学煤低温干馏
- 幼儿园安全教育教案18篇
- 小学安全教育主题班会教案
- 高三烃含氧衍生物归纳
- 全省小学数学教师赛课一等奖数学一年级上册(人教2024年新编)《10的认识 》课件
- 生命在你手中主题班会
- 病历书写规范
- 生涯规划教育实践研究
- 2021年三中全会知识竞赛题库
- 防欺凌家长会
- 教师职业生涯发展报告
- 2024年时事新闻及点评【六篇】
- 酒店竞争对手分析报告
- 《工伤预防知识教育》课件
- 青岛版二年级上册数学《认识方向》单元整体备课设计
- 国际航空运费计算
- 蛔虫病学习课件
- 期末教师总结大会活动方案
评论
0/150
提交评论