当前位置:文档之家› 全国大学生数学建模竞赛一等奖论文2012年葡萄酒的评价

全国大学生数学建模竞赛一等奖论文2012年葡萄酒的评价

306

第二十一篇 葡萄酒质量的影响因素分析

2012年A 题 葡萄酒的评价

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:

1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

附件1:葡萄酒品尝评分表(含4个表格);

附件2:葡萄和葡萄酒的理化指标(含2个表格); 附件3:葡萄和葡萄酒的芳香物质(含4个表格); 原题详见2012年全国大学生数学建模竞赛A 题。

葡萄酒质量的影响因素分析*

摘要:本文针对葡萄酒和葡萄质量的评价问题,通过t 检验、模糊聚类分析、相关性分析等多种方法,综合分析了评酒员葡萄酒品尝评分结果、葡萄和葡萄酒的理化指标以及葡萄和葡萄酒的芳香物质数据,建立了葡萄和葡萄酒的理化指标对葡萄以及葡萄酒质量的影响关系多元线性回归数学模型,运用EXCEL 、Matlab 软件得出了酿酒葡萄和葡萄酒之间的理化关系。最后,将模型结果和实际酿酒过程相结合,做出了根据酿酒葡萄和葡萄酒理化指标对葡萄酒质量进行评价的模型,对如何固化葡萄酒质量评判标准提出了相关可行性方案。

针对问题一,根据评酒员对葡萄酒品尝评分结果数据,分别对红葡萄和白葡萄,首先运用t 检验分析建立了显著性差异的成对数据t 检验模型,分析出两组评酒员的评酒结果具有显著性差异;再运用方差分析建立了方差分析模型,分析出第二组评酒员的评价结果更为可信。

针对问题二,首先运用相关性分析,确认出葡萄酒与酿酒葡萄之间的一一对应关系。再结合问

*

本文获2012年全国一等奖。队员:苏钰,胡金晶,陈成,指导教师:李勇。

307

题一中分析得出的第二组评酒员的评价结果可信度更高的结论,依据评酒员的评分结果,运用模糊聚类分析法对葡萄酒质量进行等级评估。最后,结合酿酒葡萄的理化指标数据,建立了红、白葡萄理化指标分级模型。为了方便相关技术人员对葡萄进行迅速分类,本文同时建立了一个葡萄理化指标的快速分级模型。

针对问题三,根据葡萄和葡萄酒的理化指标以及葡萄和葡萄酒的芳香物质数据,运用EXCEL 软件对这些数据加以整理分析,分别得出了红、白葡萄经过发酵变成葡萄酒之后,各项理化指标的变化情况以及变化幅度。同时,结合葡萄酿造的理化知识,对整体变化情况加以分析。最终,从定量和定性两个方面,较为完善的分析了酿酒葡萄和葡萄酒的理化指标之间的联系。

针对问题四,首先运用多元线性回归模型做出葡萄酒质量和葡萄、葡萄酒的理化性质之间的线性关系,通过理化性质指标的系数来分析酿酒葡萄和葡萄酒理化指标对葡萄酒质量的影响。然后,运用模糊综合评价模型分别按照葡萄和葡萄酒的理化性质对葡萄酒质量进行排名。最后将二者的综合排名与评酒员评的实际排名进行比较,从而论证出能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

本文通过综合运用上述t 检验分析、方差分析、相关性分析、聚类分析以及线性回归分析等方法,给出了较为完善的葡萄质量理化指标判别模型以供相关技术人员对提供的葡萄进行等级分类,给出了葡萄酒和葡萄理化指标判别模型对葡萄酒质量进行分类的理论依据。同时本文通过对数学模型的推广,分析了在其他领域的应用,并且综合评价了模型的优缺点。

关键词:葡萄;葡萄酒质量;t 检验;模糊聚类;回归分析;Matlab

21.1 问题的重述

21.1.1 背景知识

1.葡萄酒

⑴白葡萄酒:用白葡萄或皮红肉白的葡萄分离发酵制成。酒的颜色微黄带绿,近似无色或浅黄、禾秆黄、金黄。

⑵红葡萄酒:采用皮红肉白或皮肉皆红的葡萄经葡萄皮和汁混合发酵而成。酒色呈自然深宝石红、宝石红、紫红或石榴红。

葡萄的营养很高,而以葡萄为原料的葡萄酒也蕴藏了多种氨基酸、矿物质和维生素,这些物质都是人体必须补充和吸收的营养品。目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。葡萄酒的营养价值由此也得到了广泛的认可。

2.葡萄酒的酿造

在葡萄酒发酵过程中主要经过下述四个阶段:第一阶段:葡萄糖磷酸化,生成活泼的1,6-二磷酸果糖。第二阶段:1,6-二磷酸果糖分裂为二分子磷酸丙糖。第三阶段:3-磷酸甘油醛经氧化(脱氢),并磷酸化,生成1,3-二磷酸甘油酸,然后将高能磷酸键转移给ADP ,以产生ATP ,再经磷酸基变位,和分子内重排,又给出一个高能磷酸链,而后变成丙酮酸。第四阶段:酒精的生成。酵母菌在无氧条件下,将丙酮酸继续降解,产生乙醇。

3.葡萄酒的质量

⑴外观:一般而言,白酒在它年轻时是无色的,但随着陈年时间的增长,颜色会逐渐由浅黄并略带绿色反光;到成熟的麦杆色、金黄色,最后变成金铜色。若变成金铜色时,则表示已经太老不适合饮用了。红酒则相反,它的颜色会随着时间而逐渐变淡,年轻时是深红带紫,然后会渐渐转为正红或樱桃红,再转为红色偏橙红或砖红色,最后呈红褐色。

308

⑵香气:葡萄酒的香气极其丰富和复杂,不同的葡萄品种会产生一些独特的果香。好的葡萄酒香气饱满、充沛、浓郁,所以葡萄酒的香气能够比较真实、准确地反应葡萄酒的内在质量。

⑶口感:小酌一口,并以半漱口的方式,让酒在嘴中充分与空气混合且接触到口中的所有部位;当你捕捉到红葡萄酒的迷人香气时,酒液在你口腔中是如珍珠般的圆滑紧密,如丝绸般的滑润缠绵,让你不忍弃之。此时可归纳、分析出单宁、甜度、酸度、圆润度、成熟度。 21.1.2 相关数据

1.葡萄酒品尝评分表(详见原题附件1); 2.葡萄和葡萄酒的理化指标(详见原题附件2); 3.葡萄和葡萄酒的芳香物质(详见原题附件3)。 21.1.3 要解决的问题

1.问题一:根据附件1中两组评酒员的评价结果,分析其是否有显著性差异;如果有的话,那么哪一组的评分结果更为可靠。

2.问题二:在问题一中葡萄酒质量的评分结果之上,结合附件2中的酿酒葡萄的理化指标,建立定量的酿酒葡萄分级标准,从而对酿酒葡萄进行分级。

3.问题三:综合附件2、3的资料,从定量和定性两方面综合分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.问题四:分别分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

21.2 问题的分析

21.2.1 对问题的总体分析

葡萄酒的评价是一个涉及到葡萄酒外观、香气、口感等诸多方面的问题,同时评酒员的个人偏好也会对评价结果产生影响,因此对某种葡萄酒的评价具有很多的不确定性。随着当今世界人们对高品质生活的追求,葡萄酒的销量越来越庞大,对一种确定性的、不以人的意志为转移的葡萄酒质量评价方法的需求也越来越迫切。因此,本文考虑从葡萄酒和酿酒葡萄的理化指标角度入手,综合分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证用其理化指标来评价葡萄酒质量的可靠性。最终,建立起一个以葡萄和葡萄酒的理化指标来判断其质量等级的数学模型,为判断酿酒葡萄和葡萄酒质量提供一个相对完善的理化评判标准。 21.2.2 对具体问题的分析

1.对问题一的分析

根据附件1中的葡萄酒品尝评分表,分析这两组评酒员的评价结果有无显著性差异,并分析哪一组结果更可信。将问题分成两个小问来解决。对于两组评酒员的评价结果有无显著性差异这一问题,采用成对数据t 检验来判定两组评酒员评价结果的平均值的差异是否显著。对于哪一组的结果更可信这一问题,采用方差分析检验来判定哪一组的评价结果更可信。

2.对问题二的分析

根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒的葡萄进行分级。首先采用相关性分析法分析葡萄酒序号与酿酒的葡萄序号之间是否有一一对应的关系。其次对葡萄酒和对应葡萄的理化指标评价结果运用模糊C 均值聚类分析法进行评价分级。再结合葡萄的理化指标,分别得到红、白葡萄的量化分级标准。最后为了方便葡萄酒公司对买到的大量葡萄进行快速分级,本文分别为红、白

309

葡萄建立了一个葡萄快速分类法。

3.对问题三的分析

通过对酿酒葡萄和葡萄酒理化指标的研究,建立模型分析这两者之间的联系。附件2、3中给出了红、白葡萄和葡萄酒的理化指标数据和芳香物质数据,对这些数据加以统计分析,分别得出了红、白葡萄发酵后,各项理化指标的变化情况以及变化幅度。同时,结合理化知识,对整体变化情况加以分析。最终,从定量和定性两个方面,较为完善的分析了酿酒葡萄和葡萄酒的理化指标之间的联系情况。

4.对问题四的分析

根据所给数据分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,论证了能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。首先,本文建立葡萄酒质量评价值与葡萄和葡萄酒各个理化指标之间的多元线性关系,用各指标的系数分析其影响;然后建立模糊综合评价模型分别根据葡萄和葡萄酒理化指标做出葡萄酒的质量排名,将综合排名与评酒员评价得出的排名顺序相比较,进一步评估用葡萄和葡萄酒的理化指标来评价葡萄酒的质量是否合理。

21.3 模型的假设

1.各类型葡萄酒的酿造流程正常且正规;

2.葡萄和葡萄酒理化指标中未给出检测值的理化指标,含量视为零;

3.本文中的葡萄酒都为全汁葡萄酒,而非半汁葡萄酒,即都是100%葡萄汁酿制而成; 4.红、白葡萄酒分别由红、白葡萄酿造而成,且葡萄和这种葡萄酿制的葡萄酒的序号一一对应(已在问题二中论证,符合假设基本原理);

5.附件3中没有显示数据的地方表示仪器没有检测到样品该成分,即该成分含量微小,视为零。

21.4 名词解释与符号说明

21.4.1 名词解释

1.可信度:指评酒员对葡萄酒质量评分结果的可信程度;

2.显著性差异:统计学上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体,而是来自于具有差异的两个不同总体;

3.模糊聚类分析:聚类分析是数理统计中的一种多元分析方法,它是用数学方法定量地确定样本的亲疏关系,从而客观地划分类型。 21.4.2 符号说明

序号 符号 符号说明

1 i x 第一组待评价葡萄酒样品

2 i y 第二组待评价葡萄酒样品

3 j z 评酒员评酒的各个评价指标

4 i u 第一组葡萄酒样品的评价总分

5 i v

第二组葡萄酒样品的评价总分

6 m

ij x

第一组第m 个评酒员对于第i 个葡萄酒样品第j 个评价指标的评价值 7

m ij y 第二组第m 个评酒员对于第i 个葡萄酒样品第j 个评价指标的

310

21.5 模型的建立与求解

21.5.1 问题一的分析与求解

1.对问题的分析

根据附件1中的葡萄酒品尝评分表分析这两组评酒员的评价结果有无显著性差异,并分析哪一组结果更可信。将问题划分成两个小问题:一是分析两组评酒员的评价结果有无显著性差异。对于这个问题采用成对数据t 检验来判定两组评酒员评价结果的平均值的差异是否显著,通过比较p 双尾概率与之前规定的显著性水平α的大小来判断是否拒绝原假设,拒绝则有显著性差异;二是判断两组评酒员的评价结果哪一组更可信。对于这个问题采用方差分析法来判定,通过EXCEL 软件中的数据分析工具做出方差分析表,然后算出每个样品的平均方差,最后对平均方差进行汇总,分别比较红、白葡萄酒两组评酒员评价结果的平均方差和的大小,方差和小的评价结果更可信。最后,对红、白两种葡萄酒评价值的判定结果进行综合分析,得出两组中哪组的评分结果更可信。

2.对问题的求解 模型Ⅰ t 检验模型 ⑴建模思路

首先,针对红、白葡萄酒分别求出两组评酒员对所有葡萄酒的各项评价指标去掉最高分和最低分后的平均评分值,以每个指标的所有评酒员的平均评价值为各个样本,利用Excel 软件对两组评酒员每个指标的平均值样本进行t 检验:平均值的成对二样本分析,根据最后得出的概率p ,判断其是否小于假设的α值,若小于则拒绝原假设,即存在显著性差异,否则两组评酒员的评价结果之间无显著性差异。

⑵模型的建立

问题要求对两组评酒员的评价结果分析有无显著性差异。由于所有评酒员没有专业上的水平差异,故以红葡萄酒为例(白葡萄酒与其处理方法相同),将其每个指标求取平均值,因而采用主要用于检验两个处理平均数差异是否显著的t 检验对问题予以求解。

①提出假设

a .无效假设0H :21μμ=,即两组评酒员每个指标的平均值相等

b .备择假设A H :21μμ≠,即两组评酒员每个指标的平均值不相等,亦即两组评酒员的评价结果存在显著性差异。

②确定显著性水平

定义1 显著性水平:能否定0H 的人为规定的概率标准称为显著性水平,记作α。 依据小概率原理,规定显著性水平05.0=α。

③选定检验方法,计算检验统计量,确定概率值作出推断 选用平均值的成对二样本分析进行检验:

311

首先,做出每个指标的所有评酒员的平均评价值。设i x 和i y (27,,2,1 =i )分别表示第一、二组各个葡萄酒样品,9,,2,1, =j z j 分别表示澄清度、色调等各个评价指标,用i u 和i v (27,,2,1 =i )

分别表示第一、二组各葡萄酒样品的评价总分,m ij x 和m

ij y (10,,2,1 =m )分别表示一、二组第m 个

评酒员对于第i 个葡萄酒样品第j 个评价指标的评价值,分别求出对于各个葡萄酒样品十个评酒员对于每个指标j z 的平均评价值,即:

10

10

21ij

ij ij ij x x x x +++=

,10

10

21ij

ij ij ij y y y y +++=

然后再对每个葡萄酒样品的平均值进行加总得到评价总分,即:

∑==

9

1

j ij i x u ,∑==9

1

j ij i y v

接着,以()j j j j x x x X 2721,,, =和()j j j j y y y Y 2721,,, =(9,2,1, =j )分别表示求平均后第j 个指标的各葡萄酒样品组成的均值样本,U 和V 分别表示第一、二组各葡萄酒样品的评价均值总分样本,利用Excel 软件对两组评酒员每个指标的均值样本以及均值总分样本进行平均值的成对二样本分析t 检验。

④作出推断结论:是否接受假设

根据最后得出的结果P ,判断其是否小于假设的05.0=α。若小于则拒绝原假设,即存在显著性差异,否则两组评酒员的评价结果之间无显著性差异。

⑶模型的求解

根据t 检验模型代入附件1表格中的具体值,得到第一、二组对红、白葡萄酒评分结果的平均总分。

利用Excel 软件对两组评酒员每个指标的均值样本以及均值总分样本进行平均值的成对二样本分析T 检验后得到红、白葡萄酒各指标和总分t 检验:成对双样本均值分析(见表21-1)

由得出的结果分析红、白葡萄酒的总评价值均小于0.05,拒绝原假设,即两组评酒员的评价结果有显著性差异。 模型Ⅱ 方差分析模型 ⑴模型的准备 ①建模思路:

首先,针对红葡萄酒和白葡萄酒分别求出两组每个评酒员对每个葡萄酒样品的总评分值,以每个样品的所有评酒员的综合评分值为样本,求出每个样本的样本方差。然后,算出最后的平均样本

312

方差。对于同一种葡萄酒,一般评酒员们最后品尝出的评价结果应该相差不是很大,即同一样品的葡萄酒不同评酒员的评价结果方差较小的一组评分结果较为可信。

②问题分析:

由于要分析两组是否有显著性差异,所以先要验证每组数据是否满足正态性分布。为了计算方便,现将每个评酒员所品的每一种酒总分作为研究对象,所以对于红酒有2701027=?个研究对象;对于白酒有2801028=?个研究对象。将每一组的研究对象看作一个矩阵,利用matlab 来进行正态性检验。

判断正态性是否存在:

①通过频数分布直方图和正态概率图(normal probability plot )能够直观的反映出原数据是否满足正态分布,见图21-1和图21-2;

②若布尔变量h=0,表示不拒绝零假设,说明提出的假设是合理的; ③若95%的置信区间完全包括均值,则说明满足正态性; ④若sig>0.5,则不能拒绝零假设。 综上即可判断正态性存在。

对红葡萄进行正态性检验,在Matlab 中得到正态性判断结果:

Data

P r o b a b i l i t y

图21-1 正态概率图 图21-2 频数分布直方图

检验结果:①由频数分布直方图和正态概率图可以明显看出满足正态性分布;②布尔变量h=0,表示不拒绝零假设,说明提出的假设“均值70.6093”是合理的;③95%的置信区间为[68.6886,72.5301],它完全包括70.6093,且精度很高;④sig 的值为1,远超过0.5,不能拒绝零假设。综上所述红葡萄理化指标数据存在正态性。

同样方法计算出红葡萄酒和白葡萄、白葡萄酒理化指标数据也都存在正态性。 ③定义2 可信度:指品酒员对葡萄酒质量的评分结果的准确度。 ⑵模型的建立

问题要求对两组评酒员的评价结果判断哪一组可信度更高,以红葡萄酒为例(白葡萄酒处理方法与其完全相同),将各评价指标的评价结果进行综合汇总得出评价的总得分,采用单因素方差分析对组间和组内的均方差进行比较,进而得出哪一组更为可信。

①对评价结果进行综合汇总

分别对一、二组第m 个评酒员对于第i 个葡萄酒样品所有评价指标的评价值汇总,即总得分为:

∑==

9

1j m

ij

m

i x

X ,10,,2,1;9,,2,1;27,,2,1 ===m j i ; ∑==

91

j m ij

m

i y

Y ,10,,2,1;9,,2,1;27,,2,1 ===m j i

②进行单因素方差分析,利用方差比较结果

利用Excel 软件中数据分析工具中的“方差分析:单因素方差分析”进行数据处理,然后将各

313

组的每个葡萄酒样本总方差求平均,即:(27,,2,1 =i )

第一组:评酒员人数每个葡萄酒样本总方差=

i

x s ;第二组:评酒员人数

每个葡萄酒样本总方差

=i y s

最后对每组求得的平均方差求和(注:其中红葡萄酒中第20个葡萄酒样品第四个评酒员的评价结果缺省,在计算其方差平均值时应减少一个评酒员人数),即:

==

27

1

i i

x

x s S ,∑==

27

1

i i y

y s

S

比较x S 和y S 的大小,较小的一组可信度更高。 ⑶模型的求解

根据方差分析模型,结合附件1表格中的具体值,得到综合汇总后的第一、二组每个评酒员对各红、白葡萄酒样品的评价总得分情况。

利用Excel 软件中数据分析工具中的“方差分析:单因素方差分析”进行处理后,得到第一组红葡萄酒单因素方差分析(见表21-2、21-3),第二组红葡萄酒单因素方差分析(见表21-4、21-5)。

314

分析比较后发现红葡萄酒的第一组的平均方差和大于第二组的平均方差和,即:

76889.90 157.1894y =>=S S x

所以对于红葡萄酒而言,第二组评价结果可信度更高。

同样再对第一、二组白葡萄酒进行单因素方差分析,分析比较后发现第一组的平均方差和大于第二组的平均方差和,即:

8544.156 73.613y =>=S S x

所以对于白葡萄酒而言,第二组评价结果可信度更高。

综上所述,不论是红葡萄酒还是白葡萄酒,第二组评酒员的可信度都要明显高于第一组。所以,第二组评酒员的评价结果可信度更高。 21.5.2 问题二的分析与求解

1.对问题的分析

问题要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒的葡萄进行分级。由问题一得到结论:第二组评酒员的评价结果更可信,故选用第二组的评价指标进行问题的求解。首先,采用相关性分析法分析葡萄酒序号与酿酒的葡萄序号之间是否有一一对应的关系。经过检验,它们之间是一一对应的,即:1号白葡萄酒就对应着1号葡萄,2号白葡萄酒就对应着2号葡萄等等。然后,对各种葡萄酒样品的每个评价指标的所有评酒员的评价结果求平均,再对平均值求和分别得到红、白葡萄酒的评价总分,进而运用模糊C 均值聚类分析法进行评价分级。由于每一种葡萄酒都对应不同的

315

葡萄原料,故葡萄酒的分级可以进一步反推出葡萄的分级。将每个级别的葡萄的各个理化性质对应列出,得到红、白葡萄的量化分级标准。最终,为方便公司对提供的大量葡萄进行快速分级,分别为红、白葡萄建立了一个葡萄快速分类法。

2.对问题的求解 模型Ⅲ 相关性分析模型 ⑴建模思路

由于葡萄酒的评价指标有多个,故先利用变异系数法对葡萄和葡萄酒的理化指标计算权重。然后,利用加权求和法分别计算出葡萄和葡萄酒的理化指标总体评价值。最后,利用相关分析法,分别定量评估出红、白葡萄酒质量和酿酒葡萄理化指标之间的相关性。

⑵模型的建立

①变异系数法计算权重

先分别计算出第i 项指标的平均值:∑==

n

j ij

i a

n x 11

然后计算出第i

项指标的方差:∑=-?-=n j i ij

i x a

n s 1

22

)(1

1

再计算出第i 项指标的变异系数:i

i

i x s v = 最后对i v 进行归一化:∑==

m

i i

i

i v v w 1

就得到了第i 项指标的权数。 ②加权求和计算理化指标总体评价值

在附件2中,带入求出的第i 项指标的权重,分别求出红、白葡萄和葡萄酒的理化指标总体评价值。

③葡萄酒和酿酒葡萄间的相关性分析

()()()

()

()

()

()

∑∑∑===-÷--÷--÷--=

n

j n

j n

j n y y n x x n y y x x r 1

2

1

2

1

111

最终得到红、白葡萄酒和酿酒葡萄之间的相关性分别为:0.58和0.62,都大于0.5。因此,葡萄酒序号与酿酒的葡萄序号之间有一一对应的关系,即:1号白葡萄酒就对应着1号葡萄,2号白葡萄酒就对应着2号葡萄,依此类推。

模型Ⅳ 葡萄理化指标分级模型 ⑴建模思路

由于葡萄酒的评价指标有多个,故先对各个葡萄酒样品的每个评价指标的评价结果求平均,然后对每个样品的平均值求和得到总分,然后采用模糊C 均值聚类法分别对红、白葡萄酒进行分类,由葡萄酒的分类推得相应的酿酒葡萄的分类。最后,联系红、白葡萄的理化指标,建立葡萄理化指标分级标准。

⑵模型的建立

316

首先,仍以红葡萄酒为例,利用问题一中的第二组评酒员品尝总分∑==9

1

j ij i y v ,采用模糊C 均值

聚类法对两组的葡萄酒质量进行分类。

定义3 模糊C 均值聚类:定义目标函数为()()()∑∑===n

k c

i ik m ik d u V U J 112,,显然()V U J ,表示了各类

样本到聚类中心的加权距离平方和,权重是样本k x 对第i 类隶属度的m 次方,聚类准则取为求得极小值:()(){}V U J ,min

其中聚类中心为:()()∑∑==>==n k n

k m ik k m

ik i m c i u x u v 11

1,,2,1,/且 ;

其中()∑=-=2

1

12

//1j m jk ik ik d d u ,i k ik v x d -=。

得到葡萄酒的分级后,再由附件2得到相应的葡萄分级。按照级别将葡萄重新分类,并将每个级别的葡萄的各个理化性质列出,最后得到酿酒葡萄的理化指标分级标准。

⑶模型的求解

将问题一中已求得的i u 和i v ,利用Matlab 软件代入模糊C 均值聚类分析模型进行分级(程序见附录程序2),得到红、白葡萄酒的总分分级情况:

①红葡萄酒总分分级:

L1 =6,7,8,15,18;L2 =11;L3 =4,5,14,19,21,22,24,26,27;L4 =2,3,9,17,20,23;L5 =1,10,12,13,16,25。

②白葡萄酒总分分级:

L1 =10,15,22,28;L2 =7,8,11,12,13,26;L3 =1,2,3,4,6,14,18,19,20,23,24,27;L4 =16;L5 =5,9,17,21,25。

因为葡萄酒序号与所用葡萄序号一一对应,所以得出红、白葡萄分级结果,见表21-6。

综合各类葡萄的理化指标,得出葡萄理化指标与葡萄分级之间的关联,从而分别建立红、白葡萄理化指标分级模型。葡萄酒酿酒人员可以分别根据这两个模型,对采购到的红、白葡萄分别进行分级,从而为后续不同级别的葡萄酒制作奠定良好基础。

为了方便葡萄酒酿造人员对采购来的葡萄进行快速分类,建立以下快速葡萄理化指标分级模型:

①对葡萄抽检,检测各类理化指标含量;

②对葡萄理化指标的检测值加权求和得到葡萄理化性质得分score ,权值见表21-7;

317

③根据葡萄理化性质得分score ,查询快速葡萄理化指标分级模型: 红葡萄理化指标快速分级模型:

?????

??

??<<≤<≤<≤>=135135130140135185140185score score score score score level 五级

四级三级二级一级

白葡萄理化指标快速分级模型:

?????

??

??<<≤<≤<≤>=95160115162

160165162165score score score score score level 五级

四级三级二级一级

④对葡萄进行快速分级。 21.5.3 问题三的分析与求解

1.对问题的分析

问题三要求通过对酿酒葡萄和葡萄酒理化指标的研究,建立模型分析这两者之间的联系。附件2、3中给出了红、白葡萄和葡萄酒的理化指标数据,对这些数据加以整理分析,分别得出了红、白葡萄经过发酵变成葡萄酒之后,各项理化指标的变化情况以及变化幅度。同时,结合理化知识,对整体变化情况加以分析。最终,从定量和定性两个方面,较为完善的分析了酿酒葡萄和葡萄酒的理化指标之间的联系情况。

2.对问题的求解 ⑴建模的思路

通过问题三的具体分析,将思路整理成流程图(见图21-3)。 ⑵模型的建立 ①红葡萄与红葡萄酒 i)理化指标间的联系:

对红葡萄酿造前后理化成分进行分析,可以看出红葡萄酒成分变化情况。从中可以看出红葡萄与红葡萄酒的理化成分变化各异,有一些成分发酵前后都存在,但含量发生了变化,例如:单宁和花色苷;有一些成分在发酵过程中完全转化为其他成分,消失了,例如:氨基酸、蛋白质和多糖;还新生成了一些成分。因为成分种类多,变化很复杂,所以将红葡萄酿造前后理化成分变化情况用图表来清晰表示(如表21-8)。

318

图21-3 理化指标联系思路图

ii)芳香指标间的联系:

对红葡萄酿造前后芳香物质进行分析,可以看出红葡萄酒物质变化情况。从中可以看出红葡萄与红葡萄酒的芳香物质变化各异,有一些成分发酵前后都存在,但含量发生了变化,例如:丙酸乙酯、苯乙醇。有一些物质在发酵过程中完全转化为其他成分,消失了,例如:乙醛、三氯甲烷和萘。还新生成了一些成分,如:乙醇和乳酸乙酯。因为成分种类较多,变化很复杂,所以将红葡萄酿造前后芳香物质变化情况用图表来清晰表示。

②白葡萄与白葡萄酒

i)理化指标间的联系:

对红、白葡萄酿造前后理化成分进行分析,可以看出红、白葡萄酒成分变化情况。从中可以看出红、白葡萄与红、白葡萄酒的理化成分变化各异,有一些成分发酵前后都存在,但含量发生了变化,例如:单宁、总酚。有一些成分在发酵过程中完全转化为其他成分,消失了,例如:氨基酸、蛋白质和多糖。还新生成了一些成分。因为成分种类较多,变化很复杂,所以将白葡萄酿造前后理化成分变化情况用图表来清晰表示。

ii)芳香指标间的联系:

对白葡萄酿造前后芳香指标进行分析,可以看出白葡萄酒物质变化情况。从表2中可以看出白葡萄与白葡萄酒的芳香物质变化各异,有一些成分发酵前后都存在,但含量发生了变化,例如:5-甲基糠醛、2-甲基-1-丙醇。有一些物质在发酵过程中完全转化为其他成分,消失了,例如:乙醛、

319

6-甲基-5-庚烯-2-醇和甲苯。还新生成了一些成分,如:乙醇、庚酸乙酯和乳酸乙酯。因为成分种类较多,变化很复杂,所以将白葡萄酿造前后芳香物质变化情况用图表来清晰表示(如图21-4)。

③整体分析葡萄酒酿造化学原理如图21-4。

图21-4 葡萄酒酿造化学原理

20.5.4 问题四的分析与求解

1.对问题的分析

根据附件1、2、3中的数据分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。首先,针对问题的前半部分,取问题一中求得的葡萄酒的评价结果人为去掉最高和最低分的总平均值为因变量,分别以葡萄和葡萄酒的各个理化指标为自变量做多元线性回归分析,根据各自变量前的系数分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响。对于问题的后半部分,先将问题一中由附件1得到的葡萄酒的评价排名作为参考排名,建立模糊综合评价模型根据葡萄和葡萄酒的理化指标值分别对葡萄酒进行排序,最后将得到的两组排名综合,与参考排名对比分析,看二者是否基本一致。若二者排名基本一致,就说明可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

2.对问题的求解

模型V 多元线性回归模型 ⑴建模思路

因为葡萄和葡萄酒的理化指标有多个,为了研究各理化指标对葡萄酒质量的影响,选择建立葡萄酒质量与葡萄和葡萄酒理化指标之间的多元线性模型来解决问题。

⑵模型的建立

首先,选取附件所给的大部分指标,对数据进行处理,得到红、白葡萄和葡萄酒各理化指标值。根据数据,结合问题一中求得的葡萄酒评价结果的总平均值,利用Matlab 软件,做出葡萄酒评价结果和红白葡萄酒及红白葡萄的多元线性关系模型。

⑶模型的求解

以红葡萄酒为例,将具体数值带入多元线性回归模型中,在Matlab 中输入相应的程序。 ①首先做出红葡萄酒的评价结果和葡萄酒的各个理化指标的散点图(如图21-5), 经判断可以进行多元线性回归。Matlab 求解运算后得到结果:

b3 =8.6690 -0.0014 0.0350 -0.0962 0.0739 0.0716 -1.2589 -0.0257 -0.0031 -0.0056 即红葡萄酒的评价结果和红葡萄酒的各个理化指标之间的线性关系为:

320

9

8

7

6

5

4

3

2

1

0.0056X

-

0.0031X

-

0.0257X

-

1.2589X

-

0.0716X

0.0739X

0.0962X

-

0.035X

0.0014X

-

8.669+

+

+

=

Y

分析:红葡萄酒的质量受到红葡萄酒理化指标的多方面影响,花色苷、总酚、DPPH半抑制体积、色泽L*(D65)、色泽a*(D65)和色泽b*(D65)对葡萄酒质量产生的是消极影响,其中DPPH半抑制体积影响最大;单宁、酒总黄酮和白藜芦醇产生的是积极影响,其中酒总黄酮和白藜芦醇的影响相对单宁较大。做出残差与置信区间的图形,见图21-6。

R

e

s

i

d

u

a

l

s

Case Number

图21-5 红葡萄酒评价结果和葡萄酒理化指标散点图图21-6 红葡萄酒残差与置信区间图形由图21-6可看出没有异常点。

s3 =0.9108 14.7405 0.0000 0.0202

可决系数R=0.9108,说明拟合度较高。h =0,p =1 ,h=0表明残差服从正态分布,进而由t检验可知h=0,p=1,故残差服从均值为零的正态分布。

②然后做出红葡萄酒的评价结果和酿红葡萄酒的葡萄的理化指标的散点图,如图21-7。

经判断可以进行多元线性回归。

Matlab求解运算后得到结果:

b=10.9077 -0.0000 0.0085 -0.0196 0.0018 -0.0433 -0.1020 -0.2177 -0.0313 0.0011 -9.7942

0.0643 0.0102 0.1226 0.0482 -0.0056 -0.0063 0.0047 0.0223 -0.1705 -0.0517

0.0046 -0.0035 0.3662 -0.0607 -0.2186

即红葡萄酒的评价结果和红葡萄的各个理化指标之间的线性关系为:

25

24

23

22

21

20

19

18

17

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

*

2186

.0

*

0607

.0

*

3662

.0

*

0035

.0

*

0046

.0

*

0517

.0

*

1705

.0

*

0223

.0

*

0047

.0

*

0063

.0

*

0056

.0

*

0482

.0

*

1226

.0

*

0102

.0

*

0643

.0

*

7942

.9

*

0011

.0

*

0313

.0

*

2177

.0

*

1020

.0

*

0433

.0

*

0018

.0

*

0196

.0

*

0085

.0

*

9077

.

10

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

Y

-

-

+

-

+

-

-

+

+

-

-

+

+

+

+

-

+

-

-

-

-

+

-

+

-

=

分析:红葡萄酒的质量受到酿红葡萄酒的葡萄的各理化指标的多方面影响,对葡萄酒质量产生影响较大的依次是DPPH自由基1/IC50、和果皮颜色L和柠檬酸,其中氨基酸含量、蛋白质、VC 含量和白藜芦醇可以增加葡萄酒中的营养价值,花色苷、总酚、单宁、葡萄总黄酮、还原糖、果穗质量、果梗比产生积极影响。相比而言,酸、褐变度、DPPH自由基1/IC50、黄酮醇等产生消极影响。做出残差与置信区间的图形,见图21-8。

R

e

s

i

d

u

a

l

s

Case Number

图21-7 红葡萄酒的评价结果和葡萄理化指标散点图图21-8 红葡萄残差与置信区间图形由图21-8可看出没有异常点。

321

s =0.9944 7.1113 0.2892 0.0230

可知可决系数R=0.9944,说明拟合效果很好。h =0 ,p =1,h=0表明残差服从正态分布,进而由t 检验可知h=0,p=1,故残差服从均值为零的正态分布。

同红葡萄酒一样,可得白葡萄酒质量与白葡萄酒和酿酒葡萄的多元线性关系: 白葡萄酒质量与白葡萄酒理化性质的多元线性关系为:

8

76543210.1868X 0.1318X 0.265X 3.0762X 0.1331X 0.0934X -0.5382X 0.1904X --20.2787++++++=Y

分析:白葡萄酒的质量受到白葡萄酒的理化指标的多方面影响,对葡萄酒质量产生影响较大的依次是DPPH 半抑制体积、总酚和色度L*(D65),其中总酚、白藜芦醇和色度产生积极影响,酒总黄酮等产生消极影响。

s4 =0.6434 3.1578 0.0289 0.0372

可知可决系数R=0.6434,说明拟合度效果较好。h =0,p =1,h=0表明残差服从正态分布,进而由t 检验可知h=0,p=1,故残差服从均值为零的正态分布。

白葡萄酒质量与白葡萄理化性质的多元线性关系为:

25

2423222120191817161514131211109876543210042.00065.00548.00008.00025.00985.07306.00145.00051.00008.00208.01834.02742.01043.01484.07770.100046.00498.01259.01632.00465.03864.0002.00003.08147.7X X X X X X X X X X X X X X X X X X X X X X X X X Y +--++--+++-+-+++-++++-++-= 分析:白葡萄酒的质量受到酿白葡萄酒的葡萄的各理化指标的多方面影响,对葡萄酒质量产生

影响较大的依次是DPPH 半抑制体积、可滴定酸和VC 含量。其中氨基酸含量、蛋白质、VC 含量和白藜芦醇可以增加葡萄酒中的营养价值,葡萄总黄酮、黄酮醇、可滴定酸等产生消极影响,苹果酸、柠檬酸和总酚等产生消极影响。

s =0.8255 0.3786 0.9090 0.2368

可知可决系数R=0.8255,说明拟合度效果较好。h =0,p =1

h=0表明残差服从正态分布,进而由t 检验可知h=0,p=1,故残差服从均值为零的正态分布。 模型Ⅵ 模糊综合评价模型 ⑴模型的准备 建模思路

根据酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量建立模糊综合评价模型,将最后得到的葡萄和葡萄酒排名成绩综合后与评酒员评价得到的排名进行比较分析论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

⑵模型的建立 ①首先建立理想方案

本文选用模糊综合评价模型对葡萄酒的质量进行评价。设有{}n u u u U ,,,21 =是待评价的n 个葡萄酒样品,{}m v v v V ,,,21 =是评价因素集合,将U 中的每个方案用V 中的每个因素进行衡量,得到一个观测矩阵:

??????

?

??=mn m m n n a a a a a a a a a A

2

1

22221

11211 其中ij a 表示第j 个样品关于第i 项评价因素的指标值。 根据{}{}

????

?=为成本型指标

,当为效益型指标

,当ij ij ij ij i a a a a u min max 0建立理想方案0u 。

②建立相对偏差模糊矩阵

322

根据{}

{}ij

ij i ij ij a a u a r min max 0

--=

计算得出相对偏差模糊矩阵:

??????

? ??=mn m m n n r r r r r r r r r R

2

1

2222111211~. ③确定各评价指标的权数

利用变异系数法来确定各评价指标的权数。计算各指标的变异系数公式为:i

i

i x s b =

其中∑==

n

j ij i a n

x 11

为第i 项指标的平均值,()

∑=-?-=n

i ij i x a n s 1

212

11

是第i 项指标值的方差。 对i b 进行归一化,即得到各指标的权数:∑==m

i i

i

i b

b w 1

④建立综合评价模型

由∑==7

1

j ij i i r w F 计算出i F ,且若s t F F <,则第t 个葡萄酒样品排在第s 个样品前.据此分别根据酿

酒葡萄和葡萄酒的理化指标对红白两种葡萄酒的质量进行排序。

⑶模型的求解

将红、白葡萄和葡萄酒酒各理化指标值代入模糊综合评价模型中,最后得出葡萄酒质量按照葡萄和葡萄酒理化指标排名的名次比较。

为了更加直观的显现红白葡萄酒综合排名与评酒员评价排名吻合度情况,作出折线图(见图21-9、21-10)。

图21-9 红葡萄酒综合排名与评酒员评价排名比较 图21-10 白葡萄酒综合排名与评酒员评价排名比较

由图21-9和图21-10可以看出红白葡萄酒综合排名与评酒员评价排名吻合度较高,故能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

在实际生活中,为了更加准确的对葡萄酒质量进行评估,可以先利用葡萄和葡萄酒的理化指标对葡萄酒质量进行定量分析,再结合评酒员的评分情况来做综合评估,从而更加完善合理的对葡萄酒质量进行分析。

20.6 误差分析

在附件1中,评酒员4号对20号红葡萄酒样品的色调未给予打分。因此,舍去了这组值,这样就产生了一定的误差。但经过综合取平均值,在一定程度上消除了差异,所以这个误差对整个模型的影响不大。

在问题四中,虽然运用葡萄和葡萄酒理化指标来判断葡萄酒质量结果和评酒员品尝打分结果不

323

完全一致,所以对葡萄酒质量的判断会产生一定的误差。

20.7 模型的评价

1.优点:

⑴本文巧妙运用思路分解图,将建模思路完整清晰的展现出来; ⑵创新性的定义可信度,使得评价员对葡萄酒的评价结果得以量化; ⑶利用Excel 软件对数据进行处理并作出各种图表,简便,直观,快捷;

⑷运用多种数学软件(如Matlab 、Excel ),取长补短,使计算结果更加准确、明晰; ⑸本文综合葡萄酒酿造过程,将定量和定性方法相结合,对葡萄、葡萄酒的理化指标进行了全面的分析;

⑹本文建立的模型与实际紧密联系,充分考虑现实情况的不同阶段,从而使模型更贴近实际,通用性强。

2.缺点:

⑴对于一些数据,对其进行了一些必要的处理,会带来一些误差;

⑵模型中为使计算简便,使所得结果更理想化,忽略了一些次要影响因素。

20.8 模型的改进

1.在问题一中,还可以采用F 检验来判断哪一组结果更可信。最后,综合方差分析法和F 检验分析法,对两组评酒员打分结果可信度进行评价,从而进一步提高结果的可靠性。

2.在问题二中,是根据每个评酒员对葡萄酒打分的平均值,从而确定葡萄酒的质量。还可以进一步结合评酒员的评酒分类指标来详细地对葡萄酒质量进行评估,从而更加完善地对葡萄酒质量进行分级。

20.8 模型的推广

1.在问题一中,本文所用的t 检验模型不仅适用于判断两组评酒员的评价结果的显著性差异,它还适用于其他各种经济、社会、体育等活动两组评分结果的显著性差异判断。

2.本文建立的方差分析模型不仅适用于判断葡萄酒评价结果的可信度,还适用于其他需要判断多组结果可信度的情况。比如:各种赛事时,为防止由于各种原因导致的打分不公正现象,采取多组共同打分的方式。最后,就可利用本文的方差分析法判断每组打分结果的可信度,从而最终给出一个较为公平合理的打分结果。

3.在问题二中,本文分别建立了红、白葡萄理化指标分级标准。这个分级标准可以帮助酿酒人员对采购来的葡萄进行快速分级,从而为后续不同等级葡萄酒的制作奠定良好的基础。当今世界人们追逐高品质的生活,每年葡萄酒消耗量日益庞大,葡萄酒供应商的葡萄酒制作数量更为惊人。因此,这个红、白葡萄理化指标分级标准应用前景广阔。

4.在问题四中,本文从定量和定性两个方面论证了使用葡萄和葡萄酒的理化指标来评价葡萄酒质量的可靠性较高。因此,可以将这个葡萄酒理化指标评级标准定量固化下来,以后就根据葡萄和葡萄酒的理化指标来判断葡萄酒的质量,从而有效规避评酒员的个人主观因素对葡萄酒评分的影响,更可以缩减每年为给各类葡萄酒评级而带来的大量费用。

参考文献

[1] 中国葡萄酒信息网:https://www.doczj.com/doc/1718607260.html,/; [2] 葡萄酒资讯网: https://www.doczj.com/doc/1718607260.html,/;

[3] 山东师范大学发酵工艺学:https://www.doczj.com/doc/1718607260.html,/guawang/fajiao/24_70.htm ;

324

[4] 李兆斌等译.Excel 2003与VBA 编程[M].电子工业出版社.2004.9. [5] 吴礼斌.经济数学实验与建模[M].天津大学出版社.2009.8.; [6] 姜启源等.数学模型(第三版)[M].高等教育出版社.2003.8.

[7] 李运等. 统计分析在葡萄酒质量评价中的应用[J]. 酿酒科技.2009年第4期:79-82.

论文特色

◆标题定位:“葡萄酒质量的影响因素分析”既紧扣研究对象葡萄酒质量,又包含定量研究的指标影响因素,标题定位准确、简洁、传统。

◆方法鉴赏:使用成对数据t 检验、方差分析、模糊C 均值聚类、相关性分析、多元回归分析、模糊综合评价等方法,方法科学,使用恰当。且建立了可信度、显著性差异、模糊聚类分析等概念。

◆写作评析:论文摘要按总分总结构交待,字数得当、简洁经典、全面到位;关键词:葡萄、葡萄酒质量、t 检验、模糊聚类、回归分析、Matlab 分别与问题、方法、模型、算法和软件等紧密联系,恰当准确。问题的重述将原始杂乱无章的问题梳理成背景知识、相关数据、要解决的问题三个方面,层次清晰、条理分明,接近建模语言,有利于对问题本质的把握。问题的分析将分问题处理为总体分析和对具体问题的分析,这既点明问题的归属和拟采用的对策,也反映出作者的综合能力和处理问题应变能力。假设适当,具有目的性、针对性和合理性。大量图表的处理反映出作者的计算机使用能力。针对具体问题,作者按建模思路、模型的建立与求解、结果分析等步骤处理,行文有条不紊且图文并茂。

◆其它解读:论文写作较为全面,有误差分析、模型的评价、模型的改进与模型的推广。

不足之处

没有对模型改进作深入的研究,缺少灵敏度分析。

相关主题
文本预览
相关文档 最新文档