当前位置:文档之家› 数学建模-2012年葡萄酒的评价.

数学建模-2012年葡萄酒的评价.

数学建模-2012年葡萄酒的评价.
数学建模-2012年葡萄酒的评价.

306

第二十一篇 葡萄酒质量的影响因素分析

2012年A 题 葡萄酒的评价

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:

1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

附件1:葡萄酒品尝评分表(含4个表格);

附件2:葡萄和葡萄酒的理化指标(含2个表格); 附件3:葡萄和葡萄酒的芳香物质(含4个表格); 原题详见2012年全国大学生数学建模竞赛A 题。

葡萄酒质量的影响因素分析*

摘要:本文针对葡萄酒和葡萄质量的评价问题,通过t 检验、模糊聚类分析、相关性分析等多种方法,综合分析了评酒员葡萄酒品尝评分结果、葡萄和葡萄酒的理化指标以及葡萄和葡萄酒的芳香物质数据,建立了葡萄和葡萄酒的理化指标对葡萄以及葡萄酒质量的影响关系多元线性回归数学模型,运用EXCEL 、Matlab 软件得出了酿酒葡萄和葡萄酒之间的理化关系。最后,将模型结果和实际酿酒过程相结合,做出了根据酿酒葡萄和葡萄酒理化指标对葡萄酒质量进行评价的模型,对如何固化葡萄酒质量评判标准提出了相关可行性方案。

针对问题一,根据评酒员对葡萄酒品尝评分结果数据,分别对红葡萄和白葡萄,首先运用t 检验分析建立了显著性差异的成对数据t 检验模型,分析出两组评酒员的评酒结果具有显著性差异;再运用方差分析建立了方差分析模型,分析出第二组评酒员的评价结果更为可信。

针对问题二,首先运用相关性分析,确认出葡萄酒与酿酒葡萄之间的一一对应关系。再结合问

*

本文获2012年全国一等奖。队员:苏钰,胡金晶,陈成,指导教师:李勇。

307

题一中分析得出的第二组评酒员的评价结果可信度更高的结论,依据评酒员的评分结果,运用模糊聚类分析法对葡萄酒质量进行等级评估。最后,结合酿酒葡萄的理化指标数据,建立了红、白葡萄理化指标分级模型。为了方便相关技术人员对葡萄进行迅速分类,本文同时建立了一个葡萄理化指标的快速分级模型。

针对问题三,根据葡萄和葡萄酒的理化指标以及葡萄和葡萄酒的芳香物质数据,运用EXCEL 软件对这些数据加以整理分析,分别得出了红、白葡萄经过发酵变成葡萄酒之后,各项理化指标的变化情况以及变化幅度。同时,结合葡萄酿造的理化知识,对整体变化情况加以分析。最终,从定量和定性两个方面,较为完善的分析了酿酒葡萄和葡萄酒的理化指标之间的联系。

针对问题四,首先运用多元线性回归模型做出葡萄酒质量和葡萄、葡萄酒的理化性质之间的线性关系,通过理化性质指标的系数来分析酿酒葡萄和葡萄酒理化指标对葡萄酒质量的影响。然后,运用模糊综合评价模型分别按照葡萄和葡萄酒的理化性质对葡萄酒质量进行排名。最后将二者的综合排名与评酒员评的实际排名进行比较,从而论证出能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

本文通过综合运用上述t 检验分析、方差分析、相关性分析、聚类分析以及线性回归分析等方法,给出了较为完善的葡萄质量理化指标判别模型以供相关技术人员对提供的葡萄进行等级分类,给出了葡萄酒和葡萄理化指标判别模型对葡萄酒质量进行分类的理论依据。同时本文通过对数学模型的推广,分析了在其他领域的应用,并且综合评价了模型的优缺点。

关键词:葡萄;葡萄酒质量;t 检验;模糊聚类;回归分析;Matlab

21.1 问题的重述

21.1.1 背景知识

1.葡萄酒

⑴白葡萄酒:用白葡萄或皮红肉白的葡萄分离发酵制成。酒的颜色微黄带绿,近似无色或浅黄、禾秆黄、金黄。

⑵红葡萄酒:采用皮红肉白或皮肉皆红的葡萄经葡萄皮和汁混合发酵而成。酒色呈自然深宝石红、宝石红、紫红或石榴红。

葡萄的营养很高,而以葡萄为原料的葡萄酒也蕴藏了多种氨基酸、矿物质和维生素,这些物质都是人体必须补充和吸收的营养品。目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。葡萄酒的营养价值由此也得到了广泛的认可。

2.葡萄酒的酿造

在葡萄酒发酵过程中主要经过下述四个阶段:第一阶段:葡萄糖磷酸化,生成活泼的1,6-二磷酸果糖。第二阶段:1,6-二磷酸果糖分裂为二分子磷酸丙糖。第三阶段:3-磷酸甘油醛经氧化(脱氢),并磷酸化,生成1,3-二磷酸甘油酸,然后将高能磷酸键转移给ADP ,以产生ATP ,再经磷酸基变位,和分子内重排,又给出一个高能磷酸链,而后变成丙酮酸。第四阶段:酒精的生成。酵母菌在无氧条件下,将丙酮酸继续降解,产生乙醇。

3.葡萄酒的质量

⑴外观:一般而言,白酒在它年轻时是无色的,但随着陈年时间的增长,颜色会逐渐由浅黄并略带绿色反光;到成熟的麦杆色、金黄色,最后变成金铜色。若变成金铜色时,则表示已经太老不适合饮用了。红酒则相反,它的颜色会随着时间而逐渐变淡,年轻时是深红带紫,然后会渐渐转为正红或樱桃红,再转为红色偏橙红或砖红色,最后呈红褐色。

308

⑵香气:葡萄酒的香气极其丰富和复杂,不同的葡萄品种会产生一些独特的果香。好的葡萄酒香气饱满、充沛、浓郁,所以葡萄酒的香气能够比较真实、准确地反应葡萄酒的内在质量。

⑶口感:小酌一口,并以半漱口的方式,让酒在嘴中充分与空气混合且接触到口中的所有部位;当你捕捉到红葡萄酒的迷人香气时,酒液在你口腔中是如珍珠般的圆滑紧密,如丝绸般的滑润缠绵,让你不忍弃之。此时可归纳、分析出单宁、甜度、酸度、圆润度、成熟度。 21.1.2 相关数据

1.葡萄酒品尝评分表(详见原题附件1); 2.葡萄和葡萄酒的理化指标(详见原题附件2); 3.葡萄和葡萄酒的芳香物质(详见原题附件3)。 21.1.3 要解决的问题

1.问题一:根据附件1中两组评酒员的评价结果,分析其是否有显著性差异;如果有的话,那么哪一组的评分结果更为可靠。

2.问题二:在问题一中葡萄酒质量的评分结果之上,结合附件2中的酿酒葡萄的理化指标,建立定量的酿酒葡萄分级标准,从而对酿酒葡萄进行分级。

3.问题三:综合附件2、3的资料,从定量和定性两方面综合分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.问题四:分别分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

21.2 问题的分析

21.2.1 对问题的总体分析

葡萄酒的评价是一个涉及到葡萄酒外观、香气、口感等诸多方面的问题,同时评酒员的个人偏好也会对评价结果产生影响,因此对某种葡萄酒的评价具有很多的不确定性。随着当今世界人们对高品质生活的追求,葡萄酒的销量越来越庞大,对一种确定性的、不以人的意志为转移的葡萄酒质量评价方法的需求也越来越迫切。因此,本文考虑从葡萄酒和酿酒葡萄的理化指标角度入手,综合分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证用其理化指标来评价葡萄酒质量的可靠性。最终,建立起一个以葡萄和葡萄酒的理化指标来判断其质量等级的数学模型,为判断酿酒葡萄和葡萄酒质量提供一个相对完善的理化评判标准。 21.2.2 对具体问题的分析

1.对问题一的分析

根据附件1中的葡萄酒品尝评分表,分析这两组评酒员的评价结果有无显著性差异,并分析哪一组结果更可信。将问题分成两个小问来解决。对于两组评酒员的评价结果有无显著性差异这一问题,采用成对数据t 检验来判定两组评酒员评价结果的平均值的差异是否显著。对于哪一组的结果更可信这一问题,采用方差分析检验来判定哪一组的评价结果更可信。

2.对问题二的分析

根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒的葡萄进行分级。首先采用相关性分析法分析葡萄酒序号与酿酒的葡萄序号之间是否有一一对应的关系。其次对葡萄酒和对应葡萄的理化指标评价结果运用模糊C 均值聚类分析法进行评价分级。再结合葡萄的理化指标,分别得到红、白葡萄的量化分级标准。最后为了方便葡萄酒公司对买到的大量葡萄进行快速分级,本文分别为红、白

309

葡萄建立了一个葡萄快速分类法。

3.对问题三的分析

通过对酿酒葡萄和葡萄酒理化指标的研究,建立模型分析这两者之间的联系。附件2、3中给出了红、白葡萄和葡萄酒的理化指标数据和芳香物质数据,对这些数据加以统计分析,分别得出了红、白葡萄发酵后,各项理化指标的变化情况以及变化幅度。同时,结合理化知识,对整体变化情况加以分析。最终,从定量和定性两个方面,较为完善的分析了酿酒葡萄和葡萄酒的理化指标之间的联系情况。

4.对问题四的分析

根据所给数据分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,论证了能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。首先,本文建立葡萄酒质量评价值与葡萄和葡萄酒各个理化指标之间的多元线性关系,用各指标的系数分析其影响;然后建立模糊综合评价模型分别根据葡萄和葡萄酒理化指标做出葡萄酒的质量排名,将综合排名与评酒员评价得出的排名顺序相比较,进一步评估用葡萄和葡萄酒的理化指标来评价葡萄酒的质量是否合理。

21.3 模型的假设

1.各类型葡萄酒的酿造流程正常且正规;

2.葡萄和葡萄酒理化指标中未给出检测值的理化指标,含量视为零;

3.本文中的葡萄酒都为全汁葡萄酒,而非半汁葡萄酒,即都是100%葡萄汁酿制而成; 4.红、白葡萄酒分别由红、白葡萄酿造而成,且葡萄和这种葡萄酿制的葡萄酒的序号一一对应(已在问题二中论证,符合假设基本原理);

5.附件3中没有显示数据的地方表示仪器没有检测到样品该成分,即该成分含量微小,视为零。

21.4 名词解释与符号说明

21.4.1 名词解释

1.可信度:指评酒员对葡萄酒质量评分结果的可信程度;

2.显著性差异:统计学上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体,而是来自于具有差异的两个不同总体;

3.模糊聚类分析:聚类分析是数理统计中的一种多元分析方法,它是用数学方法定量地确定样本的亲疏关系,从而客观地划分类型。 21.4.2 符号说明

序号 符号 符号说明

1 i x 第一组待评价葡萄酒样品

2 i y 第二组待评价葡萄酒样品

3 j z 评酒员评酒的各个评价指标

4 i u 第一组葡萄酒样品的评价总分

5 i v

第二组葡萄酒样品的评价总分

6 m

ij x

第一组第m 个评酒员对于第i 个葡萄酒样品第j 个评价指标的评价值 7

m ij y 第二组第m 个评酒员对于第i 个葡萄酒样品第j 个评价指标的

310

21.5 模型的建立与求解

21.5.1 问题一的分析与求解

1.对问题的分析

根据附件1中的葡萄酒品尝评分表分析这两组评酒员的评价结果有无显著性差异,并分析哪一组结果更可信。将问题划分成两个小问题:一是分析两组评酒员的评价结果有无显著性差异。对于这个问题采用成对数据t 检验来判定两组评酒员评价结果的平均值的差异是否显著,通过比较p 双尾概率与之前规定的显著性水平α的大小来判断是否拒绝原假设,拒绝则有显著性差异;二是判断两组评酒员的评价结果哪一组更可信。对于这个问题采用方差分析法来判定,通过EXCEL 软件中的数据分析工具做出方差分析表,然后算出每个样品的平均方差,最后对平均方差进行汇总,分别比较红、白葡萄酒两组评酒员评价结果的平均方差和的大小,方差和小的评价结果更可信。最后,对红、白两种葡萄酒评价值的判定结果进行综合分析,得出两组中哪组的评分结果更可信。

2.对问题的求解 模型Ⅰ t 检验模型 ⑴建模思路

首先,针对红、白葡萄酒分别求出两组评酒员对所有葡萄酒的各项评价指标去掉最高分和最低分后的平均评分值,以每个指标的所有评酒员的平均评价值为各个样本,利用Excel 软件对两组评酒员每个指标的平均值样本进行t 检验:平均值的成对二样本分析,根据最后得出的概率p ,判断其是否小于假设的α值,若小于则拒绝原假设,即存在显著性差异,否则两组评酒员的评价结果之间无显著性差异。

⑵模型的建立

问题要求对两组评酒员的评价结果分析有无显著性差异。由于所有评酒员没有专业上的水平差异,故以红葡萄酒为例(白葡萄酒与其处理方法相同),将其每个指标求取平均值,因而采用主要用于检验两个处理平均数差异是否显著的t 检验对问题予以求解。

①提出假设

a .无效假设0H :21μμ=,即两组评酒员每个指标的平均值相等

b .备择假设A H :21μμ≠,即两组评酒员每个指标的平均值不相等,亦即两组评酒员的评价结果存在显著性差异。

②确定显著性水平

定义1 显著性水平:能否定0H 的人为规定的概率标准称为显著性水平,记作α。 依据小概率原理,规定显著性水平05.0=α。

③选定检验方法,计算检验统计量,确定概率值作出推断 选用平均值的成对二样本分析进行检验:

311

首先,做出每个指标的所有评酒员的平均评价值。设i x 和i y (27,,2,1 =i )分别表示第一、二组各个葡萄酒样品,9,,2,1, =j z j 分别表示澄清度、色调等各个评价指标,用i u 和i v (27,,2,1 =i )

分别表示第一、二组各葡萄酒样品的评价总分,m ij x 和m

ij y (10,,2,1 =m )分别表示一、二组第m 个

评酒员对于第i 个葡萄酒样品第j 个评价指标的评价值,分别求出对于各个葡萄酒样品十个评酒员对于每个指标j z 的平均评价值,即:

10

10

21ij

ij ij ij x x x x +++=

,10

10

21ij

ij ij ij y y y y +++=

然后再对每个葡萄酒样品的平均值进行加总得到评价总分,即:

∑==

9

1

j ij i x u ,∑==9

1

j ij i y v

接着,以()j j j j x x x X 2721,,, =和()j j j j y y y Y 2721,,, =(9,2,1, =j )分别表示求平均后第j 个指标的各葡萄酒样品组成的均值样本,U 和V 分别表示第一、二组各葡萄酒样品的评价均值总分样本,利用Excel 软件对两组评酒员每个指标的均值样本以及均值总分样本进行平均值的成对二样本分析t 检验。

④作出推断结论:是否接受假设

根据最后得出的结果P ,判断其是否小于假设的05.0=α。若小于则拒绝原假设,即存在显著性差异,否则两组评酒员的评价结果之间无显著性差异。

⑶模型的求解

根据t 检验模型代入附件1表格中的具体值,得到第一、二组对红、白葡萄酒评分结果的平均总分。

利用Excel 软件对两组评酒员每个指标的均值样本以及均值总分样本进行平均值的成对二样本分析T 检验后得到红、白葡萄酒各指标和总分t 检验:成对双样本均值分析(见表21-1)

由得出的结果分析红、白葡萄酒的总评价值均小于0.05,拒绝原假设,即两组评酒员的评价结果有显著性差异。 模型Ⅱ 方差分析模型 ⑴模型的准备 ①建模思路:

首先,针对红葡萄酒和白葡萄酒分别求出两组每个评酒员对每个葡萄酒样品的总评分值,以每个样品的所有评酒员的综合评分值为样本,求出每个样本的样本方差。然后,算出最后的平均样本

312

方差。对于同一种葡萄酒,一般评酒员们最后品尝出的评价结果应该相差不是很大,即同一样品的葡萄酒不同评酒员的评价结果方差较小的一组评分结果较为可信。

②问题分析:

由于要分析两组是否有显著性差异,所以先要验证每组数据是否满足正态性分布。为了计算方便,现将每个评酒员所品的每一种酒总分作为研究对象,所以对于红酒有2701027=?个研究对象;对于白酒有2801028=?个研究对象。将每一组的研究对象看作一个矩阵,利用matlab 来进行正态性检验。

判断正态性是否存在:

①通过频数分布直方图和正态概率图(normal probability plot )能够直观的反映出原数据是否满足正态分布,见图21-1和图21-2;

②若布尔变量h=0,表示不拒绝零假设,说明提出的假设是合理的; ③若95%的置信区间完全包括均值,则说明满足正态性; ④若sig>0.5,则不能拒绝零假设。 综上即可判断正态性存在。

对红葡萄进行正态性检验,在Matlab 中得到正态性判断结果:

Data

P r o b a b i l i t y

图21-1 正态概率图 图21-2 频数分布直方图

检验结果:①由频数分布直方图和正态概率图可以明显看出满足正态性分布;②布尔变量h=0,表示不拒绝零假设,说明提出的假设“均值70.6093”是合理的;③95%的置信区间为[68.6886,72.5301],它完全包括70.6093,且精度很高;④sig 的值为1,远超过0.5,不能拒绝零假设。综上所述红葡萄理化指标数据存在正态性。

同样方法计算出红葡萄酒和白葡萄、白葡萄酒理化指标数据也都存在正态性。 ③定义2 可信度:指品酒员对葡萄酒质量的评分结果的准确度。 ⑵模型的建立

问题要求对两组评酒员的评价结果判断哪一组可信度更高,以红葡萄酒为例(白葡萄酒处理方法与其完全相同),将各评价指标的评价结果进行综合汇总得出评价的总得分,采用单因素方差分析对组间和组内的均方差进行比较,进而得出哪一组更为可信。

①对评价结果进行综合汇总

分别对一、二组第m 个评酒员对于第i 个葡萄酒样品所有评价指标的评价值汇总,即总得分为:

∑==

9

1j m

ij

m

i x

X ,10,,2,1;9,,2,1;27,,2,1 ===m j i ; ∑==

91

j m ij

m

i y

Y ,10,,2,1;9,,2,1;27,,2,1 ===m j i

②进行单因素方差分析,利用方差比较结果

利用Excel 软件中数据分析工具中的“方差分析:单因素方差分析”进行数据处理,然后将各

313

组的每个葡萄酒样本总方差求平均,即:(27,,2,1 =i )

第一组:评酒员人数每个葡萄酒样本总方差=

i

x s ;第二组:评酒员人数

每个葡萄酒样本总方差

=i y s

最后对每组求得的平均方差求和(注:其中红葡萄酒中第20个葡萄酒样品第四个评酒员的评价结果缺省,在计算其方差平均值时应减少一个评酒员人数),即:

==

27

1

i i

x

x s S ,∑==

27

1

i i y

y s

S

比较x S 和y S 的大小,较小的一组可信度更高。 ⑶模型的求解

根据方差分析模型,结合附件1表格中的具体值,得到综合汇总后的第一、二组每个评酒员对各红、白葡萄酒样品的评价总得分情况。

利用Excel 软件中数据分析工具中的“方差分析:单因素方差分析”进行处理后,得到第一组红葡萄酒单因素方差分析(见表21-2、21-3),第二组红葡萄酒单因素方差分析(见表21-4、21-5)。

314

分析比较后发现红葡萄酒的第一组的平均方差和大于第二组的平均方差和,即:

76889.90 157.1894y =>=S S x

所以对于红葡萄酒而言,第二组评价结果可信度更高。

同样再对第一、二组白葡萄酒进行单因素方差分析,分析比较后发现第一组的平均方差和大于第二组的平均方差和,即:

8544.156 73.613y =>=S S x

所以对于白葡萄酒而言,第二组评价结果可信度更高。

综上所述,不论是红葡萄酒还是白葡萄酒,第二组评酒员的可信度都要明显高于第一组。所以,第二组评酒员的评价结果可信度更高。 21.5.2 问题二的分析与求解

1.对问题的分析

问题要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒的葡萄进行分级。由问题一得到结论:第二组评酒员的评价结果更可信,故选用第二组的评价指标进行问题的求解。首先,采用相关性分析法分析葡萄酒序号与酿酒的葡萄序号之间是否有一一对应的关系。经过检验,它们之间是一一对应的,即:1号白葡萄酒就对应着1号葡萄,2号白葡萄酒就对应着2号葡萄等等。然后,对各种葡萄酒样品的每个评价指标的所有评酒员的评价结果求平均,再对平均值求和分别得到红、白葡萄酒的评价总分,进而运用模糊C 均值聚类分析法进行评价分级。由于每一种葡萄酒都对应不同的

315

葡萄原料,故葡萄酒的分级可以进一步反推出葡萄的分级。将每个级别的葡萄的各个理化性质对应列出,得到红、白葡萄的量化分级标准。最终,为方便公司对提供的大量葡萄进行快速分级,分别为红、白葡萄建立了一个葡萄快速分类法。

2.对问题的求解 模型Ⅲ 相关性分析模型 ⑴建模思路

由于葡萄酒的评价指标有多个,故先利用变异系数法对葡萄和葡萄酒的理化指标计算权重。然后,利用加权求和法分别计算出葡萄和葡萄酒的理化指标总体评价值。最后,利用相关分析法,分别定量评估出红、白葡萄酒质量和酿酒葡萄理化指标之间的相关性。

⑵模型的建立

①变异系数法计算权重

先分别计算出第i 项指标的平均值:∑==

n

j ij

i a

n x 11

然后计算出第i

项指标的方差:∑=-?-=n j i ij

i x a

n s 1

22

)(1

1

再计算出第i 项指标的变异系数:i

i

i x s v = 最后对i v 进行归一化:∑==

m

i i

i

i v v w 1

就得到了第i 项指标的权数。 ②加权求和计算理化指标总体评价值

在附件2中,带入求出的第i 项指标的权重,分别求出红、白葡萄和葡萄酒的理化指标总体评价值。

③葡萄酒和酿酒葡萄间的相关性分析

()()()

()

()

()

()

∑∑∑===-÷--÷--÷--=

n

j n

j n

j n y y n x x n y y x x r 1

2

1

2

1

111

最终得到红、白葡萄酒和酿酒葡萄之间的相关性分别为:0.58和0.62,都大于0.5。因此,葡萄酒序号与酿酒的葡萄序号之间有一一对应的关系,即:1号白葡萄酒就对应着1号葡萄,2号白葡萄酒就对应着2号葡萄,依此类推。

模型Ⅳ 葡萄理化指标分级模型 ⑴建模思路

由于葡萄酒的评价指标有多个,故先对各个葡萄酒样品的每个评价指标的评价结果求平均,然后对每个样品的平均值求和得到总分,然后采用模糊C 均值聚类法分别对红、白葡萄酒进行分类,由葡萄酒的分类推得相应的酿酒葡萄的分类。最后,联系红、白葡萄的理化指标,建立葡萄理化指标分级标准。

⑵模型的建立

316

首先,仍以红葡萄酒为例,利用问题一中的第二组评酒员品尝总分∑==9

1

j ij i y v ,采用模糊C 均值

聚类法对两组的葡萄酒质量进行分类。

定义3 模糊C 均值聚类:定义目标函数为()()()∑∑===n

k c

i ik m ik d u V U J 112,,显然()V U J ,表示了各类

样本到聚类中心的加权距离平方和,权重是样本k x 对第i 类隶属度的m 次方,聚类准则取为求得极小值:()(){}V U J ,min

其中聚类中心为:()()∑∑==>==n k n

k m ik k m

ik i m c i u x u v 11

1,,2,1,/且 ;

其中()∑=-=2

1

12

//1j m jk ik ik d d u ,i k ik v x d -=。

得到葡萄酒的分级后,再由附件2得到相应的葡萄分级。按照级别将葡萄重新分类,并将每个级别的葡萄的各个理化性质列出,最后得到酿酒葡萄的理化指标分级标准。

⑶模型的求解

将问题一中已求得的i u 和i v ,利用Matlab 软件代入模糊C 均值聚类分析模型进行分级(程序见附录程序2),得到红、白葡萄酒的总分分级情况:

①红葡萄酒总分分级:

L1 =6,7,8,15,18;L2 =11;L3 =4,5,14,19,21,22,24,26,27;L4 =2,3,9,17,20,23;L5 =1,10,12,13,16,25。

②白葡萄酒总分分级:

L1 =10,15,22,28;L2 =7,8,11,12,13,26;L3 =1,2,3,4,6,14,18,19,20,23,24,27;L4 =16;L5 =5,9,17,21,25。

因为葡萄酒序号与所用葡萄序号一一对应,所以得出红、白葡萄分级结果,见表21-6。

综合各类葡萄的理化指标,得出葡萄理化指标与葡萄分级之间的关联,从而分别建立红、白葡萄理化指标分级模型。葡萄酒酿酒人员可以分别根据这两个模型,对采购到的红、白葡萄分别进行分级,从而为后续不同级别的葡萄酒制作奠定良好基础。

为了方便葡萄酒酿造人员对采购来的葡萄进行快速分类,建立以下快速葡萄理化指标分级模型:

①对葡萄抽检,检测各类理化指标含量;

②对葡萄理化指标的检测值加权求和得到葡萄理化性质得分score ,权值见表21-7;

317

③根据葡萄理化性质得分score ,查询快速葡萄理化指标分级模型: 红葡萄理化指标快速分级模型:

?????

??

??<<≤<≤<≤>=135135130140135185140185score score score score score level 五级

四级三级二级一级

白葡萄理化指标快速分级模型:

?????

??

??<<≤<≤<≤>=95160115162

160165162165score score score score score level 五级

四级三级二级一级

④对葡萄进行快速分级。 21.5.3 问题三的分析与求解

1.对问题的分析

问题三要求通过对酿酒葡萄和葡萄酒理化指标的研究,建立模型分析这两者之间的联系。附件2、3中给出了红、白葡萄和葡萄酒的理化指标数据,对这些数据加以整理分析,分别得出了红、白葡萄经过发酵变成葡萄酒之后,各项理化指标的变化情况以及变化幅度。同时,结合理化知识,对整体变化情况加以分析。最终,从定量和定性两个方面,较为完善的分析了酿酒葡萄和葡萄酒的理化指标之间的联系情况。

2.对问题的求解 ⑴建模的思路

通过问题三的具体分析,将思路整理成流程图(见图21-3)。 ⑵模型的建立 ①红葡萄与红葡萄酒 i)理化指标间的联系:

对红葡萄酿造前后理化成分进行分析,可以看出红葡萄酒成分变化情况。从中可以看出红葡萄与红葡萄酒的理化成分变化各异,有一些成分发酵前后都存在,但含量发生了变化,例如:单宁和花色苷;有一些成分在发酵过程中完全转化为其他成分,消失了,例如:氨基酸、蛋白质和多糖;还新生成了一些成分。因为成分种类多,变化很复杂,所以将红葡萄酿造前后理化成分变化情况用图表来清晰表示(如表21-8)。

318

图21-3 理化指标联系思路图

ii)芳香指标间的联系:

对红葡萄酿造前后芳香物质进行分析,可以看出红葡萄酒物质变化情况。从中可以看出红葡萄与红葡萄酒的芳香物质变化各异,有一些成分发酵前后都存在,但含量发生了变化,例如:丙酸乙酯、苯乙醇。有一些物质在发酵过程中完全转化为其他成分,消失了,例如:乙醛、三氯甲烷和萘。还新生成了一些成分,如:乙醇和乳酸乙酯。因为成分种类较多,变化很复杂,所以将红葡萄酿造前后芳香物质变化情况用图表来清晰表示。

②白葡萄与白葡萄酒

i)理化指标间的联系:

对红、白葡萄酿造前后理化成分进行分析,可以看出红、白葡萄酒成分变化情况。从中可以看出红、白葡萄与红、白葡萄酒的理化成分变化各异,有一些成分发酵前后都存在,但含量发生了变化,例如:单宁、总酚。有一些成分在发酵过程中完全转化为其他成分,消失了,例如:氨基酸、蛋白质和多糖。还新生成了一些成分。因为成分种类较多,变化很复杂,所以将白葡萄酿造前后理化成分变化情况用图表来清晰表示。

ii)芳香指标间的联系:

对白葡萄酿造前后芳香指标进行分析,可以看出白葡萄酒物质变化情况。从表2中可以看出白葡萄与白葡萄酒的芳香物质变化各异,有一些成分发酵前后都存在,但含量发生了变化,例如:5-甲基糠醛、2-甲基-1-丙醇。有一些物质在发酵过程中完全转化为其他成分,消失了,例如:乙醛、

319

6-甲基-5-庚烯-2-醇和甲苯。还新生成了一些成分,如:乙醇、庚酸乙酯和乳酸乙酯。因为成分种类较多,变化很复杂,所以将白葡萄酿造前后芳香物质变化情况用图表来清晰表示(如图21-4)。

③整体分析葡萄酒酿造化学原理如图21-4。

图21-4 葡萄酒酿造化学原理

20.5.4 问题四的分析与求解

1.对问题的分析

根据附件1、2、3中的数据分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。首先,针对问题的前半部分,取问题一中求得的葡萄酒的评价结果人为去掉最高和最低分的总平均值为因变量,分别以葡萄和葡萄酒的各个理化指标为自变量做多元线性回归分析,根据各自变量前的系数分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响。对于问题的后半部分,先将问题一中由附件1得到的葡萄酒的评价排名作为参考排名,建立模糊综合评价模型根据葡萄和葡萄酒的理化指标值分别对葡萄酒进行排序,最后将得到的两组排名综合,与参考排名对比分析,看二者是否基本一致。若二者排名基本一致,就说明可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

2.对问题的求解

模型V 多元线性回归模型 ⑴建模思路

因为葡萄和葡萄酒的理化指标有多个,为了研究各理化指标对葡萄酒质量的影响,选择建立葡萄酒质量与葡萄和葡萄酒理化指标之间的多元线性模型来解决问题。

⑵模型的建立

首先,选取附件所给的大部分指标,对数据进行处理,得到红、白葡萄和葡萄酒各理化指标值。根据数据,结合问题一中求得的葡萄酒评价结果的总平均值,利用Matlab 软件,做出葡萄酒评价结果和红白葡萄酒及红白葡萄的多元线性关系模型。

⑶模型的求解

以红葡萄酒为例,将具体数值带入多元线性回归模型中,在Matlab 中输入相应的程序。 ①首先做出红葡萄酒的评价结果和葡萄酒的各个理化指标的散点图(如图21-5), 经判断可以进行多元线性回归。Matlab 求解运算后得到结果:

b3 =8.6690 -0.0014 0.0350 -0.0962 0.0739 0.0716 -1.2589 -0.0257 -0.0031 -0.0056 即红葡萄酒的评价结果和红葡萄酒的各个理化指标之间的线性关系为:

320

9

8

7

6

5

4

3

2

1

0.0056X

-

0.0031X

-

0.0257X

-

1.2589X

-

0.0716X

0.0739X

0.0962X

-

0.035X

0.0014X

-

8.669+

+

+

=

Y

分析:红葡萄酒的质量受到红葡萄酒理化指标的多方面影响,花色苷、总酚、DPPH半抑制体积、色泽L*(D65)、色泽a*(D65)和色泽b*(D65)对葡萄酒质量产生的是消极影响,其中DPPH半抑制体积影响最大;单宁、酒总黄酮和白藜芦醇产生的是积极影响,其中酒总黄酮和白藜芦醇的影响相对单宁较大。做出残差与置信区间的图形,见图21-6。

R

e

s

i

d

u

a

l

s

Case Number

图21-5 红葡萄酒评价结果和葡萄酒理化指标散点图图21-6 红葡萄酒残差与置信区间图形由图21-6可看出没有异常点。

s3 =0.9108 14.7405 0.0000 0.0202

可决系数R=0.9108,说明拟合度较高。h =0,p =1 ,h=0表明残差服从正态分布,进而由t检验可知h=0,p=1,故残差服从均值为零的正态分布。

②然后做出红葡萄酒的评价结果和酿红葡萄酒的葡萄的理化指标的散点图,如图21-7。

经判断可以进行多元线性回归。

Matlab求解运算后得到结果:

b=10.9077 -0.0000 0.0085 -0.0196 0.0018 -0.0433 -0.1020 -0.2177 -0.0313 0.0011 -9.7942

0.0643 0.0102 0.1226 0.0482 -0.0056 -0.0063 0.0047 0.0223 -0.1705 -0.0517

0.0046 -0.0035 0.3662 -0.0607 -0.2186

即红葡萄酒的评价结果和红葡萄的各个理化指标之间的线性关系为:

25

24

23

22

21

20

19

18

17

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

*

2186

.0

*

0607

.0

*

3662

.0

*

0035

.0

*

0046

.0

*

0517

.0

*

1705

.0

*

0223

.0

*

0047

.0

*

0063

.0

*

0056

.0

*

0482

.0

*

1226

.0

*

0102

.0

*

0643

.0

*

7942

.9

*

0011

.0

*

0313

.0

*

2177

.0

*

1020

.0

*

0433

.0

*

0018

.0

*

0196

.0

*

0085

.0

*

9077

.

10

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

Y

-

-

+

-

+

-

-

+

+

-

-

+

+

+

+

-

+

-

-

-

-

+

-

+

-

=

分析:红葡萄酒的质量受到酿红葡萄酒的葡萄的各理化指标的多方面影响,对葡萄酒质量产生影响较大的依次是DPPH自由基1/IC50、和果皮颜色L和柠檬酸,其中氨基酸含量、蛋白质、VC 含量和白藜芦醇可以增加葡萄酒中的营养价值,花色苷、总酚、单宁、葡萄总黄酮、还原糖、果穗质量、果梗比产生积极影响。相比而言,酸、褐变度、DPPH自由基1/IC50、黄酮醇等产生消极影响。做出残差与置信区间的图形,见图21-8。

R

e

s

i

d

u

a

l

s

Case Number

图21-7 红葡萄酒的评价结果和葡萄理化指标散点图图21-8 红葡萄残差与置信区间图形由图21-8可看出没有异常点。

321

s =0.9944 7.1113 0.2892 0.0230

可知可决系数R=0.9944,说明拟合效果很好。h =0 ,p =1,h=0表明残差服从正态分布,进而由t 检验可知h=0,p=1,故残差服从均值为零的正态分布。

同红葡萄酒一样,可得白葡萄酒质量与白葡萄酒和酿酒葡萄的多元线性关系: 白葡萄酒质量与白葡萄酒理化性质的多元线性关系为:

8

76543210.1868X 0.1318X 0.265X 3.0762X 0.1331X 0.0934X -0.5382X 0.1904X --20.2787++++++=Y

分析:白葡萄酒的质量受到白葡萄酒的理化指标的多方面影响,对葡萄酒质量产生影响较大的依次是DPPH 半抑制体积、总酚和色度L*(D65),其中总酚、白藜芦醇和色度产生积极影响,酒总黄酮等产生消极影响。

s4 =0.6434 3.1578 0.0289 0.0372

可知可决系数R=0.6434,说明拟合度效果较好。h =0,p =1,h=0表明残差服从正态分布,进而由t 检验可知h=0,p=1,故残差服从均值为零的正态分布。

白葡萄酒质量与白葡萄理化性质的多元线性关系为:

25

2423222120191817161514131211109876543210042.00065.00548.00008.00025.00985.07306.00145.00051.00008.00208.01834.02742.01043.01484.07770.100046.00498.01259.01632.00465.03864.0002.00003.08147.7X X X X X X X X X X X X X X X X X X X X X X X X X Y +--++--+++-+-+++-++++-++-= 分析:白葡萄酒的质量受到酿白葡萄酒的葡萄的各理化指标的多方面影响,对葡萄酒质量产生

影响较大的依次是DPPH 半抑制体积、可滴定酸和VC 含量。其中氨基酸含量、蛋白质、VC 含量和白藜芦醇可以增加葡萄酒中的营养价值,葡萄总黄酮、黄酮醇、可滴定酸等产生消极影响,苹果酸、柠檬酸和总酚等产生消极影响。

s =0.8255 0.3786 0.9090 0.2368

可知可决系数R=0.8255,说明拟合度效果较好。h =0,p =1

h=0表明残差服从正态分布,进而由t 检验可知h=0,p=1,故残差服从均值为零的正态分布。 模型Ⅵ 模糊综合评价模型 ⑴模型的准备 建模思路

根据酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量建立模糊综合评价模型,将最后得到的葡萄和葡萄酒排名成绩综合后与评酒员评价得到的排名进行比较分析论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

⑵模型的建立 ①首先建立理想方案

本文选用模糊综合评价模型对葡萄酒的质量进行评价。设有{}n u u u U ,,,21 =是待评价的n 个葡萄酒样品,{}m v v v V ,,,21 =是评价因素集合,将U 中的每个方案用V 中的每个因素进行衡量,得到一个观测矩阵:

??????

?

??=mn m m n n a a a a a a a a a A

2

1

22221

11211 其中ij a 表示第j 个样品关于第i 项评价因素的指标值。 根据{}{}

????

?=为成本型指标

,当为效益型指标

,当ij ij ij ij i a a a a u min max 0建立理想方案0u 。

②建立相对偏差模糊矩阵

322

根据{}

{}ij

ij i ij ij a a u a r min max 0

--=

计算得出相对偏差模糊矩阵:

??????

? ??=mn m m n n r r r r r r r r r R

2

1

2222111211~. ③确定各评价指标的权数

利用变异系数法来确定各评价指标的权数。计算各指标的变异系数公式为:i

i

i x s b =

其中∑==

n

j ij i a n

x 11

为第i 项指标的平均值,()

∑=-?-=n

i ij i x a n s 1

212

11

是第i 项指标值的方差。 对i b 进行归一化,即得到各指标的权数:∑==m

i i

i

i b

b w 1

④建立综合评价模型

由∑==7

1

j ij i i r w F 计算出i F ,且若s t F F <,则第t 个葡萄酒样品排在第s 个样品前.据此分别根据酿

酒葡萄和葡萄酒的理化指标对红白两种葡萄酒的质量进行排序。

⑶模型的求解

将红、白葡萄和葡萄酒酒各理化指标值代入模糊综合评价模型中,最后得出葡萄酒质量按照葡萄和葡萄酒理化指标排名的名次比较。

为了更加直观的显现红白葡萄酒综合排名与评酒员评价排名吻合度情况,作出折线图(见图21-9、21-10)。

图21-9 红葡萄酒综合排名与评酒员评价排名比较 图21-10 白葡萄酒综合排名与评酒员评价排名比较

由图21-9和图21-10可以看出红白葡萄酒综合排名与评酒员评价排名吻合度较高,故能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

在实际生活中,为了更加准确的对葡萄酒质量进行评估,可以先利用葡萄和葡萄酒的理化指标对葡萄酒质量进行定量分析,再结合评酒员的评分情况来做综合评估,从而更加完善合理的对葡萄酒质量进行分析。

20.6 误差分析

在附件1中,评酒员4号对20号红葡萄酒样品的色调未给予打分。因此,舍去了这组值,这样就产生了一定的误差。但经过综合取平均值,在一定程度上消除了差异,所以这个误差对整个模型的影响不大。

在问题四中,虽然运用葡萄和葡萄酒理化指标来判断葡萄酒质量结果和评酒员品尝打分结果不

323

完全一致,所以对葡萄酒质量的判断会产生一定的误差。

20.7 模型的评价

1.优点:

⑴本文巧妙运用思路分解图,将建模思路完整清晰的展现出来; ⑵创新性的定义可信度,使得评价员对葡萄酒的评价结果得以量化; ⑶利用Excel 软件对数据进行处理并作出各种图表,简便,直观,快捷;

⑷运用多种数学软件(如Matlab 、Excel ),取长补短,使计算结果更加准确、明晰; ⑸本文综合葡萄酒酿造过程,将定量和定性方法相结合,对葡萄、葡萄酒的理化指标进行了全面的分析;

⑹本文建立的模型与实际紧密联系,充分考虑现实情况的不同阶段,从而使模型更贴近实际,通用性强。

2.缺点:

⑴对于一些数据,对其进行了一些必要的处理,会带来一些误差;

⑵模型中为使计算简便,使所得结果更理想化,忽略了一些次要影响因素。

20.8 模型的改进

1.在问题一中,还可以采用F 检验来判断哪一组结果更可信。最后,综合方差分析法和F 检验分析法,对两组评酒员打分结果可信度进行评价,从而进一步提高结果的可靠性。

2.在问题二中,是根据每个评酒员对葡萄酒打分的平均值,从而确定葡萄酒的质量。还可以进一步结合评酒员的评酒分类指标来详细地对葡萄酒质量进行评估,从而更加完善地对葡萄酒质量进行分级。

20.8 模型的推广

1.在问题一中,本文所用的t 检验模型不仅适用于判断两组评酒员的评价结果的显著性差异,它还适用于其他各种经济、社会、体育等活动两组评分结果的显著性差异判断。

2.本文建立的方差分析模型不仅适用于判断葡萄酒评价结果的可信度,还适用于其他需要判断多组结果可信度的情况。比如:各种赛事时,为防止由于各种原因导致的打分不公正现象,采取多组共同打分的方式。最后,就可利用本文的方差分析法判断每组打分结果的可信度,从而最终给出一个较为公平合理的打分结果。

3.在问题二中,本文分别建立了红、白葡萄理化指标分级标准。这个分级标准可以帮助酿酒人员对采购来的葡萄进行快速分级,从而为后续不同等级葡萄酒的制作奠定良好的基础。当今世界人们追逐高品质的生活,每年葡萄酒消耗量日益庞大,葡萄酒供应商的葡萄酒制作数量更为惊人。因此,这个红、白葡萄理化指标分级标准应用前景广阔。

4.在问题四中,本文从定量和定性两个方面论证了使用葡萄和葡萄酒的理化指标来评价葡萄酒质量的可靠性较高。因此,可以将这个葡萄酒理化指标评级标准定量固化下来,以后就根据葡萄和葡萄酒的理化指标来判断葡萄酒的质量,从而有效规避评酒员的个人主观因素对葡萄酒评分的影响,更可以缩减每年为给各类葡萄酒评级而带来的大量费用。

参考文献

[1] 中国葡萄酒信息网:https://www.doczj.com/doc/a413129266.html,/; [2] 葡萄酒资讯网: https://www.doczj.com/doc/a413129266.html,/;

[3] 山东师范大学发酵工艺学:https://www.doczj.com/doc/a413129266.html,/guawang/fajiao/24_70.htm ;

324

[4] 李兆斌等译.Excel 2003与VBA 编程[M].电子工业出版社.2004.9. [5] 吴礼斌.经济数学实验与建模[M].天津大学出版社.2009.8.; [6] 姜启源等.数学模型(第三版)[M].高等教育出版社.2003.8.

[7] 李运等. 统计分析在葡萄酒质量评价中的应用[J]. 酿酒科技.2009年第4期:79-82.

论文特色

◆标题定位:“葡萄酒质量的影响因素分析”既紧扣研究对象葡萄酒质量,又包含定量研究的指标影响因素,标题定位准确、简洁、传统。

◆方法鉴赏:使用成对数据t 检验、方差分析、模糊C 均值聚类、相关性分析、多元回归分析、模糊综合评价等方法,方法科学,使用恰当。且建立了可信度、显著性差异、模糊聚类分析等概念。

◆写作评析:论文摘要按总分总结构交待,字数得当、简洁经典、全面到位;关键词:葡萄、葡萄酒质量、t 检验、模糊聚类、回归分析、Matlab 分别与问题、方法、模型、算法和软件等紧密联系,恰当准确。问题的重述将原始杂乱无章的问题梳理成背景知识、相关数据、要解决的问题三个方面,层次清晰、条理分明,接近建模语言,有利于对问题本质的把握。问题的分析将分问题处理为总体分析和对具体问题的分析,这既点明问题的归属和拟采用的对策,也反映出作者的综合能力和处理问题应变能力。假设适当,具有目的性、针对性和合理性。大量图表的处理反映出作者的计算机使用能力。针对具体问题,作者按建模思路、模型的建立与求解、结果分析等步骤处理,行文有条不紊且图文并茂。

◆其它解读:论文写作较为全面,有误差分析、模型的评价、模型的改进与模型的推广。

不足之处

没有对模型改进作深入的研究,缺少灵敏度分析。

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx 葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

数学建模 葡萄酒评价模型

A题葡萄酒的评价 摘要 随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。 针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。 针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据,我们有用最小二乘法进行。 针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题: 1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析 两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以一方面,我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布;然后利用SPSS软件对两组评酒员的评价结果进行方差分析,计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。;最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价,其评价结果通常较为均匀,因此,另一方面,我们应记录和讨论表中出现的异常数据,客观评价其出现的原因。综合以上,得出结论。 2.2 对问题二的分析 首先,我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级; 然后,对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析,将葡萄分成

数学建模--葡萄酒的分级(正式版)

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子 邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关 的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其 他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式 在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违 反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西安理工大学 参赛队员 (打印并签名) :1. 郑晓东 2. 罗璐 3. 宫维静 指导教师或指导教师组负责人 (打印并签名): 日期: 2013 年 05月 10 日

葡萄酒质量的综合评价分析 摘要 近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。 对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。 对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。 对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。

2012数学建模优秀论文 葡萄酒

江苏师范大学 第五届(2011)数学建模竞赛 我们选择的题号是: B 我们的参赛队号为:

2012江苏师范大学数学建模竞赛题目 B题研究生录取问题 摘要:根据问题的背景和题目要求,研究在不同条件的研究生录取问题,在对笔试,面试以及导师信息量化,加权平均求解的基础来解决研究生录取的问题。通过构造选择矩阵和满意度矩阵建立导师和学生之间的双向选择矩阵的0-1规划模型。利用测发编程计算求出最优解,从而求得问题的最优方案,同时采用降阶技巧和创建定理,快速的求解出实用的最优解,得到对应的最优方案! 一问题重述 某学校M系计划招收10名计划内研究生,依照有关规定由初试上线的前15名学生参加复试,专家组由8位专家组成。在复试过程中,要求每位专家对每个参加复试学生的以上5个方面都给出一个等级评分,从高到低共分为A,B,C,D四个等级,并将其填入面试表内。所有参加复试学生的初试成绩、各位专家对学生的5个方面专长的评分。 该系现有10名导师拟招收研究生,分为四个研究方向。导师的研究方向、专业学术水平(发表论文数、论文检索数、编(译)著作数、科研项目数),以及对学生的期望要求。在这里导师和学生的基本情况都是公开的。要解决的问题是: (1) 首先,请你综合考虑学生的初试成绩、复试成绩等因素,帮助主管部门确定10名研究生的录取名单。然后,要求被录取的10名研究生与10名导师之间做双向选择,即学生可根据自己的专业发展意愿(依次申报2个专业志愿)、导师的基本情况和导师对学生的期望要求来选择导师;导师根据学生所报专业志愿、专家组对学生专长的评价和自己对学生的期望要求等来选择学生。请你给出一种10名研究生和导师之间的最佳双向选择方案(并不要求一名导师只带一名研究生),使师生双方的满意度最大。 (2) 根据上面已录取的10名研究生的专业志愿,如果每一位导师只能带一名研究生,请你给出一种10名导师与10名研究生双向选择的最佳方案,使得师生双方尽量都满意。 (3) 如果由十位导师根据初试的成绩及专家组的面试评价和他们自己对学生的要求条件录取研究生,那么,10名研究生的新录取方案是什么?为简化问题,假设没有申报专业志愿,请你给出这10名研究生各申报一名导师的策略和导师各选择一名研究生的策略。相互选中的即为确定;对于剩下的导师和学生,再按上述办法进行双向选择,直至确定出每一名导师带一名研究生的方案,使师生都尽量满意。 (4) 学校在确定研究生导师的过程中,要充分考虑学生的申报志愿情况。为此,学校要求根据10名导师和15名学生的综合情况选择5名导师招收研究生,再让这5名导师在

葡萄酒的评价完整版

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期: 2012 年 9 月 10 日 赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价方法研究 摘要 在本文中,我们分析葡萄酒和酿酒葡萄的理化指标与所酿的葡萄酒的质量之间的关系,研究能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。 针对问题一,本文分析了所给附件1中两组评酒员对不同葡萄酒样品的评价结果,运用方差分析法来分析两组评价结果差异的显着性。在显着性水平取为0.05的情况下,发现两组评价结果的均值和方差均满足齐性,即两组评酒员的评价结果没有显着性差异。因无显着差异,本文把两组评酒员的评分的总均值作为葡萄酒评分的期望值,计算两组评酒员对于各酒样品评分的方差并求和,结果显示第二组的总方差明显小于第一组,即其评分稳定性更高,得出第二组的评价结果更可信。 针对问题二,本文借助问题一中第二组的评价结果,将葡萄酒的质量数量化。运用主成分分析方法,得出酿酒葡萄的主要理化指标,在此基础上运用相关性分析法,分析了酿酒葡萄的主要理化指标和葡萄酒质量的相关程度,将酿酒葡萄的主要理化指标的加权平均值作为葡萄分级的标准,其中权重取为理化指标的相关系数。把各葡萄样品的主要理化指标代入表达式,得到最终加权平均值,对其划分级别,并作为葡萄的级别。结果显示红葡萄样品集中在第2,3,4级,而白葡萄大多数集中在第2级(级别数值越小代表葡萄质量越好)。 针对问题三,本文依据问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,分析了葡萄酒的理化指标与酿酒葡萄的主要理化指标之间的相关程度,我们得到的主要结论为:红葡萄酒中的花色苷与酿酒葡萄中的DPPH自由基、褐变度显着相关,与酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关;白葡萄酒中的单宁与酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关。 针对问题四,考虑到除葡萄与葡萄酒的理化指标外,葡萄与葡萄酒的芳香物质可能对葡萄质量也会造成影响。首先,运用主成分分析法,得出芳香物质中的主要成分,并借助问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,综合分析了葡萄酒质量受酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒中的芳香物质的影响程度。根据所得结果,取与葡萄酒质量关联程度较大的因素作为自变量,以葡萄酒质量作为因变量,运用多元线性回归模型建立相应的函数关系。通过上述定性与定量分析,说明葡萄酒的质量受葡萄和葡萄酒中芳香物质的影响,因此不能仅以葡萄和葡萄酒的理化指标判别葡萄酒的质量。 以上结果具有较高的可靠性和可行性,对于葡萄酒的评价具有一定的指导意义。关键词:葡萄酒质量理化指标方差分析主成分分析多元线性回归相关性分析 一:问题重述

数学建模A葡萄酒的评价完整版

数学建模A葡萄酒的评 价 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、 网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开 的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处 和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛 规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开 展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。葡萄酒的质量与 酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄 酒和酿酒葡萄的质量。 对于问题1,我们采用方差分析的方法建模解决。基本思路是:对两组评酒员的评 价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两 组评酒员的评价结果无显着性差异,通过比较两组评酒员评价结果的方差值,得出第 二组的结果更可信。 对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分 级。基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指 标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄 酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要 依据。此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因 某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。最 终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。 对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对 比,经相关性检验得到他们具有显着的线性相关性,进而用线性回归的方法得出回归 方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。 对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。 文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应 用和推广。 关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验 1.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

数学建模葡萄酒评价.docx

A题:葡萄酒的评价 摘要 本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理 化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型, 解决了葡萄酒的评价问题。 问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel 画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。 问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法(AHP )来确定影响葡萄品质的各 因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表: 等级优良中合格葡萄种类 红葡萄54108 白葡萄8892 问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP 神经网络进行比较验证。 问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量 间的联系。通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价 分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。 本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。 关键词:方差分析 Excel 逐步回归分析Bp 神经网络聚类分析Matlab DPS 数据处理系统

一、问题重述 通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题: 1.分析两组评酒员的评价结果有无显着性差异,哪一组结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 问题一:观察附表 1 中评酒员的评价结果数据,分析得出它们之间的差异。根据评酒员对各组葡 萄酒的评价结果数据,寻求结果数据更加稳定的一组,作为目标,利用求方差的数学模型, 对各个数量指标进行分析比较,得出更有可信度组。 问题二:根据不同理化指标对于酿酒葡萄影响各不相同,用层次分析法构造比较矩阵。计算得到各个因素所对应的权重,定一个分数指标,根据分数对葡萄进行分级。 问题三:题中葡萄与葡萄酒指标数分别为 60、17,考虑因变量太多,用逐步回归分析法建立求解模型,结合神经网络模型进行对比验证。将多次测试值取平均数,获得可信数据。 问题四:考虑参数过多,为剔除微小影响因素,通过聚类分析法对影响指标进行归类,寻找主要因素,用神经网络建立模型,获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数,与第二组评酒员评价数据比较分析,作为论证依据。 三、模型假设及符号说明 3.1 模型假设 (1)假设评酒员给出的评价数据不存在个人因素。 (2)假设一级指标只与一级指标相互影响,二级指标只与二级指标相互影响。 (3)假设葡萄分级时忽略二级指标对结果的影响。 3.2 符号说明 i:表示第 i 个处理观测值总体平均数。 ij :表示试验误差。 i : 表示处理i 对试验结果产生的影响。 x ij:表示i ij 总和。 ss :表示误差平方和。 e ss t表示处理间平方。

有关葡萄酒评价的数学建模论文

葡萄酒的评价 摘要 本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。 关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得 P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。然后将第一组10位() 评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。 关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。 关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。 关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。 关键词:葡萄酒质量的评价EXCEL MATLAB 、主成分分析相关系数T-检验

1.问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2.问题分析 问题一要分析两组评酒员的评价结果有无显著性差异并判断哪一组结果更可信。由于题目中有数据缺失和错误数据,我们采用曲线拟合处理这一问题。因为所给数据是小样本,总体标准差 未知的正态分布资料,因此采用T检验,根据所求得的P值判断两个平均数的差异是否显著。然后将第一组10位评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,方差大的一组则说明其打分较为严格,即说明他们对待评酒较为认真,从而认为其较为可信。 问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。考虑到不清楚葡萄酒的理化指标与葡萄酒的质量之间的关系,所以分为两种情况进行分组分析。首先根据酿酒葡萄的理化指标,采用主成分分析法给酿酒葡萄综合评分并排序,根据综合评分的排序结果对酿酒葡萄样品分级;然后将问题一所得出的较为可信的一组酒样品的评分作为葡萄酒的质量并以此分级,此即为各葡萄酒样品对应的酿酒葡萄样品的另一种分级情况。 问题三要求分析酿酒葡萄与葡萄酒理化指标之间的联系,即要求得出它们各项理化指标之间联系的紧密程度,所以采用回归分析的方法计算它们的各理化指标的相关系数,然后以相关系数的绝对值大小表示它们之间联系的紧密程度。 问题四要求探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并判断用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。考虑到问题三已经得出酿酒葡萄和葡萄酒理化指标之间的联系,且葡萄酒的理化指标相对较少,因此选择分析葡萄酒的理化指标对葡萄酒质量的影响。可以通过前面的结果,得出葡萄酒的理化指标对葡萄酒产生影响的几个主要因素,再依据这几个因素结合葡萄酒质量排序,便可以得出这几个因素对葡萄酒质量的影响。第二小问将附表3中的芳香物质考虑进来,判断其对葡萄酒质量是否有影响,从而论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

数学建模葡萄酒的评价

葡萄酒的评价 摘要 葡萄拥有很高的营养价值,本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析,对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。 针对问题一,我们首先分别计算每类葡萄酒样品在两组组评酒师评价下的综合得分,以此作为每组评酒师的最终评价结果。再运用统计学中的T 检验进行假设与检验,得出两组评价结果具有显著性差异。最后通过计算各组评价员的评价结果的标准差,以此推算稳定性指标值P ,P 值较大的可信度较高,得出2p p <红1红与2P P <白1白,进而得出第二组的评价结果更加可信。 针对问题二,我们分别对两组葡萄进行分类。在这里我们采用聚类分析法和主成分分析法,在matlab 中实现对酿酒葡萄的分类。 针对问题三,根据σ μ -= x Z 对附件2中的数据进行标准化处理,排除单位不同的影响。以酿 酒葡萄的30个一级理化指标作为自变量X ,葡萄酒9个一级的理化指标作为因变量y,建立多元线性回归模型εβ+=X y ,得出酿酒葡萄的理化指标与葡萄酒的理化指标之间的联系即回归系数矩阵 β。 针对问题四,用灰色关联度分析对两者的关系进行度量,求得理化指标对样品酒的的关联系数。然后根据葡萄酒综合得分及指标的相关系数得出样品酒的综合指标,通过MATLAB 软件对综合指标与第二问中葡萄酒的分数进行指数拟合,拟合效果不佳,因此不能定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只能根据图像大致猜测综合指标与葡萄酒的质量负相关。 关键词:T 检验 聚类分析法 主成分分析法 Z 分数 多元线性回归 一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理

葡萄酒的评价大学生数学建模竞赛

葡萄酒的评价大学生数学建模竞赛

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西南科技大学 参赛队员 (打印并签名) :1. 周立 2. 李婧 3. 赖永宽 指导教师或指导教师组负责人 (打印并签名):杨学南、王丽、倪英俊 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。 问题一: (1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。 (2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的α信度系数,分别求出两组评分的α信度系数。综合考虑这两个方面,得出第二组评分较为可信。 问题二: (1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化指标总信息量的85%。 (2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。 问题三: 对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。 问题四: (1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。 (2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键词:t检验α信度系数主成分分析 BP神经网络 GA优化BP神经网络

基于数据挖掘技术的葡萄酒评价体系研究

Advances in Applied Mathematics 应用数学进展, 2015, 4(4), 376-384 Published Online November 2015 in Hans. https://www.doczj.com/doc/a413129266.html,/journal/aam https://www.doczj.com/doc/a413129266.html,/10.12677/aam.2015.44047 The Study on Evaluation System of Wine Based on Data Mining Sizhe Wang1, Zhigang Wang2*, Yong He2 1Automation Professional Class 1301, School of Information Science and Engineering, Central South University, Changsha Hunan 2College of Information Science and Technology, Hainan University, Haikou Hainan Received: Nov. 8th, 2015; accepted: Nov. 23rd, 2015; published: Nov. 30th, 2015 Copyright ? 2015 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.doczj.com/doc/a413129266.html,/licenses/by/4.0/ Abstract Based on Question A of Mathematical Contest in Modeling for college students in 2012, the empha-sis in this paper is mainly on the establishment of evaluation system of wine based on data mining technology. The wine quality is determined by the score of the wine tasting. We analyze the credi-bility of the liquor score by one-way ANOVA. We classify the wine grape by extracting common factors of some physical and chemical indicators from the wine grape, and by clustering the factor score and wine score. The stepwise regression model is established through the correlation be-tween the physical and chemical indicators and the physical and chemical indicators of wine grapes. By the regression model between the aroma substances and the score of the wine, the key physical and chemical indicators of wine quality will be found. In the end, some shortcomings of current rating system of wine will be pointed out. Keywords Evaluation System of the Wine, Data Mining Technology, One-Way ANOVA, Cluster Analysis, Regression Analysis 基于数据挖掘技术的葡萄酒评价体系研究 王思哲1,王志刚2*,何勇2 1中南大学信息科学与工程学院自动化专业1301班,湖南长沙 2海南大学信息科学技术学院,海南海口 *通讯作者。

全国大学生数学建模竞赛题葡萄酒的评价答案全解

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析

关于葡萄酒问题的数学建模综述

葡萄酒评价模型 摘要本文讨论了葡萄酒的评价问题。 对问题一,分别求出两组评酒员对各葡萄酒样品的平均评分,通过SPSS软件对同一类酒的两组得分进行T检验,检验结果表明两组评酒员的评价结果有显著性差异。再建立评酒员和样品葡萄酒得分的典型相关分析模型,运用MATLAB 求解,以样品葡萄的得分与评酒员的相关系数越大评分越不可信为依据,得出第二组的评分更可信的结论。 对问题二,以第二组的评分为准,对葡萄酒的质量进行排序,得出排序向量,对酿酒葡萄中各个理化指标进行排序,得出排序矩阵,排序向量与排序矩阵的各列进行点乘,得到葡萄酒质量与酿酒葡萄中各个理化指标的内积,以此内积作为葡萄酒的质量与酿酒葡萄中各个理化指标的相似度指标,选出相似度较高的五项指标作为酿酒葡萄分级的参考指标。根据参考指标对酿酒葡萄进行分级,分别得出了依香气、口感、外观进行分级的酿酒葡萄分级结果(见表五,表六)。 对问题三,建立非线性回归模型,讨论酿酒葡萄与葡萄酒理化指标的联系。将葡萄和葡萄酒的理化指标进行无量纲化处理,利用最短距离法,选出葡萄理化指标中对葡萄酒理化指标影响最大的五项作为回归自变量,以葡萄酒的理化指标为回归因变量,运用MATLAB求解得到酿酒葡萄与葡萄酒的理化指标之间的4次函数关系式(见表七,表八)。 对问题四,建立酿酒葡萄的理化指标、葡萄酒的理化指标与葡萄酒质量的多重T检验模型。应用SPSS软件进行T检验,通过检验结果所体现出的向量整体差异程度表明,酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响较大,故可以用酿酒葡萄和葡萄酒的理化指标评价葡萄酒质量。 关键词理化指标;T检验;典型相关系数;回归模型;葡萄酒评价

相关主题
文本预览
相关文档 最新文档