当前位置:文档之家› 6、葡萄酒的评价模型(2012年A题)

6、葡萄酒的评价模型(2012年A题)

6、葡萄酒的评价模型(2012年A题)
6、葡萄酒的评价模型(2012年A题)

葡萄酒的评价模型

摘要

如今,葡萄酒被越来越多的人所热爱,不仅因为它博大精深的酒文化及其上等的品质,更多的是由于葡萄酒的营养价值。葡萄酒质量的鉴别主要靠感官分析和理化指标分析的方法来确定,本文主要讨论了葡萄酒质量与酿酒葡萄理化指标、葡萄酒理化指标之间的联系,分析了葡萄酒人工品评中存在的不足,建立了科学的葡萄酒质量评价模型,对葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。

对于问题一,本文将两组品酒员的打分结果看作两个配对样本,采取了配对样本T 检验的方法,分别对红葡萄酒与白葡萄酒的打分情况进行显著性差异分析。根据结果可知,红、白葡萄酒的打分结果均存在显著性差异,且第二组品酒员打分结果的系统误差更小,更为可信。

对于问题二,本文首先用置信区间法,将品酒员的打分结果进行转化处理,得到新的葡萄酒评分。接着,综合酿酒葡萄的理化指标并运用聚类分析法,分别以红葡萄酒与白葡萄酒的酒样作为研究对象,各项指标作为变量,对酒样进行分级。再通过酒样类别推出酿酒葡萄的分级情况。

对于问题三,为了探寻酿酒葡萄理化指标与葡萄酒理化指标之间的联系,本文运用典型相关的分析方法,将酿酒葡萄的理化指标作为影响因子,试图找到葡萄酒理化指标对应的少量主要因子。运用SAS软件对相应的因子进行回归分析,得出相应因子的系数方程,以此判断因子的正负相关性,从而建立酿酒葡萄与葡萄酒理化指标之间的关系。

对于问题四,分析了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。酿酒葡萄的理化指标是葡萄酒的理化指标的主要影响因素,在一定程度上,两个指标对葡萄酒质量的影响可以看作是相似甚至相等,于是本文选取葡萄酒的理化指标进行分析。接着,本文将乙醇与花色苷、单宁、酚类的比值作为新的理化指标,重新建立葡萄酒质量评价体系,进而分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。结果证明,仅仅用酿酒葡萄和葡萄酒的理化指标,并不能评价葡萄酒的质量。

关键字:葡萄酒理化指标配对T检验聚类分析典型相关多元回归

一、问题重述

葡萄酒的评价

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:

1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

二、符号说明与模型假设

2.1符号说明

x品酒员i 对酒样j 的评价

ij

A?第j种酒样的第i项指标在标准化后的数值

ij

x乙醇/花色苷

1

x乙醇/单宁

2

x乙醇/总酚

3

x酒总黄酮

4

x白藜芦醇

5

x DPPH半抑制体积

6

x L*(D65)

7

x a*(D65)

8

x b*(D65)

9

y质量

2.2模型假设

1.品酒员不带地区主观性,评判公正。

2.葡萄酒样品的品评得分合理、客观、全面。

2.葡萄酒的制作过程、制作方法不会影响葡萄酒的质量。

三、问题分析

3.1问题一:

品评往往受到评酒人员的嗜好、习惯、情绪、年龄、经验等因素的影响,因为评定常有一定程度的主观性和不确定性,这是评分的可靠性受到影响。问题要求对两组品酒员的打分情况进行显著性差异分析,并得出哪一组的结果更为可信。首先,我们需要对题给数据进行处理简化,计算每一个酒品样本的平均得分,在一定程度下减小了主观打分的误差。接着,考虑运用配对样本T检验方法,得到较为直观的分析结果。

3.2问题二:

题目要求根据酿酒葡萄的理化指标和葡萄的质量来对葡萄进行分级。一方面,针对问题一用置信区间法得出的对葡萄酒的评分,我们将其作为葡萄酒的质量指标值;另一方面,由于葡萄本身的理化指标过多且复杂,每项理化指标对于葡萄生产成葡萄酒的影响也过于繁杂,故我们利用葡萄酒的理化指标来对葡萄进行分类。

在进行聚类分析时,我们以酒样作为研究对象,各项指标作为变量对酒样进行聚类分析,再通过酒样得到的类别大致推出葡萄的分级情况,在此需说明的是红、白葡萄酒因葡萄品种不同分开讨论。

3.3问题三:

葡萄酒的酒酿过程是一个复杂的化学物理过程,葡萄与葡萄酒的理化指标在一定程度上显示了这一复杂的变化;但由于数据过于庞大繁杂,我们需要建立适当的模型来进行数据挖掘,从而分析理化指标之间的联系。

首先,我们要对理化指标进行简化处理,并通过调阅文献,对各理化指标进行全面的理解。这样的准备工作有助于我们对理化指标的相互关系作出初步的判断。随后,通过建立模型对理化指标进行定量分析,将得到的结果与实际物化性质进行比较分析,得到全面、科学的结论。理化指标的相关性分析可采用典型相关性模型。

3.4问题四:

问题四需要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,而题目中所说“酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系”,恰恰表明酿酒葡萄的理化指标是葡萄酒的理化指标的主要影响因素,在一定程度上两个指标对葡萄酒质量的影响可以看做是相似甚至相等,于是可以选取指标较少的葡萄酒,以他的理化指标来分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。根据化学知识,花色苷、单宁、酚类均溶于乙醇,我们以乙醇/花色苷,乙醇/单宁,乙醇/总酚作为新的指标,处理数据。

对于多个影响因素,本文以红葡萄酒作为实验对象,白葡萄酒作为检验对象,并将第一问中品酒员对酒评分的平均数作为某种葡萄酒的真实质量,采用多元线性回归方程,来线性描绘各指标对葡萄酒质量的影响,并通过图形检验及白葡萄酒检验,来判别上述回归方程的准确性。其中白葡萄酒的检验即为以多元回归方程估计28种葡萄酒的估计质量,并与真实质量相比较。对于第二问论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,本文以指标影响排名(即估计质量排名)与真实质量排名相比较,若在一定的误差允许范围内,排名有所波动,可以认为能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,反之,若误差较大,则不可以。

四、模型的建立与求解

4.1问题一

4.1.1利用T检验]1[分析两组品酒员的评价差异性

对于问题一,要求对两组品酒员的打分情况进行显著性差异分析。本文考虑运用多元统计学里的配对样本T检验方法。

4.1.1.1配对T检验的基本实现思路

配对样本是指对同一样本进行两次测试所获得的两组数据,或对两个完全相同的样本在不同条件下进行测试所得的两组数据。根据题给数据,两组品酒员均对27个红葡萄酒样本、28个白葡萄酒样本进行了打分评估,故可以将两组品酒员的打分结果看作两个配对样本(红葡萄酒与白葡萄酒),且样本打分的两个总体服从正态分布。

两个独立样本的T检验,是根据样本数据,对两个配对样本来源总体的均值是否有显著性差异进行推断。因此,本文先根据附件一提供的品酒员对葡萄酒的评价结果,将每位品酒员对每种酒样的各项指标的得分相加,即可得到两组品酒员对红葡萄酒和白葡萄酒的评价总分及平均分(详见附录1)。

在进行配对T 检验分析显著性差异的时候,我们先引进一个新的随机变量12Y X X =-对应的样本值为12(,,...),n y y y 其中,12(1,2,...,)i i i y x x i n =-=。

这样,检验的问题就转化为单样本t 检验问题(即转化为检验Y 的均值是否与0有显著差异)。

第二步,建立零假设,0:0Y H μ=

第三步,构造t 统计量

_

~(1)/1

y y

t t n s n =--

第四步,运用Spss 自动计算t 值和对应的P 值。 第五步,作出判断:

若P 值<显著水平α,则拒绝零假设,即认为两总体均值存在显著差异。 若P 值>显著水平α,则不能拒绝零假设,即认为两总体均值不存在显著

差异。

4.1.1.2 模型的求解

接下来我们用两组品酒员对两种葡萄酒样品(包括27种红葡萄酒和28种白葡萄酒)的平均分通过SPSS 软件做显著性分析。可得如下: (1)红葡萄酒:

成对样本统计量

均值 N

标准差 均值的标准误

对 1

第一组平均分 73.056 27 7.3426 1.4131 第二组平均分

70.515

27

3.9780

.7656

成对样本相关系数

N

相关系数

Sig.

对 1

第一组平均分 & 第二组平均分

27

.700

.000

成对样本检验

成对差分

t

df

Sig.(双侧)

均值

标准差 均值的

标准误

差分的 95% 置信

区间

下限

上限

成对样本检验成对差分

t df Sig.(双侧)

均值标准差

均值的

标准误

差分的 95% 置信

区间

下限上限

对1

第一组平

均分 - 第二组

平均分

2.5407 5.3719 1.0338 .4157 4.6658 2.458 26 .021

(2)白葡萄酒:

成对样本统计量

均值N 标准差均值的标准误对 1 第一组平均分74.011 28 4.8040 .9079

第二组平均分76.532 28 3.1709 .5993

成对样本相关系数

N 相关系数Sig.

对 1 第一组平均分 & 第二组平均

28 .240 .220

成对样本检验

成对差分

t df

Sig. (双侧)

均值

标准

均值的

标准误

差分的 95% 置

信区间

下限上限

对 1

第一组平均分 -

第二组平均分

-2.5

214

5.08

28

.9606 -4.4

923

-.55

05

-2.6

25

27 .014

由以上图分析可知,在红葡萄酒中的评价中,对应达概率P值

sig(双侧)=0.021<0.05

拒绝原假设,可认为两配对变量存在明显区别。即第一组品酒员和第二组品酒员的打分存在显著性差异。

同理,白葡萄酒的评价中,

sig(双侧)=0.014<0.05

同样存在显著性差异。

而通过分析标准差,第二组的标准差较小点,故第二组的评价结果更可信。 4.1.2 利用置信区间法]2[进一步优化葡萄酒评价

为了降低品酒员的异质性,可以计算所有品酒员对同一酒样的平均值(j x ) 及其标准差(j σ),则有品酒员i(i=1,2,...10) 对酒样j(j=1,2,...27或28) 评价的置信区间为j j x σ±。

其中,j x —酒样j 的平均值,j σ—酒样j 的标准差。

如果品酒员i 对酒样j 的评价(ij x )在其置信区间范围内就可以直接使用;如果其评价(ij x ) 不在置信区间范围内, 则将品酒员的评价ij x 进行逐步调整, 使不同品酒员对同一酒样的评价值都处于j j x σ±范围内, 即:

若j x ij <,则j ij ij x x

σ+=?(ij x ?为ij x 调整后在置信区间内的酒样评价); 若j x ij >,则j ij ij x x

σ-=?。 根据以上算法,我们可以利用可信度较高的第二组品酒员的得分算出两种葡萄酒经置信区间转换后的数据(见附录2)。

由以上置信区间法,我们可以大致得到一个关于红酒质量的评估(由优到劣排序): 红葡萄酒:

酒样9、酒样23、酒样20、酒样3、酒样17、酒样4、酒样2、酒样19、酒样21、酒样14、酒样5、酒样26、酒样27、酒样24、酒样22、酒样16、酒样1、酒样12、酒样10、酒样13、酒样25、酒样6、酒样15、酒样7、酒样8、酒样18、酒样11 白葡萄酒:

酒样9、酒样25、酒样5、酒样21、酒样10、酒样28、酒样15、酒样17、酒样22、酒样1、酒样23、酒样19、酒样4、酒样3、酒样14、酒样18、酒样6、酒样27、酒样26、酒样24、酒样20、酒样2、酒样7、酒样13、酒样12、酒样11、酒样8、酒样16

在对葡萄酒的感官评价中, 由于品酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同品酒员对同一酒样的评价差异很大,从而不能真实地反映不同酒样间的差异。因此,在对感官评价结果进行统计分析时,必须对品酒员的原始数据进行相应的处理,以真实反映样品间的差异。而置信区间法对原始数据进行调整,能有效地降低品酒员间的差异,真实地反映酒样间的客观差异。 4.2问题二(聚类分析模型) 4.2.1聚类分析模型原理简介]3[

聚类分析(又称群分析)是研究样品分类(或指标)问题的一种多元统计方法。聚类分析有多种,这里主要介绍系统聚类法(Hierarchical Cluster )和快速聚类法(K-Means Cluster )。

系统聚类法是根据事物本身的特征研究个体分类的方法,原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。而快速聚类法是非系统聚类法中最常用聚类法,优点是占内存少、计算量小、处理速度快,适合大样本的聚类分析,但是其只能对观测量(样本)聚类,而不能对变量聚类,且使用的聚类变量必须都是连续变量。

所谓聚类分析就是根据样品或指标的“相似”特征进行分类的一种多元统计分析方

法,这里指的类就是“相似”元素的集合。进行聚类分析需要知道待分类的若干样品及其指标值,然后通过每一类指标数据的分析,进一步对各个结构进行优化。

聚类分析的基本思想是定义样品之间的距离(或相似系数)和类与类之间的距离。一按开始将n 个样品各自自成一类,这时类间的距离与样品间的距离是一致的,然后将距离最近的两个类进行合并形成一个新类,并计算新类与其他类之间的距离,再按距离最小准则并类。每并类一次,类的个数就减少。这个过程持续到所有样品都被归为一类为止。需要在此说明,聚类分析中距离的计算有多种方法,譬如,最短距离法、最远距离法、中间距离法、重心法、类平均法、离差平方法等,可根据各自不同特点在建模时自行选择特定的距离计算法,这里不再具体阐述。 4.2.2数据处理

在问题二中,题目要求用附件2所给的有关酿酒葡萄的理化指标和葡萄酒的质量来对葡萄进行分级。然而实际操作中我们无法知晓有关葡萄本身性质的理化指标对葡萄酒的影响(即正面影响或负面影响),故我们采用葡萄酒的理化指标和葡萄酒的质量对葡萄进行分级。

在处理葡萄酒的理化指标时我们对进行过多次测试的指标值取平均值,并且将二级指标剔除在外,同时用问题一所得出的红、白两种葡萄酒的在置信区间内的平均分作为两种葡萄酒的质量指标值,因此我们对红、白葡萄进行聚类分析时,共有10或9个指标作为聚类的标准。

但是由于各指标值在数量级上差异较大,并且在单位上均有不同,当作为指标变量来对酒样进行聚类时容易导致有较大的偏差,故我们先对数据进行标准化处理,标准化的公式为

)

(?28

,27...2,1ij i ij

ij

A MAX A A ==(i=1,2,...27或28,j=1,2,...10或9)

在上述公式中,ij

A ?表示第j 种酒样的第i 项指标在标准化后的数值,即可得到处理后的数据(详见附录3)。

在SPSS 里进行聚类分析后,可得到酒样品的分类,从而推出出葡萄的分类或分级。 4.2.3模型的求解

在上述知识的基础上,我们通过SPSS 软件求解上述问题,可得如下数据分析列表: 有关红葡萄酒的相关数据:

树状图:

* * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * Dendrogram using Average Linkage (Between Groups)

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25

Label Num +---------+---------+---------+---------+---------+

酒样品15 15 -+

酒样品16 16 -+

酒样品18 18 -+-+

酒样品13 13 -+ +---+

酒样品10 10 -+-+ |

酒样品25 25 -+ | |

酒样品27 27 ---+ +-+

酒样品19 19 -+-----+ |

酒样品24 24 -+ | |

酒样品4 4 -+ | |

酒样品22 22 -+-+ | +-------------+

酒样品5 5 -+ | | | |

酒样品6 6 ---+---+ | |

酒样品17 17 ---+ | |

酒样品7 7 -+---+ | +-------------------------+

酒样品12 12 -+ +---+ | |

酒样品14 14 ---+-+ | |

酒样品26 26 ---+ | |

酒样品11 11 ---+-------------------+ |

酒样品20 20 ---+ |

酒样品1 1 -------+---------------------------+ |

酒样品8 8 -------+ | |

酒样品3 3 ---+-+ +-------------+

酒样品9 9 ---+ +---------+ |

酒样品2 2 -----+ +-----+ |

酒样品21 21 ---------------+ +-------------+

酒样品23 23 ---------------------+

根据以上的树状图,我们可以根据葡萄酒的分类推出酿酒葡萄的分级(分类),即大致可将红葡萄分为四大类:

第一类{23,21,2,9,3},

第二类{8,1}

第三类{20,11,26}

第四类{14,12,7,17,6,5,22,4,24,19,27,25,10,13,18,16,15}

上面四大类的等级分别由优到劣。

同理可得白葡萄酒的相关数据:

树状图:

* * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * Dendrogram using Average Linkage (Between Groups)

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25

Label Num +---------+---------+---------+---------+---------+

酒样品2 2 -+

酒样品6 6 -+

酒样品1 1 -+

酒样品21 21 -+---+

酒样品19 19 -+ |

酒样品11 11 ---+-+-+

酒样品25 25 ---+ | |

酒样品10 10 -----+ |

酒样品12 12 -+-+ |

酒样品15 15 -+ +---+-+

酒样品20 20 ---+ | |

酒样品13 13 -+-+ | |

酒样品18 18 -+ +---+ +-+

酒样品3 3 ---+ | |

酒样品7 7 ---+ | |

酒样品8 8 -----+---+ |

酒样品16 16 -----+ +-------+

酒样品4 4 -+ | |

酒样品9 9 -+-+ | |

酒样品23 23 -+ +-+ | +-------+

酒样品5 5 ---+ +-----+ | |

酒样品28 28 -----+ | +---------------------+

酒样品17 17 -------------------+ | |

酒样品14 14 -------+-------------+ | |

酒样品22 22 -------+ +-----+ |

酒样品26 26 ---------------------+ |

酒样品24 24 -------------------+-----------------------------+

酒样品27 27 -------------------+

根据以上的树状图,我们可以根据葡萄酒的分类推出酿酒葡萄的分级(分类),即大致可将白葡萄分为三大类:

第一类{27,24}

第二类{26,22,14}

第三类{17,28,5,23,9,4,16,8,7,3,18,13,20,15,12,10,25,11,19,21,1,6,2}

上述三大类的等级分别由优到劣。

4.3问题三(典型相关性分析]4[模型)

为了探寻酿酒葡萄理化指标与葡萄酒理化指标之间的联系,由于数据量大而繁杂,若单纯使用统计回归模型,拟合度将会很低,不能真实地反应回归函数。本文考虑运用典型相关的分析方法,试图找到单一理化指标对应的少量主要因子,运用SAS软件对相应的因子进行回归分析,得出相应因子的系数方程,以此判断因子的正负相关性,从而建立酿酒葡萄与葡萄酒理化指标之间的关系。

4.3.1 模型的准备 4.3.1.1典型相关分析

典型相关分析是统计方法家族中的年轻成员,是研究两组变量之间相关关系的一种多元统计方法。典型相关分析的基本思想类似于主成分分析,首先在每组变量中找出变量的线性组合,使其具有最大相关性,而从同一组内部提取的各主成分之间互不相关,用从两组之间分别提取的主成分的相关性来描述两组变量整体的线性相关关系。这样,讨论两组变量之间的相关就转化为只研究这些线性组合的最大相关,从而减少研究变量的个数。

4.3.1.2典型相关分析计算步骤 (一)根据分析目的建立原始矩阵 一般,原始数据矩阵为

??

??

???

???????nq n n np

n n q p q p y y y x x x y y y x x x

y y y x x x

2

1

212222122211121111211

(二)对原始数据进行标准化变化并计算相关系数矩阵

R = ??

?

???2221

1211

R R R R

其中11R ,22R 分别为第一组变量和第二组变量的相关系数阵,12R = 21

R '为第一组变量和第二组变量的相关系数。

(三)求典型相关系数和典型变量

计算矩阵11

11122221A R R R R --=以及矩阵1122211112B R R R R --=的特征值和特征向量,分别

得典型相关系数和典型变量。最后,检验各典型相关系数的显著性

在步骤(一)中,x 与y 是两个相互关联的随机向量,利用主成分分析,分别在两组变量中选取若干有代表性的综合变量xy ,i V ,使每一综合变量都是原变量的一个线性组合,即

1122...i i i ip p U a X a X a X a x '=+++≡

1122...i i i ip p V b Y b Y b Y b y

'=+++≡

我们只考虑方差为1的x ,y 的线性函数a x ',b y ',求使它们相关系数达到最大的这一组。若存在常向量1a ,1b ,使得

11(,)max (,)a x b y x a x b y ρρ''''=

var()var()1a x b y ''==

则称1

a x ',1

b y '是x ,y 的第一对典型相关变量。求出第一对典型相关变量之后,可以类似地去求第二对,第三对……这些典型相关变量就反映了x ,y 之间的线性相关的情况。也可以按照相关系数绝对值的大小来排列各对典型相关变量之间的先后次序,使得第一对典型相关变量相关系数的绝对值最大,第二对次之……判断各对典型相关变量相关系数的绝对值是否显著大于零,如果是,这一对综合变量就真的具有代表性;否则,这一对变量就不具有代表性,可以忽略。对于酿酒葡萄和葡萄酒的理化指标的分析,可以通过对少数典型相关变量的研究,代替原来两组之间的相关关系的研究,从而容易抓住关系的本质,尽可能给出较为深刻的分析结果。 数据处理与结果分析

首先,我们将酿酒葡萄与葡萄酒的理化指标进行简化分类。本文在进行典型相关性分析时,保留了氨基酸总量、白藜芦醇(mg/kg)、黄酮醇(mg/kg)、总糖g/L 、还原糖g/L 等蓝色一级指标。一级指标已具有代表性,在酿酒过程中起到决定性作用。剔除了各类氨基酸、果糖g/L 、葡萄糖g/L 等若干红色二级指标,并不会对典型分析结果造成太大影响;若一个指标项目下有几列测量数据,取各列数据的平均值代替该理化指标;在进行典型分析的时候,暂不考虑果皮颜色与葡萄酒色泽两个理化指标,这两个理化指标影响着葡萄酒的色调,将作为色泽物理因素单独考虑。

4.3.1.3酿酒葡萄与红葡萄酒的理化指标关系

首先,模型将对红葡萄酒与对应的酿酒葡萄的理化指标进行分析。

典型相关分析可以通过SPSS 和SAS 实现,本文使用功能强大的SAS 软件来实现理化指标的相关分析。

SAS/STAT 中的CANCORR 模块是用来实现典型相关分析的。样本程序见表:

读取数据,这里的一组变量表示酿酒红葡萄的理化指标,分别为氨基酸总量mg/100gfw (X1),蛋白质mg/100g (X2),VC 含量(mg/L)(X3),花色苷mg/100g 鲜重(X4),总酸(g/L )(X5),多酚氧化酶活力E (A/min ·g ·ml )(X6),褐变度ΔA/g*g*min*ml (X7),DPPH 自由基1/IC50(g/L )(X8),总酚(mmol/kg)(X9),单宁(mmol/kg)(X10),葡萄总黄酮(mmol/kg )(X11),白藜芦醇(mg/kg)(X12), 黄酮醇(mg/kg)( X13), 总糖g/L(X14), 还原糖g/L(X15), 可溶性固形物g/l(X16), PH 值(X17), 可滴定酸(g/l )(X18), 固酸比(X19), 干物质含量g/100g(X20), 果穗质量/g(X21), 百粒质量/g(X22), 果梗比(%)(X23), 出汁率(%)(X24), 果皮质量(g )(X25)。另外一组变量表示红葡萄酒的理化指标,分别为花色苷(mg/L)(Y1),单宁(mmol/L)(Y2),总酚(mmol/L)(Y3),酒总黄酮(mmol/L)(Y4),白藜芦醇(mg/L)(Y5),DPPH 半抑制体积(IV50)1/IV50(uL)(Y6)。

得到部分输出结果如下:

SAS系统对酿酒红葡萄、红葡萄酒理化指标的分析

Canonical Structure

Correlations Between the 'V AR’Variables and the Canonical

Variables of the 'WITH'Varicables

V1 V2 V3 V4 V5 V6

x1 0.1587 -0.3116 0.4039 0.48 -0.2373 -0.1282

x2 0.4156 0.0351 0.2671 0.2469 0.1359 -0.1344

x3 -0.0712 -0.1586 0.0334 -0.0817 -0.0188 -0.0202

x4 0.0961 0.7202 0.4846 0.2756 0.2287 0.0362

x5 0.3518 0.46 0.2765 0.0235 0.0649 -0.1412

x6 -0.0229 0.4962 0.2471 0.414 0.0494 0.0562

x7 0.1042 0.6365 0.405 -0.0584 0.2104 0.1679

x8 0.1751 0.2878 0.6443 0.2896 0.2546 -0.0529

x9 0.1281 0.2934 0.7167 0.3184 0.3087 0.0888

x10 0.1065 0.3849 0.4059 0.4704 0.2202 0.0079

x11 0.1018 0.2494 0.8052 0.0796 0.2676 0.0282

x12 0.0431 -0.0562 -0.086 0.0969 0.5711 -0.0454

x13 0.633 -0.035 0.1762 0.2109 -0.0384 -0.0271

x14 0.0113 -0.2503 0.2478 -0.023 0.3299 0.0384

x15 0.1011 -0.2087 0.4751 0.1526 0.0551 0.1409

x16 0.1405 -0.2057 0.1489 0.4724 0.5528 0.1391

x17 -0.2688 -0.2366 0.2855 0.2169 0.1738 0.1424

x18 0.0677 -0.2632 -0.0059 0.0579 -0.2751 -0.0407

x19 -0.0215 0.2199 0.1616 0.0266 0.3233 0.1325

x20 0.1643 -0.0996 0.4003 0.1908 0.0075 0.0161

x21 -0.0393 0.1235 -0.226 -0.1048 -0.2809 -0.009

x22 -0.3451 -0.0613 0.0574 -0.1099 -0.149 0.0781

x23 0.1465 0.2801 -0.0829 0.5342 -0.0244 -0.1736

x24 -0.1226 0.2135 0.342 0.1536 0.1796 0.1885

x25 0.0814 -0.0495 -0.0076 -0.0702 -0.1927 0.2127

Correlations Between the 'with' variables

and the canonical variables of the 'var' variables

W1 W2 W3 W4 W5 W6 Y1 0.2206 0.7465 0.1836 0.5743 0.1273 0.0916

Y2 0.2909 0.2014 0.6065 0.6736 0.2178 0.0047

Y3 0.2974 0.4312 0.7289 0.375 0.2174 -0.0215

Y4 0.0821 0.336 0.7152 0.3029 0.4358 0.2088

Y5 -0.2757 0.1654 -0.4074 -0.0446 0.8379 -0.0652

Y6 0.2765 0.2682 0.7929 0.3881 0.152 0.1779

Y i 变量经过计算机的成分输出结果表示原始变量间的相关关系。(1,2,3,4,5,6)

i

分析,被分为W2、W3、W4、W5四个典型相关变量,分别对应着各自的Xi典型相关

因子。下面我们就根据模型的计算结果,对各个理化指标进行定量、定性的分析。 ①葡萄酒中的花色苷(mg/L)

根据典型相关性分析的结果可知,花色苷(mg/L)(Y1)与酿酒葡萄中的VC 含量(mg/L)(X3)、花色苷mg/100g 鲜重(X4)、总酸(g/L )(X5),多酚氧化酶活力E (A/min ·g ·ml )(X6),褐变度ΔA/g*g*min*ml (X7)、可滴定酸(g/l )(X18)有较强的相关性。

14567180.74650.72020.46000.49620.63650.2632y x x x x x =+++-

根据文献]5[,葡萄组织中的酶可以破坏葡萄与葡萄酒中花色素苷,在花色苷降解过程中,涉及到的酶有糖苷酶和多酚氧化酶这两大类。维生素C 在氧化中可以产生H2O2,对2-苯基苯并吡喃阳离子的2位碳进行亲核进攻,从而产生无色的酯和香豆素等衍生物,最终产生褐色沉淀物(即褐变反应)。模型的结果与现实是高度符合的。

②葡萄酒中的总酚(mmol/L)、酒总黄酮(mmol/L)与 DPPH 半抑制体积(IV50) 1/IV50(uL)

在第二对典型相关变量中,葡萄酒中的总酚(mmol/L)(Y3),酒总黄酮(mmol/L)(Y4),DPPH 自由基1/IC50(g/L )(Y6)与酿酒葡萄中的DPPH 自由基1/IC50(g/L )(X8),总酚(mmol/kg)(X9),葡萄总黄酮(mmol/kg )(X11),还原糖g/L(X15),PH 值(X17),干物质含量g/100g(X20),出汁率(%)(X24)具有较强的相关性。

3468911172024

0.728

90.71520.79290.64430.71670.8052

0.47

510.28550.40030.3420y y y x x x x x x x ++=++++++ 输出结果直观地体现了第二对典型相关变量之间相互联系。我们通过调阅文献,并结合化学知识可知,对结果进行进一步分析:

酚类物质在一般条件下较难实现氧化还原,故本文判断:影响葡萄酒中总酚含量的主要因子为葡萄中的总酚含量,多酚氧化酶活力对酚类物质的影响并不显著。

而对于酒总黄酮,在一般情况下,酸类物质难以被还原为酮类物质,且葡萄酒发酵过程为氧化反应,故酒总黄酮大部分为葡萄中原有的黄酮类物质,当然也不排除在有还原糖的情况下酸类物质可被还原为酮类。

考虑到DPPH 自由基主要在多酚氧化酶作用下与酚类物质进行反应,在判断DPPH 半抑制体积的影响因素时,我们取DPPH 自由基、总酚作为影响因子。 ③葡萄酒中的单宁(mmol/L)

第三对典型相关变量是一组复相关系数分析。根据输出结果可以判断,葡萄酒中的单宁(mmol/L)(Y2)与氨基酸总量mg/100gfw (X1)、单宁(mmol/kg)(X10)、可溶性固形物g/l(X16)、 果梗比(%)(X23)有着显著的相关性。

211016230.67360.480.47040.47240.5342y x x x x =+++

通过调阅文献]6[我们可知,单宁是一类结构复杂的多元酚类的物质。单宁可溶于水和乙醇中, 生成胶状溶液,具有不稳定性。因此红葡萄在发酵时采用连皮带肉成为果浆时发酵, 其目的是为了获取更多的单宁和色素, 使葡萄果实的梗因含单宁星最高, 因此在果实破碎时必须除梗, 主要是果梗中的单宁粗糙且涩口, 会破坏酒质。模型的输出结果梗比(%)的影响系数达到了0.5342,为理化指标的联系提供了很好的依据。 ④葡萄酒中的白藜芦醇(mg/L)

最后,我们找出第四对典型相关变量。葡萄酒中的白藜芦醇与酿酒葡萄中白藜芦醇(mg/kg)(X12)、总糖g/L(X14)、果穗质量/g(X21)含量有关,显示如下:

51214210.83790.57110.32990.2809y x x x =+-

已有的研究表明]7[, 葡萄中白藜芦醇的生物合成途径同苯丙氨酸代谢途径密切相关。白藜芦醇原本是葡萄等植物受到逆境胁迫产生的次生代谢产物,用以抵抗逆境对自身的进一步破坏。由于植物防御体系的作用,它的出现往往伴随着植物体内多种与抗病相关的生物酶被激活。根据模型的分析结果可知,酿酒葡萄中的白藜芦醇直接影响着葡萄酒中的白藜芦醇含量。 ⑤红葡萄酒中的色泽L

色泽作为一个较特殊的物理因素,极大影响着专业品酒员对葡萄酒外观色泽地评定。为了探究色泽理化指标与酿酒葡萄部分理化指标的联系,我们首先做出初步的相关性判断,对相应的因子进行回归分析,得出相应因子的系数。

调阅文献可知,研究指出花色苷和单宁为葡萄酒色泽的最重要影响成分。红葡萄酒中的呈色物质主要是花色苷,它是决定红葡萄酒品质和感官质量的重要因素之一;褐变反应也是葡萄酒成色的一大原因;我们判断,影响葡萄酒色泽的主要因子有:花色苷、果梗比、果皮颜色、单宁、褐变度。

本文运用SPSS 软件,对色泽有关的理化指标进行分析,结果如下:

模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 1

.856a

.733

.670

12.276484

a. 预测变量: (常量), 果皮颜色L, 果梗比, 单宁,

褐变度, 花色苷。

系数a

模型 非标准化系数

标准系数

t Sig. B 标准 误差 试用版 1

(常量) 25.002 58.136 .430 .672 花色苷 -.141 .054 -.592 -2.592 .017 褐变度 .002 .011 .027 .162 .873 单宁 .620 .519 -.188 -1.194 .246 果梗比

-2.719

2.689 -.143 -1.011 .324 果皮颜色L

1.896

2.232

.124

.850

.405

a. 因变量: 色泽L

得到葡萄酒中色泽L 指数的对应函数:

7471023260.1410.020.620 2.719 1.89625.002y x x x x x =-++-++ 260.733

R =

4.3.1.4酿酒葡萄与白葡萄酒的理化指标关系

运用典型相关性分析模型,我们可以对白葡萄酒与酿酒葡萄的理化指标进行相关性分析。

通过比对数据我们发现,白葡萄酒中去除了花色苷(mg/L)这一与色泽显著相关的理化指标,且酿酒葡萄样品中,花色苷指标最大值仅为4.103mg/100g,固可以剔除这一指标的影响;其他理化指标的处理与红葡萄酒相同。

运用SAS软件,计算得到白葡萄酒与酿酒葡萄的理化指标之间的函数关系。由于计算过程与数据分析方法与4.3.1.3相同,这里就不再累述。(见附录4)综合4.3.1.3,我们得出结论:酿酒葡萄与葡萄酒的理化指标之间存在显著联系,典型相关性模型的计算结果清晰地显现了这些特征,模型为葡萄酒的酒酿过程的科学分析提供了理论依据。

4.4问题四(多元线性回归)

问题四需要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,而题目中所说“酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系”,酿酒葡萄的理化指标是葡萄酒的理化指标的主要影响因素,在一定程度上两个指标对葡萄酒质量的影响可以看作是相似甚至相等,于是本文选取葡萄酒的理化指标,对指标做出必要的处理,来求出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度。

4.4.1数据处理

就常识而言,高质量的葡萄酒中酒精(即乙醇)的含量至关重要,但是这并不表示酒精的含量越多越好。查阅资料,我们知道,花色苷,单宁,酚类均溶于乙醇,若是乙醇过多必会导致花色苷,单宁,酚类的流失,进而对葡萄酒的色,香,味均会产生重要的影响。于是,本文选取乙醇与花色苷、单宁、酚类的比值作为新的理化指标,重新建立葡萄酒的理化指标与葡萄酒的质量关系(质量为题目所给的品酒员的打分的平均分)。数据处理(见附录5):

4.4.2 预估计各因素与质量的关系(多元回归模型)

由上述已处理的数据,本文运用SPSS进行多元回归方程的分析,得出各个理化指标对葡萄酒质量的影响。

所以,各项指标x1,x2,x3,x4,x5,x6,x7,x8,x9对葡萄酒质量y 的影响可以用多元回归方程表示,如下:

7

654321101.0172.4-143.0625.0128.0-302.0-296.3-864.67x x x x x x x y +++=

98149.0031.0-x x +

4.4.3 检验上述多元回归方程的可靠性及准确性

根据上述方程,本文以白葡萄酒作为检验项,来检验方程的可靠性,有方程求出各酒样品的估计质量,并与真实质量相比较,检验准确性。数据如下:

品种编号 估计质量 实际质量

酒样品1 61.46495 77.9 酒样品2 61.1271 75.8 酒样品3 63.09089 76.79369

酒样品4 62.49077 76.9 酒样品5

55.62961

80.47476

酒样品6 58.33684 76.45336

酒样品7 73.50289 74.2

酒样品8 55.61421 72.3

酒样品9 40.03959 81.43086

酒样品10 64.43649 79.8

酒样品11 56.07975 72.33714

酒样品12 67.45737 73.5834

酒样品13 68.03441 73.9

酒样品14 35.2816 76.70153

酒样品15 65.07884 79.13515

酒样品16 80.51172 67.3

酒样品17 59.47715 79.05975

酒样品18 69.7457 76.7

酒样品19 61.99874 76.91034

酒样品20 59.43173 75.89258

酒样品21 54.64679 80.0025

酒样品22 59.67705 78.66788

酒样品23 55.58604 77.4

酒样品24 70.93877 76.1

酒样品25 60.90798 80.53199

酒样品26 59.72695 76.32879

酒样品27 71.59076 76.40372

酒样品28 57.42696 79.6

图表三:白葡萄酒的估计质量与实际质量

由上表可知,估计质量与实际质量有着相同的趋势,基本符合一定的规律,说明该回归方程具有一定的准确性。

然后,以估计质量作为自变量,实际质量作为因变量,建立二者关系,并通过一系

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx 葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

数学建模 葡萄酒评价模型

A题葡萄酒的评价 摘要 随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。 针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。 针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据,我们有用最小二乘法进行。 针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题: 1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析 两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以一方面,我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布;然后利用SPSS软件对两组评酒员的评价结果进行方差分析,计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。;最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价,其评价结果通常较为均匀,因此,另一方面,我们应记录和讨论表中出现的异常数据,客观评价其出现的原因。综合以上,得出结论。 2.2 对问题二的分析 首先,我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级; 然后,对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析,将葡萄分成

葡萄酒质量的评价1

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括、电子、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A (隐去论文作者相关信息) 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒质量的评价 摘要 葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。 首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01 -数据分析,发现对于红葡酒有70.3%的评价结果存在显著性差异,对于白葡萄酒只有53%的评价结果存在显著性差异。通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。为了评价两组结果的可信度,借助Alpha模型用克伦巴赫α系数衡量,并结合F检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。综合来看,主观因素对葡萄酒质量的评价具有不确定性。 结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚类分析法,利用SPSS软件对葡萄酒样进行分类,根据分类的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。 为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映出两者间的联系,取与葡萄各成分相关性显著的葡萄酒理化指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。 由于已经通过回归分析建立了酿酒葡萄和葡萄酒理化指标之间的关系,因此从酿酒葡萄成分对葡萄酒的理化指标的影响,再研究出葡萄酒理化指标与葡萄酒质量的联系,便可作为一个桥梁,反映出葡萄与葡萄酒理化指标对葡萄酒的质量的作用。研究葡萄酒理化指标与葡萄酒质量的联系,需要运用变量间的相关性及Pearson系数法分析葡萄酒的理化指标与葡萄酒质量评价指标的相关性,通过比较选出与葡萄酒评价的一级指标相关性程度大的葡萄酒成分,进行回归分析法,建立酿酒葡萄的理化指标与葡萄酒质量之间的拟合方程,结合各个质量一级指标的权重,从而完成了从葡萄酒成分对葡萄酒质量的客观评价。综合计算结果,与酿酒葡萄分级的结果吻合,所以分析结果较客观。

数学建模--葡萄酒的分级(正式版)

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子 邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关 的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其 他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式 在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违 反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西安理工大学 参赛队员 (打印并签名) :1. 郑晓东 2. 罗璐 3. 宫维静 指导教师或指导教师组负责人 (打印并签名): 日期: 2013 年 05月 10 日

葡萄酒质量的综合评价分析 摘要 近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。 对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。 对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。 对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。

(精编)葡萄酒质量的评价

(精编)葡萄酒质量的评 价

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A (隐去论文作者相关信息) 日期:2012 年9 月10 日 赛区评阅编号(由赛区组委会评阅前进行编号): 2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 赛区评阅记录(可供赛区评阅时使用): 评

阅 人 ,,,,,,,,,, 评 分 ,,,,,,,,,, 备 注 ,,,,,,,,,, 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒质量的评价 摘要 葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。 首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合数据分析,发现对于红葡酒有的评价结果存在显著性差异,对于白葡萄酒只有53%的评价结果存在显著性差异。通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。为了评价两组结果的可信度,借助Alpha模型用克伦巴赫系数衡量,并结合检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。综合来看,主观因素对葡萄酒质量的评价具有不确定性。 结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚类分析法,利用SPSS软件对葡萄酒样进行分类,根据分类的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。 为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映

葡萄酒评价指标

葡萄酒评价指标 区分好坏葡萄酒没有具体的绝对的量化标准,目前权威的葡萄酒评分系统主要是美国著名的葡萄酒评论家罗伯特·帕克,帕克推崇的是葡萄酒100分制评分体系;以及大家俗称的3W1D也是世界葡萄酒评分系统中的权威。 帕克的100分制给葡萄酒的打分范围是50-100,基于以下四个因素:外观,香气,风味,总体质量或潜力。帕克将葡萄酒分成四个档次(从50-100分),具体的打分体系如下: 96-100 Extraordinary 经典:顶级葡萄酒。 90-95 Outstanding 优秀:具有高级品味特征和口感的葡萄酒。 80-89 Above average 优良:口感纯正、制作优良的葡萄酒。 70-79 Average 一般:略有瑕疵,但口感无尚大碍的葡萄酒。 60-69 Below average 低于一般:不值得推荐 50-59 Unacceptable 次品 一般帕克的评分系统会给每一款酒一个基础的分数(50分)。在50分的基础上,按酒的质量特点加分。 酒的颜色和外观值5分,好的葡萄酒的外观应该澄亮透明(深颜色的酒可以不透明),有光泽,其颜色与酒的名称相符,色泽自然、悦目。 然后,酒香值15分,取决于香气的浓度、复杂度和纯粹感,香气应该是葡萄的果香(比如赤霞珠的黑醋栗香气、黑比诺的樱桃香气、霞多丽的热带水果香气)、发酵的酒香、陈酿的醇香(橡木桶陈酿及瓶内陈酿组成的香气,主要包括花香、果香、辛香料香、动物香、矿物香、动物香、焙烤香等香气类型),这些香气应该平衡、协调、融为一体,香气幽雅,令人愉快; 酒的口感和后味值20分,好的葡萄酒其口感应该是舒畅愉悦的,各种香味应细腻、柔和,酒体丰满完整,有层次感和结构感,果味、单宁、酒精、酸度、甘油、糖分均衡,余味绵长;最后,酒的总体质量水平或者演化进步的潜力,也就是说陈化的潜力,值10分。 3W指WA、WS、WE WA是《葡萄酒倡导家》杂志Wine Advocate journal 即罗伯特·帕克的评分 WS是《葡萄酒观察家》Wine Spectator magazine杂志,该杂志同样为美国最具影响力的杂志之一,同样倡导百分制,基本思路与帕克类似,但《葡萄酒观察家》拥有众多的优秀评酒师,通过蒙瓶试酒,多方面综合结果,所以评分相对较中立。 分数解释 96-100 经典的,绝佳的

基于数据挖掘技术的葡萄酒评价体系研究

Advances in Applied Mathematics 应用数学进展, 2015, 4(4), 376-384 Published Online November 2015 in Hans. https://www.doczj.com/doc/583045653.html,/journal/aam https://www.doczj.com/doc/583045653.html,/10.12677/aam.2015.44047 The Study on Evaluation System of Wine Based on Data Mining Sizhe Wang1, Zhigang Wang2*, Yong He2 1Automation Professional Class 1301, School of Information Science and Engineering, Central South University, Changsha Hunan 2College of Information Science and Technology, Hainan University, Haikou Hainan Received: Nov. 8th, 2015; accepted: Nov. 23rd, 2015; published: Nov. 30th, 2015 Copyright ? 2015 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.doczj.com/doc/583045653.html,/licenses/by/4.0/ Abstract Based on Question A of Mathematical Contest in Modeling for college students in 2012, the empha-sis in this paper is mainly on the establishment of evaluation system of wine based on data mining technology. The wine quality is determined by the score of the wine tasting. We analyze the credi-bility of the liquor score by one-way ANOVA. We classify the wine grape by extracting common factors of some physical and chemical indicators from the wine grape, and by clustering the factor score and wine score. The stepwise regression model is established through the correlation be-tween the physical and chemical indicators and the physical and chemical indicators of wine grapes. By the regression model between the aroma substances and the score of the wine, the key physical and chemical indicators of wine quality will be found. In the end, some shortcomings of current rating system of wine will be pointed out. Keywords Evaluation System of the Wine, Data Mining Technology, One-Way ANOVA, Cluster Analysis, Regression Analysis 基于数据挖掘技术的葡萄酒评价体系研究 王思哲1,王志刚2*,何勇2 1中南大学信息科学与工程学院自动化专业1301班,湖南长沙 2海南大学信息科学技术学院,海南海口 *通讯作者。

数学建模A葡萄酒的评价完整版

数学建模A葡萄酒的评 价 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、 网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开 的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处 和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛 规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开 展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。葡萄酒的质量与 酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄 酒和酿酒葡萄的质量。 对于问题1,我们采用方差分析的方法建模解决。基本思路是:对两组评酒员的评 价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两 组评酒员的评价结果无显着性差异,通过比较两组评酒员评价结果的方差值,得出第 二组的结果更可信。 对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分 级。基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指 标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄 酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要 依据。此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因 某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。最 终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。 对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对 比,经相关性检验得到他们具有显着的线性相关性,进而用线性回归的方法得出回归 方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。 对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。 文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应 用和推广。 关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验 1.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。

葡萄酒质量的综合评价分析模型

葡萄酒质量的综合评价分析模型 专家点评: 本文问题一方法合理,结论正确。问题二对葡萄理化指标进行聚类,然后根据葡萄酒质量进行分级,思路简明正确。问题三进行多元线性回归,尚可,但如果能进行相关性分析会更好。问题四用逐步回归的方法,适当,加入芳香类物质,使结论更加合理。如果问题二和问题三也能将附件三考虑入内会使结论更加有力。 【摘要】 近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增,特别是随着食品科学技术的发展,人们不再满足传统感官评价葡萄酒的水平,如何运用数据资料定量研究葡萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。本文主要研究了葡萄酒的品质与葡萄酒自身以及酿酒葡萄的理化指标的关系,给出了基于葡萄酒自身的理化指标以及酿酒葡萄的理化指标与芳香物质的定量综合评价模型。 首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,得到了两组评酒员的评分存在显著差异的结论,并通过对两组数据进行方差分析,以判别结果具有的稳定性作为标准,得到第二组比较可靠。 接下来我们结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 更进一步,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。 最后我们将提取葡萄及葡萄酒的理化指标与芳香物质中的主成分,利用逐步回归的方法考察理化指标与芳香物质对葡萄酒质量的影响程度,通过对芳香物质对葡萄酒质量影响比重得到芳香物质对葡萄酒的质量有30%以上的影响比重(白葡萄的芳香物质对白葡萄酒的质量影响相对更大),故而不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。 关键词:假设检验聚类分析主成分分析逐步回归

有关葡萄酒评价的数学建模论文

葡萄酒的评价 摘要 本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。 关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得 P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。然后将第一组10位() 评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。 关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。 关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。 关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。 关键词:葡萄酒质量的评价EXCEL MATLAB 、主成分分析相关系数T-检验

1.问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2.问题分析 问题一要分析两组评酒员的评价结果有无显著性差异并判断哪一组结果更可信。由于题目中有数据缺失和错误数据,我们采用曲线拟合处理这一问题。因为所给数据是小样本,总体标准差 未知的正态分布资料,因此采用T检验,根据所求得的P值判断两个平均数的差异是否显著。然后将第一组10位评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,方差大的一组则说明其打分较为严格,即说明他们对待评酒较为认真,从而认为其较为可信。 问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。考虑到不清楚葡萄酒的理化指标与葡萄酒的质量之间的关系,所以分为两种情况进行分组分析。首先根据酿酒葡萄的理化指标,采用主成分分析法给酿酒葡萄综合评分并排序,根据综合评分的排序结果对酿酒葡萄样品分级;然后将问题一所得出的较为可信的一组酒样品的评分作为葡萄酒的质量并以此分级,此即为各葡萄酒样品对应的酿酒葡萄样品的另一种分级情况。 问题三要求分析酿酒葡萄与葡萄酒理化指标之间的联系,即要求得出它们各项理化指标之间联系的紧密程度,所以采用回归分析的方法计算它们的各理化指标的相关系数,然后以相关系数的绝对值大小表示它们之间联系的紧密程度。 问题四要求探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并判断用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。考虑到问题三已经得出酿酒葡萄和葡萄酒理化指标之间的联系,且葡萄酒的理化指标相对较少,因此选择分析葡萄酒的理化指标对葡萄酒质量的影响。可以通过前面的结果,得出葡萄酒的理化指标对葡萄酒产生影响的几个主要因素,再依据这几个因素结合葡萄酒质量排序,便可以得出这几个因素对葡萄酒质量的影响。第二小问将附表3中的芳香物质考虑进来,判断其对葡萄酒质量是否有影响,从而论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

葡萄酒评语

葡萄酒评语 篇一:葡萄酒评价 葡萄酒的评价 摘要 对于解决葡萄酒的评价问题及其之间的联系,需要运用到统计学中不同的分析方法,同时建立模型,再利用相应的软件进行求解。 针对问题一,通过分析十位评酒员对不同葡萄酒的打分进行统计整理,得到每位评酒员对所有酒样品的总得分,利用个spss软件,通过对总得分进行T检验分析得到均值,标准差,误差等相应的数据,可以得出两组评酒员的评价结果存在的差异性,根据数值比较可知,第二组评酒员评价结果之间的浮动较小,因此确定第二组的评价结果比较可信。 针对问题二,采用主成分分析和聚类分析对酿酒葡萄进行分级,首先通过spss软件对酿酒葡萄的理化指标进行主成分分析,对主成分累计贡献率进行归一化分析得出其权重和酿酒葡萄中的主要物质的相关系数矩阵。再通过相关数据利用maTLaB得出聚类图。因为酿酒葡萄的组数较多,可将其分为4类,以便聚类图能清晰表明酿酒葡萄的等级。 针对问题三,运用spss软件及问题二的模型对酿酒葡萄和葡萄酒理化指标分析,从红葡萄和红葡萄就中提取9中主要物质(见表三1),

白葡萄与白葡萄酒中提取8中主要物质(见表四1)。再对酿酒葡萄和葡萄酒理化指标进行通过典型相关分析。更加准确的反应出酿酒葡萄与葡萄酒理化指标之间联系。 针对问题四,建立多元线性回归模型分析葡萄和葡萄酒的理化指标及芳香物质对葡萄酒的影响,利用spss软件得出图四和图六,由图中数值分析得出拟合线性回归的残差浮动区间为[-1,1],因此葡萄酒的质量可以由酿酒葡萄和葡萄酒的理化指标以及芳香物质共同反应。 关键字:T检验、主成分分析、聚类分析、典型相关分析、多元线性回归分析 一问题重述 1.1问题背景与条件 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。 1.2预解决的问题 1、问题一分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结信? 2、问题二根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3、问题三分析酿酒葡萄与葡萄酒的理化指标

数学建模葡萄酒的评价

葡萄酒的评价 摘要 葡萄拥有很高的营养价值,本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析,对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。 针对问题一,我们首先分别计算每类葡萄酒样品在两组组评酒师评价下的综合得分,以此作为每组评酒师的最终评价结果。再运用统计学中的T 检验进行假设与检验,得出两组评价结果具有显著性差异。最后通过计算各组评价员的评价结果的标准差,以此推算稳定性指标值P ,P 值较大的可信度较高,得出2p p <红1红与2P P <白1白,进而得出第二组的评价结果更加可信。 针对问题二,我们分别对两组葡萄进行分类。在这里我们采用聚类分析法和主成分分析法,在matlab 中实现对酿酒葡萄的分类。 针对问题三,根据σ μ -= x Z 对附件2中的数据进行标准化处理,排除单位不同的影响。以酿 酒葡萄的30个一级理化指标作为自变量X ,葡萄酒9个一级的理化指标作为因变量y,建立多元线性回归模型εβ+=X y ,得出酿酒葡萄的理化指标与葡萄酒的理化指标之间的联系即回归系数矩阵 β。 针对问题四,用灰色关联度分析对两者的关系进行度量,求得理化指标对样品酒的的关联系数。然后根据葡萄酒综合得分及指标的相关系数得出样品酒的综合指标,通过MATLAB 软件对综合指标与第二问中葡萄酒的分数进行指数拟合,拟合效果不佳,因此不能定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只能根据图像大致猜测综合指标与葡萄酒的质量负相关。 关键词:T 检验 聚类分析法 主成分分析法 Z 分数 多元线性回归 一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理

葡萄酒的评价

葡萄酒的评价 摘要 经济快速发展的今天,葡萄酒越来越为众多人喜欢。而如何评价葡萄酒的品质更成为一个很重要的问题。我们根据题目中所提供的表格数据建立葡萄酒评价体系的模型,一边是生产葡萄酒和销售葡萄酒的相关企业获得最大利益。对于消费者来说,也可以更了解葡萄酒的哪些指标对葡萄酒影响较大,以便更好的消费。 模型1,我们认为品酒员的评价是客观的,对于哪组评价更可信,我们运用方差分析的方法,方差越小可信度越高。于是我们对每种葡萄酒样品的十名品酒员整体评价做方差,并把求出的方差做折线图,由此更直观的得出第二组红葡萄酒评酒员的评价结果方差年华更稳定。 模型2,我们从葡萄酒的质量出发,用葡萄酒的质量来衡量酿酒葡萄的好坏,对外观,香气,口感建立加权平均值的模型,通过分析加权平均值的大小,将样品酒分为四个等级,为优秀,良好,中等,差四种。 模型3,我们认为酿酒葡萄和葡萄酒的一级指标最能反映问题,所以我们选取花色苷,单宁与总酚这三种成分,对数据取平均值,并用MATLAB对数据进拟合,通过图像,我们得出酿酒葡萄和葡萄酒的理化指标之间呈线性关系。 模型4,对于问题四,由于酿酒红葡萄和红葡萄酒之间呈线性关系,我们选择酿酒红葡萄的总酚数据作参考指标,把品酒员对葡萄酒的评论作为标准,得出葡萄和葡萄酒的理化指标能用了评价葡萄酒的质量,并呈一次相关。 最后我们通过对葡萄酒和葡萄以及他们的理化指标之间的关联做出研究,得出结论,葡萄酒和酿酒葡萄之间线性相关,从而证明了我们模型的实用性。 关键词:方差分析,加权平均值,MATLAB,拟合

一、问题重述 如今随着人们生活水平的不断提高,人们对于生活品质的追求也有所提高。葡萄酒业成为人们追求的消费品之一,因此对葡萄酒品质的评价就显得越来越重要了。对企业来说,建立起葡萄酒的评价体系很重要,它能在更好的生产葡萄酒的同时,更好的了解消费者的心理,帮助企业获得更大的利益。 而品酒员对葡萄酒品尝后对其分类指标打分,求和得到总酚,从而确定葡萄酒的质量。酿酒葡萄的好坏与葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄的理化指标在一定程度上反映葡萄酒和葡萄的质量。本文所建立的模型,需要解决以下几个问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更 可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 二.问题分析 从题目中可以发现酿酒葡萄和葡萄酒之间有一定的影响。问题一中,要求分析品酒员的可信度,我们发现是个评酒员对同一种酒的评价存在一定的差异,而且外观,香气,口感分析都对葡萄酒的整体,各占一定的比重,我们便利用方差分析法。问题二中,我们认为葡萄酒的好坏可以侧面反映酿酒葡萄的好坏,因此通过整体评价的加权平均值的方法,将葡萄酒分为四个等级。问题三中,我们想到酿酒葡萄和葡萄酒的理化指标之间满足某种关系,因此我们用曲线拟合的方法是问题简化,解决问题。 三、模型假设 为了建立更合理、更准确的数学模型,需考虑很多方面,排除不必要的干扰因素,我们提出以下几种假设: 1)品酒员品尝各种样品葡萄酒时所处状态一样

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

葡萄酒质量评价模型

葡萄酒质量评价模型 摘要 葡萄酒质量的高低评估是通过评酒专家对葡萄酒的感官评分来体现。酿酒葡萄和葡萄酒的理化指标一定程度上反映了葡萄酒的质量。 问题一,首先对附件1的数据进行预处理,分别求得评酒员关于样品酒的4组平均得分,在此基础上,利用F检验,发现不管对于红葡萄酒还是白葡萄酒,两组评酒专家的评分结果都存在显著的差异。此外,建立了评价可信度的层次分析模型,发现第二组评酒员的评分更加可信。 问题二,运用主成分分析对酿酒葡萄的30个理化指标进行降维,主成分降维后减少了变量间的重叠部分,然后通过Q型聚类对酿酒葡萄酒的样品进行归类,利用问题一中第二组评分数据,得到每一类样品的平均得分,通过得分的大小来分等级。 问题三,建立了酿酒葡萄与葡萄酒理化指标的典型相关分析模型,得出酿酒葡萄与葡萄酒理化指标之间有着密切的联系。如:红葡萄与红葡萄酒的理化指标 的第一典型相关系数(1) 1=0.99 r,第一典型变量)1( 1 u可以解释29.9%红葡萄理化指标组内变差,并解释39%红葡萄酒理化指标的变差;其两者的相关系数相互解释每组内的变差。 问题四,对于酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,本文先通过线性回归做初步的分析,然后运用TOPSIS模型进行了进一步的分析,得到葡萄和葡萄酒的理化指标不一定能评价葡萄酒的质量,但有一定的联系。

关键词:F检验;主成分分析;Q型聚类;样品典型相关分析;TOPSIS模型 1、问题提出 葡萄酒是用新鲜的葡萄或者葡萄汁经发酵酿成的酒精饮料。质量评价主要通过外观、香气、口味、典型性体现。所以确定葡萄酒的质量一般通过聘请一批有资深的评酒员对葡萄酒进行品尝后对其分类指标打分,然后求和得到总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄

相关主题
文本预览
相关文档 最新文档