葡萄酒及酿酒葡萄理化指标及质量关系分析A题
- 格式:doc
- 大小:516.50 KB
- 文档页数:28
酿酒葡萄与葡萄酒理化指标的联系分析
葡萄是酿酒葡萄酒的主要原料之一,理化指标是表征葡萄酒质量的重要标志,葡萄与葡萄酒的理化指标之间存在着千丝万缕的联系,直接反映着葡萄酒质量特征。
先看理化指标。
葡萄酒中的理化指标主要有比重、pH值、酸度、酒精度等。
比重主要测定了酒体的香气,pH值表明了酒的酸性强弱,酸度是测量酒中酸的量度,酒精度是表征酒体成分的重要指标。
葡萄的理化指标主要包括葡萄糖含量、酸含量、总有机物等。
葡萄糖含量是指葡萄中可消化食品糖的含量,反映着葡萄对酒质量影响的重要因素,酸含量可以直接反映酒的酸性,总有机物表明了葡萄中素材的浓缩程度,从而决定了酒的美味度。
葡萄与葡萄酒理化指标之间存在着千丝万缕的联系,这种联系可用数学方法去表示。
葡萄带给酒的气味、口感和质地是由理化指标决定的,是理化指标的加总结果,理化指标的变化将直接影响酒的口感和质地。
综上所述,葡萄与葡萄酒理化指标之间有着千丝万缕的联系,葡萄的理化指标从某种程度上影响了酒体的香气、pH值、酸度、酒精度等,而这些又决定了酒的美味度。
只有通过准确计算和分析,我们才能更好地把握葡萄酒质量特征,从而更好地为葡萄酒消费者提供高质量的产品。
数据说:葡萄指标数据对葡萄酒的影响一、问题设立:(改编自CUMCM 2012 A题)如我们所知,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
以上只是我们的定性分析,严重缺少定量分析验证。
现在请你根据酿酒葡萄的各项理化指标数据和葡萄酒的指标数据进行分析,通过具体的数据建立数学模型解决下列问题:1. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
2. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
3.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?附件1和附件2分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
附件1:葡萄和葡萄酒的理化指标(含2个表格)附件2:葡萄和葡萄酒的芳香物质(含4个表格)二、问题解答数据说:葡萄指标数据对葡萄酒的影响摘要本文针对对葡萄酒的评价问题,运用了聚类分析法、偏最小二乘回归分析法等方法建立数学模型,综合分析了酿酒葡萄的理化指标、葡萄酒的理化指标与葡萄酒质量三者之间的联系。
针对问题一,对酿酒葡萄进行分级,先对不同量纲的数据进行标准化处理,运用相关性分析法分别计算两种葡萄的各种理化指标和葡萄酒质量的相关性系数,从而筛选出相关性系数较大的指标作为酿酒葡萄的分类指标;运用聚类分析法对酿酒葡萄进行聚类分析,将红葡萄和白葡萄都分成了四类,根据葡萄酒的分级标准,从而得到分级结果(见表6)。
针对问题二,分析酿酒葡萄与葡萄酒的理化指标之间的联系,先对不同量纲的数据进行标准化处理,运用相关性分析法筛选出与葡萄酒质量相关性较大的酿酒葡萄指标和葡萄酒指标。
此问题是研究两组多重相关变量间的关系问题,故运用偏最小二乘回归分析法得到酿酒葡萄与葡萄酒理化指标的回归方程式,从而分析出两者理化指标之间的联系。
针对问题三,分析酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,建立了葡萄酒质量的评价模型:分别对酿酒葡萄理化指标、葡萄酒指标与葡萄酒质量运用偏最小二乘回归分析法,分别得到相应回归方程式;从而得出结论。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要随着人们生活水平的提高,越来越多的人热衷于葡萄酒,所以对葡萄酒的质量做出客观的评价非常重要。
本文就从以下的四个方面探讨葡萄酒的质量问题。
针对问题一,首先利用求平均数的方法得出每一酒样品的综合评价,建立综合评价模型:1010k 11110ij i j H a ===∑∑1010ij i 1j 11b 10K B ===∑∑接着使用综合评价数据通过相关样本检验中的Wilcoxon 符号秩检验法和边际齐性检验法都得到两组品酒员的评分有显著性差异,比较综合评价数据方差的大小得到第二组品酒员的品分比较可信。
本文还使用了通过分析每组品酒员对每个酒样品打分的方差波动情况,得到两个对比的方差波动图,依然可以得到两组品酒员的评分有显著性差异,第二组评酒员的评分更可信。
针对问题二,根据第二组评酒员对酒样品的评分,从而对第二组酒样品进行聚类分析得到葡萄酒的6个分类,相应地把葡萄分成6类。
对葡萄的理化指标进行聚类分析得到口感等四个因子。
题目葡萄酒的评价--第三次模拟训练建模组号:30 组组员及分工:张娜(11数学系)建模雒蒙(12物理系)编程刘芯(11物理系)论文摘要本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。
对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。
对于本题,我们主要采用SPSS软件对模型进行求解。
问题一运用EXCLE单因素方差分析两组评酒员的评分结果,分别求出均值和方差,通过F检验,得出两组评酒员对红葡萄酒的评价有明显差异,对白葡萄酒的评价无明显差异;引入克伦巴赫alpha系数,通过SPSS软件得到克伦巴赫系数,从而确定出第二组评分结果的可信度更高。
问题二用系统聚类分析法对数据进行处理,通过SPSS软件,找出酿酒葡萄的一级指标相似程度的统计量,再以这些统计量作为划分依据,将所有品种初步分为四个等级,再进一步根据二级指标将每一级别分为甲,乙,丙,丁。
问题三采用统计学分析方法中的主成分分析法,用SPSS软件分别筛选出酿酒葡萄与葡萄酒的理化指标中重要的几个理化指标,再对选出的两组重要理化指标建立线性回归方程,在SPSS中求出两者相关系数矩阵,得出酿酒葡萄与葡萄酒的理化指标之间的联系。
问题四利用因子分析法,分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响因素,芳香物质求和作为芳香指标进行因子分析,比较前后两者结果来确定芳香指数也是评价葡萄酒的质量的重要指标,最后还需要结合感官指标来评价葡萄酒质量。
关键词:单因素方差分析F检验alpha系数SPSS软件系统聚类分析法主成分分析法(一)问题重述在给出某一年份一些葡萄酒品尝评分表、葡萄和葡萄酒的理化指标的两个表格以及葡萄和葡萄酒的芳香物质的四个表格后,为了简化问题,我们对表中数据的各项指标进行计算,得出其对应的均值与标准差,适当的进行数据筛选,提取出相应的指标进行分析,建立数学模型。
现在我们需要解决以下四个问题:1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响葡萄酒香气极为复杂,几百种芳香物质参与了香气的构成。
本文综述了葡萄酒香气的来源及其成份,并对葡萄酒中香味物质的测定方法作了说明。
葡萄酒的呈香物质极多,目前已鉴定出的有300余种,通过协同作用、累加作用、相互抑制作用,使葡萄酒香气复杂多样,千变万化。
要正确描述、分析葡萄酒香气,就必须对它们进行分类,了解它们的来源与成份。
1. 葡萄酒香气的来源葡萄酒香气主要有三个来源,即来源葡萄品种本身的香气,来源于发酵过程中形成的酒香以及陈酿香气。
1.1 一类香气一类香气又叫葡萄酒的品种香气,这类香气在气味上以花香、果香、植物以及矿物质为主。
因为其呈味物质来源于浆果,所以葡萄品种以及影响葡萄品种表现,决定葡萄品种质量的气候、土壤、栽培技术等因素是决定该类香气质量的自然因素。
众多的葡萄品种在不同的气候、土壤类型中的表现,结果产生了繁杂的一类香气,当然有讨人喜欢的,也有遭人厌的。
只有努力地使所选用的葡萄品种的适应性,特异性与栽培地的生态条件及生产目标相一致,才能表现出该葡萄品种的最佳香气状态。
根据一类香气的类型可以将葡萄品种分为如下三类:1. 所酿的酒,一类香气非常浓郁、复杂、以果香为主,且在酒的陈熟过程中更能充分地表现出来。
如缩味浓、赤霞珠、品丽珠、梅尔诺、赛美容、维尔多等。
2. 所酿的酒以果香、花香等气味为主的葡萄品种,主要有比诺、白山坡、霞多丽、佳美以及雷司令、西万尼、琼瑶浆等。
3. 所酿的酒以动物气味为主,主要是麝香味的葡萄品种,如玫瑰香、亚利山大等。
构成一类香气的呈香物质有结合态和游离态两种状态。
结合态的呈香物质只有分解放出的游离态的才能表现出来。
所以葡萄酒的酿造过程,一方面浸提出了果皮中的芳香物质;另一方面发酵促成了一类香气的充分表现,如葡萄酒中的某些酶,人的唾液,胃液能使结合的呈香物质释放出游离态的芳香物质。
这也从某种程度上说明了葡萄酒的质量原先存在于葡萄之中,酿造过程只是让其表现出来而已。
数学建模葡萄酒评价思路及相关资料链接A题葡萄酒的评价确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据请尝试建立数学模型讨论下列问题:1 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级3 分析酿酒葡萄与葡萄酒的理化指标之间的联系4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?解题思路1、众所周知对于同一事物的评价如果大家的意见越一致那么评价的可信度就越高所以对于问题1的解题思路也就清晰明了了我们可以通过离散度所谓离散程度即观测变量各个取值之间的差异程度它是用以衡量风险大小的指标这一概念来对每一组评酒员作出的评估作出风险分析显而易见的是若风险评估的值越高这组评酒员的评价就存在问题了若风险评估值大小相当这说明这两组评酒员是没有明显差异的 2、题目中要求对葡萄作出评级看起来似乎没有思路那么我们可以动一下我们的小脑筋既然对于评级我们没有参考标准那么我们可以参考评酒员的评价即使用逆向思维从评酒员的评分发出那么大体上葡萄的分级基本上就能确定下来根据确定先来的葡萄分级进行逆推就可以得出结论3、对于这个问题最直观也是最基本的思路就是看两者之间的趋势作出两者的趋势图通过对趋势图的直接观察两者之间的大体关系即可确定然后根据曲线拟合的方法可得出两者间的函数关系4、对于问题4的这中学术中称之为白痴型问题大家肯定一眼就能得出结论那就是肯定能用理化指标来评价葡萄酒的质量但这里有个前提就是先分析葡萄和葡萄酒理化指标之间的关系显然这是解题的关键对于这种大量数据的问题只要通过计算机实现基本上不要考虑认为分析因为在浪费大量时间的前提下基本上不会得出结论言归正传谈一下解题的关键点或者是捷径可以通过附件一种的数据来作出评价至于具体的方法因为只是初步的讲解还未作出具体判断估计会在后续的评论中作出判断谢谢大家祝大家考出理想成绩我收集的数模资料链接:。
2012高教社杯全国大学生数学建模竞赛A题评阅要点[说明]本要点仅供参考,各赛区评阅组应根据对题目的理解及学生的解答,自主地进行评阅。
本题目希望学生利用数学模型和附件1-3中的数据对评酒员的品评结果给出分析,对酿酒葡萄的质量给出评价,并探讨葡萄和葡萄酒的理化指标与酒的质量的关系。
问题1. 附件1中给出的是评酒员对27种红葡萄酒和28种白葡萄酒的两组品评结果。
这两组评酒员各不相同,两组中的每个酒样都取自相同葡萄酒厂家的同一批次的产品。
要求学生给出判断这两组评价结果好坏的原理、模型和方法,给出具体的结果,并对结果进行说明。
好的品评结果应该是对同一酒样评价时这些评酒员之间的差距小、且这些酒样之间的区分度明确(注:一些学生的模型和方法仅考虑评酒员的打分差距)。
参考:红酒中样品23是好酒,样品12是较差的酒。
问题 2. 给出根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级的原则、模型、算法和结果。
确定酿酒葡萄质量好坏的主要依据是问题1中评酒员对酒的质量的评价结果,根据这个评价结果和酿酒葡萄的各种理化指标给出确定葡萄质量的模型,由此给出这些酿酒葡萄的分级结果。
参考:分级结果中好的红葡萄应包含样品23,差的应该包含样品12。
问题 3. 给出分析酿酒葡萄与葡萄酒的成分之间关系的原理、模型和方法,得到葡萄酒的理化指标是否与葡萄的理化指标相关的结论,相关时给出具体的依赖关系。
求解时最好先对葡萄的理化指标(包括芳香物质)进行分类和筛选,然后进行评价。
注:仅把葡萄的全部理化指标进行简单回归不够完整。
问题4. 建立模型分析酿酒葡萄和葡萄酒的理化指标与葡萄酒质量之间的关系,在模型的基础上给出具体结论,并对结论给出详细的分析说明。
注:评价葡萄酒质量时不一定需要包含所有的理化指标,但根据经验知道花色苷、总酚和单宁是红葡萄酒的重要指标。
附注:学生答卷中应该说明对缺失数据和异常数据的处理方式。
2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):A题我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):北京邮电大学世纪学院参赛队员(打印并签名) : 1. 彭旋2. 储润杰3. 金春阳指导教师或指导教师组负责人(打印并签名):日期: 2012 年 9 月 9 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒质量的评价摘要本文对于评酒员给出的数据和葡萄的量化指标分析,建立了对葡萄酒质量评价离散模型。
针对问题一,首先将有效数据进行求平均值和方差,排除了一些有问题的数据。
再用matlab将评酒员进行品尝后打分结果进行综合分析,然后用AHP法将其简化,得出了两组品酒员的评价结果差异,第二组更可信,进而得出了结论。
针对问题二,我们采用AHP法和K-均值聚类法对这些酿酒葡萄进行分级。
先在酿酒葡萄的理化指标和葡萄酒的质量中选择几个重要的指标,再构建判断矩阵,从而对各指标所属各矩阵进行归一化,确定各指标的权重,计算出每种酿酒葡萄的综合得分,然后用K-均值聚类方法将各种酿酒葡萄的综合得分划分等级。
葡萄酒的评价模型摘要本文主要解决葡萄酒的评价问题,运用多种数理统计方法通过MATLAB和SPSS软件对可能影响葡萄酒质量的因素进行统计分析,初步得出对葡萄酒的理化指标评价和主观评价具有差异性。
对于问题一中的显着性差异分析,针对两组评酒员对于每一种酒的评分,本文用α=),结果显示两组评酒员对红葡萄酒和白葡萄酒的评分MATLAB进行t检验(0.05都具有显着性差异。
对于可信度的问题,我们用EXCEL进行方差与置信区间的综合分析,得出对红、白葡萄酒的评价结果第二组可信度均较高。
问题二,首先用相关性分析计算出各个理化指标之间以及各理化指标与葡萄酒质量间的Pearson相关系数r,然后选取和葡萄酒质量相关程度较大(0.2r>)的理化指标进行聚类分析,依照指标的不同情况可将其分别分为3、4、5类,得出在每种分类情况下的分类方案。
最后,我们计算每种分类方案下各类酿酒葡萄质量得分的平均值,分值越高则级别越高,确定了最终的分级方案。
问题三,我们先对酿酒葡萄的理化指标进行主成分分析,利用降维技术找出能代表酿酒葡萄的主要理化指标,然后再将得出的主要理化指标与葡萄酒的理化指标进行相关性分析,根据相关系数确定二者理化指标间的关系。
结果表明,葡萄酒的理化指标除了由相对应的酿酒葡萄的理化指标决定外,还可由其它相关性大的理化指标决定。
最后,对问题四建立多元线性回归分析模型,对第一问中计算出了红、白葡萄酒和葡萄的样本相关系数进行比较,发现用葡萄的理化指标衡量葡萄酒的质量是不全面的,芳香物质可能会影响酒的香气从而影响酒的整体质量。
因此在第二小问中,先根据葡萄酒中芳香物质的化学成分将其分类(醛、烃、醇、酯、酸、酮以及其他含氧有机物),再利用多元线性回归模型计算出其样本相关系数,说明芳香物质通过酒的香气来影响酒的品质,从而说明了理化指标分析和主观评分在葡萄酒质量分析中的差异性。
关键词:t检验相关性分析聚类分析主成分分析多元线性回归问题重述葡萄酒是世界公认的对人体有益的健康酒精饮品,其生产方式方便,经济,且风味极佳.因而越来越受到广大市民的青睐,同时葡萄酒的质量以及等级划分也越来越受到人们的关注。
题目: A 队员:指导老师:学校:承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2. .3. .指导教师或指导教师组负责人(打印并签名):教练组日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要本文对酿酒葡萄理化指标、葡萄酒的评价数据和理化指标数据进行了相关统计处理分析,在此基础上求出数据的相关关系,建立相关分析模型和利用数据拟合,得出各数据间的关系。
以此来评价各个数据和葡萄酒质量间的联系。
对问题一,我们先从评酒员对各组葡萄酒样品的打分角度出发,通过对各组数据进行样本方差,样本标准差,总体标准差(后称标准差),建立离差分析模型,求出各组数据的离散程度,得到散点图,初步确定第二组较第一组可信,然后在对其进行线性分析,利用EXCEL得出各组白葡萄酒和红葡萄酒的标准差比较折线图后,可明显看出第二组评酒员的打分标准差更小,两组评酒员的评价结果有显著差异,因此第二组的结果更加可信。
酿酒葡萄与葡萄酒理化指标及其质量的分析与评估摘要本文通过运用SPSS首先对两组品酒员对葡萄酒的评价进行了差异显著性分析以及评Cronbach α系数分析对品酒员评价的可信度进行了分析,得到了两组品酒员评价之间存在显著性差异,并且第一组品酒员的评价结果更为可信。
接下来我们取第一组评酒员给每个样品酒所给出的总分的平均分表示该样品葡萄酒质量的量化指标进行相关讨论我们通过对葡萄及葡萄酒的理化指标归一化处理,将它们之间的联系现实的更为明显,紧接着我们利用因子分析、主成分分析将决定葡萄酒质量的因素维度较低,从而达到简化模型的目的,并通过分析将各成分因子重新命名,再将命名后的主成分和评论员对葡萄酒的评价作为依据对酿酒葡萄等级评定,并引入层次分析法对评定体系进行改进构想。
最后利用MATLAB求解主成分因子与葡萄酒质量之间的函数关系,并用BP人工神经网络进行验证及讨论。
最后我们在每一个问题后面进行了深入的反思与总结,得出了一些具体的改进思路及方法,并得出在原有问题上的修正。
关键字SPSS MATLAB Cronbach α系数分析主成分分析层次分析法BP人工神经网络模型的改进与修正1.问题重述随着经济的日益发展,人们生活水平的不断提高,葡萄酒的受众随之增加,品酒行业逐渐专业化。
品质是现代葡萄酒生产追求的目标之一,针对酒类的质量检测也成为食品行业工作的重中之重。
根据已有数据,运用数学建模的方法,对葡萄酒进行评价是一个重要问题。
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
从上述相关关系出发,参考相关数据,针对酿酒葡萄与葡萄酒的理化指标和葡萄酒的质量这几个变量,进行分析并建立数学模型,讨论关于葡萄酒的评价问题:特别注意指出模型中的优点和不足之处,并做出改进方向。
论酿酒葡萄与葡萄酒之间的关系郭其昌2001年8月于天津蓟县《第八届全国葡萄、葡萄酒学术研讨会》各位代表:我试图用很短的时间把我用50多年时间研究的这个题目向大家说清楚。
我讲3个方面:葡萄酿酒和葡萄栽培技术协作的2次全国会议、酿酒葡萄品种和葡萄酒的关系、葡萄质量和葡萄酒的关系。
一、葡萄酿酒和葡萄栽培技术协作的2次全国会议关于这2次会议,《新中国葡萄酒业五十年》这本书的第16~68页有着详细的记载,大家抽时间可以看一看,相信能够从中取得一些教益。
74年的会议在烟台举行,会议根据当年上半年由轻工、外贸、栽培等单位组织的调查,总结了从解放至当时的葡萄和葡萄酒行业的情况,提出了原料基地化、基地良种化和良种区域化的理论以及执行办法,制定了发展规划。
具体包括:确定发展葡萄不与粮棉争地、厂社挂钩、利用野生资源、加速发展栽培与酿酒之间的协作和研究、根据产地区域划分协作区、各地区的建议发展品种、区域性酿酒试验、出台葡萄酒暂行管理办法(葡萄酒标准的基础)。
为了使行业了解国外情况,还公布了5期内容丰富的国外葡萄酒现状和法规。
80年的会议在通化举行,会议内容非常集中。
主要解决了以下问题:讨论葡萄酒质量管理办法等4个试行草案、随着葡萄酒改型(出现干酒)的发展品尝新产品并提出结论、确定研究推广葡萄酿酒新工艺和新设备以及酿酒葡萄品种区域化的研究方向。
为什么从70年代初我们就把酿酒和栽培结合在一起共议大事?因为通过前20年的研究和实践,使我们清楚地认识到二者之间休戚与共的相互关系。
其实,葡萄栽培和葡萄酿酒本来就是栓在一根绳子上面的两只蚂蚱,要各行其是,只有两败俱伤,谁也没法进步。
酿酒葡萄多次的种种拔拔,其主要原因是两方面结合出的问题。
我们可以清醒地看到:市场经济是栽培和酿酒双方要尊重的市场。
种植酿酒葡萄是为了提供给葡萄酒厂酿造葡萄酒。
葡萄酒厂的市场是面向消费者,而酿酒葡萄的市场是葡萄酒厂,二者相互依存、不可分割。
通过多年的工作,使我们知道要及时地总结经验和汲取教训,再不要热衷于随流。
承诺书参赛队员 (打印并签名) :题目葡萄酒与酿酒葡萄理化指标与质量关系分析关键词 t检验、Q型聚类分析、主成分分析、葡萄酒质量、理化指标题目摘要葡萄酒的品尝是一门学问。
本文通过两组品评员对红葡萄酒(27个样本)与白葡萄酒(28个样本)的评分表入手,根据酿酒葡萄与葡萄酒的理化指标的内在联系,运用t 检验、Q型聚类分析、主成分分析等方法,深入讨论酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响。
对于问题一:通过每组样本的总得分算出红葡萄与白葡萄的样本总方差,每组对应数据运用t检验进行统计。
结果为T1=1.7437<2.101,且P1=0.2130>0.05;T2=1.1641<2.101,且P2=0.3501>0.05。
所以两组品酒员对红葡萄酒、白葡萄酒的评价结果均无显著性差异。
且第一组的方差比第二组大,所以第二组的结果更可信。
对于问题二:通过建立Q型聚类分析模型,以酿酒葡萄的理化指标和葡萄酒的质量为标准来对酿酒葡萄进行分类,用类平均法来求相似性度量得到红葡萄、白葡萄分级图。
对于问题三:对红葡萄与白葡萄共有的理化指标进行相关性分析,根据他们之间的相关系数,根据各个指标建立典型相关系数表,同时画出相关系数大的指标的关系图。
对于问题四:根据对葡萄与葡萄酒的理化性质的分类,并将其对应于对葡萄酒的外观、香气、口感和整体评价的影响,由第三问知道他们之间存在线性关系,则利用多元回归模型将他们拟合出一个线性方程,进而找出他们的联系,从而得出可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。
关键词:t检验、Q型聚类分析、主成分分析、葡萄酒理化性质、多元线性回归一.问题重述本次研究对象为两组红葡萄酒与白葡萄酒,葡萄酒的主要质量指标为专业性评酒提供了依据,葡萄酒的主要质量指标大体可分为感官指标和理化指标两大类。
尤其是感官品评,是目前国内外鉴定葡萄酒品质的主要手段。
本论文从三大感官指标项目入手,分别是外观分析、香气分析、口感分析。
其中每个项目中有几项指标。
外观分析包含澄清度和色调;香气分析包含纯正度、浓度和质量;口感分析包含纯正度、浓度、持久性和质量。
理化指标主要指酒精含量(酒精度)、酸度和芳香物质浓度【1】。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
在研究葡萄酒的质量时,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系【2】,我们需要研究葡萄酒和酿酒葡萄检测的理化指标与葡萄酒和葡萄的质量之间的关系。
综上所述,我们需要解决以下问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
二.符号说明和模型假设2.1符号说明n 样品数2S方差df 自由度x均值js标准差j2.2 模型假设1、假设所选取的样本值真实可信。
本文引用数据、资料均真实可靠。
2、假设全部品酒员符合品评葡萄酒的要求且在品评当天表达正常且真实的分数。
3、假设整个建模过程中忽略计算误差。
4、两组品酒员在评分时不会受另一组的影响。
5、假设二级指标的信息可以再一级指标中反映出来。
三.模型的建立与求解3.1.1 问题分析该题主要利用题目中的附件一的数据来进行求解,观察图表可以知道对葡萄酒的评分算得满分为100分,其中包括有十个评分项目,那么我们将品酒员给的十个项目分数相加来表示品酒员对这个酒样品的评价标准,这样每一个样品都有十个数据,然后两组之间对应样品号的数据就可以进行t 检验,从而确定两组对同一个样品评价有无显著性差异,从而可以通过建立这个分组对应样品进行t 检验的方法来解决第一小问。
求得两组评价都无显著性差异之后,要确定评价结果的可信度我们可以通过比较方差来得出结果。
3.1.2 建模求解首先对数据进行处理:(1)求各品酒员对各样品的总分并排序形成矩阵; (2)求t ;(3)查t(df)0.05和t(df)0.01,以便后面与t 进行比较; (4)结合P 与0.05比较,判断是否有显著性差异; 求解过程:)(成立如果1)()1()()()11(2)()(2122221121212122221121n n n n x x x x n n n n x x x x t =--+--=+-+-+--=∑∑μμμμ用matlab 编程运算得到红葡萄酒两组之间评价结果的t 检验如下:t1=[1.2917 2.6620 2.0965 0.6728 0.4362 2.0749 1.5204 1.9071 1.3623 2.0928 2.5768 4.4486 2.3635 0.1645 1.9649 2.5582 1.5398 1.7616 1.8738 1.0973 1.2584 2.0463 3.5523 2.221 0.3038 0.6669 0.5658]求t1的平均值得T1=1.7437<2.101,且P1=0.2130>0.05 所以两组品酒员对红葡萄酒的评价结果无显著性差异。
同理,对白葡萄酒的评价结果数据进行计算,t 检验结果如下:t2=[1.1931 0.3199 1.3615 0.8485 2.6868 1.6488 1.1570 0.1942 1.6811 1.0337 0.1748 1.7991 1.7152 1.4139 1.3925 1.3134 0.3510 0.8330 1.5604 0.3547 0.5750 1.9157 0.6381 0.7238 0.6406 1.6695 2.8759 0.5226]求t2的平均值得T2=1.1641<2.101,且P2=0.3501>0.05 所以两组品酒员对白葡萄酒的评价结果无显著性差异。
Matlab 运行结果如图一:图一因为两组的评价结果无显著性差异,那么对于可信度的问题可以用各品酒员对各个样品的评价结果的方差来求解。
求解方差:))((122x x nS i -=∑ (2)在matlab 中直接利用var 函数进行方差的求解即可得出结果:图二由图分析可得,无论是对红葡萄酒还是对白葡萄酒的评价结果,所得到第一组的方差比第二组大,所以第二组品酒员对酒的评价结果比较稳定,可信度也比较强,那么第二组的结果更可信。
3.2.1 模型二建立:通过建立Q 型聚类分析模型,以酿酒葡萄的理化指标和葡萄酒的质量为标准来对酿酒葡萄进行分类,聚类分析是用数量化的方法描述事物之间的相似程度,而酿酒葡萄的理化指标和葡萄酒的质量就是几个用来判定样品之间相似程度的变量。
如果每一个样品可以用十几个变量来描述的话,则在一个空间中变量可以看作这个空间的维数,每个样品就是这个空间的点,所以他们之间的相似程度就可以用他们之间的举例来体现了。
记各样品为i w w w ,......,21,每个样品的相关变量记为i v v v ,......,21;如果使用绝对值距离来测量点与点之间的距离,即使用短距离法来测量类与类之间的距离,这里使用欧氏距离法来计算,即∑=-=nk jk ik j i n v v w w d 1)(,),(为每个样品的变量数 (3)用类平均法来求类与类间的相似性度量)),...2,1(,(,),(1),(212112n n n n j i xx d n n G G D G x G x pqj i q P ==∈=∑∑∈∈其中 (4)然后再根据他们的距离长短即可得到分类结果。
3.2.2 求解:用matlab 计算如图三所示: 红葡萄分级结果:图三分类结果如下:同理对白葡萄进行分级:图四分类结果如下:表四:白葡萄分四类表五:白葡萄分五类表六:白葡萄分六类3.3.建立模型找出酿酒葡萄与葡萄酒相同的理化指标【3】,进行相关性分析。
酿酒红葡萄与红葡萄酒对应的有十五个共同的理化指标,分别是:花色苷、单宁、总酚、总黄酮、白黎芦醇、反式白黎芦醇苷、顺式白黎芦醇苷、反式白黎芦醇苷、顺式白黎芦醇苷、DPPH 半抑制体积、色泽L*\a*\b*\H\C 。
对酿酒红葡萄的15个共同的理化指标分别进行编号为1x 、2x 、3x .......15x ;对葡萄酒理化指标编号为16x 、17x 、18x .....30x 。
第一步:对原始数据进行标准化处理首先建立酿酒红葡萄理化指标与红葡萄酒的原始数据矩阵,即ij x =[1x 2x3x ....30x ],i ∈[1 27];j ∈[1 30]。
然后对数据矩阵进行标准化处理,处理方式为jjij ij s x x x -=~(5)其中j x 、j s 分别表示矩阵ij x 每一列的均值和标准差。
第二步:求它们两两变量之间的相关系数。
具体的相关系数见附件二。
同理找出白葡萄与白葡萄酒之间的共同指标,然后计算他们之间的相关系数矩阵,表八:选取典型的相关系数靠前的各个指标建立的典型相关系数表则由红葡萄相关系数表可得,红葡萄的理化性质与红葡萄有四个相关性比较大的因素:选定为花色苷,单宁,总酚和总黄酮;画出他们之间的关系图如下:图五图六图七图八同理由白葡萄相关系数表可得,白葡萄的理化性质与白葡萄有四个相关性比较大的因素:选定为单宁,总酚和总黄酮;画出他们之间的关系图如下:图九图十图十一则可以得到红葡萄中的花色苷,单宁,总酚和总黄酮与红葡萄酒的理化性质呈正比关系,白葡萄中的单宁和总黄酮与白葡萄酒的理化性质呈正比关系,而白葡萄中的总酚与白葡萄酒的理化性质大致呈反比关系。
则可以得到葡萄与葡萄酒的理化性质大致有线性关系。
3.4.1红葡萄和红葡萄酒的理化性质对葡萄酒质量的影响1.外观以621,...,,x x x 为全部自变量,采用小二乘法拟合一个多元回归模型得到葡萄酒的质量评分的外观部分1ˆy,得到如6622111*...**ˆx a x a x a y +++=式子,要求621,...,,a a a 的秩,可以通过建立多元回归模型来求得,求解过程如下:6543211*0518.0*1124.0*0010.0*0615.0*0419.0*0003.08.944ˆx x x x x x y-+++-+=(6)表九(t 检验值):这个回归模型的复判定系数 2R =0.4130图十二2.香气首先将红葡萄与红葡萄酒的各种芳香物质进行并列建立矩阵,然后用相应样品的均值填补缺失值。
,求出它们与红酒质量评分中香色部分的相关系数。
如下表1所示是选取相关系数靠前的几个芳香物质。
(其他具体相关系数见附件三)对这些变量按表中顺序进行编号分别为1x 、2x 、3x ......12x ;以上述所有变量为自变量,采用最小二乘法拟合一个多元回归模型,有:76543211964.00366.00615.01185.00262.05588.00522.08436.19ˆx x x x x x x y--+--++= 121110981157.00598.00286.00374.01630.0x x x x x ---++ (7)这个回归模型的复判定系数2R =0.8408 调整复判定系数2R =0.7044, 模型的标准剩余差为0.8798对各个参数的t 检验的结果见表2所以这个模型的t 检验和F 检验都符合。