数据说:葡萄指标数据对葡萄酒的影响
- 格式:docx
- 大小:516.43 KB
- 文档页数:18
葡萄对葡萄酒品质影响的五大指标物质
葡萄主要成分是水和糖,这是葡萄能在酵母作用下发酵成葡萄酒的物质基础。
酒精是葡萄果实中的糖发酵后的产物。
在目前的发酵工艺下,约17克左右的糖,会使每1升的葡萄汁发酵后升高1%的酒精含量。
因此,葡萄果实中糖的成份多少,是制约发酵后葡萄酒的酒精度的要素。
葡萄中酸的含量,对葡萄酒的影响也很大。
在葡萄酒中,酸除了平衡口感外,还具有抗氧化,保持葡萄酒鲜美的作用。
在味觉感受方面,适度的酸会使葡萄酒甜而不腻,并在口感上平衡酒精,甜度,葡萄的水果风味,从而增加味觉的舒适性。
单宁和色素对红葡萄酒的特色和风味作用也是显著的。
单宁是很好的抗氧化物质。
同时,它的涩味和收敛感又造就了葡萄酒丰富的厚重品质。
适度而优秀的单宁给人的感受是美妙的。
葡萄酒的颜色来源于葡萄中的色素。
葡萄的色素则决定着红葡萄酒的颜色气质。
芳香物质是造就葡萄酒风味的物质之一,芳香物质越多,葡萄酒的风味就浓厚。
尽管单宁、色素和芳香物质在整个葡萄的物质构成中所占比例非常的小。
但它们对葡萄酒的特色和风味有着非常显著的贡献。
单宁、芳香物质和色素更多地存在于葡萄皮中,因此,有时人们会认为葡萄皮的厚薄会影响葡萄酒的颜色和风味。
而真实的情况是葡萄皮中含有这三种风味物的缘故。
其实,影响葡萄酒品质的因素除酿造技术外,葡萄果中的五大要素物质的含量及构成比例起着非常重要的作用。
可以说葡萄果中的糖、酸、单宁、芳香物质和色素是影响葡萄酒品质的指标性物质。
问题四分析:
该问需要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。
在第二问将葡萄酒的等级进行划分和第三问将葡萄酒和葡萄的理化指标进行筛选的基础之上,再次运用BP神经网络算法模拟酿酒过程建立关于葡萄酒质量评价的模型,从而得出葡萄与葡萄酒的理化指标对葡萄酒质量的内在关系。
基于BP神经网络的葡萄酒质量评价的模型:
与第二问相同,为了得到关于葡萄酒质量与葡萄酒和葡萄的理化指标是否存在关系,我们建立BP神经网络的综合评价模型,在此模型中,输入层为已经在第三问遴选过的葡萄和葡萄酒的指标以及经过简化处理的芳香类的物质,输出指标为第二问基础上的3个不同等级的葡萄酒。
隐含层是神经网络的工具箱决定。
在模拟过程中,我们选择前23个指标进行训练,后4个指标进行检验,运用MATLAB神经网络工具箱进行操作,得到相应的误差分析为:
从结果可以看出,二分之一的的训练样本的误差都在[0.03282,0.0693],而样本检验的最大误差达至0.2152。
由于神经网络的构建原理是在原有的数据基础之上所做的预测,能够使到信号沿着误差最小的方向传播,因此,训练样本越多结
果会越准确,而在本题中,由于训练的样本和检验样本都比较少,所以有些结果会出现较大的误差,但就总体而言,训练结果较好。
基于理化指标分析的葡萄及葡萄酒的评价葡萄及葡萄酒的评价是葡萄酒产业中非常重要的一环,而基于理化指标的分析是评价葡萄和葡萄酒质量的一种方法。
下面我们将对基于理化指标分析的葡萄及葡萄酒的评价进行详细讨论。
首先,对于葡萄而言,理化指标主要包括果实大小、果皮厚度、果实颜色、果汁含糖量、酸度、酚类化合物含量等。
果实大小与产量密切相关,通常越大的葡萄产量越高。
果皮厚度与葡萄外观和保存性能有关,较厚的果皮可以保护果实不受外界因素的影响。
果实颜色通常被视为葡萄的品质指标之一,深色葡萄通常含有更多的花青素,而花青素是葡萄酒中重要的色素成分。
果汁含糖量与葡萄糖度相关,是判断果实成熟度和甜度等级的指标之一、酸度是葡萄品质的重要指标之一,过低的酸度可能导致葡萄酒口感平淡。
酚类化合物含量则与葡萄的芳香物质和抗氧化能力等相关。
通过对这些理化指标的分析,可以全面评价葡萄的品质和适用于酿酒的潜力。
对于葡萄酒而言,理化指标主要包括酒精度、总酸度、挥发性酸度、PH值、葡萄酒中的有机酸、糖分、酚类化合物、色素等。
酒精度是葡萄酒中的酒精含量,对于葡萄酒的风味和醇度影响很大。
总酸度和挥发性酸度分别是葡萄酒中总酸和挥发性酸的含量,对于葡萄酒的酸度和口感起到重要作用。
PH值是葡萄酒的酸碱度,对于葡萄酒的稳定性和口感也有影响。
葡萄酒中的有机酸是葡萄酒中的重要成分,不同有机酸的含量和比例会影响葡萄酒的口感和风味。
糖分是判断葡萄酒甜度的重要指标。
酚类化合物和色素是葡萄酒中的重要成分,对于葡萄酒的色泽和口感产生显著影响。
基于理化指标的分析的定量化方法可以通过仪器设备进行测量,然后用数学和统计学的方法进行分析和处理。
利用这些分析结果,我们可以对葡萄和葡萄酒的品质进行判断和评价。
同时,可以通过与历史数据和目标品质进行对比,从而找出改进和调整的方向。
此外,还可以通过对不同产地、不同品种的葡萄以及不同酿造方法的葡萄酒进行理化指标的分析比较,探索出最佳的生产和酿造工艺。
酿酒葡萄与葡萄酒理化指标的联系分析
葡萄是酿酒葡萄酒的主要原料之一,理化指标是表征葡萄酒质量的重要标志,葡萄与葡萄酒的理化指标之间存在着千丝万缕的联系,直接反映着葡萄酒质量特征。
先看理化指标。
葡萄酒中的理化指标主要有比重、pH值、酸度、酒精度等。
比重主要测定了酒体的香气,pH值表明了酒的酸性强弱,酸度是测量酒中酸的量度,酒精度是表征酒体成分的重要指标。
葡萄的理化指标主要包括葡萄糖含量、酸含量、总有机物等。
葡萄糖含量是指葡萄中可消化食品糖的含量,反映着葡萄对酒质量影响的重要因素,酸含量可以直接反映酒的酸性,总有机物表明了葡萄中素材的浓缩程度,从而决定了酒的美味度。
葡萄与葡萄酒理化指标之间存在着千丝万缕的联系,这种联系可用数学方法去表示。
葡萄带给酒的气味、口感和质地是由理化指标决定的,是理化指标的加总结果,理化指标的变化将直接影响酒的口感和质地。
综上所述,葡萄与葡萄酒理化指标之间有着千丝万缕的联系,葡萄的理化指标从某种程度上影响了酒体的香气、pH值、酸度、酒精度等,而这些又决定了酒的美味度。
只有通过准确计算和分析,我们才能更好地把握葡萄酒质量特征,从而更好地为葡萄酒消费者提供高质量的产品。
数据说:葡萄指标数据对葡萄酒的影响一、问题设立:(改编自CUMCM 2012 A题)如我们所知,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
以上只是我们的定性分析,严重缺少定量分析验证。
现在请你根据酿酒葡萄的各项理化指标数据和葡萄酒的指标数据进行分析,通过具体的数据建立数学模型解决下列问题:1. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
2. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
3.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?附件1和附件2分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
附件1:葡萄和葡萄酒的理化指标(含2个表格)附件2:葡萄和葡萄酒的芳香物质(含4个表格)二、问题解答数据说:葡萄指标数据对葡萄酒的影响摘要本文针对对葡萄酒的评价问题,运用了聚类分析法、偏最小二乘回归分析法等方法建立数学模型,综合分析了酿酒葡萄的理化指标、葡萄酒的理化指标与葡萄酒质量三者之间的联系。
针对问题一,对酿酒葡萄进行分级,先对不同量纲的数据进行标准化处理,运用相关性分析法分别计算两种葡萄的各种理化指标和葡萄酒质量的相关性系数,从而筛选出相关性系数较大的指标作为酿酒葡萄的分类指标;运用聚类分析法对酿酒葡萄进行聚类分析,将红葡萄和白葡萄都分成了四类,根据葡萄酒的分级标准,从而得到分级结果(见表6)。
针对问题二,分析酿酒葡萄与葡萄酒的理化指标之间的联系,先对不同量纲的数据进行标准化处理,运用相关性分析法筛选出与葡萄酒质量相关性较大的酿酒葡萄指标和葡萄酒指标。
此问题是研究两组多重相关变量间的关系问题,故运用偏最小二乘回归分析法得到酿酒葡萄与葡萄酒理化指标的回归方程式,从而分析出两者理化指标之间的联系。
针对问题三,分析酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,建立了葡萄酒质量的评价模型:分别对酿酒葡萄理化指标、葡萄酒指标与葡萄酒质量运用偏最小二乘回归分析法,分别得到相应回归方程式;从而得出结论。
葡萄酒质量评估指标的研究葡萄酒是一种古老的饮品,被誉为“饮料中的花露水”。
但是,葡萄酒的品质评估标准一直以来是个比较模糊的概念,有时候还会因为个人口味的不同而出现争议。
为了解决这一问题,不断有学者们进行葡萄酒质量评估指标的研究与探索。
下面将着重分析几个重要的指标。
1. 酸度酸度是葡萄酒评估中最基本且重要的指标之一。
它不仅影响了葡萄酒的口感,还影响了葡萄酒的保质期和微生物生长。
酒酸度是以pH值表示的,一般来说,标准的葡萄酒pH值应该在3.0-3.5之间。
2. 风味葡萄酒的风味是影响最大的指标之一,是葡萄酒质量的重要评价标准。
它由香气、口感和余味三部分组成。
香气是葡萄酒获得好口感的一个重要因素;口感是葡萄酒在口中的感受,如口感的浓郁程度、温度、黏滑感等;余味是指葡萄酒入口后在口中留存的味道和感觉,它应该具有长而细腻的余味。
3. 色泽色泽是葡萄酒的视觉质量指标。
良好的葡萄酒色泽不仅美观,也能反映其品质。
红葡萄酒需要具备颜色明亮、鲜艳、和透明感,而白葡萄酒一般要求颜色偏黄,而且透明度高。
4. 贮存能力葡萄酒的贮存能力是指葡萄酒的保存期限。
它是反映葡萄酒品质稳定性和口感发展能力的最重要的指标之一。
葡萄酒的贮存能力通常取决于其酸度、酒精度、芳香物质和单宁等成分。
5. 甜度甜度也是葡萄酒评估的一个重要指标。
葡萄酒的甜度很大程度上反映它的产区和品种。
一般来讲,葡萄酒的甜度可以分为干型、半干型和甜型三种。
干型的葡萄酒甜度低,味道偏苦;半干型葡萄酒甜度中等,味道适中;而甜型葡萄酒的甜度高,味道甜美。
总之,葡萄酒的质量评估是一项复杂而具有挑战性的工作,它涉及到众多因素,包括颜色、香气、口感、贮存能力等等。
因此,科学的葡萄酒质量评估指标研究非常重要。
对此,有必要加强葡萄酒评估标准的研究与尝试,不断完善葡萄酒评价指标,以提高葡萄酒质量和推动整个葡萄酒行业的升级。
(一)品尝方法1、看外观:通过3次观察,判断葡萄酒的色泽和挂杯情况。
先用食指和拇指握住酒杯柄脚部,将酒杯置于腰高低,低头垂直观察酒的液面,看酒体是否正常;再将酒杯举至双眼高度,观察酒的色泽,透明度及是否存在悬浮物和沉淀物;然后,将酒杯倾斜或摇动,使酒液均匀分布于酒杯的内壁,静置后观察酒液的挂杯状况。
2、闻香:通过3次闻香,判断香气,第一次闻香;端起酒杯,稍低头将鼻孔接近于杯口,只能闻到挥发性强的成份香气;第二次闻香,摇动酒杯,使酒液呈圆周运动,杯壁湿润,酒杯空间充满挥发性成份,再闻香更浓,第三次闻香找香气是否有缺陷。
3 尝味酒入口后,要使酒液布满舌部及口腔,闭上嘴唇,利用舌头及面颊肌肉的运动分散酒液,也可微微张口,轻轻地吸点空气,使酒的香气进入鼻腔后部,品尝味道。
一般先感觉到甜味,再感知酸味,后尝到苦涩味,当然不是截然分开的。
(二)葡萄酒评价1、外观:色正、悦目、晶亮、澄清透明、有光泽、闪烁等;2、香气:醇正、清雅、优美、具有和谐的果香和酒香;3、口味:醇厚、圆润、协调等;4、典型性:风格独特、典型性强;各类上好的葡萄酒的综合评价。
例:干型,半干型葡萄酒,具有和谐的果香味和酒香味;口味干爽,醇厚,优雅;典型性强。
半甜型葡萄酒:果香和酒香和谐,口味甘甜,醇厚柔和;风格典型。
在葡萄酒的感官评价中,由于品酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同品酒员对同一酒样的评价差异很大。
从而不能真实地反映不同酒样间的差异。
因此,在对感官评价结果进行统计分析时.必须对品酒员的原始数据进行相应的处理,以真实反映样品间的差异。
对有关数据处理方法的比较分析结果表明:标准化法不仅没有消除品酒员间的异质性,反而加大了品酒员间的差异;而置信区间法对原始数据进行调整,能有效地降低品酒员间的差异,真实地反映酒样间的客观差异。
根据葡萄酒理化指标对葡萄酒质量的统计分析作者:黄潇逸来源:《商情》2013年第28期【摘要】本文将根据葡萄酒成分的理化指标,主要通过统计中的逻辑回归与数据挖掘中的决策树实现对葡萄酒质量的分类评估,关注影响葡萄酒质量分类的关键指标。
【关键字】葡萄酒,理化指标,质量分类,逻辑回归分析,决策树一、问题提出葡萄酒是一种成分复杂的酒精饮料,葡萄酒行业评价葡萄酒质量时,惯用的是感官评价,但这种方法受评定人员的嗜好、习惯、情绪、年龄、经验等因素的影响较大,评定常有一定程度的主观性和不确定性,尤其在葡萄酒质量差别不大时,更易引起打分不一致和数据分析产生偏差,使品评结果不够科学。
对葡萄酒质量通过量化的方法进行评价,为酿酒行业对葡萄酒进行质量分类提供理论参考成为必然。
葡萄酒的成分与葡萄酒的质量关系密切,是判定葡萄酒质量的重要依据。
本文将根据葡萄酒成分的理化指标,主要通过统计中的逻辑回归方法与数据挖掘中的决策树实现对葡萄酒质量的分类评估,得到影响葡萄酒质量分类的重要指标。
二、主要研究方法针对葡萄酒质量及其理化指标的关系的理论研究方法,现在主要有多元线性回归、神经网络、支持向量机等方法。
本文主要采用数据挖掘中的逻辑回归分析与决策树及其优化对葡萄酒质量分类问题进行对比研究。
逻辑回归模型主要研究某些因素与二分类变量之间的联系,通过逻辑变换,建立因变量与自变量的线性模型,其中,因变量的系数表示为该因素改变一个单位,个体发生事件概率与不发生事件概率之比的自然对数变化值。
系数得到则主要通过最大似然估计。
决策树通过选择分类效果最好的属性,把实例从根节点排列到某个叶子节点来分类实例,叶子结点即为实例的分类。
本文主要通过Rattle中包含的决策树的CART算法对葡萄酒质量进行分类研究。
此外,本文还引入了Adaboost算法对决策树分类进行优化,以得到对葡萄酒质量最佳的分类结果。
三、指标选取及数据探索本文主要选择葡萄酒的理化指标作为分类依据进行研究。
数据说:葡萄指标数据对葡萄酒的影响一、问题设立:(改编自CUMCM 2012 A题)如我们所知,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
以上只是我们的定性分析,严重缺少定量分析验证。
现在请你根据酿酒葡萄的各项理化指标数据和葡萄酒的指标数据进行分析,通过具体的数据建立数学模型解决下列问题:1. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
2. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
3.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?附件1和附件2分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
附件1:葡萄和葡萄酒的理化指标(含2个表格)附件2:葡萄和葡萄酒的芳香物质(含4个表格)二、问题解答数据说:葡萄指标数据对葡萄酒的影响摘要本文针对对葡萄酒的评价问题,运用了聚类分析法、偏最小二乘回归分析法等方法建立数学模型,综合分析了酿酒葡萄的理化指标、葡萄酒的理化指标与葡萄酒质量三者之间的联系。
针对问题一,对酿酒葡萄进行分级,先对不同量纲的数据进行标准化处理,运用相关性分析法分别计算两种葡萄的各种理化指标和葡萄酒质量的相关性系数,从而筛选出相关性系数较大的指标作为酿酒葡萄的分类指标;运用聚类分析法对酿酒葡萄进行聚类分析,将红葡萄和白葡萄都分成了四类,根据葡萄酒的分级标准,从而得到分级结果(见表6)。
针对问题二,分析酿酒葡萄与葡萄酒的理化指标之间的联系,先对不同量纲的数据进行标准化处理,运用相关性分析法筛选出与葡萄酒质量相关性较大的酿酒葡萄指标和葡萄酒指标。
此问题是研究两组多重相关变量间的关系问题,故运用偏最小二乘回归分析法得到酿酒葡萄与葡萄酒理化指标的回归方程式,从而分析出两者理化指标之间的联系。
针对问题三,分析酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,建立了葡萄酒质量的评价模型:分别对酿酒葡萄理化指标、葡萄酒指标与葡萄酒质量运用偏最小二乘回归分析法,分别得到相应回归方程式;从而得出结论。
对模型进行检验,得知可用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
本文依据葡萄和葡萄酒的各项指标数据,建立合适的模型,定量的分析了葡萄指标对葡萄酒质量的影响。
关键词数据说;偏最小二乘回归分析法;相关性分析法;聚类分析法1、问题重述如我们所知,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
以上只是我们的定性分析,严重缺少定量分析验证。
现在请你根据酿酒葡萄的各项理化指标数据和葡萄酒的质量数据进行分析,通过具体的数据建立数学模型解决下列问题:1. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
2. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
3.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2、模型假设1.酿酒葡萄的酿造水平与酿造环境相同;2.酿制同一种酒使用的葡萄是相同的;3.葡萄的成分充分转换成葡萄酒里的成分,不存在意外的浪费和挥发。
3、通用符号说明4、问题分析、模型的建立和求解4.1 问题一分析、模型建立和求解 4.1.1问题一分析本题要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,则首先应当确立适当的分级指标,然而对于题目中要求的酿酒葡萄的理化指标和葡萄酒的质量这些指标中可能存在指标间相关性较强的情况,也可能有一些指标与酿酒葡萄的分级相关性很小。
所以有必要对所有的相关系数进行分析。
题目提供的酿酒葡萄的理化指标中的部分指标具有二级指标,为了更为细致准确的分析各指标与葡萄酒质量的关系,对于有二级指标的一级指标,只考虑其二级指标,将该一级指标去除。
然后按照剩下指标的原始顺序进行顺序编号,共有55个葡萄理化指标,记作55,,2,1, j p j 。
将葡萄酒质量编号为56,即56p 对于j 个指标,第i 种葡萄样品的值为ijp进行相关性分析,不同单位的数据要做标准化变换,即用离均差/标准差。
使数据统一。
4.2.2问题一模型建立因为酿酒葡萄是用来酿葡萄酒的,因此,酿成葡萄酒的质量也就成为了判别酿酒葡萄的最重要指标。
题目提供了酿酒葡萄的50多种指标,然而对于这些指标未必每项都对酿制的酒有影响,或者说产生的影响是可以忽略的。
所以有必要对酿酒葡萄的理化指标与酿酒质量进行相似性度量,从而找出与酿酒质量相关程度较大的指标。
下面通过计算相关系数衡量这些指标间的相似程度。
指标j p 与k p 的样本相关系数为:2111221)()())((⎥⎦⎤⎢⎣⎡----=∑∑∑===n i ni k ik j ij ni k ik j ijjk μp μp μp μpr其中n p n μni ij j ,11∑==为酿酒葡萄的样品数目。
筛选出与葡萄酒质量相关性比较大的指标之后,由于指标决定的葡萄分级,则需要对筛选出来的指标所决定的葡萄进行分类。
可参考国家对葡萄酒的分级标准用聚类分析法进行分类。
将分类后的葡萄根据国际分类标准进行分级。
4.2.3 问题一模型求解首先在Excel 中对数据进行标准化处理处理(见附件1.xls )。
计算得红葡萄理化指标与红葡萄酒质量相关系数见图3:图3 红葡萄理化指标与红葡萄酒质量相关系数计算白葡萄理化指标与白葡萄酒质量相关系数如图4:图4 白葡萄理化指标与白葡萄酒相关系数分析从图3和图4中可以看出只有部分指标超过了0.5,因此可以作为葡萄分级的评价指标,这些指标中有正相关较大的,还有一些是与质量有较大的负相关性。
也可以作为评价葡萄酒质量的指标,下面红葡萄酒以0.5为界限,白葡萄酒以0.4为界限进行筛选,如表4:表4 指标选取情况经过筛选后的指标不仅与葡萄酒的质量有很大的相关性,而且大幅度的减少了指标的数量。
下面用聚类分析的方法对相似程度大的指标进行分类。
首先对每个指标的数据ij p 进行标准化处理得到ij p ~,,,2,1,,,2,1,~n j m is μp p jjij ij ===-其中,∑m i ij j p m μ11==,∑--m i j ij j μp m s 12)(11==,n j ,,2,1= ,n m ,分别表示样品的数量和指标的数量。
样本间相似性采用欧式距离度量,类间距离的计算选用类平均法。
此外国际上和国内都是将葡萄酒按质量分为四个等级,其中,我国葡萄酒质量划分为优质特级葡萄酒、产区优质葡萄酒、产区优良葡萄酒以及佐餐酒四个级别[2]。
故将酿酒葡萄分为对应的四个等级能够便于对酿酒葡萄的收购以及应用。
根据计算欧氏距离的方法,用SPSS软件绘制出的红葡萄的分类如图5:图5 红葡萄酒酿酒葡萄分类同样,白葡萄酒酿酒葡萄分类如图6:图7 白葡萄酒酿酒葡萄分类据图得到葡萄样品分类结果为:表5 分类结果图将红葡萄和白葡萄进行分类之后,参考国家将葡萄酒分为四级的标准也将白葡萄和红葡萄分为四级。
如下表:表6 酿酒葡萄分级结果在对红葡萄和白葡萄分别分级后可明显看出第一级别的葡萄少且质量最好,第四级别的葡萄也很少质量最劣,这可为酿制葡萄酒时选购葡萄提供参考。
4.3 问题二分析、模型建立和求解4.3.1 问题二分析本题要求分析酿酒葡萄与葡萄酒各理化指标之间的联系。
分析附件1发现酿制的葡萄酒和酿酒葡萄比较有许多的成分发生了变化。
仍然只考虑二级指标,以红葡萄酒为例,成分变化如下表7:由表可看出酿制的葡萄酒有些成分变少了或是消失,说明酿制葡萄酒的过程中葡萄的成分转化成了其他的物质。
所以考虑拟建立葡萄酒的理化指标与葡萄酒的质量的相关关系模型,由题目二得出与葡萄酒的质量相关性较大的葡萄的几项理化指标,再筛选出与葡萄酒的质量相关性较大的葡萄酒的理化指标。
然后以葡萄的各项理化指标为自变量,葡萄酒的理化指标为因变量。
用偏最小二乘回归分析法[3]进行求解。
同样要对数据进行单位标准化。
要求数据单位统一。
4.3.2 问题二模型建立以红葡萄酒为例,为了更为细致准确的分析葡萄酒各理化指标与葡萄酒的质量之间的相关性,对于有二级指标的一级指标可以去除,只考虑二级指标。
然后按照葡萄酒理化指标的原始顺序进行编号,共有13个指标,记作,1,2,,13j H j =。
将葡萄酒质量编号为14,即14H 。
对于第j 个指标,第i 种葡萄酒样品的值为ijH 。
指标j H 与k H 的样本相关系数为:1122211()()()()nijj ik k i jk n nij j ik k i i HH r H H μμμμ===--=⎡⎤--⎢⎥⎣⎦∑∑∑其中11,nj ij i H n n μ==∑为红葡萄酒的样品数目。
4.3.3 问题二模型求解首先在Excel 中对数据进行标准化处理(见附件2.xls )。
由SPSS 软件计算得红葡萄酒理化指标与红葡萄酒质量相关系数见图8:图8 红葡萄酒理化指标与红葡萄质量相关系数同理,计算得白葡萄酒理化指标与白葡萄酒质量相关系数见图9:图9 白葡萄酒理化指标与白葡萄酒质量相关系数从图中可以看出,只有部分指标与葡萄酒的质量的相关系数超过0.4,与葡萄酒质量具有较大的相关性。
其中,还有些指标是与葡萄酒的质量具有较大的负相关系数,也就是会抑制葡萄酒质量的提高,因此这样的指标也必须被作为评估葡萄酒的指标。
下面对红葡萄酒以正负0.5为界,对白葡萄酒以正负0.1为界筛选指标,筛选情况见表8:表8 指标选取情况经过筛选后的指标与葡萄酒的质量有了较大的相关性,同时也减少了指标的数量。
然后把红葡萄的6项指标作为自变量,设为,1,2,6k x k =;则由题目二得,与红葡萄酒质量相关系数较大的红葡萄的6个指标分别为1x 为蛋白质,2x 为PPH 自由基1,3x 为总酚,4x 为葡萄总黄酮,5x 为PH 值,6x 为C 。
把红葡萄酒的6项指标作为因变量,设为,1,2,6k y k =,与红葡萄酒质量相关系数较大的红葡萄酒的6个指标为1y 为单宁,2y 为总酚,3y 为酒总黄酮,4y 为反式藜芦醇甘,5y 为DPPH 半抑制体积,6y 为色泽。
可得偏最小二乘法回归方程式:123456k m m m m m m m y a x b x c x d x e x f x g =++++++ (1)其中,,,,,m m m m m m a b c d e f 为未知的参数,m g 为不可观测的随机变量,称为误差项。
然后用Matlab 软件[4]求其系数得到方程系数得,如下表9:表9 红葡萄酒和红葡萄回归方程的系数由表分析,红葡萄酒的单宁和红葡萄的总酚有较大的联系,和蛋白质、PH 值以及C 成负相关关系;红葡萄酒的总酚、酒总黄酮、反式白藜芦醇甘、DPPH 半抑制体积分别都和红葡萄的总酚、葡萄总黄酮有较大的联系,都和蛋白质、PH 值以及C 成负相关关系;红葡萄酒的色泽和红葡萄的C 有较大的联系,和DPPH 自由基1、总酚、葡萄总黄酮、PH 值成负相关关系。