2012年数学建模a题论文
- 格式:doc
- 大小:349.50 KB
- 文档页数:26
基于数理分析的葡萄评价体系摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。
本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。
对于问题一,我们首先用配对样品t 检验方法研究两组评酒员评价差异的显著性,将红葡萄酒与白葡萄酒进行分类处理,用SPSS 软件对两组评酒员的评分的各个指标以及总评分进行了配对样本t 检验。
得到的部分结果显示:红葡萄酒外观色调、香气质量的评价存在显著性差异,其他单指标的评价不存在显著差异,白葡萄、红葡萄以及整体的评价存在显著性差异。
接着我们建立了数据可信度评价模型比较两组数据的可信性,将数据的可信度评价转化成对两组评酒员评分的稳定性评价。
首先我们对单个评酒员评分与该组所有评酒员评分的均值的偏差进行了分析,偏差不稳定的点就成为噪声点,表明此次评分不稳定。
然后我们用两组评酒员评分的偏差的方差衡量评酒员的稳定性。
得到第 2 组的方差明显小于第1 组的,从而得出了第2 组评价数据的可信度更高的结论。
对于问题二,我们根据酿酒葡萄的理化指标和葡萄酒质量对葡萄进行了分级。
一方面,我们对酿酒葡萄的一级理化指标的数据进行标准化,基于主成分分析法对其进行了因子分析,并且得到了27 种葡萄理化指标的综合得分及其排序。
另一方面,我们又对附录给出的各单指标百分制评分的权重进行评价,并用信息熵法重新确定了权重,用新的权重计算出27 种葡萄酒质量的综合得分并排序。
最后我们对两个排名次序用基于模糊数学评价方法将葡萄的等级划分为1-5 级。
对于问题三,首先我们将众多的葡萄理化指标用主成分分析法综合成 6 个主因子,并将葡萄等级也列为主因子之一。
对葡萄的 6 个主因子,以及葡萄酒的10 个指标用SPSS 软件进行偏相关分析,得到酒黄酮与葡萄的等级正相关性较强等结论。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):兰州理工大学参赛队员(打印并签名) :1. 杨自升2. 韩向东3. 吴林峰指导教师或指导教师组负责人(打印并签名):汪训洋陈金淑日期:2012年9月10日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要评判葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员对葡萄酒样品进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
本文就葡萄酒质量的评价问题进行分析研究,针对如何对酿酒葡萄进行分级,酿酒葡萄与葡萄酒的理化指标之间的关系,以及酿酒葡萄与葡萄酒的理化指标对葡萄酒的质量的影响等问题,建立了相应的数学模型,并运用EXCEL、MATLAB等数学软件,分别就题目所提出的问题进行求解。
2012CUMCM全国大学生数学建模竞赛A题论文D进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话): 132所属学校(请填写完整的全名)大连海事大学参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号)赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要:本文主要需要解决的问题是将葡萄酒从评酒师感官方面的定性评价通过一定的数据处理与数学模型的建立转化为由酿酒葡萄和葡萄酒理化指标做基础的定量的葡萄酒评价方法。
考虑到红葡萄酒和白葡萄酒之间的差异性,我们对它们分别进行讨论。
针对题目中的问题,我们通过如下的方法去解决:(1)第一问是对评酒员评分的差异性的分析与可信度的分析。
我们通过传统统计学的平均数与标准差的计算方法,计算各葡萄样品评酒员所打分数的平均值与每组评酒员之间所打分数的标准差,再进行作图比较,得出我们想要的结论。
(2)第二问是根据酿酒葡萄的理化指标对酿酒葡萄进行分级。
我们首先通过计算各理化指标的Pearson相关系数矩阵,分析各指标之间的Pearson相关系数,得到高度相关的理化指标。
再通过聚类的方法,将这些理化指标聚合成一类因子。
最后通过对各因子与葡萄酒质量的数据拟合,得出一定的函数关系式,结合前苏联对葡萄酒的评价模型与张大鹏检验模型对关系式进行检验。
(3)第三问是分析酿酒葡萄和葡萄酒理化指标之间的联系。
我们首先选取一些含量大且对葡萄酒质量有较大影响的理化指标。
对这些指标进行数据拟合与修正,得出我们想要的函数关系式。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):指导组日期:2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):2葡萄酒的评价摘要本文主要根据评酒员对葡萄酒的一系列指标的打分,从而对葡萄酒的质量作出判别。
考虑到酿酒葡萄的好坏、所酿葡萄酒的质量和酿酒工艺、陈酿技术等约束条件,为此我们建立模型来确定影响葡萄酒评价的各种因素。
在这模型中利用excel,spss,matlab等一系列的数学工具对模型进行求解,综合统计分析的应用对所给的结果进行比较,从而得出最终的结果。
首先,对于问题1,分析两组评酒员的评价结果,每个评酒员对外观、口感、香气、平衡/整体四个方面指标得分进行求和,得到其总分,确定葡萄酒的质量。
由于葡萄酒的质量满足正态分布,为了能分辨出两组的差异,所以利用spss进行配对T检验,从而得出两组评酒员有显著的差异。
其次,用excel对两组进行方差分析,根据所得到的P值大小,得出第一组的评价结果更为可信。
对于问题2,在问题1的基础下,根据所给的理化指标和葡萄酒的质量利用spss统计分析软件进行分析,相关性分析对数据进行预备分析,剔除与葡萄酒质量无显著性相关的指标,再利用系统聚类的方法对酿酒葡萄进行分级。
基于数理分析的葡萄评价体系摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。
本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。
对于问题一,我们首先用配对样品t 检验方法研究两组评酒员评价差异的显著性,将红葡萄酒与白葡萄酒进行分类处理,用SPSS 软件对两组评酒员的评分的各个指标以及总评分进行了配对样本t 检验。
得到的部分结果显示:红葡萄酒外观色调、香气质量的评价存在显著性差异,其他单指标的评价不存在显著差异,白葡萄、红葡萄以及整体的评价存在显著性差异。
接着我们建立了数据可信度评价模型比较两组数据的可信性,将数据的可信度评价转化成对两组评酒员评分的稳定性评价。
首先我们对单个评酒员评分与该组所有评酒员评分的均值的偏差进行了分析,偏差不稳定的点就成为噪声点,表明此次评分不稳定。
然后我们用两组评酒员评分的偏差的方差衡量评酒员的稳定性。
得到第 2 组的方差明显小于第1 组的,从而得出了第2 组评价数据的可信度更高的结论。
对于问题二,我们根据酿酒葡萄的理化指标和葡萄酒质量对葡萄进行了分级。
一方面,我们对酿酒葡萄的一级理化指标的数据进行标准化,基于主成分分析法对其进行了因子分析,并且得到了27 种葡萄理化指标的综合得分及其排序。
另一方面,我们又对附录给出的各单指标百分制评分的权重进行评价,并用信息熵法重新确定了权重,用新的权重计算出27 种葡萄酒质量的综合得分并排序。
最后我们对两个排名次序用基于模糊数学评价方法将葡萄的等级划分为1-5 级。
对于问题三,首先我们将众多的葡萄理化指标用主成分分析法综合成 6 个主因子,并将葡萄等级也列为主因子之一。
对葡萄的 6 个主因子,以及葡萄酒的10 个指标用SPSS 软件进行偏相关分析,得到酒黄酮与葡萄的等级正相关性较强等结论。
地下储油罐的变位分析与罐容表标定摘要加油站地下储油罐在使用一段时间后,由于地基变形等原因会发生纵向倾斜及横向偏转,导致与之配套的“油位计量管理系统”受到影响,必须重新标定罐容表。
本文即针对储油罐的变位时罐容表标定的问题建立了相应的数学模型。
首先从简单的小椭圆型储油罐入手,研究变位对罐容表的影响。
在无变位、纵向变位的情况下分别建立空间直角坐标系,在忽略罐壁厚度等细微影响下,运用积分的方法求出储油量和测量油位高度的关系。
将计算结果与实际测量数据在同一个坐标系中作图,经计算得误差均保持在3.5%以内。
纵向变位中,要分三种情况来进行求解,然后将三段的结果综合在一起与变位前作比较,可以得到变位对罐容表的影响。
通过计算,具体列表给出了罐体变位后油位高度间隔为1cm 的罐容表标定值。
进一步考虑实际储油罐,两端为球冠体顶。
把储油罐分成中间的圆柱体和两边的球冠体分别求解。
中间的圆柱体求解类似于第一问,要分为三种情况。
在计算球冠内储油量时为简化计算,将其内油面看做垂直于圆柱底面。
根据几何关系,可以得到如下几个变量之间的关系:测量的油位高度0h 实际的油位高度h 计算体积所需的高度H于是得到罐内储油量与油位高度及变位参数(纵向倾斜角度α和横向偏转角度β )之间的一般关系。
再利用附表2中的数据列方程组寻找α与β最准确的取值。
αβ一、问题重述通常加油站都有若干个储存燃油的地下储油罐,并且一般都有与之配套的“油位计量管理系统”,采用流量计和油位计来测量进/出油量与罐内油位高度等数据,通过预先标定的罐容表(即罐内油位高度与储油量的对应关系)进行实时计算,以得到罐内油位高度和储油量的变化情况。
许多储油罐在使用一段时间后,由于地基变形等原因,使罐体的位置会发生纵向倾斜和横向偏转等变化(以下称为变位),从而导致罐容表发生改变。
按照有关规定,需要定期对罐容表进行重新标定。
题目给出了一种典型的储油罐尺寸及形状示意图,其主体为圆柱体,两端为球冠体。
2012年数学建模A题葡萄酒的评价论文[定稿]第一篇:2012年数学建模A题葡萄酒的评价论文[定稿]葡萄酒的评价一,摘要二,问题重述葡萄酒质量的评定一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?三,问题分析三,模型假设1,白葡萄酒样品3数据有明显错误,建模过程中涉及白葡萄酒样品3都不予考虑;四,符号规定及说明五,模型求解(一)求解问题一模型1 方差分析法感官评价专家组成员的异质性及其原因表一列出了由10名葡萄酒品酒员,采用国际葡萄与葡萄酒的评价方法.对27(个白葡萄酒样品的感官评价结果。
采用加分制。
即得分越高的样品,感官评价质量越高。
将品酒员看成不同的“区组”.对表1的结果行双向方差分析以减少误差方差.同时分析不同品酒员之间是否存在差异。
分析结果表明,由于品酒员之间存在显著性差异.根据两组数据离平均值分散范围的大小,可以得到第二组人员的可信度高。
但是由于各人评价尺度的差异、评价位置的差异、评价方向的差异的客观存在,使得我们得到的这个白葡萄酒品酒品酒品酒品酒品酒品酒品酒品酒品酒品酒样品员1 员2 员3 员4 员5 员6 员7 员8 员9 员1085 80 88 61 76 93 83 80 95 79 2 78 47 86 54 79 91 85 68 73 81 4 75 77 80 65 77 83 88 78 85 86 5 84 47 77 60 79 62 74 74 79 74 6 61 45 83 65 78 56 80 67 65 84 7 84 81 83 66 74 80 80 68 77 82 8 75 46 81 54 81 59 73 77 85 83 9 79 69 81 60 70 55 73 81 76 85 10 75 42 86 60 87 75 83 73 91 71 11 79 46 85 60 74 71 86 62 88 72 12 64 42 75 52 67 62 77 56 68 70 13 82 42 83 49 66 65 76 62 65 69 14 78 48 84 67 79 64 78 68 81 73 15 74 48 87 71 81 61 79 67 74 82 16 69 49 86 6570 91 87 62 84 77 17 81 54 90 70 78 71 87 74 92 91 18 86 44 8371 72 71 85 64 74 81 19 75 66 83 68 73 64 80 63 73 77 20 80 68 82 71 83 81 84 62 87 80 21 84 49 85 59 76 86 83 70 88 84 22 65 48 90 58 72 77 76 70 80 74 23 71 66 80 69 80 82 78 71 87 75 24 82 56 79 73 67 59 68 78 86 85 25 86 80 82 69 74 67 77 78 77 81 26 75 66 82 75 93 91 81 76 90 84 27 58 40 79 67 59 55 66 74 73 77 28 66 75 89 69 88 87 85 76 88 90 表一:第一组人员对白葡萄酒样品的评分通过上述分析.可以认为在感官评价中.每个品酒员都是“分析仪器”.而且它们有各自的准确度和精确度。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍,期刊和其他媒体进行正式或非正式发表等。
)我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话): A1618 所属学校(请填写完整的全名):福州大学参赛队员 (打印并签名) :1.2.3.指导教师或指导教师组负责人 (打印并签名):日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要本文要解决的是葡萄酒的评价问题,我们利用数理统计的知识,包括显著性差异检验、主成分分析、聚类分析、典型相关分析、逐步线性回归分析等建立数学模型,分别求解。
问题一,由题意知,要分析两组评酒员的评价结果有无显著性差异,需应用《概率统计》中的假设检验知识以及spss 软件中关于两个总体均值的假设检验。
检验结果表明,对于红葡萄酒,由于t >Pr 的值为05.0019.0<,故拒绝原假设0.H ,认为两个红葡萄酒样本总体的均值不相等,同理,对白葡萄酒,t >Pr 的值为05.0017.0<,认为两个白葡萄酒样本总体的均值不相等。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):A1614所属学校(请填写完整的全名):福州大学参赛队员(打印并签名) :1. 黄剑飞2. 夏李波3. 钱斌海指导教师或指导教师组负责人(打印并签名):日期: 2011 年 9 月 11 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):城市表层土壤重金属污染分析摘要本题主要通过对重金属污染浓度的分析,画出浓度的空间分布图,建立相关的模型,得出该地区的重金属污染程度、污染原因以及污染源的所在位置。
针对不同重金属具有不同的污染源,对不同区域重金属元素浓度值进行分析。
运用克拉格差值法,画出各重金属的浓度等高线图。
从水平和垂直方向考虑浓度分布,在水平面与海拔上对金属浓度分别分析,得出在三维空间内浓度的分布状况。
考虑到区域内各种重金属元素污染程度,及不同区域内元素的综合污染状况不同,先运用地积累法,对各区域内不同元素分别考虑其污染程度,再对每个区域用内梅罗综合污染指数法得出该地区综合污染程度。
根据给出的样本数据对各种重金属元素之间的相关性进行分析,得出相关性矩阵,对于相关性比较明显的重金属,我们可以认为其来源大致相同,即有相同的污染源。
葡萄酒的评价摘要本文以葡萄酒的评价为研究对象,对葡萄酒的质量进行分析。
通过运用配对样本t检验]1[]2[、K-均值聚类]3[和对比分析的方法,解决了与葡萄酒相关的问题。
对于问题一:分析两组评酒员的评价结果有无明显差异,且哪组更可信。
由于附件一中的数据过于庞杂,所以对数据进行了平均值处理。
然后利用配对样本t检验的显着性P值来比较,最终可以得出第二组更为可靠。
对于问题二:根据所酿酒葡萄的理化指标和质量对酿酒葡萄进行分级。
因为附件二中的理化指种类标过于繁多,所以对理化指标做了随机选取性处理。
然后利用K-均值聚类分析的方法,将葡萄进行分类。
最后,可以得出酿酒葡萄的等级。
对于问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系。
在众多指标数据中随机选取酿酒的红、白葡萄和红、白葡萄酒的理化指标数据。
然后利用SPSS 软件对所选数据进行散点图的绘制。
最后通过运用MATLAB软件绘制拟合曲线。
通过散点图与拟合曲线图的比较可以得到酿酒葡萄与葡萄酒的理化指标之间的联系。
对于问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
在繁杂的数据中利用随机选取的方法对数据进行挑选,并与其相对应的质量一起利用MATLAB软件进行拟合曲线的绘制。
最后通过对拟合曲线的分析,可以得出理化指标对质量的影响。
关键词:葡萄酒平均值聚类分析拟合曲线一、问题重述1.1问题背景确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
1.2问题条件附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
1.3需要解决的问题问题一:两组评酒员的评价结果有无显着性差异,哪组更可信;问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级;问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系;问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量;二、模型假设1.假设每位评酒员都是公平、公正的;2.假设给两组评酒员的各样品都是同样的;3.假设所给的所有数据都真实有效;4.假设酿酒的工艺差别等其他外界条件不影响葡萄酒的质量;5.假设所有评酒员在除去自身品酒水平以外,其他条件相同;三、符号说明为了便于问题的求解,我们给出以下符号说明:四、问题分析葡萄酒在生活中也是常见的一种酒。
因为每个人的喜好不同,所以葡萄酒会有各种不同的种类。
对这些不同种类的葡萄酒的质量我们请评酒员对此做出了评价。
对于问题一:分析附件一中两组评酒员的评价结果有无显着性差异,且哪组更可信。
对于这个问题,我们选择采用SPSS软件中的配对样本t检验这种方法。
首先应对附录一中的各个数据进行整理。
求出附录一中四个表的10个评酒员对各个样品酒评价分数的平均值,并将这四组平均值进行分类后和样品酒编号对应起来放在Excel表中。
最后利用SPSS软件对这两组数据中的显着性进行观察,从而判断评出酒员的评价结果有无显着性差异。
对于哪组更可信这个问题可以通过比较最终结果表中的方差来判断。
对于问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
对于这个问题,我们选择采用SPSS软件中的K-均值检验这种方法。
首先应对在附件二中对数据进行舍取,并将整理后的数据放在Excel中。
最后利用SPSS 软件对这组数据进行K-均值聚类。
最后通过整理聚类后的结果列出等级表。
对于问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系。
对于这个问题,我们选择对比分析的方法。
首先将附件二中酿酒的红、白葡萄和红、白葡萄酒的理化指标整理出来后放入Excel 中,利用SPSS 软件对所选数据进行散点图的绘制。
再通过运用MATLAB 软件绘制拟合曲线。
最后通过对散点图和拟合曲线的对比分析得出结果。
对于问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
对于这个问题,我们选择对比分析的方法。
首先将酿酒的红、白葡萄和红、白葡萄酒的理化指标中选取出的理化指标整理出来后放入Excel 中,利用MATLAB 软件对所选数据绘制拟合曲线,最后通过对散点图和拟合曲线的对比分析得出结果。
五、模型的建立与求解经过以上对题目和问题的分析和准备,将进一步阐述模型的实际建立过程和求解。
5.1异常数据处理在假设中提到数据要真实有效,所以在处理数据前要对所给数据进行检查。
当数据中出面漏写、填多等失误时,采取平均值法。
就是将该项的平均值求出后填入所失误的位置,以此来减少误差。
在对第一组白葡萄酒的数据中的样品3进行评价时,第七个评酒员在持久性的评价中出现了异常。
对异常数据进行处理:①其中,Y 为样品3中持久性的平均值;()10,..,2,1=k y k 为第几个评酒员。
在对第一组红葡萄酒的数据中的样品20进行评价时,第四个评酒员在色调的评价中出现了异常。
对异常数据进行处理:②其中,X 为样品20中色调的平均值;()10,..,2,1=j X j 为第几个评酒员。
5.1.1模型一的建立与求解题中的附录一给出了27样红葡萄酒和28样白葡萄酒,且有每组10个评酒员分别对红、白葡萄酒进行评价的分数等数据。
利用这些数据对这两组数据进行处理,从而判断有无显着性差别和哪组更好。
5.1.2显着性模型的建立 (1)数据处理、求取平均值先对附录一中的第一张表格(第一组红葡萄酒)进行处理。
这组红葡萄酒共有27种样品,且这10个评酒员分别需要对这27种红葡萄酒进行评分,所以可以先对各样品中小指标的分数进行求和,算出每个人对各样品的评价分数。
然后将这些分数和对应的样品放入Excel 表中。
并将这10个评酒员对各个样品的分数进行求和取平均值,从而得到27个与样品对应的平均值。
用同样的方法可以得到其他三个表中的平均值。
其中,两组葡萄酒的平均值为表1:表一两组葡萄酒的平均值(2)数据导入在算出四张表中每个样品所对应的平均值后,将第一组的红葡萄酒和第二组的红葡萄酒中的葡萄酒样品、每个样品所对应的平均值放在一个新的Excel 表格中,并注释好每一列的名称。
用同种方法也可以得到第一组白葡萄酒和第二组白葡萄酒的新表格。
5.1.2模型的求解先将第一组红葡萄酒与第二组红葡萄酒所建的新表格导入SPSS 软件中。
通过运用SPSS 软件中的配对样本t 检验可以对两总体均值差的原假设写成:①其中1V 、2V 代表配对样本的总体,都是未知的。
选择检验统计量并给出统计量的分布。
假设总体服从正太分布,检验统计量是t 统计量,其构成为:②在总体差的样本均值和修正样本标准差中: ③④当原假设为真时,()1~-n t t 。
SPSS 软件会根据样本观测值自动计算t 统计量的观测值,并根据统计量的分布自动计算统计量观测值发生的概率(p 值)。
其中,第一组与第二组红葡萄酒的显着性概率为表2;第一组与第二组白葡萄酒的显着性概率为表3:(代码见附录一)表2第一组与第二组红葡萄的显着性表3第一组与第二组白葡萄的显着性观察表可知:在表1中可得000.0 P ,因为当P 值(配对总体差显着性)小于0.05时,说明配对总体间均值有显着差异,反之无明显差异。
由此可以得出: a. 对于红葡萄酒的评分有显着性差异; b. 对于白葡萄酒的评分无显着性差异; 5.1.3优劣性评价模型的建立与求解在通过SPSS软件得出P 值得同时,也会出现这两组中红、白葡萄各自的方差。
比较这些方差可以选出哪组更可信。
其中,两组各自红葡萄酒的方差为表4、两组各自白葡萄酒的方差为表5。
表4两组各自红葡萄酒的方差表5两组各自白葡萄酒的方差观察表可知:第一组红葡萄酒的方差3503.71=S ;第二组红葡萄酒的方差9780.32=S ; 第一组白葡萄酒的方差201.53=S ;第二组白葡萄酒的方差5137.24=S ; 由此数据可知:21S S ;43S S ;因为只有在方差越小时它的可行度才越高,所以我们得出第二组的更可信。
5.2模型二的建立与求解在同样稳定的制造工艺下,不同的酿酒葡萄会酿出不同质量的酒。
因此可以对酿酒葡萄的质量进行等级分类。
(1)数据舍取从香气、外观、口感、保鲜度这四个角度考虑,选取了白黎芦醇、果皮颜色、黄酮醇、单宁这四个具有代表性的指标作为检验的数据。
(表见附录二) (2)数据的导入在进行数据的舍取整理后,将这些新数据放入Excel 中,并标注好表头。
最后将该表导入SPSS 软件中。
在SPSS 软件中运用K-均值聚类检验,首先对导入数据进行处理,从而得到酿酒葡萄的分类等级。
通过聚类分析的原理:定义i D 与j D 之间的距离为两类最近样品的距离:⑤设类q D 与p D 合并成一个新类记为r D ,则任一类n D 与r D 的距离为: ⑥⑦最短距离法进行聚类分析的步骤如下:(a )计算样品的两两距离,得一距离阵记为()0F ,开始每个样品自成一类,这时ij ij f F =。
(b )找出最小距离,设为qp F ,则将q D 和p D 合并成一个新类,记为r D ,即{}p q r D D D ,=。
(c )按上式计算新类与其他类的距离。
(d )重复(b )、(c )两步,直到所有元素并成一类为止。
如果某一步距离最小距离不止一个,则对应这些最小距离的类可以同时合并。
模型求解结果:按评分从高到底,将红、白葡萄酒依次分为优秀、良好、较差这三个等级。
红葡萄等级如表6所示:(代码见附录三;表见附录四)表6红、白葡萄等级5.3模型三的建立与求解因酿酒葡萄的理化指标与葡萄酒的理化指标的不同,可以研究这两类的理化指标有什么联系。
1)数据的选取与整理在附件二中酿酒的红葡萄的理化指标和红葡萄酒的理化指标从附件中导出来放入Excel表中。
同理,将酿酒的白葡萄和白葡萄酒的理化指标放入另一个表(其中单宁的指标表见附录五)。
2)散点图的绘制将处理好的两张理化指标表分别导入SPSS软件中,通过Geaphs→LegacyDialogs→Ineractive→Scatterplot对这两张表进行散点图绘制。
3)拟合曲线的绘制将处理好的两张理化指标表分别导入MATLAB中,在workspace中出现data 数据即为理化指标表中的数据,然后利用MATLAB绘制拟合曲线图。
基于散点图和拟合曲线的基础上,将酿酒的红、白葡萄和红、白葡萄酒的理化指标绘制好的散点图与拟合曲线放在一起进行比较分析。
其中,红葡萄酒的白黎芦醇为图1;花色苷为图2;总酚为图3;单宁为图4;白葡萄酒的单宁为图5;总酚为图6;白黎芦醇为图7。