葡萄酒评价论文
- 格式:docx
- 大小:234.48 KB
- 文档页数:31
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012年 9月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些物质都是人体必须补充和吸收的营养品。
目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。
葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。
本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。
对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。
对于本题,我们主要采用SPSS软件对模型进行求解。
针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。
MATLAB·设计论⽂葡萄酒质量评价的数学建模葡萄酒质量评价的数学建模摘要:关于葡萄酒质量的评价,通常是通过评酒员的打分来确定的。
本论⽂通过对酿酒葡萄与葡萄酒的理化指标之间的相关关系和评酒员打分进⾏了深⼊系统地分析,给出了葡萄酒质量评价的量化研究。
基于相关数据,利⽤配对的t(α=0.05)检验、克隆巴赫系数信度分析、主成分分析、模糊C均值聚类、多元回归等⽅法,对酿酒葡萄质量评级模型,酿酒葡萄与葡萄酒之间的典型性相关分析关系模型等,并通过图像与数据分析研究了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。
对于问题⼀,利⽤配对数据的t检验,我们得出两组评酒员的评价结果没有显著性差异,并应⽤克伦巴赫系数信度分析法分别求出两组评酒员评价结果的可信度,通过数据⽐较和分析得到第⼀组评酒员的评价结果更可信,更符合实际。
对于问题⼆,基于数据,本⽂⾸先根据第⼀问中确定的的可信的⼀组(第⼀组评酒员)根据附表⼀对葡萄酒品尝后得出的总分,确定葡萄酒的质量,从⽽相应的给酿酒葡萄进⾏⼀个初步的排名。
然后对附表⼆中的酿酒葡萄的理化指标进⾏标准化处理后,进⾏主成分分析,根据新变量进⾏排名。
最后采⽤模糊C均值聚类⽅法对酿酒葡萄的理化指标进⾏了聚类分析,同时结合葡萄酒的质量得分,我们最终确定了酿酒葡萄的三级评判⽅案。
对于问题三,我们将酿酒葡萄与葡萄酒的理化指标做了多元回归,将酿酒葡萄与葡萄酒的主要指标做了典型相关系数的检验,结果表明:酿酒红葡萄中氨基酸总量、花⾊苷、苹果酸、褐变度、DPPH⾃由基、总酚、单宁、葡萄总黄酮、还原糖、PH值、果⽪颜⾊等对红葡萄酒中主要成分有显著影响;酿酒⽩葡萄中氨基酸总量、单宁、葡萄总黄酮、黄酮醇、⼲物质含量、出汁率,对⽩葡萄酒中主要成分有显著影响。
对于问题四,我们把葡萄的理化参数、葡萄酒的理化参数作为⾃变量,对酒的评价作为因变量,通过⽤MATLAB中plot作图,分析了酿酒葡萄与葡萄的理化指标之间的关系,得出结论:葡萄酒与葡萄酒的理化指数存在关系,但是葡萄酒的质量与其⾊泽、品味、环境以及⼝感有关系,所以并不能⽤葡萄和葡萄酒的理化指数指标来评价葡萄酒的质量。
答卷编号(参赛学校填写):答卷编号(竞赛组委会填写):论文题目:A组别:本科生参赛队员信息(必填):参赛学校:黑龙江八一农垦大学答卷编号(参赛学校填写):答卷编号(竞赛组委会填写):评阅情况(学校评阅专家填写):学校评阅1.学校评阅2.学校评阅3.评阅情况(联赛评阅专家填写):联赛评阅1.联赛评阅2.联赛评阅3.摘要葡萄酒是世界上三大酒种之一,葡萄酒的准确评价和理化指标的评测对我国葡萄酒产业崛起有着重要意义,本文针对葡萄酒的评价问题进行了建模、求解和分析。
对于问题一,为了评价评酒员的评价结果是否有显著性差异,首先,对数据进行整理,利用SPSS软件做方差分析和配对样品T检验。
得出两配对样品的P值分别为0.028 、0.026,均小于0.05,因此具有显著性差异。
其次,为了解决可信度问题,通过建立评价差异指数,即以评价葡萄酒的各属性的总分的百分比为权重,乘以其对应的方差并求和。
得两组评酒员对红白葡萄酒的评价差异指数为:2.3498>1.6159;3.5313>1.9899。
因此有第二组评酒员在葡萄酒评价中可信度高。
对于问题二,基于问题一得到的结论,建立了酿酒葡萄品质的综合评价模型。
首先,对数据指标进行归一化处理,并计算出酿酒葡萄与各指标因素间的相关系数。
然后,采用层次分析法确定了各指标因素的权重。
最后,利用确定的权重,建立了酿酒葡萄品质的综合评价模型,对葡萄进行分级,分别为优质,较好,普通,劣质。
对于问题三,需要分析酿酒葡萄与葡萄酒的理化指标之间的联系,即是要分析两组随机变量之间的相关性关系,考虑运用多元统计分析中的典型相关分析法进行求解。
首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
然后选取和最初挑选的这对线性组合不相关的性组合,使其配对,并选取相关系数最大的一对,如此继续下去,直到两组变量之间的相关性被提取完毕为止,从而最终求得酿酒葡萄与葡萄酒的理化指标之间的相关关系。
葡萄酒论文篇一:葡萄酒论文湖南农业大学课程论文学院:理学院班级:10级应用化学2班姓名:韩跃学号:20xx40205231课程论文题目:小谈生活中该懂的葡萄酒知识课程名称:葡萄与葡萄酒文化评阅成绩:评阅意见:成绩评定教师签名:日期:年月日小谈生活中该懂的葡萄酒知识学生:韩跃(理学院10级应用化学2班,学号:20xx40205231)摘要:随着时代的迅猛发展,我们逐步走向小康,小资。
人类更加注重生活的质量和品位。
酒文化在中国源远流长,不少文人学士留下了斗酒、写诗、作画、养生、宴会、饯行等酒神佳话。
酒作为一种特殊的文化载体,在人类交往中占有独特的地位。
而今葡萄酒的发展前景越来越好,它不仅是餐桌上的浪漫点缀,也是生活中不可缺少的健康饮品。
关键词:葡萄酒、基础知识、发展史、导入语:葡萄酒是国际上仅次于啤酒的第二大饮料酒,是发展潜力相当大的一个酒种, 仔细地了解葡萄酒及其发展历程会扩大我们的知识面,帮助我们提高鉴赏水平。
一、走进葡萄酒——葡萄酒小常识现在葡萄酒在世界各地都十分畅销,人们慢慢的接受喜爱上了葡萄酒,便深入地了解葡萄酒,以下是葡萄酒的一些基础知识。
(一)、葡萄酒定义按酿酒方法分类可将酒分为:1,酿造2,蒸馏3,配制酿造酒:是原料经发酵酿制而成,但未经过深加工的酒,也称原汁酒,一般酒精含量不高。
葡萄酒:是以葡萄为原料,经榨汁发酵酿制而成的原汁酒,酒精含量大约在9.5°-13°之间。
葡萄酒是经过发酵的葡萄汁(二)、葡萄酒的种类:(按照生产工艺)1-无汽酒(餐酒)Still Wine1〉红酒Red Wine 2〉白葡萄酒White Wine 3〉玫瑰红葡萄酒Rose Wine 1〉红葡萄酒:红葡萄酒是红皮或紫皮葡萄连皮带籽一块发酵并压榨成汁,使果实中的色素染入酒液中间再去皮渣酿造而得出的葡萄酒,酒液呈紫红色,鲜红色或宝石红〈含单宁酸较重,故保存期较长〉。
——花都加本力苏维翁20xx,张裕解百纳,华夏长城等均有生产此类葡萄酒 2〉白葡萄酒:白葡萄酒是用白皮或青皮葡萄,也有用的紫皮白肉葡萄,压榨成汁,先除去皮种籽,再用葡萄汁发酵酿制而成的葡萄酒,酒液呈金黄色,淡黄色或近似无色〈单宁酸含量较轻,故保存时间短。
基于理化指标统计分析的葡萄酒质量评价的论文基于理化指标统计分析的葡萄酒质量评价的论文1.问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
通过给定的得分及理化指标数据解决下列问题:(1)分析两组评酒员的评价结果有无显著性差异,哪一组结果更可信?(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。
(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2.问题分析与预备知识2.1问题一利用SPSS等统计软件对评价结果进行数据分析,并采用计算均值、T-检验的方法进行计算分析,用以评判两组评酒员评价结果的差异性,从而判断评价结果可信性。
T-检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
当总体分布是正态分布,如总体标准差a未知且样本容量n<30,那么样本平均数与总体平均数的离差统计量呈t分布。
检验统计量为:其中,t为样本平均数与总体平均数的离差统计量,无为样本平均数,/x 为总体平均数,ax为样本标准差,n为样本容量。
2.2问题二在第一问的基础上,选取第二组评酒师对红白葡萄酒的评价结果平均值作为标准,先通过主成分分析法将问题简化,从而便于排序与分类,再使用聚类分析对主成分的特征向量进行分析。
最后参考酒类等级建立标准W,并使用数据分析结果支持结论。
2.3问题三根据第二问分级结果,使用SPSS软件对葡萄酒和葡萄的主要理化指标进行相关性及多元回归分析[51,从而确定酿酒葡萄与葡萄酒理化指标之间的联系。
2.4问题四根据葡萄酒评价结果与葡萄酒及酿酒葡萄主要理化指标间的关系,筛选出对葡萄酒的分有重要影响的指标,然后做多元线性回归分析,并通过数据带入对比检验后,用得出评价葡萄酒质量的公式。
葡萄酒的文化、品质与鉴赏XX经济管理学院 201X级会计学专业12班学号:XXXXXX 联系电话:XXXXXXXXXXX摘要:法国著名化学家马丁·夏特兰·古多华(1772-1838)曾说过:“酒反映了人类文明史上的许多东西,它向我们展示了宗教、宇宙、自然和生命.它是涉及生与死、美学、社会和政治的百科全书。
”杯酒人生,酒已经涉及我们的生活,已经贯穿我们的人生。
品味红酒如同品味人生,其中的滋味只有尝试了才会明白红酒给你带来的,不仅仅是情调,还有高贵、浪漫和健康。
葡萄酒发展至今,品种繁多,文化博大精深。
学习西式食品鉴赏—葡萄酒,那么我们应该怎么了解葡萄酒,知道葡萄酒所蕴含怎么样的文化,如何看葡萄酒的品质和鉴赏葡萄酒优劣呢?关键字:葡萄酒,酒文化,酒品质,酒鉴赏葡萄酒是指以新鲜葡萄或葡萄汁为原料,经全部或部分发酵酿制而成、酒精度(体积分数)大于等于7%的酒精饮品。
葡萄酒种类葡萄酒以成品颜色来说,可分为红葡萄酒、白葡萄酒及粉红葡萄酒三类。
其中红葡萄酒又可细分为干红葡萄酒、半干红葡萄酒、半甜红葡萄酒和甜红葡萄酒。
白葡萄酒则细分为干白葡萄酒、半干白葡萄酒、半甜白葡萄酒和甜白葡萄酒。
以酿造方式来说,可以分为葡萄酒、气泡葡萄酒、加烈葡萄酒和加味葡萄酒四类。
葡萄酒历史传说传说古代有一位波斯国王,爱吃葡萄,曾将葡萄压紧保藏在一个大陶罐里,标着“有毒”,防人偷吃。
等到数天以后,国王妻妾群中有一个妃子对生活发生了厌倦,擅自饮用了标明“有毒”的陶罐内的葡萄酿成的饮料,滋味非常美好,非但没结束自己的生命,反而异常兴奋,这个妃子又对生活充满了信心。
她盛了一杯专门呈送给国王,国王饮后也十分欣赏。
自此以后,国王颁布了命令,专门收藏成熟的葡萄,压紧盛在容器内进行发酵,以便得到葡萄酒。
葡萄酒功效葡萄的营养很高,而以葡萄为原料的葡萄酒也蕴藏了多种氨基酸、矿物质和维生素,这些物质都是人体必须补充和吸收的营养品。
已知的葡萄酒中含有的对人体有益的成分大约就有600种。
葡萄酒生产工艺介绍:红葡萄酒的酿造红葡萄酒必须由红葡萄来酿造,品种可以是皮红肉白的葡萄,也可采用皮肉皆红的葡萄。
酒的红色均来自葡萄皮中的红色素,绝不可使用人工合成的色素。
红葡萄酒的酿造方法有很多,共同特点都是去梗、压榨,再将果肉、果核、果皮统统装进发酵桶中发酵,发酵过程中酒精发酵和色素、香味物质的提取同时进行。
发酵桶或罐都需要先用低剂量的二氧化硫处理,以预防微生物污染。
葡萄汁在大桶中发酵生成酒精的同时,果皮和果肉经过在葡萄汁中浸泡,5-7天内便释出葡萄酒的色素和耐久的劲力(劲度)。
红葡萄酒的酿造方法一般为传统发酵法(另还有旋转罐法、二氧化碳浸渍法、热浸提法和连续发酵法)。
其酿制过程是:工艺流程图采摘的葡萄运达酒厂后→破碎(使果肉和果汁从葡萄中分离)→除梗(去除果梗的青稞味)→第一次发酵(发酵过程中葡萄皮中的单宁和红色素就会渗入发酵中的葡萄汁里称为浸渍。
浸渍时间一般4-5天或2-3周,根据红酒的不同类型而定。
酿造单宁含量较低、较柔顺易入口的“新酒”,浸渍时间会很短;酿造可长期收藏的红酒,因需要足够的单宁,浸渍时间则需延长。
)→从发酵罐中抽取自然流出的酒液(滴出酒)→压榨葡萄渣(以取得更多单宁酸的压榨酒)→小心混合(调配)自流酒与压榨酒→醇化(即乳酸发酵或称后发酵,把酒中酸涩的苹果酸转变成较柔顺且稳定的乳酸)→澄清(沉淀、分离及精滤)→陈酿(在大酒桶中贮藏6个月至2年)→装瓶(早期饮用的酒在采摘2-6个月后装瓶,陈酿的在转桶2年后装瓶)优良的干红葡萄酒应具有以下特点:(1)有自然宝石红色、紫红色、石榴红色等。
(2)有该品种干红葡萄酒的典型性。
这取决于葡萄的完好性和成熟情况,一般葡萄汁的相对密度至少在1.090-1.096的条件下,才能形成。
(3)葡萄酒含酸量应在5.5-6.5g/l,最高不应超过7.0g/l。
(4)葡萄酒中单宁含量少,不应使葡萄酒产生收敛过涩的感觉(在发酵过程中,渣与酒接触时间长,酒中会溶入一部分单宁)。
内容摘要葡萄酒是一个传统的产业,其历史和人类文明的历史一样漫长,人类早在5000多年前就已经饮用葡萄酒;葡萄酒也是一个朝阳产业,具有旺盛的生命力。
特别是在中国,葡萄酒产业面临着重大发展机遇,拥有广阔的发展空间,是成长性最好、发展最快的行业之一。
随着经济一体化进程的加快,国内各类葡萄酒企业纷纷与国外品牌开展多层次的小产区经营,这已经成为一种潮流,更是今后葡萄酒业发展的必然趋势。
葡萄酒的营销模式也将随之改善发展。
关键字:朝阳产业小产区经营营销模式一、葡萄酒产业的发展现状及机遇(一)当前葡萄与葡萄酒产业面临着重大发展机遇葡萄酒是一个传统的产业,其历史和人类文明的历史一样漫长,人类早在5000多年前就已经饮用葡萄酒;葡萄酒也是一个朝阳产业,具有旺盛的生命力。
特别是在中国,葡萄酒产业面临着重大发展机遇,拥有广阔的发展空间,是成长性最好、发展最快的行业之一。
在全国100个工业行业利税率排名中,葡萄酒排第7位。
2004年,我国葡萄酒产量36.73万吨,同比增长14.7%;销售收入74.34亿元,同比增长17.06%。
高额的回报率,吸引越来越多的企业介入其中,葡萄酒产业已成为国内新的投资热点。
特别是随着经济的发展和消费者收入的增加,葡萄酒消费将有更大的发展空间,葡萄及葡萄酒产业面临新的发展机遇。
一是消费结构升级的机遇。
目前,我国人均GDP已突破了1000美元,消费结构开始大幅度、快速升级。
消费结构升级最明显的变化就是表现在酒、饮料等饮食消费上,葡萄酒需求量也与日俱增,表现尤为突出。
从1997年到2004年,全国葡萄酒消费量从10多万吨增加到36.7万吨,增长速度非常快。
但对比发达国家,中国葡萄酒总量不足美国、澳大利亚等国家一家企业的年产量,特别是人均指标,差距更大。
世界葡萄酒人均消费量为7.6升,欧洲主要葡萄酒生产国人均葡萄酒消费量达到60升,而我国人均葡萄酒消费量为0.5升,仅为世界平均水平的1/15、欧洲平均水平的1/120,距离国家有关部门预计的人均消费1.5升的远期规划相去甚远,拥有广阔的发展空间。
题目:葡萄酒的评价摘要关键词:可信度分析,K-S正态性检验,配对样本t检验,kruskal-wallis检验,主成分分析一、问题重述1.1背景为确定一批红葡萄酒的质量,现聘请两组评酒师对其进行品评及按分类指标打分。
求和得到的总分便是红葡萄酒的质量。
红葡萄酒是由葡萄皮和果肉综合酿造得到的,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
1.2需要解决的问题我们尝试通过三个附件所给出的数据,建立数学模型讨论以下问题:问题(1):分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?问题(4):分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、模型分析2.1问题(1)的分析题目要求我们根据两组评酒员对27种红葡萄酒的10个指标相应的打分情况进行分析,并确定两组评酒员对葡萄酒的评价结果是否有显著性差异,然后判断哪组评酒员的评价结果更可信。
初步分析可知:由于评酒员对颜色、气味等感官指标的衡量尺度不同,因此两组评酒员评价结果是否具有显著性差异应该与评价指标的类型有关,不同的评价指标的显著性差异可能会不同。
基于以上分析,我们可以分别两组品尝同一种类酒样品的评酒员的评价结果进行两两配对,分析配对的数据是否満足配对样品t检验的前提条件,而且根据常识可知评酒员对同一种酒的同一指标的评价在实际中是符合t检验的条件的。
接着我们就可以对数据进行多组配对样品的t检验,从而对西组评酒员评价结果的显著性差异进行检验。
由于对同一酒样品的评价数据只有两组,我们只能通过评价结果的稳定性来判定结果的可靠性。
而每组结果的可靠性又最终决定于每个评酒员的稳定性,因此将问题转化为对评酒员稳定性的评价。
2.2问题(4)的分析本题要求我们分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,同时论证能否能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
初步分析可知酿酒葡萄质量的好坏以及葡萄酒理化指标的合理会使醒出的葡萄酒的质量较好。
2016年数学建模论文第三套论文题目:葡萄酒的评价队伍信息:计算141 雷锦电气146罗引航城地142亢佳伟提交时间:2016年7月8日葡萄酒的评价摘要葡萄酒中含有丰富的营养物质,至今多达600种以上的物质被测定出来,之所以葡萄酒有保健和营养价值,是因为葡萄赋予葡萄酒以丰富的糖分和较丰富的矿质元素,尤其是大量元素钾,锌、硒等微量元素对调节人体生理平衡,增强免疫力系统都有很好的作用。
葡萄酒因其特殊的营养的价值和较好的保健效果,越来越受人们欢迎,因此,葡萄酒质量的好坏也备受关注,酿酒葡萄的好坏与葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄酒的质量。
本文主要讨论了关于对葡萄酒质量的评价、酿酒葡萄的分级问题,并且研究了葡萄酒的质量与酿酒葡萄的理化指标之间的关系,进行定量分析并得出合理的评价结果与相关性,最后得出能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。
针对问题1,运用了数理统计学中假设检验的原理,建立了双T检验模型。
由题目所给的数据表分析可知第二组的数据更可靠。
针对问题2,采用了K-均值聚类算法。
首先根据酿酒葡萄与葡萄酒的理化指标可得出对酿酒葡萄进行合理的分级情况,再对理化指标进行相关性分析可以得出酿酒葡萄与葡萄酒质量之间的联系与关系强度的大小,运用了matlab中自带的kmeans函数将酿酒葡萄分成5类。
针对问题3,采用了线性回归分析得出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的相关性,求出回归方程,进而可得葡萄和葡萄酒的理化指标之间的联系。
针对问题4,采用了主成分分析法将酿酒葡萄的理化指标进行简化,求出各主成分的各个理化指标的贡献率,以贡献率为自变量,以酒的得分为因变量进行曲线拟合和相关性分析,即可得出能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。
关键词:双T检验模型聚类算法主成分分析法相关性线性回归一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析本题要讨论的是有关葡萄酒的质量评价的分析问题,题设中共有4个问题。
经过初步的分析可得:对于第一个问题,要分析两组评酒员的评价结果有无显著性差异,显然属于假设检验的内容,由于方差未知并且有两组数据,因此用双T检验法进行比较分析,要确定哪一组的结果更可靠,则通过对它们的方差分析得出。
对于第二个问题,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,由第一问可知,第二组的数据更加可靠,根据葡萄酒的评分对葡萄样品进行等级分类,由于葡萄的理化指标较多,采用主成分分析法和聚类分析法。
对于第三个问题,根据酿酒葡萄和葡萄酒所共有的理化指标之间的关系强度大小进行相关性分析,得到各个理化指标之间的相关关系及其强弱程度,采用线性回归分析法求出回归方程,进而可得葡萄和葡萄酒的理化指标之间的联系。
对于第四个问题,先用主成分分析法将酿酒葡萄的理化指标进行简化,求出各主成分的各个理化指标的贡献率,以贡献率为自变量,以酒的得分为因变量进行曲线拟合和相关性分析,即可得出能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。
三、模型假设1.假设红葡萄酒与白葡萄酒的生产工艺及环境因素的影响都可忽略不计。
2.假设所有样品在取样和检测时都没有人为造成的误差,即附件中所给的数据都是真实可靠的。
3.假设评酒员对样品的一个指标的评价对另一个指标无影响,即对各项指标的评价是相互独立的。
4.假设评酒员的评酒水平基本是稳定的。
5.假设所计算的数据误差都在可接受范围之内。
四、符号说明t--检验统计量n--第一组数据的个数1n--第二组数据的个数2x--第一组数据ii y --第二组数据 x --第1组数据的均值y --第2组数据的均值21s --第一数据的子样方差 22s --第二组数据的子样方差r --相关系数五、模型建立1.对于问题一,采用双T 检验模型进行分析2111n n s yx t w +-=其中:第一组的均值为: ∑==1111n i i x n x第二组的均值为: ∑==2121n i i y n y式中 2)1()1(21222211-+-+-=n n s n s n s w其中:第一组数据的子样方差为: ∑=--=112121)(11n i i x x n s 第二组数据的子样方差为: ∑=--=212222)(11n i i y y n s2.对于问题二,采用主成分分析和聚类分析首先对红葡萄的理化指标数据进行分析,因为理化指标较多,因此采用主成分分析法对指标进行筛选,由于前9个主成分的累计贡献率达到86.278%>85%,则这九个主成分能反映足够的信息,因此选前9个指标作为新的指标,然后根据聚类分析将葡萄酒进行合理的分类。
3.对于问题三,采用相关性分析(1)红葡萄酒的理化指标与红葡萄的理化指标之间的相关性分析∑∑∑===-⋅---=n i ni iiini iy y x x y y x x r 11221)()()()(21121212111)()(∑∑∑∑∑∑∑=======-⋅-⋅-=ni i n i i n i n i i i ni ni ni ii i i y y n x x n y x y x n根据红葡萄酒的理化指标,选出与其对应的红葡萄的理化指标,利用得到两组数据做相关性分析计算相关系数并利用相应软件绘出拟合曲线。
(2)白葡萄酒的理化指标与白葡萄的理化指标之间的相关性分析相关系数的计算及分析思路与(1)相同,根据白葡萄酒的理化指标选出与其对应的白葡萄的理化指标,利用得到的两组数据做相关性分析计算相关系数并作出拟合曲线。
4.对于问题四,采用线性回归分析法,建立相关性模型 (1)相关性系数为:∑∑∑===-⋅---=n i ni iiini iy y x x y y x x r 11221)()()()(21121212111)()(∑∑∑∑∑∑∑=======-⋅-⋅-=ni i n i i n i n i i i n i n i ni ii i i y y n x x n y x y x n(2)做酿酒葡萄的理化指标与葡萄酒质量的相关系性分析根据酿酒葡萄和葡萄酒的理化指标,选择与其相对应的葡萄酒质量的评分,将两者的数据进行相关性分析,计算出相关系数,得出葡萄酒的质量是否与酿酒葡萄和葡萄酒的理化指标相关的结论。
六、模型求解1.(1)经计算可得,对红葡萄酒的评价为: 第一组:平均分x =73.1,方差为 21s =55.97 第二组:平均分y =70.5,方差为22s =16.41 则带入公式解得 =t =1.593)1.0(t <=1.675所以可认为,两组评酒员对红酒的评价无显著性差异。
红葡萄酒评分的均值拟合曲线如下图一所示图一 红葡萄酒评分均值差异比较图 (2) 同理,对白葡萄酒的评价为: 第一组:平均分x =74.3,方差为21s =28.1 第二组:平均分y =76.5,方差为22s =10.5 则带入公式解得 t =-1.874)1.0(t -<=-1.674所以可认为,两组评酒员对白酒的评价有显著性差异。
白葡萄酒评分的均值拟合曲线如下图二所示图二 白葡萄酒评分均值差异比较图对于可信度的分析,建立方差模型,如下图三、图四所示,比较红白葡萄酒的方差,均有 2122s s ,可知第二组评酒员的评分波动较小,因此第二组的评价结果更为可靠。
(3)方差的柱形图分析比较稳定性 (a )红葡萄酒评分的方差柱形图分析图三红葡萄酒评分方差柱形图(b)白葡萄酒的方差柱形图分析图四白葡萄酒评分方差柱形图2.对问题二,先求样本的平均Sil 指标:设)(t a 为聚类j C 中的样本t 与类内所有其他样本的平均不相似度或距离,),(i C t d 为样本t 到另一个类i C 的所有样本的平均不相似度或距离,则j i k i C t d t b i ≠==,,,2,1)},,(m i n {)( 。
Sil 指标计算每个样本与同一聚类中样本的不相似度以及与其他聚类中样本的不相似度,其每个样本t 的计算公式如下:)}(),(max{)()()(t b t a t a t b t Sil -=一般以一个数据集的所有样本的平均Sil 值来评价聚类结果的质量,Sil 指标越大表示聚类质量越好,其最大值对应的类数作为最优的聚类个数。
不同类别对应的平均轮廓值12345670.550.60.650.70.750.80.850.9红葡萄酒kmeans 聚类结果分布图因此根据聚类分析法,应将红葡萄酒以下五个等级: 第1级样品的编号:2 3 17 20第2级样品的编号:4 5 14 19 21 22 24 26 27 第3级样品的编号:1 10 12 13 16 25 第4级样品的编号:9 23第5级样品的编号:6 7 8 11 15 18510152025306062646668707274767880根据红葡萄酒的理化性质分类分类结果第1类中心点:-3.7494该类样品的编号4 8 12 25 27 第2类中心点:7.5562该类样品的编号1 2 3 9 23 第3类中心点:-6.6694该类样品的编号6 7 15 18第4类中心点:-1.1451该类样品的编号14 16 17 19 26第5类中心点:1.6711该类样品的编号5 10 11 13 20 21 22 243.(1)红葡萄酒的理化指标与红葡萄的理化指标之间的相关性分析相关系数的性质如下表一所示两者各理化指标之间相关系数如下表所示51015202530-8-6-4-2024681012由相关系数可知,酿酒葡萄的花色苷、单宁、总酚、总黄酮、自由基与葡萄酒的对应指标呈高度线性相关;两者的色泽L显著性正相关,色泽a*显著负相关;白藜芦醇、色泽b*低度线性相关。
(2)白葡萄酒的理化指标与白葡萄的理化指标之间的相关性分析两者各理化指标之间的相关系数如下表所示由相关系数可知,酿酒葡萄的总黄酮与葡萄酒的对应指标接近高度线性相关;两者的单宁、总酚显著性相关;白藜芦醇、自由基、色泽L*、色泽a*、色泽b*低度线性相关。