基于多元逐步回归分析的葡萄酒理化指标模型研究
- 格式:doc
- 大小:18.50 KB
- 文档页数:6
葡萄酒质量评价的多元统计分析模型承诺书我们细心阅读了中国大先生数学建模竞赛的竞赛规那么.我们完全明白,在竞赛末尾后参赛队员不能以任何方式〔包括、电子邮件、网上咨询等〕与队外的任何人〔包括指点教员〕研讨、讨论与赛题有关的效果。
我们知道,剽窃他人的效果是违犯竞赛规那么的, 假设援用他人的效果或其他地下的资料〔包括网上查到的资料〕,必需依照规则的参考文献的表述方式在注释援用途和参考文献中明白列出。
我们郑重承诺,严厉遵守竞赛规那么,以保证竞赛的公正、公允性。
如有违犯竞赛规那么的行为,我们将遭到严肃处置。
我们授权全国大先生数学建模竞赛组委会,可将我们的论文以任何方式停止公展开现〔包括停止网上公示,在书籍、期刊和其他媒体停止正式或非正式宣布等〕。
我们参赛选择的题号是〔从A/B/C/D中选择一项填写〕: A我们的参赛报名号为〔假设赛区设置报名号的话〕:13224010所属学校〔请填写完整的全名〕:湖北科技学院参赛队员(打印并签名) :1. 黄磊2. 李晓香3. 刘勇为指点教员或指点教员组担任人(打印并签名):钟绍军周志明日期: 2021 年 9 月 10 日赛区评阅编号〔由赛区组委会评阅行停止编号〕:2021高教社杯全国大先生数学建模竞赛编号专用页赛区评阅编号〔由赛区组委会评阅行停止编号〕:全国一致编号〔由赛区组委会送交全国前编号〕:全国评阅编号〔由全国组委会评阅行停止编号〕:葡萄酒质量评价的多元统计剖析模型摘要葡萄酒质量评价通常是依据评酒师的感官目的得分停止评价的,这种方法有很强的客观性,很难失掉一个较为可信的结论。
经过对酿酒葡萄和葡萄酒的理化目的停止检测并据此停止葡萄酒质量的评价,曾经逐渐被社会所采用。
本文针对给定的酿酒葡萄和葡萄酒的理化目的,综合运用统计剖析的基本方法研讨了理化目的之间的因果关系,得出了经过理化目的停止葡萄酒质量鉴定的普通方法。
效果一,评酒员给出的分数主要遭到葡萄的种类、样本集体差异、不同组别、不同评酒员等要素的影响。
葡萄酒的评价摘要本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。
关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。
首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。
然后将第一组10位()评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。
关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。
关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。
关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。
然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。
最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。
关键词:葡萄酒质量的评价EXCEL MATLAB、主成分分析相关系数T-检验1.问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
学术论坛科技创新导报 Science and Technology Innovation Herald226一般来说,要评判葡萄酒的好坏需要聘请一些资深的评酒员进行品评,通过对葡萄酒的澄清度、色调、浓度、纯正度等指标进行分类打分,然后求和得到葡萄酒的总分,对几位评酒员的评分求平均值,来确定葡萄酒的质量。
这种评价方法人为因素较大,有时并不能通过分数来反映葡萄酒真实质量。
所以这种方法具有一定的不科学性,为了避免人为因素的干扰,可以采用更为科学的方法来评判葡萄酒的好坏。
1 逐步回归分析原理逐步回归分析法是指运用回归分析原理采用双检验原则,逐步引入和剔除自变量而建立最优回归方程的优选方法。
逐步回归模型是以已知地理数据序列为基础,根据多元回归分析法和求解求逆紧凑变换法及双检验法而建立的能够反映地理要素之间变化关系的最优回归模型。
由于需要分析酿酒葡萄与葡萄酒的理化指标之间的关系,两者的理化指标都比较繁杂,所以首先考虑对数据进行预处理,最后再通过逐步回归法对他们之间的联系进行分析。
在得到葡萄的理化指标经过相关性分析及聚类分析后的简化指标后,接下来利用因子分析法进一步处理得到主成分与理化指标之间的对应关系同理,利用因子分析法可以对葡萄酒的理化指标进行简化处理,得到主成分与理化指标之间的对应关系因此原问题可以简化为分析葡萄理化指标与葡萄酒理化指标之间的联系。
对于两组变量之间的联系,我们优先选用典型相关性分析,但是由于因子分析下得到的主成分为正交矩阵,这样就消除了每组变量内部间的相关性,因而采用在显著相关性水平检验下的逐步回归法进行分析是比较恰当的。
2 葡萄、葡萄酒理化指标与葡萄酒质量的多元线性回归模型模型的建立与求解首先对模型进行简化,利用葡萄和葡萄酒理化指标因子分析得到的主成分来代表整个指标体系进行建模,进一步可以得到40.66250.031rwine red =+ (1)50.47850.021rwine red =−+ (2)30.3792 6.192-15wwine white E =+ (3)5=0.4132+7.001-16wwine white E (4)8=0.42219.170-16wwine white E − (5)利用SPSS求解可以得到:红葡萄酒质量:10.80110.9952 2.9383 4.2851 1.6Q red red red rwine =−−−++ 1 1.66820.7803 5.3444rwine rwine rwine +++0.2205 2.6266 1.42370.9438 6.4rwine rwine rwine rwine −−+−−8 6.497968.896rwine −+ (6)白葡萄酒质量:20.0953 1.0004 1.0715 1.3601 1.2Q white white white wwine =+−++1 1.21020.3113wwine wwine ++0.83640.27150.00660.77570.9wwine wwine wwine wwine ++−−+70.931876.532wwine ++ (7)对他们分别进行残差分析并可得红葡萄酒质量的回归模型的残差较大,不太适合用来评价红葡萄酒的质量。
多元统计分析在葡萄酒品质评鉴中的应用多元统计分析是一种对大量多变量数据进行统计分析的技术,由数据的统计学推断和形式模型的建立两部分组成,它的基本思想是描述、表达和分析数据之间的关系,以达到深入理解数据背后含义的目的[1]。
在葡萄酒品质评鉴中,多元统计分析可以捕捉到葡萄酒的多种品位特征及其复杂关系,从而更准确地预测品质。
评鉴葡萄酒的品质是一件复杂的事情,有时需要多个葡萄酒参数来评判一种葡萄酒的质量,而这些参数之间可能存在复杂的关系。
这一点可以通过建立多元统计模型来解决。
在多元统计模型中,可以对葡萄酒的台糖含量、酸度、游离氮、乙醇含量、挥发性酸含量、醇度、香气等作为多个变量,进行多变量分析,以便更深入地了解葡萄酒品质之间的复杂关系[2]。
在多元统计分析中,可以运用不同的统计技术来探索此类复杂关系。
有用的技术包括多元回归分析、主成分分析和聚类分析,其中所述的分析技术都可以用于预测葡萄酒品质的优劣。
例如,利用多元统计分析,可以通过观察葡萄酒的理化指标作为依据,结合不同的口感和气味特征,探讨并预测葡萄酒品质的潜在变化趋势[3]。
同时,多元统计分析还可以将葡萄酒品质与微生物组合研究相结合,以进一步了解葡萄酒差异程度,展示出复杂的范围和细节。
经过多元统计技术的分析,可以通过测量几个参数来预测葡萄酒品质,比如以台糖含量、酸度、游离氮、乙醇含量等参数的组合,来评价葡萄酒的质量是否优良,以及该葡萄酒是否有特殊口感和各种其他优势[4]。
因此,多元统计分析可以帮助酿酒者更加准确地评价葡萄酒的品质,以便更快更准确地获取最优质的葡萄酒产品。
综上所述,多元统计分析是一种帮助酿酒者更准确评价葡萄酒品质的有效技术,它通过识别葡萄酒的各项参数之间的复杂关系,可以更有效地预测和预测葡萄酒的品质。
同时,多元统计分析技术也可以结合微生物组合研究,以便更深入了解葡萄酒差异程度,使之更具特色。
因此,多元统计分析在葡萄酒品质评鉴中具有重要的作用,值得酿酒者好好利用。
数学建模经典案例分析以葡萄酒质量评价为例一、本文概述本文旨在通过深入剖析数学建模在葡萄酒质量评价中的应用,展示数学建模的经典案例。
我们将首先简要介绍数学建模的基本概念及其在各个领域的应用,然后聚焦葡萄酒质量评价这一具体问题,阐述如何通过数学建模对其进行科学、客观的分析。
文章将详细分析数据的收集与处理、模型的建立与求解、模型的验证与优化等关键环节,并探讨不同数学模型在葡萄酒质量评价中的优缺点。
我们将总结数学建模在葡萄酒质量评价中的实际应用效果,展望其在未来葡萄酒产业中的发展前景。
通过阅读本文,读者将能够了解数学建模在葡萄酒质量评价中的重要作用,掌握相关数学建模方法和技术,为类似问题的解决提供有益的参考和借鉴。
本文也将促进数学建模在葡萄酒产业中的应用与发展,推动葡萄酒产业的科技进步和产业升级。
二、数学建模基础数学建模是一种将实际问题抽象化、量化的过程,通过数学工具和方法来求解问题的近似解。
在葡萄酒质量评价这一案例中,数学建模提供了从复杂的实际生产环境中提取关键信息,并建立预测模型的可能。
这需要我们具备一定的数学基础,如统计学、线性代数、微积分等,同时也需要理解并掌握数据处理的基本技术,如数据清洗、特征提取和选择等。
在葡萄酒质量评价问题中,我们首先需要收集大量的葡萄酒样本数据,这些数据可能包括葡萄品种、产地、气候、土壤、酿造工艺、化学成分等多个方面的信息。
然后,我们需要对这些数据进行预处理,如去除缺失值、异常值,进行数据标准化等,以提高模型的稳定性和准确性。
接下来,我们可以选择适合的模型进行训练。
在这个案例中,我们可以选择线性回归、决策树、随机森林、神经网络等模型进行尝试。
我们需要根据数据的特性和问题的需求,选择最合适的模型。
同时,我们还需要进行模型的训练和验证,通过调整模型的参数,提高模型的预测能力。
我们需要对模型进行评估和优化。
这可以通过交叉验证、ROC曲线、AUC值等评估指标来进行。
如果模型的预测能力不足,我们需要对模型进行优化,如改进模型的结构、增加更多的特征等。
基于理化指标统计分析的葡萄酒质量评价的论文基于理化指标统计分析的葡萄酒质量评价的论文1.问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
通过给定的得分及理化指标数据解决下列问题:(1)分析两组评酒员的评价结果有无显著性差异,哪一组结果更可信?(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。
(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2.问题分析与预备知识2.1问题一利用SPSS等统计软件对评价结果进行数据分析,并采用计算均值、T-检验的方法进行计算分析,用以评判两组评酒员评价结果的差异性,从而判断评价结果可信性。
T-检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
当总体分布是正态分布,如总体标准差a未知且样本容量n<30,那么样本平均数与总体平均数的离差统计量呈t分布。
检验统计量为:其中,t为样本平均数与总体平均数的离差统计量,无为样本平均数,/x 为总体平均数,ax为样本标准差,n为样本容量。
2.2问题二在第一问的基础上,选取第二组评酒师对红白葡萄酒的评价结果平均值作为标准,先通过主成分分析法将问题简化,从而便于排序与分类,再使用聚类分析对主成分的特征向量进行分析。
最后参考酒类等级建立标准W,并使用数据分析结果支持结论。
2.3问题三根据第二问分级结果,使用SPSS软件对葡萄酒和葡萄的主要理化指标进行相关性及多元回归分析[51,从而确定酿酒葡萄与葡萄酒理化指标之间的联系。
2.4问题四根据葡萄酒评价结果与葡萄酒及酿酒葡萄主要理化指标间的关系,筛选出对葡萄酒的分有重要影响的指标,然后做多元线性回归分析,并通过数据带入对比检验后,用得出评价葡萄酒质量的公式。
科学技术创新2019.30基于相关分析和多元线性回归的葡萄酒质量预测马凯文(兰州大学附属中学,甘肃兰州730030)1概述随着我国经济的飞速发展,人民生活水平不断提高,同时也带动了葡萄酒行业的发展。
中国葡萄酒已经从初级阶段迈入发展阶段。
《2018年葡萄酒市场白皮书》指出:中国葡萄酒市场总量继续保持10%以上的增速,在接下来的5年内,中国将从全球第五大葡萄酒市场成长为仅次于美国的全球第二大葡萄酒市场[1]。
如何使大批量生产的葡萄酒的质量得以保证,成为葡萄酒行业健康稳固发展的根本。
以往在确定葡萄酒质量时一般是通过聘请一批有资质的评酒师对葡萄酒的色、香、味等感官印象进行打分,从而确定葡萄酒的质量。
但由于评酒师的职业水平、个人喜好等因素的不同,他们对同一种葡萄酒的质量评价可能存在一定的差异性[2];且培养一名出色的评酒师需要极高成本,故国内训练有素的专家评酒师数量有限。
介于此,亟需建立一套客观、有效的葡萄酒质量评价体系,实现对葡萄酒质量进行快速、批量的检验。
两个关键因素推动了葡萄酒质量评价研究的发展。
一是先进的检测仪器实现葡萄酒成分的精准检测。
2008年国家葡萄酒质量监督检测中心引进了超高压液相串联四级杆质谱仪,通过检测葡萄酒成分及对应的含量作为特征指标来判断葡萄酒质量[3]。
二是模式识别、数据挖掘技术等技术的日益成熟,为葡萄酒质量评价提供技术支撑。
基于以上分析,本文希望建立一个客观准确的葡萄酒质量预测模型,通过对葡萄酒成分的检测和分析,利用模式识别和数据挖掘技术实现对葡萄酒质量的精准预测。
2研究问题为建立葡萄酒质量预测模型,本文选取了2012年全国大学生数学建模竞赛A 题[4]的部分数据(红葡萄酒的成分指标和对应的评酒师品尝评分)。
首先通过相关分析选取与评价总分最相关的特征指标,然后在选取的特征指标和评价总分之间建立多元线性回归模型,最后根据帕克评分体系分别对评价总分的真实值和预测值进行评级,评级结果的差异可以反映模型预测的正确与否,从而实现由葡萄酒成分对葡萄酒质量的预测能力。
基于数据分析的葡萄酒评价模型摘要本文就葡萄酒的评价问题进行了分析研究,首先对所有评酒员的评分结果采用逐对比较法()1(2-≥=hn t hns hd ht hdα)和双样本t 假设检验法进行分析,然后对葡萄和葡萄酒的理化指标基本数据进行统计分析及无量纲化处理,再对其用主成分分析法(),,2,1,(),(p j i e x z p l ij i j i ij ===λ)、典型性相关分析法、多元线性规划分析法([][]alpha X Y regress stats r b b ,,int,int,,=,int),(r r rcopht )和TOPSIS 法(n j m i a a b mi ijijij ,,2,1,,,2,1,12===∑=)进行相关性分析,最后针对各个问题建立模型求解.针对问题一,我们首先利用EXCEL 对葡萄酒品尝评分表的分数数据进行处理,然后利用MATLAB 软件绘制出所有葡萄酒样品的分数曲线图,因为样本总体相同,i i y x -服从正态分布,采用逐对比较法得到两组红白葡萄酒综合评价的差值,确定出两组评分无显著性差异.再利用双样本t 假设检验方法判断最终得出第二组评酒员的评分结果更可信.针对问题二,我们首先利用EXCEL 及MATLAB 软件对附件二指标总表中的一、二级指标数据分别进行处理,然后利用主成份分析法,用贡献率(),,2,1(1p i pk ki=∑=λλ)对各主成分加权求和,得到样本总得分,由于我们在问题一中已得出第二组评酒员的评分结果更可信,故设样本总得分与第二组数据符合二八原理,计算得到一组综合分数,最终分析确定红葡萄可分为五个等级,白葡萄可分为六个等级.针对问题三,我们首先对酿酒葡萄和葡萄酒的理化指标数据进行预处理,提取两个有代表性的综合变量,再利用典型性相关分析处理得到两组指标之间的整体相关性联系,呈现出对应相关关系.针对问题四,由于在问题三中已得出酿酒葡萄和葡萄酒的理化指标之间存在着整体相关关系,我们首先对附件二指标总表中的数据进行无量纲化处理,然后采用多元线性回归分析得到酿酒葡萄和葡萄酒的理化指标与葡萄酒质量(分数)的线性相关关系,最后利用TOPSIS 法论证确定出不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量.关键字 t 假设检验 无量纲化 主成分分析 典型性相关分析 多元线性规划分析一问题提出1.1问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量.酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量.附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据.请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级.3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系.4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?1.2 问题分析问题要求我们通过研究葡萄酒和酿酒葡萄的理化指标以及葡萄酒的品尝评分,分析评价结果的差异性、可信度,以及酿酒葡萄对葡萄酒质量之间的影响,说明酿酒葡萄与葡萄酒的理化指标之间的关系,确定是否能用葡萄酒和葡萄的理化指标来评价葡萄酒的质量.问题一,根据附件一中两组品酒员对红白两种葡萄酒的评分,利用逐对比较法得出hd,bd,hs,bs,hd,bd,再得出btht,值,在利用双样本均值差t检验法得出两组评价结果有无显著性差异,再对所得数据进行双样本t假设检验方法判断哪组更可信.问题二,根据附件二中酿酒葡萄的理化指标,先对每种含量进行求和再平均,(见附录三表三、表四),然后利用主成分分析法,得出所有成分中的主成分、特征值特征向量以及主成分得分等,最后利用贡献率对主成分得分加权,得出一组得分,将总得分与附件一中二组的数据根据一定的比例进行加权计算,得到总得分,对总得分进行排序,就得到了酿酒葡萄的分级.问题三,针对本问题,先提取两组变量中具有代表性的数据,利用典型性分析,对这些数据建模求解,得到一个整体的相关性.反应酿酒葡萄与葡萄酒理化指标之间的联系.问题四,因为酿酒葡萄和葡萄酒的理化指标之间有联系,所以在考虑他们对葡萄酒质量影响时,可以把它们两个综合起来考虑对葡萄酒质量的影响,即希望能建立一种关系,所以用多元线性回归分析,这样便能得出它们对葡萄酒的质量有否影响.二模型假设1、假设题目所给数据真实可靠.2、假设每组评酒员品的是同一样酒.3、假设附件一中评酒员的评价结果反映了葡萄酒的质量.4、假设葡萄酒样品和葡萄酒一一对应,例如27号红葡萄酒是由27号红葡萄生产而来.5、假设二级指标影响很小,我们可以忽略它的影响.6、不考虑因个人口味、爱好不同对葡萄酒打分的影响,不考虑因环境等不同对葡萄酒和葡萄理化指标的影响.三符号说明x:第一组得分.y:第二组得分.hx:第一组每位品酒师对每个红酒样品各个方面评分的和,即综合评价.bx:第一组每位品酒师对每个白酒样品各个方面评分的和,即综合评价.hy:第二组每位品酒师对每个红酒样品各个方面评分的和,即综合评价.by:第二组每位品酒师对每个白酒样品各个方面评分的和,即综合评价.hd:两组红葡萄酒综合评价的差值.bd:两组白葡萄酒综合评价的差值.hs:hd的标准差.bs:bd的标准差.hd:hd的平均值.bd:bd的平均值.hn:红葡萄酒样品个数,即27.bn:白葡萄酒样品个数,即28.四模型建立与求解问题一1、数据处理利用附件一中的数据,求出每个评酒员对每个酒样评价的综合评分,用MATLAB 对这些数据进行处理,见附录三(表一,表二).2、模型建立我们首先考虑对每个样品的十个综合评分求平均值,用MATLAB作图(见下图),结果不能判断有无显著性差异.然后采用逐对比较法,以红葡萄酒为例:红葡萄酒共有27对相互独立的观察结果:),(,),,(),,(27272211hy hx hy hx hy hx ,令272727222111,,,hy hx hd hy hx hd hy hx hd -=-=-= ,则2721,,,hd hd hd 相互独立,又由于2721,,,hd hd hd 是有统一因素所引起的,可认为他们服从同一分布.今假设i hd ~),(2hd hd N δμ,27,,2,1 =i .这就是说2721,,,hd hd hd 构成正态总体),(2hd hd N δμ的一个样本,其中2,hd hd δμ未知.我们需要基于这一样本检验假设: (1);0:,0:10≠=hd hd H H μμ (2);0:,0:10〉≤hd hd H H μμ (3) ;0:,0:10〈≥hd hd H H μμ分别记2721,,,hd hd hd 的样本均值和样本方差的观察值,hd 2hd s .检验问题(1),(2),(3)的拒绝域分别为(显著性水平为α):)1(2-≥=hn t hns hd ht hdα,)1(-≥=hn t hns hd ht hdα, )1(--≤=hn t hns hd ht hd α.现在回过来讨论本例的检验问题.先做出同一试块分别由y x h h ,测得的结果之差.按题意需检验假设;0:,0:10≠=hd hd H H μμ现在4786.2)26()26(,27005.02===t t h n ε即知拒绝域为4786.2≥=hns hd ht hd.若4786.2〈ht ,则t 的值不落在拒绝域内,故接受0H ,认为两组对红葡萄酒的评分无显著性差异,反之则反. 3、 模型求解利用逐对比较法(程序见附录二附件一),求出ht 与bt (见图1),在α=0.01下进行t 分布的显著性分析,得出两组评酒员的评价结果无显著性差异,再对数据进行双样本均值差t 检验法(见图二),结果得出二组更可信.问题二1、 数据分析首先对附件二酿酒葡萄的理化指标进行数据处理(见附录三表三、表四) 2、 模型建立1)计算相关系数矩阵⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=pp p p p p r r r r r r r r r R 212222111211... (1) ij r (p j i ,...2,1,=)为原变量的i x 与j x 之间的相关系数,其计算公式为∑∑∑===----=nk nk j kj i kij j k nk i ik j i x x x xx x x xr 11221)()()()( (2)因为R 是是对称矩阵(即i j j i r r =),所以只需计算上三角元素或下三角元素即可. 2)计算特征值与特征向量首先解特征方程0=-R I λ,通常可用雅可比法(Jacobi )求出特征值),,2,1(p i i =λ,并使其按顺序大小排列,即0...,321≥≥≥≥p λλλλ;然后分别求出对应于特征值i λ的特征向量),,2,1(p i e i =.这里要求,1=即∑==pj ij e 121,其中ij e 表示向量i e 的第j 个分量.3)计算主成分贡献率及累计贡献率 主成分i z 的贡献率i α为),,2,1(1p i pk ki=∑=λλ累计贡献率为),,2,1(11p i pk kik k=∑∑==λλ一般取累计贡献率达85-95%的特征值m λλλλ,,,,321 所对应的第一、第二、第)(p m m ≤个主成分. 4)计算主成分载荷量 其计算公式为),,2,1,(),(p j i e x z p l ij i j i ij ===λ (3)得到各主成分的载荷后,利用特征向量,得到各主成分的得分⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=nm n n m m z z z z z z z z z Z 212222111211 (4)5)主成分分析用于系统评估利用主成分p z z z ,,,21 做线性组合,并以每一个主成分i z 的方差贡献率i α作为权数,构造一个综合评价函数p p z z z y ⋅++⋅+⋅=ααα 2211 (5) 也称y 为评估指数,依据对每个样品得出的y 值进行分级. 3、 模型求解利用MATLAB 编写程序,得出y 的值.(程序见附录二附件二) 得出的y 值越大说明酿酒葡萄的质量越高,葡萄酒质量的衡量用附件一中二组的数据(由题一知二组比一组更可靠),利用二八原理得出葡萄酒和酿酒葡萄的综合得分(见附录三表五),找出最大值max ,最小值min ,组距6min)(max -=d ,红葡萄酒得出5个小区间,划分为5个等级,白葡萄酒得出6个小区间,划分为6个等级,划分等1、 数据分析在两组变量中提取有代表性的两个综合变量,对综合变量进行标准化处理(见附录二附件三),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性.2、 模型建立本模型对两组指标酿酒葡萄和葡萄酒的理化指标作典型相关分析.其中, 酿酒葡萄指标:211,,A A葡萄酒的理化指标:3022,,A A第一步,计算相关系数阵3030)(⨯=ij r R ,具体结果见附录表1A 2A … 29A 30A⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡--------0000.13113.02401.03680.03113.00000.13486.01073.02401.03486.00000.11097.03680.01073.01097.00000.1302921A A A A 第二步,典型相关系数及其检验,将酿酒葡萄指标和葡萄酒的理化指标数据经过整理利用 MATLAB 软件的canoncorr 函数进行处理,得出如表1所示结果:由表1可知,前6个典型相关系数均较高,表明相应典型变量之间密切相关.进行相关系数的2χ统计量检验确定典型变量相关性的显著程度,比较统计量2χ计算值从上表得知这9对典型变量均通过统计量检验,表明相应典型变量之间相关关系显著,酿酒葡萄与葡萄酒的理化指标之间有相关联系.第三步:典型相关模型由于原始变量的计量单位不同,不宜直接比较,本文采用标准化的典型系数,给出典型相关模型,如公式⑴~⑹所示⎪⎪⎪⎩⎪⎪⎪⎨⎧+++++=++++++++++++-=302928272625242322121201918171615141312111098765432110.1859A -0.1243A 0.8060A0.9033A - 0.1438A 0.7253A 1.1161A -0.5222A 0.9882A V0.2576A - 0.6898A 0.6145A 0.3881A 0.8054A -0.9221A -0.0797A 0.8424A 0.1035A-0.1112A 0.6588A 0.5552A - 0.6333A - 0.8875A 2.1858 -0.53080.07880.53010.0333- 0.14192666.0 A A A A A A A U ⑴ ⎪⎪⎪⎩⎪⎪⎪⎨⎧++++++=++++++++=302928272625242322221201918171615141312111098765432120.3811A 1.0582A 1.9635A0.7222A 0.6133A - 1.1626A -2.8979A 1.2812A - 0.5658A V0.2346A 0.2256A -0.1844A 0.1093A 0.0087A -1.4993A 0.1513A 0.7407A - 0.6954A-0.6504A - 0.3317A - 0.1804A - 0.0854A - 0.6617A -0.7315 0.2775 0.4173- 0.0114 0.0908- 0.8853-0.1777 A A A A A A A U ⑵ ⎪⎪⎪⎩⎪⎪⎪⎨⎧+-+++=+++++-+++++=302928272625242322321201918171615141312111098765432130.6108A 1.1652A -0.2270A0.2647A 0.5229A 0.4005A 1.3208A -0.3465A -0.0115A V0.7740A 0.0768A 0.1494A - 0.5894A 0.7736A 0.8003A 0.0571A 0.0390A -0.1631A - 0.1316A 0.3281A - 0.3523A - 0.5051A 0.7135A -1.9691 1.6219-0.6603 1.1176-0.4611- 0.0626 -0.1341A A A A A A A U ⑶ ⎪⎪⎪⎩⎪⎪⎪⎨⎧-++++=++++++++++++=302928272625242322421201918171615141312111098765432140.8632A - 0.6128A -2.1413A0.3405A 0.1296A 0.1725A 1.7119A -1.1137A 2.7421A - V0.4821A 0.2111A -0.0337A - -0.4764A 0.8511A - 3.8525A -0.4394A -0.8279A 0.7593A 1.6148A 1.4068A 0.0829A 0.4232A -1.5406A 2.0668 -0.90220.17060.2461-0.5411 0.1621-0.0964A A A A A A A U ⑷ ⎪⎪⎪⎩⎪⎪⎪⎨⎧-+++=+++++++++++=302928272625242322521201918171615141312111098765432150.9032A -0.5843A -1.5873A0.0911A - 0.1586A 0.1056A 1.3940A 1.8497A -1.4755A - VA 0.2073 0.0210A 0.6044A - 0.1196A - 0.8591A 0.2084A 0.2593A -0.1736A - 0.7033A - -0.3871A - 0.0474A 0.1275A - 0.3342A 0.0629A - 1.6602 -1.22400.1262 0.3456- 0.4287- 0.2810 -0.0774A A A A A A A U ⑸ ⎪⎪⎪⎩⎪⎪⎪⎨⎧-++=+++++++++++++=302928272625242322621201918171615141312111098765432160.0113A - 0.2930A -1.2336A 0.5983A 0.6340A 1.1863A -1.1943A -0.1001A -0.1006A V1.1199A 1.6234A -0.5710A - 0.4459A 1.2038A 1.1480A -1.0176A -0.2293A 0.1792A0.1712A 0.4702A 0.3912A 0.8888A 0.0378A - 1.1037 2.3197-0.59180.4889-0.2723 0.3094 0.3201- A A A A A A A U ⑹ 3、结果分析由公式⑴典型相关方程可知,酿酒葡萄的主要指标是7A ,8A ,14A ,16A ,17A ,说明酿酒葡萄中影响葡萄酒理化指标的主要因素是总酚(7A )、单宁(8A )、PH(14A )、干物质含量(16A )、果穗质量(17A ),葡萄酒的第一典型变量1V 与22A ,24A ,27A ,28A 呈高度相关;根据公式⑵典型相关方程,2A (花色苷)是酿酒葡萄的主要因素,葡萄酒的第二典型变量2V 与23A ,24A ,25A ,28A ,29A 呈高度相关;公式⑶中酿酒葡萄的主要指标是6A ,7A ,16A ,葡萄酒的第三典型变量3V 与24A ,29A 呈高度相关;公式⑷酿酒葡萄的主要指标是6A ,7A ,8A ,11A ,12A ,14A ,17A ,葡萄酒的第四典型变量4V 与22A ,23A ,24A ,28A 呈高度相关;公式⑸酿酒葡萄的主要指标是6A ,7A ,葡萄酒的第五典型变量5V 与22A ,23A ,24A ,28A 呈高度相关;公式⑹酿酒葡萄的主要指标是15A ,16A ,17A ,20A ,21A ,葡萄酒的第六典型变量6V 与24A ,25A ,28A 呈高度相关.由于第一组典型变量信息比重较大,所以总体上酿酒葡萄与葡萄酒主要理化高度相关的主要指标是7A ,6A ,16A ,17A ,8A ,14A ,2A ,11A ,12A ,14A ,15A ,20A ,21A ,反映葡萄酒的理化指标与酿酒葡萄高度相关的指标为22A ,23A ,24A ,25A ,27A ,28A ,29A .问题四1、模型建立[][]alpha X Y regress stats r b b ,,int,int,,= int),(r r rcophtn j m i aa b mi ijijij ,,2,1,,,2,1,12 ===∑=程序见附表二附件,残差图见附录一图三、图四. 2、结果分析 以红葡萄酒为例 2997.5;5148.7010==ββ y =70.5148+5.29971x ,9842.02=r ;(越接近于1,回归效果越显著) 05.00255.0≤=p ,回归模型成立.从残差图可以看出,除第8,11,20三个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型y =70.5148+5.29971x ,能较好的符合原始数据,而这三个个数据可视为异常点. 同理,白葡萄的多元线性回归成立. 用TOPSIS 法,对能否用葡萄酒和葡萄酒的理化指标来评价葡萄酒的质量进行分析, (1)用向量规划化的方法求得规范决策矩阵。
基于logistic回归模型的葡萄酒质量评价方法研究python葡萄酒的质量评价一直是酒类制造商和消费者关注的重点。
通过基于logistic回归模型的葡萄酒质量评价方法研究,可以得到更精准的评价结果。
Python是一种流行的编程语言,它可以很好地支持logistic回归模型的研究和应用。
对于葡萄酒质量评价,我们采用基于logistic回归模型的二元分类方法。
这种方法会将葡萄酒分为两类,即优质酒和普通酒。
使用Python 语言实现基于logistic回归模型的葡萄酒质量评价方法,我们可以采用Scikit-learn库中的LogisticRegression函数。
首先,我们需要准备数据集。
我们可以使用公开数据集来进行数据分析和训练模型。
由于葡萄酒质量的评价是基于一系列化学物质的含量,因此我们需要采集葡萄酒样品的化学数据和其对应的品质评价信息。
通过对数据进行分析和预处理,我们可以将化学物质的含量作为特征值,将品质评价作为标签值。
对于一个二元分类问题,对于样本进行分类的目的是找到一个最佳的超平面,将两类样本分离。
而logistic回归模型则不仅仅只是找到一个超平面,而是将样本划分为两个类别的概率值。
这个概率值是一个介于0和1之间的数值,代表了某一个样本属于某一类的可能性大小。
我们使用LogisticRegression函数从Scikit-learn库中构建基于logistic回归模型的葡萄酒质量评价方法。
代码如下:```from sklearn.linear_model import LogisticRegressionfrom sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)clf = LogisticRegression(random_state=0, solver='lbfgs',multi_class='multinomial')clf.fit(X_train, y_train)```该代码使用train_test_split函数将数据集分成训练集和测试集。
基于理化指标分析的葡萄与葡萄酒的评价摘要针对酿酒葡萄与葡萄酒理化指标的统计,通过聚类法,典型相关分析及逐步回归分析法等,建立数据统计模型:对于问题一,首先对两组数据进行整理分析,然后利用spss软件进行配对数据t-检验(详见第三页表二),从而判断出两组评酒员的评价结果具有显著性差异。
而后利用excel进行方差分析-无重复双因子分析得出二组结果更为可信。
详细见第 3 页。
对于问题二,使用matlab软件对原始变量进行主成分分析得出中和变量,然后使用spss软件应用离差平方和法对中和变量进行聚类分析,从而根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,为了检验欧式测距是否可以正确区分出葡萄的等级,所以对主成份分析后的理化指标求均值,经过验证,均值相差大,足以区分葡萄等级,最终将红葡萄分为3级,白葡萄分为4级。
详细见第 5 页。
对于问题三,首先通过matlab软件对葡萄酒的理化指标进行主成分分析,得出中和指标。
然后使用spss软件进行典型相关分析,得到葡萄酒的理化指标与酿酒葡萄的理化指标的关联度。
再通过对关系度表格的分析,得到酿酒葡萄与葡萄酒的理化指标之间的联系。
详细见第 14 页。
对于问题四,考虑到葡萄酒质量与酿酒葡萄和葡萄酒理化指标可能成线性关系,故应用逐步回归分析,将葡萄酒质量设为因变量,酿酒葡萄和葡萄酒理化指标设为自变量,列出线性回归方程,通过spss软件进行数据拟合和显著性分析,排除影响不显著的变量,将因变量与评酒员打分结果对比,得出拟合结果基本符合。
再通过分析得到分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。
最后根据F检验判断所得数据的正确性。
由于葡萄酒可能会收到年份和贮藏环境等其他因素的影响,因此不能单纯地通过葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
详细见第 16 页。
关键字:典型相关分析 t检验主成分分析一、问题重述葡萄酒是一种成分复杂的酒精饮料,不同产地、年份和品种的葡萄酒成分不同。
基于相关分析和多元线性回归的葡萄酒质量预测葡萄酒质量预测一直是葡萄酒行业的重要课题之一、通过了解葡萄酒的各种特征和其质量评分之间的关系,可以为生产商提供重要的参考,帮助他们改进生产工艺和提高葡萄酒的质量。
在这篇文章中,我们将介绍如何使用相关分析和多元线性回归模型来预测葡萄酒的质量。
首先,我们需要了解葡萄酒的质量是如何被评价的。
在葡萄酒行业,通常会使用一些专业人士对葡萄酒进行评分。
这些人士品尝葡萄酒后,会给出一个0到10的评分,表示葡萄酒的质量。
我们将这个评分定义为葡萄酒的质量变量。
为了预测葡萄酒的质量,我们需要一些与葡萄酒特征相关的数据。
例如,葡萄酒的酒精度、酸度、挥发性酸度、残糖等特征。
我们将这些特征定义为自变量。
相关分析是一种用于研究两个变量之间关系的统计方法。
在我们的问题中,我们将使用相关分析来了解葡萄酒特征和质量之间的关系。
具体来说,我们可以计算每个特征与质量变量之间的相关系数。
相关系数的取值范围为-1到1,其中1表示强正相关,-1表示强负相关,0表示无关。
通过计算相关系数,我们可以知道哪些特征与葡萄酒质量有较强的关系。
在葡萄酒数据集中,我们可以使用多元线性回归模型来预测葡萄酒的质量。
多元线性回归模型可以将多个自变量与一个因变量之间的关系建模,从而预测因变量的值。
在我们的问题中,因变量是葡萄酒的质量,自变量是葡萄酒的各种特征。
多元线性回归模型可以表示为一个线性方程:Y=β0+β1X1+β2X2+...+βnXn其中,Y表示因变量(葡萄酒的质量),X1到Xn表示自变量(葡萄酒的各种特征),β0到βn表示回归系数。
为了构建多元线性回归模型,我们需要先拟合一个初始模型,然后使用最小二乘法来估计回归系数。
最小二乘法是一种常用的回归分析方法,可以通过最小化残差平方和来估计回归系数。
在我们的问题中,残差即为实际质量与预测质量之间的差异。
构建多元线性回归模型后,我们可以使用该模型来预测新葡萄酒的质量。
葡萄酒评价数学建模matlab摘要:一、引言二、葡萄酒评价的数学模型三、数学建模在葡萄酒评价中的应用四、MATLAB 在葡萄酒评价数学模型中的实现五、结论正文:一、引言随着生活水平的提高,人们对葡萄酒的需求也逐渐增加。
葡萄酒的质量评价成为了一个重要的问题。
传统的葡萄酒评价方法通常依赖于评酒师的主观感受,这种主观性较强的评价方式存在着一定的局限性。
因此,借助数学模型对葡萄酒进行客观评价成为了研究的热点。
本文将介绍葡萄酒评价的数学模型,以及如何利用MATLAB 实现这些模型。
二、葡萄酒评价的数学模型葡萄酒评价的数学模型主要包括以下几种:1.基于理化指标的评价模型:通过分析葡萄酒的理化指标,如酒精度、酸度、单宁等,建立数学模型,从而对葡萄酒的质量进行评价。
2.基于多元统计分析的评价模型:利用多元统计分析方法,如主成分分析(PCA)、线性判别分析(LDA)等,对葡萄酒的感官指标进行降维处理,从而实现葡萄酒的客观评价。
3.基于人工神经网络的评价模型:通过训练神经网络,建立葡萄酒感官指标与质量之间的映射关系,实现对葡萄酒的评价。
三、数学建模在葡萄酒评价中的应用数学建模在葡萄酒评价中的应用主要体现在以下几个方面:1.提高评价的客观性:数学模型可以减少评价过程中主观因素的影响,提高评价的客观性。
2.提高评价的效率:利用计算机程序进行数学建模,可以大大提高评价的效率。
3.促进葡萄酒产业的发展:通过数学建模,可以对葡萄酒的质量进行更加精确的评价,有利于促进葡萄酒产业的发展。
四、MATLAB 在葡萄酒评价数学模型中的实现MATLAB 是一种广泛应用于科学计算和数据分析的软件,可以方便地实现葡萄酒评价数学模型。
以下是一个简单的示例,基于MATLAB 实现多元统计分析的葡萄酒评价模型:1.收集葡萄酒的感官指标数据,如香气、口感、色泽等。
2.利用MATLAB 中的PCA 函数对感官指标数据进行降维处理,得到主成分得分。
3.根据主成分得分,利用MATLAB 中的LDA 函数建立葡萄酒质量的分类模型。
基于多元逐步回归分析的葡萄酒理化指标模型研究
作者:江俊谕黄玉茜王秀兰王春利
来源:《中国科技博览》2014年第14期
[摘要]:本文以2012年全国数学建模本科组A题为研究对象。
经过对附件二提供的指标数据的预处理,采用多元逐步回归法,建立了葡萄酒理化指标与酿酒葡萄理化指标的多元逐步回归模型,求解得出它们之间的函数表达式和复相关系数,可以说明他们之间的关系显著程度并通过了检验论证。
[关键词]:葡萄酒评价;多远逐步回归法;SAS软件
【分类号】TS262.6
1逐步回归理论知识[1]
逐步回归分析时在考虑的全部自变量中按其对的贡献程度大小,由大到小地逐个引入回归方程,而对那些对作用不显著的变量可能是中不被引入回归方程。
另外,已被引入回归方程的变量在引入新变量进行检验后失去重要性时,需要从回归方程中剔除出去。
建立逐步回归模型一般步骤:
步骤1:计算变量均值和差平方和。
其中分别为第个变量、的均值,表示第个变量的第个数、的差平方和。
各自的标准化变量为:
(1)
步骤2:计算的相关系数矩阵,是由相关系数组成的矩阵。
步骤3:设已经选上了个互不相同的变量:经过变换后为。
对逐一计算标准化变量的偏回归平方和:
,记(2)
作检验:
(3)
对给定的显著性水平,拒绝域为,若则剔除该变量;反之,则引入新变量。
步骤 4:循环步骤3 ,直至最终选上了个互不相同变量,经过变换后为,则对应的回归方程为:
(4)通过代数运算可得:。
(5)2 基于多元逐步回归分析葡萄酒理化指标模型
2.1 解模型的准备
首先我们用Excel做出葡萄酒与葡萄对应的指标折线图,并观察它们之间的是否存在线性关系。
经分析得到的折线图可以看出葡萄与葡萄酒的关系差不多都为线性关系,以下我们用逐步回归分析法分别来建立红白葡萄酒中的指标和其对应葡萄中的各个指标的函数关系式,同时用复相关系数来说明它们指标之间的关系。
2.2 逐步回归分析的求解过程
在处理数据时,若遇到某项指标测试多次,则取其平均值,若只测试一次的。
整理好后根据SAS解出得结果和理论知识可以求得它们的函数表达式,其中,按顺序表示酿酒葡萄的一级指标。
1)对红葡萄酒各项指标分别进行逐步回归分析方法求解。
第一项指标花色苷:
红葡萄酒和红葡萄中的花色苷的函数表达式:
(6)
由运行结果可知,对于:,:,:。
由复相关系数可以看出与、、的线性关系是很显著的,与红葡萄中的其他因素的关系不是很显著。
第二项指标总酚:
红葡萄酒和红葡萄中的总酚的函数表达式:
(7)
由运行结果可知,对于:,:,:,:。
它是同一种物质之间的转换,由附件给出的数据我们可以知在变化的过程中是减少的,其复相关系数为:。
由得出的复相关系数可以看出与、、、的线性关系是比较显著的。
第三项指标单宁:
红葡萄酒和红葡萄中的单宁的函数表达式:
(8)
由运行结果可知,对于:,:,:,:,:。
由解出的复相关系数可以看出与、、、和的线性关系是高度显著的。
第四项指标黄酮:
红葡萄酒和红葡萄中的黄酮的函数表达式:
(9)
由程序运行结果可知,对于:,故与的联系较差。
第五项指标白藜芦醇:
红葡萄酒和红葡萄中的白藜芦醇的函数表达式:
(10)
由运行结果可知,对于、、、来说,它们的复相关系数都小于0.8,可以说明
与、、、的线性关系显著性较差。
而的复相关系数大于0.8(),所以与的线性关系较强。
第六项指标L*(D65):
红葡萄酒和红葡萄中的L*(D65)的函数表达式:
(11)
由运行结果可知,对于、来说,它们的复相关系数都小于0.8,可以说明与、的线性关系显著性较差。
但、的复相关系数大于0.8(、),所以与、的线性关系较强。
第七项指标a*(D65):
红葡萄酒和红葡萄中的a*(D65)的函数表达式:
(12)
由运行结果可知,对于、来说,它们的复相关系数都小于0.8,可以说明与、的线性关系显著性较差。
第八项指标b*(D65):
红葡萄酒和红葡萄中的b*(D65)的函数表达式:
(13)
由运行结果可知,对于、、来说,它们的复相关系数都小于0.8,可以说明与它们的线性关系显著性较差。
2)对白葡萄酒各项指标分别进行逐步回归方法求解。
第一项指标总酚:
白葡萄酒和白葡萄中的总酚的函数表达式:
(14)
由运行结果可知,对于:,:,可以由它们之间的复相关系数看出与、的线性关系比较差。
第二项指标单宁:
白葡萄酒和白葡萄中的单宁的函数表达式:
(15)
由运行结果可知,对于:,对于:,对于:,对于:。
由解出的复相关系数可以看出与、、、的联系比较差。
第三项指标黄酮:
白葡萄酒和白葡萄中的黄酮的函数表达式:
(16)
由运行结果可知,对于:,:,:,:,:,:,:,:。
由解出的复相关系数可以看出与、、、、之间的联系很大,其余的联系较小。
第四项指标白藜芦醇:
白葡萄酒和白葡萄中的白藜芦醇的函数表达式:
(17)
由运行结果可知,对于、、来说,它们的复相关系数都小于0.8,可以说明与、、的线性关系显著性较差。
第五项指标L*(D65):
红葡萄酒和红葡萄中的L*(D65)的函数表达式:
(18)
由运行结果可知,对于、、、来说,它们的复相关系数都小于0.8,可以说明
与、、、的线性显著性都很差。
第六项指标a*(D65):
白葡萄酒和白葡萄中的a*(D65)的函数表达式:
(19)
由运行结果可知,对于、、来说,它们的复相关系数都小于0.8,可以说明与、、的线性关系显著性较差。
第七项指标b*(D65):
白葡萄酒和白葡萄中的b*(D65)的函数表达式:
(20)
由运行结果可知,对于、、、来说,它们的复相关系数都小于0.8,可以说明与它们的线性关系显著性较差。
而的复相关系数大于0.8(),说明它与存在线性关系。
综上所述,可知红葡萄酒、白葡萄酒中的各项理化指标不一定对应酿酒葡萄的理化指标,它与酿酒葡萄中的其他理化指标也存在线性关系。
并且有些不是对应的理化指标比对应的理化指标存在的线性关系还要显著。
说明葡萄酒和酿酒葡萄之间的理化指标不一定是相应转化的,还可以由其他理化指标转化而来。
参考文献:
[1]宋建民,陈敏江,运用逐步回归分析法对河北省国民经济的分析与研究[J],科技信息,2008,第35期。
[2]薛毅,数学建模基础[M],北京:科学出版社,2011。
[3]李德宜,李明,数学建模[M],北京:科学出版社,2009。
[4]徐全智,杨晋浩,数学建模[M ],北京:高等教育出版社, 2004。
[5]范金城,林长海,数据分析[M],北京:科学出版社,2010。
[6]胡国定,张润楚,多元数据分析方法[M ],天津:南开大学出版社, 1990。
作者简介:
王春利(1980—),男,吉林长春人,硕士,讲师,从事差分方程相关理论研究。
基金资助:院级教改一般项目(2013JGY19)。