当前位置:文档之家› 2012国赛数学建模A题葡萄酒论文

2012国赛数学建模A题葡萄酒论文

2012国赛数学建模A题葡萄酒论文
2012国赛数学建模A题葡萄酒论文

葡萄酒的评价

一、摘要

对于问题一,考虑到分数间不存在相关性,样本量偏小,需要对两组数据进行比较分析,我们采用了非参数检验中的Wilcoxon符号秩检验,评判结果均有显著性差异。在此情况下,比较同组内十名品酒员对同一样品酒给出的总分的方差,再令得到的多组方差取平均,无论红葡萄酒和白葡萄酒,都是第一组方差较大,故第二组的评分较为可信。另外由于所给数据大量且复杂,需预先对数据进行预处理,排除明显错误数据,用组内均值替代缺失数据。

对于问题二,先用SPSS对芳香物质和香气指标总分进行简单相关分析,筛选芳香物质中与香气评分相关性较大的成分。将保留的芳香物质和葡萄的理化指标与葡萄的质量进行逐步回归分析,得到回归方程。在得到结果后,我们也检验了数据满足逐步回归分析的条件。最后将不同组葡萄的指标系数代入,根据分数值对葡萄分级,最终红、白葡萄酒都被分为六级。

对于问题三,我组首先对葡萄酒与酿酒葡萄当中相同的指标进行了简单相关性检验,得出其中大部分指标是强相关的,但是有一些指标(例如白酒的色素)是不相关的。为了对这些指标进行进一步的分析,我组对含有二级指标的指标组进行了典型相关性分析,分析多个指标与多个指标间的关系。而像酒总黄酮这类的单独指标,则进行了逐步线性回归,探究与所有可能有联系的指标间的联系。

对于问题四,我组以品酒员测定的指标等级为依据,希望通过逐步线性回归与Topsis排序的方法归纳出葡萄酒和葡萄理化指标间的数量关系,进而还原出品酒员所评定的等级。但是在具体实践过后,两种方法的分级都与品酒员的分级有较大的误差,故认定不能直接通过理化指标去确定葡萄酒的等级。

关键词:葡萄酒质量符号秩检验主成分分析逐步回归主成分分析

二、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:

1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

三、问题分析

3.1问题一的分析

两组品酒员分别对于白葡萄酒和红葡萄酒给出了包括外观,口感,香气,平衡四项大指标的评价,可将每个方面的评分相加作为总分确定葡萄酒的质量。对于同一葡萄酒样品,不同的品酒员给出的分值存在个体差异,考虑到分数间不存在相关性,样本量偏小,且需要对两组数据进行比较分析,我们采用了非参数检验中的Wilcoxon符号秩和检验评判结果有无显著性差异。由于所给数据大量且复杂,需预先对数据进行预处理,排除明显错误数据,用组内均值替代缺失数据。

要评价哪组的评价结果更可信,主要是检验组内各个品酒员的评分是否相对集中,可以通过计算方差的方法,比较得到哪组数据波动小,则可信度高。

3.2问题二的分析

首先,我们分析芳香物质对葡萄酒质量的相关性。采用SPSS的简单相关系数分析,分别化简保留8个红葡萄和6个白葡萄中芳香物质。然后,对理化指标中多组测试结果取均值作为该理化指标的唯一数据,同时考虑到二级指标比一级指标分类更细致,可以得到更精确的分析结果,我们以二级指标代替一级指标。我们以品酒员给出样品酒的总分作为葡萄酒质量的衡定。

将简化好的理化指标与葡萄酒总分输入SPSS软件,进行逐步回归分析,得到理化指标与葡萄酒质量的线性回归方程。将各个理化指标代入方程,计算得各个总分,对分数进行分级,即可得到酿酒葡萄的等级。

3.3问题三的分析

要分析葡萄酒和酿酒葡萄之间的联系,我们发现它们有共同的指标,故首先对葡萄酒与酿酒葡萄当中相同的指标进行了简单相关性检验,得出其中大部分指标是强相关的,但是有一些指标(例如白酒的色素)是不相关的。为了对这些指标进行进一步的分析,我们对含有二级指标的指标组进行了典型相关性分析,分析多个指标与多个指标间的关系。而像酒总黄酮这类的单独指标,则进行了逐步线性回归,探究与所有可能有联系的指标间的联系。

3.4问题四的分析

我们以品酒员测定的指标等级为依据,希望通过逐步线性回归与Topsis排序的方法归纳出葡萄酒和葡萄理化指标间的数量关系,进而还原出品酒员所评定的等级。但是在具体实践过后,两种方法的分级都与品酒员的分级有较大的误差,故认定不能直接通过理化指标去确定葡萄酒的等级。

四、模型假设

1.假设所有的葡萄酒酿造工艺相同;

2. 假设一级指标包括二级指标,部分二级指标可以按一定标准进行取舍;

3. 假设各处理条件下的葡萄和葡萄酒样本是相互独立的;

4. 评酒员对葡萄酒样品的评分是客观的,不含任何自己的主观意见。

5. 假设葡萄中存在的而葡萄酒中不存在的理化指标也会影响葡萄酒的质量;

6.假设附件中给出的葡萄和葡萄酒理化指标都准确可靠。

五、符号说明

六、模型的建立和求解

6.1模型一的建立和求解

6.1.1数据的预处理

(1)检验数据的正确性及改正

两组品酒员分别对27组红葡萄酒和28组白葡萄酒进行了多指标的评判。根据每个指标的规定最高分,我们发现第一组品酒员7对于白葡萄酒3号的持久性评分值77大于最优值8,故判断此数据有误。考虑让数据最不偏离正确的结果,我们对该项目的其余9位品酒员的分数取平均值得到分数6.1分,将错误数据修正为6.1分。

(2)空缺数据的填补

第一组品酒员4对于红葡萄酒20号的色调评分值缺失,对该项目的其余9位品酒员的分数取平均值得分数6.2分,将空白数据填充为6.2分。

预处理后数据中,第一组、第二组各有10名评酒员对27种红葡萄酒样品和28中白葡萄酒样品分别作了评价,故将每位评酒员对每种酒样品的各项评分求和得到总分,然后将同组中每种酒样品的10个总分取平均值,从而得到第一组对27种红葡萄酒样品、28种白葡萄酒样品的综合平均评分,和第二组对27种红葡萄酒样品、28种白葡萄酒样品的综合平均评分。

6.1.2基于威尔科克森符号秩检验的显著性差异分析

在威尔科克符号秩检验中,它把观测值和零假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量。适用于T检验中的成对比较,但并不要求成对数据之差di服从正态分布,只要求对称分布即可。检验成对观测数据之差是否来自均值为0的总体(产生数据的总体是否具有相同的均值)。

要判断两组评酒员的评价结果有无显著性差异,就应该构造统计量,检验两组评分的差异。若不在置信区间内,则认为评分差异性显著。

基于本题的背景,两组的差异体现在了对样本酒的排名差异上。因为本题属于食品评价中的感官评价问题,所以可以结合感官评价中的排序检验与非参数检验中的符号秩检验,对两者的显著性进行评价。

下面采用Wilcoxon符号秩检验的方法作显著性分析,以红葡萄酒为例进行说明。为了比较红葡萄酒样品的两组评分结果是否有显著性差异,作出假设检验为:

H0:两组评分结果没有显著性差异;

H1:两组评分结果有显著性差异。

正负符号检验和威尔科克森符号秩检验,都可看作是就成对观察值而进行的参数方式的T检验的代用品,非参数检验具有无需对总体分布作假定的优点,而就成对观察值作的参数方式的T检验,必须假定有关的差别总体服从正态分布。

该方法具体步骤如下:

(1)对i=1,...,n,计算∣Xi-M0∣,它们代表这些样本点到M0的距离。

(2)把上面的n个绝对值排序,并找出它们的n个秩,如果它们有相同的样本点,每个点取平均秩。

(3)令W+等于Xi-M0>0的∣Xi-M0∣的秩的和,而W-等于Xi-M0<0的∣Xi-M0∣的秩的和。

(4)对双边检验H0:M=M0<=>H1:M≠M0,在零假设下,W+和W-应差不多。因而,当其中之一很小时,应怀疑零假设。在此,取检验统计量W=min(W+,W-)。

(5)根据得到的W值,利用统计软件或查Wilcoxon符号秩检验的分布表以得到在零假设下的p值。如果n很大要用正态近似:得到一个与W有关的正态随机变量Z的值,再用软件或查正态分布表得到p值。

(6)如果p值较小(比如小于或等于给定的显著性水平,譬如0.05)则可以拒绝零假设。如果p值较大则没有充分的证据来拒绝零假设,但不意味着接受零假设。

先求出每对数据的差值D,按差值绝对值|D|由小到大排列并给秩R,从秩1开始到秩27,样本数目27n,在给秩时,遇到相等的|D|时,使用平均秩,如表中酒样品3和酒样品13具有相同的绝对差值5.8,因而平分秩16和秩17,各为秩16.5。当绝对差值的秩值R给出后,将R分成正、负差值的两个部分秩值R+和R-,最后求符号秩和

T R,T R

+=∑+-=∑-

由于样本数目为27个,T+和T-的最小可能值为0,而最大可能值为1+2+…n=(n+1)n/2。此处使用SPSS软件的秩和检验功能,得出如下结果:

图6.1 红葡萄酒的秩排序

图6.2 白葡萄酒的秩排序

上图为红白葡萄酒1~27样品的秩排序,从图中可粗略看出一组与二组数据符合的不好。下面通过SPSS软件进行定量分析。

红葡萄酒:

(1)秩

(2)检验统计量[b]

白葡萄酒:

(1)秩

(2)检验统计量[b]

选取α=0.05,查表得拒绝域为z≥1.96和z ≤?1.96,因为-2.535<-1.96,-2.084<-1.96,所以拒绝原假设H0,故在显著性水平为0.05的情况下,两组评

酒员对27种红葡萄酒、28种白葡萄酒的评价结果也具有显著性差异。

综上所述,在显著性水平为0.05的情形下,两组评酒员的评价结果具有显著性差异。

6.1.3方差比较可信度

由于整体评价数据无显著性差异,我们可以认为20名评酒员的水平在一个区间内。因此评酒员的评价结果的稳定性将决定该评酒员评价的数据的可信度。若某一评酒员的评价数据不稳定,则其所评数据可信度较低,其所在组别的数据评价可信度也将相应降低。因此,我们将数据的可信度比较转化为两组评酒员评论水平的稳定性比较。

查阅相关资料获知,评酒员的评价尺度是有一定的系统误差的。如不同评酒员对色调的敏感度或许是不同的,如果某一评酒员评价的色调稍高于标准色调,但他每次评价的色调都稍高,而且一直很稳定。虽然与均值间始终存在误差,由于其稳定性,这样的评酒员的评价数据仍然是可信的。所以,我们建立的数据可信度评价指标为评酒员评价的稳定性。评酒员的评价数据越稳定,数据越可信。在此,我们选择方差来刻画稳定性。27个样品的平均方差越小,则数据越稳定,可信度越高。

s.数据如上对每一个样品酒计算总和,然后以品酒员的十个分数计算方差

i

表6.1.

s=

i

.

由表6.2可以看出,无论是红葡萄酒还是白葡萄酒,第二组的方差均值较小,也就是说,第二组品酒员的评分波动比较小,故第二组更可靠。

6.2模型二的建立和求解

6.2.1数据的预处理

在酿酒葡萄的理化指标中,有些项目下有几列数据,表示该项目测试几次(例如单苧,总酚)。而在处理数据关系时,仅需要一个指标的一组数据,故我们选择对多次测试的结果取均值,以均值代表某一样品的某一理化指标。同时,我们用二级指标来替代一级指标。

在红白葡萄酒与红白葡萄的芳香物质指标表中,由于芳香物质的种类过多,且某些样品的芳香物质检测值为0,为了让芳香物质的数据能与每一个样品分析出相关性,我们将有多余3个空白项的芳香物质删除。

在数据分析的过程中,我们发现红葡萄的样品9的“(E)-3,7-二甲基-2,6-辛二烯-1-醇”值远远大于其他样品的值,为了使数据分析结果更具有普遍意义,我们舍弃该参数。

6.2.2芳香物质与评分的相关性分析

附表3中单独给出了红白葡萄酒与红白葡萄的芳香物质指标。资料可知,酿酒葡萄中的芳香物质会影响葡萄酒的香气。

鉴于芳香物质将影响品酒员的在香气分析的评判分数,我们使用SPSS 软件,将芳香物质指标与此品酒员的香气分析中三项指标的总分进行简单相关分析。

其原理是:利用样本相关系数推断总体中两个变量是否相关,可以用t 统计量对总体相关系数为0的原假设进行检验。若t 检验显著,则拒绝原假设,即两个变量是线性相关的;若t 检验不显著,则不能拒绝原假设,即两个变量不是线性相关的。公式如下:

()()

n

i i x x y y r --=

其中n 为样本量,i x ,i y 和x ,y 分别为两个变量的观测值和均值。r 描述的是两个变量间线性相关强弱的程度。r 的取值在-1与+1之间,若r>0,表明两

个变量是正相关;若r<0,表明两个变量是负相关。r 的绝对值越大表明相关性越强,要注意的是这里并不存在因果关系。若r=0,表明两个变量间不是线性相关。

使用SPSS 软件,得到的结果如下表所示:

将分析后保留的芳香物质指标加入酿酒葡萄的理化指标中。 6.2.3理化指标与酿酒葡萄质量的逐步线性回归分析

以品酒员对不同的葡萄酒的总分作为该葡萄酒对应葡萄的质量评判,我们采用SPSS 中逐步回归分析理化指标与葡萄质量的相关性,找出酿酒葡萄的线性回归方程。

逐步回归分析的主要计算步骤:

(1) 确定F检验值

(2) 逐步计算:如果已计算t步(包含t=0), 且回归方程中已引入l个变量, 则第l+1步的计算为:

①计算全部自变量的贡献V(偏回归平方和).

②在已引入的自变量中, 检查是否有需要剔除的不显著变量。这就要在已引入的变量中选取具有最小V值的一个并计算其F值, 如果F≤F

, 表示该变量不

2

则不需要剔除变量, 这显著, 应将其从回归方程中剔除, 计算转至④。如F>F

2

, 则时则考虑从未引入的变量中选出具有最大值V的一个并计算F值, 如果F>F

1

, 表示已无变表示该变量显著, 应将其引到回归方程, 计算转至③。如果F≤F

1

量可选入方程, 则逐步计算阶段结束, 计算转④.

③剔除或引入一个变量后, 相关系数矩阵进行消去变换, 第t+1步计算结束。其后重复上述步骤进行下步的计算.

④计算回归方程入选变量的系数、复相关系数及残差等统计量.

使用SPSS软件的逐步线性回归分析,将理化指标(包含保留的芳香物质)和葡萄酒总分输入,最终得到结果如下:

(1)红葡萄(4个主因素)

葡萄总黄酮(mmol/kg) 0.448

组氨酸 0.289

蛋氨酸 -0.563

DPPH自由基1/IC50(g/L) 23.220

红葡萄酒58.129

(2)白葡萄(3个主因素)

白葡萄酒 70.944

葡萄总黄酮(mmol/kg) -0.845

丝氨酸 0.020

可滴定酸(g/l) 0.787

由于用SPSS 多重线性回归需要变量满足一些条件,否则不可以用线性回归。因此在得到结果之后,我们要对变量进行检验,以下为检验的方法:

(1)正态性检验:就自变量的任何一个线性组合,应变量y均服从正态分布,即要求残差ei服从正态分布,检验的方法是绘制标准化残差的正态概率

分布图。

红葡萄酒白葡萄酒

(2)残差方差齐性检验:标检验准化残差的大小不随变量取值的改变而改变。

1234

123

58.12923.220.2890.4480.56370.9440.8450.020.787red white score a a a a score b b b =+++-=-++

其中,1,2,3,4i a i =分别代表DPPH 自由基1/IC50,组氨酸,葡萄总黄酮,蛋氨酸.,1,2,3i b i =分别代表葡萄总黄酮,丝氨酸,可滴定酸.

代入27组红葡萄酒和28组白葡萄酒的参数,得到其各自的分数,根据分数的密集程度,我们对酿酒葡萄的质量进行了等级划分,分级如下表:

6.3模型三的建立和求解

6.3.1葡萄酒与葡萄相同指标的相关性检验

鉴于葡萄酒的大部分理化指标与酿酒葡萄中的理化指标重叠,我们先对这些相同的指标进行相关性分析,确认其两者之间的联系。

使用SPSS软件中的简单相关系数,依次代入葡萄酒和酿酒葡萄相同的指标量,得到结果如下表:

(1)

a.红葡萄酒的

(2)白葡萄酒与白葡萄

a.白葡萄酒的

结果发现,葡萄酒与葡萄中的相同物质并不全都具有一一对应的相关性,因此分析葡萄酒与葡萄的理化指标的联系应该从更多指标来分析。

6.3.2逐步线性回归分析葡萄酒与葡萄的理化指标的联系

若要考虑葡萄酒的不同指标与葡萄的不同指标之间的关系,由于指标数量偏大,不易于数据的处理,通过查阅相关资料与结合生活实际经验,我们将明显具有相关性的因子,采用典型相关分析,如白藜芦醇与顺式白藜芦醇苷、反式白藜芦醇苷,顺式白藜芦醇、反式白藜芦醇的关系。对于无明显对应关系的单一变量,我们先进行相关性的检验,后采用逐步线性回归。

结果如下:

因变量过多,本文以红葡萄酒中花色苷指标与红葡萄各项理化指标的关系求解为例:

利用spss软件中逐步线性回归分析可得:

|----|-----|----|---------|---------------|

|模型|R |R 方|调整 R 方|标准估计的误差|

|----|-----|----|---------|---------------|

|1 |.923a|.851|.845 |90.47914 |

|----|-----|----|---------|---------------|

|2 |.973b|.947|.942 |55.24180 |

|----|-----|----|---------|---------------|

|3 |.980c|.960|.955 |49.01488 |

|----|-----|----|---------|---------------|

|4 |.984d|.968|.962 |44.76697 |

|----|-----|----|---------|---------------|

|5 |.989e|.978|.973 |37.86229 |

|----|-----|----|---------|---------------|

|6 |.991f|.982|.977 |35.06085 |

|----|-----|----|---------|---------------|

|7 |.993g|.986|.981 |31.85447 |

|----|-----|----|---------|---------------|

|8 |.995h|.990|.985 |28.02114 |

|----|-----|----|---------|---------------|

Spss给出的八个模型中,模型8的R、R方等参数接近1,与理想情况符合的很

|---------|-----------|--|-----------|-------|-----|

|模型 |平方和 |df|均方 |F |Sig. |

|----|----|-----------|--|-----------|-------|-----|

|8 |回归|1361682.963|8 |170210.370 |216.778|.000h|

| |----|-----------|--|-----------|-------|-----|

| |残差|14133.322 |18|785.185 | | |

| |----|-----------|--|-----------|-------|-----|

| |总计|1375816.285|26| | | |

|----|----|-----------|--|-----------|-------|-----|

下面求解模型8的非标准化系数:

|-------------|----------------------|--------|------|----|

|模型 |非标准化系数 |标准系数|t |Sig.|

| |--------|------------|---------|--------| | |

| |B |标准误差|试用版 | | |

|----|--------|------------|---------|--------|------|----|

|8 |(常量) |-368.480 |183.968 | |-2.003|.060|

| |--------|------------|---------|--------|------|----|

| |花色苷 |2.014 |.108 |.785 |18.694|.000|

| |--------|------------|---------|--------|------|----|

| |反式白藜芦醇苷|34.468 |8.705 |.146 |3.960 |.001|

| |--------|------------|---------|--------|------|----|

| |亮氨酸 |.802 |.118 |.279 |6.816 |.000|

| |--------|------------|---------|--------|------|----|

| |苏氨酸 |-1.744 |.272 |-.220 |-6.403|.000|

| |--------|------------|---------|--------|------|----|

| |丙氨酸 |2.117 |.442 |.139 |4.792 |.000|

| |--------|------------|---------|--------|------|----|

| |天门冬氨酸|14.187 |6.004 |.071 |2.363 |.030|

| |--------|------------|---------|--------|------|----|

| |果穗质量|350.417 |113.534 |.086 |3.086 |.006|

| |--------|------------|---------|--------|------|----|

| |出汁率 |-2.676 |1.045 |-.085 |-2.560|.020|

|----|--------|------------|---------|--------|------|----|

从上面的分析中可出红葡萄酒中花色苷与葡萄中花色苷、反式白藜芦醇苷、亮氨酸、苏氨酸、丙氨酸、天门冬氨酸、果穗质量、出汁率有关;

采用类似方法可同理得出白葡萄酒的理化指标与白葡萄的理化指标之间的关系。现将结果呈现如下:

红葡萄酒中的总酚与红葡萄中的总酚、反式白藜芦醇苷有关;

红葡萄酒中的单宁与红葡萄中的单宁、异鼠李素、可溶性固形物、反式白藜芦醇、苏氨酸有关;

红葡萄酒中的酒总黄酮与红葡萄中的葡萄总黄酮有关;

白葡萄酒中的单宁与白葡萄中的单宁、丙氨酸、赖氨酸、色泽H有关;

白葡萄酒中的总酚与白葡萄中的总酚、丙氨酸、赖氨酸、色泽H有关;

白葡萄酒中的酒总黄酮与白葡萄中的葡萄总黄酮、丙氨酸、赖氨酸、色泽H有关;

6.3.3典型相关性分析葡萄酒一级理化指标与葡萄相同一二级理化指标的关系

对于葡萄酒当中有一二级分类的指标,例如白藜芦醇等指标,我组猜测酿酒葡萄与葡萄酒当中的白藜芦醇有相关性,对于这多个指标与多个指标间的分析采用典型相关性分析法。以下给出红葡萄酒利用典型相关性分析得出的关于葡萄酒与酿酒葡萄白藜芦醇的分析例程。

首先分析葡萄酒白藜芦醇指标间的关系:

由图表可看出白藜芦醇和反式白藜芦醇和顺式白藜芦醇成显著性相关,所以应该用第二级指标代替第一级指标进行典型性分析。

处理结果如下:

可以看出第一典型性分析结果优于之前任何一组简单相关性分析的结果。

为了忽略单位间的影响,所以采用标准化的系数进行表述。可见标准化系数分布的比价平均,可以说明两者的白藜芦醇二级指标间都有总体上的相关性联系,并且红酒的反式白藜芦醇和红葡萄的顺式白藜芦醇简称较强的相关性,且对于整体的相关性贡献比较大。

假设性检验:

可知对于第二三四个组合数,我们不能拒绝它的所有系数为零的原假设。

其它结果呈现如下:

红酒的色泽和红葡萄色泽的分析:

预处理后去除二级指标,然后进行典型相关性分析。分析得出系数分布比较平均,呈现整体上的相关性,但葡萄中色泽a的影响比较大。

白酒的白藜芦醇和白葡萄的白藜芦醇的分析:

白葡萄中顺式白藜芦醇和白酒中的顺式及反式白藜芦醇苷的相关性比较大,其余量的影响力比较小。

白酒的色泽和白葡萄的色泽分析:

白葡萄酒的色泽分析中没有通过卡方检验,故不能排除所有系数为零的假设,故不能得出两者有显著线性关系的结论。

6.4模型四的建立和求解

根据以上表格所示,红葡萄酒质量和红葡萄酒理化指标之间的关系可以近似表示为线性关系式:

Y1=17.2?X16+66.66

但是此线性关系式的R-Square的值只有0.303,说明我们得到的这个回归曲线的拟合程度很低,说明葡萄酒的理化指标对葡萄酒的质量影响很小,所以我们可以得到这样的结论:不能单纯地用葡萄与葡萄酒的理化指标来评价葡萄酒的质量好坏。事实上,我们考虑到:评价一种葡萄酒的好坏。而之后在将葡萄酒的理化指标作为因变量输入后,对葡萄酒的好坏进行重新排序后发现,排序的结果与原结果仍有明显的区别,结果如下:

原序列:

12 15 18 1 11 7 25 8 6 4 10 13 27 16

5 14 2

6 22 21 24 19 1

7 2 3 20 9 23

重排后:

12 1 18 11 4 7 15 6 8 24 27 25 10

5 13 14 3 1

6 22 26 1

7 2 3 20 9 23

发现重排后的序列和原序列相差仍比较大,故不可以完全按照理化指标进行排序。

七、模型评价

7.1模型的优点

(1)模型一中运用了威尔克克森秩和检验,该检验不需要样本总体为某一特定分布(如正态分布),因此模型的适应性较好。考虑到品酒员与标准之间的系统误差,采用秩和检验可以有效减少其影响。

(3)模型二中采用的逐步回归分析葡萄质量与理化指标之间的关系,在得到结果后,我们进行了正态性和残差齐次性的检验,确保结果的正确性。

(3)使用SPSS软件,帮助处理数据的相关性分析,操作简单而得到的结果可信度高。

7.2模型的缺点

(1)根据葡萄质量与理化指标之间的方程,我们代入数值,计算分数直接分级,缺少考虑分数是否分布具有一定现实规律。

(2)采用Wilcoxon符号秩和检验,当相同秩次较多时,统计量要校正;如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布,这时人为地将精确测量值变成顺序的秩,将丢失部分信息,造成检验功效下降。

八、参考文献

[1]. 祝国强.谈谈两总体比较的非参数检验方法[J].Journal of Mathematical Medical,524-525,2011.

[2]. 郑莉莉.葡萄酒香气成分分析的研究进展[J].中外葡萄与葡萄酒.38-40,2008.

[3].陈恩水,王峰.数学建模与实验[M].北京:科学出版社,2008年6月:1-9,162-169;

[4].李洪成, 姜宏华. SPSS数据分析教程. 北京:人民邮电出版社,2012:1-288;

[5].朱星宇,陈勇强.SPSS多元统计分析方法及应用[M].北京:清华大学出版社,2011:1-200

全国大学生数学建模竞赛题葡萄酒的评价答案

全国大学生数学建模竞赛题葡萄酒的评价答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

数学实验 计算机科学与技术 成员:xxx 学号:xxxxxxxxxx 葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显着性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显着性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着。 关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显着性差异,哪一组结果更可信 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

数学建模国家一等奖优秀论文

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写):B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3.

指导教师或指导教师组负责人(打印并签名): ?(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 2014 年 9 月15日 赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

2013全国数学建模大赛a题优秀论文

车道被占用对城市道路通行能力的影响 摘要 随着城市化进程加快,城市车辆数的增加,致使道路的占用现象日益严重,同时也导致了更多交通事故的发生。而交通事故发生过程中,路边停车、占道施工、交通流密增大等因素直接导致车道被占用,进而影响了城市道路的通行能力。本文在视频提供的背景下通过数据采集,利用数据插值拟合、差异对比、车流波动理论等对这一影响进行了分析,具体如下: 针对问题一,首先根据视频1中交通事故前后道路通行情况的变化过程运用物理观察测量类比法、数学控制变量法提取描述变量(如事故横断面处的车流量、车流速度以及车流密度)的数据,从而通过研究各变量的变化,来分析其对通行能力的影响。而视频1中有一些时间断层,我们可根据现有的数据先用统计回归对各变量数据插值后再进行拟合,拟合过程中利用残差计算值的大小来选择较好的模型来反应各变量与事故持续时间的关系,进而更好地说明事故发生至撤离期间,事故所处横断面实际通行能力的变化过程。 针对问题二:沿用问题一中的方法,对视频2中影响通行能力的各个变量进行数据采集,同样使用matlab对时间断层处进行插值拟合处理,再将所得到的的变化图像与题一中各变量的变化趋势进行对比分析,其中考虑到两视频的时间段与两视频的事故时长不同,从而采用多种对比方式(如以事故发生前、中、后三时段比较差值、以事故相同持续时间进行对比、以整个事故时间段按比例分配时间进行对比)来更好地说明这一差异。由于小区口的位置不同、时间段是否处于车流高峰期以及1、2、3道车流比例不同等因素的影响,采用不同的数据采集方式使采集的变量数据的实用性更强,从而最后得到视频1中的道路被占用影响程度高于视频2中的影响程度,再者从差异图像的变化波动中得到验证,使其合理性更强。 针对问题三:运用问题1、2中三个变量与持续时间的关系作为纽带,再根据附件5中的信号相位确定出车流量的测量周期为一分钟,测量出上游车流量随时间的变化情况,而事故横断面实际通行能力与持续时间的关系已在1、2问中由拟合得到,所以再根据波动理论预测道路异常下车辆长度模型的结论,结合采集数据得到的函数关系建立数学模型,最后得出事故发生后,车辆排队长度与事故横断面实际通行能力、事故持续时间以及路段上游车流量这三者之间的关系式。 针对问题四:在问题3建立的模型下,利用问题4中提供的变量数据推导出其它相关变量值,然后代入模型,估算出时间长度,以此检验模型的操作性及可靠性。 关键词:通行能力车流波动理论车流量车流速度车流密度

数学建模 葡萄酒评价模型

A题葡萄酒的评价 摘要 随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。 针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。 针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。但主成分法去掉了一部分数据,我们有用最小二乘法进行。 针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件

一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题: 1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析 两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以一方面,我们首先应当对评价数据进行2 拟合检验法[1],说明其服从正态分布;然后利用SPSS软件对两组评酒员的评价结果进行方差分析,计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。;最后采用t检验和F检验进行显著性分析。而一个较好的评价组员应是本着客观的原则进行评价,其评价结果通常较为均匀,因此,另一方面,我们应记录和讨论表中出现的异常数据,客观评价其出现的原因。综合以上,得出结论。 2.2 对问题二的分析 首先,我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级; 然后,对初步处理后的酿酒葡萄的理化指标对葡萄进行Q型聚类分析,将葡萄分成

全国数模竞赛优秀论文

一、基础知识 1.1 常见数学函数 如:输入x=[-4.85 -2.3 -0.2 1.3 4.56 6.75],则: ceil(x)= -4 -2 0 2 5 7 fix(x) = -4 -2 0 1 4 6 floor(x) = -5 -3 -1 1 4 6 round(x) = -5 -2 0 1 5 7 1.2 系统的在线帮助 1 help 命令: 1.当不知系统有何帮助内容时,可直接输入help以寻求帮助: >>help(回车) 2.当想了解某一主题的内容时,如输入: >> help syntax(了解Matlab的语法规定) 3.当想了解某一具体的函数或命令的帮助信息时,如输入: >> help sqrt (了解函数sqrt的相关信息)

2 lookfor命令 现需要完成某一具体操作,不知有何命令或函数可以完成,如输入: >> lookfor line (查找与直线、线性问题有关的函数) 1.3 常量与变量 系统的变量命名规则:变量名区分字母大小写;变量名必须以字母打头,其后可以是任意字母,数字,或下划线的组合。此外,系统内部预先定义了几个有特殊意 1 数值型向量(矩阵)的输入 1.任何矩阵(向量),可以直接按行方式 ...输入每个元素:同一行中的元素用逗号(,)或者用空格符来分隔;行与行之间用分号(;)分隔。所有元素处于一方括号([ ])内; 例1: >> Time = [11 12 1 2 3 4 5 6 7 8 9 10] >> X_Data = [2.32 3.43;4.37 5.98] 2 上面函数的具体用法,可以用帮助命令help得到。如:meshgrid(x,y) 输入x=[1 2 3 4]; y=[1 0 5]; [X,Y]=meshgrid(x, y),则 X = Y =

2012数学建模优秀论文 葡萄酒

江苏师范大学 第五届(2011)数学建模竞赛 我们选择的题号是: B 我们的参赛队号为:

2012江苏师范大学数学建模竞赛题目 B题研究生录取问题 摘要:根据问题的背景和题目要求,研究在不同条件的研究生录取问题,在对笔试,面试以及导师信息量化,加权平均求解的基础来解决研究生录取的问题。通过构造选择矩阵和满意度矩阵建立导师和学生之间的双向选择矩阵的0-1规划模型。利用测发编程计算求出最优解,从而求得问题的最优方案,同时采用降阶技巧和创建定理,快速的求解出实用的最优解,得到对应的最优方案! 一问题重述 某学校M系计划招收10名计划内研究生,依照有关规定由初试上线的前15名学生参加复试,专家组由8位专家组成。在复试过程中,要求每位专家对每个参加复试学生的以上5个方面都给出一个等级评分,从高到低共分为A,B,C,D四个等级,并将其填入面试表内。所有参加复试学生的初试成绩、各位专家对学生的5个方面专长的评分。 该系现有10名导师拟招收研究生,分为四个研究方向。导师的研究方向、专业学术水平(发表论文数、论文检索数、编(译)著作数、科研项目数),以及对学生的期望要求。在这里导师和学生的基本情况都是公开的。要解决的问题是: (1) 首先,请你综合考虑学生的初试成绩、复试成绩等因素,帮助主管部门确定10名研究生的录取名单。然后,要求被录取的10名研究生与10名导师之间做双向选择,即学生可根据自己的专业发展意愿(依次申报2个专业志愿)、导师的基本情况和导师对学生的期望要求来选择导师;导师根据学生所报专业志愿、专家组对学生专长的评价和自己对学生的期望要求等来选择学生。请你给出一种10名研究生和导师之间的最佳双向选择方案(并不要求一名导师只带一名研究生),使师生双方的满意度最大。 (2) 根据上面已录取的10名研究生的专业志愿,如果每一位导师只能带一名研究生,请你给出一种10名导师与10名研究生双向选择的最佳方案,使得师生双方尽量都满意。 (3) 如果由十位导师根据初试的成绩及专家组的面试评价和他们自己对学生的要求条件录取研究生,那么,10名研究生的新录取方案是什么?为简化问题,假设没有申报专业志愿,请你给出这10名研究生各申报一名导师的策略和导师各选择一名研究生的策略。相互选中的即为确定;对于剩下的导师和学生,再按上述办法进行双向选择,直至确定出每一名导师带一名研究生的方案,使师生都尽量满意。 (4) 学校在确定研究生导师的过程中,要充分考虑学生的申报志愿情况。为此,学校要求根据10名导师和15名学生的综合情况选择5名导师招收研究生,再让这5名导师在

数学建模--葡萄酒的分级(正式版)

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子 邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关 的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其 他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式 在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违 反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名):西安理工大学 参赛队员 (打印并签名) :1. 郑晓东 2. 罗璐 3. 宫维静 指导教师或指导教师组负责人 (打印并签名): 日期: 2013 年 05月 10 日

葡萄酒质量的综合评价分析 摘要 近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。 对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。 对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。 对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。

全国数学建模优秀论文

上海世博会影响力的定量评估 摘要 本文主要针对世博会对上海市的发展产生的影响力进行定量评估。 在模型一中,首先我们从上海的城市基础设施建设这一侧面定量评估世博会对上海市的发展产生的影响,而层次分析法是对社会经济系统进行系统分析的有力工具。所以我们运用层次分析法,构造成对比矩阵a,找到最大特征值 ,运用 进行一致性检验,这样对成对比矩阵a进行逐步修正,最终可以确定权向量。再运用模糊数学的综合评价法,通过组合权向量就可以得出召开世博会比没有召开世博会对上海城市基本设施建设的影响要高出40%。 在模型二中,上海世博会的影响力直接体现在GDP上,我们直接以GDP这个硬性直接指标来衡量上海世博会对上海的影响。因此我们运用线性回归的模型预测出在有无上海世博会这两者情况下的GDP的值,并将运用线性回归得到的数据与上海统计年鉴中的相关数据进行比较运算,算出误差在1.2%左右,这说明我们用线性回归得到的模型能准确地反映出世博会对上海GDP的影响。运用公式 可以计算出世博对上海GDP的影响力的大小为 。 关键词:层次分析法模糊数学线性回归城市基础建设 GDP 1 问题重述

2010年上海世博会是首次在中国举办的世界博览会。从1851年伦敦的“万国工业博览会”开始,世博会正日益成为各国人民交流历史文化、展示科技成果、体现合作精神、展望未来发展等的重要舞台。请你们选择感兴趣的某个侧面,建立数学模型,利用互联网数据,定量评估2010年上海世博会的影响力。 2 问题分析 对于模型一,为了定量评估2010年上海世博会的影响力,我们首先选取城市基础设施建设的投入这一个侧面,因为通过查找相关数据,我们发现,城市基础设施建设的投入在上海整个GDP的增长中占有很大的比重,对GDP的贡献占主体地位。而层次分析法是对社会经济系统进行系统分析的有力工具。为此,我们通过研究上海统计局的相关数据,使用层次分析法来评估世博会的召开对基础设施建设的投入的影响,目标层为世博会的召开对基础设施建设的投入的影响,准则层依次为电力建设、交通运输、邮电通信、公用事业、市政建设,方案层依次为没有召开世博时的影响、召开世博时的影响。首先我们通过层次分析法算出电力建设、交通运输、邮电通信、公用事业、市政建设的相对权重,然后应用模糊数学中的综合评价法对上海世博会对城市基础设施建设的影响作出综合的评价,应用综合评价法计算出没有召开世博和召开世博两种情况下的权重,从而得出上海世博会的召开对城市基础设施建设的影响。 对于模型二,直接以GDP这个硬性直接指标来衡量上海世博会对上海的影响。先根据上海没有申办世博会的GDP总额的相关数据,建立线性回归模型,由此预测不举办世博会情况下2010年上海市的GDP总额;再由2002年至2009年的GDP值用线性回归预测出举办世博会情况下2010年上海市的GDP总额,并将两种情况进行对比得出世博会对上海GDP的影响。 3 模型假设 3.1假设非典和奥运等重大事件对世博前的城市基础建设的投入影响很小,可以忽略。

美国大学生数学建模竞赛优秀论文翻译

优化和评价的收费亭的数量 景区简介 由於公路出来的第一千九百三十,至今发展十分迅速在全世界逐渐成为骨架的运输系统,以其高速度,承载能力大,运输成本低,具有吸引力的旅游方便,减少交通堵塞。以下的快速传播的公路,相应的管理收费站设置支付和公路条件的改善公路和收费广场。 然而,随着越来越多的人口密度和产业基地,公路如花园州公园大道的经验严重交通挤塞收费广场在高峰时间。事实上,这是共同经历长时间的延误甚至在非赶这两小时收费广场。 在进入收费广场的车流量,球迷的较大的收费亭的数量,而当离开收费广场,川流不息的车辆需挤缩到的车道数的数量相等的车道收费广场前。因此,当交通繁忙时,拥堵现象发生在从收费广场。当交通非常拥挤,阻塞也会在进入收费广场因为所需要的时间为每个车辆付通行费。 因此,这是可取的,以尽量减少车辆烦恼限制数额收费广场引起的交通混乱。良好的设计,这些系统可以产生重大影响的有效利用的基础设施,并有助于提高居民的生活水平。通常,一个更大的收费亭的数量提供的数量比进入收费广场的道路。 事实上,高速公路收费广场和停车场出入口广场构成了一个独特的类型的运输系统,需要具体分析时,试图了解他们的工作和他们之间的互动与其他巷道组成部分。一方面,这些设施是一个最有效的手段收集用户收费或者停车服务或对道路,桥梁,隧道。另一方面,收费广场产生不利影响的吞吐量或设施的服务能力。收费广场的不利影响是特别明显时,通常是重交通。 其目标模式是保证收费广场可以处理交通流没有任何问题。车辆安全通行费广场也是一个重要的问题,如无障碍的收费广场。封锁交通流应尽量避免。 模型的目标是确定最优的收费亭的数量的基础上进行合理的优化准则。 主要原因是拥挤的

2014年数学建模国家一等奖优秀论文设计

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参 赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括、电子、网上咨询等) 与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或 其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文 引用处和参考文献中明确列出。 我们重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违 反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3.

指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 2014 年 9 月 15日赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

全国数学建模获奖论文

承诺书 我们仔细阅读了数学建模竞赛选拔的规则. 我们完全明白,在做题期间不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与选拔题有关的问题。 我们知道,抄袭别人的成果是违反选拔规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守选拔规则,以保证选拔的公正、公平性。如有违反选拔规则的行为,我们将受到严肃处理。 我们选择的题号是(从A/B/C中选择一项填写): 队员签名:1. 2. 3. 日期:年月日

2012年河南科技大学数学建模竞赛选拔 编号专用页 评阅编号(评阅前进行编号): 评阅记录(评阅时使用): 评 阅 人 评 分 备 注

C题数学建模竞赛成绩评价与预测 一、摘要 近20 年来,CUMCM 的规模平均每年以20%以上的增长速度健康发展,是目前全国高校中规模最大的课外科技活动之一。本文对数学建模竞赛成绩的评价与预测问题进行了建模、求解和相关分析。 对于问题一,首先对广东赛区各院校2008-2011年建模奖励数据进行统计分析,将决策问题分为三个层次,建立多层次模糊综合评判模型。在该模型中,将因素集{国家一等奖,国家二等奖,省一等奖,省二等奖,省三等奖}看作准则层,将2008-2011各年建模情况看作方案层,结合实际情况,给出改进综合评判模型,解得广东金融学院、华南农业大学的总体综合评定成绩分别2.9474、2.7141,排名第一、第二。 对于问题二,首先建立单年的综合评定模型,得出广州赛区各院校2008-2011年的综合评定成绩。鉴于仅有4组数据,分别采用GM(1,1)法、回归曲线最小二乘法、移动平均法进行建模,最后结合实际情况并根据结果对比以上三种模型,确定了移动平均法方案最优,最终得出广东金融学院、华南农业大学的综合评定成绩分别为0.7369、0.6785,依旧排名第一、第二,较好地解决了问题二。 对于问题三,鉴于附件2所给数据冗杂庞大,故从中抽取2008-2011年的建模数据作为样本,分别统计出本科组和专科组在这四年中每年获得国家一等奖和国家二等奖的人数;将问题一中国家一等奖、二等奖的权重进行归一化处理,建立类似问题一的特殊综合评判模型,得出本科组哈尔滨工业大学、解放军信息工程大学的综合评定成绩分别为5.5117、4.6609;专科组海军航空工程学院、太原理工轻纺与美术学院的综合评定成绩分别为1.3931、1.3095,名列各组第一、第二,问题三得到了较好解决。 对于问题四,除全国竞赛成绩、赛区成绩外,讨论了学生的能力、参赛队数、师资力量、学校的综合实力、硬件设施等因素对建模成绩评估的影响,考虑首先对因素集进行模糊聚类分析,然后用层次分析法来进行评价,用BP神经网络结合Matlab软件来进行预测,理论上问题四能够得到较好地得到解决。 关键词: 模糊综合评判模型GM(1,1)模型移动平均法综合评定成绩

全国大学生数学建模竞赛题葡萄酒评价答案

葡萄酒的评价 摘要 本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。 在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。 在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。 在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。 在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,

有关葡萄酒评价的数学建模论文

葡萄酒的评价 摘要 本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。 关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得 P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。然后将第一组10位() 评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。 关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。 关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。 关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。 关键词:葡萄酒质量的评价EXCEL MATLAB 、主成分分析相关系数T-检验

1.问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2.问题分析 问题一要分析两组评酒员的评价结果有无显著性差异并判断哪一组结果更可信。由于题目中有数据缺失和错误数据,我们采用曲线拟合处理这一问题。因为所给数据是小样本,总体标准差 未知的正态分布资料,因此采用T检验,根据所求得的P值判断两个平均数的差异是否显著。然后将第一组10位评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,方差大的一组则说明其打分较为严格,即说明他们对待评酒较为认真,从而认为其较为可信。 问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。考虑到不清楚葡萄酒的理化指标与葡萄酒的质量之间的关系,所以分为两种情况进行分组分析。首先根据酿酒葡萄的理化指标,采用主成分分析法给酿酒葡萄综合评分并排序,根据综合评分的排序结果对酿酒葡萄样品分级;然后将问题一所得出的较为可信的一组酒样品的评分作为葡萄酒的质量并以此分级,此即为各葡萄酒样品对应的酿酒葡萄样品的另一种分级情况。 问题三要求分析酿酒葡萄与葡萄酒理化指标之间的联系,即要求得出它们各项理化指标之间联系的紧密程度,所以采用回归分析的方法计算它们的各理化指标的相关系数,然后以相关系数的绝对值大小表示它们之间联系的紧密程度。 问题四要求探究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并判断用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。考虑到问题三已经得出酿酒葡萄和葡萄酒理化指标之间的联系,且葡萄酒的理化指标相对较少,因此选择分析葡萄酒的理化指标对葡萄酒质量的影响。可以通过前面的结果,得出葡萄酒的理化指标对葡萄酒产生影响的几个主要因素,再依据这几个因素结合葡萄酒质量排序,便可以得出这几个因素对葡萄酒质量的影响。第二小问将附表3中的芳香物质考虑进来,判断其对葡萄酒质量是否有影响,从而论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

数学建模葡萄酒的评价

葡萄酒的评价 摘要 葡萄拥有很高的营养价值,本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析,对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。 针对问题一,我们首先分别计算每类葡萄酒样品在两组组评酒师评价下的综合得分,以此作为每组评酒师的最终评价结果。再运用统计学中的T 检验进行假设与检验,得出两组评价结果具有显著性差异。最后通过计算各组评价员的评价结果的标准差,以此推算稳定性指标值P ,P 值较大的可信度较高,得出2p p <红1红与2P P <白1白,进而得出第二组的评价结果更加可信。 针对问题二,我们分别对两组葡萄进行分类。在这里我们采用聚类分析法和主成分分析法,在matlab 中实现对酿酒葡萄的分类。 针对问题三,根据σ μ -= x Z 对附件2中的数据进行标准化处理,排除单位不同的影响。以酿 酒葡萄的30个一级理化指标作为自变量X ,葡萄酒9个一级的理化指标作为因变量y,建立多元线性回归模型εβ+=X y ,得出酿酒葡萄的理化指标与葡萄酒的理化指标之间的联系即回归系数矩阵 β。 针对问题四,用灰色关联度分析对两者的关系进行度量,求得理化指标对样品酒的的关联系数。然后根据葡萄酒综合得分及指标的相关系数得出样品酒的综合指标,通过MATLAB 软件对综合指标与第二问中葡萄酒的分数进行指数拟合,拟合效果不佳,因此不能定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只能根据图像大致猜测综合指标与葡萄酒的质量负相关。 关键词:T 检验 聚类分析法 主成分分析法 Z 分数 多元线性回归 一、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理

2011年全国数学建模大赛A题获奖论文

城市表层土壤重金属污染分析 摘要 本文旨在对城市土壤地质环境的重金属污染状况进行分析,建立模型对金属污染物的分布特点、污染程度、传播特征以及污染源的确定进行有效的描述、评价和定位。 对于重金属空间分布问题,首先基于克里金插值法,应用Surfer 8软件对各数据点的分布情况进行模拟,得到了直观的重金属污染空间分布图形;随后,分别用内梅罗综合污染指数以及模糊评价标准和模型对城区内不同区域重金属的污染程度进行了评判。 对于金属污染的主要原因分析问题,基于因子分析法、问题一的结果和对各个金属污染物的来源分析等因素,判断出金属污染的主要原因有:工业生产、汽车尾气排放、石油加工并推测该区域是镍矿富集区。随后讨论了污染源之间的相互关系和不同金属的污染贡献率。 针对污染源位置确定问题,我们建立了两个模型:模型一以流程图的形式出现,基于污染传播的一般规律建立模型,求取污染源范围,模型作用更倾向于确定污染源的位置;模型二基于最小二乘法原理,建立了拟合二次曲面方程,在有效确定污染源的同时也反映了其传播特征,模型更加清楚,理论性也更强。 在研究城市地质环境的演变模式问题中,我们对针对污染源位置确定问题所建模型的优缺点进行了评价,同时建立了考虑了时间,地域环境和传播媒介的污染物传播模型,从而反映了地质的演变。 综上所述,本文模型的特点是从简单的模型建立起,强更准确的数学模型发展,逐步达到目标期望。 关键词:重金属污染,克里金插值最小二乘法因子分析流程图

一、问题重述 1.1问题背景 随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。评价和研究城市土壤重金属污染程度,讨论土壤中重金属的空间分布,研究城市土壤重金属污染特征、污染来源以及在环境中迁移、转化机理,并对城市环境污染治理和城市进一步的发展规划提出科学建议,不仅有利于城市生态环境良性发展,有利于人类与自然和谐,也有利于人类社会 健康和城市可持续发展[1] 。按照功能划分,城区一般可分为生活区、工业区、山区、主干道路区及公园绿地区等,不同的区域环境受人类活动影响的程度不同。 现对某城市城区土壤地质环境进行调查。为此,将所考察的城区划分为间距1公里左右的网格子区域,按照每平方公里1个采样点对表层土(0~10 厘米深度)进行取样、编号,并用GPS 记录采样点的位置。应用专门仪器测试分析,获得了每个样本所含的多种化学元素的浓度数据。另一方面,按照2公里的间距在那些远离人群及工业活动的自然区取样,将其作为该城区表层土壤中元素的背景值。 1.2 目标任务 (1) 给出8种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金属的污染程度。 (2) 通过数据分析,说明重金属污染的主要原因。 (3) 分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。 (4) 分析所建立模型的优缺点,为更好地研究城市地质环境的演变模式,分析还应收集的信息,并进一步探索怎样利用收集的信息建立模型及解决问题。 二、 模型假设 1)忽略地下矿源对污染物浓度的影响; 2)认为海拔对污染物的分布较小,故只在少数模型中讨论其作用; 3)认为题目中的采样方式是科学的,能够客观反映污染源的分布。 三、 符号说明 3.1第一问中的符号说明 i p ——污染物i 的环境污染指数 i C ——污染物i 的实测值 i S ——污染物i 的背景值 m ax (/)i i C S ——土壤污染指数的最大值 (/)i i avg C S ——土壤污染指数的平均值

数学建模葡萄酒评价.docx

A题:葡萄酒的评价 摘要 本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理 化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型, 解决了葡萄酒的评价问题。 问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel 画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。 问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法(AHP )来确定影响葡萄品质的各 因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表: 等级优良中合格葡萄种类 红葡萄54108 白葡萄8892 问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP 神经网络进行比较验证。 问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量 间的联系。通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价 分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。 本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。 关键词:方差分析 Excel 逐步回归分析Bp 神经网络聚类分析Matlab DPS 数据处理系统

一、问题重述 通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题: 1.分析两组评酒员的评价结果有无显着性差异,哪一组结果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析 问题一:观察附表 1 中评酒员的评价结果数据,分析得出它们之间的差异。根据评酒员对各组葡 萄酒的评价结果数据,寻求结果数据更加稳定的一组,作为目标,利用求方差的数学模型, 对各个数量指标进行分析比较,得出更有可信度组。 问题二:根据不同理化指标对于酿酒葡萄影响各不相同,用层次分析法构造比较矩阵。计算得到各个因素所对应的权重,定一个分数指标,根据分数对葡萄进行分级。 问题三:题中葡萄与葡萄酒指标数分别为 60、17,考虑因变量太多,用逐步回归分析法建立求解模型,结合神经网络模型进行对比验证。将多次测试值取平均数,获得可信数据。 问题四:考虑参数过多,为剔除微小影响因素,通过聚类分析法对影响指标进行归类,寻找主要因素,用神经网络建立模型,获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数,与第二组评酒员评价数据比较分析,作为论证依据。 三、模型假设及符号说明 3.1 模型假设 (1)假设评酒员给出的评价数据不存在个人因素。 (2)假设一级指标只与一级指标相互影响,二级指标只与二级指标相互影响。 (3)假设葡萄分级时忽略二级指标对结果的影响。 3.2 符号说明 i:表示第 i 个处理观测值总体平均数。 ij :表示试验误差。 i : 表示处理i 对试验结果产生的影响。 x ij:表示i ij 总和。 ss :表示误差平方和。 e ss t表示处理间平方。

全国大学生数学建模竞赛b题全国优秀论文

基于打车软件的出租车供求匹配度模型研究与分析 摘要 目前城市“出行难”、“打车难”的社会难题导致越来越多的线上打车软件出现在市场上。“打车难”已成为社会热点。以此为背景,本文将要解决分析的三个问题应运而生。 本文运用主成分分析、定性分析等分析方法以及部分经济学理论成功解决了这三个问 题,得到了不同时空下衡量出租车资源供求匹配程度的指标与模型以及一个合适的补贴 方案政策,并对现有的各公司出租车补贴政策进行了分析。 针对问题一,根据各大城市的宏观出租车数据,绘制柱形图进行重点数据的对比分 析,首先确定适合进行分析研究的城市。之后,根据该市不同地区、时间段的不同特点 选择多个数据样本区,以数据样本区作为研究对象,进行多种数据(包括出租车分布、 出租车需求量等)的采集整理。接着,通过主成分分析法确定模型的目标函数、约束条 件等。最后运用spss软件工具对数据进行计算,求出匹配程度函数F 与指标的关系式, 并对结果进行分析。 针对问题二,在各公司出租车补贴政策部分已知的情况下,综合考虑出租车司机以 及顾客两个方面的利益,分别就理想情况与实际情况进行全方位的分析。在问题一的模 型与数据结果基础上,首先分别从给司机和乘客补贴两个角度定性分析了补贴的效果。 重点就给司机进行补贴的方式进行讨论,定量分析了目前补贴方案的效果,得出了如果 统一给每次成功的打车给予相同的补贴无法改善打车难易程度的结论,并对第三问模型 的设计提供了启示,即需要对具有不同打车难易程度和需求量的区域采取分级的补贴政 策。 针对问题三,在问题二的基础上我们设计了一种根据不同区域打车难易程度和需求

量来确定补贴等级的方法。设计了相应的量化指标,以极大化各区域打车难易程度降低 的幅度之和作为目标,建立该问题的规划模型。目的是通过优化求解该模型,使得通过 求得的优化补贴方案,能够优化调度出租车资源,使得打车难区域得到缓解。通过设计 启发式原则和计算机模拟的方法进行求解,并以具体案例分析得到,本文方法相对统一 的补贴方案而言的确可以一定程度缓解打车难的程度。 关键词:主成分分析法,供求匹配度,最优化模型,出租车流动平衡 1

相关主题
文本预览
相关文档 最新文档