当前位置:文档之家› 中国农大_数学建模民生杯一等奖论文

中国农大_数学建模民生杯一等奖论文

中国农大_数学建模民生杯一等奖论文
中国农大_数学建模民生杯一等奖论文

承诺书

我们仔细阅读了“民生杯”数学建模与计算技术应用大赛的竞赛规则。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与本队以外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们愿意承担由此引起的一切后果。

我们的参赛报名号为:15

参赛组别(本科、专科或研究生):本科

参赛队员(签名) :

队员1:訾海

队员2:田凯强

队员3:周金辉

获奖证书邮寄地址:北京市海淀区清华东路17号中国农业大学

编号专用页

参赛队伍的参赛号码:(请各个参赛队提前填写好):竞赛统一编号(由竞赛组委会送至评委团前编号):竞赛评阅编号(由竞赛评委团评阅前进行编号):

目录

摘要 (4)

一、问题分析 (5)

二、模型假设和建立 (5)

2.1 模型假设及变量说明 (5)

2.2 缺失数据的补充 (5)

2.3 模型的建立 (9)

2.3.1 第Ⅰ类模型:逐步回归法 (9)

2.3.1.1 单指标逐步回归模型: (10)

2.3.1.2 多指标逐步回归模型: (13)

2.3.2 第Ⅱ类模型:聚类回归法 (17)

2.3.2.1单指标聚类回归模型 (20)

2.3.2.2多指标聚类回归模型 (20)

2.3.3.1主成分分析法介绍 (21)

2.3.3.1.2主成分分析数学模型 (21)

2.3.3.1.3主成分分析的求解原理 (22)

2.3.3.1.4 主成分分析运用的判定条件 (23)

2.3.3.1.5确定主成分个数的方法 (23)

2.3.3.1.6确定权重计算综合得分 (23)

2.3.3.3.2主成分的确定 (25)

2.3.3.3.3计算得分系数 (27)

三、模型的评价准则 (30)

四、模型的优缺点 (31)

五、参考文献 (31)

六、附录 (31)

洗衣粉去污功效研究

摘要

本文通过对86种产品的21个溶液属性数据和18中污渍的去污能力数据进行分析,建立了三大类反映溶液属性和去污能力之间关系的模型:一、利用逐步回归思想,选取单个及多个指标来代表所有指标,建立了单指标模型和多指标模型;二、利用聚类分析思想对庞大数据分类,再对各类数据利用逐步回归法,选择单个或者多个指标,建立单指标模型和多指标模型;三、利用主成分分析思想分别提取了21个溶液属性指标的4个主成分和18个去污功效指标的4个主成分,再运用多元统计分析的思想建立两类主成分之间的关系。其中,第二类模型是对第一类模型的改进和优化。

对于前两类模型,本文使用MATLAB软件以及C++计算机编程进行求解。本文还提出了模型评价机制,利用该评价准则,从前两类模型的四个模型中选出了最优的模型:基于聚类分析思想的多指标逐步回归模型。回归的结果为: Y1=-2.34X2-0.93X3-0.21X9+1.11X17+29.73

Y2=-0.0063X1+2.98X2+0.7466X8+58.76

Y3=-0.11X9-0.5X16+25.809

本文还利用剩余的10组数据对模型进行了检验,发现模型效果良好。对于缺失的数据,本文以补充后数据的标准差尽可能小的办法进行补充,有些选取的是均值,有些选取的是平方项,有些选取的是交互项。

关键字:去污功效洗衣粉聚类分析主成分分析逐步回归

一、问题分析

通过对96组产品进行分析,文中提供了21个衡量水溶液属性的因子和评价洗衣粉的去污效果的18个指标。题目要求我们通过这些数据设法得到最合理描述溶液属性和去污效果之间关系的模型。于是,我们面临着两大难题:

如何从这么多的属性因子中挑选出最重要最相关的因子?

怎样选取最有价值的去污衡量指标?

通过聚类思想、主成分提取思想以及计算机编程,这两个问题被很好的解决。在此基础上,我们的模型也建立了起来。

二、模型假设和建立

2.1 模型假设及变量说明

在建立模型之前,我们将做出一些假设以使问题得到简化,并将我们文中使用的变量和符号进行说明。

(1)以前86组数据为研究样本,后10组数据为检验样本不影响原始数据的分布规律;

(2)相近的数据可以并为一类;

(3)缺失的数据可以通过某种方式补齐

(4)题目所给数据完全正确,不考虑实验误差和记录错误

2.2 缺失数据的补充

经分析,PP02 和PP03 的缺失数据总是成对出现且缺失程度相同,不妨考虑用相同的方法进行研究。

根据逐步回归的思想及matlab 实现,O07、O05、O17 是对PP02 影响显的变量。

建立PP02 关于O07、O05、O17 的多元线性回归方程

20117201318

pp o o o x m n y p y q y =+++ (1)

利用PP02、O07、O05、O17 均完整的80 组数据求解系数,可得

0m =11.1,1n =-0.14,p2=-0.026,3q =0.067

对于PP02 缺失的6 组数据,利用(1) 式,即可完成预测(具体数据见附表)。

经计算可知,对于预测前PP02 完整的80 组数据,其均值和标准差分别为

1 1 0.3456, 1.4845

对于预测后PP02 完整的86 组数据,其均值和标准差分别为

2 2 -0.3983, 1.4461

所以,用上述方法对PP02 缺失的6 组数据的预测是比较合适的。 同理,知17、O01、O18 是对PP03 影响显著的变量。

建立PP03 关于O17、O01、O18 的多元线性回归方程

5015'pp pp x d d x =+20117201318

pp o o o x m n y p y q y =+++

利用PP03、O17、O01、O18 均完整的80 组数据求解系数,可得

77μσ==01235.6,0.16,0.029,0.099b b b b ==-==

对于预测前PP03 完整的80 组数据,其均值和标准差分别为

3μ= 4.623σ=1.99

对于预测后PP03 完整的86 组数据,其均值和标准差分别为

4μ= 4.59,4σ=1.9

近似相等,已经很吻合了。

以下对PP04 和PP05 进行分析研究: 用matlab 画出PP4——PP5数据:

观察图01 可知,PP04 和PP05 之间确实是存在较好的线性关系。利用此性质,可在PP04 与PP05 之间建立一个线性回归方程:

4015

pp pp x m m x =+

可得

0m =0.4,1m =0.59

如何对PP05 的缺失数据做出合理预测呢?设PP05’表示PP04 与PP06 的线性组合:PP04+PP06。做出其散点图:

PP05 和PP05’也存在较好的线性关系。利用此性质,可在PP05 和PP05’ 之间建立一个线性回归方程:

5015'

pp pp x d d x =+

可推导出 经计算可知,

对于预测后PP04 完整的86 组数据,其均值和标准差分别为

6μ=81.9,6σ=13.9 对于预测前PP05完整的86组数据,其均值和标准差分别为 7μ=139.5,7σ=23.0

所以,比较合适。

2.3 模型的建立

2.3.1 第Ⅰ类模型:逐步回归法

在这里,我们认为描述溶液属性的18个因子中,仅有有限个因子对最终的去污效果有显著的作用。因此我们需要从18个因子中挑选出重要变量和非重要变量,而在后续的最小二乘法回归中,我们采用的自变量便是之前挑选出来的重要变量。

虽然题中给出了21个自变量PP1—PP21,但是不一定每一项都对洗衣粉去污功效Y有显著影响,考虑到各项之间或许有很强的相关性,我们挑出那些对整体Y有显著影响的来建立回归模型。变量选择的标准,应该是将所有对因变量影响显著的自变量都选入模型,而影响不显著的自变量都不选入模型,从便于应用的角度使模型中自变量的个数尽可能小。逐步回归就是一种从众多自变量中有效的选择重要变量的方法。

其基本思路是,先确定一个包含若干自变量得出试剂盒,然后每次从集合外的变量中引入一个对因变量影响最大的,在对集合中的变量进行检验,从变得不显著的变量中移出一个影响最小的,以此进行,直到不能引入和移出为止。引入

在去污效果的衡量指标中,在实际生活中,有的人希望用一个值来衡量去污好坏,太多的指标让他们无所适从;有的人希望用几个指标来描述去污效果,这样显得客观。因此我们建立了两个子模型:单指标模型和多指标模型。

2.3.1.1 单指标逐步回归模型:

首先我们将O1到O18变量进行处理,新建变量O ,代表综合的唯一的去污衡量指标。而O 的数据,我们通过加权平均法得到。

[]12121818O O O O ωωω????

??= ??????

其中上式中的各权值通过下式得到:

11811

,(1,2,1,2)N

ij

j i N

ij

i j O

i j O

ω====

==∑∑∑

其中

ij

O 是第i 个去污衡量指标的第j 次抽样值。

用matlab 工具箱中的逐步回归命令stepwise 求解,可以得到Stepwise Table 和Stepwise Plot ,如下:

根据人机交互式画面,我们在画面上随意的引入与移出变量,计算机协助我们找到最终结果:当模型中仅含X1、X2、X8、X9(对应原来数据的PP1、PP2、PP8、PP9)时,其回归系数置信区间远离零点,说明X1、X2、X8、X9对因变量的综合性能有显著影响。

有图为证:

图五

前四幅图为正面论证,图五为反面论证,任意选取一个(除X1、X2、X8、X9以外)因变量X11,其结果仍调整为关于X1、X2、X8、X9,足见X1、X2、X8、X9对因变量影响是显著的。此时,

Intercept=68.87 R-square=0.632 F=21.04 RMSE =6.145 Adj R-sq =0.602 p=3.81e-010 易求得

011223849b Y b X b X b X b X =----= 67.75

利用逐步回归,最终结果为:

Y=0.00325X1-1.65X2-0.41X8+0.302X9+67.75

2.3.1.2 多指标逐步回归模型:

观察到去污效果的18组数据中有几组数据很接近,我们有理由认为这些去污指标中存在相关关系,并非是相互独立的。因此通过检验互相关系数矩阵,我们选取相关性最小的几个去污指标作为模型的输出变量。

我们用matlab 软件求出18个输出变量的相关系数(即每一 列向量的相关性),如下:

1.0000 0.2073 0.3364 0.7961 0.7555 0.7930 0.1923 0.2478 0.7253 0.6517 0.6250 0.6649 0.3530 0.3057 0.2211 0.1931 0.1593 0.1415

0.2073 1.0000 0.8763 0.3538 0.3548 0.2636 0.8005 0.7498 0.2951 0.4003 0.3517 0.3105 0.4999 0.5025 0.2932 0.2506 0.4252 0.3724

0.3364 0.8763 1.0000 0.5509 0.5539 0.3471 0.9095 0.8793 0.5262 0.5633 0.5368 0.5255 0.7164 0.7218 0.3510 0.3160 0.6604 0.5614

0.7961 0.3538 0.5509 1.0000 0.8314 0.6723 0.4418 0.5492 0.8772 0.7343 0.6977 0.7690 0.6596 0.6163 0.3011 0.3851 0.4717 0.4482

0.7555 0.3548 0.5539 0.8314 1.0000 0.7250 0.4773 0.4873 0.8351 0.8096 0.8202 0.8212 0.6655 0.6457 0.2701 0.2410 0.4716 0.3827

0.7930 0.2636 0.3471 0.6723 0.7250 1.0000 0.2851 0.2080 0.6085 0.5449 0.5136 0.5297 0.2828 0.2441 0.2501 -0.1193 0.1099 -0.0425

0.1923 0.8005 0.9095 0.4418 0.4773 0.2851 1.0000 0.8616 0.4692 0.4864 0.4601 0.4645 0.7904 0.7942 0.4663 0.2955 0.7363 0.6223

0.2478 0.7498 0.8793 0.5492 0.4873 0.2080 0.8616

1.0000 0.5637 0.5270 0.4983 0.5167 0.7887 0.8078 0.4159 0.4736 0.7577 0.7224

0.7253 0.2951 0.5262 0.8772 0.8351 0.6085 0.4692 0.5637 1.0000 0.8089 0.7830 0.8305 0.7300 0.6931 0.2753 0.3789 0.5772 0.5297

0.6517 0.4003 0.5633 0.7343 0.8096 0.5449 0.4864 0.5270 0.8089 1.0000 0.9510 0.9547 0.6530 0.5982 0.1003 0.2924 0.3999 0.4637

0.6250 0.3517 0.5368 0.6977 0.8202 0.5136 0.4601 0.4983 0.7830 0.9510 1.0000 0.9562 0.6500 0.6075 0.0440 0.2712 0.3740 0.4423

0.6649 0.3105 0.5255 0.7690 0.8212 0.5297 0.4645 0.5167 0.8305 0.9547 0.9562 1.0000 0.6995 0.6446 0.1146 0.2975 0.4404 0.4814

0.3530 0.4999 0.7164 0.6596 0.6655 0.2828 0.7904 0.7887 0.7300 0.6530 0.6500 0.6995 1.0000 0.9769 0.4870 0.5297 0.8444 0.8059

0.3057 0.5025 0.7218 0.6163 0.6457 0.2441 0.7942 0.8078 0.6931 0.5982 0.6075 0.6446 0.9769 1.0000 0.4903 0.5105 0.8769 0.8139

0.2211 0.2932 0.3510 0.3011 0.2701 0.2501 0.4663 0.4159 0.2753 0.1003 0.04400.1146 0.4870 0.4903 1.0000 0.4034 0.5311 0.4375

0.1931 0.2506 0.3160 0.3851 0.2410 -0.1193 0.2955 0.4736 0.3789 0.2924 0.2712 0.2975 0.5297 0.5105 0.4034

1.0000 0.4107 0.6901

0.1593 0.4252 0.6604 0.4717 0.4716 0.1099 0.7363 0.7577 0.5772 0.3999 0.3740 0.4404 0.8444 0.8769 0.5311 0.4107 1.0000 0.7897

0.1415 0.3724 0.5614 0.4482 0.3827 -0.0425 0.6223 0.7224 0.5297 0.4637 0.4423 0.4814 0.8059 0.8139 0.4375

0.6901 0.7897 1.0000

我们用计算机自动查找出 小的非常特殊的两个量:0.0440、0.0425(图中红色数据),其坐标为(15,12)、(18,7),由此,我们可以充分选出能分别代表三组输出变量的 列向量:r7代表第一组,r12代表第二组,r15代表第三组。(由下文第二类模型的结果知,我们在18组因变量中 选出最主要的三组)

选Y1=r7,重新带入上文的单指标逐步回归模型,用matlab 求解:

同样根据人机交互式画面,我们在画面上随意的引入与移出变量,计算机协助我们找到最终结果:当模型中仅含X2、X3、X9、X17时,其回归系数置信区间远离零点,说明X2、X3、X9、X17对因变量的综合性能有显著影响。此时,

Intercept=29.8165 R-square=0.682 F=26.2533 RMSE =4.04 Adj R-sq =0.6558 p=1.155e-011 易求得

01122339417b Y b X b X b X b X =----= 29.73

利用逐步回归,最终结果为:

Y1=-2.34X2-0.93X3-0.21X9+1.11X17+29.73 选Y2=r12,重新带入,用matlab 求解:

我们在画面上随意的引入与移出变量,计算机协助我们找到最终结果:当模型中仅含X1、X2、X8时,其回归系数置信区间远离零点,X1、X2、X8对因变量的综合性能有显著影响。此时,

Intercept=57.3137 R-square=0.429975 F=12.5718 RMSE =14.7321 Adj R-sq =0.39577 p=3.03815e-006 易求得

02112238b Y b X b X b X =---=58.76

利用逐步回归,最终结果为:

Y2=-0.0063X1+2.98X2+0.7466X8+58.76 选Y3=r15,重新带入,用matlab 求解:

计算机找到最终结果: 当模型中仅含X9、X16时,其回归系数置信区间远离零点,X9、X16对因变量的综合性能有显著影响。此时,

Intercept=25.7258 R-square=0.24317 F=8.19316 RMSE =3.01556 Adj R-sq =0.21349 p=8.21219e-004 易求得

0319216b Y b X b X =--=25.809

利用逐步回归,最终结果为:

Y3=-0.11X9-0.5X16+25.809 故多指标逐步回归模型的结果为:

Y1=-2.34X2-0.93X3-0.21X9+1.11X17+29.73 Y2=-0.0063X1+2.98X2+0.7466X8+58.76

Y3=-0.11X9-0.5X16+25.809

2.3.2 第Ⅱ类模型:聚类回归法

由于题目中的变量太多,如果直接由这么多的变量进行建模的话,非常耗费时间和精力,而且没有这么做的必要。所以,为了精简模型,我们对这些变量进行聚类操作,将作用相似的变量合并为一个变量,然后进行进一步的操作。

聚类的算法大致如下,每一个变量可以看成是一个类,类与类之间的相似程度的测量使用类间距离,设Gp 与Gq 分别表示两个类,它们分别含有np 和nq 个样本。类Gp 与Gq 之间的距离记为Dpq ,类平均距离

ij G i G i q p pq d n n D q

p ∈∈∑∑=

1

确定了样本间及类间的距离之后,便可以对样本进行分类。应用最广泛的一

种分类方法就是系统聚类法,其计算流程如下:

将n 个样本分为n 类,每类一个样本,然后计算任意两个样本之间的距离,构成一个对称距离矩阵

?

?

???

??

?????=0002

1221112)

0( n n n n d d d d d d D

(1) 选择)0(D 中的非对角线上的最小元素,设这个最小元素是pq D 。此时,

}{p p x G =与}{q q x G =距离最近,将q p G G ,合并成一个新类},{q p r G G G =。在

)0(D 中消去p G 和q G 所对应的行与列,并加入由新类r G 与剩下的其他未聚合的类间的距离所组成的新的矩阵)1(D ,它是一个n-1阶方阵;

(2)

从)1(D 出发重复(2)的做法得)2(D ,再由)2(D 出发重复上述步骤,

直到n 个样品聚为1个大类为止。

(3) 在合并过程中记下合并样品的编号及两类合并时的水平(即距离)并绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。

为了对这些变量进行分类,我们设计的程序进行求解。程序采用Visual Basic 6进行编写,在Windows 7的环境下编译通过。在程序中,为了处理Excel 表格中的数据,我们把Excel 的格式转换为CSV (逗号分隔文件)格式,然后导入到程序中进行求解。

程序的设计算法如下:

1、 加载原数据文件,利用二维表存储各项指标以及数据;

2、 对每一列数据进行计算,求得数据的平均值;

3、 将n 个样本分为n 类,构造一个n*n 的矩阵,矩阵中的元素d ij 代表指标j 和指标i 的距离;

4、 这个矩阵为对称矩阵,求得矩阵上三角形中的最小距离的值以及对应的i 和j 的值;

5、 将指标i 和指标j 合并到i ,用指标i 和指标j 的中值取代指标i 的值;

6、 输出合并操作的对应参数;

7、 此时剩下n-1阶矩阵,重新构造一个(n-1)*(n-1)阶的矩阵,计算其中的两两指标之间的距离;

8、 重复上述操作,每执行完一次操作之后便将矩阵的阶数减一,直到最后矩阵的阶数为2,结束算法。 程序的流程图如下所示:

程序在执行完之后,产生了一个日志文件,根据这个日志文件,我们将输入

模型和多指标聚类回归模型。

2.3.2.1单指标聚类回归模型

我们首先对题目的给出的18个去污指标进行加权处理,得到唯一的综合指标:

[]12121818O O O O ωωω????

??= ??????

其中上式中的各权值通过下式得到:

11811

,(1,2,1,2)N

ij

j i N

ij

i j O

i j O

ω====

==∑∑∑

其中ij O 是第i 个去污衡量指标的第j 次抽样值。

然后通过对21个溶液属性因子进行聚类,我们最终采用PP1、PP2、PP4、PP5 、PP6、PP9,这六组。进行多元线性回归得到回归方程如下:

87.42360.00351 1.542320.467740.322250.597560.07149

O PP PP PP PP PP PP =+-+--+

2.3.2.2多指标聚类回归模型

由于观察到18个去污指标中,有些指标相似度比较高,因此我们仍采用聚类思想。

然后我们利用聚类后的溶液属性因子分别针对三个去污指标做回归分析,利用stata11软件最终得到回归方程如下:

111106.1259,0.0047, 1.6173,0.2146,0.0763, 1.5069,0.022429114.5856,0.0049, 1.0663,0.4570,0.3880, 1.0592,0.066241381.6157,0.0050, 2.5623,0.8461,0.7045,0.7055,0.0457PP O PP O PP O PP ----????????=---????????---???? 569PP PP ??????

?????

???

????????

2.

2013深圳杯数学建模D题

自然灾害保险问题的研究 摘要 我国是农业大国,又是世界上遭受自然灾害损失最为严重的国家之一。近10年来,自然灾害给我国造成的经济损失每年都在1000亿元以上。自然灾害对农业经济发展的影响非常严重。但与国际上大灾风险主要通过保险机制来分担化解的做法不同,我国自然灾害损失的救助工作主要依靠国家财政援助和生产自救进行,有关自然灾害风险防范的保险体系尚未真正建立。因此,必需改革目前的保险体制,探索建立巨灾保险救助和通过资产证券化等非传统风险转移方式分散农业巨灾风险的新途径,有效地提升保险在国家灾害救助体系中的积极作用,因此我们分析了近几年天气,各地区的农作物种植面积,受灾,成灾,绝收面积的有关数据,得出了自然灾害的变化趋势,通过Excel,matlab等软件建立了几个模型以及分析出了受灾面积的函数y=-879.8x+2E+6,R*R=0.089,成灾面积y=-132.6X+21663,R*R+0.003绝收面积的函数y=-328.1X+66308,R*R=0.307并且还分析了出了降水量,风速,冰雹在近几年的变化趋势,为今后的预防工作和提出更加合理的保险险种方案做出了充分的准备。 关键词:自然灾害、保险险种、灾害变化趋势、土地种植面积、模型的建立 一、问题重述 根据2013年3月5日《环球时报》转摘美国《商业周报》的相关报道,“在2012年全世界发生的10大自然灾害中,有4场是发生在中国。包括3场严重的夏季洪涝灾和席卷苏鲁冀等沿海地区的台风‘达维’造成的灾害。另外,还有很多地区遭受了严重干旱、冰雹等自然灾害,共造成290亿美元的损失,但通过投保由保险公司赔付的比例仅占总损失的4%左右,这个比例相对美国的自然灾害保险赔付率相差甚远。”另据报道:“2013年3月20日发生在广东、广西等省部分地区的一场大风和冰雹灾害,造成直接经济损失达13亿多元。”这个事实警示我们,中国需要重视和加强自然灾害保险的研究和实践,特别是针对严重自然灾害的保险体系建设和对策方案的研究,推动由政府主导的自然灾害政策性保险方案的实施。 农业灾害保险是国家政策性保险之一,即政府为保障国家农业生产的发展,基于商业保险的原理并给予政策扶持的一类保险产品。农业灾害保险也是针对自然灾害,保障农业生产的重要措施之一,是现代农业金融服务的重要组成部分,它与现代农业技术、现代农业信息化及市场建设共同构成整个农业现代化体系。农业灾害保险险种是一种准公共产品,基于投保人、保险公司和政府三方面的利益,按照公平合理的定价原则设计,由保险公司经营的保险产品,三方各承担不同的责任、义务和风险。农业灾害保险分种植业保险和养殖业保险两大类,现有几十个险种,因不同地区的气象条件和作物种类不同,其险种和设置方案都不尽相同。农业灾害保险除遵循保险的共同原理外,有其自身的特点。比如,其损失规律有别于人寿保险和通常的财产保险(如汽车险)等。政府作为投保人和承保人之外的第三方介入以体现对国家安全和救灾的责任。附件1给出了P省种植业现行的部分险种方案,请你们从实际出发,查阅和参考附件中的数据资料,通过分析建模,研究解决下面的问题:(1)对附件2中的数据做必要的统计分析,研究P省现有农业灾害保险险种方案可能存在的风险,并分析其方案是否存在不合理性。

数学建模美赛o奖论文

For office use only T1________________ T2________________ T3________________ T4________________ Team Control Number 55069 Problem Chosen A For office use only F1________________ F2________________ F3________________ F4________________ 2017 MCM/ICM Summary Sheet The Rehabilitation of the Kariba Dam Recently, the Institute of Risk Management of South Africa has just warned that the Kariba dam is in desperate need of rehabilitation, otherwise the whole dam would collapse, putting 3.5 million people at risk. Aimed to look for the best strategy with the three options listed to maintain the dam, we employ AHP model to filter factors and determine two most influential criteria, including potential costs and benefits. With the weight of each criterion worked out, our model demonstrates that option 3is the optimal choice. According to our choice, we are required to offer the recommendation as to the number and placement of the new dams. Regarding it as a set covering problem, we develop a multi-objective optimization model to minimize the number of smaller dams while improving the water resources management capacity. Applying TOPSIS evaluation method to get the demand of the electricity and water, we solve this problem with genetic algorithm and get an approximate optimal solution with 12 smaller dams and determine the location of them. Taking the strategy for modulating the water flow into account, we construct a joint operation of dam system to simulate the relationship among the smaller dams with genetic algorithm approach. We define four kinds of year based on the Kariba’s climate data of climate, namely, normal flow year, low flow year, high flow year and differential year. Finally, these statistics could help us simulate the water flow of each month in one year, then we obtain the water resources planning and modulating strategy. The sensitivity analysis of our model has pointed out that small alteration in our constraints (including removing an important city of the countries and changing the measurement of the economic development index etc.) affects the location of some of our dams slightly while the number of dams remains the same. Also we find that the output coefficient is not an important factor for joint operation of the dam system, for the reason that the discharge index and the capacity index would not change a lot with the output coefficient changing.

数学建模国家一等奖优秀论文

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写):B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3.

指导教师或指导教师组负责人(打印并签名): ?(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 2014 年 9 月15日 赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

深圳杯数学建模A题答案

摘要 深圳作为中国经济发展的重点城市,人口与医疗问题已经成为我们的焦点话题,是一个复杂的系统工程。本文针对深圳地区人口年龄分布情况,外来务工人员的数量,从实际出发,在基于一些合理简化假设的基础上,建立数学模型,并充分利用matlab 等软件简化计算,对相关问题进行了有针对性的求解。 在预测未来十年深圳常住人口时,我们运用了matlab 一元线性回归对近十年的数据进行了多次拟合,并对这些拟合进行了比较得出深圳常住人口模型公式为:2() 1.00050.00838.1671Q x e x x =+-+, 通过拟合预测出了未来十年深圳市常住人口的数量,同时在网上2000年到2010年的人口结构的数据,通过Leslie 矩阵预测出了未来十年人口结构的分布。通过分析深圳近人口数量和人口结构的变化,预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求呈线性递增趋势。同时选取了高血压,脑出血,癌症这三种疾病进行预测,运用matlab 最小二乘法散点拟合,得出这三种疾病的发展趋势,由此预测出未来十年这三种疾病的就医的床位需求。 关键词:matlab 、一元线性回归、Leslie 、最小二乘法、床位需求 一、问题重述 从深圳的人口的结构来看,显著的特点是流动人口远远超过户籍人口,且年轻人口占主绝对优势。流动人口主要从事第二、三产业的企业一线工人等。年轻人身体好,发病少 ,导致深圳目前人均医疗设施低于全国类似城市平均水平,但仍能满足现有人口的就医需求。然而,政策的调整与世界的推移会使深圳市老年人增加。产业结构的变化也会影流动人口的数量。直接会导致深圳市未来的医疗需求的变化。 现有人口社会发展模型在面对深圳情况时,难以满足人口和医疗预测的要

数学建模国家一等奖优秀论文

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以 上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取 消评奖资格。) 日期:2014 年9 月 15日 赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

2012数学建模深圳杯A答案

答卷编号(参赛学校填写): 答卷编号(竞赛组委会填写): 论文题目:深圳人口与医疗需求预测(A)组别:本科生 参赛学校: 报名序号: 参赛队员信息(必填): 答卷编号(竞赛组委会填写):

评阅情况(省赛评阅专家填写): 省赛评阅1: 省赛评阅2: 省赛评阅3: 省赛评阅4: 省赛评阅5: 深圳市人口与医疗需求预测模型 摘要: 人口与医疗问题是关系到国计民生的大问题,能够合理而准确地预测就显得非常重要。但不同城市有不同的人口特点,本文在吸取前人经验的基础上,以深圳的人口为依托提出了一些新的简单而实用方法,希望能为政府决策提供帮助。 针对深圳市人口结构中非户籍人口比重大,流动人口多这一特点,我们采用了灰色GM(1,1)模型,通过matlab对深圳市自2001至2010年的数据进行拟合,发现其人口变化近似呈线性增长,线性相关系数高达0.99,我们就此认定其为线性相关并给出线性方程。同理,针对其非户籍人口,我们进行matlab拟合发现,其为非线性相关,并得出相关函数。 通过模拟出的常住人口与非户籍人口的函数,我们可以很容易的得出深圳市的人口数量变化情况,同时我们以非户籍人口与常住人口的函数之比作为深圳市人口结构的变化,通过作图发现,深圳市非户籍人口正逐年下降,这正与官方以及媒体报道深圳市产业转型相对应。 由于深圳市人口结构中外来人口比例接近76%,而且外来人口中以青壮年居多,可以认为在较短时间内(十年内)外来人口年龄结构近似不变,同时当地户籍人口因为受历史条件影响,人口年龄结构在短期内也不会发生较大变化,所以

我们大胆假设深圳市未来十年人口年龄结构近似不变。同时深圳市各区发展水平相同,可以认为其人口发展态势与深圳市总体相同,所以其所在深圳市人口比例不变。 通过查阅资料得知床位需求与各年龄段人数、住院率、平均住院天数以及该地平均年床开放日数有关,在查找资料以及大量演算基础上,利用已求出的常住人口变化函数,我们得出深圳市的床位需求函数,而深圳市各区对应的床位需求则为深圳市总的床位需求乘以本区总人口所占深圳市总人口的比例(已架设各区人口在较短时间内保持不变)。 考虑到问题研究的实用性,我们选取了肺癌与胃癌作为深圳市疾病研究的对象,我们通过查找肺癌与胃癌在深圳市不同年龄段的发病率,这两种病在市级与区级医院的住院天数以及这两种级别的医院的平均年床开放日数,利用已知的病床需求函数,做出了针对深圳市不同级别医疗机构的函数表达式,通过函数表达式我们可以很轻松的看出深圳市不同类型医疗机构的床位需求。 最后以我们的模型为依托去测试深圳市各年的相关数据,都表现出来比较好的吻合性,它充分证明了我们模型的正确性。但是,由于时间仓促,模型仍有不完善地方,而且有其局限性(在较长时间内误差较大),随着时间推移,深圳外来人口比例将更低,老龄化趋势将更加显著,这显然会影响深圳市各级机构床位需求的预测,我们希望可以引入包含年龄结构的函数对其修正,而这将会成为我们以后的一个研究方向。 关键字:灰色GM(1,1)模型线性相关方程 一、问题重述 深圳市是一个流动人口多,户籍人口少的城市,外来人口多导致深圳市青壮年劳动力多,由于青壮年劳动力身体健康程度要高于其它人群,因此深圳目前人均医疗设施虽然低于全国类似城市平均水平,但仍能满足现有人口的就医需求。然而,随着时间推移和政策的调整,深圳老年人口比例会逐渐增加,产业结构的变化也会影响外来务工人员的数量。这些都可能导致深圳市未来的医疗需求与现在有较大的差异。未来的医疗需求与人口结构、数量和经济发展等因素相关。请根据深圳市人口特点预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求;根据深圳市人口的年龄结构和患病情况及所收集的数据,选择预测几种病在不同类型的医疗机构就医的床位需求。 二、问题分析 深圳市人口特点是流动人口多,非户籍人口多,但户籍人口较少,针对这个情况,我们选取人口结构中的主要矛盾,即常住人口与非常住人口(即非户籍人口)进行研究。我们首先分析了深圳市近十年的人口年龄结构变化,发现其结构变化幅度很小,因此在短期内我们可以认为其年龄结构恒定。由于本题需要处理数据较多,我们采用matlab进行辅助分析,通过拟合结果研究其常住人口已经非户籍人口变化。而对于人口结构,我们可以用非户籍人口与总人口的比例来表

美赛:13215---数模英文论文

Team Control Number For office use only 13215 For office use only T1 ________________ F1 ________________ T2 ________________ F2 ________________ T3 ________________ Problem Chosen F3 ________________ T4 ________________ F4 ________________ C 2012 Mathematical Contest in Modeling (MCM) Summary Sheet (Attach a copy of this page to each copy of your solution paper.) Type a summary of your results on this page. Do not include the name of your school, advisor, or team members on this page. Message Network Modeling for Crime Busting Abstract A particularly popular and challenging problem in crime analysis is to identify the conspirators through analysis of message networks. In this paper, using the data of message traffic, we model to prioritize the likelihood of one’s being conspirator, and nominate the probable conspiracy leaders. We note a fact that any conspirator has at least one message communication with other conspirators, and assume that sending or receiving a message has the same effect, and then develop Model 1, 2 and 3 to make a priority list respectively and Model 4 to nominate the conspiracy leader. In Model 1, we take the amount of one’s suspicious messages and one’s all messages with known conspirators into account, and define a simple composite index to measure the likelihood of one’s being conspirator. Then, considering probability relevance of all nodes, we develop Model 2 based on Law of Total Probability . In this model, probability of one’s being conspirator is the weight sum of probabilities of others directly linking to it. And we develop Algorithm 1 to calculate probabilities of all the network nodes as direct calculation is infeasible. Besides, in order to better quantify one’s relationship to the known conspirators, we develop Model 3, which brings in the concept “shortest path” of graph theory to create an indicator evaluating the likelihood of one’s being conspirator which can be calculated through Algorithm 2. As a result, we compare three priority lists and conclude that the overall rankings are similar but quite changes appear in some nodes. Additionally, when altering the given information, we find that the priority list just changes slightly except for a few nodes, so that we validate the models’ stability. Afterwards, by using Freeman’s centrality method, we develop Model 4 to nominate three most probable leaders: Paul, Elsie, Dolores (senior manager). What’s more, we make some remarks about the models and discuss what could be done to enhance them in the future work. In addition, we further explain Investigation EZ through text and semantic network analysis, so to illustrate the models’ capacity of applying to more complicated cases. Finally, we briefly state the application of our models in other disciplines.

2014年数学建模美赛题目原文及翻译

2014年数学建模美赛题目原文及翻译 作者:Ternence Zhang 转载注明出处:https://www.doczj.com/doc/c413229599.html,/zhangtengyuan23 MCM原题PDF: https://www.doczj.com/doc/c413229599.html,/detail/zhangty0223/6901271 PROBLEM A: The Keep-Right-Except-To-Pass Rule In countries where driving automobiles on the right is the rule (that is, USA, China and most other countries except for Great Britain, Australia, and some former British colonies), multi-lane freeways often employ a rule that requires drivers to drive in the right-most lane unless they are passing another vehicle, in which case they move one lane to the left, pass, and return to their former travel lane. Build and analyze a mathematical model to analyze the performance of this rule in light and heavy traffic. You may wish to examine tradeoffs between traffic flow and safety, the role of under- or over-posted speed limits (that is, speed limits that are too low or too high), and/or other factors that may not be

深圳杯数学建模A题答案完整版

深圳杯数学建模A题答 案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

摘要 深圳作为中国经济发展的重点城市,人口与医疗问题已经成为我们的焦点话题,是一个复杂的系统工程。本文针对深圳地区人口年龄分布情况,外来务工人员的数量,从实际出发,在基于一些合理简化假设的基础上,建立数学模型,并充分利用matlab等软件简化计算,对相关问题进行了有针对性的求解。 在预测未来十年深圳常住人口时,我们运用了matlab一元线性回归对近十年的数据进行了多次拟合,并对这些拟合进行了比较得出深圳常住人口模型公式为: 2 =+-+, 通过拟合预测出了未来十年深圳市常住人口的Q x e x x () 1.00050.00838.1671 数量,同时在网上2000年到2010年的人口结构的数据,通过Leslie矩阵预测出了未来十年人口结构的分布。通过分析深圳近人口数量和人口结构的变化,预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求呈线性递增趋势。同时选取了高血压,脑出血,癌症这三种疾病进行预测,运用matlab最小二乘法散点拟合,得出这三种疾病的发展趋势,由此预测出未来十年这三种疾病的就医的床位需求。 关键词:matlab、一元线性回归、Leslie、最小二乘法、床位需求 一、问题重述 从深圳的人口的结构来看,显着的特点是流动人口远远超过户籍人口,且年轻人口占主绝对优势。流动人口主要从事第二、三产业的企业一线工人等。年轻人身体好,发病少,导致深圳目前人均医疗设施低于全国类似城市平均水平,但仍能满足现有人口的就医需求。然而,政策的调整与世界的推移会使深圳市老年人增加。产业结构的变化也会影流动人口的数量。直接会导致深圳市未来的医疗需求的变化。 现有人口社会发展模型在面对深圳情况时,难以满足人口和医疗预测的要求。为了解决此问题,请根据深圳人口发展变化态势以及全社会医疗卫生资源投入情况(医疗设施、医护人员结构等方面)收集数据、建立针对深圳具体情况的数学模型,预测深圳未来的人口增长和医疗需求,解决下面几个问题: 1.分析深圳近十年常住人口、非常住人口变化特征,预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求; 2.根据深圳市人口的年龄结构和患病情况及所收集的数据,对几种病进行预测,在不同类型的医疗机构就医的床位需求。

数学建模美赛2012MCM B论文

Camping along the Big Long River Summary In this paper, the problem that allows more parties entering recreation system is investigated. In order to let park managers have better arrangements on camping for parties, the problem is divided into four sections to consider. The first section is the description of the process for single-party's rafting. That is, formulating a Status Transfer Equation of a party based on the state of the arriving time at any campsite. Furthermore, we analyze the encounter situations between two parties. Next we build up a simulation model according to the analysis above. Setting that there are recreation sites though the river, count the encounter times when a new party enters this recreation system, and judge whether there exists campsites available for them to station. If the times of encounter between parties are small and the campsite is available, the managers give them a good schedule and permit their rafting, or else, putting off the small interval time t until the party satisfies the conditions. Then solve the problem by the method of computer simulation. We imitate the whole process of rafting for every party, and obtain different numbers of parties, every party's schedule arrangement, travelling time, numbers of every campsite's usage, ratio of these two kinds of rafting boats, and time intervals between two parties' starting time under various numbers of campsites after several times of simulation. Hence, explore the changing law between the numbers of parties (X) and the numbers of campsites (Y) that X ascends rapidly in the first period followed by Y's increasing and the curve tends to be steady and finally looks like a S curve. In the end of our paper, we make sensitive analysis by changing parameters of simulation and evaluate the strengths and weaknesses of our model, and write a memo to river managers on the arrangements of rafting. Key words: Camping;Computer Simulation; Status Transfer Equation

2019数学建模美赛论文

2019 MCM/ICM Summary Sheet (Your team's summary should be included as the first page of your electronic submission.) Type a summary of your results on this page. Do not include the name of your school, advisor , or team members on this page. Ecosystems provide many natural processes to maintain a healthy and sustainable environment after human life. However, over the past decades, rapid industrial development and other anthropogenic activities have been limiting or removing ecosystem services. It is necessary to access the impact of human activities on biodiversity and environmental degradation. The main purpose of this work is to understand the true economic costs of land use projects when ecosystem services are considered. To this end, we propose an ecological service assessment model to perform a cost benefit analysis of land use development projects of varying sites, from small-scale community projects to large national projects. We mainly focus on the treatment cost of environmental pollution in land use from three aspects: air pollution, solid waste and water pollution. We collect pollution data nationwide from 2010 to 2015 to estimate economic costs. We visually analyze the change in economic costs over time via some charts. We also analyze how the economic cost changes with time by using linear regression method. We divide the data into small community projects data (living pollution data) and large natural data (industrial pollution data). Our results indicate that the economic costs of restoring economical services for different scales of land use are different. For small-scale land, according to our analysis, the treatment cost of living pollution is about 30 million every year in China. With the rapid development of technology, the cost is lower than past years. For large-scale land, according to our analysis, the treatment cost of industrial pollution is about 8 million, which is lower than cost of living pollution. Meanwhile the cost is trending down due to technology development. The theory developed here provides a sound foundation for effective decision making policies on land use projects. Key words: economic cost , ecosystem service, ecological service assesment model, pollution. Team Control Number For office use only For office use only T1 ________________ F1 ________________ T2 ________________ F2 ________________ T3 ________________ Problem Chosen F3 ________________ T4 ________________ F4 ________________ E

数学建模优秀论文模板(全国一等奖模板)

Haozl觉得数学建模论文格式这么样设置 版权归郝竹林所有,材料仅学习参考 版权:郝竹林 备注☆ ※§等等字符都可以作为问题重述左边的。。。。。一级标题 所有段落一级标题设置成段落前后间距13磅 图和表的标题采用插入题注方式题注样式在样式表中设置居中五号字体 Excel中画出的折线表字体采用默认格式宋体正文10号 图标题在图上方段落间距前0.25行后0行 表标题在表下方段落间距前0行后0.25行 行距均使用单倍行距 所有段落均把4个勾去掉 注意Excel表格插入到word的方式在Excel中复制后,粘贴,word2010粘贴选用使用目标主题嵌入当前 Dsffaf 所有软件名字第一个字母大写比如E xcel 所有公式和字母均使用MathType编写 公式编号采用MathType编号格式自己定义

农业化肥公司的生产与销售优化方案 摘 要 要求总分总 本文针对储油罐的变位识别与罐容表标定的计算方法问题,运用二重积分法和最小二乘法建立了储油罐的变位识别与罐容表标定的计算模型,分别对三种不同变位情况推导出的油位计所测油位高度与实际罐容量的数学模型,运用matlab 软件编程得出合理的结论,最终对模型的结果做出了误差分析。 针对问题一要求依据图4及附表1建立积分数学模型研究罐体变位后对罐容表的影响,并给出罐体变位后油位高度间隔为1cm 的罐容表标定值。我们作图分析出实验储油罐出现纵向倾斜 14.时存在三种不同的可能情况,即储油罐中储油量较少、储油量一般、储油量较多的情况。针对于每种情况我们都利用了高等数学求容积的知识,以倾斜变位后油位计所测实际油位高度为积分变量,进行两次积分运算,运用MATLAB 软件推导出了所测油位高度与实际罐容量的关系式。并且给出了罐体倾斜变位后油位高度间隔为1cm 的罐容标定值(见表1),最后我们对倾斜变位前后的罐容标定值残差进行分析,得到样本方差为4103878.2-?,这充分说明残差波动不大。我们得出结论:罐体倾斜变位后,在同一油位条件下倾斜变位后罐容量比变位前罐容量少L 243。 表 1.1 针对问题二要求对于图1所示的实际储油罐,试建立罐体变位后标定罐容表的数学模型,即罐内储油量与油位高度及变位参数(纵向倾斜角度α和横向偏转角度β)之间的一般关系。利用罐体变位后在进/出油过程中的实际检测数据(附件2),根据所建立的数学模型确定变位参数,并给出罐体变位后油位高度间隔为10cm 的罐容表标定值。进一步利用附件2中的实际检测数据来分析检验你们模型的正确性与方法的可靠性。我们根据实际储油罐的特殊构造将实际储油罐分为三部分,左、右球冠状体与中间的圆柱体。运用积分的知识,按照实际储油罐的纵向变位后油位的三种不同情况。利用MATLAB 编程进行两次积分求得仅纵向变位时油量与油位、倾斜角α的容积表达式。然后我们通过作图分析油罐体的变位情况,将双向变位后的油位h 与仅纵向变位时的油位0h 建立关系表达式01.5(1.5)cos h h β=--,从而得到双向变位油量与油位、倾斜角α、偏转角β的容积表达式。利用附件二的数据,采用最小二乘法来确定倾斜角α、偏转角β的值,用matlab 软件求出03.3=α、04=β α=3.30,β=时总的平均相对误差达到最小,其最小值为0.0594。由此得到双向变位后油量与油位的容积表达式V ,从而确定了双向变位后的罐容表(见表2)。 本文主要应用MATLAB 软件对相关的模型进行编程求解,计算方便、快捷、准确,整篇文章采取图文并茂的效果。文章最后根据所建立的模型用附件2中的实际检测数据进行了误差分析,结果可靠,使得模型具有现实意义。 关键词:罐容表标定;积分求解;最小二乘法;MATLAB ;误差分

相关主题
相关文档 最新文档