当前位置：文档之家› 深圳杯数学建模A题获奖论文

深圳杯数学建模A题获奖论文

网络侧估计终端用户视频体验建模

摘要

现代社会，使用手机APP观看视频已经成为当代社会的一种普遍形式，本文依据统计回归方法，对网络侧变量和用户体验变量之间的函数关系进行拟合，令其余无关变量均近似地服从正态分布。采用多重拟合方式拟合出不同的评价函数，并进行误差检验。选择误差最小的评价函数。并基于评价函数，两个用户体验变量进行预测。

同时对用户观看视频体验进行综合评价，采用多级指标，运用AHP及模糊综合评价法评价用户观看视频的满意度。求出权重，建立评价矩阵。得到用户观看视频满意度处在较满意和一般满意之间。

最后，由于多种原因，本文建立的用户体验变量评价函数具有一定程度的误差，因此基于原有数据，建立灰色系统模型，再次进行预测，比较结果。建立GM（1,1）模型对相关指标进行预测，取预测区间长度为100，得出预测值，并绘制残差图对预测值进行检验。并与评价函数预测结果进行对比。验证评价函数的正确性。同时得到结论，基于原始数据直接建立灰色系统，预测相对更加准确。关键词：统计回归；综合评价；灰色预测；残差检验

一.问题重述

随着科技的日益进步，无线宽带网络也随之无限升级。智能终端在大众生活中普及，越来越多的用户选择在智能终端上（以手机为主）应用客户端APP来观看网络视频，这是一种基于TCP（是一种面向连接的、可靠的、基于字节流的传输层通信协议）的视频传输以及播放。在观看网络视频时，有很多因素指标会影响用户对于视频的观看体验，而其中两个关键指标是初始缓冲等待时间和卡顿缓冲时间，我们可以用初始缓冲时延和卡顿时长占比（卡顿时长占比=卡顿时长/视频播放时长）来定量评价用户体验。研究表明影响初始缓冲时延和卡顿时长占比的主要因素有初始缓冲峰值速率、播放阶段平均下载速率、端到端环回时间（E2ERTT）以及视频参数。然而这些因素和初始缓冲时延以及卡顿时长占比之间的关系并不明确。本文拟通过数学建模的方式对网络端视频用户体验做综合评价和预测，以采取针对性的措施提高网络端视频用户体验的满意程度。本文尝试解决以下问题：

1、根据实验数据建立起用户体验评价变量和网络侧变量之间的函数关系。

2、对网络侧终端用户体验进行定量的综合评价。

3、针对网络侧用户体验进行预测。

二.问题分析与思考

本题目附件中提供试验数据共89266组，由于希望提高问题分析的准确性，首先要对数据进行考察，并将不合理数据予以剔除，因此，进行数据的信度与效度检验就必不可少。

2.1数据信度检验

信度检验为判断分析数据结果准确性，即数据结果的可靠性检验。常用的方法有：拉以达准则，Dixon准则以及Crubbs准则法等，然这三种方法都是基于样本大致服从正态分布而给出的，因此，我们采取最常见也是最可信的拉以达准则进行数据的信度检验。

拉以达准则又称3原则，是先假设一组检测数据只含有随机误差，对其进行计

算处理得到标准偏差，按一定概率确定一个区间，认为凡超过这个区间的误差，就不属于随机误差而是粗大误差，含有该误差的数据应予以剔除。这种判别处理原理及方法仅局限于对正态或近似正态分布的样本数据处理，它是以测量次数充分大为前提的，由于本模型中测量次数较多，因此拉以达原则在合理范围之内。

图1：统计数据分析结构图

本文利用Matlab软件，将附件中的各指标数据利用程序进行分析以及剔除（详见附录1）。共剔除数据7713组，剩余81553组数据。剔除数据总数小于，

在合理范围之内。

图2：剔除异常数据后的数据分布结构图

在此后的建模过程中，只针对这81553组数据进行分析。

拉依达准则判断粗大误差的基本思想是以给定的置信概率99.73%为标准,以三

倍测量列的标准偏差限为依据,凡超过此界限的误差,就认为它不属于随机误差的范畴,而是粗大误差。含有粗大误差的测量值称为异常值,异常值是不可取的,应该从测量数据中剔除。

用拉依达准则判断和剔除含有粗大误差的异常值时,应先算出等精度独立测量列Xi(i=1,2,…,n)的平均值，残余误差,并按贝塞尔公式算出该测量列的标准偏差S,如果某测量值的残余误差，满足下式，则认为是含有误差的异常值,须剔除不要。该判别式即为拉依达准则

2.2相关方法

评价是基于研究对象的某些属性（指标），将之变为客观客观定量计值或者主观效度的行为。本文介绍几种本文涉及的方法：

（1）统计回归分析法

由于客观事物内部规律的复杂性以及人们认识程度的限制，无法准确的分析实际对象内在的因果关系，因此需要建立合乎机理规律的数学模型。动态测量数据的数学处理问题大多可以转化为回归分析问题。确定变量之间的数学关系式并对其进行可信度检验。根据所求的关系式，根据一个或几个变量的取值来预测或控制另一个特定变量的取值。并给出这种预测却控制的精确程度。

（2）层次分析法（AHP）

层次分析法指的是将决策问题的有关元素分解成目标、准则、方案等层次，在此基础上进行定性分析和定量分析的一种决策方法。它的特点是对复杂决策问题的本质、影响因素及内在关系等进行深入分析后，构建层次结构模型，把决策的思维过程数学化，进而提供一种简单的决策方法。层次分析法的结果合理性较大，在本文中也会有涉及，用以权重的求解。

（3）模糊综合评价法

客观世界中，存在着许多不确定的现象，这种不确定性主要表现在两个方面：一是随机性，二是模糊性。在概率论研究中，通常以在上的取值的分布函数来描述这种随机性。同样，在上取值的隶属函数就描述了事件的模糊性。

模糊数学是描述模糊问题的不可或缺的工具。模糊综合评价同时可以实现模糊识别，模糊分析，模糊聚类以及预测的功能，是一种非常优越的分析方式。由于本题中各指标之间的关系并不明确，其具有模糊性，因此本文主要采用模糊分析来对该问题进行综合评价。

（4）灰色预测法

灰色预测是通过鉴别系统因素之间发展趋势的相异程度，即进行关联分析，并对原始数据生成处理来寻找系统变动的规律，生成有较强规律性的数据序列，然后建立相应的微分方程模型从而预测事物未来发展趋势的状况。预测某一特征量或达到此特征量的经历时间。

三.模型基本假设

1，假设用户观看视频时，在网络传输速率基本一致的情况下，视频卡顿的出现是随机的；

2，假设卡顿时长与在同一网络环境下，使用客户端观看视频的人数基本成线性的正比关系；

3，经过剔除后的统计数据真实可信且抽样样本能够完全反应总体的特征；

4，假设除网络侧变量和用户体验变量外的其余变量均近似地服从正态分布。

四.基本符号说明

：自变量与因变量间的回归模型系数，；

：子变量与子变量间的回归模型系数，；

模糊综合评价因素集，,各因素，；

模糊综合评价评语论域（评价集），

；

判断矩阵；

模糊关系矩阵；

权重向量；综合评价矩阵。

五.模型的建立与求解

5.1统计回归模型

统计回归是基于数据的统计分析，对于内部规律具有复杂性的客观事物，建立合乎机理的数学模型，其基本思路结构如下：

图3：统计回归模型结构流程图

由于采样数据的随机性，在上步利用拉以达原则剔除后，以现有的数据进行分析。首先进行标准化处理。

数据的标准化（normalization ）是将数据按照一定规则缩放，使之落入一个小的特定区间。这样去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是0-1标准化和Z 标准化，当然，也有一些其他的标准化方法，用在不同场景。本文采用Z-score 标准化（标准差标准化）。转化函数为：

。其中为所有样本

统计检

修

应分类研

结构简相关分预测决

现实问

提炼问

根据定性理论设置收集整

根据目标和

进行统计计算

数据的均值，为样本数据的标准差。经过Z-score标准化后，变量的平均值为0，标准差为1。为了数据处理的简便性，将均值迁移到1。

5.1.2模型建立与求解

1、针对初始缓冲时延的回归模型

（1）模型的建立

记用户体验变量分别为(初始缓冲时延)，（卡顿时长占比）；网络侧变

量分别为（初始缓冲峰值速率），（播放阶段平均下载速率），（E2ERTT）。首先，为了能大致的分析与，，之间的关系，利用剔除后的数据分别作出对，，的散点图。

图4：对的散点图

图5：对的散点图

图6：对的散点图

从图4中可以发现，对有比较明显的反比关系，对虽然较为模糊，但大

体上则类似于一次或二次函数关系，对关系比较模糊，但大体上呈现一种线性关系。综合以上分析，建立如下的回归模型：

经过多次利用MATLAB软件多次拟合实验，最终选择如下的回归模型：

其中，，，即为回归变量，而影响的其他因素均包含在随机误差中，

应大致的服从均值为零的正态分布。

（2）模型的求解

直接利用MATLAB统计工具箱中的命令regress求解：

[b,bint,rint,stats]=regress(y,x,alpha)

输入回归模型中的数据（n维向量形式），为对应于回归系数

的数据矩阵，alpha为置信水平（缺省时），输

出是的估计值，常记作，bint是的置信区间，为残差向量，rint为r的置信区间，stats为回归模型的检验统计量，有三个值，第一个是回归方程

的决定系数(是相关系数)，第二个是的统计量值，第三个是与统计量对应的概率值。

针对以上回归模型的回归系数估计值及其置信区间（取置信水平），检验统计量，，的结果如下：

参数参数估计值参数置信区间

-596.7539 [-601.1,-592.25]

718.6450 [712.9,724.3]

-115.8773 [-139.2,-92.6]

1215.3 [119.16,123.9]

=0.8641=54467<0.0000001

表1显示，=0.8641指的是因变量的86.41%可由模型确定，值远远超过检验的临界值，远小于，因此以上模型整体来看是可用的。

表1中的回归系数给出了以上模型的估计值，即=-596.7539，

=718.6450，=-115.8773，=1215.3，检查置信区间后发现，没有参数的置信区间内包含零点，表明回归变量对估计值都是显着的。

将回归系数的估计值代入上述模型，即可预测用户体验变量（初始缓冲时延）的预测值，得到预测方程：

因此，依据以上方程，就可以预测用户体验变量（初始缓冲时延）的预测值，

使用MATLAB软件，预测出100组数据，由于数据过于庞大，只节选几组放在这里。

表2：统计模型的预测结果（节选）

初始缓冲峰值速率(kbps) E2ERTT(

ms)

播放阶

段平均

速率

(kbps)

初始缓

冲时延

(ms)

预测

49450 54 3719 1108 1085.936368

50517 52 5902 1095 1029.70971

47988 47 5806 1051 948.4334083

56457 55 5978 1099 1111.962852

56690 54 5931 1133 1101.852193

74000 58 6212 1132 1280.115924

58178 54 6146 1020 1109.395913

66762 58 6154 1029 1225.807954

48445 57 6127 1133 1073.506341

经过统计，预测合理的数据为86%，与结果分析中的取值基本一致。以下是预

测结果残差图

图7：模型（1）预测结果残差图

由残差图可知，预测值基本符合相应指标的置信区间，因此，预测方程基本合理。

2、针对卡顿时长占比的回归模型

按照上部的原有步骤，记用户体验变量分别为(初始缓冲时延)，（卡顿时长占比）；网络侧变量分别为（初始缓冲峰值速率），（播放阶段平均下载速率），（E2ERTT）。

首先，为了能大致的分析与，，之间的关系，利用剔除后的数据分别作出对，，的散点图。

图8，对的散点图

图9：对的散点图

从图7，图8可以明显的看出来，对的函数关系并不明确，而对之间的关系几乎是杂乱无章的，根本无法选择合适的拟合函数，经多次试验，最高拟合度仅有34%。因此，，，与之间无法拟合出一个合适的函数。

（1）模型的建立

基于模型（1）中的方程，可取播放阶段平均速率为，初始缓冲时延为，VMOS

为，视频全程感知速率为，视频码率。经过多次试验，得到与之间近似的服从一种正比关系。于是得到回归模型如下：

其中，，，，，即为回归变量，而影响的其他因素均包含在随机误

差中，应大致的服从均值为零的正态分布。

（2）模型的求解

直接利用MATLAB统计工具箱中的命令regress求解：

[b,bint,rint,stats]=regress(y,x,alpha)

输入回归模型中的数据（n维向量形式），为对应于回归系数

的数据矩阵，alpha为置信水平（缺省时），输出是的估计值，常记作，bint是的置信区间，为残差向量，rint为r的置信区间，stats为回归模型的检验统计量，有三个值，第一个是回归方程的决定系数(是相关系数)，第二个是的统计量值，第三个是与统计量对应的概率值。

参数参数估计值参数置信区间

-0.0015 [-0.0016,-0.0013]

-0.0361 [-0.0361,-0.0361]

-0.3897 [-0.3900,-0.3894]

0.0015 [0.0013,0.0016]

0.0241 [0.0236,0.0245]

0.4023 [0.4017,0.4028]

=0.9901=163730<0.000000001

表3显示，=0.9901指的是因变量的99.01%可由模型确定,拟合度非常高。值远远超过检验的临界值，远小于，因此以上模型是合理的。

表3中的回归系数给出了以上模型的估计值，即=-0.0015，

=-0.0361，=-0.3897，=0.0015，=0.0241，=0.4023。检查置信区间后

发现，没有参数的置信区间内包含零点，表明回归变量对估计值都是显着的。（4）自变量间的拟合分析

由于我们选择的回归变量并不完全是题目中给定的回归变量，于是，我们需要对回归变量进行分析。

由于播放阶段平均速率是题目中给出的网络侧变量，同时，根据模型（1），初始缓冲时延能够和三个网络侧变量建立函数关系。因此，我们只需要给出VMOS，视频全程感知速率与网络侧变量间的关系。VMOS表示视频流的传输，它与初始缓冲时延近似的成反比关系，我们利用MATLAB软件，尽量通过多元函数建立拟合关系。

为节约篇幅，具体步骤的分析过程略。经过多次拟合尝试，以VOMS为因变量，视频全程感知速率与播放阶段平均速率分别为自变量，利用多项式函数进行拟合，拟合结果如下表：

参数参数估计值参数置信区间

1.523e+04 [1.436e+04,1.61e+04]

-1.027e+04 [-1.099e+04,-9562]

-2.107 [-2.322,-1.893]

2796 [2796,2796]

0.7789 [0.7789,0.7789]

-329.1 [7.112e-10,2.919e-09]

=0.95<0.000000001

信区间内包含零点，表明回归变量对估计值都是显着的。=0.95指的是因变量的95%可由模型确定,拟合度非常高。远小于，因此以上模型是合理的。

于是，我们根据上表给出的数据，得到回归方程如下：

下图为拟合的散点图：

图10：自变量间二元拟合散点图（1）

以下的过程与上面的类似，在实际生活中，视频码率与视频流（即VOMS ）之间有着相应的客观关系，因此，近似的取视频码率和VOMS 之间为正比关系，则亦可描述相应变量之间的关系。

最后，关于初始缓冲峰值速率，初始缓冲时延（）与VOMS （）之间的函数关系拟合过程不再赘述，以下给出拟合结果和散点图。得到的方程为：

=0.8576。基本符合要求。拟合散点图如下；

图11：自变量间二元拟合散点图（2）

（5）模型预测与误差

根据以上的分析过程，就可以预测用户体验变量（卡顿时长占比）的预测值，使用MATLAB 软件，预测出100组数据，以下是数据的残差图。

图12：模型（2）预测残差图

由残差图可知，预测值基本符合相应指标的置信区间，因此，预测方程基本合理。 5.2模糊综合评价模型

模糊综合评价是基于模糊数学，对各指标之间具有模糊性的变量进行评价的评价方法，其一般思路如下：

图13：模糊综合评价流程图

由于数据的信度检验和剔除工作已经完成，因此建模的第一步由确定各指标的权重开始。

5.2.1层次分析法（AHP ）确定权重

1、层次分析法

思维过程数学化，从而为多目标、多准则或无结构特性的复杂决策问题提供简便的决策方法。尤其适合于对决策结果难于直接准确计量的场合。 2、层次分析法的步骤

（1）、确定目标和评价因素

确定评确定隶

确定隶

形成判

确定权

计算权

模糊综

评价结

P 个评价指标，{}12,,,p u u u u =L L 。

（2）、构造判断矩阵

判断矩阵元素的值反映了人们对各元素相对重要性的认识，一般采用1—9及其倒数的标度方法。但当相互比较因素的重要性能够用具有实际意义的比值说明时，判断矩阵相应元素的值则取这个比值。即得到判断矩阵()ij p p

S u ?=。

（3）、计算判断矩阵

表5元素相对重要性的比例标度

max A ，此特征向量就是各评价因素的重要性排序，也即是权系数的分配。 4、一致性检验

为进行判断矩阵的一致性检验，需计算一致性指标

平均随机一致性指标RI 。它是用随机的方法构造500个样本矩阵，构造方法是随机地用标度以及它们的倒数填满样本矩阵的上三角各项，主对角线各项数值始终为1，对应转置位置项则采用上述对应位置随机数的倒数。然后对各个随机样本矩阵计算其一致性指标值，对这些CI 值平均即得到平均随机一致性指标RI

值[12]。当随机一致性比率0.10CI

CR RI

=<时，认为层次分析排序的结果有满意的一致性，即权系数的分配是合理的；否则，要调整判断矩阵的元素取值，重新分配权系数的值。

查找一致性指标RI 参考表平均随机一致性指标

表6平均随机一致性指标

n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

0 0

0.58 0.90 1.12 1.24 1.32 1.41 1.45 1.49 1.51 1.54 1.56 1.58 1.59

指标权重求解的层次分析法步骤：指标权重，我们采用层次分析的方法求出指标权重。构造判断矩阵()ij p S u =即：

max 阵的一致性检验，需计算一致性指标：

平均随机一致性指标0.9RI =。随机一致性比率：

因此认为层次分析排序的结果有满意的一致性，即权系数的分配是非常合理的。

()ij p p

S u ?=即：

用MATLAB max 。为进行判断矩阵的一致性检验，需计算一致性指标：

平均随机一致性指标0.58RI =。随机一致性比率：因此认为层次分析排序的结果有满意的一致性，即权系数的分配是非常合理的。

()ij p p

S u ?=即：

用MATLAB max 表9：两指标权重

指标权重，我们采用层次分析的方法求出指标权重。构造判断矩阵()

ij p p

S u ?=即：

用max 为进行判断矩阵的一致性检验，需计算一致性指标：

平均随机一致性指标0.9RI =。随机一致性比率：因此认为层次分析排序的结果有满意的一致性，即权系数的分配是非常合理的。

()ij p

S u ?=即：

max 阵的一致性检验，需计算一致性指标：

平均随机一致性指标0.9RI =。随机一致性比率：因此认为层次分析排序的结果有满意的一致性，即权系数的分配是非常合理的。

表11：二级指标权重（2）

5.2.2建立多级模糊综合评价模型

由于各因素与用户体验之间的关系具有模糊性，因此我们需建立模糊综合评价体系。

1、综合评价等级体系

模型附件中给出了华为员工视频体验评价试验数据，共测出13个指标各个员工的评价值。在评价过程中，我们将之分成四大类，包括视频等待时间，视频播放速率，用户体验和传输效率与设备作为一级指标，具体分布如下图：

图14：综合评价等级指标图

模糊综合评价是以模糊数学为基础。应用模糊关系合成的原理，将一些边界不清，不易定量的因素定量化，进行综合评价的一种方法[1]。评价中存在大量的模糊现象和模糊概念。因此，在综合评价时，常用到模糊综合评价的方法进行定量化处理，取得了良好的效果。但权重的确定需要专家的知识和经验，具有一定的缺陷，为此，本文采用层次分析法来确定各指标的权系数。使其更有合理性，更符合客观实际并易于定量表示，从而提高模糊综合评判结果的准确性。此外，模糊综合评价中常取的取大取小算法，信息丢失很多，常常出现结果不易分辨(即模型失效)的情况。所以，本文提出了针对模糊综合评价的改进模型。另外，本

文在对模糊综合评价结果进行分析时，对常用的最大隶属度原则方法进行了改进，提出了加权平均原则方法。 2、模糊综合评价方法和步骤 1）模糊综合评价方法

模糊综合评价是通过构造等级模糊子集把反映被评事物的模糊指标进行量化(即确定隶属度)，然后利用模糊变换原理对各指标综合[9]。 2）评价步骤：

（1）确定评价对象的因素论域

P 个评价指标，{}12,,,p u u u u =L L 。（2）确定评语等级论域

{}12,,,p v v v v =L L ，即等级集合。每一个等级可对应一个模糊子集。（3）建立模糊关系矩阵R

在构造了等级模糊子集后，要逐个对被评事物从每个因素()1,2,,i u i p =L L 上进行量化，即确定从单因素来看被评事物对等级模糊子集的隶属度()|i R u ，进而得到模糊关系矩阵：

矩阵R 中第i 行第j 列元素ij r ，表示某个被评事物从因素i u 来看对j v 等级模糊子集的隶属度。一个被评事物在某个因素i u 方面的表现，是通过模糊向量

()()12|,,,i i i im R u r r r =L L 来刻画的，而在其他评价方法中多是由一个指标实际值

来刻画的，因此，从这个角度讲模糊综合评价要求更多的信息[10]。（4）确定评价因素的权向量

在模糊综合评价中，确定评价因素的权向量：()12,,,p A a a a =L L 。权向量A 中的元素i a 本质上是因素i u 对模糊子{} 对被评事物重要的因素的隶属度。本文使用层次分析法来确定评价指标间的相对重要性次序。从而确定权系数，并且在合成之前归一化。即11p

i i a ==∑，0i a ≥，1,2,,i n =L L

（5）合成模糊综合评价结果向量

利用合适的算子将A 与各被评事物的R 进行合成，得到各被评事物的模糊综合评价结果向量B 。即：

其中1b 是由A 与R 的第j 列运算得到的，它表示被评事物从整体上看对j v 等级模糊子集的隶属程度。

（6）对模糊综合评价结果向量进行分析

实际中最常用的方法是最大隶属度原则，但在某些情况下使用会有些很勉强，损失信息很多，甚至得出不合理的评价结果。提出使用加权平均求隶属等级的方法，对于多个被评事物并可以依据其等级位置进行排序。

在本文的综合评价中，对于每一个指标设定五个级别评语，即

并且赋值为

由30位经验丰富的人员对指标价值体系进行评估，由每个专家单

独对指标层的每个指标进行等级打分。由于指标的模糊性，可以综合每个人对该指标的打分次数，得出该指标属于某个评语等级的隶属度，取30位赞同该指标的评语等级的比重为隶属度，从而建立单因素模糊综合评判矩阵，计算结果如下：视频等待时间的评价向量

视频播放速率的评价向量

用户体验的评价向量

传输效率与设备的评价向量

整体评价向量

整体评价向量的整体评分值

表12：各评价等级评分

评价等级V

(很

好)

(较好) V

(一般)

(较

差)

(很

差)

分数５４３２１

整体评分值为3.1844，介于一般与较好之间。

于是，我们同时得到各项一级指标的评价值如下

视频等待时间的评价值3.2444

视频播放速率的评价值3.2444

用户体验的评价值3.0464

传输效率与设备的评价值3.1537

5.3灰色系统预测模型

由于多种原因，本文建立的用户体验变量评价函数具有一定程度的误差，因此基于原有数据，建立灰色系统模型，再次进行预测，比较结果。

灰色理论认为系统的行为现象尽管是朦胧的，数据是复杂的，但它毕竟是有序的，是有整体功能的。灰数的生成，就是从杂乱中寻找出规律。同时，灰色理论建立的是生成数据模型，不是原始数据模型，因此，灰色预测是一种对含有不确定因素的系统进行预测的方法。

5.3.1灰色预测的相关理论 1、灰色预测的原理

灰色预测通过鉴别系统因素之间发展趋势的相异程度，即进行关联分析，并对原始数据进行生成处理来寻找系统变动的规律，生成有较强规律性的数据序列，然后建立相应的微分方程模型，从而预测事物未来发展趋势的状况。其用等时距观测到的反应预测对象特征的一系列数量值构造灰色预测模型，预测未来某一时刻的特征量，或达到某一特征量的时间。 2、灰色预测的分类

1）灰色时间序列预测；即用观察到的反映预测对象特征的时间序列来构造灰色预测模型，预测未来某一时刻的特征量，或达到某一特征量的时间。 2）畸变预测；即通过灰色模型预测异常值出现的时刻，预测异常值什么时候出现在特定时区内。

3）系统预测；通过对系统行为特征指标建立一组相互关联的灰色预测模型，预测系统中众多变量间的相互协调关系的变化。

4）拓扑预测；将原始数据作曲线，在曲线上按定值寻找该定值发生的所有时点，并以该定值为框架构成时点数列，然后建立模型预测该定值所发生的时点。

由于本题中需要预测两个用户体验变量的取值，以验证评价函数的准确性，因此直接依据原始数据，建立灰色系统预测模型。

灰色系统预测模型是基于一阶常微分方程建立的，故又称为一阶一元微分方程，记为

，由于原始数据均为非负，因此可作一次累加，满足建模要

求。

3、建立灰色预测模型

建立灰色预测模型一般遵循如下思路：

图15：灰色系统预测流程图

1）)1,1(GM 模型

灰色系统理论是由华中理工大学邓聚龙教授于1982年创立的，它是一门渗透性强、应用面极广的新兴横断学科。灰色预测模型以微分方程为描述形式，揭

数据预处一次累加生

生成数列

列微分方

响应

差分代替微分

数据拟

精度检

示灰色信息系统发展的连续过程；并充分利用原始数据序列的有序性及有界性，注重揭示数据集合所具备的潜在规律，不要求对系统信息的完全掌握。 2）)1,1(GM 模型建立：

（1）：设原始序列))(,),2(),1(()0()0()0()0(n x x x x Λ=，为了弱化原始序列的随机性和波动性，为灰色模型提供更加有效的信息，在建立灰色预测模型前，对原始数据进行预处理，通常采用对序列)0(X 进行一次累加生成的处理方式，即1-AGO(AccumulatingGenerationOperator)，记生成序列为：

))()1(,),2()1(),1(())(,),2(),1(()0()1()0()1()0(111)1(n x n x x x x n x x x x +-+==ΛΛ；

（2）：GM(1,1)模型是由一个包含单变量的一阶微分方程构成的动态模型：

b k z a k x =+)()()1()0((k =1,2,3,…,n )

为对)1(x 作紧邻均值生成序列)1(z ；即)]1()([5.0)()1()1()1(--=k x k x k z 得

n k n z z z k z ΛΛ,3,2));(,),2(),2(()()1()1()1()1(==；

（3）：上述第2步中的动态模型的白化方程（也称影子方程）为：其中a 称为发展灰数,b 称为内生控制灰数,a 的有效区间是)2,2(-。应用最小二

乘法对参数列Y B B B b a a

T T T 1)(],[?-==求解可得： a

?=T b a ),(=n T T Y B B B ??-1)(。其中??

????

??+--+-+-=111)),()1((2/1)),3()2((2/1 )),2()1((2/1)1()1()

1()1()1()1(ΛΛn x n x x x x x B ，n

Y =[)0(x (2),)0(x (3),…,)

0(x (n )]T ；（4）：确定)1,1(GM 模型时间响应序列为：

a b

e a b x k x

ak +-=+-])1([)1(?)0()1(；

（5）：求)1(x 的模拟值

))()1(,),2()1(),1(())(,),2(),1(()0()1()0()1()0(111)1(n x n x x x x n x x x x +-+==Λ)

Λ)))；

（6）：还原模拟值

)(?)1(?)1(?)1()1()0(k x k x k x

-+=+；

（7）：检验误差。为确保所建灰色模型有较高的预测精度和可信程度，需要进行残差检验、关联度检验及后验差检验。方法有三种如下：

3）残差检验

分别求出)()0(k x 与)(?)0(k x 的残差序列)()0(k e 、相对误差序列k ?和平均相对误

差?：

=)()

0(k e )()0(k x －)(?)0(k x

4）后验差检验

求出原始数据平均值x 以及残差平均值e ：

求出原始数据方差2

1s 、残差方差2

2s 及其均方差比值C 和小误差概率P ：

12/s s C =，{}

1)0(6745.0)(s e k e p P <-=

令e k e k -=)()0(ξ，106745.0s s =，则{}0s p P k <=ξ。

根据灰色系统理论，通常)()0(k e 、k ?、C 值越小，P 值越大，则模型精度越好。当发展灰数)2,3.0[-∈a ，则所建GM(1,1)模型的一步预测精度在98%以上，2步和5步预测精度都在97%以上，可用于中长期预测。

21/C S S =为均方差比值，对于给定的00C >，当0C C <时，称模型为均

方差比合格模型；(0)

1(|()|0.6745)P P q k Q S =-<称小误差概率；对于给定的

00P >，当0P P >时，则称为小误差概率合格模型。表8给出了检验精度的等级

划分标准。

后验差比(均方差比值):C=0.30966

由于C<=0.35，则此模型精度等级为1级（好）。计算小误差概率:P=1

由于P>=0.95，则此模型精度等级为1级（好）。

发展系数:a=0.015906

灰作用量:u=2555.5951

由于-a<0.3，则此模型适合用于中长期预测。

图16：灰色预测残差图（1）

（2）卡顿占比预测检验

后验差比(均方差比值):C=0.39917

由于0.35

小误差概率:P=1

由于P>=0.95，则此模型精度等级为1级（好）。

发展系数:a=0.058428

灰作用量:u=3103.5906

由于-a<0.3，则此模型适合用于中长期预测。

图17：灰色预测残差图（2）

由残差图我们发现，灰色系统的预测值相比于5.1中的预测方程来说，精度要提高很多，含有误差的预测值很少。因此，灰色系统预测更为准确。

我们预测100组数据，产生如下结果：

2013深圳杯数学建模D题

自然灾害保险问题的研究摘要我国是农业大国,又是世界上遭受自然灾害损失最为严重的国家之一。近10年来,自然灾害给我国造成的经济损失每年都在1000亿元以上。自然灾害对农业经济发展的影响非常严重。但与国际上大灾风险主要通过保险机制来分担化解的做法不同,我国自然灾害损失的救助工作主要依靠国家财政援助和生产自救进行,有关自然灾害风险防范的保险体系尚未真正建立。因此,必需改革目前的保险体制,探索建立巨灾保险救助和通过资产证券化等非传统风险转移方式分散农业巨灾风险的新途径,有效地提升保险在国家灾害救助体系中的积极作用，因此我们分析了近几年天气，各地区的农作物种植面积，受灾，成灾，绝收面积的有关数据，得出了自然灾害的变化趋势，通过Excel,matlab等软件建立了几个模型以及分析出了受灾面积的函数y=-879.8x+2E+6,R*R=0.089,成灾面积y=-132.6X+21663,R*R+0.003绝收面积的函数y=-328.1X+66308，R*R=0.307并且还分析了出了降水量，风速，冰雹在近几年的变化趋势，为今后的预防工作和提出更加合理的保险险种方案做出了充分的准备。关键词：自然灾害、保险险种、灾害变化趋势、土地种植面积、模型的建立一、问题重述根据2013年3月5日《环球时报》转摘美国《商业周报》的相关报道，“在2012年全世界发生的10大自然灾害中，有4场是发生在中国。包括3场严重的夏季洪涝灾和席卷苏鲁冀等沿海地区的台风‘达维’造成的灾害。另外，还有很多地区遭受了严重干旱、冰雹等自然灾害，共造成290亿美元的损失，但通过投保由保险公司赔付的比例仅占总损失的４％左右，这个比例相对美国的自然灾害保险赔付率相差甚远。”另据报道：“2013年3月20日发生在广东、广西等省部分地区的一场大风和冰雹灾害，造成直接经济损失达13亿多元。”这个事实警示我们，中国需要重视和加强自然灾害保险的研究和实践，特别是针对严重自然灾害的保险体系建设和对策方案的研究，推动由政府主导的自然灾害政策性保险方案的实施。农业灾害保险是国家政策性保险之一，即政府为保障国家农业生产的发展，基于商业保险的原理并给予政策扶持的一类保险产品。农业灾害保险也是针对自然灾害，保障农业生产的重要措施之一，是现代农业金融服务的重要组成部分，它与现代农业技术、现代农业信息化及市场建设共同构成整个农业现代化体系。农业灾害保险险种是一种准公共产品，基于投保人、保险公司和政府三方面的利益，按照公平合理的定价原则设计，由保险公司经营的保险产品，三方各承担不同的责任、义务和风险。农业灾害保险分种植业保险和养殖业保险两大类，现有几十个险种，因不同地区的气象条件和作物种类不同，其险种和设置方案都不尽相同。农业灾害保险除遵循保险的共同原理外，有其自身的特点。比如，其损失规律有别于人寿保险和通常的财产保险（如汽车险）等。政府作为投保人和承保人之外的第三方介入以体现对国家安全和救灾的责任。附件1给出了P省种植业现行的部分险种方案，请你们从实际出发，查阅和参考附件中的数据资料，通过分析建模，研究解决下面的问题：（1）对附件2中的数据做必要的统计分析，研究P省现有农业灾害保险险种方案可能存在的风险，并分析其方案是否存在不合理性。

深圳杯数学建模A题答案

摘要深圳作为中国经济发展的重点城市，人口与医疗问题已经成为我们的焦点话题，是一个复杂的系统工程。本文针对深圳地区人口年龄分布情况，外来务工人员的数量，从实际出发，在基于一些合理简化假设的基础上，建立数学模型，并充分利用matlab 等软件简化计算，对相关问题进行了有针对性的求解。在预测未来十年深圳常住人口时，我们运用了matlab 一元线性回归对近十年的数据进行了多次拟合，并对这些拟合进行了比较得出深圳常住人口模型公式为：2() 1.00050.00838.1671Q x e x x =+-+, 通过拟合预测出了未来十年深圳市常住人口的数量，同时在网上2000年到2010年的人口结构的数据，通过Leslie 矩阵预测出了未来十年人口结构的分布。通过分析深圳近人口数量和人口结构的变化，预测未来十年深圳市人口数量和结构的发展趋势，以此为基础预测未来全市和各区医疗床位需求呈线性递增趋势。同时选取了高血压，脑出血，癌症这三种疾病进行预测，运用matlab 最小二乘法散点拟合，得出这三种疾病的发展趋势，由此预测出未来十年这三种疾病的就医的床位需求。关键词：matlab 、一元线性回归、Leslie 、最小二乘法、床位需求一、问题重述从深圳的人口的结构来看，显著的特点是流动人口远远超过户籍人口，且年轻人口占主绝对优势。流动人口主要从事第二、三产业的企业一线工人等。年轻人身体好，发病少，导致深圳目前人均医疗设施低于全国类似城市平均水平，但仍能满足现有人口的就医需求。然而，政策的调整与世界的推移会使深圳市老年人增加。产业结构的变化也会影流动人口的数量。直接会导致深圳市未来的医疗需求的变化。现有人口社会发展模型在面对深圳情况时，难以满足人口和医疗预测的要

2012数学建模深圳杯A答案

答卷编号（参赛学校填写）：答卷编号（竞赛组委会填写）：论文题目：深圳人口与医疗需求预测（A）组别：本科生参赛学校：报名序号：参赛队员信息(必填)：答卷编号（竞赛组委会填写）：

评阅情况（省赛评阅专家填写）：省赛评阅1：省赛评阅2：省赛评阅3：省赛评阅4：省赛评阅5：深圳市人口与医疗需求预测模型摘要：人口与医疗问题是关系到国计民生的大问题，能够合理而准确地预测就显得非常重要。但不同城市有不同的人口特点，本文在吸取前人经验的基础上，以深圳的人口为依托提出了一些新的简单而实用方法，希望能为政府决策提供帮助。针对深圳市人口结构中非户籍人口比重大，流动人口多这一特点，我们采用了灰色GM(1,1)模型，通过matlab对深圳市自2001至2010年的数据进行拟合，发现其人口变化近似呈线性增长，线性相关系数高达0.99，我们就此认定其为线性相关并给出线性方程。同理，针对其非户籍人口，我们进行matlab拟合发现，其为非线性相关，并得出相关函数。通过模拟出的常住人口与非户籍人口的函数，我们可以很容易的得出深圳市的人口数量变化情况，同时我们以非户籍人口与常住人口的函数之比作为深圳市人口结构的变化，通过作图发现，深圳市非户籍人口正逐年下降，这正与官方以及媒体报道深圳市产业转型相对应。由于深圳市人口结构中外来人口比例接近76%，而且外来人口中以青壮年居多，可以认为在较短时间内（十年内）外来人口年龄结构近似不变，同时当地户籍人口因为受历史条件影响，人口年龄结构在短期内也不会发生较大变化，所以

我们大胆假设深圳市未来十年人口年龄结构近似不变。同时深圳市各区发展水平相同，可以认为其人口发展态势与深圳市总体相同，所以其所在深圳市人口比例不变。通过查阅资料得知床位需求与各年龄段人数、住院率、平均住院天数以及该地平均年床开放日数有关，在查找资料以及大量演算基础上，利用已求出的常住人口变化函数，我们得出深圳市的床位需求函数，而深圳市各区对应的床位需求则为深圳市总的床位需求乘以本区总人口所占深圳市总人口的比例（已架设各区人口在较短时间内保持不变）。考虑到问题研究的实用性，我们选取了肺癌与胃癌作为深圳市疾病研究的对象，我们通过查找肺癌与胃癌在深圳市不同年龄段的发病率，这两种病在市级与区级医院的住院天数以及这两种级别的医院的平均年床开放日数，利用已知的病床需求函数，做出了针对深圳市不同级别医疗机构的函数表达式，通过函数表达式我们可以很轻松的看出深圳市不同类型医疗机构的床位需求。最后以我们的模型为依托去测试深圳市各年的相关数据，都表现出来比较好的吻合性，它充分证明了我们模型的正确性。但是，由于时间仓促，模型仍有不完善地方，而且有其局限性（在较长时间内误差较大），随着时间推移，深圳外来人口比例将更低，老龄化趋势将更加显著，这显然会影响深圳市各级机构床位需求的预测，我们希望可以引入包含年龄结构的函数对其修正，而这将会成为我们以后的一个研究方向。关键字：灰色GM(1,1)模型线性相关方程一、问题重述深圳市是一个流动人口多，户籍人口少的城市，外来人口多导致深圳市青壮年劳动力多，由于青壮年劳动力身体健康程度要高于其它人群，因此深圳目前人均医疗设施虽然低于全国类似城市平均水平，但仍能满足现有人口的就医需求。然而，随着时间推移和政策的调整，深圳老年人口比例会逐渐增加，产业结构的变化也会影响外来务工人员的数量。这些都可能导致深圳市未来的医疗需求与现在有较大的差异。未来的医疗需求与人口结构、数量和经济发展等因素相关。请根据深圳市人口特点预测未来十年深圳市人口数量和结构的发展趋势，以此为基础预测未来全市和各区医疗床位需求；根据深圳市人口的年龄结构和患病情况及所收集的数据，选择预测几种病在不同类型的医疗机构就医的床位需求。二、问题分析深圳市人口特点是流动人口多，非户籍人口多，但户籍人口较少，针对这个情况，我们选取人口结构中的主要矛盾，即常住人口与非常住人口（即非户籍人口）进行研究。我们首先分析了深圳市近十年的人口年龄结构变化，发现其结构变化幅度很小，因此在短期内我们可以认为其年龄结构恒定。由于本题需要处理数据较多，我们采用matlab进行辅助分析，通过拟合结果研究其常住人口已经非户籍人口变化。而对于人口结构，我们可以用非户籍人口与总人口的比例来表

深圳杯数学建模A题答案完整版

深圳杯数学建模A题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

摘要深圳作为中国经济发展的重点城市，人口与医疗问题已经成为我们的焦点话题，是一个复杂的系统工程。本文针对深圳地区人口年龄分布情况，外来务工人员的数量，从实际出发，在基于一些合理简化假设的基础上，建立数学模型，并充分利用matlab等软件简化计算，对相关问题进行了有针对性的求解。在预测未来十年深圳常住人口时，我们运用了matlab一元线性回归对近十年的数据进行了多次拟合，并对这些拟合进行了比较得出深圳常住人口模型公式为： 2 =+-+, 通过拟合预测出了未来十年深圳市常住人口的Q x e x x () 1.00050.00838.1671 数量，同时在网上2000年到2010年的人口结构的数据，通过Leslie矩阵预测出了未来十年人口结构的分布。通过分析深圳近人口数量和人口结构的变化，预测未来十年深圳市人口数量和结构的发展趋势，以此为基础预测未来全市和各区医疗床位需求呈线性递增趋势。同时选取了高血压，脑出血，癌症这三种疾病进行预测，运用matlab最小二乘法散点拟合，得出这三种疾病的发展趋势，由此预测出未来十年这三种疾病的就医的床位需求。关键词：matlab、一元线性回归、Leslie、最小二乘法、床位需求一、问题重述从深圳的人口的结构来看，显着的特点是流动人口远远超过户籍人口，且年轻人口占主绝对优势。流动人口主要从事第二、三产业的企业一线工人等。年轻人身体好，发病少，导致深圳目前人均医疗设施低于全国类似城市平均水平，但仍能满足现有人口的就医需求。然而，政策的调整与世界的推移会使深圳市老年人增加。产业结构的变化也会影流动人口的数量。直接会导致深圳市未来的医疗需求的变化。现有人口社会发展模型在面对深圳情况时，难以满足人口和医疗预测的要求。为了解决此问题，请根据深圳人口发展变化态势以及全社会医疗卫生资源投入情况（医疗设施、医护人员结构等方面）收集数据、建立针对深圳具体情况的数学模型，预测深圳未来的人口增长和医疗需求，解决下面几个问题： 1.分析深圳近十年常住人口、非常住人口变化特征，预测未来十年深圳市人口数量和结构的发展趋势，以此为基础预测未来全市和各区医疗床位需求； 2.根据深圳市人口的年龄结构和患病情况及所收集的数据，对几种病进行预测，在不同类型的医疗机构就医的床位需求。

深圳杯数模比赛A题最新答案

深圳人口与医疗需求预测摘要问题一中，由于深圳市不同于常规一线城市，从结构来看，深圳人口的显著特点是流动人口远远超过户籍人口，影响人口数量增长的因素较多，人口年龄结构变化大，常用人口预测模型误差较大，本文通过Mathematica 二次曲线拟合预测产生未来十年产业从业人员比例，并建立多元线性回归拟合模型来预测深圳市非常住人口数量，其次用 Markov 链预测未来人口年龄结构比例，利用Matlab 程序预测未来具有就医需求的总人口数并得出深圳市床位需求，以及各区床位需求。问题二中，选取两种疾病，利用灰色GM (1,1) 模型预测小儿肺炎和老年性白内障未来十年的入院率，利用Excel 处理得出对各类医疗机构床位需求权重，得到未来十年的小儿肺炎的床位需求和老年性白内障对各类医疗机构的床位需求。关键词：关键词：二次曲线拟合预测 Markov 链多元线性回归灰色GM (1,1) 预测模型 -1- 一、问题重述

深圳市我国人口增长最快的地方，从1980年到2010年，深圳每年都以30多万的人口增幅增长，到2010年深圳市总人口已达到1037万人。从结构来看，深圳人口的显著特点是流动人口远远超过户籍人口，且年轻人口占绝对优势。深圳流动人口主要是从事第二、三产业的企业一线工人和商业服务业人员。年轻人身体强壮，发病较少，因此深圳目前人均医疗设施虽然低于全国类似城市平均水平，但仍能满足现有人口的就医需求。然而，随着时间推移和政策的调整，深圳老年人口比例会逐渐增加，产业结构的变化也会影响外来务工人员的数量。这些都可能导致深圳市未来的医疗需求与现在有较大的差异。就深圳市的相关情况，建立数学模型分析研究下面的问题：问题一：分析深圳近十年常住人口、非常住人口变化特征，预测未来十年深圳市人口数量和结构的发展趋势，以此为基础预测未来全市和各区医疗床位需求。问题二：根据深圳市人口的年龄结构和患病情况及所收集的数据，选择预测几种病（如：肺癌及其他恶性肿瘤、心肌梗塞、脑血管病、高血压、糖尿病、小儿肺炎、分娩等）在不同类型的医疗机构就医的床位需求。二、问题分析问题一：近十年常住人口、非常住人口（由给出的数据得知，常住人口包括户籍人口和流动人口中非户籍人口（居住时间在6个月以上），非常住人口是流动人口中居住时间在六个月之内）与城市的经济产业发展高度相关。产业结构影响非常住人口数量，非常住人口数量影响常住人口数量，具有就医需求的人口数量等于常住人口与非常住人口之和。问题二中，由问题一得出的数据，针对人群对各类医疗机构的选择计算出需求权重，得出不同类型的医疗机构就医的床位需求。问题二：每一种疾病都会有一个高发人群年龄段，例如，老年性白内障，心脏病、高血压等疾病多发生在老年人中，而小儿肺炎发生在少年儿童中，因此该年龄段人口的比例严重影响着该种疾病入院率。因此需要预测先预测出来深圳市未来十年的入院率，其次在根据问题一得出的人口结构数量计算出每年的入院人数，再根据床位数=该病入院人数 × 平均住院日得出该种病的床位需求。一年的总天数(365天) 三、模型假设 1、假设深圳市各区人口体质保持不变，并且在同一年度各区入院率相同。 2、假设每种病每年平均住院日保持不变。 3、假设所预测出来的医院床位每天没有空闲的时候。 4、假设各区相对封闭，本区人口不会跨区就医。 -2-

深圳杯数学建模A题答案

摘要深圳作为中国经济发展的重点城市，人口与医疗问题已经成为我们的焦点话题，是一个复杂的系统工程。本文针对深圳地区人口年龄分布情况，外来务工人员的数量，从实际出发，在基于一些合理简化假设的基础上，建立数学模型，并充分利用matlab等软件简化计算，对相关问题进行了有针对性的求解。在预测未来十年深圳常住人口时，我们运用了matlab一元线性回归对近十年的数据进行式为：Q ( ，导致深圳目前人均医疗设施低于全国类似城市平均水平，但仍能满足现有人口的就医需求。然而，政策的调整与世界的推移会使深圳市老年人增加。产业结构的变化也会影流动人口的数量。直接会导致深圳市未来的医疗需求的变化。现有人口社会发展模型在面对深圳情况时，难以满足人口和医疗预测的要求。为了解决此问题，请根据深圳人口发展变化态势以及全社会医疗卫生资源投入情况（医疗设施、医护人员结构等方面）收集数据、建立针对深圳具体情况的数学模型，预测深圳未来的人

口增长和医疗需求，解决下面几个问题： 1.分析深圳近十年常住人口、非常住人口变化特征，预测未来十年深圳市人口数量和结构的发展趋势，以此为基础预测未来全市和各区医疗床位需求； 2.根据深圳市人口的年龄结构和患病情况及所收集的数据，对几种病进行预测，在不同类型的医疗机构就医的床位需求。 2.1 题目中所给的两个问题都属于预测的数学问题。其中问题一需要通过对深圳人口数量极其人口结构进行预测，以此为基础预测未来全市和各区医疗床位需求。为了解决此问题，我们首先要对近十年的常住人口与非常住人口进行分析，其次再对人口数量和结构进行分析，通过对这些已知数据的分析和统计，在预测未来十年深圳常住人口时，我们运用了matlab 对近十年的数据进行了多次拟合，并对这些拟合进行了比较得出深圳常住人口模型公式为：

深圳杯数学建模A题获奖论文

网络侧估计终端用户视频体验建模摘要现代社会，使用手机APP观看视频已经成为当代社会的一种普遍形式，本文依据统计回归方法，对网络侧变量和用户体验变量之间的函数关系进行拟合，令其余无关变量均近似地服从正态分布。采用多重拟合方式拟合出不同的评价函数，并进行误差检验。选择误差最小的评价函数。并基于评价函数，两个用户体验变量进行预测。同时对用户观看视频体验进行综合评价，采用多级指标，运用AHP及模糊综合评价法评价用户观看视频的满意度。求出权重，建立评价矩阵。得到用户观看视频满意度处在较满意和一般满意之间。最后，由于多种原因，本文建立的用户体验变量评价函数具有一定程度的误差，因此基于原有数据，建立灰色系统模型，再次进行预测，比较结果。建立GM（1,1）模型对相关指标进行预测，取预测区间长度为100，得出预测值，并绘制残差图对预测值进行检验。并与评价函数预测结果进行对比。验证评价函数的正确性。同时得到结论，基于原始数据直接建立灰色系统，预测相对更加准确。关键词：统计回归；综合评价；灰色预测；残差检验一.问题重述随着科技的日益进步，无线宽带网络也随之无限升级。智能终端在大众生活中普及，越来越多的用户选择在智能终端上（以手机为主）应用客户端APP来观看网络视频，这是一种基于TCP（是一种面向连接的、可靠的、基于字节流的传输层通信协议）的视频传输以及播放。在观看网络视频时，有很多因素指标会影响用户对于视频的观看体验，而其中两个关键指标是初始缓冲等待时间和卡顿缓冲时间，我们可以用初始缓冲时延和卡顿时长占比（卡顿时长占比=卡顿时长/视频播放时长）来定量评价用户体验。研究表明影响初始缓冲时延和卡顿时长占比的主要因素有初始缓冲峰值速率、播放阶段平均下载速率、端到端环回时间（E2ERTT）以及视频参数。然而这些因素和初始缓冲时延以及卡顿时长占比之间的关系并不明确。本文拟通过数学建模的方式对网络端视频用户体验做综合评价和预测，以采取针对性的措施提高网络端视频用户体验的满意程度。本文尝试解决以下问题： 1、根据实验数据建立起用户体验评价变量和网络侧变量之间的函数关系。 2、对网络侧终端用户体验进行定量的综合评价。

深圳杯数学建模A题

————————————————————————————————作者：————————————————————————————————日期：

答卷编号（参赛学校填写）：答卷编号(竞赛组委会填写）：论文题目: A题:深圳人口与医疗需求预测组别：本科生参赛学校:东北电力大学报名序号:(可以不填) 参赛队员信息(必填)：姓名专业班级及学号联系电话参赛队员 1 李峰自动化卓越111班２5 参赛队员 2 李扬电自1１1３班２4 参赛队员 3 黄阳红电自1１1４班２３ ?

答卷编号(竞赛组委会填写）：评阅情况(省赛评阅专家填写）: 省赛评阅１：省赛评阅2: 省赛评阅３：省赛评阅4: 省赛评阅５：

深圳市人口与医疗需求预测模型摘要本论文针对所提出的“深圳人口与医疗需求预测”的问题，根据所给定的深圳市现有数据及其相关查阅参考资料建立起深圳具体情况的数学模型，预测深圳未来的人口增长和医疗需求。首先，对深圳市常住人口数据进行分析,用MＡTＬＡB的scaｔｔe ｒ散点图描点可以大致看出深圳市常住人口（R）与时间（T）呈线性增长变化,于是通过多项式曲线拟合构建一阶深圳市常住人口与时间的线性方程模型。同样从非常住人口数据中初步估计模型，根据实际数据情况,对于非常住人口的变化特征,我们采用了灰色模型(Grey Mｏdｅl,GM)，使用MAＴLAB对灰色模型GM（1，1)编程得到预测值,残差,级比偏差等相关数据结果。由于初步编程得出的预测模型为其累加后的方程,通过生成序列预测值及模型还原值之间的关系及之前所求的预测值模型易求的非常住人口变化特征模型。而对于之后的人口结构特征模型及病床床位需求模型均采用多项式二阶及三阶曲线拟合,所得其模型方程。考虑到问题研究的实用性,我们选取了肺癌与胃癌作为深圳市疾病研究的对象,我们通过查找肺癌与胃癌在深圳市不同年龄段的发病率，这两种病在市级与区级医院的住院天数以及这两种级别的医院的平均年床开放日数，利用已知的病床需求函数,做出了针对深圳市不同级别医疗机构的函数表达式,通过函数表达式我们可以很轻松的看出深圳市不同类型医疗机构的床位需求。最后以我们的模型为依托去测试深圳市各年的相关数据,都表现出来比较好的吻合性，它充分证明了我们模型的正确性。但是,由于时间仓促,模型仍有不完善地方，而且有其局限性(在较长时间内误差较大),随着时间推移,深圳外来人口比例将更低,老龄化趋势将更加显著，这显然会影响深圳市各级机构床位需求的预测,我们希望可以引入包含年龄结构的函数对其修正，而这将会成为我们以后的一个研究方向。关键词：多项式曲线拟合、灰色预测模型、床位需求方程、人口与医疗

深圳杯数学建模题目

2014“深圳杯”数学建模夏令营A题计划生育政策调整对人口数量、结构及其影响的研究人口的数量和结构是影响经济社会发展的重要因素。从20世纪70年代后期以来，我国鼓励晚婚晚育，提倡一对夫妻生育一个孩子。该政策实施30多年来，有效地控制了我国人口的过快增长，对经济发展和人民生活的改善做出了积极的贡献。但另一方面，其负面影响也开始显现。如小学招生人数（1995年以来）、高校报名人数（2009年以来）逐年下降，劳动人口绝对数量开始步入下降通道，人口抚养比的相变时刻即将到来，这些对经济社会健康、可持续发展将产生一系列影响，引起了中央和社会各界的重视。党的十八届三中全会提出了开放单独二孩，今年以来许多省、市、自治区相继出台了具体的政策。政策出台前后各方面人士对开放“单独二孩”的效应有过大量的研究和评论。人口问题有着悠久的研究历史，也有不少经典的理论和模型。这些理论和模型都依赖生育模式、生育率、死亡率和性别比等多个因素。这些因素与政策及人的观念、社会文化习俗有着紧密的关系，后者又受社会经济发展水平的影响。研究中用到的数据的置信水平也与调查统计有关。请收集一些典型的研究评论报告，根据每十年一次的全国人口普查数据，建立模型，对报告的假设和某些结论发表自己的独立见解，并针对深圳市或其他某个区域，讨论计划生育新政策（可综合考虑城镇化、延迟退休年龄、养老金统筹等政策因素，但只须选择某一方面作重点讨论）对未来人口数量、结构及其对教育、劳动力供给与就业、养老等方面的影响。

2014年“深圳杯”数学建模夏令营C题垃圾焚烧厂的经济补偿问题 “垃圾围城”是世界性难题，在今天的中国显得尤为突出。2012年全国城市生活垃圾清运量达到1.71亿吨，比2010年增长了1300万吨。数据显示，目前全国三分之二以上的城市面临“垃圾围城”问题，垃圾堆放累计侵占土地75万亩。因此，垃圾焚烧正逐步成为中国垃圾处理的主要手段之一。城市垃圾经过分类处理，剔除可回收垃圾和有害垃圾后将剩余垃圾在焚烧炉中焚烧处理，既可避免垃圾填埋侵占大量的土地，又可利用垃圾焚烧产生的能量进行发电等获得可观的经济效益。然而，由于政府监管不力、投资者目光短浅等多方面的原因，致使前些年各地建设的垃圾焚烧电厂在运营中出现了环境污染问题，给垃圾焚烧技术在我国的推广造成了很大阻力，许多城市的新建垃圾焚烧厂选址都出现因居民反对而难以落地的局面。事实上垃圾焚烧厂对环境的污染风险与建设投资规模、运行监管力度有直接关系。小型垃圾焚烧厂由于没有规模效应，在污染治理方面的投入也会受到影响，致使其污染物排放比较严重，难以达到国家新的排放标准，对环境的危害较大。尤其是目前建厂选址尤为困难，所以国内各大城市目前均倾向于采用新型大型焚烧炉的焚烧厂取代分散的小型焚烧炉的举措。然而大型焚烧厂又存在需要考虑垃圾运输成本与道路建设成本等问题，因此对于不同城市来说，究竟该把大型焚烧厂的建设规模控制在什么水平，这是一个值得研究的课题。在垃圾焚烧厂运行监管方面，目前主要是在垃圾焚烧厂内进行测量监控，缺少从周边环境视角出发的外围动态监控，因而难以形成为民众所信服的全方位垃圾焚烧厂环境监控体系。深圳市某地点计划建立一个中型的垃圾焚烧厂，计划处理垃圾量1950吨/天（设置三台可处理垃圾650吨/天的焚烧炉，排烟口高度80米，每天24小时运转）。从构建环境动态监控体系、并根据潜在污染风险对周围居民进行合理经济补偿的需求出发，有关部门希望能综合考虑垃圾焚烧厂对周围带来环境污染以及其他危害的多种因素（例如，焚烧炉的污染物排放量、居住点离开垃圾焚烧厂的距离、风力和风向及降雨等气象条件、地形地貌以及建筑物的遮挡程度等等），在进行科学定量分析的基础上，确立一套可行的垃圾焚烧厂环境影响动态监控评估方法，并针对潜在环境风险制定出合理的经济补偿方案。请你在收集相关资料的基础上考虑以下问题： (1) 假定焚烧炉的排放符合国家新的污染物排放标准（参见附件1），根据垃圾焚烧厂周边环境设计一种环境指标监测方法，实现对垃圾焚烧厂烟气排放及相关环境影响状况的动态监控。以你设计的环境动态监控体系实际监控结果为依据，设计合理的周围居民风险承担经济补偿方案。 (2) 由于各种因素焚烧炉的除尘装置（如袋式除尘器）损坏或出现其他故障导致污染物的排放增加，致使相关各项指标将严重超标（如：烟尘浓度、二氧化硫、氮氧化物、一氧化碳、二恶英类及重金属等排放超标，附件2给出了一台可处理垃圾350吨/天的焚烧炉正常运作时的在线排放监测记录）。请在考虑故障发生概率的情况下修正你设计的监测方法和补偿方案。

2015深圳杯数学建模a题课程论文

《数学建模II》课程论文组别学生一学生二学生三时间成绩

摘要: 医疗保险是关系到国计民生和国家发展的重大问题，基金统筹定额标准对医疗保险的发展、完善和社会稳定发展有重要影响。本文探讨了年基金支付总额与年龄之间的关系，给出新的定额标准，并对按参保人年龄结构分类的每一类定点医疗机构下一年度的定额总费用进行预测。针对问题一，我们建立模型一和模型二。模型一计算出人均支付基金总额，利用excel 画出折线图，并且根据折线图的分布进行不同区间对你曲线进行拟合，利用隶函数，确定出人均支付基金总额与年龄的之间的函数关系，并通过相关性检验，得到了相应的方程。模型二分析得到年基金支付总额与看病次数近似成正比关系，然后将年基金支付总额0到180万分成6 段，利用每个年龄看病次数占总的看病次数的比重求的每段一个平均年基金支付总额，再求的每个区间段的平均人数，平均总额与平均人数的比即为新的定价。针对问题二，对附件4的数据进行分析，建立了聚类分析模型，对46个医疗机构进行的分类，运用SPSS 进行求解，把医疗机构分成了5类，分类结果见表五，然后在新的定额标准下，利用excel 求的每一个医疗机构的总费用，最后用均值表示为每一类医疗机构的下一年的预测费用为：关键词：：统计回归聚类分析拟合一、问题描述近来，为给各县市居民的医保方便，各县市纷纷出台有关社会基本医疗保险普通门诊统筹的相关办法，其中，职工医疗保险、外来劳务人员大病医疗保险、未成年人医疗保险、城乡居民基本医疗保险的参保人全部纳入门诊统筹的范围。医疗保险欺诈，是指公民、法人或者其他组织在参加医疗保险、缴纳医疗保险费、享受医疗保险待遇过程中，故意捏造事实、弄虚作假、隐瞒真实情况等造成医疗保险基金损失的行为。骗保人进行医保欺诈时通常使用的手段，一是拿着别人的医保卡配药，二是在不同的医院和医生处重复配药。下面这些情况都有可能是医保欺诈：单张处方药费特别高，一张卡在一定时间内反复多次拿药等。社会基本医疗保险门诊统筹实行定点医疗。某市医疗保险定点医疗机构为社区卫生服务机构及镇卫生院。保险按照年度定额筹集，每人每年100元。由于医疗保险基金收

2016深圳杯数学建模A题

赛区评阅编号（由赛区组委会填写）： 2016年山西省大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》（以下简称为“竞赛章程和参赛规则”，可从全国大学生数学建模竞赛网站下载）。我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。我们知道，抄袭别人的成果是违反竞赛章程和参赛规则的，如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺，严格遵守竞赛章程和参赛规则，以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为，我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。我们参赛选择的题号（从A/B/C/D中选择一项填写）： A 我们的报名参赛队号（12位数字全国统一编号）：04002012 参赛学校（完整的学校全称，不含院系名）：太原理工大学参赛队员(打印并签名) ：1.黄子蓉 2.杨力兵 3.杨振跃指导教师或指导教师组负责人(打印并签名)：赵国贞日期： 2016 年 5 月 12 日（此承诺书打印签名后作为纸质论文的封面，注意电子版论文中不得出现此页。以上内

容请仔细核对，特别是参赛队号，如填写错误，论文可能被取消评奖资格。）赛区评阅编号（由赛区组委会填写）： 2016年山西省大学生数学建模竞赛编号专用页送全国评奖统一编号（由赛区组委会填写）：全国评阅统一编号（由全国组委会填写）：此编号专用页仅供赛区和全国评阅使用，参赛队打印后装订到纸质论文的第二页上。注

深圳杯数学建模比赛D题参考论文

承诺书我们仔细阅读了山西赛区数学建模联赛的竞赛规则. 我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。我们知道，抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。如有违反竞赛规则的行为，我们将受到严肃处理。我们参赛选择的题号是（从A/B/C/D中选择一项填写）： D 我们的参赛报名号为：参赛队员(打印并签名) ：1. 2. 3.

评阅记录

自然灾害保险问题的研究摘要本文给出P省2012年政策性农业保险统颁条款（种植部分），首先对2012年P省政策性农业保险统颁条款(部分)进行分析，然后对P省10地区的2002～2011年的主要气象数据进行统计分析，再对全国各省（市、区）的1998～2011年的农作物受灾统计数据分析，最后针对各个问题建立模型并求解。针对问题一，我们首先利用EXCEL和 SPSS统计软件对各气候条件的数据进行处理，研究P省现有农业灾害保险险种方案可能存在的风险，并分析其方案是否存在不合理性。关键字：spss回归分析泊松分布条件概率一、问题重述根据2013年3月5日《环球时报》转摘美国《商业周报》的相关报道，“在2012年全世界发生的10大自然灾害中，有4场是发生在中国。包括3场严重的夏季洪涝灾和席卷苏鲁冀等沿海地区的台风‘达维’造成的灾害。另外，还有很多地区遭受了严重干旱、冰雹等自然灾害，共造成290亿美元的损失，但通过投保由保险公司赔付的比例仅占总损失的４％左右，这个比例相对美国的自然灾害保险赔付率相差甚远。”另据报道：“2013年3月20日发生在广东、广西等省部分地区的一场大风和冰雹灾害，造成直接经济损失达13亿多元。”这个事实警示我们，中国需要重视和加强自然灾害保险的研究和实践，特别是针对严重自然灾害的保险体系建设和对策方案的研究，推动由政府主导的自然灾害政策性保险方案的实施。农业灾害保险是国家政策性保险之一，即政府为保障国家农业生产的发展，基于商业保险的原理并给予政策扶持的一类保险产品。农业灾害保险也是针对自然灾害，保障农业生产的重要措施之一，是现代农业金融服务的重要组成部分，它与现代农业技术、现代农业信息化及市场建设共同构成整个农业现代化体系。农业灾害保险险种是一种准公共产品，基于投保人、保险公司和政府三方面的利益，按照公平合理的定价原则设计，由保险公司经营的保险产品，三方各承担不同的责任、义务和风险。农业灾害保险分种植业保险和养殖业保险两大类，现有几十个险种，因不同地区的气象条件和作物种类不同，其险种和设置方案都不尽相同。农业灾害保险除遵循保险的共同原理外，有其自身的特点。比如，其损失规律有别于人寿保险和通常的财产保险（如汽车险）等。政府作为投保人和承保人之外的第三方介入以体现对国家安全和救灾的责任。附件1给出了P省种植业现行的部分险种方案，请你们从实际出发，查阅和参考附件中的数据资料，通过分析建模，研究解决下面的问题：（1）对附件2中的数据做必要的统计分析，研究P省现有农业灾害保险险种方案可能存在的风险，并分析其方案是否存在不合理性。（2）针对P省的具体情况，选取其中部分农业灾害保险险种，设计更实际可行的农业灾害保险的险种方案，包括标的、保险金、保费、费率、赔付率、政府补贴率等；并对方案的有效性（即保险公司和投保人的风险大小）及可行性做出定量分析。

2016深圳杯数学建模优秀论文B

摘要随着居民生活水平的提高，传统的填埋方式已经不能完全解决日益增多的垃圾产生量，以垃圾焚烧为主的处理方式成为我国解决“垃圾围城”问题的必由之路。但是由于我国在垃圾焚烧领域起步较晚，垃圾焚烧厂运行不稳定，加之信息不对称，导致居民对垃圾焚烧污染排放的担忧，对垃圾焚烧厂的选址和运营都造成了困扰。而现行垃圾焚烧除尘工艺不能持续稳定运行的缺陷，是致使社会公众对垃圾焚烧产生危害疑虑的主要原因。本文给出袋式除尘系统运行稳定性φ的定义为垃圾焚烧厂实际工况与正常工况污染物排放浓度的差值同实际工况与国标规定排放限额差值之比，φ越小说明袋式除尘系统运行越稳定，φ>1说明袋式除尘系统处于不稳定状态。目前国内对垃圾焚烧袋式除尘系统稳定性方面的研究比较少，主要集中在定性研究方面。本文试图通过定量的方法，深入解析袋式除尘系统的除尘原理和运行机制量化评价袋式除尘系统的稳定性。本文将为研究袋式除尘器在正常工况下的除尘效率，本文从过滤原理入手，根据PTFE(聚四氟乙烯)覆膜滤袋的纤维特性和表面过滤原理构建了粉尘颗粒床过滤效率和阻力计算模型，并与实际数据对比，证明用PTFE覆膜滤袋的袋式除尘系统在正常运行工况下可以达到99.8%以上的运行效率，使粉尘排放浓度达到20mg/Nm3以下，完全可以满足国标规定的排放要求。其次，本文对袋式除尘系统各种故障进行系统的分析将滤袋损坏分为破损与糊袋两类，从滤料的理化特性着手，创新性的提出袋式除尘系统滤袋的损坏是受运行温度，滤料的长期蠕变和滤袋磨损这三个主要因素共同作用的结果，并定量分析了三个因素各自对滤袋损坏的作用，构建滤袋TCF(温度-蠕变-磨损)损坏模型，用以模拟袋式除尘系统的滤袋损坏情况，并用实际运行数据进行检验，取得了良好的效果。本文结合袋式除尘系统正常工况下除尘效率模型和滤袋损坏的TCF模型对稳定性进行求解，结果显示一号炉的运行稳定性φ1= 0.2198，二号炉的运行稳定性φ2= 0.8427，采用新的除尘工艺的运行稳定性较一号炉提升97.99%，较二号炉提升98.66%。并且在现有稳定性的基础上根据大气污染的高斯扩散模型，以深圳市宝安区老虎坑垃圾焚烧发电厂计算周围2.5公里范围内颗粒物排放浓度的限额，推导出基于颗粒物排放的垃圾焚烧厂扩建的环境最大允许上限为7365.14吨每天。关键词：袋式除尘系统稳定性污染物排放标准除尘效率模型运行阻力模型滤袋损坏的TCF模型多元非线性回归大气污染高斯扩散模型排放限额监测方案

深圳杯数学建模c题论文

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。我们知道，抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。如有违反竞赛规则的行为，我们将受到严肃处理。我们参赛选择的题号是（从A/B/C/D中选择一项填写）： C 我们的参赛报名号为（如果赛区设置报名号的话）：所属学校（请填写完整的全名）：洛阳师范学院参赛队员(打印并签名) ：1. 田菲菲 2. 梁雪颖 3. 王阵东指导教师或指导教师组负责人(打印并签名)：日期：2013年 06月 01 日赛区评阅编号（由赛区组委会评阅前进行编号）：

编号专用页赛区评阅编号（由赛区组委会评阅前进行编号）：全国统一编号（由赛区组委会送交全国前编号）： 2013年.doc 全国评阅编号（由全国组委会评阅前进行编号）：

垃圾减量分类活动中社会及个体因素的量化分析摘要由于人类生产和生活的不断发展，产生的垃圾对生态环境及人类生存带来极大的威胁，这逐渐成为重要的社会问题。本文主要是针对垃圾减量分类的一系列评价及预测进行了建模、求解以及相关分析。对问题一基于层次分析模型。根据题意共设七个不同的因素，利用“层次分析法”建立矩阵并进一步计算最大特征值的权重，通过计算并比较他们组合权向量大小得出天景花园的垃圾减量处理效果要好于阳光家园。对问题二该问题要分析一组随机变量之间的相关性关系,运用相似系数中的相关系数分析试点小区四类垃圾组分本身的数量之间的相关性，得到天景花园和阳光花园各自四类垃圾的相关系数矩阵，由相关系数的大小得到它们之间的相关性。由模型一中的归一后的权向量可知各项激励措施与减量分类效果呈正相关。对问题三基于分层抽样模型。通过分析附件8中的资料得出深圳市较其他城市混合类垃圾所占比例大，所以基础数据分项不足够；粒径分在0.5mm以下，颗粒径已经足够；厨余垃圾含水率所占比例最高，因此对厨余垃圾数据的收集应该投放更多的精力和成本；设置少量抽样数据检测减量分类效果时，主要运用了分层随机抽样模型。对问题四基于)1 GM模型和多元线性回归模型。通过查找资料得出深圳市最近五年的年末1(，全市常住人口数据、环保投资数据以及第三产业数据，通过)1 GM模型对未来数据进 1(，行了预测，然后建立多元回归方程，最终预测出措施实施的最好与最坏结果。关键词：层次分析法；组合权重；多元线性回归模型；相关系数矩阵；分层随机抽样；GM模型 )11(，

深圳杯大学生数学建模优秀范文

大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》（以下简称为“竞赛章程和参赛规则”，可从全国大学生数学建模竞赛网站下载）。我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。我们知道，抄袭别人的成果是违反竞赛章程和参赛规则的，如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺，严格遵守竞赛章程和参赛规则，以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为，我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。我们参赛选择的题号是（从A/B/C/D/E中选择一项填写）：我们的报名参赛队号为（8位数字组成的编号）：所属学校（请填写完整的全名）：参赛队员(打印并签名) 1. 2. 3. 指导教师或指导教师组负责人(打印并签名)：（论文纸质版与电子版中的以上信息必须一致，只是电子版中无需签名。以上内容请仔细核对，提交后将不再允许做任何修改。如填写错误，论文可能被取消评奖资格。）日期：年月日赛区评阅编号（由赛区组委会评阅前进行编号）：

大学生数学建模竞赛编号专用页赛区评阅编号（由赛区组委会评阅前进行编号）：

医保欺诈行为的主动发现摘要本文针对医保欺诈行为，采用数据挖掘思想，首先对医保欺诈的方式进行分析，应用在医保领域可能需要的一些数据挖掘应用场景。实施针对医保数据的数据探索,分析附件所给的医保数据特征,将数据挖掘技术应用于医保参保人细分、医保支出挖掘等方面,并且根据医保业务需求抽象出一种医保欺诈行为检测问题,最后采用挖掘算法,针对各个问题建立模型并求解。并对所得的结果进行分析比较，以此来主动发现医保欺诈行为。关键词数据挖掘异常检测数据清洗效-效相似性检测 WSimRank算法

论文--数学建模深圳杯

垃圾分类处理与清运方案设计摘要本文首先分析相关数据，确立了使用三个大型设备处理中心的方案。在深刻研究深圳南山区38个转运站的分布情况，确立三个处理中心的坐标，并以此为基础，为达到最佳经济效益和环保效果这个目标，找出分配的最优方案。在当转运站允许重新设计时，根据各小区相关数据，确立了处理中心的个数及位置。针对问题一，在垃圾转运站的位置与数量已定时，选定只使用三个大型设备处理中心这个方案。通过研究38个转运站的具体分布情况，利用Lingo软件，以线性回归函数： Min=)() ∑∑ == ? + ? = + + 3 i 找出三个处理中心的坐标，具体坐标位置分别为：A（18，21），B（35，35），C（41，59）。通过数据分析确立一个基本分配原则：凡是厨余垃圾量多于10吨，均直接分派运输车运输回对应处理中心，直至厨余垃圾量小于10吨。最终求出了每辆大型厢车的具体运输方案总共需要37辆车。在此基础上，给出总费用表达式：总费用=车辆的运输费用+设备的处理费用+固有成本- 垃圾处理后的收益

针对问题2，当在垃圾转运站的位置与数量不定时，根据各小区人口数量等信息，确立垃圾转运站的数量以及具体的位置，利用距离矩阵，找出转运站具体坐标位置： S=D*A=[S(V1) S(V3) ..... S(VC) ] 最后再根据模型一来求解最优的清运路线方案。关键词：线性规划最优分配距离举证Lingo软件一、问题重述在垃圾分类收集与处理中，不同类的垃圾有不同的处理方式，简述如下：1）厨余垃圾可以使用脱水干燥处理装置，处理后的干物质运送饲料加工厂做原料。不同处理规模的设备成本和运行成本（分大型和小型）。 2）可回收垃圾将收集后分类再利用。 3）有害垃圾，运送到固废处理中心集中处理。 4）其他不可回收垃圾将运送到填埋场或焚烧场处理。所有垃圾将从小区运送到附近的转运站，再运送到少数几个垃圾处理中心。显然，1)和2)两项中，经过处理，回收和利用，产生经济效益，而3)和4）只有消耗处理费用，不产生经济效益。已知相关数据如下：表1 厨余设备相关数据类别处理能力投资额运行成本产物价格大型厨余设备200吨/日4500万元150元/吨1000-1500元/吨小型厨余设备200-300公斤/日28万元200元/吨1000-1500元/吨表2 四类垃圾比例类别厨余垃圾可回收垃圾有害垃圾其他不可回收垃圾比例 4 2 1 3 表3可回收垃圾的相关数据类别所占比类回收价格纸类55% 1元/公斤