第1章数学建模与误差分析 1.1 数学与科学计算 数学是科学之母,科学技术离不开数学,它通过建立数学模型与数学产生紧密联系,数学又以各种形式应用于科学技术各领域。数学擅长处理各种复杂的依赖关系,精细刻画量的变化以及可能性的评估。它可以帮助人们探讨原因、量化过程、控制风险、优化管理、合理预测。近几十年来由于计算机及科学技术的快速发展,求解各种数学问题的数值方法即计算数学也越来越多地应用于科学技术各领域,相关交叉学科分支纷纷兴起,如计算力学、计算物理、计算化学、计算生物、计算经济学等。 科学计算是指利用计算机来完成科学研究和工程技术中提出的数学问题的计算,是一种使用计算机解释和预测实验中难以验证的、复杂现象的方法。科学计算是伴随着电子计算机的出现而迅速发展并获得广泛应用的新兴交叉学科,是数学及计算机应用于高科技领域的必不可少的纽带和工具。科学计算涉及数学的各分支,研究它们适合于计算机编程的数值计算方法是计算数学的任务,它是各种计算性学科的联系纽带和共性基础,兼有基础性和应用性的数学学科。它面向的是数学问题本身而不是具体的物理模型,但它又是各计算学科共同的基础。 随着计算机技术的飞速发展,科学计算在工程技术中发挥着愈来愈大的作用,已成为继科学实验和理论研究之后科学研究的第三种方法。在实际应用中所建立的数学模型其完备形式往往不能方便地求出精确解,于是只能转化为简化模型,如将复杂的非线性模型忽略一些因素而简化为线性模型,但这样做往往不能满足精度要求。因此,目前使用数值方法来直接求解较少简化的模型,可以得到满足精度要求的结果,使科学计算发挥更大作用。了解和掌握科学计算的基本方法、数学建模方法已成为科技人才必需的技能。因此,科学计算与数学建模的基本知识和方法是工程技术人才必备的数学素质。 1.2 数学建模及其重要意义 数学,作为一门研究现实世界数量关系和空间形式的科学,在它产生和发展的历史长河中,一直是和人们生活的实际需要密切相关。用数学方法解决工程实际和科学技术中的具体问题时,首先必须将具体问题抽象为数学问题,即建立起能描述并等价代替该实际问题的数学模型,然后将建立起的数学模型,利用数学理论和计算技术进行推演、论证和计算,得到欲求解问题的解析解或数值解,最后用求得的解析解和数值解来解决实际问题。本章主要介绍数学建模基本过程和求解数学问题数值方法的误差传播分析。 1.2.1 数学建模的过程 数学建模过程就是从现实对象到数学模型,再从数学模型回到现实对象的循环,一般通过表述、求解、解释、验证几个阶段完成。数学建模过程如图1.2.1所示,数学模型求解方法可分为解析法和数值方法,如图1.2.2所示。 表述是将现实问题“翻译”成抽象的数学问题,属于归纳。数学模型的求解方法则属于演绎。归纳是依据个别现象推出一般规律;演绎是按照普遍原理考察特定对象,导出结论。演绎利用严格的逻辑推理,对解释现象做出科学预见,具有重要意义,但是它要以归纳的结论作为公理化形式的前提,只有在这个前提下
典型相关分析 在对经济问题的研究和管理研究中,不仅经常需要考察两个变量之间的相关程度,而且还经常需要考察多个变量与多个变量之间即两组变量之间的相关性。典型相关分析就是测度两组变量之间相关程度的一种多元统计方法。 典型相关分析计算步骤 (一)根据分析目的建立原始矩阵 原始数据矩阵 ? ?????? ?????? ?nq n n np n n q p q p y y y x x x y y y x x x y y y x x x 2 1 2 1222 21 22211121111211 (二)对原始数据进行标准化变化并计算相关系数矩阵 R = ?? ? ? ??2221 1211 R R R R 其中11R ,22R 分别为第一组变量和第二组变量的相关系数阵,12R = 21 R '为第一组变量和第二组变量的相关系数 (三)求典型相关系数和典型变量 计算矩阵=A 111-R 12R 122-R 21R 以及矩阵=B 122-R 21R 1 11-R 12R 的特征值和特征向量,分 别得典型相关系数和典型变量。 (四)检验各典型相关系数的显著性 第五节 利用SPSS 进行典型相关分析 第一步,录入原始数据,如下表:X1 X2 X3 X4 X5 分别代表多孩率、综合节育率、初中及以上受教育程度的人口比例、人均国民收入和城镇人口比例。 研究人口出生与教育程度、生活水平等的相关。
1、点击“Files→New→Syntax”打开如下对话框。 2、输入调用命令程序及定义典型相关分析变量组的命令。如图
输入时要注意“Canonical correlation.sps”程序所在的根目录,注意变量组的格式和空格。 第三步,执行程序。用光标选择这些命令,使其图黑,再点击运行键,即可得到所有典型相关分析结果。
堰塞湖及其处理 1.什么是堰塞湖 堰塞湖(barrier lake)是由山体滑坡堵塞河道后蓄水而形成的湖泊。堵塞河道的滑坡体, 称“堰塞体”, 实际上是一座天然水坝, 堰塞湖实际上是一座水库。 在堰塞湖形成的当时, 如果它对上下游构成威胁, 就要采取紧急措施进行处理。对于那些对上下游不构成威胁, 或者经处理后, 堰塞体还可加以利用, 那么, 还可将这些堰塞体或堰塞湖永久保留, 并改造成永久性的水坝和水库, 将害转化为利。 造成山体滑坡的原因主要有以下三种: (1)地震 由地震造成的滑坡体形成的堰塞体也称“地震坝”。我国重庆黔江上的小南海,就是在清代(1856年)因地震形成的一座堰塞湖, 坝长约100m, 坝高约30m。由于后来又人为开设了溢洪道,因此它能与人工水坝工程比美, 现已成为旅游胜地, 并享有“深山明珠”等美誉。对其成因,李四光曾有“冰窖”之说。世界上有众多的这类堰塞湖。 (2)火山熔岩流 由火山熔岩流形成的堰塞湖, 特称“熔岩堰塞湖”。 我国有多座著名的熔岩堰塞湖, 如: ①黑龙江省东南部的镜泊湖。是一座经5次火山爆发由熔岩流堵塞河道形成的。 ②黑龙江省的五大连池。由14座火山爆发形成, 在河道上形成了5个一串相邻的堰塞湖, 故名。 ③新疆的天山天池。天山天池距乌鲁木齐110km, 湖面呈半月形, 长3400m, 最宽处1500m, 最深105m, 有“天山明珠”的盛誉。 (3)特殊的地质构造 由特殊的地质构造造成的山体滑坡形成的堰塞体也称“山崩坝”。 我国陕西的天池就是由特殊的地质构造产生山体滑坡堵塞了太乙河形成的堰塞湖。天池也称太乙池。 诚如上述, 滑坡体可以堵塞河流形成水库;然而, 世界上还有完全相反的、也许是绝无仅有的一个史实:滑坡体竟然会使已有的水库消失——这就是意大利的瓦依昂(Vajont)坝库区的一次特大山体滑坡, 滑坡体将该水库填满, 原有水库不复存在, 该坝成了一座不蓄水的被废弃的坝。该滑坡体方量竟达2.4亿m3, 而当时的库容仅1.2亿m3。 还要指出的是, 就堵塞河道形成天然水坝来说, 除了上述的堰塞体外, 还有“冰坝”。由冰坝形成的水库称“冰坝湖”。 现在的研究发现, 在远古时期, 俄罗斯就存在有大型冰坝湖。 我国黄河每值冬春季节, 在多湾多滩的河段, 易发生冰凌插塞堆积现象, 严重时便形成了冰坝, 对上下游形成威胁。 2. 堰塞湖的处理措施 在发生山体滑坡形成堰塞湖的初期, 如果堰塞湖对上下游的人民生命财产构成威胁时, 就要进行紧急处理。处理措施主要有: (1)开挖溢洪道。 在堰塞湖岸开挖溢洪道(或明渠)是处理堰塞湖的常用方法, 如图1所示。溢洪道通常都是将湖水排泄到堰塞体下游的原河道, 也可考虑排泄到相邻河道或相邻河道的水库中(要具有这种地形条件, 同时在所泄湖水对相邻河道或相邻河道的水库不带来危害的情况下才予考虑)。
第39卷第16期2009年8月数学的实践与认识M A TH EM A T I CS I N PRA CT I CE AND TH EO R Y V o l 139 N o 116 A ugust,2009 唐家山堰塞湖泄洪的理论模型及数值模拟 王 莉1, 高毅欣2, 程佩佩1, 魏永生3 (1.西安交通大学理学院,陕西西安 710049) (2.西安交通大学电信学院,陕西西安 710049) (3.北京交通大学理学院,北京 100044) 摘要: 针对2008年全国研究生数学建模竞赛A 题,研究和解决汶川地震中唐家山堰塞湖的泄洪问题.建立了唐家山堰塞湖的蓄水量模型、溃坝模型、洪水演进模型和人员调度模型等理论模型,并给出了这些模型的精确数值模拟.模拟结果显示,提出的模型具有较高的精度,依据该模型提出的调度方案能够合理解决泄洪时的人员撤离问题,具有重要的参考意义. 关键词: 产汇流估计;圣维南方程组;动态模拟;网络流算法 1 问题分析 收稿日期:2009204230 2008年5月12日14:28在我国四川汶川地区发生了8.0级强烈地震,给人民生命财产和国民经济造成了极大的损失.地震引发的次生灾害也相当严重,截至5月22日,震灾区共发现堰塞湖33处,其中以唐家山堰塞湖尤为严重. 唐家山堰塞湖距离北川县城6公里,大坝坝顶高程750.2米,坝高82.8米,顺河长约220米,湖上游集雨面积3550平方公里.地震后每天新增至少500万立方米的水量,随着水位不断上涨,对下游地区造成了严重威胁. 本文工作旨在:1)建立唐家山堰塞湖以水位高程为自变量的蓄水量数学模型;2)在合理的假设下,建立堰塞湖蓄水漫顶后在水流作用下发生溃坝的数学模型,包含缺口宽度、深度、水流速度、水量、水位高程,时间等变量;3)根据数字地图给出坝体发生溃塌、造成堰塞湖内1 3的蓄水突然下泻时的洪水水流速度及淹没区域;4)根据地形和人口数据,提出当上述溃坝情况发生时的有效调度方案,从而极大减少损失. 2 蓄水量模型 设唐家山堰塞湖的水位高程和蓄水量分别为时间t 的函数H (t )和V (t ),并设t 时刻湖面面积为S t .根据流入堰塞湖中的水体积与堰塞湖新增水体积相等,建立微分方程:dV (t )=S t dH (t ) (2.1)根据[4]可知,唐家山堰塞湖的湖面面积S 和时间t 之间是分段线性函数,水位高程H (t )和时间t 之间的关系也是一个分段多项式函数,即: H (t )=a i (t -T i -1)m +H (T i -1),T i -1Φt 案例分析1: 自行车外胎的使用寿命 问题: 目前,自行车在我国是一种可缺少的交通工具。它小巧、灵活、方便、易学,而且价格适中,给广大居民带来了不小的益处。但是,自行车也有令人头痛的地方,最常见的问题莫过于扎胎了。扎胎的原因有很多,但相当一部分是由于外胎磨损,致使一些玻璃碴、小石子很容易侵入、扎破内胎。为了减少不必要的麻烦,如何估计自行车外胎的寿命,及时更换? 分析: 分析角度:由于题目里未明确指出我们是应从厂家角度,还是应从用户角度来考虑这个问题,因此需要我们自己做出合理判断。若从厂家角度,我们面对的应当是一大批自行车外胎的平均寿命的估计。这样的估计要求一定精确度和相对明确的使用环境;而从用户角度来说,面对的仅是个人的一辆车,不需要很高的精确度,这样的寿命估计更简单,易于随时了解,下面仅从用户角度进行分析。 产品的使用者需要了解产品的寿命,是基于安全性及更换的费用来考虑的。我们将这两个标准作为主要标准来分析,首先值得注意的两个关键性问题是如何定义寿命、何时为寿命的终止。寿命的定义要做到科学,直观,有可比性,在航空工业中航天飞机的使用寿命是用重复使用的次数来衡量,而工厂机器设备的寿命则以连续工作的时间来定义。本题外胎的寿命亦可用时间来表征,但由于外胎的寿命直接与其磨损速度相关;而磨损速度又与使用频率及行驶速度相互联系,致使外胎的寿命不一定与使用时间成正比(这种非正比关系使我们不能拿一辆—天跑200公里的自行车与一天只跑1公里的自行车进行寿命比较),降低了可比性。如换成自行车的路程寿命来比较,就好得多。产品寿命是在安全性和更换费用相互制约下达到的一个点,在这个点上,外胎的安全系数降到用户不可接受的最低值,更换费用(寿命越长,在一定意义上更换费用越低)也达到了最大限度的节省。 弄清了上面两个问题后,我们继续明确建立模型需要解决哪些问题及建立模型的重点难点。 自行车使用过程中,一来影响因素多,二来这些因素之间彼此相关,十分复杂,要做到比较准确地估计使用寿命,不但要对外胎的性能有相当的了解,而且对使用环境更不能忽视。当然我们由于是站在用户角度上来考虑的,相对地就可忽略一些次要的影响因素。 这样的数学模型面对着两个主要问题。一、自行车使用寿命与外胎厚度的关系,二、外胎能够抵御小石子破坏作用的最小厚度。后者可处理得相对简略些(如只考虑一块具有一般特征的小石子对外胎的破坏作用),而重点(也是难点)是第一个问题。车重、人重、轮胎性质(力学的、热学的、甚至化学的)和自行车使用频率等都左右着它们的关系。这么多相关因素,不必一一都加以考虑(用户是不会在意这么多的),有些因素,可以先不考虑,在模型的改进部分再作修改,采取逐步深入的方法,如:摩擦损耗有滑动摩擦和滚动摩擦损耗两种,由于滚动摩擦占用的时间(或路程)显然占绝对优势,因此可重点考虑。但滑动摩擦造成的一次损坏又比滚动摩擦大,在刹车使用过频的情况下,就不能不考虑了。 最后,需对得出的结果用简单清晰的文字进行说明,以供用户参考。 案例分析2:城市商业中心最优位置分析 问题: 城市商业中心是城市的基本构成要素之一。它的形成是一个复杂的定位过程。商业中心的选址涉及到各种因素制约,但其中交通条件是很重要的因素之一。即商业中心应位于城市“中心”,如果太偏离这一位置,极有可能在城市“中心”地带又形成一个商业区,造成重复建设。 某市对老商业中心进行改建规划,使居民到商业中心最方便。如果你是规划的策划者,如何建立一个数学模型来解决这个问题。 汶川地震中唐家山堰塞湖泄洪问题 摘要 本文研究的是唐家山地震次生灾害引发的堰塞湖问题,结合数字高程地图和新闻报道所提供的数据分别建立模型研究了唐家山堰塞湖形成之后湖水高程、蓄水量、溃坝情形、溃坝灾害等一系列问题。 针对第一问,首先对数字高程地图进行等高图像分析求解了堰塞湖不同高程水位(高程间隔为1米)对应的湖区面积,接着本文采用拟合法得到任意高程(710-750)的湖区面积,对高程积分建立了蓄水量体积与堰塞湖水位高程的离散化模型,然后建立了多元线性回归模型研究了北川天气预报3天降雨量与堰塞湖入库流量的关系,继而求解得到不同降雨量下每日堰塞湖水位高程。 针对第二问,首先研究泄洪过程和溃坝过程的区别与联系,从而分别建立正交多项式逼近和仿真模型得到溃坝时的溃口流量随时间变化的关系,继而分析求解得到溃坝时溃口宽度、深度、水位高程和水流速度随时间变化的关系。 针对第三问,综合数字高程地图和行政区域地图,在数字地图中查找地势相对较低区域,进而得到洪水下泄区域及被淹没区域。确定洪水的流速之后,利用数字地图计算了洪水到达各被淹没区域的时间,淹没范围,以及淹没之后的安全区域,并据此制订了初步的撤离方案。 关键字微元积分多元线性回归模型 2008年5月12日14:28在我国四川汶川地区发生了8.0级特大地震,给人民生命财产和国民经济造成了极大的损失。地震引发的次生灾害也相当严重,特别是地震造成的34处高悬于灾区人民头上的堰塞湖,对下游人民的生命财产和国家建设构成巨大威胁。加强对震后次生灾害规律的研究,为国家抗震救灾提供更有力的科学支撑是科技工作者义不容辞的责任。 唐家山堰塞湖是汶川大地震后山体滑坡后阻塞河道形成的最大堰塞湖,位于涧河上游距北川县城6公里处,是北川灾区面积最大、危险最大的堰塞湖,其堰塞体沿河流方向长约803米,横河最大宽约611米,顶部面积约为30万平方米,主要由石头和山坡风化土组成。由于唐家山堰塞湖集雨面积大、水位上涨快、地质结构差,溃坝的可能性极大,从最终的实际情况看,从坝顶溢出而溃坝的可能性比其它原因溃坝的可能性大得多。 经过专家分析,采取有效措施,最终完成了唐家山堰塞湖的成功泄洪。当时的科技工作者记录了大量的珍贵数据,新闻媒体也对唐家山堰塞湖进展情况进行了及时的报道,通过对这些数据的收集(由于数据来源不同,数据有些冲突,以新华社报道的相关数据为准),我们对堰塞湖及其泄洪规律进行了初步研究,完成以下工作: 1.建立唐家山堰塞湖以水位高程为自变量的蓄水量的数学模型,并以该地区天气预报的降雨情况的50%,80%,100%,150%为实际降雨量预计自5月25日起至6月12日堰塞湖水位每日上升的高度(不计及泄洪)。(由于问题的难度和实际情况的复杂性及安全方面的考虑,没有充分追求模型的精度,以下同); 2.唐家山堰塞湖泄洪时科技人员记录下了大量宝贵的数据。我们在合理的假设下,利用这些数据建立堰塞湖蓄水漫顶后在水流作用下发生溃坝的数学模型,模型中包含缺口宽度、深度、水流速度、水量、水位高程,时间等变量。 3.根据数字地图,给出坝体发生溃塌造成堰塞湖内1/3的蓄水突然下泻时(实际上没有发生)的洪水水流速度及淹没区域(包括洪水到达各地的时间),并在此基础上考虑洪水淹没区域中人口密集区域的人员撤离方案。 4.根据我们所建立的数学模型分析当时所采取对策的正确性和改进的可能性。讨论应对地震后次生山地灾害 (不限堰塞湖) ,科技工作中应该设法解决的关键问题,并提出有关建议。 第11章第2题 摘要 本题分析4 种化肥和3 个小麦品种对小麦产量的影响,以及二者交互作用对小麦产量的影响,可视为两因素方差分析,即化肥和小麦品种两个因素,4种化肥可看作是化肥的四个不同水平,3个小麦品种也可以看作是小麦品种的三个不同水平。 试验的目的是分析化肥的四个不同水平以及小麦品种的三个不同水平对小麦产量有无显着性影响。 关键词:方差分析显着性化肥种类小麦品种 一.问题重述 为了分析4 种化肥和3 个小麦品种对小麦产量的影响,把一块试验田等分成36个小块,分别对3种种子和四种化肥的每一种组合种植3 小块田,产量如表1所示(单位公斤),问不同品种、不同种类的化肥及二者的交互作用对小麦产量有无显着影响。 二.问题分析 本题意在分析四种化肥和三种小麦品种对小麦产量的影响,以及二者交互作用对小麦产量的影响,为两因素方差分析问题,即化肥和小麦品种两个因素,4种化肥可看作是化肥的四个不同水平,3个小麦品种也可以看作是小麦品种的三个不同水平。通过对这两种因素的不同水平及交互作用的分析,从而分析 4 种化肥和3 个小麦品种对小麦产量的影响。 三.模型假设 1.假设只有化肥种类和小麦品种两个因素,其他因素对试验结果不构成影响。 2.假设不存在数据记录错误。 3.假设每一块试验田本身各项指标相同,不会影响结果。 四.符号说明 数字1,2,3,4——不同的化肥种类 数字1,2,3——不同的小麦品种 五.模型建立 将化肥种类和小麦品种视为两个因素,四种化肥种类看作是化肥种类的四个不同水平,三个小麦品种看作是小麦品种的三个不同水平,将表1的数据进行整理,如表2所示。 六.模型求解 将表2数据导入到spss软件中,进行两因素方差检验,得到结果如下:表3 结果分析 综上所述,由模型求解可知,在满足模型条件的假设(4)的条件下,当所给阳性的先验概率0.3066p ≥时,在不分组的条件下每个人一次一次的检验可以使总次数最少;当所给0.29290.3066p ≤<时,进行一次检验比分两次组和不分组均可使总次数最少;当00.2929p <<时,分两次组总次数比分一次组总次数要少。 当p 固定时,为了是人群中总的检验次数最小,就需要确定每组中的人数k 。根据固定值p 的大小分类讨论: 当0.3066p ≥时,此时不需要分组,即1k =时可使检验次数最小; 当0.3066p <时,此时需要分组,要使人群总的检验次数最小,只需要使每个人的检验次数的期望值E ξ最小,通过引入与11k E q k ξ=-+ 变化趋势相同的连续性函数 )2(,11)(≥+-=x x q x f x ,对于一个给定的p ,可以求出函数(x)f 的极值,又由分析知'(x)f 是增函数,所以求出(x)f 的极值就是(x)f 的最小值的取值m x ,故取与m x 最相近的两个值(上取整和下取整),代入ξE ,然后比较两个函数值,找出较小的一个,以此类推,可以确定,每一个给定的p 要使人群中总的检验次数最小所对应的人数k 。 在0.3066p <中,当0.29290.3066p ≤<时,进行一次分组检验比进行两次分组检验和不分组检验可使检验次数最少;当00.2929p <<时,分两组比分一组总的检验次数少。 模型检验 当然这都是在假设(4)的前提下做出的,现举一例具体说明上述假设的合理性:设0.002p =时,经过上述计算可得,当23k =时可使在一次分组的情况下平均每人检验次数最小,为满足假设(4),可以取24k =(此时平均每人检验次数仅比23k =时多510-次,故在检验100000人时总次数才多一次,故可忽略),然后取112k =或更小(如16k =),此时一定可以做到分两次组比分一次组平均每人检验次数小。当然此时还可以继续求满足条件的第二次分组平均每人检验次数的最小值。 由于题给条件是人群数量很大,基本是健康人,先验概率p 很小,所以4 堰塞湖及其爆破处置方法研究 “堰塞湖”在“5.12”汶川大地震后引起公众的普遍关注。本文论述了采用爆破方式炸开缺口泄流一类堰塞湖应急排险的有效手段, 较详细地分析了堰塞湖滑坡坝治理中常用的工程爆破技术。包括具体方法的使用特点和工程处治典型实例。 新世纪新阶段,我国经济高速发展,针对未来可能发生的突发情况,随着我军的职能使命任务正在发生新的变化,由承担单纯的水电施工逐渐向应急救援领域转变。特别是近年来,由于自然环境恶化,灾害频发,导致重大的人员财产经济损失。作为水电兵,我们在抢险救灾方面拥有得天独厚的专业优势,在抢险救灾中可担任尖刀兵,为抢救人员生命和财产做出重要贡献。 从98特大洪灾到汶川特大地震灾害,我军在抢险救灾方面积累了丰富的经验。然而,在汶川地震中我军面临了一类新的灾害考验——地震堰塞湖。堰塞湖是由于河流被外来物质堵塞而形成的湖泊。常由山崩、地震、滑坡、石流、火山喷发的熔岩流和流动沙丘等造成。长发生在地震活跃,泥石流多发地带。地震堰塞湖的堤坝大多由滑落的松散石块组成,一旦决堤将会对下游民众造成毁灭性的破坏。在治理汶川地震形成的堰塞湖过程中,针对唐家山堰塞湖极难险情,我军联合各领域的专家解决了问题,但同时也反映出在处理这一类灾害上的技能欠缺,经验欠缺,排险措施单一等问题。本文主要是通过对各国处理地震堰塞湖的经验技术进行分析总结,为我军治理堰塞湖提供一定的技术支撑。 在汶川地震后,国内学者专家通过对唐家山等地震堰塞湖的应急处理积累了经验。在治理过程中通过多平台,多时相的卫星遥感影像,利用3S技术掌握了灾区堰塞湖的位置及范围,并利用先进的数学建模技术模拟灾区堰塞湖模型,为治理方案的产生提供了宝贵的参考依据。这些经验对我们应急抢险都有宝贵的借鉴价值,在处理未来的突发灾难时,我们可以借助先进的卫星通信,遥感成像,计算机模拟等技术为我军抢险救援提供技术支撑。 本文以处理堰塞湖方法技术为切入点,通过对爆破处置技术的原理、原则、具 聚类分析 聚类分析是将个对象按各自的特征将相似的对象归到同一个类或簇的一种方法,它的原则是同一个类中的对象有很大的相似性,而不同类间的对象有很大的相异性。特点: ①适用于没有先验知识情况下的分类。对于没有先前的经验或一些规则的对象进行分类,则显得很随意和主观,这时需要使用聚类分析法通过对象各自的特性来合理的分类; ②能处理多个维度或属性决定的分类。例如,对于某个地区的全部家庭的富裕程度而言,通过家庭的收入和支出差可以简单分类,容易知道。但是如果要求从家庭的收入、家庭的支出、家庭的固有资产、家庭所在地区的地段等多个变量来分析就比较复杂,然后解决这个问题可以使用聚类分析算法。 ③聚类分析算法也是一种探索性分析方法,能够挖掘对象的潜在规律和特性,并根据相似性原则对事物进行分类。 几类距离公式: () ()() () () ()()()211112 21 11.2.=,3.,4.||5.1|| 6.2||7p q pq ij i G j G p q pq p q T p q pq p q p q p q p q q ij ik jk k p ij ik jk k p ij ik jk k D d n n D d x x n n ward D x x x x n n Minkowski d q x x d x x d x x ∈∈==== = = -+? ?=-???? =-? ?=-????∑∑∑∑∑类平均距离重心距离 离差平方和距离闵科夫斯基绝对值距离 欧氏距离 () ()( )())1 ||.8.p ik jk ij k ik jk ij x x Wiliams d L x x Mahalanobis d M =-=+= ∑ 兰式距离马氏距离其中是样品协方差 系统聚类法思想 先将每一个样本作为一个单独的类,然后计算各个样本之间的距离i S ,在将计算出来的距离i S 定义为类之间的距离j S ,以为j S 标准的距离,进行合理合并,形成新的一个类,在重新对新类和其他剩余的类进行计算其距离,循环执行合并动作,直到全部的样本都属于一个大类为止。 步骤: ①若有n 个样本点,计算出每两个样本点之间的距离ij d ,即矩阵()ij n n D d ?=; ②建立n 个类,每个类中仅有一个样本点,且每个类的平台高度都为0; ③将距离最近的两个类合并为新类,选取聚类图的平台高度为这两类之间的距离值; ④求出新类和目前各类之间的距离,如果类的个数等于1,执行步骤⑤,否则,返回执行步骤③; 现代统计学 1.因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。 运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 2.主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 主成分分析和因子分析的区别 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。 和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b, 清华大学-汶川地震中唐家山堰塞湖泄洪问题 本页仅作为文档页封面,使用时可以删除 This document is for reference only-rar21year.March 全国第五届研究生数学建模竞赛 题目汶川地震中唐家山堰塞湖泄洪问题研究 摘要: 本文首先根据库容量和水位高程的变化关系建立了一个库容量计算模型,得出库容量和水位高程符合指数关系,再根据降水量和水位高程变化的关系建立了降水量模型,分析了降水量对堰塞湖水位的影响,并给出了50%、80%、100%、150%各种降水情形下的水位变化。 然后利用新闻媒体搜集的数据建立了一个逐渐溃坝模型,该模型包括溃口计算模型,水流量计算模型和库容计算模型,包含了溃口宽度、深度、水流速度、水量、水位高程,时间等变量,并根据该模型计算了唐家山堰塞湖发生漫顶逐渐溃坝时的各种变量的数据。 根据河道内质量守恒定律和能量守恒定律,在假设河道分段逐渐变化的前提下推导得到了溃坝推演模型,并给出了模型的离散形式,在已知河道信息和溃坝处信息情况下的迭代推算方法,并将溃坝推演模型用来推测唐家山发生 1/3溃坝时的水流速度变化和水面高度变化,并提示了可能被洪水淹没的地区。 最后根据本文中的模型分析了当时采取的政策和方案,并提出了我们的建议。 参赛密码 参赛队号清华大学参赛队13 一、问题的提出 2008年5月12日14:28在我国四川汶川地区发生了级特大地震,给人民生命财产和国民经济造成了极大的损失。地震引发的次生灾害也相当严重,特别是地震造成的34处高悬于灾区人民头上的堰塞湖,对下游人民的生命财产和国家建设构成巨大威胁。加强对震后次生灾害规律的研究,为国家抗震救灾提供更有力的科学支撑是科技工作者义不容辞的责任。 唐家山堰塞湖是汶川大地震后山体滑坡后阻塞河道形成的最大堰塞湖,位于涧河上游距北川县城6公里处,是北川灾区面积最大、危险最大的堰塞湖,其堰塞体沿河流方向长约803米,横河最大宽约611米,顶部面积约为30万平方米,主要由石头和山坡风化土组成。由于唐家山堰塞湖集雨面积大、水位上涨快、地质结构差,溃坝的可能性极大,从最终的实际情况看,从坝顶溢出而溃坝的可能性比其它原因溃坝的可能性大得多。 经过专家分析,采取有效措施,最终完成了唐家山堰塞湖的成功泄洪。当时的科技工作者记录了大量的珍贵数据,新闻媒体也对唐家山堰塞湖进展情况进行了及时的报道,通过对这些数据的收集(由于数据来源不同,数据有些冲突,以新华社报道的相关数据为准),我们对堰塞湖及其泄洪规律进行了初步研究,完成以下工作: 1.建立唐家山堰塞湖以水位高程为自变量的蓄水量的数学模型,并以该地区天气预报的降雨情况的50%,80%,100%,150%为实际降雨量预计自5月25日起至6月12日堰塞湖水位每日上升的高度(不计及泄洪)。(由于问题的难度和实际情况的复杂性及安全方面的考虑,没有充分追求模型的精度,以下同); 2.唐家山堰塞湖泄洪时科技人员记录下了大量宝贵的数据。我们在合理的假设下,利用这些数据建立堰塞湖蓄水漫顶后在水流作用下发生溃坝的数学模型,模型中包含缺口宽度、深度、水流速度、水量、水位高程,时间等变量。 3.根据数字地图,给出坝体发生溃塌造成堰塞湖内1/3的蓄水突然下泻时(实际上没有发生)的洪水水流速度及淹没区域(包括洪水到达各地的时间),并在此基础上考虑洪水淹没区域中人口密集区域的人员撤离方案。 4.根据我们所建立的数学模型分析当时所采取对策的正确性和改进的可能性。讨论应对地震后次生山地灾害 (不限堰塞湖) ,科技工作中应该设法解决的关键问题,并提出有关建议。 聚类分析 聚类分析是将个对象按各自的特征将相似的对象归到同一个类或簇的一种方法,它的原则是同一个类中的对象有很大的相似性,而不同类间的对象有很大的相异性。特点: ①适用于没有先验知识情况下的分类。对于没有先前的经验或一些规则的对象进行分类,则显得很随意和主观,这时需要使用聚类分析法通过对象各自的特性来合理的分类; ②能处理多个维度或属性决定的分类。例如,对于某个地区的全部家庭的富裕程度而言,通过家庭的收入和支出差可以简单分类,容易知道。但是如果要求从家庭的收入、家庭的支出、家庭的固有资产、家庭所在地区的地段等多个变量来分析就比较复杂,然后解决这个问题可以使用聚类分析算法。 ③聚类分析算法也是一种探索性分析方法,能够挖掘对象的潜在规律和特性,并根据相似性原则对事物进行分类。 几类距离公式: () ()() () () ()()()21 1112 21 11.2.=,3.,4.||5.1|| 6.2||7p q pq ij i G j G p q pq p q T p q pq p q p q p q p q q ij ik jk k p ij ik jk k p ij ik jk k D d n n D d x x n n ward D x x x x n n Minkowski d q x x d x x d x x ∈∈==== == -+? ?=-???? =-? ?=-????∑∑∑∑∑类平均距离重心距离 离差平方和距离闵科夫斯基绝对值距离 欧氏距离 () ()() ())1 ||.8.p ik jk ij k ik jk ij x x Wiliams d L x x Mahalanobis d M =-=+= ∑ 兰式距离马氏距离其中是样品协方差 系统聚类法思想 % 先将每一个样本作为一个单独的类,然后计算各个样本之间的距离i S ,在将计算出来的距离i S 定义为类之间的距离j S ,以为j S 标准的距离,进行合理合并, 数学建模问题分析 1、给出一个所感兴趣的建模的实际问题:上班高峰车辆拥堵情况 (1) 写出问题的实际背景:**发展迅速,人们生活水平提高,私家车越来越多。上班高峰期车辆拥堵严重,通过调查统计603路公交车的双程的运行时间,与平常运行时间相对比,了解吴家坟?省体育场交通拥堵状况,合理地配置车辆资源。 (2) 给出解决问题的路径(建模与解答路径): 通过调查统计,绘制相应的统计图。 根据统计图,了解各路段的拥堵状况,对车辆的运行稍作调整。 ,将调查结果提供给市民,是他们可以适当地选择合理的交通工具和上班路线,适当地缓解交通压力。 (3)要解决什么样的问题:了解该路段的拥堵情况,选择合适的交通工具以及交通路线,适当地减轻交通拥堵,减轻交通压力。 2、找一本与数学建模有关的参考书:《数学模型方法》 作者:齐欢出版社:华中科技大学出版社 (1) 为何选择这本书, 数学的产生一直是和数学建模紧密相联的(实际上,一切科学研究都是首先与模型打交道,然后才在实际系统上实现(在本世纪70年代前后,数学建模再次形成热潮,主要是由于计算机的迅猛发展和日益广泛的应用(正如美国科学、工程和公共事务政策委员会在一份报告中指出的“今天,在技术科学中最有用的数学研究领域是数值分析和数学建模”。 何谓模型?简言之,模型是一种结构,它是由对原型的形象化或模拟与抽象而来、对原型的一个不失真的近似反映,例如建筑模型和玩具(数学模型是一种符号模型,在应用数学中,称反映特定的具体实体内在规律性的数学结构为数学模型。 本书的重点在于如何建立数学模型,而对这些数学模型的详细的教学分析,读者不难在有关的数学专业书中找到(建立数学模型的基本方法是机理分析法、数据分析法和计算机仿真。 数学模型方法是近10多年来随着计算机的广泛使用而发展起来的新学科,是利用数学知识解决实际问题的重要方法(这是一本关于数学建模的理论与方法的入门书,内容包括数学建模的方法论基础,以及数学建模的三种主要方法:机理分析法、数据分析法和计算机仿真,本书避免了详细的理论证明和复杂的数学推导,在众多的实例中,介绍了数学建模的大量方法与技巧,着重研究了在不同背景下数学模型的构造,内容生动,富有启发性。 凡具有微积分、线性代数和概率论知识的读者,即可掌握本书的基本内容,本书适于数学、应用数学、工程各专业、经济与管理等专业的本科生。 (2) 对数学建模的思想有何启示, 应用数学去解决各类实际问题时,建立数学模型是十分关键的一步,同时也是十分困难的一步。建立教学模型的过程,是把错综复杂的实际问题简化、抽象为合理的数学结构的过程。要通过调查、收集数据资料,观察和研究实际对象的固有特征和内在规律,抓住问题的主要矛盾,建立起反映实际问题的数量关系,然后利用数学的理论和方法去分析和解决问题。这就需要深厚扎实的数学基础,敏锐的洞察力和想象力,对实际问题的浓厚兴趣和广博的知识面。 本书的重点在于如何建立数学模型,而对这些数学模型的详细的教学分析。本书的目的在于通过多种建模方法的训练和大量实例的分析,提高学生的三个能力,即: 数学建模之模糊评价与 模糊聚类 TYYGROUP system office room 【TYYUA16H-TYY-TYYYUA8Q8- 一、模糊评价 模糊评价法是应用模糊理论和模糊关系合成的原理,通过多个因素对被评 价事物隶属等级状况进行综合性评价的一种方法。运用模糊评价法,通过多因素 或多指标,既对被评价事物的变化区间作出某种划分,又对事物属于各评价等级 的程度作出分析,从而更深入和客观地对被评价事物进行描述。 特点: ①模糊评价法的结果是一个向量,而不是一个数值,即被评价事物的状况是通过被评价事物的等级隶属度来表示。 ②模糊评价法可以是一种多层的评价,即可以先对被评价事物的某一层面进行模糊评价,再将各层面的模糊评价结果进行模糊合成,得出总的模糊评价结果。 ③模糊评价法具有指标或因素的自然可综合性。由于模糊评价法只需确定各指标的等级隶属度,既可用于主观指标,又可用于客观指标,以此而无需专门对指标进行无量纲处理。 模糊评价的应用 ①人事考核中的应用, ②单位员工的年终评定, ③昆山公安信息化建设效绩的评估(下载文档), ④我国商业银行内部控制评价体系研究(下载文档), ⑤石化行业业绩评价(下载文档)等。 一级模糊综合评判模型的建立步骤 ①确定因素集及评语集 确定被评价对象的因素集U ,{}12=,, ,n U u u u ,评语集{}12,,,m V v v v =; ②构造模糊关系矩阵R ,进行单因素评判。 用ij r 表示U 中的因素i u 对应于V 中等级j v 的隶属关系,则有 ③确定各因素的权重 用i a 表示第i 个因素的权重,11n i i a ==∑,则评价因素权向量A 为 ()12,,,n A a a a =。 ④综合评判 由模糊关系矩阵R 得到一个模糊变换为 则评判的综合结果为 () 11121212221212,,,m m n n n nm r r r r r r B A R a a a r r r ?? ? ? == ? ??? 。 多层次模糊综合评判模型的建立步骤 四类基本模型 1 优化模型 1.1 数学规划模型 线性规划、整数线性规划、非线性规划、多目标规划、动态规划。 1.2 微分方程组模型 阻滞增长模型、SARS 传播模型。 1.3 图论与网络优化问题 最短路径问题、网络最大流问题、最小费用最大流问题、最小生成树问题(MST)、旅行商问题(TSP)、图的着色问题。 1.4 概率模型 决策模型、随机存储模型、随机人口模型、报童问题、Markov 链模型。 1.5 组合优化经典问题 ● 多维背包问题(MKP) 背包问题:n 个物品,对物品i ,体积为i w ,背包容量为W 。如何将尽可能多的物品装入背包。 多维背包问题:n 个物品,对物品i ,价值为i p ,体积为i w ,背包容量为W 。如何选取物品装入背包,是背包中物品的总价值最大。 多维背包问题在实际中的应用有:资源分配、货物装载和存储分配等问题。该问题属于NP 难问题。 ● 二维指派问题(QAP) 工作指派问题:n 个工作可以由n 个工人分别完成。工人i 完成工作j 的时间为ij d 。如何安排使总工作时间最小。 二维指派问题(常以机器布局问题为例):n 台机器要布置在n 个地方,机器i 与k 之间的物流量为ik f ,位置j 与l 之间的距离为jl d ,如何布置使费用最小。 二维指派问题在实际中的应用有:校园建筑物的布局、医院科室的安排、成组技术中加工中心的组成问题等。 ● 旅行商问题(TSP) 旅行商问题:有n 个城市,城市i 与j 之间的距离为ij d ,找一条经过n 个城市的巡回(每个城市经过且只经过一次,最后回到出发点),使得总路程最小。 ● 车辆路径问题(VRP) 车辆路径问题(也称车辆计划):已知n 个客户的位置坐标和货物需求,在 1. 一个班有7名男性工人,他们的身高和体重列于下表 请把他们分成若干类并指出每一类的特征。这里身高以米为单位,体重以千克为单位。 2.有两种跳蚤共10只,分别测得它们四个指标值如表。 样本号甲种乙种 X3 X4 X1 X2 X3 X4 X1 X 2 1 189 245 137 163 181 305 184 209 2 192 260 132 217 158 237 13 3 188 3 217 276 141 192 18 4 300 166 231 4 221 299 142 213 171 273 162 213 5 171 239 128 158 181 297 163 224 1)用距离判别法建立判别准则。 2)问(192, 287, 141,198 和(197, 303, 170, 205 各属于哪一种? 3.考察温度x对产量y的影响,测得下列10组数据: 求y关于x的线性回归方程,检验回归效果是否显著,并预测 x=42C时产量的估值 4. 在研究化学动力学反应过程中,建立了一个反应速度和反应物 %-备 含量的数学模型,形式为y — 1 +卩2为+ P3X 2 +P4X3 其中i…,飞是未知参数,X1,X2,X3是三种反应物(氢,门戊烷, 异构戊烷)的含量,y是反应速度?今测得一组数据如表,试由此确定参数订…宀 序号反应速度y 氢X1 n戊烷X2 异构戊烷X3 1 8.55 470 300 10 2 3.79 285 80 10 3 4.82 470 300 120 4 0.02 470 80 120 5 2.75 470 80 10 6 14.39 100 190 10 7 2.54 100 80 65 8 4.35 470 190 65 9 13.00 100 300 54 10 8.50 100 300 120 11 0.05 100 80 120 12 11.32 285 300 10 13 3.13 285 190 120 5. 主成分与卡方检验已课件为主数学建模案例分析
汶川地震中唐家山堰塞湖泄洪问题
数学建模模拟题,图论,回归模型,聚类分析,因子分析等 (48)
数学建模结果分析
堰塞湖的处置方法
数学建模之聚类分析
数学建模各种分析报告方法
清华大学-汶川地震中唐家山堰塞湖泄洪问题
数学建模之聚类分析
数学建模问题分析
数学建模之模糊评价与模糊聚类
数学建模 四大模型总结
数学建模竞赛统计回归分析相关练习题