第6章_动态规划
- 格式:ppt
- 大小:941.00 KB
- 文档页数:61
第6章 动态规划动态规划(Dynamic Programming )是解决多阶段决策过程最优化的一种有用的数学方法。
它是由美国学者Richard .Bellman 在1951年提出的,1957年他的专著《动态规划》一书问世,标志着运筹学的一个重要分支-动态规划的诞生.动态规划也是一种将多变量问题转化为单变量问题的一种方法。
在动态规划中,把困难的多阶段决策问题变换成一系列相互联系的比较容易的单阶段问题一个个地求解。
动态规划是考察解决问题的一种途径 ,而不是一种特殊的算法,不像线性规划那样有统一的数学模型和算法(如单纯形法).事实上,在运用其解决问题的过程中还需要运用其它的优化算法。
因此,动态规划不像其它方法局限于解决某一类问题,它可以解决各类多阶段决策问题。
动态规划在工程技术、经济管理等社会各个领域都有着广泛的应用,并且获得了显著的效果。
在经济管理方面,动态规划可以用来解决最优路径问题、资源分配问题、生产调度问题、库存管理问题、排序问题、设备更新问题以及生产过程最优控制问题等,是经济管理中一种重要的决策技术。
许多规划问题用动态规划的方法来处理,常比线性规划或非线性规划更有效。
特别是对于离散的问题,由于解析数学无法发挥作用,动态规划便成为了一种非常有用的工具。
动态规划可以按照决策过程的演变是否确定分为确定性动态规划和随机性动态规划;也可以按照决策变量的取值是否连续分为连续性动态规划和离散性动态规划。
本教材主要介绍动态规划的基本概念、理论和方法,并通过典型的案例说明这些理论和方法的应用。
6.1动态规划的基本理论6.1.1多阶段决策过程的数学描述有这样一类活动过程,其整个过程可分为若干相互联系的阶段,每一阶段都要作出相应的决策,以使整个过程达到最佳的活动效果。
任何一个阶段(stage ,即决策点)都是由输入(input )、决策(decision )、状态转移律(transformation function )和输出(output )构成的,如图6-1(a )所示.其中输入和输出也称为状态(state ),输入称为输入状态,输出称为输出状态。
运筹学思考练习题答案第⼀章 L.P 及单纯形法练习题答案⼀、判断下列说法是否正确1. 线性规划模型中增加⼀个约束条件,可⾏域的范围⼀般将缩⼩,减少⼀个约束条件,可⾏域的范围⼀般将扩⼤。
(?)2. 线性规划问题的每⼀个基解对应可⾏域的⼀个顶点。
(?)3. 如线性规划问题存在某个最优解,则该最优解⼀定对应可⾏域边界上的⼀个点。
(?)4. 单纯形法计算中,如不按最⼩⽐值原则选取换出变量,则在下⼀个基可⾏解中⾄少有⼀个基变量的值为负。
(?)5. ⼀旦⼀个⼈⼯变量在迭代中变为⾮基变量后,该变量及相应列的数字可以从单纯形表中删除,⽽不影响计算结果。
(?)6. 若1X 、2X 分别是某⼀线性规划问题的最优解,则1212X X X λλ=+也是该线性规划问题的最优解,其中1λ、2λ为正的实数。
(?)7. 线性规划⽤两阶段法求解时,第⼀阶段的⽬标函数通常写为ai iMinZ x =∑(x ai 为⼈⼯变量),但也可写为i ai iMinZ k x =∑,只要所有k i 均为⼤于零的常数。
(?)8. 对⼀个有n 个变量、m 个约束的标准型的线性规划问题,其可⾏域的顶点恰好为m n C 个。
(?)9. 线性规划问题的可⾏解如为最优解,则该可⾏解⼀定是基可⾏解。
(?)10. 若线性规划问题具有可⾏解,且其可⾏域有界,则该线性规划问题最多具有有限个数的最优解。
(?)⼆、求得L.P 问题121231425j MaxZ 2x 3x x 2x x 84x x 164x x 12x 0;j 1,2,,5=+++=??+=??+=?≥=的解如下: X ⑴=(0,3,2,16,0)T ;X ⑵=(4,3,-2,0,0)T ;X ⑶=(3.5,2,0.5,2,4)T ;X ⑷=(8,0,0,-16,12)T ; =(4.5,2,-0.5,-2,4)T ; X ⑹=(3,2,1,4,4)T ;X ⑺=(4,2,0,0,4)T 。
要求:分别指出其中的基解、可⾏解、基可⾏解、⾮基可⾏解。
运筹学:应用分析、试验、量化的方法,对经济管理系统中人力、物力、财力等资源进行统筹安排,为决策者提供有依据的最优方案,以实现最有效的管理。
第一章、线性规划的图解法1.基本概念线性规划:是一种解决在线性约束条件下追求最大或最小的线性目标函数的方法。
线性规划的三要素:变量或决策变量、目标函数、约束条件。
目标函数:是变量的线性函数。
约束条件:变量的线性等式或不等式。
可行解:满足所有约束条件的解称为该线性规划的可行解。
可行域:可行解的集合称为可行域。
最优解:使得目标函数值最大的可行解称为该线性规划的最优解。
唯一最优解、无穷最优解、无界解(可行域无界)或无可行解(可行域为空域)。
凸集:要求集合中任意两点的连线段落在这个集合中。
等值线:目标函数z,对于z的某一取值所得的直线上的每一点都具有相同的目标函数值,故称之为等值线。
松弛变量:对于“≤”约束条件,可增加一些代表没使用的资源或能力的变量,称之为松弛变量。
剩余变量:对于“≥”约束条件,可增加一些代表最低限约束的超过量的变量,称之为剩余变量。
2.线性规划的标准形式约束条件为等式(=)约束条件的常数项非负(b j≥0)决策变量非负(x j≥0)3.灵敏度分析:是在建立数学模型和求得最优解之后,研究线性规划的一些系数的变化对最优解产生什么影响。
4.目标函数中的系数c i的灵敏度分析目标函数的斜率在形成最优解顶点的两条直线的斜率之间变化时,最优解不变。
5.约束条件中常数项b i的灵敏度分析对偶价格:约束条件常数项中增加一个单位而使最优目标函数值得到改进的数量。
当某约束条件中的松弛变量(或剩余变量)不为零时,这个约束条件的对偶价格为零。
第二章、线性规划问题在工商管理中的应用1.人力资源分配问题(P41)设x i为第i班次开始上班的人数。
2.生产计划问题(P44)3.套材下料问题(P48)下料方案表(P48)设x i为按各下料方式下料的原材料数量。
4.配料问题(P49)设x ij为第i种产品需要第j种原料的量。
《运筹学》2014年秋学期在线作业(三)
一,单选题
1. (第6章)关于动态规划的如下说法中错误的是();
A. 状态转移方程表明了各阶段之间状态的联系
B. 过程指标函数必须由阶段指标函数相加得到
C. 动态规划基本方程必须有边界条件
D. 动态规划中决策变量可以为连续变量也可以为离散变量
?
正确答案:B
2. (第5章)下列关于整数规划问题的说法,正确的是();
A. 整数规划问题解的目标函数值优于其对应的线性规划问题的解的目标函数值
B. 部分变量都取整数的问题称之为纯整数规划问题
C. 全部变量都取整数的问题称之为纯整数规划问题
D. 分配问题不是整数规划问题
?
正确答案:C
3. 题目和选项如下图所示:
A.
B.
C.
D.
?
正确答案:B
4. (第5章)在用匈牙利法求解指派问题时,当独立零元素个数小于任务数(人数)时:下列说法正确的是();
A. 用最少的直线划去所有的非独立的零元素
B. 剩余的元素非零元素都减去本行的最小元素
C. 为保证所有元素大于零,应在横线和竖线交汇格元素加上最小元素
D. 用最少的直线划去所有的独立零元素
?
正确答案:C
5. (第6章)用逆序法求解资源分配问题时,为保证独立性,状态变量取值一般为();
A. 各阶段分配的资源数
B. 当前阶段开始时前部过程已分配的资源数
C. 当前阶段开始时剩余给后部过程的资源数
D. 资源的总数量
?。
第6章动态规划判断06100011判断:在动态规划模型中,问题的阶段数等于问题中的子问题的数目;06100021判断:动态规划中,定义状态时应保证在各个阶段中所作决策的相互独立性;06100031判断:)动态规划的最优性原理保证了从某一状态开始的未来决策独立于先前已做出的决策;06100041判断:对一个动态规划问题,应用顺推或逆推解法可能会得出不同的最优解;06100051判断:动态规划计算中的“维数障碍”主要是由于问题中阶段数的急剧增加而引起的;06100061判断:)假如一个线性规划问题含有5个变量和3个约束,则用动态规划方法求解时将划分为3个阶段,每个阶段的状态将由一个5维的向量组成;06100071判断:任何一个多阶段决策过程的最优化问题,都可以用非线性规划模型来描述。
06100081判断:动态规划问题如果按状态转移率区分,可分成确定性的与随机性的.简答06200011简答:一个N阶段的决策过程具有哪特征?06200021简答:试述动态规划的优点。
06200031简答:试述最优化原理的内容06200041简答:试述动态规划数学模型的四种类型.计算题最短路问题06301012设某厂自国外进口一步精密机器,由机器制造厂至出口港口可供选择,而进口港又有三个可供选择,进口后可经由两个城市到达目的地,期间的运输成本如下图所示,试求运费最低的路线。
06301022、某工厂从国外引进一台设备,由A到G港口有多条通路可供选择,其路线及费用如下图所示。
现要确定一条从A到G的使总费用最小的路线。
请将该问题描述成一个动态规划问题,然后求其最优解。
资源分配06302012有一部货车每天沿着公路给四个零售店卸下6箱货物,如果各零售店出售该货物06302022设有某种肥料共6个单位重量,准备供给四块粮田用,其每块粮田施肥数量与增06302033某公司打算向承包的三个营业区增设六个销售店,每个营业地区至少增设一个,从各区赚取的利润与增设的销售店个数有关,其数据如下表所示。
教学基本文件模板课程教学大纲:《运筹学》课程教学大纲课程编号:课程名称:运筹学/Operational Research课程总学时/学分:72/4 (其中理论60学时,实验12学时)适用专业:适用本科四年制信息管理与信息系统专业一、课程简介本课程的授课对象是信息管理与信息系统专业本科生,属管理类专业专业基础必修课。
《运筹学》是以定量分析为主来研究经济管理问题,将工程思想和管理思想相结合,应用系统的、科学的、数学分析的方法,通过建模、检验和求解数学模型获得最优决策方案。
本课程的主要内容包括线性规划、运输问题、整数规划、目标规划、动态规划、网络分析等与经济、管理和工程领域密切相关的运筹学分支的基本模型、方法和应用。
运用科学的模型化方法来描述、求解和分析问题,从而支持决策。
二、教学目的和任务本课程旨在使同学们正确、全面地掌握各级管理工作中已被广泛应用、发展比较成熟的最优化理论与方法,并能运用所学理论和方法解决管理工作中出现的各种优化问题,为后续课程奠定定量分析基础。
在已学过高等数学、微积分、线性代数等课程基础上学习本课程,通过教授、自学、复习、作业练习、辅导、上机等教学环节达到上述目的。
学习中要注意到学科系统性,数学概念和逻辑的严密性、准确性和完整性,但不偏重纯数学方法论证。
注重基本概念、基本思路、基本方法、算法步骤的掌握,了解各种方法特点和实用价值,提高建立模型、分析求解能力和技巧。
应注重实际应用中建立模型,选择可行求解的理论方法,运用计算机工具求解这三方面训练的有机结合。
三、教学基本要求信息管理与信息系统专业的学生应系统地学习《运筹学》的全部内容。
系统掌握线性规划、运输问题、目标规划、整数规划、动态规划、图与网络分析的理论和方法;能借助Excel、Lingo等电子计算手段,运用所学理论和方法解决实际问题。
通过该课程的学习,进一步培养学生的分析问题和解决问题的能力。
四、教学内容与学时分配绪论(2学时)第一节运筹学的定义与发展简史1、运筹学名称的来历;2、运筹学的发展简史。
第六章动态规划法• P137 2 ,3, 4•2.解答:cost[i]表示从顶点i 到终点n-1 的最短路径,path[i]表示从顶点i 到终点n-1 的路径上顶点i 的下一个顶点。
cost[i]=min{cij+cost[j]}3 有5 个物品,其重量分别是{3, 2, 1, 4,5},价值分别为{25, 20, 15, 40, 50},背包的容量为6。
V[i][j]表示把前i 个物品装入容量为j 的背包中获得的最大价值。
最优解为(0,0,1,0,1)最优值为65. 4.序列A =(x, z , y , z , z , y,x ),B =(z , x , y , y , z , x , z ),建立两个(m+1)×(n+1)的二 维表L 和表S ,分别存放搜索过程中得到的子序列的长度和状态。
z , x , y , y , z,x , z )path[i]= 使 cij+cost[j] 最小的 j i 012345678 9 10 11 12 13 14 15 Cost[i] 18 13 16 13 10 9 12 7 6875943Path[i]145778911 11 11 13 14 14 15 15 0得到最短路径 0->1->4->7->11->14->15 , 长度为 18(a)长度矩阵L(b)状态矩阵S 。
第七章贪心算法2.背包问题:有7 个物品,背包容量W=15。
将给定物品按单位重量价值从大到小排序,结果如下:个物品,物品重量存放在数组w[n]中,价值存放在数组放在数组x[n]中。
按算法7.6——背包问题1.改变数组w 和v 的排列顺序,使其按单位重量价值v[i]/w[i]降序排列;2.将数组x[n]初始化为0;//初始化解向量3.i=1;4.循环直到( w[i]>C )4.1 x[i]=1; //将第i个物品放入背包4.2 C=C-w[i];4.3 i++;5. x[i]=C/w[i];得出,该背包问题的求解过程为:: x[1]=1;c=15-1=14 v=6 x[2]=1; c=14-2=12V=6+10=10 x[3]=1; c=12-4=8V=16+18=34 x[4]=1; c=8-5=3V=34+15=49 x[5]=1; c=3-1=2 V=49+3=52x[6]=2/3 ; c=0; V=52+5*2/3=156/3 最优值为156/3 最优解为(1,1,1,1,1,2/3,0)) (x[i]按排序后物品的顺序构造)5.可以将该问题抽象为图的着色问题,活动抽象为顶点,不相容的活动用边相连(也可以将该问题理解为最大相容子集问题,重复查找剩余活动的最大相容子集,子集个数为所求).具体参见算法7.3 算法7.3——图着色问题1.color[1]=1; //顶点1着颜色12.for (i=2; i<=n; i++) //其他所有顶点置未着色状态color[i]=0;3.k=0;4.循环直到所有顶点均着色4.1k++; //取下一个颜色4.2for (i=2; i<=n; i++) //用颜色k 为尽量多的顶点着色4.2.1 若顶点i已着色,则转步骤4.2,考虑下一个顶点;4.2.2 若图中与顶点i邻接的顶点着色与顶点i着颜色k 不冲突,则color[i]=k;5.输出k;第八章回溯法4.搜索空间(a) 一个无向图(b) 回溯法搜索空间最优解为(1,2,1,2,3)5.0-1 背包问题n∑w i x i≤c 1• 可行性约束函数:i =1• 上界函数:nr =∑Vi5 = 3A B *CD8 ** * 131 =12 =23 = 14 = 2 34215课后答案网()i=k+1 1第九章分支限界法5,解:应用贪心法求得近似解:(1,4,2,3),其路径代价为:3+5+7+6=21,这可以作为该问题的上界。
一、考试知识点
第二章线性规划
2.1线性规划的标准形式
2.2线性规划的基本解基本可行解
2.3规范形式线性规划的单纯形算法、大M法求解线性规划列出初始单纯形表
2.4单纯型算法求解线性规划的唯一最优解、无解、无界解、无穷多解的判定方法
第三章对偶规划
3.1线性规划的对偶规划
3.2对偶规划规划的基本性质(证明题、计算题)
3.3灵敏度分析(关于目标函数系数C、右端向量
b)
第四章运输问题
4.1目标规划的图解法
4.2标准形式运输问题的表上作业法,包括求出初始方案(最小元素法、Vogel法)、检验、调整等
4.3带弹性约束的运输问题转化为标准形式的运输问题
第五章整数规划
整数规划问题建模
指派问题的匈牙利算法
第六章动态规划
6.1离散确定型动态规划的标号算法(练习题 6.1)
6.2运用动态规划原理求解生产存储问题、投资决策问题、零部件安全性问题(6.3,6.5)
第七章图论
7.1寻找最小生成树
7.2 Dijkstra算法寻找最短路
7.3寻找最大流、最小割
第十章博弈论
划线法求纯策略纳什均衡混合策略纳什均衡逆占优策略均衡、反复剔除的占优策略均衡
向归纳法求动态博弈的纳什均衡
二、考试题型
1 、选择题2*10 =20
2、计算题:5道大题共计
80分
三、考试时间和地点
6月 28日( 17周日) 9: 30-11:
30
地点:教学楼5-105(上午班)5-107(下午班)
按序号指定位置就座,现场可查询自己班内序号。
试卷上要写明自己的班内序号。