第6章 动态规划-第3节
- 格式:ppt
- 大小:427.00 KB
- 文档页数:27
第6章 动态规划动态规划(Dynamic Programming )是解决多阶段决策过程最优化的一种有用的数学方法。
它是由美国学者Richard .Bellman 在1951年提出的,1957年他的专著《动态规划》一书问世,标志着运筹学的一个重要分支-动态规划的诞生.动态规划也是一种将多变量问题转化为单变量问题的一种方法。
在动态规划中,把困难的多阶段决策问题变换成一系列相互联系的比较容易的单阶段问题一个个地求解。
动态规划是考察解决问题的一种途径 ,而不是一种特殊的算法,不像线性规划那样有统一的数学模型和算法(如单纯形法).事实上,在运用其解决问题的过程中还需要运用其它的优化算法。
因此,动态规划不像其它方法局限于解决某一类问题,它可以解决各类多阶段决策问题。
动态规划在工程技术、经济管理等社会各个领域都有着广泛的应用,并且获得了显著的效果。
在经济管理方面,动态规划可以用来解决最优路径问题、资源分配问题、生产调度问题、库存管理问题、排序问题、设备更新问题以及生产过程最优控制问题等,是经济管理中一种重要的决策技术。
许多规划问题用动态规划的方法来处理,常比线性规划或非线性规划更有效。
特别是对于离散的问题,由于解析数学无法发挥作用,动态规划便成为了一种非常有用的工具。
动态规划可以按照决策过程的演变是否确定分为确定性动态规划和随机性动态规划;也可以按照决策变量的取值是否连续分为连续性动态规划和离散性动态规划。
本教材主要介绍动态规划的基本概念、理论和方法,并通过典型的案例说明这些理论和方法的应用。
6.1动态规划的基本理论6.1.1多阶段决策过程的数学描述有这样一类活动过程,其整个过程可分为若干相互联系的阶段,每一阶段都要作出相应的决策,以使整个过程达到最佳的活动效果。
任何一个阶段(stage ,即决策点)都是由输入(input )、决策(decision )、状态转移律(transformation function )和输出(output )构成的,如图6-1(a )所示.其中输入和输出也称为状态(state ),输入称为输入状态,输出称为输出状态。
第三章:动态规划3.1 动态规划的基本概念一、动态决策问题:决策过程具有阶段性和时序性(与时间有关)的决策问题。
即决策过程可划分为明显的阶段。
二、什么叫动态规划(D.P.–Dynamic Program):多阶段决策问题最优化的一种方法。
广泛应用于工业技术、生产管理、企业管理、经济、军事等领域。
三、动态规划(D.P.)的起源:1951年,(美)数学家R.Bellman等提出最优化原理,从而建立动态规划,名著《动态规划》于1957年出版。
四、动态决策问题分类:1、按数据给出的形式分为:•离散型动态决策问题。
•连续型动态决策问题。
2、按决策过程演变的性质分为:•确定型动态决策问题。
•随机型动态决策问题。
五1、阶段(stage)n :作出决策的若干轮次。
n = 1、2、3、4、5。
2、状态(state)S n :每一阶段的出发位置。
构成状态集,记为S nS 1={A},S 2={B 1,B 2,B 3},S 3={C 1,C 2,C 3},S 4={D 1,D 2,D 3},S 5={E 1,E 2}。
阶段的起点。
3、决策(decision)X n :从一个阶段某状态演变到下一个阶段某状态的选择。
构成决策集,记为D n (S n )。
阶段的终点。
D 1(S 1)={X 1(A)}={B 1,B 2,B 3}= S 2,D 2(S 2)={X 2(B 1),X 2(B 2),X 2(B 3)}={C 1,C 2,C 3}=S 3,D 3(S 3)={X 3(C 1),X 3(C 2),X 3(C 3)}={D 1,D 2,D 3}=S 4,D 4(S 4)={X 4(D 1),X 4(D 2),X 4(D 3)}={E 1,E 2}=S 5D 5(S 5)={X 5(E 1),X 5(E 2)}={F;F}={F}。
4、策略(policy):全过程中各个阶段的决策Xn 组成的有序总体{Xn }。
如 A àB2àC1àD1àE2àF5、子策略(sub-policy):剩下的n个阶段构成n子过程,相应的决策系列叫n子策略。
运筹学:应用分析、试验、量化的方法,对经济管理系统中人力、物力、财力等资源进行统筹安排,为决策者提供有依据的最优方案,以实现最有效的管理。
第一章、线性规划的图解法1.基本概念线性规划:是一种解决在线性约束条件下追求最大或最小的线性目标函数的方法。
线性规划的三要素:变量或决策变量、目标函数、约束条件。
目标函数:是变量的线性函数。
约束条件:变量的线性等式或不等式。
可行解:满足所有约束条件的解称为该线性规划的可行解。
可行域:可行解的集合称为可行域。
最优解:使得目标函数值最大的可行解称为该线性规划的最优解。
唯一最优解、无穷最优解、无界解(可行域无界)或无可行解(可行域为空域)。
凸集:要求集合中任意两点的连线段落在这个集合中。
等值线:目标函数z,对于z的某一取值所得的直线上的每一点都具有相同的目标函数值,故称之为等值线。
松弛变量:对于“≤”约束条件,可增加一些代表没使用的资源或能力的变量,称之为松弛变量。
剩余变量:对于“≥”约束条件,可增加一些代表最低限约束的超过量的变量,称之为剩余变量。
2.线性规划的标准形式约束条件为等式(=)约束条件的常数项非负(b j≥0)决策变量非负(x j≥0)3.灵敏度分析:是在建立数学模型和求得最优解之后,研究线性规划的一些系数的变化对最优解产生什么影响。
4.目标函数中的系数c i的灵敏度分析目标函数的斜率在形成最优解顶点的两条直线的斜率之间变化时,最优解不变。
5.约束条件中常数项b i的灵敏度分析对偶价格:约束条件常数项中增加一个单位而使最优目标函数值得到改进的数量。
当某约束条件中的松弛变量(或剩余变量)不为零时,这个约束条件的对偶价格为零。
第二章、线性规划问题在工商管理中的应用1.人力资源分配问题(P41)设x i为第i班次开始上班的人数。
2.生产计划问题(P44)3.套材下料问题(P48)下料方案表(P48)设x i为按各下料方式下料的原材料数量。
4.配料问题(P49)设x ij为第i种产品需要第j种原料的量。
6-1 阐述分离序列综合基本概念:简单塔、顺序表、分离子群、分离子问题等。
简单塔:①指一个进料分成两个产品;②每一个组分只出现在一个产品中,即锐分离;③塔顶设全凝器以及塔底设再沸器。
顺序表:将分离所涉及的各组分按关键物性数据大小排列形成的表。
分离子群:分离过程中产生的流股。
分离子问题:所有分离序列中不重样的分离问题。
6-2 分离序列综合有序直观推断规则有哪些?说明其含义?规则(1)在所有其分离方法中,优先采用能量分离剂分离方法(例如精馏), 避免用质量分离剂分离方法(例如萃取)。
当关键组分间的相对挥发度小于1.05-1.10时,应该采用质量分离剂分离方法(例如萃取),此时质量分离剂应在下步立即分离。
规则(2)精馏分离过程尽量避免真空和制冷操作。
如需采用真空操作,则可考虑用萃取方案代替;如需采用制冷操作,则可考虑采用吸收方案代替。
由于真空和制冷操作能耗较大,有时即使在较高温度和压力下操作也会有利。
规则(3)当产品集中包括多个多元产品时,倾向于选择得到最少产品种类的分离序列。
相同的产品不要在几处分出。
因为产品集合越小,相应分离序列中的分离单元就越少,所以费用可能较低。
规则(4)首先安排除去腐蚀性组分和有毒有害组分,从而避免对后继设备苛刻要求,提高安全操作保证,减少环境污染。
规则(5)最后处理难分离或分离要求高的组分,特别是当关键组分间的相对挥发度接近1时,应当在没有非关键组分存在的情况下进行分离,这时分离净功耗可以保持较低水平。
规则(6)进料中含量最多的组分应该首先分离出去,这样可以避免含量最多的组分在后续塔中多次气化与冷凝,降低了后续塔的负荷。
规则(7)如果组分间的性质差异以及组分的组成变化范围不大,则倾向于塔顶和塔底产品量等摩尔分离。
精馏塔冷凝器负荷与再沸器负荷不能独立调节,塔顶和塔底产品量等摩尔分离时,精馏段回流比与提馏段蒸发比可以得到较好的平衡。
6-3 采用渐进调优进行分离序列综合时,调优规则与策略有哪些?其作用是什么?调优法则就是指产生与当前分离序列相容结构的变化机制① 相邻层次切分点序列位置变换可行分离序列就是历经各个切分点的某种切分顺序。
运筹学第三版课后习题答案第一章:引论1.1 课后习题习题1a)运筹学是一门应用数学的学科,旨在解决实际问题中的决策和优化问题。
它包括数学模型的建立、问题求解方法的设计等方面。
b)运筹学可以应用于各个领域,如物流管理、生产计划、流程优化等。
它可以帮助组织提高效率、降低成本、优化资源分配等。
c)运筹学主要包括线性规划、整数规划、指派问题等方法。
习题2运筹学的应用可以帮助组织提高效率、降低成本、优化资源分配等。
它可以帮助制定最佳的生产计划,优化供应链管理,提高运输效率等。
运筹学方法的应用还可以帮助解决紧急情况下的应急调度问题,优化医疗资源分配等。
1.2 课后习题习题1运筹学方法可以应用于各个领域,如物流管理、生产计划、供应链管理、流程优化等。
在物流管理中,可以使用运筹学方法优化仓储和运输的布局,提高货物的运输效率。
在生产计划中,可以使用运筹学方法优化产品的生产数量和生产周期,降低生产成本。
在供应链管理中,可以使用运筹学方法优化订单配送和库存管理,提高供应链的效率。
在流程优化中,可以使用运筹学方法优化业务流程,提高整体效率。
习题2在物流管理中,可以使用运筹学方法优化车辆的调度和路线规划,以提高运输效率和降低成本。
在生产计划中,可以使用运筹学方法优化生产线的安排和产品的生产量,以降低生产成本和提高产能利用率。
在供应链管理中,可以使用运筹学方法优化供应链各个环节的协调和调度,以提高整体效率和减少库存成本。
在流程优化中,可以使用运筹学方法优化业务流程的排布和资源的分配,以提高流程效率和客户满意度。
第二章:线性规划基础2.1 课后习题习题1线性规划是一种数学优化方法,用于解决包含线性约束和线性目标函数的优化问题。
其一般形式为:max c^T*xs.t. Ax <= bx >= 0其中,c是目标函数的系数向量,x是决策变量向量,A是约束矩阵,b是约束向量。
习题2使用线性规划方法可以解决许多实际问题,如生产计划、供应链管理、资源分配等。
第6章动态规划判断06100011判断:在动态规划模型中,问题的阶段数等于问题中的子问题的数目;06100021判断:动态规划中,定义状态时应保证在各个阶段中所作决策的相互独立性;06100031判断:)动态规划的最优性原理保证了从某一状态开始的未来决策独立于先前已做出的决策;06100041判断:对一个动态规划问题,应用顺推或逆推解法可能会得出不同的最优解;06100051判断:动态规划计算中的“维数障碍”主要是由于问题中阶段数的急剧增加而引起的;06100061判断:)假如一个线性规划问题含有5个变量和3个约束,则用动态规划方法求解时将划分为3个阶段,每个阶段的状态将由一个5维的向量组成;06100071判断:任何一个多阶段决策过程的最优化问题,都可以用非线性规划模型来描述。
06100081判断:动态规划问题如果按状态转移率区分,可分成确定性的与随机性的.简答06200011简答:一个N阶段的决策过程具有哪特征?06200021简答:试述动态规划的优点。
06200031简答:试述最优化原理的内容06200041简答:试述动态规划数学模型的四种类型.计算题最短路问题06301012设某厂自国外进口一步精密机器,由机器制造厂至出口港口可供选择,而进口港又有三个可供选择,进口后可经由两个城市到达目的地,期间的运输成本如下图所示,试求运费最低的路线。
06301022、某工厂从国外引进一台设备,由A到G港口有多条通路可供选择,其路线及费用如下图所示。
现要确定一条从A到G的使总费用最小的路线。
请将该问题描述成一个动态规划问题,然后求其最优解。
资源分配06302012有一部货车每天沿着公路给四个零售店卸下6箱货物,如果各零售店出售该货物06302022设有某种肥料共6个单位重量,准备供给四块粮田用,其每块粮田施肥数量与增06302033某公司打算向承包的三个营业区增设六个销售店,每个营业地区至少增设一个,从各区赚取的利润与增设的销售店个数有关,其数据如下表所示。
《管理运筹学》第四版课后习题解析(下)第9章目标规划1、解:设工厂生产A 产品1x 件,生产B 产品2x 件。
按照生产要求,建立如下目标规划模型。
112212121211122212min ()()s.t43452530555086100,,,0,1,2--+-+-+-++++-+=+-+==i i P d P d x x x x x x d d x x d d x x d d i ≤≤≥由管理运筹学软件求解得12121211.25,0,0,10, 6.25,0x x d d d d --++======由图解法或进一步计算可知,本题在求解结果未要求整数解的情况下,满意解有无穷多个,为线段(135/14,15/7)(1)(45/4,0),[0,1]ααα+-∈上的任一点。
2、解:设该公司生产A 型混凝土x 1吨,生产B 型混凝土x 2吨,按照要求建立如下的目标规划模型。
)5,,2,1(0,,0,014550.060.015550.040.030000100150100120275200.)()(min 2121215521442331222111215443322111Λ=≥≥≥≤+≤+=-++=-+=-+=-++=-++++++++-+-+-+-+-+----++-i d d x x x x x x d d x x d d x d d x d d x x d d x x ts d p d d p d p d d p i i 由管理运筹学软件求解得.0,0,20,0,0,0,0,35,40,0,120,120554433221121============+-+-+-+-+-d d d d d d d d d d x x3、解:设x 1,x 2分别表示购买两种基金的数量,按要求建立如下的目标规划模型。
,,01250543504.07.0100004525.min 2,122211121212211≥≥=-++=-++≤+++-+-+--+i i d d x x d d x x d d x x x x ts d p d p用管理运筹学软件求解得,0,0,0,818.206,091.159,636.113221121======+-+-d d d d x x所以,该人可以投资A 基金113.636份,投资B 基金159.091份。