第9章多阶段动态规划决策.pptx
- 格式:pptx
- 大小:292.92 KB
- 文档页数:17
动态规划_多阶段决策问题的求解方法1.构造状态网络; :一:解决多阶段决策最优化的过程为动态规划方法在程序设计中,有一类活动的过程,由于它的特殊性,可将过程2.根据状态转移关系和状态转移方程建立最优值的分成若干个互相联系的阶段,在它的每一阶段都需要做出决策,从而3.按阶段的先后次序计算每个状态的最优值。
使整个过程达到最好的活动效果。
因此各个阶段决策的选取不能任逆向思维法是指从问题目标状态出发倒推回初始意确定,它依赖于当前面临的状态,又影响以后的发展。
当各个阶段态的思维方法。
动态规划的逆向思维法的要点可归纳为以决策确定后,就组成一个决策序列,因而也就确定了整个过程的一条 1.分析最优值的结构,刻画其结构特征; 活动路线。
这种把一个问题看作是一个前后关联具有链状结构的多 2.递归地定义最优值; 阶段过程就称为多阶段决策过程,这种问题称为多阶段决策问题。
3.按自底向上或自顶向下记忆化的方式计算最优在多阶段决策问题中,各个阶段采取的决策,一般来说是与时间有关的,决策依赖于当前状态,又随即引起状态的转移,一个决策序列如果原问题可以分解成几个本质相同、规模较小的就是在变化的状态中产生出来的,故有"动态"的含义,我们称这种就会联想到从逆向思维的角度寻求问题的解决。
一般解决多阶段决策最优化的过程为动态规划方法。
策问题多采用动态规划逆向思维方法解决。
二、举:二:动态规划最优化原理 pascal 语例说明本文以信息学奥赛用语言——最优化原理是动态规划的基础。
任何一个问题,如果失去了这言为编程个最优化原理的支持,就不可能用动态规划方法计算。
这个“最优化说明,其他编程语言编写方法相同,语句类似。
原理”如果用数学化一点的语言来描述的话,就是:假设为了解决某 :一:问题描述一优化问题,需要依次作出 n 个决策 D1,D2,,Dn,如若这个决策设有 N 个不相同的整数组成的数列,记为: 序列是最优的,对于任何一个整数 k,1 < k < n,不论前面 k 个决策是怎样的,以后的最优决策只取决于由前面决策所确定的当前状态,即 ()且 ?? a1 a2 an aiajij以后的决策 Dk+1,Dk+2,,Dn 也是最优的。
多阶段确定型决策(动态规划)若整个确定型决策过程又分为几个阶段,而在每个阶段(通常以时间为标志)要根据过程的演变情况确定一个决策,使全过程的某个指标达到最优,此时的决策问题称为多阶段确定型决策。
多阶段确定型决策过程实际上是一个状态转移问题,如最短路问题、资源的最优分配问题、设备更新问题和生产计划与存贮问题等。
动态规划模型理论是解决此类问题的有力工具。
它的目的就是求一个策略,使得各阶段的效益总和达到最优。
是1951年,美国数学家R.. Bellman 等人提出并创建形成的。
动态规划方法的基本思想:将一个复杂系统分解成若干阶段,每一个阶段系统都有一个决策集合,从中选择一个决策,从而决定整个过程的策略。
阶段往往用时间划分,这就具有“动态”的含义,然而,一些与时间无关的静态规划中的优化决策,也可以人为地把问题分为若干阶段作为多阶段决策问题处理。
多阶段确定型决策问题主要包括两种情况:一是阶段数固定,一是阶段数不固定。
各有各的解法,我们下面只介绍第一种情况。
求解思想主要来源于图论中的最短路径问题的思想(见图论中最短路径)。
下面结合图论最短路径问题的求解过程介绍动态规划的基本概念和原理:例:图7-5是一个线路图,边上的权表示两点之间的运输费用,寻求一条从A 到G 的路线,使运费最省。
分析:由图可知任意一条从A 到G 的路线均由六条支路构成,所以此例的最优路线问题,可看作是能够分成若干阶段的一个过程。
在过程的每一个阶段都需要作出选择,决定究竟走哪一条支路。
这些决定不同,直接导致整个选择的路线不同,走的路线的距离也不同。
如何选择路线呢?动态规划最优化原理:美国数学家R.. Bellman 指出:“作为整个过程的最优策略具有这样的性质,即无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。
”其含义是:最优策略的任何状态后的部分策略,都是相应于以此时状态作为初始状态的最优策略。
简言之,每个最优策略只能是由最优子策略构成的。