3动态规划2011_1

格式：ppt
大小：1.51 MB
文档页数：102

下载文档原格式

/ 102

动态规划.pdf

第三章：动态规划3.1 动态规划的基本概念一、动态决策问题：决策过程具有阶段性和时序性(与时间有关)的决策问题。

即决策过程可划分为明显的阶段。

二、什么叫动态规划(D.P.–Dynamic Program)：多阶段决策问题最优化的一种方法。

广泛应用于工业技术、生产管理、企业管理、经济、军事等领域。

三、动态规划(D.P.)的起源：1951年,(美)数学家R.Bellman等提出最优化原理，从而建立动态规划，名著《动态规划》于1957年出版。

四、动态决策问题分类：1、按数据给出的形式分为：•离散型动态决策问题。

•连续型动态决策问题。

2、按决策过程演变的性质分为：•确定型动态决策问题。

•随机型动态决策问题。

五1、阶段(stage)n ：作出决策的若干轮次。

n = 1、2、3、4、5。

2、状态(state)S n ：每一阶段的出发位置。

构成状态集，记为S nS 1={A}，S 2={B 1,B 2,B 3}，S 3={C 1,C 2,C 3}，S 4={D 1,D 2,D 3}，S 5={E 1,E 2}。

阶段的起点。

3、决策(decision)X n ：从一个阶段某状态演变到下一个阶段某状态的选择。

构成决策集，记为D n (S n )。

阶段的终点。

D 1(S 1)={X 1(A)}={B 1,B 2,B 3}= S 2，D 2(S 2)={X 2(B 1),X 2(B 2),X 2(B 3)}={C 1,C 2,C 3}=S 3，D 3(S 3)={X 3(C 1),X 3(C 2),X 3(C 3)}={D 1,D 2,D 3}=S 4，D 4(S 4)={X 4(D 1),X 4(D 2),X 4(D 3)}={E 1,E 2}=S 5D 5(S 5)={X 5(E 1),X 5(E 2)}={F;F}={F}。

4、策略(policy)：全过程中各个阶段的决策Xn 组成的有序总体{Xn }。

如 A àB2àC1àD1àE2àF5、子策略(sub-policy)：剩下的n个阶段构成n子过程，相应的决策系列叫n子策略。

动态规划1(qh)

4 1 C3
B2
2
2
C2 3
5 B1 4
3 C1 3
D3 5
E2
3
2
D2
4
F
4
2 E1
D1
A
B
C
D
E
F
动态规划的函数方程（DP）
建立DP函数方程是指确定过程的阶段及阶段数，规定状态变量和决策变量的取法，给出各阶段的状态集合，允许决策集合，状态转移方程和指标函数等。
在上面的计算过程中，利用了第 k阶段与第k+1阶段的关系：
f3(C1)=MIN r(C1,D1)+ f4(D1) r(C1,D2)+ f4(D2)
=MIN（3+6，3+5）=8 最短路线： C1——D2——E2——F 最优解： d3*(C1)= D2
4 A3
4 1 C3
B2
2
2
C2 3
5 B1 4
3 C1 3
D3 5
E2
3
2
D2
4
F
4
2 E1
D1
A
B
C
D
4
F
4
2 E1
D1
A
B
C
D
E
F
d1
r (S 1,d 1 (S 1))+ f2(S 2) f 1(S 1) d 1 (S 1)
S1
B1
B2
A
15
14
14
B2
4 A3
4 1 C3
B2
2
2
C2 3
5 B1 4
3 C1 3
D3 5
E2
3

动态规划-1

f(1,1)=13
13
11 12 6 12
f(4,1)=42 f(2,1)=24 f(2,2)=21
阶段1
8
f(3,3)=47
f(3,1)=36
f(3,2)=31
阶段2
7 14
f(4,2)=50
26
阶段3
15
f(4,3)=62
8
f(4,4)=55
f(5,1)=54
7
f(5,2)=57
13
f(5,3)=75
Yangzheng Middle School
例题最长公共子序列
字符序列的子序列是指从给定字符序列中随意地
（不一定连续）去掉若干个字符（可能一个也不
去掉）后所形成的字符序列。给定2个序列X和Y，当另一序列Z既是X的子序列又是Y的子序列时，称Z是序列X和Y的公共子序列。给定2个序列X={x1,x2,…,xm}和Y={y1,y2,…,yn}，找出X和Y的最长公共子序列。
Yangzheng Middle School
例题友好城市
【输入样例】 7 2 4 现在要在2个友好城市之间建立一条航线， 7 但由于天气的缘故，所有的航线都不能相交，因此，就不能给所有的友好城市 1 建立友好航线。最多能建多少条航线。 3 【输入格式】 5 6 第1行，一个整数N(1≤N≤5000)，表示城【输出样例】市数 4 以下N行，记第i行有一个正整数j，表
例题友好城市
从上面的结论可以看出如果选择了m条不相交的航线。将航线按北岸城市号从小到大排序后，对应的南岸城市序号为B1,B2 , ……,Bm。必定满足B1<B2<……Bm 因此，我们可以先将各航线按北岸城市号排一个序，那么最优的方案必然是从相对应的南岸城市号中找出一个最长不下降序列，该序列的长度即为问题的解。

动态规划(完整)

第七章动态规划
主要内容:
§7.1多阶段决策问题 §7.2 动态规划的基本概念和基本原理
§7.3 动态规划应用举例
例求解最短路问题
A1 2 Q 4 3 A3 A2 6 3 7 4 B1 1 4 2 4 4 1 5 6 B2 3 B3 3 3 C2 C1 3 4 T
Ⅰ
Ⅱ
Ⅲ
Ⅳ
分阶段的最短路径
• • • • • • • Ⅳ ： C1—T Ⅲ --Ⅳ : B1—C1—T Ⅱ--Ⅲ--Ⅳ ：A2—B1—C1—T Ⅰ--Ⅱ--Ⅲ --Ⅳ： Q—A2—B1—C1—T Q--A3—B1—C1—T Q--A3—B2—C2—T 3 4 7
决策为 xk 时的指标，则它就是第 k 段指标函
数，简记为vk 。（2）过程指标函数（也称目标函数）用f(sk , xk)表示第k子过程的指标函数。表
示处于第 k 段 sk 状态且所作决策为xk时，
从 sk 点到终点的距离。由此可见， f(sk , xk)
不仅跟当前状态 sk 有关，
还跟该子过程策略 pk(sk) 有关,严格说来，应
(6) 指标函数
用来衡量策略或子策略或决策的效果的某种数量指标，就称为指标函数。它是定义在全过程或各子过程或各阶段上的确定数量函数。对不同问题，指标函数可以是诸如费用、成本、产值、利润、产量、耗量、距离、时间、效用，等等。
（1）阶段指标函数（也称阶段效应）
用vk(sk , xk)表示第 k 段处于状态 sk且所作
资规划, 排序问题和生产过程的最优控制
等问题;
§7.2 动态规划的基本概念和基本思想
一、基本概念
使用动态规划方法求解决策问题首先要将问题改造成符合动态规划求解要求的形式, 要涉及以下概念: (1)阶段 (3)决策与策略 (2)状态 (4)状态转移方程

动态规划的基本方法ppt课件

状态具有无后效性的多阶段决策过程的状态转移方程如下
s2 T1 ( s1 , u1 ) s3 T2 ( s2 , u2 )
动态规划中能处理的状态转移
sk 1 Tk ( sk , uk )
方程的形式。
精选ppt课件
11
5、策略：
是一个按顺序排列的决策组成的集合。在实际问题中，可供选择的策略有一定的范围，称为允许策略集合。从允许策略集合中找出达到最优效果的策略称为最优策略。
精选ppt课件
20
3
C1
2 B1 3
1
A
1 2
3
C2
3
D
4 B2 1
4
C3
第二阶段（B →C）： B 到C 有六条路线。
d( B1,C1 43;1
f2 ( B1 ) = min d( B1,C2 ) + f1 (C2 ) = min 3+3
d( B1,C3 ) + f1 (C3 )
间的自然特征来进行的，但要便于问题转化为多阶段决策。
年、
月、
一个数、
2、状态：
路段
一组数、一个向量
表示每个阶段开始所处的自然状况或客观条件。通常一个阶段有若
干个状态，描述过程状态的变量称为状态变量。
状态变量的取值有一定的允许集合或范围，此集合称为状态允许集合。
精选ppt课件
8
3、决策：
表示当过程处于某一阶段的某个状态时，可以作出不同的决定，从而确定下一阶段的状态，这种决定称为决策。描述决策的变量，称为决策变量。决策变量是状态变量的函数。可用一个数、一组数或一向量（多维情形）来描述。在实际问题中决策变量的取值往往在某一范围之内，此范围称为允许决策集合。

动态规划基础讲解及经典案例分析解答

5、参考程序 III
动态规划解题的一般思路
许多求最优解的问题可以用动态规划来解决。许多求最优解的问题可以用动态规划来解决。首先要把原问题分解为若干个子问题。首先要把原问题分解为若干个子问题。注意单纯的递归往往会导致子问题被重复计算，用动态规划的方法，致子问题被重复计算，用动态规划的方法，子问题的解一旦求出就要被保存，所以每个子问题只需求解一次。要被保存，所以每个子问题只需求解一次。子问题经常和原问题形式相似，有时甚至完全一样，子问题经常和原问题形式相似，有时甚至完全一样，只不过规模从原来的n 变成了n-1，或从原来的 ×m 变成了 ×(m-1) ……等从原来的变成了，或从原来的n× 变成了n× 等等。找到子问题，就意味着找到了将整个问题逐渐分解的办法。找到子问题，就意味着找到了将整个问题逐渐分解的办法。分解下去，分解下去，直到最底层规模最小的的子问题可以一目了然地看出解。每一层子问题的解决，会导致上一层子问题的解决，逐层向上，每一层子问题的解决，会导致上一层子问题的解决，逐层向上，就会导致最终整个问题的解决。就会导致最终整个问题的解决。如果从最底层的子问题开始，如果从最底层的子问题开始，自底向上地推导出一个个子问题的那么编程的时候就不需要写递归函数。解，那么编程的时候就不需要写递归函数。
3、参考程序 I
int main(void) { int m; scanf("%d", &N); for( int i = 1; i <= N; i ++ ) for( int j = 1; j <= i; j ++ ) scanf("%d", &D[i][j]); printf("%d", MaxSum(1, 1)); return 0; }

《动态规划》课件

《动态规划》ppt课件
xx年xx月xx日
• 动态规划概述 • 动态规划的基本概念 • 动态规划的求解方法 • 动态规划的应用实例 • 动态规划的优化技巧 • 动态规划的总结与展望
目录
01
动态规划概述
定义与特点
定义
动态规划是一种通过将原问题分解为相互重叠的子问题，并存储子问题的解以避免重复计算的方法。
特点
动态规划适用于具有重叠子问题和最优子结构的问题，通过将问题分解为子问题，可以找到最优解。
动态规划的适用范围
最优化问题
01
动态规划适用于解决最优化问题，如最大/最小化问题、决策问
题等。
子问题重叠
02
动态规划适用于子问题重叠的情况，即子问题之间存在共享状
态或参数。
递归关系
03
动态规划适用于具有递归关系的问题，可以通过递归方式求解
机器调度问题
总结词
动态规划可以应用于机器调度问题，以确定最优的调度方案，满足生产需求并降低成本。
详细描述
机器调度问题是一个经典的优化问题，涉及到如何分配任务到机器上，以最小化成本或最大化效率。通过动态规划，可以将机器调度问题分解为一系列子问题，如确定每个任务的调度顺序、分配机器等，并逐个求解子问题的最优解，最终得到整个调度方案的最
VS
详细描述
记忆化搜索法是一种优化技术，通过存储已解决的子问题的解，避免重复计算，提高求解效率。这种方法适用于子问题数量较少且相互独立的情况。
04
动态规划的应用实例
最短路径问题
总结词
通过动态规划解决最短路径问题，可以找到从起点到终点的最短路径。
详细描述
在图论中，最短路径问题是一个经典的优化问题，旨在找到从起点到终点之间的一条路径，使得路径上的所有边的权重之和最小。动态规划是一种有效的解决方法，通过将问题分解为子问题并存储子问题的解，避免了重复计算，提高了求解效率。

《动态规划课件》课件

应用场景：求解最短路径、背包问题等
注意事项：避免重复计算子问题和记忆化搜索
定义：将问题划分为若干个较小的子问题，并逐个解决子问题，最终得到原问题的解
特点：将原问题分解为更小的子问题，通过求解子问题的最优解得到原问题的最优解
应用场景：适用于具有重叠子问题和最优子结构特性的问题
示例：背包问题、最大子段和问题等
分段算法的代码实现
分段算法的时间复杂度分析
避免重复计算：使用备忘录或动态规划表来记录已计算过的子问题减少子问题的数量：通过合并或减少不必要的子问题来降低计算复杂度选择合适的递归方式：根据问题的特点选择最优的递归方式优化递归栈：通过减少递归深度或使用循环代替递归来提高性能
优化算法：动态规划可以优化算法，提高计算效率避免重复计算：通过记忆化搜索，避免重复计算，提高计算速度
添加标题ቤተ መጻሕፍቲ ባይዱ
添加标题
添加标题
添加标题
动态规划与分治法比较：分治法将问题分解为子问题，而动态规划将子问题联系起来
动态规划与回溯法比较：回溯法会穷举所有可能解，而动态规划可以避免不必要的搜索
机器学习与深度学习中的动态规划
自然语言处理中的动态规划
计算机视觉中的动态规划
推荐系统中的动态规划
最大子段和问题的定义最大子段和问题的应用场景最大子段和问题的解决方法最大子段和问题的实际应用案例
定义：矩阵链乘法问题是一种优化问题，通过动态规划算法来求解
应用场景：在科学计算、机器学习、图像处理等领域都有广泛的应用
算法原理：通过动态规划算法，将矩阵链乘法问题转化为子问题，从而避免重复计算，提高计算效率
应用场景：背包问题在计算机科学、运筹学、经济学等领域都有广泛的应用，如资源分配、路径规划、时间表安排等。

动态规划1引例和基本概念_OK

25
生产－库存问题的动态结构
1 月初库存量: s1=2
生产量 x1
2 月初库存量:
生产
s2
系统
生产量 x2
3 月初库存量:
生产
s3
系统
决策准则: 生产成本 c1x1 最小
决策准则: 生产成本 c2x2 最小
7 月初库存量: s7
生产量 x7
7 月底库存量:
生产
s8＝0
系统
决策准则: 生产成本 c7x7 最小
其中rk
(sk
,xk
)为sk
选择决策xk
到s k
的距离。
1
fk 1 (sk 1
)为sk
到终点的距离。
1
因此，最短路线问题可简化为四个阶段的决策问题，使由这四个阶段决策组成决策序列，也称为策略所决定的一条路线的总长度最短。
8
例 5.1.2 多阶段资源分配问题
设有数量为x的某种资源，将它投入两种生产方式A和B中：以数量y投入生产方式A，剩下的量投入生产方式B，则可得到收入g(y)+h(x-y)，其中 g(y) 和 h(y) 是已知函数，并且 g(0)=h(0)=0 ；同时假设以y与x-y分别投入两种生产方式A，B 后可以回收再生产，回收率分别为a与b。试求进行n个阶段后的最大总收入。
3
D1
2
D2 3
E
4
D3
同样的理由，可以递推得其余阶段的铺设路线，如阶段3在C1点的决策是D1，阶段4在D1点的决策只有E点；由于到E点是整个铺设管道的终点，至此，决策过程完成，铺设一条A点到E点的管道是由四个阶段的管道组成的，如A---B3---C1---D1---E，它也称为一个策略。

第3章动态规划

第3章动态规划动态规划是一种通过将问题分解为子问题，并且以自底向上的方式求解子问题从而求解整个问题的算法设计方法。

它在计算机科学中的应用非常广泛，特别是在优化问题和组合优化问题中。

动态规划的核心思想是将问题划分为多个重叠子问题，并且将计算结果储存起来以供后续使用。

通过这种方式，可以避免重复计算，提高算法效率。

动态规划通常适用于满足最优子结构的问题，即问题的最优解可以通过一系列子问题的最优解得到。

在动态规划中，需要定义一个状态转移方程，用于描述问题的最优解与其子问题的最优解之间的关系。

通过利用状态转移方程，可以从最底层的子问题开始，逐步求解出更大规模的问题的最优解。

最终，可以得到整个问题的最优解。

动态规划的基本步骤包括问题建模、确定状态、定义状态转移方程、确定边界条件和计算最优解。

首先，需要将原始问题转化为适合动态规划求解的形式，通常可以采用数学建模的方法。

然后，需要确定问题的状态，即将问题划分为多个子问题，并且定义子问题的状态。

接下来，需要定义状态转移方程，该方程记录了问题的最优解与子问题的最优解之间的关系。

然后，需要确定边界条件，即问题的最基本解。

最后，通过逐步计算子问题的最优解，得到整个问题的最优解。

动态规划在多个领域都有广泛的应用。

在计算机科学中，动态规划被广泛应用于图论算法、字符串处理算法、序列比对算法等。

此外，动态规划还被应用于经济学、运筹学和生物学等领域的优化问题。

通过应用动态规划，可以有效地解决这些领域中的复杂问题。

总结起来，动态规划是一种通过将问题划分为多个子问题，并且利用状态转移方程求解子问题从而求解整个问题的算法设计方法。

通过避免重复计算，动态规划可以提高计算效率，并且被广泛应用于计算机科学和其他领域的问题求解。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

设计动态规划法的步骤：
1、划分阶段（子问题），分析最优子结构性质。 2、找出阶段间的最优决策的递推关系，写出动态规划方程； 3、设计自底向上计算出最优值的步骤。 4、从最终决策的回溯子问题的决策，构造一个最优解。
3.1 多段图问题设G=(V,E)是一个赋权有向图，其顶点集V被划分成k>2个不相交的子集Vi: 1≤i≤k，其中，V1和Vk分别只有一个顶点s(称为源)和一个顶点t(称为汇)，图中所有的边(u,v)的始点和终点都在相邻的两个子集Vi和Vi＋1 中：u∈Vi，v∈Vi＋1。如图所示。
3）构造最优解如果在计算每一个COST(i，j)的同时，记下每个结点j所作的决策(即，使c(j，l)+COST(i+1，l)取最小值的j的后继节点 r)，设它为D(i，j)，则可容易地求出这条最小成本路径。 D(3，6)＝10 D(3，7)＝10 D(3，8)＝10 D(2，2)=7 D(2，3)=6 D(2，4)＝8 D(2，5)＝8 D(1，1)＝2 P(1)＝1， P(5)＝12 P(2)= D(1，P(1) )=2, P(3)=D(3,P(2) ) = D(3, 2 )=7, P(4)＝D(2，P(3))=D(3，7)＝10
3.2 矩阵连乘问题
给定n个矩阵｛A1,A2,…,An｝，其中Ai与Ai+1是可乘的， i=1，2…，n-1。如何确定计算矩阵连乘积的计算次序，使得依此次序计算矩阵连乘积需要的数乘次数最少。
两个矩阵相乘所需做的数乘次数为 l*n*m 矩阵乘法满足结合律，故矩阵连乘有可以有许多不同的计算顺序。计算顺序由加括号的方式确定。加括号的方式决定了矩阵连乘的计算量
的解（最优解）。 2、每个最优化问题都包含一组限制条件和一个优化函数（optimization function），符合限制条件的问题求解方案称为可行解（ feasible solution），使优化函数取得最佳值的可行解称为最优解（optimal solution）。
例1
0/1背包问题
问题：问题：已知有n种物品和一个可容纳M重量的背包，每种物品i的重量为wi。假定将物品i的一部分xi放入背包就会得到pixi的效益，这里，xi=0,1，pi>0。如果这些物品重量的和大于M，要求所有选中要装入背包的物品总重量不得超过M，而装入背包物品获得的总效益最大。即
( Ai Ai +1... Ak )( Ak +1 Ak + 2 ... A j )
计算量：A(i:k)的计算量加上A(k+1:j)的计算量，再加上 A(i:k)和A(k+1:j)相乘的计算量。
• 特征：计算A(i:j)的最优次序所包含的计算矩阵子链 A(i:k)和 A(k+1:j)的次序也是最优的。 • 矩阵连乘计算次序问题的最优解包含着其子问题的最优解。
最优子结构性质：最优子结构性质：原问题的最优解包含了其子问题的最优解，即最优化原理成立。子问题重叠性质：子问题重叠性质：每次产生的子问题并不总是新问题，有些子问题被反复计算多次。如果问题具备以上性质，则该问题可以用动态规划方法求解。
最优子结构性质
2 1 3 4 3 2 1 4 5 3 4 4 6 1
将原问题划分成两个子问题。如果原问题获得最优值。则子问题的应该也是最优的。
考虑任意大小(起点为，终点为j)的子问题的子问题，考虑任意大小起点为i，终点为的子问题，起点为将矩阵连乘积 Ai Ai +1... A j 简记为A(i:j) ，这里i≤j 考察计算A(i:j)的最优计算次序。设这个计算次序在矩阵 Ak和Ak+1之间将矩阵链断开，i≤k<j，则其相应完全加括号方式为
设计算A(i:j)，1≤i≤j≤n，所需要的最少数乘次数m[i,j]，设计算A(i:k)的最少数乘次数为m[i,k]，计算A(k+1:j) 最少数乘次数为m[k+1,j] 最后两个矩阵相乘即A(i:k)A(k+1,j)所做的乘法次数： m[i,j]=m[i,k]+m[k+1,j]}
A(i:j)=
pk × p j
得到不同的乘法运算的次数：
16000, 10500, 36000, 87500, 34500
1、划分阶段（子问题）、划分阶段（子问题）将矩阵连乘积
A1A2 ... n A
简记为A(1:n)
设最优计算次序在矩阵 Ak和Ak+1之间将矩阵链断开，1≤k<n，则其相应完全加括号方式为
(A1 ... k )(Ak +1Ak + 2 ... n ) A A
1）证明最优化原理对多段图成立。）证明最优化原理对多段图成立假设s vi,…,vk-1 ,t是一条由s到t的最短路径，如图所示。假定从源点s开始，已作出了到结点vi的决策，下面的子问题是找出一条由vi到t的最短路径，因此初始决策所产生的状态vi 是子问题的初始状态。
显然子问题的最优解是vi，…，vk-1，t，如果不是，由由 vi到t的最短路径是vi，qi+1，…，qk-1，t，则s，…，vi， qi+1，…，qk-1，t是一条比路径s，…，vi，…，vk-1，t更短的由s到t的路径。与假设矛盾，故最优性原理成立。因此它为使用动态规划方法来解多段图问题提供了可能。
pi −1 × pk × p j
pi −1 × pk
可以递归地定义m[i,j]为：
0 i= j m[i, j ] = minj{m[i, k ] + m[k + 1, j ] + pi −1 pk p j } i < j i≤ k <
k 的位置只有 j − i 种可能
设计算法 1、根据动态规划方程，子问题A(i:j)的最优值m[i,j]计算流程如下： for k← i+1 to j-1 do //求最好的分割点 k { t←m[i][k] + m[k+1][j] + p[i-1]*p[k]*p[j]; if t < m[i][j] then { m[i][j] ← t s[i][j] ← k //记下子问题A(i:j)的最好分割点 } 2、计算所有大小为r的子问题各子问题的起点从i=1至n-r+1，终点j=i+r-1 i=1 n-r+1 j=i+r-1
设们的维数分别是：
A = 50 × 10 B = 10 × 40 C = 40 × 30 D = 30 × 5
总共有五中完全加括号的方式
( A(( BC ) D )) ((( AB )C ) D )
( A( B (CD ))) (( A( BC )) D )
(( AB )(CD ))
2 1
2 1
4
4 6
原问题的最优解 1
2 1 1
2
4 包含子问题的最优解
4 3
子问题重叠性质
1-4中包含了子问题 1-2 1-5中也包含了子问题 1-2 1 3 4 3 4 5
2 1 1
2
4
动态规划算法的设计思想
动态规划法与分治法类似，其基本思想也是将待求解问题分解成若干个子问题，但是经分解得到的子问题往往不是互相独立的。用分治法求解时，有些子问题被重复计算了许多次。如果能够保存已解决的子问题的答案，而在需要时再找出已求得的答案，就可以避免大量重复计算，从而得到多项式时间算法。
多段图的向前处理算法 procedure FGRAPH(G，k，n，P) {//G有n个结点的k段图。E是边集，c[i，j]是边<i,j>的成本。 P[1：k]是最小成本路径。// COST[n]， D[n一1]，P[k]，r，j，k，n COST[n]← 0 for j←n-1to 1 by -1 do //计算COST[j]// {设r是一个这样的结点，(j，r)∈E且使c[j，r]+COST[r]取最小值 COST[j]←c[j，r]+COST[r] D[j]←r } //向前对j-1进行决策// P[1]←1 P[k]←n for j←2 to k-1 do //找路径上的第j个节点// P[j]←D [ P[j-1] ] }
动态规划方法 Dynamic Programming
Programming——规划、计划
该方法是由Bellman 在1950年提出的，目的是解决优化问题。
学习要点: 学习要点
• 理解动态规划算法的原理。 • 掌握动态规划算法的基本要素 • 掌握设计动态规划算法的步骤。
3.1优化问题
1、问题有多种解决方案，但需要找某种指标最好
对策：分段决策。
问题： 1）什么问题能够通过分段决策（求解子问题），求原问题的最优？ 2）怎样分段（划分子问题）？
在实际生活中，有一类问题的活动过程可以分成若干个阶段，而且在任一阶段后的行为依赖于该阶段的状态，与该阶段之前的过程如何达到这种状态的方式无关。贝尔曼（Richard Bellman）等人提出了解决这类问题的“最优化原理”，把多阶段过程转化为一系列单阶段问题，利用各阶段之间的关系，逐个求解。
1 i K=i+1 j n
…….
向后递推规划方法
• Cost[i-1,l] s ………. Vi-1 l vi j ………. t c[i-1,l]
Cost[i-1,l] Cost[i,j] Cost[k,n]
Cost[1,s]=0已知可求得Cost[2,j] 对于任意的cost[i,j]，有 cost[i,j]=min{cost[i-1,l]+c[l,j] } j∈Vi ，l ∈Vi-1 最后求出s,…..vi，…，vk-1，t。
1:n 1:k …….
1:3 1:2 2:3 2:4 3:4 K:k+1 n-2:n-1 n-1:n