7.2 动态规划的基本原理
7.2.1 最优化原理
动态规划方法是由美国数学家贝尔曼 (R.Bellman)等人于本世纪 50 年 代提出的。他们针对多阶段决策问题的特点 ,提出了解决这类问题的”最优 化原理”,并成功地解决了生产管理、工程技术许多方面的实际问题。 最优化 原理可以表述为:“一个过程的最优策略具有这样的性质, 即无论初始状态 和初始决策如何,对于先前决策所形成的状态而言 ,其以后的所有决策必构成 最优策略。”
1 S1
2
3
4
S2
S3
S4
精选PPT
17
第三步, K=2 由于第 3 段各点 C1,C2,C3 到终点 E 的最短距离 f3(C1),
f3(C2), f3(C3),已知,所以要求城市 B1 到 E 的最短距离,只需以它们为基础,
分别加上 B1 到达 C1,C2,C3 的一段距离,加以比较取其最短者即可。
x
* 3
(
C2
)=
D2
1 S1
2
3
4
S2
S3
S4
f 3 ( C3 )=min
d (C3 , D1 ) + f4 (D1 ) d (C3 , D2 ) + f4 (D2 )
=min
1+ 4 3+3
=5
即从 C3 到 E 的最短距离为 5,其路径为 C3→D1→E,相应的决策为
x
* 3
(
C
3
)=
D1
。
1
2
3
4
精选PPT
6
3)、 决策(Decision )
当各阶段的状态确定以后,就可以做出不同的决定或选择,从而确 定下一阶段的状态,这种决定就是决策,表示决策的变量称为决策变量。