有些问题,如系统可靠性问题,其目标函
数是取各阶段效应的连乘积形式,
n
fk vk (sk ,uk ) ik
.
22
(7) 最优解
用 fk* (sk) 表示第 k 子过程指标函数Fk(sk , pk(sk)) 在状态 sk 下的最优值,即:
fk (s k)o p t{ F k(s k,p k(s k))}k 1 ,2 ,L ,n
段”概念;
2. 正确选择状态变量 sk, 满足: 可知性: 正确描述动态过程演变, 可直接或
间接确定状态变量的值;
无后效性: 后面的决策与前面的决策无关;
.
34
3. 确定决策变量 xk以及允许决策集合Xk; 4. 写出状态转移方程 sk+1 = T (sk , xk); 5. 决策变量的取值范围 6. 写出过程指标函数(阶段函数)的递推
.
27
在例题中,求解最短路线的计算公式可以概括
写成:
ff5k((ss5k))0xkmXikn(sk){vk(sk,xk(sk))fk1(sk1)} k4,3,2,1
其中,vk 在这里表示从状态 sk 到由决策 xk
所决定的状态 sk+1 之间的距离。f5(s5)=0 是边
界条件,表示全过程到第四阶段终点结束。
.
31
相应的函数基本方程为 :
ffnk1(s(ks)n1)op1t{vk(sk,xk(sk))• fk1(sk1)}
xkXk
kn,n1,L ,2,1
.
32
动态规划的优缺点
动态规划的优点
• 可以解决线性, 非线性, 整 数规划无法有效求解的复 杂问题;
• 容易找到全局最优解;
• 可以得到一组解;