2_动态规划专题(共三讲)

格式：pdf
大小：415.07 KB
文档页数：20

下载文档原格式

/ 20

动态规划超级详细的讲义

动态规划入门1(2008-09-20 21:40:51)第一节动态规划基本概念一，动态规划三要素：阶段，状态，决策。

他们的概念到处都是，我就不多说了，我只说说我对他们的理解：如果把动态规划的求解过程看成一个工厂的生产线，阶段就是生产某个商品的不同的环节，状态就是工件当前的形态，决策就是对工件的操作。

显然不同阶段是对产品的一个前面各个状态的小结，有一个个的小结构成了最终的整个生产线。

每个状态间又有关联（下一个状态是由上一个状态做了某个决策后产生的）。

下面举个例子：要生产一批雪糕，在这个过程中要分好多环节：购买牛奶，对牛奶提纯处理，放入工厂加工，加工后的商品要包装，包装后就去销售……，这样没个环节就可以看做是一个阶段；产品在不同的时候有不同的状态，刚开始时只是白白的牛奶，进入生产后做成了各种造型，从冷冻库拿出来后就变成雪糕（由液态变成固态=_=||）。

每个形态就是一个状态，那从液态变成固态经过了冰冻这一操作，这个操作就是一个决策。

一个状态经过一个决策变成了另外一个状态，这个过程就是状态转移，用来描述状态转移的方程就是状态转移方程。

经过这个例子相信大家对动态规划有所了解了吧。

下面在说说我对动态规划的另外一个理解：用图论知识理解动态规划：把动态规划中的状态抽象成一个点，在有直接关联的状态间连一条有向边，状态转移的代价就是边上的权。

这样就形成了一个有向无环图AOE网（为什么无环呢？往下看）。

对这个图进行拓扑排序，删除一个边后同时出现入度为0的状态在同一阶段。

这样对图求最优路径就是动态规划问题的求解。

二，动态规划的适用范围动态规划用于解决多阶段决策最优化问题，但是不是所有的最优化问题都可以用动态规划解答呢？一般在题目中出现求最优解的问题就要考虑动态规划了，但是否可以用还要满足两个条件：最优子结构（最优化原理）无后效性最优化原理在下面的最短路径问题中有详细的解答；什么是无后效性呢？就是说在状态i求解时用到状态j而状态j就解有用到状态k…..状态N。

动态规划专题讲义

拦截导弹
问题描述：某国为了防御敌国的导弹袭击，发展出一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷：虽然它的第一发炮弹能够到达任意的高度，但是以后每一发炮弹都不能高于前一发的高度。某天，雷达捕捉到敌国的导弹来袭，由于该系统还在试用阶段，所以只有一套系统，因此有可能不能拦截所有的导弹。输入导弹的枚数和导弹依次飞来的高度（雷达给出的高度数据是不大于 30000的正整数，每个数据之间有一个空格），计算这套系统最多能拦截多少导弹？如果要拦截所有导弹最少要配备多少套这种导弹拦截系统？样例输入： 8 389 207 155 300 299 170 158 65 样例输出： 6（最多能拦截的导弹数） 2（要拦截所有导弹最少要配备的系统数）
“拦截导弹”问题分析先讨论第一问：假设a[i]表示拦截的最后一枚导弹是第i枚时，系统能拦得的最大导弹数。例如，样例中的a[5]=3，表示：如果系统拦截的最后一枚导弹是高度为299的话，最多可以拦截第1枚（389）、第4枚（300）、第5枚（299）三枚导弹。显然，a[1]~a[8]中的最大值就是第一问的答案。关键是怎样求得a[1]~a[8]？我们换一个角度，假设现在已经求得a[1]~a[7]（注：在动态规划中，这样的假设往往是很必要的），那么怎样求a[8]呢？

根据上述递归式已经可以递归地求出最优解了。用递归来完成搜索，算法设计如下： function make( i {处理到第i件物品} , j{剩余的空间为 j}:integer) :integer; {初始时i=m , j=背包总容量 } begin if (i=0)or(j=0) then begin make:=0;exit;end; if j>=wi then (背包剩余空间可以放下物品 i ) r1:=make(i-1,j-wi)+v[i]; (第i件物品放入所能得到的价值 ) r2:=make(i-1,j) (第i件物品不放所能得到的价值 ) make:=max{r1,r2} end;

提高篇——动态规划专题 ppt课件

，把这种可以直接确定其结果的部分称为边界，而动态规划的递推写法总是
从这些边界出发，通过状态转移方程扩散到整个dp数组。
这样就可以从最底层各位置的dp值开始，不断往上求出每一层各位置的dp
值，最后就会得到dp[1][1]，即为想要的答案。
ppt课件
动态规划的递推写法（代码）
#include<cstdio>
• 一个问题必须拥有重叠子问题，才能使用动态规划去解决。
ppt课件
动态规划的递推写法
5
8
3
12 7 16
4 10 11 6
9
5
3
9
4
【数塔问题】将一些数字排成数塔的形状，其中第一层有一个数字，第二层有两个数字……第n层有n个数字。现在要从第一层走到第n层，每次只能走向下一层连接的两个数字中的一个，问：最后将路径上所有数字相加后得到的和最大是多少？
#include<algorithm>
using namespace std;
const int maxn=1000;
int f[maxn][maxn],dp[maxn][maxn];
int main(){
int n; cin>>n;
for(int i=1;i<=n;i++){
for(int j=1;j<=I;j++){
ppt课件
最大连续子序列和
【问题描述】给定一个数字序列A1,A2,……,An,求
i,j(1<=i<=j<=n),使得Ai+……+Aj最大，输出这个最大和。【样例】输入：-2 11 -4 13 -5 -2 输出：20

第三讲动态规划高级运筹学课件

所谓多阶段决策问题是：把一个问题看作是一个前后关联具有链状结构的多阶段过程，也称为序贯决策过程。如下图所示：
②在处理各阶段决策的选取上，不仅只依赖于当前面临的状态，而且还要注意对以后的发展。即是从全局考虑解决局部（阶段）的问题。
③各阶段选取的决策，一般与“时序”有关，决策依赖于当前的状态，又随即引起状态的转移，整个决策序列就是在变化的状态中产生出来，故有“动态”含义。因此，把这种方法称为动态规划方法。
§4.2 动态规划的基本概念
一、动态规划的基本要素
1、阶段。阶段的划分，一般根据时序和空间的自然特征来划分，但要便于把问题的过程能转化为阶段决策的过程。描述阶段的变量称为阶段变量，常用自然数k表示。如引例可划分为4个阶段求解，k=1，2，3，4。
2、状态。状态就是阶段的起始位置。它既是该阶段某支路的起点，又是前一阶段某支路的终点。（1）状态变量和状态集合。描述过程状态的变量称为状态变量。它可用一个数、一组数或一向量（多维情形）来描述，常用Sk表示第k阶段的状态变量。通常一个阶段有若干个状态。第k阶段的状态就是该阶段所有始点的集合。如引例中
称Pk,n(Sk)= {dk(sk),dk+1(sk+1),…,dn(sn)}为由第k阶段开始到最后阶段止的一个子策略，简称后部子策略。简记为 Pk,n(Sk)
如在引例的第二阶段中，若从B1出发，D2（B1）={B1 C1, B1 C2, B1 C3}如果决定选取B1 C2，则d2（B1）= B1 C2。
4、策略与子策略。策略是一个决策序列的集合。当k=1时，P1n（S1）={d1(s1),d2(s2),…,dn(sn)}就称为全过程的一个策略，简称策略，简记为P1n(S1).

Lecture2-动态规划

13
最优子结构
• DP以自底向上的方式来利用最优子结构。即首先找到子问题的最优解，解决子问题，然后找到问题的一个最优解。寻找问题的一个最优解需要在子问题中做出选择，即选择将用哪一个来求解问题。问题解的代价通常是子问题的代价加上选择本身带来的开销。
14
最优子结构存在与否的例子
• 无权最短路径—存在 • 无权最长简单路径—不存在
19
LCS的重叠子问题
• LCS的重叠子问题：为找出X和Y的一个LCS，可能需要找出X和Yn-1的一个LCS，以及Xm-1和Y的一个LCS。但这两个问题都包含找Xm-1和Yn-1的一个LCS的子子问题。原问题总共包含O(mn)个不同的子问题，所以可以用DP自底向上来计算解。 ( X m 2 , Yn 2 ) ... ( X , Y ) ( X m 1 , Yn 2 ) ... m 1 n 1 ( X , Y ) ... m 2 n 1 ( X m 1 , Yn 2 ) ... ( X m , Yn ) ( X m , Yn 1 ) ( X m , Yn 2 ) ... ( X , Y ) ... m 1 n 1 ( X m 2 , Yn 1 ) ... ( X , Y ) ( X , Y ) ... m 1 n 1 m 1 n ( X , Y ) ... m2 n
2
装配线调度
• • • • ai,j –装配线上的节点的处理时间 ei – 进入装配线的时间 xi – 离开装配线的时间 ti,j – 在不同装配线之间进行切换的时间
3
装配线调度—分析
• 如何计算最优解
4
装配线调度—一个最优解

《动态规划》课件

《动态规划》ppt课件
xx年xx月xx日
• 动态规划概述 • 动态规划的基本概念 • 动态规划的求解方法 • 动态规划的应用实例 • 动态规划的优化技巧 • 动态规划的总结与展望
目录
01
动态规划概述
定义与特点
定义
动态规划是一种通过将原问题分解为相互重叠的子问题，并存储子问题的解以避免重复计算的方法。
特点
动态规划适用于具有重叠子问题和最优子结构的问题，通过将问题分解为子问题，可以找到最优解。
动态规划的适用范围
最优化问题
01
动态规划适用于解决最优化问题，如最大/最小化问题、决策问
题等。
子问题重叠
02
动态规划适用于子问题重叠的情况，即子问题之间存在共享状
态或参数。
递归关系
03
动态规划适用于具有递归关系的问题，可以通过递归方式求解
机器调度问题
总结词
动态规划可以应用于机器调度问题，以确定最优的调度方案，满足生产需求并降低成本。
详细描述
机器调度问题是一个经典的优化问题，涉及到如何分配任务到机器上，以最小化成本或最大化效率。通过动态规划，可以将机器调度问题分解为一系列子问题，如确定每个任务的调度顺序、分配机器等，并逐个求解子问题的最优解，最终得到整个调度方案的最
VS
详细描述
记忆化搜索法是一种优化技术，通过存储已解决的子问题的解，避免重复计算，提高求解效率。这种方法适用于子问题数量较少且相互独立的情况。
04
动态规划的应用实例
最短路径问题
总结词
通过动态规划解决最短路径问题，可以找到从起点到终点的最短路径。
详细描述
在图论中，最短路径问题是一个经典的优化问题，旨在找到从起点到终点之间的一条路径，使得路径上的所有边的权重之和最小。动态规划是一种有效的解决方法，通过将问题分解为子问题并存储子问题的解，避免了重复计算，提高了求解效率。

动态规划讲解+例子ppt课件

航天飞机飞行控制问题：由于航天飞机的运动的环境是不断变化的，因此就要根据航天飞机飞行在不同环境中的情况，不断地决定航天飞机的飞行方向和速度（状态），使之能最省燃料和完成飞行任务（如软着陆）。
5
多阶段决策过程的特点：
• 根据过程的特性可以将过程按空间、时间等标志分为若干个互相联系又
互相区别的阶段。
6 6
E3
F1 4
G 3 F2
4
5
63
背包问题有一个徒步旅行者，其可携带物品重量的限度为a 公斤，设有n 种物品可供他选择装入包中。已知每种物品的重量及使用价值（作用），问此人应如何选择携带的物品（各几件），使所起作用（使用价值）最大？
物品
12…j…n
重量（公斤/件） a1 a2 … aj … an 每件使用价值 c1 c2 … cj … cn
112
2
B1
10
14
A
5
B2 610
1
4
13
B3
12 11
C1 3
9 6
C2 5
8
C3 10
D1 5 E
2
D2
8
112
2
B1
10
14
A
5
B2 610
1
4
13
B3
12 11
C1 3
9 6
C2 5
8
C3 10
D1 5
2
D2
解：整个计算过程分四个阶段，从最后一个阶段开始。
第四阶段（D →E）： D 有两条路线到终点E 。
学习动态规划，我们首先要了解多阶段决策问题。
2
最短路径问题：给定一个交通网络图如下，其中两点之间的数字表示距离（或运费），试求从A点到G点的最短距离（总运输费用最小）。

动态规划(完整)ppt课件

3
• Ⅲ --Ⅳ :
B1—C1—T
4
• Ⅱ--Ⅲ--Ⅳ ：A2—B1—C1—T
7
• Ⅰ--Ⅱ--Ⅲ --Ⅳ：
•
Q—A2—B1—C1—T
11
•
Q--A3—B1—C1—T
11
•
Q--A3—B2—C2—T
11
最新版整理ppt
3
最短路径
11
4
7
A1
4
2
6
11
47
3 2
Q
A2
4
B1
1
4 76
3
C1
3
B2 3
最新版整理ppt
16
(4)策略和允许策略集合
策略(Policy)也叫决策序列．策略有全过程策略和 k 部子策略之分，全过程策略是指具有n 个阶段的全部过程，由依次进行的 n 个阶段决策构成的决策序列，简称策略，表示
为 p1,n{x1,x2, ,xn}。从 k 阶段到第 n 阶段，
依次进行的阶段决策构成的决策序列称为 k
新分支的创立。
最新版整理ppt
6
• 动态规划将复杂的多阶段决策问题分解为一系列简单的、离散的单阶段决策问题, 采用顺序求解方法, 通过解一系列小问题达到求解整个问题目的;
• 动态规划的各个决策阶段不但要考虑本阶段的决策目标, 还要兼顾整个决策过程的整体目标, 从而实现整体最优决策.
最新版整理ppt
第七章动态规划
主要内容:
§7.1多阶段决策问题 §7.2 动态规划的基本概念和基本原理 §7.3 动态规划应用举例
最新版整理ppt
1
例求解最短路问题
2
Q
4

动态规划专题讲义解读课件

02
动态规划基本问题
最短路径问题
总结词
最短路径问题是动态规划中常见的问题类型，主要解决在给定图中从起点到终点的最短路径问题。
详细描述
最短路径问题可以分为单源最短路径问题和多源最短路径问题。单源最短路径问题是指给定一个起点和一组终点，求起点到每个终点的最短路径。多源最短路径问题则是给定一组起点和终点，求每对起点和终点之间的最短路径。
问题规模限制
对于大规模问题，动态规划算法可能会面临性能瓶颈，因为其时间复杂度是指数级的。
适用性问题
并非所有问题都适合使用动态规划算法，对于一些问题，其他算法可能更有效。
06
动态规划的未来发展展望
动态规划与其他算法的结合使用
动态规划与机器学习算法结合
利用动态规划优化机器学习模型的训练过程，提高模型的预测精度和泛化能力。
动态规划理论研究的深入和创新
深入研究动态规划算法的数学基础和理论基础，探索其更广泛的应用领域。
创新动态规划算法的设计和应用，解决现实生活中的复杂问题，推动科学技术的发展。
THANK YOU
感谢聆听
动态规划与人工智能算法结合
将动态规划应用于人工智能领域，如强化学习、自然语言处理等，以解决更复杂的问题
。
动态规划在大数据和云计算领域的应用前景
大数据处理
利用动态规划处理大规模数据集，提高数据处理效率，降低计算成本。
云计算优化
通过动态规划算法优化云计算资源的分配和管理，提高资源利用率和系统性能。
动态规划专题讲义解读课件
目
CONTENCT
录
• 动态规划概述 • 动态规划的基本问题 • 动态规划的算法实现 • 动态规划的应用场景 • 动态规划的优缺点分析 • 动态规划的未来发展展望

《动态规划教学》课件

动态规划的理论研究
要点一
动态规划算法的收敛性研究
深入探讨动态规划算法的收敛速度和收敛条件，为算法优化提供理论支持。
要点二
动态规划的近似算法研究
研究近似动态规划算法，在保证一定精度下降低计算复杂度，提高求解效率。
THANK YOU
缺点
01
空间复杂度高
动态规划通常需要存储所有子问题的解决方案，因此其空间复杂度通常较高。对于大规模问题，可能需要大量的存储空间，这可能导致算法在实际应用中受到限制。
02 03
可能陷入局部最优解
虽然动态规划有助于找到全局最优解，但在某些情况下，它可能陷入局部最优解。这是因为动态规划通常从问题的初始状态开始，逐步解决子问题，如果初始状态不是最优的，则可能在整个过程中都围绕着一个非最优的解决方案。
期权定价
动态规划可以用于期权定价模型，以更准确地预测期权价格。
计算机科学
算法优化
动态规划可以用于优化算法，以提高计算效率和准确性。
数据压缩
动态规划可以用于数据压缩算法，以更有效地压缩和解压缩数据。
游戏开发
动态规划可以用于游戏开发和AI算法，以提高游戏的可玩性和智能性。
生物信息学
基因序列比对
动态规划可以用于基因序列比对，以ห้องสมุดไป่ตู้定不同基因序列之间的相似性和差异性。
蛋白质结构预测
动态规划可以用于预测蛋白质的三维结构，以更好地理解蛋白质的功能和作用机制。
进化树构建
动态规划可以用于构建进化树，以更好地理解物种的进化关系和演化历程。
05
动态规划的优缺点
优点
高效性
动态规划能够有效地解决最优化问题，特别是那些具有重叠子问题和最优子结构的问题。通过将问题分解为子问题并存储它们的解决方案，动态规划避免了重复计算，从而大大提高了算法的效率。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

目录１、动态规划（一）基础知识２、动态规划（二）资源分配类３、动态规划（三）合并类型动态规划模型动态规划专题（一）基础知识篇长沙雅礼中学朱全民一、什么是动态规划近年来，在信息学竞赛中，每次竞赛几乎都有涉及运用动态规划解题的试题，动态规划问题已越来越受到出题者的青昧。

那么，什么是动态规划呢?在了解动态规划之前，我们先来看一道简单题。

例１如下图是一个带权的有向分层网络图，如果要求点A到点D的最短路径，怎么求呢？首先，我们看这里共有４条路径：AÆB1 Æ C1 Æ D，A Æ B1 Æ C2 Æ D，A Æ B2 ÆC2 Æ D，A Æ B2 Æ C3 Æ D它们的长度分别为：5+3+4＝12，5+2+3＝10，2+7+3＝12，2+4+5＝11。

方法1：如果采用枚举算法，枚举4条路径，然后比较每条路径的长度，得出最优解10，路径为A Æ B1 Æ C2 Æ D。

方法2：如果我们采用分层递推的思想来做这个题，会出现什么效果呢?我们设G[i]为点i到点D的距离，显然G[C1]=4，G[C2]=3，G[C3]=5，根据上面的分析，有：G[B1]=min{G[C1]+3，G[C2]+2}=5，G[B2]=min{G[C2]+7，G[C3]+4}=9，再就有：G[A]=min{G[B1]+5，G[B2]+2}=10，所以A到D的最短距离是10，最短路径是A Æ B1 Æ C2 Æ D。

分析：方法1采用枚举法对于边A-B1，A-B2，C2-D都计算了2次；而方法2采用逐层递推的方法，每条边都只计算了1次，因此，方法2要比方法1优秀。

那么造成两种方法效率不同的根本原因是什么呢? 从例1可以看出，方法2采用的逐层递推的方法从根本上消除了枚举法对路径过程中部分重复路径的冗余运算。

像上面先把一个问题递归地分解成若干与之类似的子问题，再从这些子问题的解中递推回去以得到原问题的解，就是动态规划。

动态规划是运筹学的一个分支。

它是解决多阶段决策过程最优化问题的一种方法。

1951年，美国数学家贝尔曼(R．Bellman)提出了解决这类问题的“最优化原则”；1957年发表了他的名著《动态规划》，该书是动态规划方面的第一本著作。

动态规划问世以来，在工农业生产、经济、军事、工程技术等方面都得到了广泛的应用，取得了显著的效果。

下面我们来熟悉一些动态规划的基本概念。

1．状态与状态的特征我们把每个子问题的中间解称为一个状态，例如例1中的G[A]、G[Bl]、G[C3]等就是不同的状态。

状态的特征是指影响问题目标的一个或几个因素，我们根据这些因素来区分不同的状态。

例1中的状态的特征就是顶点的序号，根据序号我们才能把C[A]、G[B1]和G[C3]这些状态区分开。

2．决策与策略在递推的过程中，我们要做出一些取舍(选择)，以决定如何从已知的状态推知未知的状态，对于特定状态的选择就被叫做决策。

如例1中，在决定C[A]的值时，取G[Bl]+5而舍G[B2]+2，就是一个明智的决策。

由一连串的决策所构成的序列称为策略，能够得到满足要求的解的策略就称为最优策略。

如例1中的最优策略就是选择A Æ B1 Æ C2 Æ D作为最短路径上的点。

3．规划方向与阶段因为所有状态在整个解题过程中的地位和作用并不完全相同，所以每个问题的解决必须依照一定的次序。

如例1中，G[B1]与G[B2]的地位是相同的，所以哪个先求解都没有关系；而G[A]与G[B1]处在不同的地位，因此G[(B1]必须在C(A]之前求解。

我们把这种解题的次序称为规划方向，把地位相同的状态称为一个阶段。

可以看出，例1的规划方向是从后向前的：由C到B，再到A；阶段A由C[A]独立构成，而阶段B 包括G[Bl]和G[B2]，阶段C包括G[C1]、G[C2]和G[C3]。

4．边界在实践中，问题一般包含多个阶段才有讨论的意义，问题的最初的阶段，我们就称为边界。

边界必须在递推之前根据题意人为给定，它是递推的基础。

这就像是在运用数学归纳法证明命题的正确性，首先要证明命题在n=n0时是成立的，接下来才能证明在n>n0时命题也是成立的，因为前者是后者的基础。

在例1中，阶段C就是边界，所以我们一开始便根据C1，C2，C3到D点的距离给G[Cl]，G[C2]和G[C3]赋了值。

5．状态转移方程我们知道，除边界外的任一阶段都得由其前面的阶段递推得到，这递推的过程就表现出了阶段的动态演变。

这种根据已有状态求得未知状态的过程，我们称之为状态转移，状态转移的规则用数学语言来描述，就称为状态转移方程。

状态转移方程的形式多样，如例1中的形式为G[i]=min{G[j]+e(i,j)}，e(i,j)∈E。

6．表上操作动态规划一个显著的特点就是“表上操作”。

也就是说，动态规划把所有的状态都保存在了一张表格之中，这表格称为状态变量，如例子中的G。

状态变量可以是一维、二维，也可以是三维、四维，这就要由阶段的划分和状态的特征来决定。

二、动态规划的基本原理运用动态规划解题往往编程简单，但效率很高，如何使用动态规划，它的核心实质上是对问题进行状态的设计和阶段的划分。

那么阶段的划分和状态描述能否符合动态规划的解题原理，是解决问题的根本所在。

1. 无后效性对于每个阶段的状态而言，如果确定了某一阶段的状态后，则在这一阶段以后过程的发展不再受这阶段以前各段状态的影响。

在例1中，要求G(A)的最优值，只会跟G(Bi)的最优值有关，而跟G(Ci)的各个状态无关。

换句话说，每个状态都是“过去历史的一个完整总结”。

这就是无后效性。

例2 多米诺骨牌有一种多米诺骨牌是平面的，其正面被分成上下两部分，每一部分的表面或者为空，或者被标上1至6个点。

例如，现有一行骨牌排列在桌面上，如下图：顶行骨牌的点数之和为6+1+1+1=9，底行骨牌点数之和为1+5+3+2=11。

顶行和底行的差值是2。

这个差值是两行点数之和的差的绝对值。

每个多米诺骨牌都可以上下倒置转换，即上部变为下部，下部变为上部。

现在的任务是，以最少的翻转次数，使得顶行和底行之间的差值最小。

对于上面这个例子，我们只需翻转最后一个骨牌，就可以使得顶行和底行的差值为0，所以例子的答案为1。

[分析]因为各骨牌的翻转顺序没有限定，因此，如果我们按例1的方法进行阶段划分，可以看出决策不具有无后效性，前面的骨牌翻转次数与后面骨牌是否翻转的最优性没有必然联系。

因此不能按骨牌编号作为阶段来划分。

怎么办呢?考虑到骨牌差值与骨牌翻转次数的关系，因此我们可以骨牌的差值来划分阶段，将最初骨牌序列上下两部分的差值I作为初始状态，把是否翻转某张骨牌作为决策，设f(i)表示骨牌差值为i时的最少翻转次数，于是有，F(i)=min{f(i+2*j)+1} 其中，-6≤j≤6，j为翻转点数差值为j的骨牌。

本题样例，f(-2)=0，由该初始状态可递推出其他差值的状态。

[注意]每个骨牌最多翻一次，在计算各状态差值时，除记录最少步数外，还需记录到达这一状态时各骨牌的放置情况，直到计算每个骨牌都已翻转或达到差值最小为止。

2．最优性原理对于每个阶段的决策而言，无论初始状态及初始决策如何，对于先前决策所形成的状态而言，其以后的所有决策应构成最优策略。

这就是最优化原理。

简言之，就是“最优策略的子策略也是最优策略”。

[例3] mod 4最优路径问题在下图中找出从第1点到第4点的一条路径，要求路径长度mod4的余数最小。

这个图是一个多段图，而且是一个特殊的多段图。

虽然这个图的形式比一般的多段图要简单，但是这个最优路径问题却不能用类似例1的分阶段形式来进行动态规划。

因为一条从第1点到第4点的最优路径，在它走到第2点、第3点时，路径长度mod 4的余数不一定是最小，也就是说最优策略的子策略不一定最优——这个问题不满足最优化原理。

但是我们可以把它转换成判定性问题，用递推法来解决。

判断从第1点到第k点的长度mod 4为Sk的路径是否存在，用fk(Sk)来表示，则递推公式如下：True (s1=0)F1(s1)= (边界条件)Flase (s1=1,2,3)F k-1(s k-len k,1) mod 4)F k(s k)= F k-1((s k-len k,2) mod 4)F k-1((s k-len k,3) mod 4)这里len k,i表示从第k-1点到第k点之间的第i条边的长度，方括号表示或运算，这里S k=0,1,2,3。

这个递推法的递推公式和动态规划的规划方程非常相似，我们在这里借用了动态规划的符号也就是为了更清楚地显示这一点。

其实它们的思想也是非常相像的，可以说是递推法借用了动态规划的思想解决了动态规划不能解决的问题。

有的多阶段决策问题(像这一题的阶段特征就很明显)，由于不能满足最优化原理等使用动态规划的先决条件，而无法应用动态规划。

在这时可以将最优指标函数的值当做“状态”放到下标中去，从而变最优化问题为判定性问题，再借用动态规划的思想，用递推法来解决问题。

三、动态规划的基本运用[例4]机器分配总公司拥有高效生产设备M台，准备分给下属的N个公司。

各分公司若获得这些设备，可以为国家提供一定的盈利。

问：如何分配这M台设备才能使国家得到的盈利最大?求出最大盈利值。

其中M<=100，N<=100。

分配原则：每个公司有权获得任意数目的设备，但总台数不得超过总设备数M。

保存数据的文件名从键盘输入。

数据文件格式为：第一行保存两个数，第一个数是设备台数M，第二个数是分公司数N。

接下来是一个N*M的矩阵，其中，第1行第J个数表明第1个公司分配J台机器的盈利。

[分析]这是一个资源分配问题，如果我们采用搜索或枚举的方法，每个公司都能分配0-m 台机器，因此时间复杂度将达到O(n m+1)，显然时间复杂度巨大。

那么我们是否能用动态规划来解决呢?设F(i，j)表示前i个公司分配了j台机器的所获得的最大盈利。

则状态转移方程为：F(i,j)=Max(F(i-1,k) + value[i,j-k]) (0≤k≤j≤m，1≤i≤n)F(i,0)=0时间复杂度0(nm2)。

[参考程序1／pascal语言]program mechine;varvalue,f : array[0..100,0..100] of longint;n,m : integer;procedure init;vari,j : integer;beginassign(input,'input.txt'); reset(input);readln(m,n);for i:=1 to n dobeginfor j:=1 to m doread(value[i,j]);readln;end;close(input);end;dynamic; //动态规划procedurevari,j,k : integer;beginassign(output,'output.txt'); rewrite(output);for i:=1 to n do //枚举阶段ifor j:=0 to m do //枚举决策变量jfor k:=0 to j do //枚举决策变量kif f[i-1,k]+value[i,j-k]>f[i,j] then //决策转移条件f[i,j]:=f[i-1,k]+value[i,j-k]; //更新最优值writeln(f[n,m]);close(output);end;begininit;dynamicend.总结：可以看出，采用动态规划解题，程序非常简单，当然上题F(i,j)只与F(i-1,k)有关，因此可以采用滚动数组（一维数组）存储每个阶段的状态。

(浙江专用)2013届高考数学冲刺必备第二部分专题二第三讲冲刺直击高考

页数:6
专题二第三讲平面向量

页数:37
第三讲数论专题 - 学生版

页数:9
第三讲专题二化学教学的.ppt

页数:19
专题二第三讲极限、数学归纳法(理)

页数:47
专题二第三讲词性转换(优秀经典公开课比赛课件)

页数:41
2020年高考理科数学二轮复习：第一部分专题二第三讲平面向量

页数:11
专题二第三讲战考场

页数:4
专题二第三讲决策

页数:32
专题二第三讲极限、数学归纳法PPT课件

页数:37

2_动态规划专题(共三讲)

合集下载

动态规划超级详细的讲义

动态规划专题讲义

提高篇——动态规划专题 ppt课件

第三讲动态规划高级运筹学课件

Lecture2-动态规划

《动态规划》课件

动态规划讲解+例子ppt课件

动态规划(完整)ppt课件

动态规划专题讲义解读课件

《动态规划教学》课件

文档推荐

最新文档

2_动态规划专题(共三讲)

合集下载

动态规划超级详细的讲义

动态规划专题讲义

提高篇——动态规划专题 ppt课件

第三讲 动态规划 高级运筹学课件

Lecture2-动态规划

《动态规划》课件

动态规划讲解+例子ppt课件

动态规划(完整)ppt课件

动态规划专题讲义解读课件

《动态规划教学》课件

文档推荐

最新文档

第三讲动态规划高级运筹学课件