动态规划

格式：doc
大小：36.00 KB
文档页数：4

下载文档原格式

动态规划

f1(A)=MIN r(A,B1)+ f2(B1) r(A,B2)+ f2(B2)
=MIN（3+12，4+10）=14
最短路线： A—— B2 ——C2——D2——E2——F 最优解： d1*(A)= B2，最短用时14
1
B2
C3
4 2
D3
5
E2
4
A
2
C2
3 3 3
D2
2
F
3
B1
5 4
C1
4
2
E1
最优解： d2*(B1)= C1
1
B2
C3
4 2
D3
5
E2
4
A
2
C2
3 3 3
D2
2
F
3
B1
5 4
C1
4
2
E1
4
3
D1
A
B
C
D
E
F
如果S2=B2，则下一步能取C2或C3，故
f2(B2)=MIN r(B2,C2)+ f3(C2)
r(B2,C3)+ f3(C3) =MIN（2+8，1+11）=10
最短路线： B2 ——C2——D2——E2——F
1
B2
C3
4 2
D3
5
E2
4
A
2
C2
3 3 3
D2
2
F
3
B1
5 4
C1
4
2
E1
4
3
D1
A
B
C
D
E
F
如果S4=D3，则下一步只能取E2，故

动态规划

多阶段决策问题中，各个阶段采取的决策，一般来说是与时间有关的，决策依赖于当前状态，又随即引起状态的转移，一个决策序列就是在变化的状态中产生出来的，故有“动态”的含义，称这种解决多阶段决策最优化问题的方法为动态规划方法。
任何思想方法都有一定的局限性，超出了特定条件，它就失去了作用。同样，动态规划也并不是万能的。适用动态规划的问题必须满足最优化原理和无后效性。
动态规划
运筹学的分支
01 原理
03 局限性
目录
02 分类
动态规划（Dynamic Programming，DP）是运筹学的一个分支，是求解决策过程最优化的过程。20世纪50年代初，美国数学家贝尔曼（R.Bellman）等人在研究多阶段决策过程的优化问题时，提出了著名的最优化原理，从而创立了动态规划。动态规划的应用极其广泛，包括工程技术、经济、工业生产、军事以及自动化控制等领域，并在背包问题、生产经营问题、资金管理问题、资源分配问题、最短路径问题和复杂系统可靠性问题等中取得了显著的效果。
最优化原理可这样阐述：一个最优化策略具有这样的性质，不论过去状态和决策如何，对前面的决策所形成的状态而言，余下的诸决策必须构成最优策略。简而言之，一个最优化策略的子策略总是最优的。一个问题满足最优化原理又称其具有最优子结构性质。
将各阶段按照一定的次序排列好之后，对于某个给定的阶段状态，它以前各阶段的状态无法直接影响它未来的决策，而只能通过当前的这个状态。换句话说，每个状态都是过去历史的一个完整总结。这就是无后向性，又称为无后效性。
状态：状态表示每个阶段开始面临的自然状况或客观条件，它不以人们的主观意志为转移，也称为不可控因素。在上面的例子中状态就是某阶段的出发位置，它既是该阶段某路的起点，同时又是前一阶段某支路的终点。

第6章动态规划

第6章动态规划动态规划（Dynamic Programming ）是解决多阶段决策过程最优化的一种有用的数学方法。

它是由美国学者Richard .Bellman 在1951年提出的，1957年他的专著《动态规划》一书问世，标志着运筹学的一个重要分支－动态规划的诞生.动态规划也是一种将多变量问题转化为单变量问题的一种方法。

在动态规划中，把困难的多阶段决策问题变换成一系列相互联系的比较容易的单阶段问题一个个地求解。

动态规划是考察解决问题的一种途径 ,而不是一种特殊的算法，不像线性规划那样有统一的数学模型和算法（如单纯形法）.事实上，在运用其解决问题的过程中还需要运用其它的优化算法。

因此，动态规划不像其它方法局限于解决某一类问题,它可以解决各类多阶段决策问题。

动态规划在工程技术、经济管理等社会各个领域都有着广泛的应用，并且获得了显著的效果。

在经济管理方面,动态规划可以用来解决最优路径问题、资源分配问题、生产调度问题、库存管理问题、排序问题、设备更新问题以及生产过程最优控制问题等，是经济管理中一种重要的决策技术。

许多规划问题用动态规划的方法来处理,常比线性规划或非线性规划更有效。

特别是对于离散的问题，由于解析数学无法发挥作用，动态规划便成为了一种非常有用的工具。

动态规划可以按照决策过程的演变是否确定分为确定性动态规划和随机性动态规划；也可以按照决策变量的取值是否连续分为连续性动态规划和离散性动态规划。

本教材主要介绍动态规划的基本概念、理论和方法,并通过典型的案例说明这些理论和方法的应用。

6.1动态规划的基本理论6.1.1多阶段决策过程的数学描述有这样一类活动过程,其整个过程可分为若干相互联系的阶段，每一阶段都要作出相应的决策,以使整个过程达到最佳的活动效果。

任何一个阶段(stage ，即决策点)都是由输入(input ）、决策（decision ）、状态转移律（transformation function )和输出(output )构成的，如图6-1（a ）所示.其中输入和输出也称为状态(state ）,输入称为输入状态，输出称为输出状态。

动态规划.pdf

第三章：动态规划3.1 动态规划的基本概念一、动态决策问题：决策过程具有阶段性和时序性(与时间有关)的决策问题。

即决策过程可划分为明显的阶段。

二、什么叫动态规划(D.P.–Dynamic Program)：多阶段决策问题最优化的一种方法。

广泛应用于工业技术、生产管理、企业管理、经济、军事等领域。

三、动态规划(D.P.)的起源：1951年,(美)数学家R.Bellman等提出最优化原理，从而建立动态规划，名著《动态规划》于1957年出版。

四、动态决策问题分类：1、按数据给出的形式分为：•离散型动态决策问题。

•连续型动态决策问题。

2、按决策过程演变的性质分为：•确定型动态决策问题。

•随机型动态决策问题。

五1、阶段(stage)n ：作出决策的若干轮次。

n = 1、2、3、4、5。

2、状态(state)S n ：每一阶段的出发位置。

构成状态集，记为S nS 1={A}，S 2={B 1,B 2,B 3}，S 3={C 1,C 2,C 3}，S 4={D 1,D 2,D 3}，S 5={E 1,E 2}。

阶段的起点。

3、决策(decision)X n ：从一个阶段某状态演变到下一个阶段某状态的选择。

构成决策集，记为D n (S n )。

阶段的终点。

D 1(S 1)={X 1(A)}={B 1,B 2,B 3}= S 2，D 2(S 2)={X 2(B 1),X 2(B 2),X 2(B 3)}={C 1,C 2,C 3}=S 3，D 3(S 3)={X 3(C 1),X 3(C 2),X 3(C 3)}={D 1,D 2,D 3}=S 4，D 4(S 4)={X 4(D 1),X 4(D 2),X 4(D 3)}={E 1,E 2}=S 5D 5(S 5)={X 5(E 1),X 5(E 2)}={F;F}={F}。

4、策略(policy)：全过程中各个阶段的决策Xn 组成的有序总体{Xn }。

如 A àB2àC1àD1àE2àF5、子策略(sub-policy)：剩下的n个阶段构成n子过程，相应的决策系列叫n子策略。

动态规划

(3)决策（Decision）
(4)策略（Policy）各阶段的决策组成的一个决策序列称为
一个策略，记为： p x1, x2 ,, xn
从阶段i开始的过程，称为i子过程，它包含阶段i，阶段i+1，…，阶段n。i子过程的决策序列称为i子策略，记
为 pi xi , xi1,, xn i 1, 2 ,, n 1
,
3 资源分配问题
设有数量为a的资源，计划分配给n 个项目。设xi (i=1, 2, …, n)为分配给第i 个项目的资源量，gi(xi)为第i个项目得到数量为xi的资源后可提供的收益，问如何分配资源a，可使总收益为最高？
►静态规划模型
n
max f gi (xi )
i 1
n xi a
1.3 动态规划的基本方程
(1) 动态规划的基本方程(逆序递推公式)
si1
g(si , xi )
，f
* n 1
(
x
n 1
)
0
fi* (si )
opt
v(si , xi )
f
i
* 1
(si
1
)
xi
i n, n 1,,1
(2) 动态规划的基本方程(正序递推公式)
si1 g(si , xi ) ，f1*(s1) opt{v(s1, x1)}
1
6
7
X
2
(
B2
,
C3
)
f
3
(C3
)
1 6
最短路线B2C3D。
C1
5
5
4
B1 5
3
A
C2
3
D
4
6

第6章-动态规划

f*n(Sn)为从第n个阶段到终点的最短距离， f*n+1(Sn+1)为从第n+1个阶段到终点的最短距离， dn(Sn,Xn)为第n个阶段的距离，f*5(S5)为递推的起点，通常为已知的。
求解过程
由最后一个阶段的优化开始，按逆向顺序逐步向前一阶段扩展，并将后一阶段的优化结果带到扩展后的阶段中去，以此逐步向前推进，直至得到全过程的优化结果。
f1
(
A)
min
dd11
( (
A, A,
B1) B2 )
ff22((BB12))
min
4 9
9 11
13
d1( A, B3) f2 (B3)
5 13
其最短路线是A→ B1→C2 →D2 →E ，相应的决策变量是u1(A)=B1
因此，最优策略序列是：
u1(A) =B1, u2(B1)=C2, u3(C2)=D2, u4(D2)=E
5 8 C2 4 6 4
4 C3 2
C3
D1 4 2 6
D2 9 7
D3 5
D4
E1 1 F
E2 2
E5
F
动态规划的逆序解法与顺序解法
逆序（递推）解法：即由最后一段到第一段逐步求出各点到终点的最短路线,最后求出A点到E点的最短路线。运用逆序递推方法的好处是可以始终盯住目标,不致脱离最终目标。顺序解法：其寻优方向与过程的行进方向相同，求解时是从第一段开始计算逐段向后推进，计算后一阶段时要用到前一段求优的结果，最后一段的计算结果就是全过程的最优结果。
B1
A
4+9=13
d(u1)+f2
B2
B3
f1(s1) u1*

动态规划(完整)

第七章动态规划
主要内容:
§7.1多阶段决策问题 §7.2 动态规划的基本概念和基本原理
§7.3 动态规划应用举例
例求解最短路问题
A1 2 Q 4 3 A3 A2 6 3 7 4 B1 1 4 2 4 4 1 5 6 B2 3 B3 3 3 C2 C1 3 4 T
Ⅰ
Ⅱ
Ⅲ
Ⅳ
分阶段的最短路径
• • • • • • • Ⅳ ： C1—T Ⅲ --Ⅳ : B1—C1—T Ⅱ--Ⅲ--Ⅳ ：A2—B1—C1—T Ⅰ--Ⅱ--Ⅲ --Ⅳ： Q—A2—B1—C1—T Q--A3—B1—C1—T Q--A3—B2—C2—T 3 4 7
决策为 xk 时的指标，则它就是第 k 段指标函
数，简记为vk 。（2）过程指标函数（也称目标函数）用f(sk , xk)表示第k子过程的指标函数。表
示处于第 k 段 sk 状态且所作决策为xk时，
从 sk 点到终点的距离。由此可见， f(sk , xk)
不仅跟当前状态 sk 有关，
还跟该子过程策略 pk(sk) 有关,严格说来，应
(6) 指标函数
用来衡量策略或子策略或决策的效果的某种数量指标，就称为指标函数。它是定义在全过程或各子过程或各阶段上的确定数量函数。对不同问题，指标函数可以是诸如费用、成本、产值、利润、产量、耗量、距离、时间、效用，等等。
（1）阶段指标函数（也称阶段效应）
用vk(sk , xk)表示第 k 段处于状态 sk且所作
资规划, 排序问题和生产过程的最优控制
等问题;
§7.2 动态规划的基本概念和基本思想
一、基本概念
使用动态规划方法求解决策问题首先要将问题改造成符合动态规划求解要求的形式, 要涉及以下概念: (1)阶段 (3)决策与策略 (2)状态 (4)状态转移方程

动态规划-动态规划-美国数学家贝尔曼-动态规划领域

物品
1 2 … j …n
重量（公斤/件） a1 a2 … aj … an
每件使用价值 c1 c2 … cj … cn
类似问题：工厂里的下料问题、运输中的货物装载问题、人造卫星内的物品装载问题等。
生产决策问题：企业在生产过程中，由于需求是随时间变化的，因此企业为了获得全年的最佳生产效益，就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划。
描述状态的变量称为状态变量，它可用一个数、一组数或一向量（多维情形）来描述，第k阶段的状态变量常用sk表示，通常一个阶段有若干个状态。
第k阶段的状态就是该阶段所有始点的集合，用Sk表示。在第1阶段状态变量s1是确定的，称初始状态。如引例中:
S1 A，S2 B1, B2, B3，S3 C1,C2,C3，S4 D1, D2
min
4
9
12
决策点为B3
AB3
f2
B3
3 9*
f1(A)=12说明从A到E的最短距离为12，最短路线的确定可按计算顺序反推而得。即
A→B3→C2→D2→E 上述最短路线问题的计算过程，也可借助于图
形直观的表示出来：
12 2 A4
3
11
B1
7 4
6
93
B2 2
4
96
B3
2 5
6
C1 3
多阶段决策过程特点：
（1）根据过程的特性可以将过程按空间、时间等标志分为若干个互相联系又互相区别的阶段。
（2）在每一个阶段都需要做出决策，从而使整个过程达到最好的效果。
（3）在处理各阶段决策的选取上，不仅只依赖于当前面临的状态，而且还要注意对以后的发展。即是从全局考虑解决局部（阶段）的问题。

第10章动态规划

②某些情况下，用动态规划处理不仅能定性描述分析，且可利用计算机给出求其数值解的方法。
管理运筹学
7
缺点
①没有统一的处理方法，求解时要根据问题的性质，结合多种数学技巧。因此实践经验及创造性思维将起重要的引导作用；
②“维数障碍”，当变量个数太多时，由于计算机内存和速度的限制导致问题无法解决。有些问题由于涉及的函数没有理想的性质使问题只能用动态规划描述，而不能用动态规划方法求解。
盈利工厂设备台数
0 1 2
3 4 5
甲厂
0 3 7 9 12 13
乙厂
0 5 10 11 11 11
管理运筹学
29
第一阶段：只有1个始点A，终点有B1,B2,B3,B4 。对始点和终点进行分析和讨论分别求A到B1,B2,B3,B4的最短路径问题：
表10-4
本阶段始点(状态)
A
阶段1 本阶段各终点（决策）
B1
B2
B3
B4
4+12=16 3+13=16 3+14=17 2+12=14
到E的最本阶段最优终短距离点(最优决策)
第四阶段：两个始点D1和D2，终点只有一个；
表10-1
阶段4
本阶段始点本阶段各终点（决策）到E的最短距离
（状态）
E
D1
10
10
D2
6
6
分析得知：从D1和D2到E的最短路径唯一。
本阶段最优终点（最优决策)
E E
管理运筹学
27
第三阶段：有三个始点C1，C2，C3，终点有D1，D2，对始点
和终点进行分析和讨论分别求C1，C2，C3到D1，D2 的最短路

第8章动态规划《管理运筹学》PPT课件

Vk,n (sk , uk , , sn1) fk [sk , uk ,Vk 1,n (sk 1, uk 1, , 1)] ③函数 fk (sk , uk ,Vk 1,n ) 对于变量 Vk1,n 要严格单调。
8.2 动态规划模型建立
下面以投资问题为例介绍动态规划的建模条件。
【例8-2】某公司现有资金20万元，若投资于三个
8.1 动态规划基础知识
（5）状态转移方程：状态转移方程是确定过程由一
个状态转移到另一个状态的演变过程。动态规划中某一状
态以及该状态下的决策，与下一状态之间具有一定的函数
关系，称这种函数关系的表达式为状态转移方程。如果第
k段的状态为 sk ，该阶段的决策为
的状态就可以用下式来表示：
uk
sk
，则第k+1段
阶段的指标函数，是该阶段最优的指标函数。
8.2 动态规划模型建立
建立动态规划模型，就是在分析实际问题的基础上建立该问题的动态规划基本方程。成功地应用动态规划方法的关键，在于识别问题的多阶段特征，将问题分解成为可用递推关系式联系起来的若干子问题，或者说正确地建立具体问题的基本方程，这需要经验与技巧。而正确建立基本递推关系方程的关键又在于正确选择状态变量，保证各阶段的状态变量具有递推的状态转移关系。
第8章动态规划
动态规划(DYnamic Programming，缩写为DP)方法，是本世纪50年代初期由美国数学家贝尔曼(Richard E ，Bellman)等人提出，后来逐渐发展起来的数学分支，它是一种解决多阶段决策过程最优化问题的数学规划法。动态规划的数学模型和求解方法比较灵活，对于连续的或离散的，线性的或非线性的，确定性的或随机性的模型，只要能构成多阶段决策过程，便可用动态规划方法求其最优解。因而在自然科学、社会科学、工程技术等许多领域具有广泛的用途，甚至一定程度上比线性规划（LP）、非线性规划（NLP）有成效，特别是对于某些离散型问题，解析数学无法适用，动态规划方法就成为非常有用的求解工具。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一、1050 To the Max：这是我的第一个DP，题目的意思很简单，在一个矩阵里面找它的子矩阵，使得子矩阵数值之和到达最大。

其实就是最大子段和问题在二维空间上的推广。

先说一下一维的情况吧。

设有数组a0,a1…an,找除其中连续的子段，使它们的和达到最大。

最开始的想法，是枚举矩阵的长度，计算每个子矩阵的和，然后比较得出最大值，这样要消耗的时间为O(n)。

让我们再想想，如果这个序列的每一个数都是整数，那么它们的最大子段和就是把所有的数相加。

所以我们想要尽可能多地找到正数相加。

在序列中有负数的情况下，从头开始扫描数组，把正数都相加，这其中可能会有负数，一种情况是：负数和减小子段和，但这时子段和仍然为正，用sum记录下连续子段和的最大值，继续想后扫描，因为后面有可能出现更大的正数的情况，会使和比原来没加负数之前更大；第二种情况是：加入一个负数后，是这个连续的子段和的值变成了负数，这时就要抛弃该负数以及该负数之前的所有序列，因为前面若有子段与后面构成了连续的子段，则这个子段一定会包括这个负数，而在这个负数之前的序列的和是个负数，那么这个子段的和一定不是最大的子段和。

抛弃这个负数之前的序列后，子段和从这个负数后面的第一个数算起，继续扫描。

//一维数组求最大字段int submax1(int a[], int n){int b=0;int bn=-32767;int i;int sum=0;for(i=0; i<n; i++){if(b>0){b+=a[i];}else if(a[i]>bn && a[i]<0){bn=a[i];b=a[i];}else{b=a[i];}if(b>sum){sum=b;}}if(sum==0)return bn;elsereturn sum;}其中变量b就是记录当前扫描过的子段和的，而sum记录的是子段和的最大值二维的情况：这里我使用了一个很简单的做法，在二维数组a[i][j]里面枚举第一维的长度k，然后得到一个k*n的子矩阵，把这个子矩阵的每一列数值相加，就把这个二维数组转化成了一维，再调用函数int submax1(int a[], int n)，就计算得出最大值。

总结：感觉我做这道题目还不是很像DP，只有在求一维情况下的sum记录最大值，以及在扫描是计算的子段和b，代表了某数前面连续的最大子段和。

二、1579 Function Run Fun这肯定是一个处心积虑的函数，没看出它有什么实际的用处Consider a three-parameter recursive function w(a, b, c):if a <= 0 or b <= 0 or c <= 0, then w(a, b, c) returns: 1if a > 20 or b > 20 or c > 20, then w(a, b, c) returns: w(20, 20, 20)if a < b and b < c, then w(a, b, c) returns: w(a, b, c-1) + w(a, b-1, c-1) - w(a, b-1, c)otherwise it returns: w(a-1, b, c) + w(a-1, b-1, c) + w(a-1, b, c-1) - w(a-1, b-1, c-1) 这本身就是一个递归函数，要是按照函数本身写递归式，结果肯定是TLE，这里我开了一个三维数组，从w(0,0,0)开始递推，逐步产生到w(20,20,20)的值，复杂度O(n^3) 总结：这道题是很地道的DP，因为它的子问题实在是太多了，但还是属于简单题目的范畴，就像把fabonacci函数增加到三维，限制条件多点而已，而实际上的做法都一样。

三、1080 Humman Gene Function应该说这是一道比较经典的DP，两串基因序列包含A、C、G、T，每两个字母间的匹配都会产生一个相似值，求基因序列（字符串）匹配的最大值。

感觉这题有点像求最长公共子序列。

只不过把求最大长度改成了求最大的匹配值。

用二维数组m[i][j]记录字符串a中的第i个字符与字符串b中的第j个字符匹配所产生的最大值。

若字符串a的长度为la，字符串b的长度为lb，初始时m[la][k](0<=k<=lb-1),这里即为字符串a的末尾与b中的字符匹配，因为超过了字符串a的长度，所以匹配的时候只能时以空格’-’匹配。

同理可产生m[k][lb](0<=k<=la-1)，的所有值，再以此往前递推，其状态转移方程为m[i][j]=max{map[i][j]+m[i+1][j+1],m[‘-‘][j]+m[i][j+1],m[i][‘-’]+m[i+1][j]}所以最后m[0][0]即为所求。

四、2533 Longest Ordered Subsequence很早以前就看过这题，求最大递增序列，那时刚刚晓得什么叫“动态规划”，是《算法设计与分析》（王晓东）上的一道习题，开始不会做。

后来想了一种很笨的办法，用了O(n^2)的时间，还附加了n^2的空间。

看了世铭的两种方法，一种是O(n^2),一种是O(nlogn)。

两种方法核心的方法都一样，用一个n大小的一维空间(a[n])，a[i]表示子串长度为i时所有子串最大值中的最小值，因为要找一个i长度的子串，那么a[i]的值至少要比长度为i-1子串中的一个最末位的值要大。

之所以会有两种时间复杂度的差别，就是在查找i-1长度的末尾值中的最小值的时候，前者是线性的搜索，后者是用的二分搜索，提高了时间效率。

另外说一下这题的变形吧，1631 Briging signals，是有很多路由器搭线，要求求出互不相交的搭配的最大个数。

细细分析一下题目，只要被匹配的路由器序号是一个递增的序列，则他们的连线就不会相交，就把这题转化为求最大递增序列的问题。

但需要注意的是这题的问题规模n 达到了40000，Time Limit :1000MS，所以在这里要选用刚才提到的O(nlogn)的算法，才不会导致TLE。

五、1014 Dividing实际上早就看到这题了，那时对ACM的认识还很幼稚，刚学完程序设计，学会怎么用递归，也不看题目的条件，反正就是六种marble，写了个递归的程序，测试数据当然能通过，但其结果肯定是TLE了。

又过了一段时间，有了点时间效率的观念，写了个枚举法计算总和的1/2的可达性，不过还是有很多情况我都没有考虑到，结果WA了。

到现在学DP，再来看想想这题，其实还有更好的解法。

也是计算总和的1/2(sum)的可达性，如果marble的总数是n，则DP算法的时间复杂度可以达到O(n*sum)。

用一个一维数组标记从0－sum所有加和的可达性，对于一颗宝石的价值i，数组a[j]==true，表示和为j可达，那么可得出a[i+j]=true,即i+j的值可达。

循环以致于用完所有的宝石，观察a[sum]的值，true即为这些宝石可分，反之不可分。

六、2192 Zipper又是一道字符串的动态规划题目，简述一下：给出三个字符串，s1,s2,s3，s3的长度为s1与s2长度之和，判断s1，s2是否为s3的不重合的公共子序列。

其实就是判别公共之序列的升级版，把原来的一对一，改成了一对二。

我用一个二维数组mark[i][j]记录s1中的第i个字符以及s2中的第j个字符能否与s3[i+j]想匹配。

If(s1[i]==s3[i+j]) mark[i+1][j]=true;//s1中的第i个字符匹配，则s1串向后移一个字符If(s2[j]==s3[i+j]) mark[i][j+1]=true;//s2中的第j个字符匹配，则s2串向后移一个字符这样用O(n^2)的时间，递推能产生mark[c1][c2]的值，值为true输出即能够全部匹配。

七、2576 Tug of War我觉得非常有必要做的一道题目。

这道题目看似很简单，实质就是n个数，将其分成两堆，两堆数量的差距不超过1，并且使这两堆数字之和最接近。

是一道动态规划题目，看起来简单是因为受了1014题的影响，但这题两堆的数目是确定的，一堆是n/2个，另一堆则是n-n/2个,而1014题是不受加和数目的影响的。

这题也不同与多米勒骨牌那题，因为那题中各个数字之间是一一对应的。

苦想了一天没有结果，看来这题还要寻求其它的方法。

这题不是我自己想除来的，看了alpc02的代码，自己又照自己的理解重写了一遍。

记录状态是用一个二维数组，mark[i][j]表示i个数相加，其值能否达到j，如果能mark[i][j]的为true。

对于一个输入的数w，修改i个数的每一种状态，其状态转移方程：If(m[i][j]) then m[i][j+w]=true;//j+w的值可由j的值加得由后往前修改每一个i下的可达值。

那么最后就只要再n/2行中找出m[n/2][j]的最大值（j<=total/2），这就是两堆之和最接近的一组数值。

八、2441 Arrange the Bulls这题里我看到了动态规划的一种新的方法。

每头牛有自己喜欢的篮球场，我们的任务就是安排这些牛到它们喜欢的篮球场去，然后计算所有合理的解的数量（篮球场的数目最多20个）。

显然，要找到一个解，很容易就能搜出，但是要求所有解的数量，如果再用搜索的方法，在时间上是不堪忍受的。

这里用了一种新的方法（对于我来说是一种新方法^_^）。

用二进制数记录当前篮球场使用的状态，“1”表示未分配，“0”表示已分配，每个篮球场与每个数位相对应。

所以20个篮球场就总共需要一个1<<20的数组来记录所有生成的状态。

想到这里，我觉得这题基本上已经解决一半了，剩下的就是如何进行状态转移，用的就是二进制运算。

我觉得我在这个方面一点都不熟悉，不会写，看了别人的代码，然后自己仿写了。

一种是用滚动数组，这种方法占用时间空间都较大，另一种是状态压缩的DP，方法比较巧妙。

呵呵，要讲得更深点，等我变成牛人在续吧……九、2738 Two Ends有点想博弈的题目，我事用dp来做的。

有一组数，两个人分别轮流从数组两头取数，第一个取数的人可以选用任意的策略，第二个人则要一直使用贪心策略。

问最后第一个人所取得的数字之和比第二个人取得的数字之和最多多多少。

很容易想到DP，第二个人的取数规则是一定的，只有第一个个人可以选择，那么在第一个人取数的时候就有状态转移方程，dp[i][j]表示前面是第i个数后面是第j个数的时候第一个人所能得到数字和的最大值。

if(dp[i][j]+a[i]>dp[i+1][j])dp[i+1][j]=dp[i][j]+a[i]; //取前面的数if(dp[i][j]+a[j]>dp[i][j-1])dp[i][j-1]=dp[i][j]+a[j]; //取后面的数那么第二个人的状态转移就相对比较好确定了：if(a[i]<a[j] && dp[i][j]!=-1 && dp[i][j]>dp[i][j-1])dp[i][j-1]=dp[i][j];if(a[i]>=a[j] && dp[i][j]!=-1 && dp[i][j]>dp[i+1][j])dp[i+1][j]=dp[i][j];最后一步只需比较dp[i][i]的值，选其中最大的出来就行了^_^十、2411 Mondriaan's Dream一道状态压缩的DP题。

动态规划

合集下载

动态规划

动态规划

第6章动态规划

动态规划.pdf

动态规划

第6章-动态规划

动态规划(完整)

动态规划-动态规划-美国数学家贝尔曼-动态规划领域

第10章动态规划

第8章动态规划《管理运筹学》PPT课件

文档推荐

最新文档

动态规划

合集下载

动态规划

动态规划

第6章动态规划

动态规划.pdf

动态规划

第6章-动态规划

动态规划(完整)

动态规划-动态规划-美国数学家贝尔曼-动态规划领域

第10章 动态规划

第8章 动态规划《管理运筹学》PPT课件

文档推荐

最新文档

第10章动态规划

第8章动态规划《管理运筹学》PPT课件