2013年4月10日_动态规划思考题
- 格式:pdf
- 大小:310.69 KB
- 文档页数:8
什么是动态规划算法,常见的动态规划问题分析与求解理解动态规划动态规划中递推式的求解⽅法不是动态规划的本质。
我曾经给学校参加NOIP的同学多次讲过动态规划,我试着讲⼀下我理解的动态规划,争取深⼊浅出。
希望你看了我的答案,能够喜欢上动态规划。
0. 动态规划的本质,是对问题状态的定义和状态转移⽅程的定义。
引⾃维基百科dynamic programming is a method for solving a complex problem by breaking it down into a collection of simpler subproblems.动态规划是通过拆分问题,定义问题状态和状态之间的关系,使得问题能够以递推(或者说分治)的⽅式去解决。
本题下的其他答案,⼤多都是在说递推的求解⽅法,但如何拆分问题,才是动态规划的核⼼。
⽽拆分问题,靠的就是状态的定义和状态转移⽅程的定义。
1. 什么是状态的定义?⾸先想说⼤家千万不要被下⾯的数学式吓到,这⾥只涉及到了函数相关的知识。
我们先来看⼀个动态规划的教学必备题:给定⼀个数列,长度为N,求这个数列的最长上升(递增)⼦数列(LIS)的长度.以 1 7 2 8 3 4 为例。
这个数列的最长递增⼦数列是 1 2 3 4,长度为4;次长的长度为3,包括 1 7 8; 1 2 3 等.要解决这个问题,我们⾸先要定义这个问题和这个问题的⼦问题。
有⼈可能会问了,题⽬都已经在这了,我们还需定义这个问题吗?需要,原因就是这个问题在字⾯上看,找不出⼦问题,⽽没有⼦问题,这个题⽬就没办法解决。
所以我们来重新定义这个问题:给定⼀个数列,长度为N,设为:以数列中第k项结尾的最长递增⼦序列的长度.求中的最⼤值.显然,这个新问题与原问题等价。
⽽对于来讲,都是的⼦问题:因为以第k项结尾的最长递增⼦序列(下称LIS),包含着以第中某项结尾的LIS。
上述的新问题也可以叫做状态,定义中的“为数列中第k项结尾的LIS的长度”,就叫做对状态的定义。
动态规划练习题USACO 2.2 Subset Sums题目如下:对于从1到N的连续整集合合,能划分成两个子集合,且保证每个集合的数字和是相等的。
举个例子,如果N=3,对于{1,2,3}能划分成两个子集合,他们每个的所有数字和是相等的:and {1,2}这是唯一一种分发(交换集合位置被认为是同一种划分方案,因此不会增加划分方案总数)如果N=7,有四种方法能划分集合{1,2,3,4,5,6,7},每一种分发的子集合各数字和是相等的:{1,6,7} and {2,3,4,5} {注1+6+7=2+3+4+5}{2,5,7} and {1,3,4,6}{3,4,7} and {1,2,5,6}{1,2,4,7} and {3,5,6}给出N,你的程序应该输出划分方案总数,如果不存在这样的划分方案,则输出0。
程序不能预存结果直接输出。
PROGRAM NAME: subsetINPUT FORMAT输入文件只有一行,且只有一个整数NSAMPLE INPUT (file subset.in)7OUTPUT FORMAT输出划分方案总数,如果不存在则输出0。
SAMPLE OUTPUT (file subset.out)4参考程序如下:#include <fstream>using namespace std;const unsigned int MAX_SUM = 1024;int n;unsigned long long int dyn[MAX_SUM];ifstream fin ("subset.in");ofstream fout ("subset.out");int main() {fin >> n;fin.close();int s = n*(n+1);if (s % 4) {fout << 0 << endl;fout.close ();return ;}s /= 4;int i, j;dyn [0] = 1;for (i = 1; i <= n; i++)for (j = s; j >= i; j--)dyn[j] += dyn[j-i];fout << (dyn[s]/2) << endl;fout.close();return 0;}USACO 2.3 Longest Prefix题目如下:在生物学中,一些生物的结构是用包含其要素的大写字母序列来表示的。
动态规划讲解大全含例题及答案动态规划讲解大全动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。
20世纪50年代初美国数学家R.E.Bellman等人在研究多阶段决策过程(multistep decision process)的优化问题时,提出了著名的最优化原理(principle of optimality),把多阶段过程转化为一系列单阶段问题,逐个求解,创立了解决这类过程优化问题的新方法——动态规划。
1957年出版了他的名著Dynamic Programming,这是该领域的第一本著作。
动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。
例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。
虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间因素,把它视为多阶段决策过程,也可以用动态规划方法方便地求解。
动态规划程序设计是对解最优化问题的一种途径、一种方法,而不是一种特殊算法。
不象前面所述的那些搜索或数值计算那样,具有一个标准的数学表达式和明确清晰的解题方法。
动态规划程序设计往往是针对一种最优化问题,由于各种问题的性质不同,确定最优解的条件也互不相同,因而动态规划的设计方法对不同的问题,有各具特色的解题方法,而不存在一种万能的动态规划算法,可以解决各类最优化问题。
因此读者在学习时,除了要对基本概念和方法正确理解外,必须具体问题具体分析处理,以丰富的想象力去建立模型,用创造性的技巧去求解。
我们也可以通过对若干有代表性的问题的动态规划算法进行分析、讨论,逐渐学会并掌握这一设计方法。
基本模型多阶段决策过程的最优化问题。
在现实生活中,有一类活动的过程,由于它的特殊性,可将过程分成若干个互相联系的阶段,在它的每一阶段都需要作出决策,从而使整个过程达到最好的活动效果。
C++中的动态规划算法及常见题⽬汇总什么是动态规划在⾯试过程中如果是求⼀个问题的最优解(通常是最⼤值或者最⼩值),并且该问题能够分解成若⼲个⼦问题,并且⼦问题之间好友重叠的更⼩⼦问题,就可以考虑⽤动态规划来解决这个问题。
动态规划的分类 ⼤多数动态规划问题都可以被归类成两种类型:优化问题和组合问题优化问题 优化问题就是我们常见的求⼀个问题最优解(最⼤值或者最⼩值)组合问题 组合问题是希望你弄清楚做某事的数量或者某些事件发⽣的概率两种不同动态规划解决⽅案⾃上⽽下:即从顶端不断地分解问题,知道你看到的问题已经分解到最⼩并已得到解决,之后只⽤返回保存的答案即可⾃下⽽上:你可以直接开始解决较⼩的⼦问题,从⽽获得最⼩的解决⽅案。
在此过程中,你需要保证在解决问题之前先解决⼦问题。
这种⽅法叫做表格填充法。
常见的动态规划例⼦1.2.3.4.5.6.7.8.9.10.11. 猜数字⼤⼩ 1. 裴波那契数列 裴波那契数列就是典型的组合问题,要求出做某事的数量或者概率问题分析:对于题⽬中的青蛙爬楼梯问题,初试情况下是只有⼀级台阶时,只有⼀种跳法,只有两级台阶时,有两种跳法,当有n级台阶时,设n级台阶的跳法总数是f(n),如果第⼀步跳⼀级台阶,则和剩下的n-1级台阶的跳法是⼀样的,如果第⼀级跳两级台阶,则和剩下的n-2级台阶的跳法是⼀样的,因此最终n级台阶的跳法是f(n)=f(n-1)+f(n-2),即其是可以被分解为更⼩的⼦问题的,下⾯我们以求解f(10)为例来分析递归的过程 我们从这张图中不难发现,在这棵树中有很多节点都是重复的,⽽且重复节点会随着n的增⼤⽽急剧增⼤,因此我们采⽤⾃顶向下的⽅式会有很低的效率,因此我们采⽤⾃下⽽上的⽅法,⾸先根据f(1)和f(2)计算出f(3),再根据f(2)和f(3计算出f(4),以此类推求出f(n) 实现的代码如下1int jumpFloor(int number) {2if(number<0)3return0;4else if(number==0||number==1||number==2)5return number;6else7 {8int result=0;9int f1=1;10int f2=2;11for(int i=3;i<=number;++i)12 {13 result=f1+f2;14 f1=f2;15 f2=result;16 }17return f2;18 }19 }矩形覆盖问题问题分析:由于2*1的⼩矩形可以横着放,也可以竖着放,当n=1时,其只有⼀种⽅式,f(1)=1,n=2时,有两种覆盖⽅式f(2)=2如图 当要构成2*n的⼤矩形时,如果第⼀个⼩矩形竖着放,则其和后⾯n-1个⼩矩形的⽅法相等,如果第⼀个⼩矩形横着放,则第⼆个⼩矩形也只能横着放,即上图右边的⽅法,因此其和后⾯n-2个⼩矩形的放法相等。
动态规划思想:⽯⼦合并问题描述:在⼀个圆形操场的四周摆放着n 堆⽯⼦。
现要将⽯⼦有次序地合并成⼀堆。
规定每次只能选相邻的2 堆⽯⼦合并成新的⼀堆,并将新的⼀堆⽯⼦数记为该次合并的得分。
试设计⼀个算法,计算出将n堆⽯⼦合并成⼀堆的最⼩得分和最⼤得分。
开始以为通过贪⼼算法可能很快解决问题,可是是⾏不通的。
⾸先我们可以把这么堆⽯⼦看成⼀列我们假如5堆的⽯⼦,其中⽯⼦数分别为7,6,5,7,100•按照贪⼼法,合并的过程如下:每次合并得分第⼀次合并 7 6 5 7 100 =11 第⼆次合并 7 11 7 100=18 第三次合并 18 7 100 =25第四次合并 25 100 =125总得分=11+18+25+125=179•另⼀种合并⽅案每次合并得分 第⼀次合并 7 6 5 7 100 ->13第⼆次合并 13 5 7 100->12第三次合并 13 12 100 ->25第四次合并 25 100 ->125总得分=13+12+25+125=175显然利⽤贪⼼来做是错误的,贪⼼算法在⼦过程中得出的解只是局部最优,⽽不能保证使得全局的值最优。
如果N-1次合并的全局最优解包含了每⼀次合并的⼦问题的最优解,那么经这样的N-1次合并后的得分总和必然是最优的。
因此我们需要通过动态规划算法来求出最优解。
在此我们假设有n堆⽯⼦,⼀字排开,合并相邻两堆的⽯⼦,每合并两堆⽯⼦得到⼀个分数,最终合并后总分数最少的。
我们设m(i,j)定义为第i堆⽯⼦到第j堆⽯⼦合并后的最少总分数。
a(i)为第i堆⽯⼦得⽯⼦数量。
当合并的⽯⼦堆为1堆时,很明显m(i,i)的分数为0; 当合并的⽯⼦堆为2堆时,m(i,i+1)的分数为a(i)+a(i+1); 当合并的⽯⼦堆为3堆时,m(i,i+2)的分数为MIN((m(i,i)+m(i+1,i+2)+sum(i,i+2)),(m(i,i+1)+m(i+2,i+2)+sum(i,i+2)); 当合并的⽯⼦堆为4堆时......代码实现如下:1 #include<stdio.h>2#define N 1003/*4 *求合并过程中5 *最少合并堆数⽬6 **/7int MatrixChain_min(int p[N],int n)8 {9//定义⼆维数组m[i][j]来记录i到j的合并过成中最少⽯⼦数⽬10 //此处赋值为-11112int m[N][N];13for(int x=1;x<=n;x++)14for(int z=1;z<=n;z++)15 {16 m[x][z]=-1;17 }1819int min=0;2021//当⼀个单独合并时,m[i][i]设为0,表⽰没有⽯⼦22for(int g = 1;g<=n;g++) m[g][g]=0;2324//当相邻的两堆⽯⼦合并时,此时的m很容易可以看出是两者之和25for(int i=1;i<=n-1;i++)26 {27int j=i+1;28 m[i][j]=p[i]+p[j];29 }3031//当相邻的3堆以及到最后的n堆时,执⾏以下循环32for(int r=3; r<=n;r++)33for(int i=1;i<=n-r+1;i++)34 {35int j = i+r-1; //j总是距离i r-1的距离36int sum=0;37//当i到j堆⽯⼦合并时最后⾥⾯的⽯⼦数求和得sum38for(int b=i;b<=j;b++)39 sum+=p[b];4041// 此时m[i][j]为i~j堆⽯⼦间以m[i][i]+m[i+1][j]+sum结果,这是其中⼀种可能,不⼀定是最优42 //要与下⾯的情况相⽐较,唉,太详细了4344 m[i][j] = m[i+1][j]+sum;4546//除上⾯⼀种组合情况外的其他组合情况47for(int k=i+1;k<j;k++)48 {49int t=m[i][k]+m[k+1][j]+sum;50if(t<m[i][j])51 m[i][j] = t;5253 }54 }55//最终得到最优解56 min=m[1][n];57return min;585960 }6162/*63 *求合并过程中64 *最多合并堆数⽬65 **/6667int MatrixChain_max(int p[N],int n)68 {69int m[N][N];70for(int x=1;x<=n;x++)71for(int z=1;z<=n;z++)72 {73 m[x][z]=-1;74 }757677int max=0;78//⼀个独⾃组合时79for(int g = 1;g<=n;g++) m[g][g]=0;80//两个两两组合时81for(int i=1;i<=n-1;i++)82 {83int j=i+1;84 m[i][j]=p[i]+p[j];85 }8687for(int r=3; r<=n;r++)88for(int i=1;i<=n-r+1;i++)89 {90int j = i+r-1;91int sum=0;92for(int b=i;b<=j;b++)93 sum+=p[b];94 m[i][j] = m[i+1][j]+sum;9596for(int k=i+1;k<j;k++)97 {98int t=m[i][k]+m[k+1][j]+sum;99if(t>m[i][j])100 m[i][j] = t;101102 }103 }104105 max=m[1][n];106return max;107108109 }110int main()111 {112int stone[N];113int min=0;114int max=0;115int n;116 scanf("%d",&n);117for(int i=1;i<=n;i++)118 scanf("%d",&stone[i]);119120 min= MatrixChain_min(stone,n);121 max= MatrixChain_max(stone,n);122123//因为题⽬要求圆的原因,要把所有情况都要考虑到,总共有n种情况。
第1篇一、实验目的本次实验旨在让学生理解动态规划算法的基本概念,掌握动态规划解决问题的基本思想和步骤,并能运用动态规划算法解决实际问题。
通过实验,学生应能够:1. 理解动态规划算法的概念及其应用领域。
2. 掌握动态规划的基本思想和解决问题的基本步骤。
3. 学习动态规划算法设计策略,并能够运用到实际问题中。
4. 通过实际编程,提高编程能力和问题解决能力。
二、实验环境1. 操作系统:Windows 102. 编程语言:Python3.83. 开发环境:PyCharm三、实验内容本次实验选择了三个典型的动态规划问题进行实践:1. 最长公共子序列问题2. 矩阵连乘问题3. 剪绳子问题四、实验步骤1. 最长公共子序列问题(1)问题描述:给定两个序列X和Y,找出X和Y的最长公共子序列。
(2)算法设计:- 使用二维数组dp[i][j]表示X的前i个字符和Y的前j个字符的最长公共子序列的长度。
- 初始化dp[0][j] = 0和dp[i][0] = 0。
- 对于i > 0和j > 0,如果X[i-1] == Y[j-1],则dp[i][j] = dp[i-1][j-1] + 1;否则,dp[i][j] = max(dp[i-1][j], dp[i][j-1])。
(3)代码实现:```pythondef longest_common_subsequence(X, Y):m, n = len(X), len(Y)dp = [[0] (n + 1) for _ in range(m + 1)]for i in range(1, m + 1):for j in range(1, n + 1):if X[i - 1] == Y[j - 1]:dp[i][j] = dp[i - 1][j - 1] + 1else:dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])return dp[m][n]```2. 矩阵连乘问题(1)问题描述:给定n个矩阵A1, A2, ..., An,其中Ai与Ai-1是可乘的,i = 1, 2, ..., n-1。
动态规划动态规划是运筹学的一个分支,它是解决多阶段决策过程最优化问题的一种方法。
该方法是由美国数学家贝尔曼(R.Bellman)等人在本世纪50年代初提出的。
他们针对多阶段决策问题的特点,提出了解决这类问题的“最优化原理”,并成功地解决了生产管理、工程技术等方面的许多实际问题,从而建立了运筹学的一个新分支——动态规划。
他的名著《动态规划》于1957年出版,该书是动态规划的第一本著作。
动态规划是现代企业管理中的一种重要决策方法,在工程技术、经济管理、工农业生产及军事及其它部们都有广泛的应用,并且获得了显著的效果。
动态规划可用于解决最优路径问题、资源分配问题、生产计划与库存问题、投资分配问题、装载问题、设备更新与维修问题、排序问题及生产过程的最优控制等。
由于它所具有独特的解题思路,在处理某些优化问题时,常常比线性规划或非线性规划方法更有效。
第一节动态规划的基本方法多阶段决策的实际问题很多,下面通过具体例子,说明什么是动态规划模型及其求解方法。
例1:最短路线问题某工厂需要把一批货物从城市A运到城市E,中间可经过B1 、B2、B3、C1、C2、C3、D1、D2等城市,各城市之间的交通线和距离如下图所示,问应该选择一条什么路线,使得从A到E的距离最短?下面引进几个动态规划的基本概念和相关符号。
(1)阶段(Stage)把所给问题的过程,按时间和空间特征划分成若干个相互联系的阶段,以便按次序去求每个阶段的解,阶段总数一般用字母n表示,用字母k表示阶段变量。
如例l中 (最短路线问题)可看作是n=4阶段的动态规划问题,k=2表示处于第二阶段。
(2)状态(State)状态表示每个阶段开始时系统所处的自然状况或客观条件,它描述了研究问题过程状况。
描述各阶段状态的变量称为状态变量,常用字母sk表示第k阶段的状态变量,状态变量的取值范围称为状态集,用Sk表示。
如例l中,第一阶段的状态为A(即出发位置)。
第二阶段有三个状态:B1 、B2、B3,状态变量s2=B2表示第2阶段系统所处的位置是B2。
常见的动态规划问题分析与求解 转载⾃:动态规划(Dynamic Programming,简称DP),虽然抽象后进⾏求解的思路并不复杂,但具体的形式千差万别,找出问题的⼦结构以及通过⼦结构重新构造最优解的过程很难统⼀,并不像回溯法具有解决绝⼤多数问题的框架()。
为了解决动态规划问题,只能靠多练习、多思考了。
本⽂主要是对⼀些常见的动态规划题⽬的收集,希望能有所帮助。
难度评级受个⼈主观影响较⼤,仅供参考。
⽬录(点击跳转)动态规划求解的⼀般思路: 判断问题的⼦结构(也可看作状态),当具有最优⼦结构时,动态规划可能适⽤。
求解重叠⼦问题。
⼀个递归算法不断地调⽤同⼀问题,递归可以转化为查表从⽽利⽤⼦问题的解。
分治法则不同,每次递归都产⽣新的问题。
重新构造⼀个最优解。
备忘录法: 动态规划的⼀种变形,使⽤⾃顶向下的策略,更像递归算法。
初始化时表中填⼊⼀个特殊值表⽰待填⼊,当递归算法第⼀次遇到⼀个⼦问题时,计算并填表;以后每次遇到时只需返回以前填⼊的值。
实例可以参照矩阵链乘法部分。
1.硬币找零难度评级:★ 假设有⼏种硬币,如1、3、5,并且数量⽆限。
请找出能够组成某个数⽬的找零所使⽤最少的硬币数。
解法: ⽤待找零的数值k描述⼦结构/状态,记作sum[k],其值为所需的最⼩硬币数。
对于不同的硬币⾯值coin[0...n],有sum[k] = min(sum[k-coin[0]] , sum[k-coin[1]], ...)+1。
对应于给定数⽬的找零total,需要求解sum[total]的值。
typedef struct {int nCoin; //使⽤硬币数量//以下两个成员是为了便于构造出求解过程的展⽰int lastSum;//上⼀个状态int addCoin;//从上⼀个状态达到当前状态所⽤的硬币种类} state;state *sum = malloc(sizeof(state)*(total+1));//initfor(i=0;i<=total;i++)sum[i].nCoin = INF;sum[0].nCoin = 0;sum[0].lastSum = 0;for(i=1;i<=total;i++)for(j=0;j<n;j++)if(i-coin[j]>=0 && sum[i-coin[j]].nCoin+1<sum[i].nCoin){sum[i].nCoin = sum[i-coin[j]].nCoin+1;sum[i].lastSum = j;sum[i].addCoin = coin[j];}if(sum[total].nCoin == INF){printf("can't make change.\n");return 0;}else//output ; 通过sum[total].lastSum和sum[total].addCoin,很容易通过循环逆序地或者编写递归调⽤的函数正序地输出从结束状态到开始状态使⽤的硬币种类。
动态规划算法动态规划算法基本思想:1、将待求解问题分阶段处理2、每个阶段有若干个状态S3、通过决策X将目前的状态S转到下一个状态S4、从目前的状态到如何到终点与如何到此状态无关5、从最后一阶段往前递推6、找到递推公式,对于最短路径问题:=Min{ }= Min{ +}【最短路径问题】如图所示,节点间的路长已标出,求A至E点的最短路径。
解决方法:将问题分4个阶段,自低向上讨论。
当k=4(阶段4)只考虑从本阶段到终点E的路径选择。
在这一阶段有两个状态:D1和D2,D1:目前已到达D1,要从D1到E;D2:目前已到达D2,要从D2到E:在阶段4,从当前状态到达终点的决策(应选择哪一个点到达终点路径最短):阶段4 从当前状态到达终点的最短距离k=3k=2或或k=1或所以,110为从A到E的最短路径值。
【0-1背包问题】一个旅行者有一个最多能用M公斤的背包,现在有N件物品,它们的重量分别是W1,W2,...,Wn,它们的价值分别为P1,P2,...,Pn.若每种物品只有一件求旅行者能获得最大总价值。
测试数据:10 33 44 55 6(表示M=10,N=3,W1=3,P1=4,w2=4,P2=5,W3=5,P3=6)分析:阶段:在前i件物品中,选取若干件物品放入背包中;状态:在前i件物品中,选取若干件物品放入所剩空间为W的背包中的所能获得的最大价值;决策:第i件物品放或者不放;递推公式:c(i,j)=max{c(i-1,j), c(i-1,j-w[i])+vl(i)}i :处理到第i件物品j:剩余的空间为jc(i,j):在前i件物品中选取若干件放到背包的最大价值c(i-1,j):第i件物品不放所能得到的价值c(i-1,j-w[i])+vl(i):第i件物品放入所能得到的价值所以,获得的最大总价值是11。
【0-1完全背包问题】一个旅行者有一个最多能用M公斤的背包,现在有N种物品,它们的重量分别是W1,W2,...,Wn,它们的价值分别为P1,P2,...,Pn.若每种物品有无限件,求旅行者能获得最大总价值。