NOI导刊_坐标规则型动态规划
- 格式:ppt
- 大小:224.00 KB
- 文档页数:25
动态规划在信息学奥林匹克竞赛中的应用一.动态规划含义:在现实生活中,有一类活动的过程,由于它的特殊性,可将过程分成若干个互相联系的阶段,在它的每一阶段都要做出决策,从而使整个过程达到最好的活动效果.因此,各个阶段决策确定后,组成一个决策序列,因而也就确定了整个过程的一条活动路线.这种把一个问题看作是一个前后关联具有链状结构的多阶段过程,就称为多阶段决策过程,这种问题称为多阶段决策问题.在多阶段决策问题中,各个阶段采取的决策,一般来说是和时间有关的,决策依赖于当前状态,又随即引起状态的转移,一个决策序列就是在变化的状态中产生出来的,故有"动态"的含义,我们称这种解决多阶段决策最优化的过程为动态规划.二.动态规划特征动态规划的显著特征是:无后效性,有边界条件,且一般划分为很明显的阶段.动态规划一般还存在一条或多条状态转移方程.三.例题1. Catcher防卫导弹(GDOI'98)题目讲得很麻烦,归根结底就是求一整串数中的最长不上升序列这道题目一开始我使用回溯算法,大概可以拿到1/3的分吧,后来发现这其实是动态规划算法中最基础的题目,用一个二维数组C[1..Max,1..2]来建立动态规划状态转移方程(注:C[1..Max,1]表示当前状态最多可击落的导弹数,C[1..Max,2]表示当前状态的前继标志):Ci=Max{C[j]+1,(j=i+1..n)},然后程序也就不难实现了.示范程序:program catcher_hh;varf:text;i,j,k,max,n,num:integer;a:array [1..4000] of integer; {导弹高度数组}c:array [1..4000,1..2] of integer; {动态规划数组}procedure readfile;beginassign(f,'catcher.dat'); reset(f);readln(f,num);for i:=1 to num doreadln(f,a[i]);end;procedure work;beginfillchar(c,sizeof(c),0); c[num,1]:=1; {清空数组,赋初值}{开始进行动态规划}for i:=num-1 downto 1 dobeginn:=0; max:=1;for j:=i+1 to num doif (a[i]>a[j]) and (max<1+c[j,1])then begin n:=j; max:=1+c[j,1]; end;c[i,1]:=max; c[i,2]:=n;end;writeln; writeln('Max : ',max); {打印最大值}max:=0; n:=0;for i:=1 to num doif c[i,1]>max then begin max:=c[i,1]; n:=i; end;{返回寻找路径}repeatwriteln(n,' '); n:=c[n,2];until n=0;end;beginreadfile; work;end.2. Perform巡回演出(GDKOI'2000)题目描述:Flute市的Phlharmoniker乐团2000年准备到Harp市做一次大型演出,本着普及古典音乐的目的,乐团指挥L.Y.M准备在到达Harp市之前先在周围一些小城市作一段时间的巡回演出,此后的几天里,音乐家们将每天搭乘一个航班从一个城市飞到另一个城市,最后才到达目的地Harp市(乐团可多次在同一城市演出).由于航线的费用和班次每天都在变,城市和城市之间都有一份循环的航班表,每一时间,每一方向,航班表循环的周期都可能不同.现要求寻找一张花费费用最小的演出表.输入:输入文件包括若干个场景.每个场景的描述由一对整数n(2<=n<=10)和k(1<=k<=1000)开始,音乐家们要在这n个城市作巡回演出,城市用1..n标号,其中1是起点Flute市,n是终点Harp市,接下来有n*(n-1)份航班表,一份航班表一行,描述每对城市之间的航线和价格,第一组n-1份航班表对应从城市1到其他城市(2,3,...n)的航班,接下的n-1行是从城市2到其他城市(1,3,4...n)的航班,如此下去.每份航班又一个整数d(1<=d<=30)开始,表示航班表循环的周期,接下来的d个非负整数表示1,2...d天对应的两个城市的航班的价格,价格为零表示那天两个城市之间没有航班.例如"3 75 0 80"表示第一天机票价格是75KOI,第二天没有航班,第三天的机票是80KOI,然后循环:第四天又是75KOI,第五天没有航班,如此循环.输入文件由n=k=0的场景结束.输出:对每个场景如果乐团可能从城市1出发,每天都要飞往另一个城市,最后(经过k天)抵达城市n,则输出这k个航班价格之和的最小值.如果不可能存在这样的巡回演出路线,输出0.样例输入:3 62 130 1503 75 0 807 120 110 0 100 110 120 04 60 70 60 503 0 135 1402 70 802 0 701 800 0样例输出:460初看这道题,很容易便可以想到动态规划,因为第x天在第y个地方的最优值只与第x-1天有关,符合动态规划的无后效性原则,即只与上一个状态相关联,而某一天x航班价格不难求出S=C[(x-1) mod m +1].我们用天数和地点来规划用一个数组A[1..1000,1..10]来存储,A[i,j]表示第i天到达第j个城市的最优值,C[i,j,l]表示i城市与j城市间第l天航班价格,则A[i,j]=Min{A[i-1,l]+C[l,j,i] (l=1..n且C[l,j,i]<>0)},动态规划方程一出,尽可以放怀大笑了.示范程序:program perform_hh;varf,fout:text;p,l,i,j,n,k:integer;a:array [1..1000,1..10] of integer; {动态规划数组}c:array [1..10,1..10] of record {航班价格数组}num:integer;t:array [1..30] of integer;end;e:array [1..1000] of integer;procedure work;begin{人工赋第一天各城市最优值}for i:=1 to n dobeginif c[1,i].t[1]<>0then a[1,i]:=c[1,i].t[1];end;for i:=2 to k dobeginfor j:=1 to n dobeginfor l:=1 to n dobeginif (j<>l)and (c[l,j].t[(i-1) mod c[l,j].num+1]<>0) {判断存在航班}and ((a[i,j]=0) or (a[i-1,l]+c[l,j].t[(i-1) mod c[l,j].num+1]<a[i,j])) {判断比当前解优}then a[i,j]:=a[i-1,l]+c[l,j].t[(i-1) mod c[l,j].num+1]; {赋值}end;end;e[p]:=a[k,n]; {第p个场景的最优值}end;procedure readfile; {读文件}beginassign(f,'PERFORM.DA T'); reset(f);assign(fout,'PERFORM.OUT'); rewrite(fout);readln(f,n,k); p:=0;while (n<>0) and (k<>0) dobeginp:=p+1;fillchar(c,sizeof(c),0);fillchar(a,sizeof(a),0);for i:=1 to n dobeginfor j:=1 to i-1 dobeginread(f,c[i,j].num);for l:=1 to c[i,j].num doread(f,c[i,j].t[l]);end;for j:=i+1 to n dobeginread(f,c[i,j].num);for l:=1 to c[i,j].num doread(f,c[i,j].t[l]);end;end;work;readln(f,n,k);end;{输出各个场景的解}for i:=1 to p-1 dowriteln(fout,e[i]);write(fout,e[p]);close(f);close(fout);end;beginreadfile;end.四.小结动态规划与穷举法相比,大大减少了计算量,丰富了计算结果,不仅求出了当前状态到目标状态的最优值,而且同时求出了到中间状态的最优值,这对于很多实际问题来说是很有用的.这几年,动态规划已在各省市信息学奥林匹克竞赛中占据相当重要的地位,每年省赛8道题目中一般有2~3道题目属于动态规划,动态规划相比一般穷举也存在一定缺点:空间占据过多,但对于空间需求量不大的题目来说,动态规划无疑是最佳方法!五.课后题目1. m个人抄n本书,每本书页数已知,每个人(第一个人除外)都必须从上一个人抄的最后一本书的下一本抄起(书必须整本整本的抄),求一种分配方法,使抄书页数最多的人抄书页数尽可能少. (GDOI''99 Books).2. 有一字符串有多种编码方式可供人选择,将这个字符串进行编码,使求得得编码长度最短。
坐标规则型动态规划1.机器人有一个机器人,每次可以向右或向下走,有些垃圾等待它清扫2.矩阵取数游戏对于一个给定的n*m的矩阵,矩阵中的每个元素Aij为非负整数。
游戏规则如下:1. 每次取数时须从每行各取走一个元素,共n个。
m次后取完矩阵所有的元素;2. 每次取走的各个元素只能是该元素所在行的行首或行尾;3. 每次取数都有一个得分值,为每行取数的得分之和;每行取数的得分= 被取走的元素值*2i,其中i表示第i次取数(从1开始编号);4. 游戏结束总得分为m次取数得分之和。
求出取数后的最大得分。
N行求值可以独立进行F[I,j]:=max{f[i+1,j]+w*a[i],f[I,j-1]+w*a[j]}W:=w*2;最终求出max{f[I,j]+w*a[i]},i=1..m传纸条 双向动归F 表示纸条1到i1,j1位置,纸条2到i2,j2位置时的最优值。
优化:F 表示1到了i ,k-i 位置,2到了j ,k-j 位置时的最优值,k 表示步数。
免费馅饼• SERKOI 最新推出了一种叫做“免费馅饼”的游戏。
• 游戏在一个舞台上进行。
舞台的宽度为W 格,天幕的高度为H 格,游戏者占一格。
开始时,游戏者站在舞台的正中央,手里拿着一个托盘。
• 游戏开始后,从舞台天幕顶端的格子中不断出现馅饼并垂直下落。
游戏者左右移动去接馅饼。
游戏者每秒可以向左或右移动一格或两格,也可以站在愿地不动。
],[],[)1,,1,()1,,,1(),1,1,(),1,,1(max ),,,(221122112211221122112211j i C j i C j i j i f j i j i f j i j i f j i j i f j i j i f ++⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧--------=],[],[)1,1,1()1,,1(),1,1(),,1(max ),,(22112121212121i k i C i k i C i i k f i i k f i i k f i i k f i i k f -+-+⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧--------=• 馅饼有很多种,游戏者事先根据自己的口味,对各种馅饼依次打了分。