当前位置:文档之家› 第04章 动态规划

第04章 动态规划

第04章  动态规划
第04章  动态规划

第四章动态规划

§1 引言

1.1 动态规划的发展及研究内容

动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。20世纪50年代初R. E. Bellman等人在研究多阶段决策过程(multistep decision process)的优化问题时,提出了著名的最优性原理(principle of optimality),把多阶段过程转化为一系列单阶段问题,逐个求解,创立了解决这类过程优化问题的新方法—动态规划。1957年出版了他的名著《Dynamic Programming》,这是该领域的第一本著作。

动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。

虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间因素,把它视为多阶段决策过程,也可以用动态规划方法方便地求解。

应指出,动态规划是求解某类问题的一种方法,是考察问题的一种途径,而不是一种特殊算法(如线性规划是一种算法)。因而,它不象线性规划那样有一个标准的数学表达式和明确定义的一组规则,而必须对具体问题进行具体分析处理。因此,在学习时,除了要对基本概念和方法正确理解外,应以丰富的想象力去建立模型,用创造性的技巧去求解。

例1 最短路线问题

图1是一个线路网,连线上的数字表示两点之间的距离(或费用)。试寻求一条由A 到G距离最短(或费用最省)的路线。

图1 最短路线问题

例2 生产计划问题

工厂生产某种产品,每单位(千件)的成本为1(千元),每次开工的固定成本为3(千元),工厂每季度的最大生产能力为6(千件)。经调查,市场对该产品的需求量第一、二、三、四季度分别为2,3,2,4(千件)。如果工厂在第一、二季度将全年的需求都生产出来,自然可以降低成本(少付固定成本费),但是对于第三、四季度才能上市的产品需付存储费,每季每千件的存储费为0.5(千元)。还规定年初和年末这种产品均无库存。试制定一个生产计划,即安排每个季度的产量,使一年的总费用(生产成本和存储费)最少。

1.2 决策过程的分类

根据过程的时间变量是离散的还是连续的,分为离散时间决策过程(discrete-time

-56-

-57-

decision process )和连续时间决策过程(continuous-time decision process );根据过程的演变是确定的还是随机的,分为确定性决策过程(deterministic decision process )和随机性决策过程(stochastic decision process ),其中应用最广的是确定性多阶段决策过程。

§2 基本概念、基本方程和计算方法

2.1 动态规划的基本概念和基本方程

一个多阶段决策过程最优化问题的动态规划模型通常包含以下要素。

2.1.1 阶段

阶段(step)是对整个过程的自然划分。通常根据时间顺序或空间顺序特征来划分阶段,以便按阶段的次序解优化问题。阶段变量一般用n k ,,2,1L =表示。在例1中由A 出发为1=k ,由)2,1(=i B i 出发为2=k ,依此下去从)2,1(=i F i 出发为6=k ,共6=n 个阶段。在例2中按照第一、二、三、四季度分为4,3,2,1=k ,共四个阶段。

2.1.2 状态

状态(state )表示每个阶段开始时过程所处的自然状况。它应能描述过程的特征并且无后效性,即当某阶段的状态变量给定时,这个阶段以后过程的演变与该阶段以前各阶段的状态无关。通常还要求状态是直接或间接可以观测的。

描述状态的变量称状态变量(state variable )。变量允许取值的范围称允许状态集合(set of admissible states)。用k x 表示第k 阶段的状态变量,它可以是一个数或一个向量。用k X 表示第k 阶段的允许状态集合。在例1中2x 可取21,B B ,或将i B 定义为)2,1(=i i ,则12=x 或2,而}2,1{2=X 。

n 个阶段的决策过程有1+n 个状态变量,1+n x 表示n x 演变的结果。在例1中7x 取G ,或定义为1,即17=x 。

根据过程演变的具体情况,状态变量可以是离散的或连续的。为了计算的方便有时将连续变量离散化;为了分析的方便有时又将离散变量视为连续的。

状态变量简称为状态。

2.1.3 决策

当一个阶段的状态确定后,可以作出各种选择从而演变到下一阶段的某个状态,这种选择手段称为决策(decision ),在最优控制问题中也称为控制(control )。

描述决策的变量称决策变量(decision variable ),变量允许取值的范围称允许决策集合(set of admissible decisions )。用)(k k x u 表示第k 阶段处于状态k x 时的决策变量,

它是k x 的函数,

用)(k k x U 表示k x 的允许决策集合。在例1中)(12B u 可取21,C C 或3C ,可记作3,2,1)1(2=u ,而}3,2,1{)1(2=U 。

决策变量简称决策。

2.1.4 策略

决策组成的序列称为策略(policy )。由初始状态1x 开始的全过程的策略记作)(11x p n ,即

)}(,),(),({)(221111n n n x u x u x u x p L =.

由第k 阶段的状态k x 开始到终止状态的后部子过程的策略记作)(k kn x p ,即

)}(,),({)(n n k k k kn x u x u x p L =,1,,2,1?=n k L .

类似地,由第k 到第j 阶段的子过程的策略记作

-58-

)}(,),({)(j j k k k kj x u x u x p L =.

可供选择的策略有一定的范围,称为允许策略集合(set of admissible policies),用)(),(),(11k kj k kn n x P x P x P 表示。

2.1.5. 状态转移方程

在确定性过程中,一旦某阶段的状态和决策为已知,下阶段的状态便完全确定。用状态转移方程(equation of state transition )表示这种演变规律,写作

.,,2,1),,(1n k u x T x k k k k L ==+ (1) 在例1中状态转移方程为)(1k k k x u x =+。

2.1.6. 指标函数和最优值函数

指标函数(objective function)是衡量过程优劣的数量指标,它是定义在全过程和所有后部子过程上的数量函数,用),,,,(11,++n k k k n k x x u x V L 表示,n k ,,2,1L =。指标函数应具有可分离性,即n k V ,可表为n k k k V u x ,1,,+的函数,记为

)),,,(,,(),,,,(111,111,++++++=n k k n k k k k n k k k n k x u x V u x x x u x V L L ?

并且函数k ?对于变量n k V ,1+是严格单调的。 过程在第j 阶段的阶段指标取决于状态j x 和决策j u ,用),(j j j u x v 表示。指标函数由),,2,1(n j v j L =组成,常见的形式有:

阶段指标之和,即

∑=++=n k

j j j j n k k k n k u x v x x u x V ),(),,,,(11,L ,

阶段指标之积,即

∏=++=n k

j j j j n k k k n k u x v x x u x V ),(),,,,(11,L ,

阶段指标之极大(或极小),即

),((min)max ),,,,(11,j j j n

j k n k k k n k u x v x x u x V ≤≤++=L . 这些形式下第k 到第j 阶段子过程的指标函数为),,,(1,+j k k j k x u x V L 。

根据状态转移方程指标函数n k V ,还可以表示为状态k x 和策略kn p 的函数,即

),(,kn k n k p x V 。

在k x 给定时指标函数n k V ,对kn p 的最优值称为最优值函数(optimal value function ),记为)(k k x f ,即

),(opt )(,)(kn k n k x P p k k p x V x f k kn kn ∈=

其中opt 可根据具体情况取max 或min 。

2.1.7 最优策略和最优轨线

使指标函数n k V ,达到最优值的策略是从k 开始的后部子过程的最优策略,记作},,{***n k kn u u p L =。*1n p 是全过程的最优策略,简称最优策略(optimal policy )。从初始状态)(*11x x =出发,过程按照*

1n p 和状态转移方程演变所经历的状态序列},,,{*1*2*1+n x x x L 称最优轨线(optimal trajectory )。

-59-

2.1.8 递归方程

如下方程称为递归方程

??

???=?==++∈++1,,)},(),({opt )(10)(11)(11L n k x f u x v x f x f k k k k k x U u k k n n k k k 或 (2) 在上述方程中,当?为加法时取0)(11=++n n x f ;当?为乘法时,取1)(11=++n n x f 。动态规划递归方程是动态规划的最优性原理的基础,即:最优策略的子策略,构成最优子策略。用状态转移方程(1)和递归方程(2)求解动态规划的过程,是由1+=n k 逆推至1=k ,故这种解法称为逆序解法。当然,对某些动态规划问题,也可采用顺序解法。这时,状态转移方程和递归方程分别为:

n k u x T x k k r k k ,,1),,(1L ==+,??

???=?==?+∈+++n k x f u x v x f x f k k k k k x U u k k k r k k ,,1)},(),({opt )(10(11)(11

011L 或)

例3 用lingo 求解例1最短路线问题。

model:

Title Dynamic Programming;

sets:

vertex/A,B1,B2,C1,C2,C3,C4,D1,D2,D3,E1,E2,E3,F1,F2,G/:L;

road(vertex,vertex)/A B1,A B2,B1 C1,B1 C2,B1 c3,B2 C2,B2 C3,B2 C4, C1 D1,C1 D2,C2 D1,C2 D2,C3 D2,C3 D3,C4 D2,C4 D3,

D1 E1,D1 E2,D2 E2,D2 E3,D3 E2,D3 E3,

E1 F1,E1 F2,E2 F1,E2 F2,E3 F1,E3 F2,F1 G,F2 G/:D;

endsets

data:

D=5 3 1 3 6 8 7 6

6 8 3 5 3 3 8 4

2 2 1 2

3 3

3 5 5 2 6 6

4 3;

L=0,,,,,,,,,,,,,,,;

enddata

@for(vertex(i)|i#GT#1:L(i)=@min(road(j,i):L(j)+D(j,i)));

end

纵上所述,如果一个问题能用动态规划方法求解,那么,我们可以按下列步骤,首先建立起动态规划的数学模型:

(i )将过程划分成恰当的阶段。

(ii )正确选择状态变量k x ,使它既能描述过程的状态,又满足无后效性,同时确定允许状态集合k X 。

(iii )选择决策变量k u ,确定允许决策集合)(k k x U 。

(iv )写出状态转移方程。

(v )确定阶段指标),(k k k u x v 及指标函数kn V 的形式(阶段指标之和,阶段指标之积,阶段指标之极大或极小等)。

(vi )写出基本方程即最优值函数满足的递归方程,以及端点条件。

§3 逆序解法的计算框图

-60-

以自由终端、固定始端、指标函数取和的形式的逆序解法为例给出计算框图,其它情况容易在这个基础上修改得到。

一般化的自由终端条件为

1,1,11,,2,1),()(++++==n i n i n n n i x x f L ? (3)

其中?为已知。固定始端条件可表示为}{}{*

111x x X ==。

如果状态k x 和决策k u 是连续变量,用数值方法求解时需按照精度要求进行离散化。设状态k x 的允许集合为 n k n i n i x X k k ki k ,,2,1,,,2,1},,,2,1|{L L L ====.

决策)(ki ki x u 的允许集合为

n k n i n j u U k ki j ki ki ,,2,1,,,2,1},,,2,1|{)(L L L ====.

状态转移方程和阶段指标应对k x 的每个取值ki x 和ki u 的每个取值)

(j ki u 计算,即

),()(j ki ki k k u x T T =,),()(j ki ki k u x v v =。最优值函数应对k x 的每个取值ki x 计算。基本方程可以表为

.

1,2,,,,,2,1,,,2,1),

(opt )()),

,((),()()()(1)()(L L L n k n i n j x f x f u x T f u x v x f k ki ki j k j ki k j ki ki k k j ki ki k ki j k ====+=+ (4)

图2 解法框图

-61- 按照(3),(4)逆向计算出)(*

11x f ,为全过程的最优值。记状态ki x 的最优决策为

)(*ki ki x u ,由*1x 和)(*ki ki x u 按照状态转移方程计算出最优状态,记作*k x 。并得到相应的最优决策,记作)(**k k x u 。于是最优策略为)}(,),(),({***2*2*1*1n n x u x u x u L 。

算法程序的框图如图2所示。

图的左边部分是函数序列的递推计算,可输出全过程最优值)(*11x f ,如果需要还可以输出后部子过程最优值函数序列)(ki k x f 和最优决策序列)(*

ki k x u 。计算过程中存

)(ki k x f 是备计算1?k f 之用,在1?k f 算完后可用1?k f 将k f 替换掉;存)(*ki k x u 是备右边部分读)(*

*k k x u 之用。

图的右边部分是最优状态和最优决策序列的正向计算,可输出最优策略)}(,),(),({***2*2*1*1n n x u x u x u L 和最优轨线},,,{**2*1n x x x L 。

§4 动态规划与静态规划的关系

动态规划与静态规划(线性和非线性规划等)研究的对象本质上都是在若干约束条件下的函数极值问题。两种规划在很多情况下原则上可以相互转换。

动态规划可以看作求决策n u u u ,,,21L 使指标函数),,,(2111n n u u u x V L ,达到最优(最大或最小)的极值问题,状态转移方程、端点条件以及允许状态集、允许决策集等是约束条件,原则上可以用非线性规划方法求解。

一些静态规划只要适当引入阶段变量、状态、决策等就可以用动态规划方法求解。下面用例子说明。

例4 用动态规划解下列非线性规划

∑=n k k k u g 1)(max

s.t. ∑=≥=n k k k u a u

10,.

其中)(k k u g 为任意的已知函数。

解 按变量k u 的序号划分阶段,看作n 段决策过程。设状态为121,,,+n x x x L ,取问题中的变量n u u u ,,,21L 为决策。状态转移方程为

.,,2,1,,11n k u x x a x k k k L =?==+

取)(k k u g 为阶段指标,最优值函数的基本方程为(注意到01=+n x )

)]()([max )(110++≤≤+=k k k k x u k k x f x g x f k

k ; 1,2,,1,,0L ?=≤≤n n k a x k ;

0)0(1=+n f .

按照逆序解法求出对应于k x 每个取值的最优决策)(*

k k x u ,计算至)(1a f 后即可利用状态转移方程得到最优状态序列}{*k x 和最优决策序列)}({**k k x u 。

与静态规划相比,动态规划的优越性在于:

(i )能够得到全局最优解。由于约束条件确定的约束集合往往很复杂,即使指标函数较简单,用非线性规划方法也很难求出全局最优解。而动态规划方法把全过程化为

-62-

一系列结构相似的子问题,每个子问题的变量个数大大减少,约束集合也简单得多,易于得到全局最优解。特别是对于约束集合、状态转移和指标函数不能用分析形式给出的优化问题,可以对每个子过程用枚举法求解,而约束条件越多,决策的搜索范围越小,求解也越容易。对于这类问题,动态规划通常是求全局最优解的唯一方法。

(ii )可以得到一族最优解。与非线性规划只能得到全过程的一个最优解不同,动态规划得到的是全过程及所有后部子过程的各个状态的一族最优解。有些实际问题需要这样的解族,即使不需要,它们在分析最优策略和最优值对于状态的稳定性时也是很有用的。当最优策略由于某些原因不能实现时,这样的解族可以用来寻找次优策略。

(iii )能够利用经验提高求解效率。如果实际问题本身就是动态的,由于动态规划方法反映了过程逐段演变的前后联系和动态特征,在计算中可以利用实际知识和经验提高求解效率。如在策略迭代法中,实际经验能够帮助选择较好的初始策略,提高收敛速度。

动态规划的主要缺点是:

(i )没有统一的标准模型,也没有构造模型的通用方法,甚至还没有判断一个问题能否构造动态规划模型的准则。这样就只能对每类问题进行具体分析,构造具体的模型。对于较复杂的问题在选择状态、决策、确定状态转移规律等方面需要丰富的想象力和灵活的技巧性,这就带来了应用上的局限性。

(ii )用数值方法求解时存在维数灾(curse of dimensionality )。若一维状态变量有m 个取值,那么对于n 维问题,状态k x 就有n m 个值,对于每个状态值都要计算、存储函数)(k k x f ,对于n 稍大的实际问题的计算往往是不现实的。目前还没有克服维数灾的有效的一般方法。

§5 若干典型问题的动态规划模型

5.1 最短路线问题

对于例1一类最短路线问题(shortest Path Problem ),阶段按过程的演变划分,状态由各段的初始位置确定,决策为从各个状态出发的走向,即有)(1k k k x u x =+,阶段指标为相邻两段状态间的距离))(,(k k k k x u x d ,指标函数为阶段指标之和,最优值函数)(k k x f 是由k x 出发到终点的最短距离(或最小费用),基本方程为

;1,,)],())(,([min )(11)

(L n k x f x u x d x f k k k k k k x u k k k k =+=++ .0)(11=++n n x f

利用这个模型可以算出例l 的最短路线为G F E D C AB 22121,

相应的最短距离为18。 5.2 生产计划问题

对于例 2一类生产计划问题(Production planning problem ),阶段按计划时间自然划分,状态定义为每阶段开始时的储存量k x ,决策为每个阶段的产量k u ,记每个阶段的需求量(已知量)为k d ,则状态转移方程为

.,,2,1,0,1n k x d u x x k k k k k L =≥?+=+ (5)

设每阶段开工的固定成本费为a ,生产单位数量产品的成本费为b ,每阶段单位数量产品的储存费为c ,阶段指标为阶段的生产成本和储存费之和,即

?

??>++=00,),(k k k k k k u bu a cx u x v (6)

-63-

指标函数kn V 为k v 之和。最优值函数)(k k x f 为从第k 段的状态k x 出发到过程终结的最小费用,满足

.1,,)],(),([min )(11L n k x f u x v x f k k k k k U u k k k

k =+=++∈ 其中允许决策集合k U 由每阶段的最大生产能力决定。若设过程终结时允许存储量为01+n x ,则终端条件是

.0)(011=++n n x f (7)

(5)~(7)构成该问题的动态规划模型。

5.3 资源分配问题

一种或几种资源(包括资金)分配给若干用户,或投资于几家企业,以获得最大的效益。资源分配问题(resource allocating Problem )可以是多阶段决策过程,也可以是静态规划问题,都能构造动态规划模型求解。下面举例说明。

例5 机器可以在高、低两种负荷下生产。u 台机器在高负荷下的年产量是)(u g ,在低负荷下的年产量是)(u h ,高、低负荷下机器的年损耗率分别是1a 和1b (1011<<>βα),即高、低负荷下每台机器的年产量分别为α和β,结果将有什么特点。

解 年度为阶段变量n k ,,2,1L =。状态k x 为第k 年初完好的机器数,决策k u 为第k 年投入高负荷运行的台数。当k x 或k u 不是整数时,将小数部分理解为一年中正常工作时间或投入高负荷运行时间的比例。

机器在高、低负荷下的年完好率分别记为a 和b ,则11a a ?=,11b b ?=,有b a <。因为第k 年投入低负荷运行的机器台数为k k u x ?,所以状态转移方程是

)(1k k k k u x b au x ?+=+ (8)

阶段指标k v 是第k 年的产量,有

)()(),(k k k k k k u x h u g u x v ?+= (9)

指标函数是阶段指标之和,最优值函数)(k k x f 满足

.1,2,,,0 )],(),([max )(110L n k m x x f u x v x f k k k k k k x u k k k

k =≤≤+=++≤≤ (10)

及自由终端条件

.0,0)(111m x x f n n n ≤≤=+++ (11)

当k v 中的h g ,用较简单的函数表达式给出时,对于每个k 可以用解析方法求解极

值问题。特别,若u u g α=)(,u u h β=)(,

(10)中的)](),([1k k k k k x f u x v ++ 将是k u 的线性函数,最大值点必在区间k k x u ≤≤0的左端点0=k u 或右端点k k x u =取得,即每年初将完好的机器全部投入低负荷或高负荷运行。

§6 具体的应用实例

例6 设某工厂有1000台机器,生产两种产品B A 、,若投入x 台机器生产A 产

-64-

品,则纯收入为x 5,若投入y 台机器生产B 种产品,则纯收入为y 4,又知:生产A 种产品机器的年折损率为20%,生产B 产品机器的年折损率为10%,问在5年内如何安排各年度的生产计划,才能使总收入最高?

解 年度为阶段变量5,4,3,2,1=k 。

令k x 表示第k 年初完好机器数,k u 表示第k 年安排生产A 种产品的机器数,则k k u x ?为第k 年安排生产B 种产品的机器数,且k k x u ≤≤0。

则第1+k 年初完好的机器数

k k k k k k u x u x u x 1.09.0))(1.01()2.01(1?=??+?=+ (12) 令),(k k k u x v 表示第k 年的纯收入,)(k k x f 表示第k 年初往后各年的最大利润之和。

显然

0)(66=x f (13) 则

)}(),({max )(110++≤≤+=k k k k k x u k k x f u x v x f k

k )}(4{max )}()(45{max 110110++≤≤++≤≤++=+?+=k k k k x u k k k k k x u x f x u x f u x u k

k k k (14) (1)5=k 时,由(13)、(14)式得

}4{max )(550555

5x u x f x u +=≤≤ 554x u +关于5u 求导,知其导数大于零,所以554x u +在5u 等于5x 处取得最大值,即55x u =时,5555)(x x f =。

(2)4=k 时,由(12)、(14)式得

}54{max )(5440444

4x x u x f x u ++=≤≤ }5.85.0{max )}1.09.0(54{max 440444404

444x u u x x u x u x u +=?++=≤≤≤≤ 当44x u =时,4449)(x x f =

(3)3=k 时,

}94{max )(4330333

3x x u x f x u ++=≤≤ }1.121.0{max )}1.09.0(94{max 330333303

333x u u x x u x u x u +=?++=≤≤≤≤ 当33x u =时,3332.12)(x x f =

(4)2=k 时,

}98.1422.0{max }2.124{max )(2203220222

222x u x x u x f x u x u +?=++=≤≤≤≤ 当02=u 时,22298.14)(x x f =。

(5)1=k 时,

}482.17498.0{max }98.144{max )(1102110111

111x u x x u x f x u x u +?=++=≤≤≤≤ 当01=u 时,111482.17)(x x f =。因为

10001=x (台)

-65-

所以由(12)式,进行回代得

9001.09.0112=?=u x x (台)

8101.09.0223=?=u x x (台)

6481.09.0334=?=u x x (台)

4.5181.09.0445=?=u x x (台)

注:4.5185=x 台中的0.4台应理解为有一台机器只能使用0.4年将报废。

例7 求解下面问题

32

21max u u u z = ???=≥>=++3,2,10)0(321i u c c u u u i

解: 按问题的变量个数划分阶段,把它看作为一个三阶段决策问题。设状态变量为4321,,,x x x x ,并记c x =1;取问题中的变量321,,u u u 为决策变量;各阶段指标函数按乘积方式结合。令最优值函数)(k k x f 表示第k 阶段的初始状态为k x ,从k 阶段到3阶段所得到的最大值。

设33u x =, 223x u x =+, c x u x ==+112

则有

33x u =, 220x u ≤≤, 110x u ≤≤

用逆推解法,从后向前依次有

3333}{max )(3

3x u x f x u === 及最优解 3*3x u = ),(max )}({max )}({max )(22202222033220222

22222x u h u x u x f u x f x u x u x u ≤≤≤≤≤≤=?== 由032222222=?=u x u du dh ,得223

2x u =和02=u (舍去) 又22222262u x du h d ?=,而0223222

2222

2x u =。 })(27

4{max )}({max )(311102*********u x u x f u x f x u x u ?==≤≤≤≤ 同样利用微分法易知 4111641)(x x f =,最优解1*14

1x u =。 由于1x 已知,因而按计算的顺序反推算,可得各阶段的最优决策和最优值。即

c u 4

1*1=,411641)(c x f = 由

c c c u x x 4

341*112=?=?=

-66-

所以

c x u 2

1322*2==,322161)(c x f = 由 c c c u x x 412143*223=?=

?= 所以

c u 41*3=,c x f 4

1)(33= 因此得到最优解为:c u 41*1=,c u 21*2=,c u 4

1*3=; 最大值为:41641)(max c c f z ==。

习 题 四

1. 用Matlab 编程求例6的解。

2. 有四个工人,要指派他们分别完成4项工作,每人做各项工作所消耗的时间如表1所示。

问指派哪个人去完成哪项工作,可使总的消耗时间为最小?试对此问题用动态规划方法求解。

3. 为保证某一设备的正常运转,需备有三种不同的零件321,,E E E 。若增加备用零件的数量,可提高设备正常运转的可靠性,但增加了费用,而投资额仅为8000元。已知备用零件数与它的可靠性和费用的关系如表2所示。

表2

增加的可靠性

设备的费用(千元) 备件数

1E 2E 3E 1E 2E 3E 1

2

3 0.3 0.

4 0.

5 0.2 0.5 0.9 0.1 0.2 0.7 1 2 3 3 5

6 2 3 4

现要求在既不超出投资额的限制,又能尽量提高设备运转的可靠性的条件下,问各种零件的备件数量应是多少为好?

4. 某工厂购进100台机器,准备生产I 、II 两种产品,若生产产品I ,每台机器每年可收入45万元,损坏率为65%;若生产产品II ,每台机器每年收入为35万元,损坏率为35%,估计三年后将有新型机器出现,旧的机器将全部淘汰。试问每年应如何

安排生产,使在三年内收入最多?

5.3名商人各带1名随从乘船渡河,一只小船只能容纳2人,由他们自己划行。随从们密约,在河的任一岸,一旦随从人数比商人多,就杀商人。此密约被商人知道,如何乘船渡河的大权掌握在商人们手中,商人们怎样安排每次乘船方案,才能安全渡河呢?

6.某一印刷厂有六项加工任务,对印刷车间和装订车间所需时间(单位:天)如表3所示,试求最优的加工顺序和总加工天数。

-67-

(数学建模教材)4第四章动态规划

第四章动态规划 §1 引言 1.1 动态规划的发展及研究内容 动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。20 世纪50 年代初R. E. Bellman 等人在研究多阶段决策过程(multistep decision process)的优化问题时,提出了著名的最优性原理(principle of optimality),把多阶段过程转化为一系列单阶段问题,逐个求解,创立了解决这类过程优化问题的新方法—动态规划。1957 年出版了他的名著《Dynamic Programming》,这是该领域的第一本著作。 动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。 虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间因素,把它视为多阶段决策过程,也可以用动态规划方法方便地求解。 应指出,动态规划是求解某类问题的一种方法,是考察问题的一种途径,而不是一种特殊算法(如线性规划是一种算法)。因而,它不象线性规划那样有一个标准的数学表达式和明确定义的一组规则,而必须对具体问题进行具体分析处理。因此,在学习时,除了要对基本概念和方法正确理解外,应以丰富的想象力去建立模型,用创造性的技巧去求解。 例1 最短路线问题 图1 是一个线路网,连线上的数字表示两点之间的距离(或费用)。试寻求一条由A 到G距离最短(或费用最省)的路线。 图1 最短路线问题 例2 生产计划问题 工厂生产某种产品,每单位(千件)的成本为1(千元),每次开工的固定成本为3 (千元),工厂每季度的最大生产能力为6(千件)。经调查,市场对该产品的需求量第一、二、三、四季度分别为2,3,2,4(千件)。如果工厂在第一、二季度将全年的需求都生产出来,自然可以降低成本(少付固定成本费),但是对于第三、四季度才能上市的产品需付存储费,每季每千件的存储费为0.5(千元)。还规定年初和年末这种产品均无库存。试制定一个生产计划,即安排每个季度的产量,使一年的总费用(生产成本和存储费)最少。 1.2 决策过程的分类根据过程的时间变量是离散的还是连续的,分为离散时间 决策过程(discrete-time -56-

动态规划

动态规划 一、背包问题 1、0/1背包[问题背景及描述] Bessie 正在减肥,所以她规定每天不能吃超过C (10 <= C <= 35,000)卡路里的食物。农民John 在戏弄她,在她面前放了B (1 <= B <= 21) 捅食物。每桶内都有某个单位卡路里(范围:1..35,000)的食物(不一定相同)。Bessie 没有自控能力,一旦她开始吃一个桶中的食物,她就一定把这桶食物全部吃完。Bessie 对于组合数学不大在行。请确定一个最优组合,使得可以得到最多的卡路里,并且总量不超过C。例如,总量上限是40卡路里,6 桶食物分别含有7, 13, 17, 19, 29, 和31卡路里的食物。Bessie可以吃7 + 31 = 38卡路里,但是可以获取得更多:7 + 13 + 19 = 39卡路里。没有更好的组合了。 [输入] 共两行。 第一行,两个用空格分开的整数:C 和 B 第二行,B个用空格分开的整数,分别表示每桶中食物所含的卡路里。 [输出] 共一行,一个整数,表示Bessie能获得的最大卡路里,使她不违反减肥的规则。 [输入样例] 40 6 7 13 17 19 29 31 [样例输出] 39 2、固定次数的0/1背包 有N种物品和一个容量为V的背包。第i种物品最多有n[i]件可用,每件体积是c[i],价值是w[i]。求解将哪些物品装入背包可使这些物品的体积总和不超过背包容量,且价值总和最大。V〈30000,n〈100,n[i]〈50。 输入输出格式: 第1行,两个用空格分开的整数:v 和n 第2—n+1行,每件体积是c[i],价值是w[i],最多有n[i]件可用 [输入样例] 40 2 10 20 5 20 30 6 [样例输出] 80 3、重复背包货币系统money 母牛们不但创建了他们自己的政府而且选择了建立了自己的货币系统。[In their own

第四章 数学规划模型

第四章 数学规划模型 【教学目的】:深刻理解线性规划,非线性规划,动态规划方法建模的基本特点,并能熟练建立一些实际问题的数学规划模型;熟练掌握用数学软件(Matlab ,Lindo ,Lingo 等)求解优化问题的方法。 【教学重点难点】: 教学重点:线性规划和非线性规划的基本概念和算法,解决数学规划问题的一般思路和 方法,线性规划模型、整数规划模型、非线性规划模型的构建及其Matlab 与Lingo 实现。 教学难点:区分线性规划模型和非线性模型适用的实际问题,以及何时采用线性模型, 何时采用非线性模型,线性模型与非线性模型的转化。 【课时安排】:10学时 【教学方法】:采用多媒体教学手段,配合实例教学法,通过对典型例题的讲解启发学生思维,并给与学生适当的课后思考讨论的时间,加深知识掌握的程度。安排一定课时的上机操作。 【教学内容】: 在众多实际问题中,常常要求决策(确定)一些可控制量的值,使得相关的量(目标)达到最佳(最大或最小)。这些问题就叫优化问题,通常需要建立规划模型进行求解。称这些可控制量为决策变量,相关的目标量为目标函数;一般情况下,决策变量x 的取值是受限制的,不妨记为x ∈Ω,Ω称为可行域,优化问题的数学模型可表示为 Max(或Min)f(x), x ∈Ω 一般情况下,x 是一个多元变量,f(x)为多元函数,可行域比较复杂,一般可用一组不等式组来表示,这样规划问题的一般形式为 () x Min f x . ()0,1,2,,i st g x i m ≤= 虽然,该问题属于多元函数极值问题,但变量个数和约束条件比较多,一般不能用微分法进行解决,而通过规划方法来求解;这里讨论的不是规划问题的具体算法,主要是讨论如何将一个实际问题建立优化模型,并利用优化软件包进行求解。 根据目标函数和约束函数是否为线性,将规划模型分为线性规划和非线性规划。 4.1线性规划 线性规划(LP)研究的实际问题多种多样的,它在工农业生产、经济管理、优化设计与控

动态规划算法原理与的应用

动态规划算法原理及其应用研究 系别:x x x 姓名:x x x 指导教员: x x x 2012年5月20日

摘要:动态规划是解决最优化问题的基本方法,本文介绍了动态规划的基本思想和基本步骤,并通过几个实例的分析,研究了利用动态规划设计算法的具体途径。关键词:动态规划多阶段决策 1.引言 规划问题的最终目的就是确定各决策变量的取值,以使目标函数达到极大或极小。在线性规划和非线性规划中,决策变量都是以集合的形式被一次性处理的;然而,有时我们也会面对决策变量需分期、分批处理的多阶段决策问题。所谓多阶段决策问题是指这样一类活动过程:它可以分解为若干个互相联系的阶段,在每一阶段分别对应着一组可供选取的决策集合;即构成过程的每个阶段都需要进行一次决策的决策问题。将各个阶段的决策综合起来构成一个决策序列,称为一个策略。显然,由于各个阶段选取的决策不同,对应整个过程可以有一系列不同的策略。当过程采取某个具体策略时,相应可以得到一个确定的效果,采取不同的策略,就会得到不同的效果。多阶段的决策问题,就是要在所有可能采取的策略中选取一个最优的策略,以便得到最佳的效果。动态规划是一种求解多阶段决策问题的系统技术,可以说它横跨整个规划领域(线性规划和非线性规划)。在多阶段决策问题中,有些问题对阶段的划分具有明显的时序性,动态规划的“动态”二字也由此而得名。动态规划的主要创始人是美国数学家贝尔曼(Bellman)。20世纪40年代末50年代初,当时在兰德公司(Rand Corporation)从事研究工作的贝尔曼首先提出了动态规划的概念。1957年贝尔曼发表了数篇研究论文,并出版了他的第一部著作《动态规划》。该著作成为了当时唯一的进一步研究和应用动态规划的理论源泉。在贝尔曼及其助手们致力于发展和推广这一技术的同时,其他一些学者也对动态规划的发展做出了重大的贡献,其中最值得一提的是爱尔思(Aris)和梅特顿(Mitten)。爱尔思先后于1961年和1964年出版了两部关于动态规划的著作,并于1964年同尼母霍思尔(Nemhauser)、威尔德(Wild)一道创建了处理分枝、循环性多阶段决策系统的一般性理论。梅特顿提出了许多对动态规划后来发展有着重要意义的基础性观点,并且对明晰动态规划路径的数

第三讲 线性规划

第三章 不等式 第三讲 线性规划问题 科目 高三数学 班级 姓名 时间 2015-10-02 一.复习目标: 1.能用二元一次不等式(组) 表示平面区域,会求表示区域的面积 2.会求目标函数最值及约束条件、目标函数中的参变量的取值范围. 3.能利用线性规划方法设计解决实际问题的最优方案. 二.学习过程: (一)知识梳理:阅读课本,自主梳理总结以下几个问题: 1.如何用二元一次不等式(组)表示平面区域? 2.线性规划的相关概念 (1)什么是约束条件?目标函数?线性规划问题? (2)什么是可行域?可行解?最优解? 3.利用图解法解决线性规划问题的一般步骤 第一步:设出 ,列出 ,确立 , 第二步:根据约束条件,画出 , 第三步:作出目标函数的等值线(等值线是指 ). 第四步:求出 .在可行域内平行移动目标函数等值线,从图中能判定问题有 ,或者是有 ,或是 . 思考: (1)点P 1和P 2位于直线Ax +By +C =0的两侧(或异侧)的充要条件是什么? (2)可行解与最优解有何关系?最优解是否唯一? (二)题型分析与研究 考点一 二元一次不等式(组)表示平面区域 例1.不等式组?? ???≤≥-+≤-+203062y y x y x 表示的平面区域的面积为 考点二 求目标函数的最值 (常见的目标函数有哪些?) 例3.(1)设变量x ,y 满足约束条件?? ???≥≤--≥-+10202y y x y x ,则目标函数z =x +2y 的最小值 为

(2)在平面直角坐标系xOy 中,M 为不等式组?? ???≤-+≥-+≥--083012022y x y x y x ,所表示的区域上一动 点,则直线OM 斜率的最小值为 (3)变量x ,y 满足?? ???≥≤-+≤+-102553034x y x y x ,(1)设z =y x ,求z 的最小值;(2)设z =x 2+y 2,求z 的取值范围. 考点三 求线性规划中的参数问题 例3.(1)x ,y 满足约束条件?? ???≥+-≤--≤-+02202202y x y x y x ,若z =y -ax 取得最大值的最优解不唯..一. ,则实数a 的值为 (2)当实数x ,y 满足?? ???≥≤--≤-+101042x y x y x 时,1≤ax +y ≤4恒成立,则实数a 的取值范 围是________. 考点四 线性规划的实际应用 例4.某玩具生产公司每天计划生产卫兵、骑兵、伞兵这三种玩具共100个,生产一个卫兵需5分钟,生产一个骑兵需7分钟,生产一个伞兵需4分钟,已知总生产时间不超过10小时.若生产一个卫兵可获利润5元,生产一个骑兵可获利润6元,生产一个伞兵可获利润3元. (1)用每天生产的卫兵个数x 与骑兵个数y ,表示每天的利润W (元); (2)怎样分配生产任务才能使每天的利润最大,最大利润是多少?

动态规划习题

第七章动态规划 规划问题的最终目的就是确定各决策变量的取值,以使目标函数达到极大或极小。在线性规划和非线性规划中,决策变量都是以集合的形式被一次性处理的;然而,有时我们也会面对决策变量需分期、分批处理的多阶段决策问题。所谓多阶段决策问题是指这样一类活动过程:它可以分解为若干个互相联系的阶段,在每一阶段分别对应着一组可供选取的决策集合;即构成过程的每个阶段都需要进行一次决策的决策问题。将各个阶段的决策综合起来构成一个决策序列,称为一个策略。显然,由于各个阶段选取的决策不同,对应整个过程可以有一系列不同的策略。当过程采取某个具体策略时,相应可以得到一个确定的效果,采取不同的策略,就会得到不同的效果。多阶段的决策问题,就是要在所有可能采取的策略中选取一个最优的策略,以便得到最佳的效果。动态规划(dynamic programming)同前面介绍过的各种优化方法不同,它不是一种算法,而是考察问题的一种途径。动态规划是一种求解多阶段决策问题的系统技术,可以说它横跨整个规划领域(线性规划和非线性规划)。当然,由于动态规划不是一种特定的算法,因而它不象线性规划那样有一个标准的数学表达式和明确定义的一组规则,动态规划必须对具体问题进行具体的分析处理。在多阶段决策问题中,有些问题对阶段的划分具有明显的时序性,动态规划的“动态”二字也由此而得名。动态规划的主要创始人是美国数学家贝尔曼(Bellman)。20世纪40年代末50年代初,当时在兰德公司(Rand Corporation)从事研究工作的贝尔曼首先提出了动态规划的概念。1957年贝尔曼发表了数篇研究论文,并出版了他的第一部著作《动态规划》。该著作成为了当时唯一的进一步研究和应用动态规划的理论源泉。1961年贝尔曼出版了他的第二部著作,并于1962年同杜瑞佛思(Dreyfus)合作出版了第三部著作。在贝尔曼及其助手们致力于发展和推广这一技术的同时,其他一些学者也对动态规划的发展做出了重大的贡献,其中最值得一提的是爱尔思(Aris)和梅特顿(Mitten)。爱尔思先后于1961年和1964年出版了两部关于动态规划的著作,并于1964年同尼母霍思尔(Nemhauser)、威尔德(Wild)一道创建了处理分枝、循环性多阶段决策系统的一般性理论。梅特顿提出了许多对动态规划后来发展有着重要意义的基础性观点,并且对明晰动态规划路径的数学性质做出了巨大的贡献。 动态规划在工程技术、经济管理等社会各个领域都有着广泛的应用,并且获得了显著的效果。在经济管理方面,动态规划可以用来解决最优路径问题、资源分配问题、生产调度问题、库存管理问题、排序问题、设备更新问题以及生产过程最优控制问题等,是经济管理中一种重要的决策技术。许多规划问题用动态规划的方法来处理,常比线性规划或非线性规划更有效。特别是对于离散的问题,由于解析数学无法发挥作用,动态规划便成为了一种非常有用的工具。 动态规划可以按照决策过程的演变是否确定分为确定性动态规划和随机性动态规划;也可以按照决策变量的取值是否连续分为连续性动态规划和离散性动态规划。本教材主要介绍动态规划的基本概念、理论和方法,并通过典型的案例说明这些理论和方法的应用。 §7.1 动态规划的基本理论 1.1多阶段决策过程的数学描述 有这样一类活动过程,其整个过程可分为若干相互联系的阶段,每一阶段都要作出相应的决策,以使整个过程达到最佳的活动效果。任何一个阶段(stage,即决策点)都是由输入(input)、决策(decision)、状态转移律(transformation function)和输出(output)构成的,如图7-1(a)所示。其中输入和输出也称为状态(state),输入称为输入状态,输出称为输出状态。

参考习题 第四章 决策

精心整理 第四章决策 一、单项选择题 1、有一种说法认为"管理就是决策",这实际上意味着:(C ) A.对于管理者来说只要善于决策就一定能够获得成功 B.管理的复杂性和挑战性都是由于决策的复杂性而导致的 C.决策能力对于管理的成功具有特别重要的作用 D.管理首先需要的就是面对复杂的环境作出决策 2 A.3、根据"A.B.C.D.4(1)5 A.B.C.D.620A.B.C.D.这不是真正意义上的授权而只是一种工作落实 7、某企业原先重大战略决策的基本过程是由各部门(如财务部、销售部、生产部、人事部等)独立把各自部门的情况写成报告送给总经理,再由总经理综合完成有关的战略方案。后来,对此过程作了些调整,这就是:总经理收到各部门呈上的报告后,有选择地找些管理人员来磋商,最后由自己形成决策。再后来,总经理在收到报告后,就把这些报告交给一个有各部门人员共同参与组成的委员会,通过委员会全体成员的面对面讨论,最终形成有关决策。对此你的看法是:(C) A.这种处理方式的改变对企业战略决策以及其它方面的工作没什么影响 B.这种处理方式的改变可以大大提高企业决策的效率 C.这种处理方式的改变增加了信息沟通的范围,可带来更多的成员满意感 D.这种处理方式的改变提高了企业上下信息沟通的效率 8、现在社会上销售彩票的很多。一家三口在抽奖时,常常喜欢让孩子来抽,请问这是遵循了什么决策原则?(A )

A.乐观原则 B.悲观原则 C.折衷原则 D.最小最大后悔值原则 9、某企业集团拟投资开发新产品,现有两个方案,假定其开发费用相同。开发甲产品,估计投产后,市场竞争不激烈时每年可获利150万元,市场竞争激烈时每年亏损50万元。开发乙产品,估计投产后无论市场竞争激烈与否,每年均可获利70万元。根据预测,这两种拟开发的产品投产后,出现市场竞争不激烈情况的概率为0.6,出现市场竞争激烈情况的概率为0.4。如果只能在这两个方案中选一个,你的评价是什么?(B) A.开发甲产品比开发乙产品好。 B.开发乙产品比开发甲产品好。 C.开发甲产品与开发乙产品没什么差别。 D.根据以上资料尚无法下结论。 10、在以下X、Y和Z三种方案中,哪一个方案最好?(B) A.X 11 A. B. C. D. 12 A. 13、 A. 13 A. C. 14 A.关于公司各部门办公电脑的分配方案 D.对一位客户投诉的例行处理 C.对一家主要竞争对手突然大幅削价作出反应 D.对一位公司内部违纪职工按规章进行处理 15、在制定计划时,为了有效地确定前提条件,应当:(A) A.找出并着重研究那些关键性的、战略性的的提条件, B.要准备不止一套的备选前提条件,以供出现偶发事件时应急使用。 C.所选择的各前提条件相互间必须协调一致。 D.对以上3条作综合考虑。 16、有一个大家熟悉的商务趣闻:甲乙两家鞋业公司的经理各派了一位市场调查员去某岛调查,发现岛上的居民从来不穿鞋。结果甲公司的调查员向公司报告称自己发现厂一个新市场,进而开拓了市场;而乙公司的调查员则

第三讲不等式及线性规划

第三讲 不等式及线性规划 考题为证 1. 不等式1 21x x -+的解集为 ( ) A. 1(,1]2- B. 1,12??-???? C. (1 ,)2-∞-[1,)?+∞ D. 1(,][1,)2 -∞-+∞ 2.已知变量x ,y 满足约束条件21 1y x y x y ≤??+≥??-≤?,则z=3x+y 的最大值为( ) A. 12 B.11 C. 3 D. -1 3.设1,0,a b c >><给出下列三个结论:① ;c c a b >②;c c a b <③log ()log ()b a a c b c ->- 其中所有的正确结论的序号为( ) A. ① B. ①② C.②③ D.①②③ 4. 若函数y=2x 图象上存在点(x ,y )满足约束条件30230x y x y x m +-≤??--≤??≥? ,则实数m 的最大值为 ( ) A .12 B 1 C. 32 D. 2 5. 下列不等式一定成立的是( ) A.()21lg lg 04x x x ??+ >> ??? B.sinx+12sin x ≥ (,x k k Z π≠∈) C.()212,x x x R +≥∈ D. 211,()1 x R x >∈+ 核心考点 考点1:一元二次不等式的恒成立问题 考点2:简单分式不等式的解法

考点3:几个重要不等式 考点4:线性规划问题 热点考向聚焦 :考向1 不等式的解法 例1:不等式1 223log 1 x x --0≥的解集是( ) A.(,2]-∞ B.(1,2] C .(3,2]2 D.3(,1)(,)2 -∞?+∞ 变式1.设函数22(1)()2(1) x x x f x x ?-≥?=?

第11章 动态规划

第11章 动态规划 一个随事件或阶段推移的系统叫做动态系统,动态规划是解决多阶段决策过程最优化的一种数学方法。一个系统依据某种方式分为许多个不同的阶段,这些阶段不仅有着次序推移性,而且相互间有着依赖和影响。这样,在多阶段决策过程中,每个阶段决策的选择,不仅要依据次序来考查某阶段的效果,而且要顾及此决策对以后各阶段决策的影响。一般情况下,为得到整个系统的最优选择,必须放弃对某个阶段来说最佳的决策。对各个阶段所做的决策形成确定整个系统的决策序列,称这样的决策序列为系统的一个策略。对应某一确定的策略,整个系统依据某种数量指标衡量其决策的优劣。多阶段决策过程就是在所有允许策略集合中。确定一个达到最有指标的最优策略。这种衡量系统的指标一般取最大值或最小值的策略。因此,多阶段决策过程也是一个可以构成多个变量的最优化问题。动态规划就是解决此类多阶段决策过程的最优化方法。虽然动态规划主要解决多阶段决策的动态系统,但是可分阶段的静态系统问题也能作为特例用它有效地求解。 §11.1 动态规划的基本原理 本章通过构造数学模型,形成具有特殊的动态系统过程,将基于某种方式把整个过程分成若干个互相联系的阶段,在其每个阶段都需要作出决策,从而使整个过程达到最佳效果。同时,各个阶段决策的选择依赖于该阶段的状态以及前阶段或后阶段的变化。各个阶段决策确定后,组成一个决策序列,从而形成了整个过程具有前后关联的链状结构的多阶段决策过程,称为序贯决策过程。 先用下面的最短路问题(问题可分成阶段性)来说明动态规划的基本思想。 例 1,最短路问题。图11—1所示是一个路线网络图,连线上的数字表示两点之间的距离(或费用),要求寻找一条由A 到E 的路线,使距离最短(或费用最省)。 对于这样的一个比较简单的问题,可直接使用枚举法例举所有从A 到E 得路线,确定 出所应走的路线是距离最短或费用最少,用 动态规划的思想,如果已找到由A 到E 得最 短路线是A —B 1—C2—D 2—E (记作L ),那 么当寻求L 中的任何一点(如C 2)到E 得最 短路时,它必然是L 子路线 C 2—D 2—E(记 作L 1)。否则,如D 2到E 的最短路是另一条 路线L 2,则把A —B 1—C 2与L2连接起来, 就会得到一条不同于L 的从A 到E 得最短 路,根据最短路的这一特性,可以从最后一 段开始,用逐步向前递推的方法,一次求出路段上各点到E 的最短路,最后得到A 到E 得最短路。上述这种由系统的最后阶段逐段向初始阶段求最优的过程称为动态规划的解法。该过程揭示了动态规划的基础思想,为便于对动态规划的思想和方法进行数学描述,下面先引入动态规划的基本概念并建立最优目标函数。 (1)分阶段:适当地依据具体情况将系统分成若干个相互联系的阶段,并将各个段按顺序或逆序加以编号(常用K ),描述阶段的变量称为阶段变量。如例1可分为5个阶段,k=1,2,3,4,5. (2)状态:状态表示系统在某一阶段所处的位置。描述过程状态的变量称为状态变量,第k 阶段的状态变量常用s k 表示,状态变量的集合用S k 表示。如在例1中,第一阶段有一个状态就是初始位置A ,第三阶段有3个状态,即集合S3=}{1,2,3C C C . (3)决策:当系统处于某一阶段的某个状态时,可以作出不同的决定(或选择),从而确定下一阶段的状态,这种决定称为决策。如在例1第二阶段中,从状态B2出发,其允许决

线性规划(第三讲)

BST金牌高二(必修五)数学专题系列之线性规划(三) 一. 1. 点P(x0,y0)在直线Ax+By+C=0上,则点P坐标适合方程,即Ax0+By0+C=0 2. 点P(x0,y0)在直线Ax+By+C=0上方(左上或右上),则当B>0时,Ax0+By0+C>0;当B<0时,Ax0+By0+C<0 3. 点P(x0,y0)在直线Ax+By+C=0下方(左下或右下),则当B>0时,Ax0+By0+C<0;当B<0时,Ax0+By0+C>0 注意:(1)在直线Ax+By+C=0同一侧的所有点,把它的坐标(x,y)代入Ax+By+C,所得实数的符号都相同, (2)在直线Ax+By+C=0的两侧的两点,把它的坐标代入Ax+By+C,所得到实数的符号相反, 即:1.点P(x1,y1)和点Q(x2,y2)在直线Ax+By+C=0的同侧,则有(Ax1+By1+C)(A x2+By2+C)>0 2.点P(x1,y1)和点Q(x2,y2)在直线Ax+By+C=0的两侧,则有(Ax1+By1+C)(Ax2+By2+C)<0 二.二元一次不等式表示平面区域: ①二元一次不等式Ax+By+C>0(或<0)在平面直角坐标系中表示直线Ax+By+C=0某一侧所有点组成的平面区 域. 不.包括边界; ②二元一次不等式Ax+By+C≥0(或≤0)在平面直角坐标系中表示直线Ax+By+C=0某一侧所有点组成的平面 区域且包括边界; 注意:作图时,不包括边界画成虚线;包括边界画成实线. 三.判断二元一次不等式表示哪一侧平面区域的方法: 方法一:取特殊点检验; “直线定界、特殊点定域 原因:由于对在直线Ax+By+C=0的同一侧的所有点(x,y),把它的坐标(x,y)代入Ax+By+C,所得到的实数的符号都相同,所以只需在此直线的某一侧取一个特殊点(x0,y0),从Ax0+By0+C的正负即可判断Ax+By+C>0表示直线哪一侧的平面区域.特殊地, 当C≠0时,常把原点作为特殊点,当C=0时,可用(0,1)或(1,0)当特殊点,若点坐标代入适合不等式则此点所在的区域为需画的区域,否则是另一侧区域为需画区域。 方法二:利用规律: 1.Ax+By+C>0,当B>0时表示直线Ax+By+C=0上方(左上或右上), 当B<0时表示直线Ax+By+C=0下方(左下或右下); 2.Ax+By+C<0,当B>0时表示直线Ax+By+C=0下方(左下或右下) 当B<0时表示直线Ax+By+C=0上方(左上或右上)。 四.线性规划的有关概念:

动态规划算法原理与的应用

动态规划算法原理 及其应用研究 2012年5月20日摘要:动态规划是解决最优化问题的基本方法,本文介绍了

动态规划的基本思想和基本步骤,并通过几个实例的分析,研究了利用动态规划设计算法的具体途径。关键词:动态规划多阶段决策 1.引言 规划问题的最终目的就是确定各决策变量的取值,以使目标函数达到极大或极小。在线性规划和非线性规划中,决策变量都是以集合的形式被一次性处理的;然而,有时我们也会面对决策变量需分期、分批处理的多阶段决策问题。所谓多阶段决策问题是指这样一类活动过程:它可以分解为若干个互相联系的阶段,在每一阶段分别对应着一组可供选取的决策集合;即构成过程的每个阶段都需要进行一次决策的决策问题。将各个阶段的决策综合起来构成一个决策序列,称为一■ 个策略。显然,由于各个阶段选取的决策不同,对应整个过程可以有一系列不同的策略。当过程采取某个具体策略时,相应可以得到一个确定的效果,采取不同的策略,就会得到不同的效果。多阶段的决策问题,就是要在所有可能采取的策略中选取一个最优的策略,以便得到最佳的效果。动态规划是一种求解多阶段决策问题的系统技术,可以说它横跨整个规划领域(线性规划和非线性规划)。在多阶段决策问题中,有些问题对阶段的划分具有明显的时序性,动态规划的“动态”二字也由此而得名。动态规划的主要创始人是美国数学家贝尔曼(Bellman)。20世纪40年代末50年代初,当时在兰德公司(Rand Corporation)从事研究工作的贝尔曼首先提出了动态规划的概念。1957年贝尔曼发表了数篇研究论文,并出版了他的第一部著作《动态规划》。该著作成为了当时唯一的进一步研究和应用动态规划的理论源泉。在贝尔曼及其助手们致力于发展和推广这一技术的同时,其他一些学者也对动态规划的发展做出了重大的贡献,其中最值得一提的是爱尔思(Aris)和梅特顿(Mitten )。爱尔思先后于1961年和1964年出版了两部 关于动态规划的著作,并于1964年同尼母霍思尔(Nemhause)、威尔德(Wild)一道创建了处理分枝、循环性多阶段决策系统的一般性理论。梅特顿提出了许多对动态规划后来发展有着重要意义的基础性观点,并且对明晰动态规划路径的数学性质做出了巨大的贡献。 动态规划问世以来,在工程技术、经济管理等社会各个领域都有着广泛的应用,并且获得了显著的效果。在经济管理方面,动态规划可以用来解决最优路径

数学模型动态规划

动态规划 动态规划(dynamic programming)是运筹学的一个重要分支,它是解决多阶段决策问题的一种有效的数量化方法.动态规划是由美国学者贝尔曼(R.Bellman)等人所创立的.1951年贝尔曼首先提出了动态规划中解决多阶段决策问题的最优化原理,并给出了许多实际问题的解法.1957年贝尔曼发表了《动态规划》一书,标志着运筹学这一重要分支的诞生. §1动态规划的概念与原理 一、动态规划的基本概念 引例:最短路线问题 美国黑金石油公司(The Black Gold Petroleum Company)最近在阿拉斯加(Alaska)的北斯洛波(North Slope)发现了大的石油储量。为了大规模开发这一油田,首先必须建立相应的输运网络,使北斯洛波生产的原油能运至美国的3个装运港之一。在油田的集输站(结点C)与装运港(结点P1、P 、P3)之间需要若干个中间站,中间站之间的联通情况如图1所示,图中线2 段上的数字代表两站之间的距离(单位:10千米)。试确定一最佳的输运线路,使原油的输送距离最短。 解:最短路线有一个重要性质,即如果由起点A经过B点和C点到达终点D是一条最短路线,则由B点经C点到达终点D一定是B到D的最短路(贝尔曼最优化原理)。此性质用反证法很容易证明,因为如果不是这样,则从B 点到D点有另一条距离更短的路线存在,不妨假设为B—P—D;从而可知路线A—B—P—D比原路线A—B—C—D距离短,这与原路线A—B—C—D是最短路线相矛盾,性质得证。 根据最短路线的这一性质,寻找最短路线的方法就是从最后阶段开始,由后向前逐步递推求出各点到终点的最短路线,最后求得由始点到终点的最短路;即动态规划的方法是从终点逐段向始点方向寻找最短路线的一种方法。按照动态规划的方法,将此过程划分为4个阶段,即阶段变量4,3,2,1 k;取 x,按逆序算法求解。 过程在各阶段所处的位置为状态变量 k

04第四章 动态规划

第四章 动态规划初步 第一节 问题概览 一、问题的表述 与变分法和最优控制相比,动态规划处理离散时间与不确定性问题更有优势。在本章中,我们将简介在确定性下的动态规划的初步知识。我们从下面的问题开始: {}0 (1)((0))((),(1))max t t x t V x U x t x t β∞=∞* +=+∑ (P1) .. (1)(())s t x t G x t +∈, 对所有的时间t (0)x 给定。 约束说明在()x t 时(1)x t +的值。()x t 是状态变量,(1)x t +可以看作是t 时的控制变量。所以该约束说明给定状态变量如何确定控制变量。U 是瞬时回报(实值函数),U 不独立依赖于时间。 我们是要得到最优值序列{}0 (1)t x t ∞ *=+以使得((0))V x *最大,{}0 (1)t x t ∞ *=+被称 为最优计划(plan ),((0))V x *是值函数。我们把问题P1的形式称为序贯(sequence problem )问题。显而易见,((0))V x *与初始的(0)x 相关,即不同的(0)x 会导致不同的最优值。下面是一个该问题形式的具体例子: 例1:{} (),() max (())t c t k t t U c t β∞ =∑ .. (1)(())()(1)()s t k t f k t c t k t δ+=-+- ()0k t ≥,(0)k 给定。 该例子实际上就是代表性主体(或计划者)的Ramsey 问题。该问题不是标准的P1问题的形式,但是我们可以将它转化成P1的形式: {}0 (1)((0))((())(1)(1)())max t t k t V k U f k t k t k t βδ∞=*+=-++-∑ .. (1)[0,(())(1)()]s t k t f k t k t δ+∈+- 其中,()(())(1)(1)c t f k t k t k t δ=- ++-。对应P1式中:()()x t k t =,

2020年(决策管理)参考试题第四章决策

(决策管理)参考试题第四章决策

第四章决策 壹、单项选择题 1、有壹种说法认为"管理就是决策",这实际上意味着:(C) A.对于管理者来说只要善于决策就壹定能够获得成功 B.管理的复杂性和挑战性均是由于决策的复杂性而导致的 C.决策能力对于管理的成功具有特别重要的作用 D.管理首先需要的就是面对复杂的环境作出决策 2、有关活动尚未进行,从而环境未受到影响的情况下作出的决策是(C) A.长期决策 B.战术决策 C.初始决策 D.程序化决策 3、根据"企业运营单位组合分析图",下列哪壹项命题是不正确的?(C) A.幼童和瘦狗均可能被放弃 B.金牛能给企业带来最大的现金流 C.对幼童和明星均应该投入巨资以扩大其市场占有率 D.应用该方法决策要以"企业的目标是追求增长和利润"为前提 4、对某复杂问题进行系统分析,从而得到最满意的行动方案,可能需要做这样壹些工作:(1)对方案进行分析、比较、评价;(2)选择满意方案;(3)阐明问题现状;(4)提出可行备选方案;(5)明确决策目标。你认为正确的分析思路和程序应该是:(A) A.(5)(3)(4)(1)(2) B.(3)(4)(1)(2)(5) C.(5)(4)(3)(1)(2) D.(3)(5)(4)(1)(2) 5、政策指导矩阵是根据(D)将运营单位进行分类的。 A.业务增长率和相对竞争地位

B.业务增长率和行业市场前景 C.运营单位的竞争能力和相对竞争地位 D.运营单位的竞争能力和行业市场前景 6、某XX公司总裁决定进壹步采取授权行动,于XX公司内部推行民主管理。最近XX公司发文规定,于文件所列举的20种紧急情况下,壹线经理有权自主采取行动,但需将进展情况和结果及时方案上级经理。对于这壹安排,你认为下述描述中哪壹条最贴切?(D) A.这表明XX公司显著增加了壹线经理的决策权 B.XX公司有限度地扩大了壹线经理的自主决策权 C.如果无须方案上级经理,这种做法就是授权 D.这不是真正意义上的授权而只是壹种工作落实 7、某企业原先重大战略决策的基本过程是由各部门(如财务部、销售部、生产部、人事部等)独立把各自部门的情况写成方案送给总经理,再由总经理综合完成有关的战略方案。后来,对此过程作了些调整,这就是:总经理收到各部门呈上的方案后,有选择地找些管理人员来磋商,最后由自己形成决策。再后来,总经理于收到方案后,就把这些方案交给壹个有各部门人员共同参和组成的委员会,通过委员会全体成员的面对面讨论,最终形成有关决策。对此你的见法是:(C) A.这种处理方式的改变对企业战略决策以及其它方面的工作没什么影响 B.这种处理方式的改变能够大大提高企业决策的效率 C.这种处理方式的改变增加了信息沟通的范围,可带来更多的成员满意感 D.这种处理方式的改变提高了企业上下信息沟通的效率 8、当下社会上销售彩票的很多。壹家三口于抽奖时,常常喜欢让孩子来抽,请问这是遵循

运筹学--第七章 动态规划

189 习题七7.1计算如图所示的从A 到E 的最短路线及其长度(单位:km ): (1) 用逆推解法;2用标号法。 7.2 用动态规划方法求解下列问题 (1) max z =x 12x 2 x 33 x 1+x 2+x 3 ≤6 x j ≥0 (j =1,2,3) (2)min z = 3x 12+4x 22 +x 32 x 1x 2 x 3 ≥ 9 x j ≥0 (j =1,2,3) 7.3 利用动态规划方法证明平均值不等式: n n n x x x n x x x 12121)()( ≥+++ 设x i ≥0,i =1,2,…,n 。 7.4 考虑一个有m 个产地和n 个销地的运输问题。设a i (i =1,2,…,m )为产地i 可发运的物资数,b j (j =1,2,…,n )为销地j 所需要的物资数。又从产地i 到销地j 发运x ij 单位物资所需的费用为h ij (x ij ),试将此问题建立动态规划的模型。 7.5 某公司在今后三年的每一年的开头将资金投入A 或B 项工程,年末的回收及其概率如下表所示。每年至多做一项投资,每次只能投入1000万元。求出三年后所拥有的期望金额达到最大的投资方案。 投 资 回 收 概 率 A 0 0.4 2000 0.6 B 1000 0.9 2000 0.1 7.6 某公司有三个工厂,它们都可以考虑改造扩建。每个工厂都有若干种方案可供选择,各种方案的投资及所能取得的收益如下表所示(单位:千万元)。现公司有资金5千万元,问应如何分配投资使公司的总收益最大?

7.7 某厂准备连续3个月生产A种产品,每月初开始生产。A的生产成本费用为x2,其中x是A产品当月的生产数量。仓库存货成本费是每月每单位为1元。估计3个月的需求量分别为d1=100,d2=110,d3=120。现设开始时第一个月月初存货s0=0,第三个月的月末存货s3=0。试问:每月的生产数量应是多少才使总的生产和存货费用为最小。 7.8 设有一辆载重卡车,现有4种货物均可用此车运输。已知这4种货物的重量、容积及价值关系如下表所示。 货物代号重量(吨)容积(立方米)价值(千元) 1 2 2 3 2 3 2 4 3 4 2 5 4 5 3 6 若该卡车的最大载重为15吨,最大允许装载容积为10立方米,在许可的条件下,每车装载每一种货物的件数不限。问应如何搭配这四种货物,才能使每车装载货物的价值最大。 7.9 某警卫部门有12支巡逻队负责4个仓库的巡逻。按规定对每个仓库可分别派2-4支队伍巡逻。由于所派队伍数量上的差别,各仓库一年内预期发生事故的次数如下表所示。试应用动态规划的方法确定派往各仓库的巡逻队数,使预期事故的总次数为最少。 巡逻队数预期事故次数仓库 1 2 3 4 2 18 38 14 34 3 16 36 12 31 4 12 30 11 25 7.10 (生产计划问题)根据合同,某厂明年每个季度末应向销售公司提供产品,有关信息见下表。若产品过多,季末有积压,则一个季度每积压一吨产品需支付存贮费0.2万元。现需找出明年的最优生产方案,使该厂能在完成合同的情况下使全年的生产费用最低。 季度j生产能力a j(吨)生产成本d j(万元/吨)需求量b j(吨) 1 30 15.6 20 2 40 14.0 25 3 25 15.3 30 4 10 14.8 15 (1)请建立此问题的线性规划模型。(提示:设第j季度工厂生产产品x j吨,第j季度初存贮的产品为y j吨,显然y1=0)(2)请建立此问题的动态规划模型。(均不用求解) 190

2021版高三数学(新高考)一轮复习检测 (40)第6章第三讲简单的线性规划

[练案40]第三讲 简单的线性规划 A 组基础巩固 一、单选题 1.关于x ,y 的不等式组??? 3x +y -6≥0, x -y -2≤0, x +y -4≤0 表示的平面区域的面积为 ( C ) A .3 B .52 C .2 D .32 [解析] 平面区域为一个直角三角形ABC ,其中A(3,1),B(2,0),C(1,3),所以面积为12|AB |·|AC|=1 2 ×2×8=2,故选C. [方法总结] 求平面区域的面积的方法 平面区域的面积问题主要包括两类题型:(1)求已知约束不等式(组)表示的平面区域的面积;(2)根据平面区域面积的大小及关系求未知参数,求解时需抓住两点:(1)正确判断平面区域的形状,如果形状不是常见的规则平面图形,则要进行分割;(2)求参数问题一般涉及一条动直线,因此确定其位置显得更为关键,有时还要对动直线的位置进行分类讨论. 2.(2020·黑龙江省大庆市模拟)设x ,y 满足约束条件??? x +y -1≥0 x -y +1≥0 x ≤3 , 则z =2x -3y 的最小值是( B ) A .-7 B .-6 C .-5 D .-3 [解析] 作出可行域:

并作出直线l 0:2x -3y =0,平移l 0 到经过点E(3,4)时,目标函数z =2x -3y , 取得最小值为:z min =2×3-3×4=-6.故选B. 3.(2020·河北省唐山市模拟)若x ,y 满足约束条件??? 3x -y -3≤0 x +y -1≥0 x -y +1≥0 则 z =2x +y 的最大值为( C ) A .1 B .2 C .7 D .8 [解析] 作出线性约束条件的可行域,如图示: 由?? ? 3x -y -3=0x -y +1=0 ,解得A(2,3), 由z =2x +y 得y =-2x +z ,平移直线y =-2x , 显然直线过A(2,3)时,z 最大,最大值是7,故选C. 4.(2020·浙江湖州、衢州、丽水三地市期中)已知实数x ,y 满足 ??? 2x +3y -6≤0x +y -2≥0,y ≥0 则x 2+y 2的最小值是( B ) A . 2 B .2

参考试题第四章决策

第四章决策 一、单项选择题 1、有一种说法认为"管理就是决策",这实际上意味着:( C ) A.对于管理者来说只要善于决策就一定能够获得成功 B.管理的复杂性和挑战性都是由于决策的复杂性而导致的 C.决策能力对于管理的成功具有特别重要的作用 D.管理首先需要的就是面对复杂的环境作出决策 2、有关活动尚未进行,从而环境未受到影响的情况下作出的决策是( C ) A.长期决策 B.战术决策 C.初始决策 D.程序化决策 3、根据"企业经营单位组合分析图",下列哪一项命题是不正确的?( C ) A.幼童和瘦狗都可能被放弃 B.金牛能给企业带来最大的现金流 C.对幼童和明星都应该投入巨资以扩大其市场占有率 D.应用该方法决策要以"企业的目标是追求增长和利润"为前提 4、对某复杂问题进行系统分析,从而得到最满意的行动方案,可能需要做这样一些工作: (1) 对方案进行分析、比较、评价;(2) 选择满意方案;(3) 阐明问题现状;(4) 提出可行备选方案;(5)明确决策目标。你认为正确的分析思路与程序应该是:( A ) A.(5) (3) (4) (1) (2) B.(3) (4) (1) (2) (5) C.(5) (4) (3) (1) (2) D.(3) (5) (4) (1) (2) 5 、政策指导矩阵是根据( D )将经营单位进行分类的。 A.业务增长率和相对竞争地位 B.业务增长率和行业市场前景 C.经营单位的竞争能力与相对竞争地位 D.经营单位的竞争能力与行业市场前景 6、某公司总裁决定进一步采取授权行动,在公司内部推行民主管理。最近公司发文规定,在文件所列举的20 种紧急情况下,一线经理有权自主采取行动,但需将进展情况和结果及时报告上级经理。对于这一安排,你认为下述描述中哪一条最贴切? ( D ) A.这表明公司显著增加了一线经理的决策权 B.公司有限度地扩大了一线经理的自主决策权 C.如果无须报告上级经理,这种做法就是授权 D.这不是真正意义上的授权而只是一种工作落实 7、某企业原先重大战略决策的基本过程是由各部门(如财务部、销售部、生产部、人事部等)独立把各自部门的情况写成报告送给总经理,再由总经理综合完成有关的战略方案。后来,对此过程作了些调整,这就是:总经理收到各部门呈上的报告后,有选择地找些管理人员来磋商,最后由自己形成决策。再后来,总经理在收到报告后,就把这些报告交给一个有各部门人员共同参与组成的委员会,通过委员会全体成员的面对面讨论,最终形成有关决策。对此你的看法是:(C) A.这种处理方式的改变对企业战略决策以及其它方面的工作没什么影响 B.这种处理方式的改变可以大大提高企业决策的效率 C.这种处理方式的改变增加了信息沟通的范围,可带来更多的成员满意感 D.这种处理方式的改变提高了企业上下信息沟通的效率 8、现在社会上销售彩票的很多。一家三口在抽奖时,常常喜欢让孩子来抽,请问这是遵循了什么决策原则?( A ) A. 乐观原则 B.悲观原则 C.折衷原则 D.最小最大后悔值原则 9、某企业集团拟投资开发新产品,现有两个方案,假定其开发费用相同。开发甲产品,估计投产后,市场竞争不激烈时每年可获利150万元,市场竞争激烈时每年亏损50万元。开发乙产品,估计投产后无论市场竞争激烈与否,每年均可获利70万元。根据预测,这两种拟开发的产品投产后,出现市场竞争不激烈情况的概率为0.6,出现市场竞争激烈情况的概率为0.4。如果只能在这两个方案中选一个,你的评价是什么?( B )

相关主题
文本预览
相关文档 最新文档