多阶段决策问题

格式：ppt
大小：3.50 MB
文档页数：25

下载文档原格式

第六章多阶段决策

θ θ1 θ2 θ3
P（θ） 0.4 0.3 0.3
a1
40000
a2
30000
a3
10000
20000
30000
10000
-30000 -20000 10000
为了更正确地了解市场情况，正式投产前可先生产少量产品试销。由于要增添少量生产设备等原因，试销费需要600元。由于试销前未做广告，顾客对产品不太了解，加之试销量较小，试销结果不很准确。假设试销结果分为产品受欢迎（H1）、一般（H2）和不受欢迎（H3）三种，其准确度见表。
（3）如果不试销，应大批生产、中批生产还是小批生产？如果试销，又应该如何根据试销结果决定其行动？
第二节序列决策
序列决策：有些问题，在进行决策后又产生一些新情况，需要进行新的决策，接着又有一些新的情况，又需要进行新的决策。这样就构成一个序列，这就是序列决策。
例 6-3 设某石油勘探队，在一片估计能出油的荒田钻探，可以先做试验，然后决策钻井与否。或者不做试验，只凭经验决策钻井与否。做试验的费用为每次3000元，钻井费用为10000元。若钻井后出油，井队可收入 40000 元；若不出油就没有收入。各种情况下出油的概率已估计出，并标在图 6-2 上。问钻井队该如果决策使其期望收入值最大。
θ θ1 θ2 θ3
P（θ） P(H1|θ ) 0.4 0.4 0.3 0.2 0.3 0.4
P(H2|θ )
P(H3|θ )
0.3 0.4 0.5
0.3 0.4 0.1
如不买此技术，把这笔费用用在其它方面，在同样的时期可获利ห้องสมุดไป่ตู้000元。那么，该公司应该如何决策？（1）是否买技术？
（2）如果买技术，是否采取试销方法？

多阶段决策问题与动态规划

s1=1000, x1*=0 s2=900, x2*=0 s3=810, s4=576, x4*=576 s5=397, x5*=397 x3*=810
4.4 动态规划的应用(一)
1 求解静态规划问题
某些静态规划问题可用动态规划法来求解。
例用动态规划法求解 max z=x12.x22.x3 x1+x2+x3=c xi≥0 i=1,2,3
值函数； (6) 写出递推方程和边界条件，建立基本方程； (7) 按照基本方程递推求解。
以上步骤是动态规划法处理问题的基本步骤，其中的前六步是建立动态规划模型的步骤。
例：机器负荷问题某种机器可以在高低两种不同的负荷下进行生产．在高负荷下进行生产时，产品的年产量g和投入生产的机器数量u的关系为 g＝8u, 这时机器的年完好率为a=0.7 ．在低负荷下生产时，产品的年产量h和投入生产的机器数量v的关系为h＝5v, 这时机器的年完好率为b=0.9．假定开始生产时完好的机器数量为s1，要求制定一个五年计划,在每年开始时决定机器在两种不同负荷下生产的数量 ,使五年内产品的总产量最高。
解: (1)按年数划分为5个阶段，k=1,2,3,4,5
(2)取第k年初完好的机器数sk为状态变量, s(31)=取10第00k年投入高负荷的机器数xk为决策变量, 0≤xk≤sk (4)状态转移方程为 sk+1=0.7xk+0.9(sk-xk)=0.9sk-0.2xk
(5)指标函数为Vk,5=∑[8xj+5(sj-xj)]=∑(5sj+3xj)
(6)基本方程为
fk(sk)＝ max {5sj+3xj +fk+1(sk+1)}
k=5,4,3,2,1

第10章动态规划

②某些情况下，用动态规划处理不仅能定性描述分析，且可利用计算机给出求其数值解的方法。
管理运筹学
7
缺点
①没有统一的处理方法，求解时要根据问题的性质，结合多种数学技巧。因此实践经验及创造性思维将起重要的引导作用；
②“维数障碍”，当变量个数太多时，由于计算机内存和速度的限制导致问题无法解决。有些问题由于涉及的函数没有理想的性质使问题只能用动态规划描述，而不能用动态规划方法求解。
盈利工厂设备台数
0 1 2
3 4 5
甲厂
0 3 7 9 12 13
乙厂
0 5 10 11 11 11
管理运筹学
29
第一阶段：只有1个始点A，终点有B1,B2,B3,B4 。对始点和终点进行分析和讨论分别求A到B1,B2,B3,B4的最短路径问题：
表10-4
本阶段始点(状态)
A
阶段1 本阶段各终点（决策）
B1
B2
B3
B4
4+12=16 3+13=16 3+14=17 2+12=14
到E的最本阶段最优终短距离点(最优决策)
第四阶段：两个始点D1和D2，终点只有一个；
表10-1
阶段4
本阶段始点本阶段各终点（决策）到E的最短距离
（状态）
E
D1
10
10
D2
6
6
分析得知：从D1和D2到E的最短路径唯一。
本阶段最优终点（最优决策)
E E
管理运筹学
27
第三阶段：有三个始点C1，C2，C3，终点有D1，D2，对始点
和终点进行分析和讨论分别求C1，C2，C3到D1，D2 的最短路

第九章多阶段决策和序贯决策

第一步，画出决策树图。
-700
2
建大厂
4
销路好0.7
销路差0.3
5
销路好0.9 销路差0.1
1
-400
建小厂
8
扩建
-300
6
销路好0.7
3
不扩建
9
销路差0.3
7
210
-40
-40
销路好0.9
210
销路差0.1
-40
销路好0.9
90
销路差0.1
60
60
3年内
7年内
第二步，从右向左计算各点的期望收益值。
第二阶段决策：产量不变，还是增加产量。
30 5
82 买专利决
策自行研制
65
失败 0.2
95 产量不变 6
82
3
1 成功0.8
95 7
增加产量
60
63 成功0.6
85 产量不变 4
8
2
85
量增加产
失败0.4
9
30
11
低0.1 中0.5 高0.4 低0.1
中0.5 高0.4
低0.1 中0.5 高0.4 低0.1
方案收益状态
按原工艺方案生产
(万元)
买专利(0.8)
产量不变
增产
自研(0.6)
产量不变
增产
价低 0.1 -100 -200 -300 -200 -300
中 0.5 0 50 50 0 -250
价高 0.4 100 150 250 200 600
第一阶段决策问题：购买专利，还是自行研制
200
销路不好(0.2)

动态规划_多阶段决策问题的求解方法

动态规划_多阶段决策问题的求解方法1.构造状态网络; :一:解决多阶段决策最优化的过程为动态规划方法在程序设计中，有一类活动的过程，由于它的特殊性，可将过程2.根据状态转移关系和状态转移方程建立最优值的分成若干个互相联系的阶段，在它的每一阶段都需要做出决策，从而3.按阶段的先后次序计算每个状态的最优值。

使整个过程达到最好的活动效果。

因此各个阶段决策的选取不能任逆向思维法是指从问题目标状态出发倒推回初始意确定，它依赖于当前面临的状态，又影响以后的发展。

当各个阶段态的思维方法。

动态规划的逆向思维法的要点可归纳为以决策确定后，就组成一个决策序列，因而也就确定了整个过程的一条 1.分析最优值的结构，刻画其结构特征; 活动路线。

这种把一个问题看作是一个前后关联具有链状结构的多 2.递归地定义最优值; 阶段过程就称为多阶段决策过程，这种问题称为多阶段决策问题。

3.按自底向上或自顶向下记忆化的方式计算最优在多阶段决策问题中，各个阶段采取的决策，一般来说是与时间有关的，决策依赖于当前状态，又随即引起状态的转移，一个决策序列如果原问题可以分解成几个本质相同、规模较小的就是在变化的状态中产生出来的，故有"动态"的含义，我们称这种就会联想到从逆向思维的角度寻求问题的解决。

一般解决多阶段决策最优化的过程为动态规划方法。

策问题多采用动态规划逆向思维方法解决。

二、举:二:动态规划最优化原理 pascal 语例说明本文以信息学奥赛用语言——最优化原理是动态规划的基础。

任何一个问题，如果失去了这言为编程个最优化原理的支持，就不可能用动态规划方法计算。

这个“最优化说明，其他编程语言编写方法相同，语句类似。

原理”如果用数学化一点的语言来描述的话，就是:假设为了解决某 :一:问题描述一优化问题，需要依次作出 n 个决策 D1，D2，，Dn，如若这个决策设有 N 个不相同的整数组成的数列，记为: 序列是最优的，对于任何一个整数 k，1 < k < n，不论前面 k 个决策是怎样的，以后的最优决策只取决于由前面决策所确定的当前状态，即 ()且 ?? a1 a2 an aiajij以后的决策 Dk+1，Dk+2，，Dn 也是最优的。

动态规划和几个经典问题

动态规划和⼏个经典问题动态规划 (本⽂适合⼊门理解思想，后期多刷题) 动态规划是运筹学的⼀个分⽀，是求解多阶段决策过程最优化问题的数学⽅法，在经济管理、⼯程技术、⼯农业⽣产及军事部门中都有着⼴泛的应⽤，并且获得了显著的效果。

学习动态规划，我们⾸先要了解多阶段决策问题。

多阶段决策问题例⼦：⽣产决策问题：企业在⽣产过程中，由于需求是随时间变化的，因此企业为了获得全年的最佳⽣产效益，就要在整个⽣产过程中逐⽉或逐季度地根据库存和需求决定⽣产计划。

机器负荷分配问题：某种机器可以在⾼低两种不同的负荷下进⾏⽣产。

要求制定⼀个五年计划，在每年开始时，决定如何重新分配完好的机器在两种不同的负荷下⽣产的数量，使在五年内产品的总产量达到最⾼。

航天飞机飞⾏控制问题：由于航天飞机的运动的环境是不断变化的，因此就要根据航天飞机飞⾏在不同环境中的情况，不断地决定航天飞机的飞⾏⽅向和速度（状态），使之能最省燃料和完成飞⾏任务（如软着陆）。

多阶段决策过程的特点：根据过程的特性可以将过程按空间、时间等标志分为若⼲个互相联系⼜互相区别的阶段。

在每⼀个阶段都需要做出决策，从⽽使整个过程达到最好的效果。

各个阶段决策的选取不是任意确定的，它依赖于当前⾯临的状态，⼜影响以后的发展。

当各个阶段的决策确定后，就组成了⼀个决策序列，因⽽也就决定了整个过程的⼀条活动路线，这样的⼀个前后关联具有链状结构的多阶段过程就称为多阶段决策问题。

针对多阶段决策过程的最优化问题，美国数学家Bellman等⼈在20世纪50年代初提出了著名的最优化原理，把多阶段决策问题转化为⼀系列单阶段最优化问题，从⽽逐个求解，创⽴了解决这类过程优化问题的新⽅法：动态规划。

对最佳路径（最佳决策过程）所经过的各个阶段，其中每个阶段始点到全过程终点的路径，必定是该阶段始点到全过程终点的⼀切可能路径中的最佳路径（最优决策），这就是Bellman提出的著名的最优化原理。

多阶段决策过程

动态规划多阶段决策过程（multistep decision process ）是指这样一类特殊的活动过程，过程可以按时间顺序分解成若干个相互联系的阶段，在每一个阶段都需要做出决策，全部过程的决策是一个决策序列。

动态规划（dynamic programming ）算法是解决多阶段决策过程最优化问题的一种常用方法，难度比较大，技巧性也很强。

利用动态规划算法，可以优雅而高效地解决很多贪婪算法或分治算法不能解决的问题。

动态规划算法的基本思想是：将待求解的问题分解成若干个相互联系的子问题，先求解子问题，然后从这些子问题的解得到原问题的解；对于重复出现的子问题，只在第一次遇到的时候对它进行求解，并把答案保存起来，让以后再次遇到时直接引用答案，不必重新求解。

动态规划算法将问题的解决方案视为一系列决策的结果，与贪婪算法不同的是，在贪婪算法中，每采用一次贪婪准则，便做出一个不可撤回的决策；而在动态规划算法中，还要考察每个最优决策序列中是否包含一个最优决策子序列，即问题是否具有最优子结构性质。

动态规划算法的有效性依赖于待求解问题本身具有的两个重要性质：最优子结构性质和子问题重叠性质。

1 、最优子结构性质。

如果问题的最优解所包含的子问题的解也是最优的，我们就称该问题具有最优子结构性质（即满足最优化原理）。

最优子结构性质为动态规划算法解决问题提供了重要线索。

2 、子问题重叠性质。

子问题重叠性质是指在用递归算法自顶向下对问题进行求解时，每次产生的子问题并不总是新问题，有些子问题会被重复计算多次。

动态规划算法正是利用了这种子问题的重叠性质，对每一个子问题只计算一次，然后将其计算结果保存在一个表格中，当再次需要计算已经计算过的子问题时，只是在表格中简单地查看一下结果，从而获得较高的解题效率。

当我们已经确定待解决的问题需要用动态规划算法求解时，通常可以按照以下步骤设计动态规划算法：1 、分析问题的最优解，找出最优解的性质，并刻画其结构特征；2 、递归地定义最优值；3 、采用自底向上的方式计算问题的最优值；4 、根据计算最优值时得到的信息，构造最优解。

多阶段决策过程最优化问题研究

地区预期创造的销售收入见表１．表１每个地区可能创造的销售收入
Ｔａｂ．１Ｐｏｓｉｅｓｌｅｎｒａｅａｃｒａｓｂｌａｅｒｖｅｕｅｃｅｔｄｂｙｅｈａｅ
从表１中可以看出，果没有在华北和华东地区建样板店，么这两个地区的销售收入为０如果没有在华南地区建样板如那．店，南地区仍可以通过订购系统获得每月２万元的销售收入．个问题的目标函数是在建样板店的个数有限的条件下，何华这如
０引言
在实践中，常会遇到这样的决策问题 “ ：于过程的特殊性，以将决策的全过程依据时间或空间划分为若干个相常由可互联系的阶段．态规划方法的关键是将多阶段的决策问题变换成一系列的单阶段问题，逐一求解．阶段的决策过程很动并多难直观地描述，文通过一个实例来说明动态规划解决多阶段决策问题的方法和过程．本
１１第三阶段决策．
将在华南地区建多少样板店作为问题第三阶段的决策．动态规划中假设第三阶段的决策是决策过程中的最终决策，在因此，果将在华东、北地区建样板店作为规划的第二阶段和第一阶段，么在华南地区建几个样板店的决策是建立在另两如华那

1.多阶段决策过程2.Bellman最优性原理3.动态规划的数学描述

2019/3/8
例7-3的求解
依此类推可求得：
*u3=S3 f3 (S3 ) = 17.5S3 *u2= 0 f2 (S2 ) = 20.8S2 *u1= 0 f1 (S1 ) = 23.7S1 =23700(件)
计算结果表明，前两年应把全部完好设备均投入低负荷生产；而后三年应把全部完好设备均投入高负荷生产。这样所得的产量最高，其最高产量为23700件。各年年初的状态为： S1 =
[例7-2]: 第119页某公司拟将500万元的资本投入所属的甲、乙、丙三个工厂，各工厂获得投资后年利润将有相应的增长，一定投资下的利润增长额如下表所示，试确定最优的投资分配方案，使公司年利润增长额最大。投资(百万元) 1 2 3 4 5 甲 0.3 0.7 0.9 1.2 1.3 乙 0.5 1.0 1.1 1.1 1.1 丙 0.4 0.6 1.1 1.2 1.2
2019/3/8
阶段指标函数
阶段指标函数是对应某一阶段决策的效率度量，用gk=rk (Sk, dk)来加以表示。
2019/3/8
过程指标函数
过程指标函数是用来衡量所实现过程优劣的数量指标，它是定义在全过程（策略）或后续子过程（子策略）上的数量函数。过程指标函数常用 Rk,,N 来表示，构成动态规划的过程指标函数应具有可分性并满足递推关系，即Rk,,N 可表示为rk 和 Rk+1,N二者的函数。最常见的过程指标函数与阶段指标函数的关系有如下两种： 1.过程指标函数是阶段指标函数的和，此时 Rk,,N =rk +Rk+1,N 2.过程指标函数是阶段指标函数的积，此时 Rk,,N =rk Rk+1,N
2019/3/8
例7-2的求解

序贯决策

13
1.多阶段决策多阶段决策
1.3 应用举例
P ( H1 ) = ∑ P ( H1 θ j ) P(θ j )
j =1 3
= 0.4 × 0.4 + 0.3 × 0.2 + 0.32 × 0.4 = 0.34
P (θ1 H1 ) = P ( H1 θ1 ) P (θ1 ) P( H1 ) = 0.4 × 0.4 = 0.471 0.34
0.2 × 0.3 = = 0.177 0.34 = 0.4 × 0.3 = 0.352 0.34
P (θ2 H1 ) =
P ( H1 θ2 ) P (θ2 ) P( H1 ) P ( H1 θ3 ) P(θ3 ) P( H1 )
P (θ3 H1 ) =
14
1.多阶段决策多阶段决策
1.3 应用举例试销结果下的后验概率
16
2. 序列决策
有些决策问题，有些决策问题，在进行决策后又产生一些新情况需要进行新的决策，接着又有一些新的情况，，需要进行新的决策，接着又有一些新的情况，有需要进行新的决策。这样决策、新情况、决策…，需要进行新的决策。这样决策、新情况、决策，就构成一个系列，成为系贯决策。就构成一个系列，成为系贯决策。多阶段决策的阶段数是确定的，多阶段决策的阶段数是确定的，序贯决策的阶段数是不确定的，数是不确定的，它依赖于执行决策过程中所出现的状况。状况。决策方法：决策方法：决策树
20
3. 马尔可夫决策
3.1 马尔可夫决策问题预测在本质上就是利用预测对象的历史数据去推知预测对象的未来。知预测对象的未来。在经济管理现象中存在一种“无后效性” 在经济管理现象中存在一种“无后效性”，即“ 系统在每一时刻的状态仅仅取决于前一时刻的状态而与其过去的历史无关。，而与其过去的历史无关。” 例如：池塘里有三张荷叶，编号为，，，例如：池塘里有三张荷叶，编号为1，2，3，假设有一只青蛙随机地在荷叶上跳来跳去，设有一只青蛙随机地在荷叶上跳来跳去，在初始时它在2号荷叶上在时刻，它有可能跳到1号或号荷叶上。刻，它在号荷叶上。在时刻，它有可能跳到号或号荷叶上，者3号荷叶上，也有可能原地不动。号荷叶上也有可能原地不动。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

表示什么？
三、用最优化原理解某些资源分配问题
四、复合系统可靠性问题
部件1
部件2
……
部件n
作业 p. 181: 题一、旅行售货员问题
旅行售货员问题(Traveling Salesperson Problem, 简称TSP问题)是优化问题中一个著名问题，许多优化问题(包括许多实际问题)都可以化为旅行售货员问题。
从v0出发，经过n个城市v1, v2, … , vn，然后回v0。设从vi到vj的距离为dij，其中dij可能不等于dji；如果没有直接从vi到vj的路，则设dij = ∞。找一条最短路线。
6 8
v1 7 8
9
v0
9 7
5
6 v3
5
5
8
v2
v0 v1 v2 v3
0856
v0
6085
v1
D=
7905
v2
9780
v3
二、多阶段资源分配问题
投入 y1
资源 u1
投入 z1
收益 g(y1)
生产A 回收 ay1
投入 y2
资源 u2
生产B
回收 bz1
投入 z2
收益 h(z1)
生产A 生产B

多阶段决策问题

合集下载

第六章多阶段决策

多阶段决策问题与动态规划

第10章动态规划

第九章多阶段决策和序贯决策

动态规划_多阶段决策问题的求解方法

动态规划和几个经典问题

多阶段决策过程

多阶段决策过程最优化问题研究

1.多阶段决策过程2.Bellman最优性原理3.动态规划的数学描述

序贯决策

文档推荐

最新文档

多阶段决策问题

合集下载

第六章 多阶段决策

多阶段决策问题与动态规划

第10章 动态规划

第九章多阶段决策和序贯决策

动态规划_多阶段决策问题的求解方法

动态规划和几个经典问题

多阶段决策过程

多阶段决策过程最优化问题研究

1.多阶段决策过程2.Bellman最优性原理3.动态规划的数学描述

序贯决策

文档推荐

最新文档

第六章多阶段决策

第10章动态规划