二人有限零和对策
- 格式:ppt
- 大小:900.00 KB
- 文档页数:26
《管理科学》名词解释1、管理就是管理者运用各种资源达成某既定目标的过程。
2、管理科学:是一门应用多学科与多领域理论、方法、技术和知识的综合性交叉学科,其目的是研究人类利用有限资源实现组织目标的管理活动方面的动态、复杂和创新的社会行为及其规律。
3、管理科学的基本特征:(1)以管理决策为基点;(2)以科学方法论为依据;(3)以系统观点为指导;(4)以数学模型为主要工具。
4、图解法只能用于两个变量的情况,并得到两个重要结论:(1)线性规划的约束集合是凸多面体;(2)线性规划若有最优解,则最优解一定能在凸多面体的角点(定点)上达到。
5、基本解:假设B为线性规划问题的基,对约束系数矩阵A目标函数系数响亮C,决策向量X进行分块处理,则有:A=(B,N),C=(CB,CN),X=[XB,XN]T,其中,N表示非基矩阵,XB表示基变量所构成的子向量,XN表示非基变量所构成的子向量,CN为非基变量所对应的目标函数所构成的子向量,由AX =b得到:AX=(B,N) [XB,XN]T=B XB +N XN=b,由此式解出XB,并令非基变量的取值等于零,得到X =[B-1b,0]T,则称X为基B 下的基本解。
6、线性整数规划:限制部分决策变量或全部决策变量只能取整数的线性规划。
7、非线性规划:目标或约束中含有非线性函数的优化问题成为非线性规划。
8、梯度:若f(X)在X0的领域内有连续一阶偏导数,则称f(X)在点X0对n个变元的偏导数组成的向量为f(X)在X0的梯度,记为▽f(X0)9、海赛阵:若f(X)在X0的领域内有连续二阶偏导数,则称f(X)在点X0对n个变元两两组合的二阶偏导数组成的矩阵为f(X)在X0的海赛阵,记为H(X0)10、多目标规划解法的基本思想:利用一个复合函数将多目标问题转化为单目标问题求解。
11、图与网络具有的两个基本要素:一是被研究的对象,通常用点来表示;二是所研究对象之间的某种特定关系,通常用点与点之间的连线表示12、边:两点之间不带箭头的联线由点及边构成的图称之为无向图13、弧:两点之间带箭头的联线由点及弧构成的图称之为有向图14、网络:在有向图D=(V,A)中,Vs为起点,Vt为终点,而对每一弧(Vi,Vj)∈A赋以量cij>0称为弧的容量,则称这样的有向图为一个网络,记为D=(V,A,C)15、树:一个无圈的连通图16、Dijkstra方法是求解最短路问题的一种有效方法17、网络图的组成要素:箭线、结点和线路18、确定型决策:这类决策问题只可能出现一种确定的自然状态,每个行动方案在这唯一的自然状态下的结局是可以计算出来的19、风险型决策:这类决策问题在决策过程中可以出现多种自然状态,每一个行动方案在不同自然状态下有不同的结局,且能预先估计出各个自然状态出现的概率20、完全不确定型决策;这类决策问题在决策过程中可以出现多种自然状态,但在这类决策问题中,不能预先估计出各个自然状态出现的概率,所以称之为完全不确定型决策21、决策树:是一种由结点和分支构成的由左向右横向展开的树状图形22、贝叶斯决策分三步走:先验分析、预验分析、后验分析23、效用值是风险下损益值在决策者心目中的满意程度的衡量尺度24、一般来讲,库存量不足会造成缺货损失,而库存量过大又会造成物质积压,库存费用增大,流动资金占用过大25、补充就是储存系统的输入26、状态:过程各阶段所处的“位置”称为状态27、某阶段初装台决定后,从这状态向下一阶段哪个状态演变的选择称为决策28、前一阶段的状态和决策决定了下一阶段的状态,它们之间的关系称为状态转移29、由阶段k=1至阶段k=n的全过程中,由每个阶段所选择的决策构成一决策序列,称之为一个策略30、层次分析法(简称AHP)是由美国匹兹堡大学教授T.L.Saaty在20世纪70年代中期提出的,它的基本思想是把一个复杂的问题分解为各个组成因素,并将这些因素按支配关系分组,从而形成一个有序的递阶层次结构。
矩阵对策问题及其解法背景对策论研究具有竞争性质的现象。
有权决定⾃⾝⾏为的对策参加者称为局中⼈,所有局中⼈构成集合I,在⼀局对策中可供剧中⼈选择的⼀个实际可⾏的完整的⾏动⽅案成为策略,对于任意剧中⼈i∈I,都有⾃⼰的策略集S i。
⼀局对策中由各剧中⼈选定的策略构成的策略组称为局势s=(s1,...,s n),⽽全体局势集合S=S1×...×S n。
局势决定了对策的结果,对局势s∈S,局中⼈i可以得到收益H i(s),也称为局中⼈i的赢得函数。
矩阵对策即⼆⼈有限零和对策,是⼀类较为简单的对策模型。
矩阵对策基础我们假设,局中⼈ I 有纯策略α1,...,αm,局中⼈ II 有纯策略β1,...,βn,⼆者各选择⼀个纯策略则构成m×n个纯局势 (αi,βj),将 (αi,βj)下 I 的赢得值记为a i,j,设矩阵A=[a i,j],称为 I 的赢得矩阵或 II 的⽀付矩阵。
局中⼈ II 的赢得矩阵就是 −A T。
最优纯策略若纯局势 (a i∗,b j∗) 满⾜max i minj a i,j=minjmaxi a i,j=a i∗,j∗则称为矩阵对策 {S1,S2;A} 的最优纯策略。
显然,最有纯策略在赢得矩阵中对应的元素⼀定满⾜,其是所在⾏的最⼩元素,也是所在列的最⼤元素,即矩阵的鞍点。
混合策略当纯策略不存在时,我们希望给出⼀个选取不同策略的概率分布。
我们记 I,II 的概率分布向量分别为x,y,所有概率分布向量构成的集合为S1,S2,则局中⼈ I 的赢得函数为E(x,y)=x T Ay。
纯策略是混合策略的特例。
若混合局势 (x∗,y∗) 满⾜max x miny E(x,y)=minymaxx E(x,y)=E(x∗,y∗)则称为矩阵对策 {S1,S2;A} 的最优混合策略。
同样,混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数E(x,y) 的鞍点。
两人有限零和博弈例题摘要:1.引言2.两人有限零和博弈的定义3.例题讲解3.1 题目背景3.2 博弈过程分析3.3 博弈结果及启示4.总结正文:在博弈论中,两人有限零和博弈是一种特殊的博弈模型,它指的是两个参与者在一定规则下进行的互动,其结果只有两种可能:赢或输,而且赢与输的和为零。
这种博弈模型广泛应用于经济学、社会学、政治学等多个领域。
接下来,我们将通过一个具体的例题来讲解两人有限零和博弈的原理及应用。
例题讲解:假设甲、乙两人进行一场扑克牌游戏,游戏规则如下:1.每人手中有5 张牌,且每张牌的点数分别为1 至5;2.游戏开始时,甲、乙两人分别随机抽取一张牌;3.甲、乙两人轮流进行出牌,每次出牌后,对手可以选择接受或拒绝;4.若对手接受,则游戏结束,双方点数之和为本次出牌的点数之和;5.若对手拒绝,则轮到对手出牌;6.游戏结束时,点数之和最大的一方获胜。
在这个例子中,我们可以分析甲、乙两人的策略。
为了获胜,甲、乙两人应该尽量使自己的点数之和最大化。
假设甲先出牌,且甲手中有1、2、3、4、5 五张牌,乙手中有a、b、c、d、e 五张牌,且a≤b≤c≤d≤e。
那么,甲应该如何出牌才能最大化获胜的概率呢?我们可以列出如下的出牌策略:1.如果乙手中有1、2、3、4、5 五张牌,那么甲应该选择最大的牌5;2.如果乙手中有1、2、3、4 四张牌,那么甲应该选择最大的牌4;3.如果乙手中有1、2、3 三张牌,那么甲应该选择最大的牌3;4.如果乙手中有1、2 两张牌,那么甲应该选择最大的牌2;5.如果乙手中有1 张牌,那么甲应该选择最大的牌1。
通过以上的策略分析,我们可以发现,甲、乙两人实际上在进行一场有限零和博弈。
甲要想获胜,就必须在保证自己利益的前提下,尽量削弱乙的竞争力。
同样,乙要想获胜,也必须在保证自己利益的前提下,尽量削弱甲的竞争力。
最终,博弈的结果将取决于甲、乙两人的策略选择。
通过这个例子,我们可以看到两人有限零和博弈的特点:参与者需要在保证自己利益的前提下,尽量削弱对手的竞争力。
两人有限零和博弈例题
摘要:
1.零和博弈的定义
2.两人有限零和博弈的概念
3.两人有限零和博弈的例题
4.解决两人有限零和博弈的方法
正文:
【1】零和博弈的定义
零和博弈,是指在博弈过程中,参与者的收益总和为零的一种博弈。
也就是说,在一个零和博弈中,一个参与者的收益总是与另一个参与者的损失相等。
这种博弈中,没有参与者可以从中获得超过另一个参与者的损失的收益。
【2】两人有限零和博弈的概念
两人有限零和博弈,是指只有两个参与者,且每个参与者都有有限个策略可以选择的零和博弈。
在这个博弈中,每个参与者都知道对方的所有策略和可能的结果,并且每个参与者的目标是最大化自己的收益。
【3】两人有限零和博弈的例题
例如,一个游戏中,参与者A 可以选择“石头”、“剪刀”或“布”,参与者B 也可以选择“石头”、“剪刀”或“布”。
他们的收益是由他们选择的策略决定的。
如果A 选择“石头”,B 选择“剪刀”,那么A 的收益是1,B 的收益是-1;如果A 选择“石头”,B 选择“布”,那么A 的收益是-1,B 的收益是1。
这个游戏就是一个两人有限零和博弈。
【4】解决两人有限零和博弈的方法
对于两人有限零和博弈,一种解决方法是使用博弈论中的“最小最大”策略。
这个策略是,每个参与者都选择他们认为对方最可能选择的策略,然后选择一个可以最大化自己收益的策略。
《习题2-1解答》第 1 页 共 1 页 习题2-1解答
1. 二人零和对策问题:两儿童玩石头—剪子—布的游戏,每人的出法只能在{石头,剪子,布}中选择一种,当他们各选定一种出法(亦称策略)时,就确定了一个“局势”。
也就决定了各自的输赢,若规定胜者得1分,负者得1-分,平手各得零分,则对于各种可能的局势(每一局势得分之和为零即零和),试用矩阵表示他们的输赢状况。
解: B 策略→
A 石头 策 剪子 略 布 ↓
2. 有6名选手参加乒乓球比赛,成绩如下:选手1胜2,4,5,6,负于3;选手2胜4,5,6,负于1,3;选手3胜1,2,4,负于5,6;选手4胜5,6,负于1,2,3;选手5胜3,6,负于1,2,4;若胜一场得1分,负一场得零分,试用矩阵表示输赢状况,并排序。
解: 1 2 3 4 5 6
1
2
3
4
5
6 3. 能源利用系统表示为加权有向图(如图所示),试用矩阵表示之。
解: C F J P Q R U
C F J P Q
R U
⎪⎪⎪⎭
⎫ ⎝⎛---011101110⎪⎪⎪⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛001001010011000001111110011101⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛---05.02.10008.13.0000000
0003.00005.1000000000100020005.100
02
00010。