矩阵对策论
- 格式:ppt
- 大小:242.00 KB
- 文档页数:56
矩阵对策问题及其解法背景对策论研究具有竞争性质的现象。
有权决定⾃⾝⾏为的对策参加者称为局中⼈,所有局中⼈构成集合I,在⼀局对策中可供剧中⼈选择的⼀个实际可⾏的完整的⾏动⽅案成为策略,对于任意剧中⼈i∈I,都有⾃⼰的策略集S i。
⼀局对策中由各剧中⼈选定的策略构成的策略组称为局势s=(s1,...,s n),⽽全体局势集合S=S1×...×S n。
局势决定了对策的结果,对局势s∈S,局中⼈i可以得到收益H i(s),也称为局中⼈i的赢得函数。
矩阵对策即⼆⼈有限零和对策,是⼀类较为简单的对策模型。
矩阵对策基础我们假设,局中⼈ I 有纯策略α1,...,αm,局中⼈ II 有纯策略β1,...,βn,⼆者各选择⼀个纯策略则构成m×n个纯局势 (αi,βj),将 (αi,βj)下 I 的赢得值记为a i,j,设矩阵A=[a i,j],称为 I 的赢得矩阵或 II 的⽀付矩阵。
局中⼈ II 的赢得矩阵就是 −A T。
最优纯策略若纯局势 (a i∗,b j∗) 满⾜max i minj a i,j=minjmaxi a i,j=a i∗,j∗则称为矩阵对策 {S1,S2;A} 的最优纯策略。
显然,最有纯策略在赢得矩阵中对应的元素⼀定满⾜,其是所在⾏的最⼩元素,也是所在列的最⼤元素,即矩阵的鞍点。
混合策略当纯策略不存在时,我们希望给出⼀个选取不同策略的概率分布。
我们记 I,II 的概率分布向量分别为x,y,所有概率分布向量构成的集合为S1,S2,则局中⼈ I 的赢得函数为E(x,y)=x T Ay。
纯策略是混合策略的特例。
若混合局势 (x∗,y∗) 满⾜max x miny E(x,y)=minymaxx E(x,y)=E(x∗,y∗)则称为矩阵对策 {S1,S2;A} 的最优混合策略。
同样,混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数E(x,y) 的鞍点。
对策论的基本概念引言对策论是一种重要的决策理论,它在多个领域,包括经济学、政治学、管理学等方面都有广泛的应用。
本文将介绍对策论的基本概念,包括对策、对策矩阵、纳什均衡等内容。
对策的定义对策是指在决策过程中,一方的行动将受到另一方行动的影响,从而引发一系列后续行动的反应。
对策是一种针对不确定性情况下的最佳决策方法,通过预测对手的可能行动并制定相应的应对策略来实现最优效果。
对策通常涉及两个或多个决策者之间的互动。
在对策中,每个决策者都试图通过选择最优的行动来达到自己的目标,同时也要考虑到对手的行动。
对策矩阵是对策论分析的基本工具之一,用于描述对策者在不同行动下的收益情况。
对策矩阵通常以表格形式呈现,横轴代表一个决策者的行动,纵轴代表另一个决策者的行动,每个单元格中的数值表示在特定行动组合下各方的收益。
例如,考虑两个决策者A和B在某个游戏中的对策矩阵如下:行动1 行动2 行动3行动1 2, 2 0, 3 1, 1行动2 1, 0 3, 2 2, 1行动3 1, 1 2, 2 0, 3在这个对策矩阵中,每个单元格表示A和B在特定行动组合下的收益情况。
例如,当A选择行动1,B选择行动2时,A的收益为0,B 的收益为3。
纳什均衡是对策论中的一个重要概念,指的是在对策矩阵中,各方在给定对手行动的情况下,选择能够最大化自己收益的行动组合。
在对策矩阵中,如果不存在更好的选择来取代当前的行动组合,那么该组合就是一个纳什均衡。
在纳什均衡下,每个决策者都无法通过改变自己的行动来获得更好的结果。
以前面的对策矩阵为例,在该矩阵中,行动组合(行动1, 行动2)是一个纳什均衡,因为在这种情况下,A选择行动1,B选择行动2时,双方的收益已经达到最大化。
结论对策论是一种重要的决策理论,可以应用于各种领域,帮助我们理解和分析决策者之间的互动和冲突。
本文介绍了对策的基本概念,包括对策、对策矩阵和纳什均衡。
了解对策论的基本概念将有助于我们更好地理解和解决复杂的决策问题。
§4.2 矩阵对策的基本理论(续)三 混合策略与混合扩充 1. 基本概念在上面的最优纯策略中,能够有最优纯策略的决策问题中存在一个鞍点,也就是必须有max(min )ij jia =)(max min iij ja如果 max(min )ij jia ≠)(max min iij ja那末,对策中双方没有最优纯策略,也就是没有在纯策略中的解,我们把这种对策称为无鞍点的对策。
比如:给定矩阵对策G :G={S 1,S 2,A},其中S 1={a 1, a 2 },S 2={β1,β2},1342A ⎛⎫= ⎪⎝⎭可知 )min (max ij jia =2 )(max min iij ja =3所以 )min (max ij jia ≠)(max min iij ja注:在齐王塞马的例子中也是没有鞍点。
在这种情况下,局中人应如何选择纯策略参加对策呢?这就需要估计选取各个策略可能性的大小来进行对策,或者说,用多大概率选取各个纯策略。
我们把每一个局中人用一定的概率选取纯策略来参加的对策称为混合策略。
例如上面的例子:假定:局中人甲以概率x 选取纯策略a 1;以概率1—x 选取纯策略a 2 局中人乙以概率y 选取纯策略β1;以概率1—y 选取纯策略β2⎪⎪⎭⎫⎝⎛--2431)1()()1()(2121x a x a y y ββ于是对局中人甲来说,他的期望赢得便是E (x , y ) =)1)(1(2)1(4)1(3y x y x y x xy --+-+-+ =224+++-y x xy=2/5)4/1)(2/1(4+---y x由此可见:当x =1/2时,即局中人甲以50% 的概率选纯策略a 1参加对策,他的赢得期望至少是5/2,但它不能保证超过5/2,因为当局中人乙取y =1/4时,会控制局中人甲不超过5/2。
因此5/2是局中人甲赢得的期望值。
同样,局中人乙取y =1/4时,才能保证他的支出不多于5/2.。