5 同时博弈与序贯博弈
- 格式:pdf
- 大小:290.35 KB
- 文档页数:41
连续博弈的概念全文共四篇示例,供读者参考第一篇示例:连续博弈是博弈论中一个重要的概念,它描述了博弈的一种特定形式,即游戏在一系列连续的回合中进行,每一回合的决策都受前一回合的结果影响。
这种博弈形式不同于一次性的单次博弈,而是存在连续的互动和反复博弈。
在连续博弈中,参与者可以根据前一回合的结果来调整自己的策略,以获得更好的回报。
这种互动性和动态性使得连续博弈更具挑战性和复杂性,同时也更贴近现实生活中的许多实际情况。
在连续博弈中,参与者的决策往往受到对手的策略选择和游戏规则的限制。
他们需要不断地分析对手可能的行为,同时也要考虑自己的利益和目标,以在长期的博弈过程中取得最优的结果。
连续博弈的一个重要特点是信誉的建立和维持。
在多次互动中,参与者的决策会反映他们之前的行为和信誉,这会影响其他玩家对他们的看法和态度。
在连续博弈中,建立良好的信誉是非常重要的,它可以帮助玩家取得更好的结果和更大的收益。
另一个重要的概念是策略的演化和博弈的稳定性。
在连续博弈中,参与者的策略选择往往会随着时间的推移而发生变化,他们可能会根据对手的行为和游戏的胜率来调整自己的策略。
这种策略的变化和演化会导致博弈的稳定性出现变化,有些策略可能会变得稳定,而有些策略可能会被淘汰。
在现实生活中,连续博弈的概念可以应用于许多领域,如商业竞争、政治博弈、社会互动等。
人们可以通过分析对手的行为和不断优化自己的策略,来取得更好的效果和获得更大的利益。
连续博弈也提醒我们,与他人的互动是一个长期的过程,需要不断地学习和适应,才能在竞争中取得优势。
连续博弈是博弈论中一个重要的概念,它描述了一种具有动态性和互动性的博弈形式。
在连续博弈中,参与者需要不断地分析对手的行为和调整自己的策略,以获得最优的结果。
这种博弈形式不仅具有理论意义,也可以应用于现实生活中的各种情况,为人们提供有益的参考和启示。
第二篇示例:连续博弈是博弈论中一个重要的分支,它描述了博弈在一个连续时间内进行的情况。
博弈树例题(原创实用版)目录1.博弈树的概念和基本结构2.博弈树的分类和应用场景3.博弈树的例题解析4.博弈树的解题技巧和策略5.博弈树在人工智能和决策制定中的作用正文一、博弈树的概念和基本结构博弈树(Game Tree)是一种用于表示博弈过程的树形结构,主要用于分析和解决两人或多人之间的互动决策问题。
博弈树由节点、边和叶子组成,每个节点表示一个决策,边表示决策之间的概率转移,叶子表示最终的结果。
在博弈树中,每个参与者的决策对应着一棵子树,通过对比子树之间的胜率,可以找到最优的决策策略。
二、博弈树的分类和应用场景1.分类:博弈树根据参与者决策的顺序可以分为序贯博弈树和同时博弈树。
序贯博弈树表示参与者按照一定顺序依次做出决策,而同时博弈树则表示参与者在同一时间做出决策。
2.应用场景:博弈树广泛应用于经济学、社会学、政治学、军事战略等领域。
典型的应用场景包括价格博弈、拍卖、选举、战争策略等。
三、博弈树的例题解析例题:两人零和博弈假设甲乙两人进行零和博弈,甲方有策略 A 和策略 B,乙方有策略 X和策略 Y。
甲方选择策略 A 时,乙方选择策略 X 的概率为 0.6,选择策略 Y 的概率为 0.4;甲方选择策略 B 时,乙方选择策略 X 的概率为0.3,选择策略 Y 的概率为 0.7。
求甲方在两种策略下的最优选择。
解析:通过构建博弈树,可以发现甲方选择策略 A 时,期望收益为0.6*(-1)+0.4*0=-0.2;选择策略 B 时,期望收益为0.3*(-1)+0.7*0=-0.3。
因此,甲方应选择策略 A,乙方应选择策略 Y,才能达到最大收益。
四、博弈树的解题技巧和策略1.剪枝:在博弈过程中,可以对胜率较低的子树进行剪枝,以降低搜索空间,提高计算效率。
2.引入随机因素:在博弈树中,可以通过引入随机因素来模拟不确定性,从而提高模型的泛化能力。
3.采用启发式算法:对于复杂的博弈问题,可以采用启发式算法如Alpha-Beta 剪枝、Min-Max 算法等,来加速搜索过程。
第五章同时博弈与序贯博弈目录•5-1 正规型表示与展开型表示–树型表示转化为矩阵表示–矩阵表示转化为树型表示:信息集•5-2 同时决策与序贯决策的混合博弈•5-3 树型博弈的子博弈•5-4 子博弈精炼纳什均衡•5-6 连续支付情形的序贯博弈5-1 正规型表示与展开型表示•1.树型表示转化为矩阵表示•“进入者”只有一个决策节点,他有两个纯策略可以选择:进入和不进入。
•“垄断者”有四个可能的纯策略:–{容忍,容忍}、{对抗,对抗}、{对抗,容忍}、{容忍,对抗}。
•把首先行动的局中人放在行局中人的位置,后行动的局中人放在列局中人的位置。
•垄断者有不止一个纯策略可以导致相同的博弈结果。
•步骤:首先确定好可供每个局中人选择的纯策略的总数目,从而把表格的大小确定下来,然后在每个策略组合所对应的格子中,按照约定的规格填入相应的支付向量。
•2.矩阵表示转化为树型表示•问题:树型如何能够表达出局中人同时进行博弈的情况。
信息集•处理方法:用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集,并约定如下的理解:所论局中人只知道博弈是否进行到了他的这个信息集,但是在他知道博弈已经进行到他的这个信息集的情况下。
他不知道博弈究竟进行到这个信息集中的哪个决策节点。
注意•一个信息集罩住的必须首先是同一个局中人的决策节点。
•一个信息集罩住的必须是同一个局中人在同一个时点的决策节点。
•给予不被扁椭圆虚线罩住的每个决策节点以信息集的地位,是单点集的信息集。
•每一个决策位置都是一个信息集。
•在同一个信息集上,大自然、老天爷或者虚拟局中人必须给位于该信息集内的每个决策节点规定相同的行动选择集合。
(数量,内容均相同)•当博弈走到一个单点集的信息集时,面临决策的局中人对于博弈迄今的历史是清楚的,他清楚博弈具体走到了他的这个决策节点而不是别的决策节点。
但是当博弈走到一个非单点集的信息集时,面临决策的局中人对于博弈迄今的历史是不清楚的,他不清楚博弃具体走到了他的这个信息集里面的哪个决策节点。
Chapter06序贯博弈和同时博弈的结合序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves第6章Chapter 6序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves博弈类型Game Type概念Concepts分析技术Techniques of Analysis博弈树(扩展形式) Game Trees (Extensive form)收益表(策略形式) Payoff tables (Strategic form) 纯粹序贯博弈反转均衡Purely Sequential- Rollback move games equilibrium纯粹同时博弈Purely Simultaneousmove games纳什均衡Nash equilibriumSlide 2序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves在现实中,许多策略环境包含了这两种相互作用的成分。
In reality, many strategic situations contain elements of both types of interaction.而且,我们还可以使用扩展形式或策略形式分析任何一种博弈(可以交叉使用)。
Also, we can use either extensive form or strategic form for any type of game.Slide 3内容提要Outline兼具同时和序贯行动的博弈Games with both simultaneous and sequential moves改变博弈中的行动顺序Changing the order of moves in a game !改变分析方法Change in the method of analysis *三人博弈Three-player gamesSlide 4 兼具同时和序贯行动的博弈Games with Both Simultaneous and Sequential Moves典型的例子一般都是博弈者在一段比较长的时间内相互作用。
博弈论的分类博弈的分类博弈可以按照不同的分类方式进行分类,比如按照博弈者出招的顺序,博弈者对其他参与博弈者特征、策略空间和收益是否了解进行分类。
1、从按照博弈者出招的顺序、博弈持续时间和重复次数的角度,博弈可以分为静态博弈(Static Game)和动态博弈(Dynamic Game)。
静态博弈指的是参与博弈的各方同时采取策略,这些博弈者的收益取决于博弈者们不同的策略组合。
因此静态博弈又称为“同时行动的博弈”(Simultaneous-Move Games)。
有时候博弈方采取策略有先后,但是他们并不知道之前其他人做出的策略。
比如“囚徒困境”中罪犯1采取策略后,轮到罪犯2采取策略时他并不知道罪犯1所做出的策略。
动态博弈(序贯博弈)指的是在博弈中,参与博弈的博弈方所采取策略是有先后顺序的(Sequential-Move),且博弈者能够知道先采取策略者所选择的策略。
2、从博弈者对其他参与博弈者所了解的信息的完全程度,博弈可以分为完全信息博弈(Complete Information Game)与不完全信息博弈(Incomplete Information Game),以及完美信息博弈(Perfect Information Game)与不完美信息博弈(Imperfect Information Game),确定的博弈(Certainty Game)与不确定的博弈(Uncertain Game),对称信息博弈(Symmetric Game)与非对称信息博弈(Asymmetric Game)等等。
其中,完全信息是指博弈中每一个博弈者对其他博弈者的特征、策略空间和收益函数都了解,也就是博弈者的收益集(Pay offs)是所有博弈者都知道的。
完美信息是指博弈者完全知道在他采取策略时其他博弈者的所有策略信息。
完美信息是针对记忆而言,也就是他知道博弈已经发生过程的所有信息。
又或者说,如果博弈者在采取策略时观察到他所处的信息节点是唯一的,即他知道以前发生的所有事情,如果所处的信息节点不唯一,说明他对之前的信息没有完美的记忆(不知道博弈过程是怎么过来的)。
第五章同时博弈与序贯博弈
目录
•5-1 正规型表示与展开型表示–树型表示转化为矩阵表示
–矩阵表示转化为树型表示:信息集•5-2 同时决策与序贯决策的混合博弈•5-3 树型博弈的子博弈
•5-4 子博弈精炼纳什均衡
•5-6 连续支付情形的序贯博弈
5-1 正规型表示与展开型表示•1.树型表示转化为矩阵表示
•“进入者”只有一个决策节点,他有两个纯策略可以选择:进入和不进入。
•“垄断者”有四个可能的纯策略:
–{容忍,容忍}、{对抗,对抗}、{对抗,容忍}、{容忍,对抗}。
•把首先行动的局中人放在行局中人的位置,后行动的局中人放在列局中人的位置。
•垄断者有不止一个纯策略可以导致相同的博弈结果。
•步骤:首先确定好可供每个局中人选择的纯策略的总数目,从而把表格的大小确定下来,然后在每个策略组合所对应的格子中,按照约定的规格填入相应的支付向量。
•2.矩阵表示转化为树型表示
•问题:树型如何能够表达出局中人同时进行博弈的情况。
信息集
•处理方法:用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集,并约定如下的理解:所论局中人只知道博弈是否进行到了他的这个信息集,但是在他知道博弈已经进行到他的这个信息集的情况下。
他不知道博弈究竟进行到这个信息集中的哪个决策节点。
注意
•一个信息集罩住的必须首先是同一个局中人的决策节点。
•一个信息集罩住的必须是同一个局中人在同一个时点的决策节点。
•给予不被扁椭圆虚线罩住的每个决策节点以信息集的地位,是单点集的信息集。
•每一个决策位置都是一个信息集。
•在同一个信息集上,大自然、老天爷或者虚拟局中人必须给位于该信息集内的每个决策节点规定相同的行动选择集合。
(数量,内容均相同)
•当博弈走到一个单点集的信息集时,面临决策的局中人对于博弈迄今的历史是清楚的,他清楚博弈具体走到了他的这个决策节点而不是别的决策节点。
但是当博弈走到一个非单点集的信息集时,面临决策的局中人对于博弈迄今的历史是不清楚的,他不清楚博弃具体走到了他的这个信息集里面的哪个决策节点。
完美和不完美
•历史,也是一种信息。
历史清楚的博弈,叫做完美信息的博弈,历史不清楚的博弈,叫做不完美信息的博弈。
•非单点集的信息集的作用,在于说明所论局中人在决策时面对不完美信息的局面,即他不能根据自己现有的信息对位于信息集内的决策节点进行区分,他不知道自己现在究竟位于这个信息集的哪个决策节点上。
定义
•定义:如果一个序贯博弈的每个信息集都是一个单点集,那么么该序贯博弈就是完美信息博弈。
否则,它就是不完美信息博弈。
•同集同注
例子
•女方不清楚男方“先前做出”
的策略选择。
女方必须要么
在两个决策节点上都选择足
球,要么在两个决策节点上
都选择芭蕾,她不能在一个
决策节点上选择足球,而在
另一个决策节点上选择芭蕾。
•女方的选择也可以放在博弈树的初始决策节点上,这时候男方的两个决策节点就位于同一个信息集内。
此时,男方受到的限制是,他必须在位于信息集内的两个决策节点上作出相同的策略选择。
5-2 同时决策与序贯决策的混合博弈•混合博弈:包含同时决策行动和序贯决策行动的博弈。
例子
•假定有两家计算机公司,彼此就新产品的研发展开博弈竞争。
博弈持续的时间为一年。
•在这一年里,这两家公司为能在市场上推出新产品而需要各自私下确定对研发的投入。
•假设两家公司致力推出的新产品类型相同,并且双方都知道对方要这样做,但他们都没有向公众公布他们的研发预算。
•了解对手研发投入决策的唯一方法,是通过在产业年度交易展上观察其产品的性能来推断最终产品的情况。
•在交易展上观察到对手的新产品后。
双方必须分别对各自的新产品定价。
•假定公司的研发投入只有低预算和高预算两种选择。
低预算的结果是新产品只是旧产品的部分改良,而高预算的结果则是推出一个完全不同于旧产品而且质量高很多的全新产品。
低预算策略用“小”或者“小投人”表示,高预算策略用“大”或者“大投入”表示。
•假定方正和联想在看到对手的新产品后的唯一决策问题就是对自己的新产品进行定价,定价只有“高”和“低”两种选择。
•两阶段同时博弈的序贯结构
研发预算和定价博弈的矩阵型表述
•研发预算和定价博
弈的展开表述•每家公司各有32个
纯策略;共有64个纯策略。
•结果只有16个。
5-3 树型博弈的子博弈
支和棱
•一个支可以包含许多条棱。
支必须包含从它的每个决策节点往后直到末端节点的所有棱。
子博弈
•定义:在一个n人展开型博弈T中,满足如下3个条的一个博弈S称为博弈T的一个子博弈:
1.S的博弈树是T的博弈树的一支;
2.博弈S不能分割博弈T的信息集.具体来说,只要博
弈T的某个情息集的任何一个决策节点是博弈S的一
个决策节点,那么T的这个信息集的每一个决策节点
都必须是博弈S决策节点;
3.博弈S的末端节点处的支付向量,与博弈T在这些末
端节点的支付向量的有关部分重合。
z母博弈
•子博弈的根前断开标示法
注意
•任何博弈树必须从一个初始决策节点(根)开始,那么,子博弈的根必须组成母博弈的单点信息集。
•子博弈的信息集和不包含在它这个支内的母博弈的信息集不相交。
一共有几个子博弈?
5-4 子博弈精炼纳什均衡•策略组合的粗线表示法和纳什均衡的虚线排除确定法可知,8个策略组合,有3个是纳什均衡。
•哪个均衡是最有可能发生的并且具有最好稳定性的结果?
子博弈精炼纳什均衡
•定义(泽尔滕):在一个博弈的所有作为纳什均衡的策略组合当中,那些局限在每个子博弈上都仍然是那个子博弈的纳什均衡的策略组合,叫做子博弈精炼纳什均衡。
•子博弈精练纳什均衡本身也是纳什均衡,但却是比纳什均衡更强的均衡概念。
•利用博弈树考察一个纳什均衡的时,只要局限于某一个子博弈上它不再是纳什均衡,所考察的纳什均衡就不是子博弈精炼纳什均衡。
•(足球,{足球,足球})对局虽然是博弈的纳什均衡,但不是博弈的子博弈精炼纳什均衡,因为局限在根前断开的那支子树所标示的子博弈上,指向(-1,-1)的策略选择有单独偏离的激励,用弯曲箭头表示箭尾的策略成分有向箭头的方向偏离的激励(偏离方向的箭头标示法)。
•如果一个策略组合的某个策略成分有偏离的激励,可以说这个策略组合缺乏局部稳定性。
•子博弈精炼纳什均衡,应该是经得起每个子博弈均衡检验的纳什均衡
•包含不可信威胁的纳什均衡,不是子博弈精炼的纳什均衡。
•这个策略组合,无论从全局看还是从每个局部看,都符合稳定性的要求,符合最优性的要求。
所以,序贯情侣博弈的(足球,{足球,芭蕾})对局,是博弈的子博弈精炼的纳什均衡。
5-5 完美博弈的库恩定理•是否每个树型表示的动态博弈都有纳什均衡呢?
•库恩定理完美信息的有限序贯博弈(sequential game of perfect information)都有纳什均衡。
课堂练习
•用策略组合的粗线表示法和纳什均衡的虚线排除法画出并讨论全部可能的对局或者策略组合,以虚线标示不是纳什均衡的那些对局。
•用虚线圈住的子博弈和相应的标示具有偏离激励策略的箭头,排除那些不是子博弈精炼均衡的纳什均衡,得到子博弈精炼的纳什均衡。
5-6 连续支付情形的序贯博弈•斯坦克尔伯格模型
–与古诺竞争模型一样,斯坦克尔伯格寡头竞争模型也是同质产品的产量竞争模型。
–与古诺模型所不同的是,斯坦克尔伯格模型是一个序贯决策模型,博弈的其中一方具有较强的实力,称之为企业1;而另一方的实力相对
较弱,称之为企业2。
–博弈首先由实力比较强的企业1选择自己的产
量,实力比较弱的企业2在观察到企业1所作出的产量决策后,再确定自己的产量水平。
是一个两阶段的序贯决策博弈。
•用()表示企业1的产量选择;•用(
)表示企业2在观测到后所选择的产量;•用表示当市场总产量为时的市场出清价格,其中•企业的利润是
•每个企业的利润可写为:
1q 01≥q 2q 02≥q 1q q A q p −=)(q 21q q q +=i 2,1)],)([),(21=−=i c q p q q q i i i π)(),(2121i i i c q q A q q q −−−=π。