博弈论混合策略纳什均衡
- 格式:ppt
- 大小:680.00 KB
- 文档页数:68
问题:博弈论三种均衡的异同结合工作实践举一个例子,谈以下三种均衡的异同,1、占优策略均衡,2、纳什均衡,3、混合策略纳什均衡。
国企办公室当中的智猪博弈。
“大猪”们辛辛苦苦加班,工资一分也不多拿,“小猪”们一边逍遥自在,工资一分也不少拿,这种情况在国企办公室里比比皆是。
很遗憾,我就是“大猪”们中的一员,因为我们什么都缺,尤其缺能干的人,就是不缺人。
严格占优均衡(DSE)、重复剔除占优均衡(IEDE)、纯策略纳什均衡(PNE)、混合策略纳什均衡(MNE),前一个均衡是后一个均衡的特例,后一个均衡是前一个均衡的扩展,即DSE是IEDE的子集,IEDE是PNE的子集,PNE是MNE的子集。
他们的区别如下:1、占优策略“不管你怎么做,我所做的都是我能做得最好的。
”其他人无论采取什么策略,目前你采取的策略就是最优的,永远不会改变。
2、纳什均衡:在一种策略组合上,其他人不改变策略时,那么你就不会改变策略,因为目前最优。
★“给定你的做法后,我所做的是我能做得最好的。
”★“给定我的做法后,你所做的是你能做得最好的。
”★如果你有占优策略, 你可以使用此策略, 以不变应万变;★如果你没有占优策略, 你必须随机应变。
在达到了纳什均衡之后, 所有参与者都没有动机想再变了。
纳什均衡是常态,帕累托最优几乎不存在。
经典案例:囚徒困境。
3、混合策略纳什均衡由所有参与人的混合策略构成的纳什均衡。
有些博弈不存在纳什均衡,或者纳什均衡不唯一,如猜硬币博弈。
要想为博弈方的选择和博弈结果做明细的预测,就要用到混合策略纳什均衡。
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。
博弈论教学/混合策略的纳什均衡出自MyKnowledgeBase< 博弈论教学Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡目录■1 复习■2 混合策略(Mixed strategy)■2.1 举例/Example■2.2 概念■2.3 纯策略和混合策略■2.4 混合策略的争议■3 混合策略的纳什均衡■3.1 基本概念■3.2 混合策略纳什均衡的存在性/纳什定理■3.3 学术争议与批评■4 混合策略纳什均衡举例■4.1 社会福利博弈Social Welfare Game■4.1.1 博弈分析(方法1:收益无差异)■4.1.2 博弈分析(方法2:图形分析法)■4.1.3 博弈分析(方法3:导数(Derivative)极值法)■4.2 普通例子■4.3 审计博弈(Tax Game)■4.4 激励的悖论[5]■4.5 求解纳什均衡的一般方法■5 多重纳什均衡■5.1 多重纳什均衡举例■5.1.1 夫妻之争■5.1.2 制式问题■5.1.3 市场机会博弈■5.2 多重纳什均衡分析■5.2.1 帕累托上策均衡(Pareto Dominated Equilibrium)■5.2.1.1 帕累托最优Pareto optimality■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium)■5.2.1.3 举例分析■5.2.2 风险上策均衡(Risk-dominant Equilibrium)■5.2.3 聚点均衡(Focal Points Equilibrium)■5.2.4 相关均衡■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义■7 作业■8 参考文献pure strategy)相对应。
混合策略:在博弈中,博弈方的策略空间为,则博弈方i以概率分布随机在其选策略中选择的“策略”,称为一个“混合策略”,其中,对都成立,且。
混合策略纳什均衡例子混合策略纳什均衡是博弈论中的一个重要概念,指的是各参与者选择一个概率分布作为他们的策略,从而达到一个稳定的状态。
在混合策略纳什均衡中,没有任何参与者可以通过单独改变自己的策略来获得更好的结果。
一个经典的混合策略纳什均衡的例子是“岩石-剪刀-布”游戏。
在这个游戏中,两个参与者(称为玩家1和玩家2)可以选择出岩石、剪刀或布中的任意一种。
每一种选择都有一定的胜负规则:岩石胜剪刀,剪刀胜布,布胜岩石。
假设玩家1选择出岩石、剪刀和布的概率分别为p1、q1和r1,玩家2选择出岩石、剪刀和布的概率分别为p2、q2和r2。
两个玩家的利益可以用一个支付矩阵表示如下:| 岩石 | 剪刀 | 布-----------------------------岩石 | 0 | -1 | 1-----------------------------剪刀 | 1 | 0 | -1-----------------------------布 | -1 | 1 | 0在混合策略纳什均衡中,每个玩家选择的概率分布必须使得对于每一种选择,玩家都不希望改变自己的概率分布。
在这个例子中,我们可以通过计算来找到混合策略纳什均衡。
假设玩家1选择出岩石的概率为p1,则选择剪刀的概率为q1=1-p1-0=1-p1,选择布的概率为r1=0-0=0。
同样地,玩家2选择出岩石的概率为p2,则选择剪刀的概率为q2=1-p2-0=1-p2,选择布的概率为r2=0-0=0。
为了找到混合策略纳什均衡,我们需要检查每一种选择,并确保玩家对于每一种选择都不希望改变自己的概率分布。
在这个例子中,无论玩家1选择什么概率分布,玩家2都可以通过选择相应的概率分布来获得更好的结果。
所以,不存在一个混合策略纳什均衡。
总结起来,混合策略纳什均衡是博弈论中一种稳定的策略选择状态,即不存在任何参与者可以通过单独改变自己的策略来获得更好的结果。
岩石-剪刀-布游戏是一个经典的混合策略纳什均衡的例子,其中玩家的选择概率分布是关键因素。
博弈论混合策略纳什均衡名词解释博弈论混合策略纳什均衡是指在博弈论中,当参与者不能确定选
择某一个策略时,采取混合策略的情况下达到的均衡状态。
具体来说,混合策略是指在一个博弈中,参与者以一定的概率选
择不同的纯策略。
而纳什均衡是指在一个博弈中,参与者无法通过单
独改变自己的选择来获得更好的结果,即不存在任何参与者可以通过
改变自己的策略来让其他参与者不再选择当前策略。
混合策略纳什均衡是指游戏中所有参与者以一定的概率选择不同
的纯策略,并且这种概率分配对于所有参与者都是最优的。
也就是说,在混合策略纳什均衡下,参与者没有更好的选择可供其采取,而其他
参与者也没有更好的概率分配可供其选择。
拓展:
在博弈论中,还有许多其他类型的均衡概念,例如纯策略纳什均衡、帕累托均衡、部分均衡等等。
纯策略纳什均衡是指游戏中参与者
以确定性的纯策略进行选择,使得没有参与者可以通过改变其策略来
获得更好的结果。
帕累托均衡是指在一个博弈中,不存在可以改善任
何一个参与者的情况。
部分均衡是指只有某些参与者达到均衡状态,而其他参与者未达到均衡状态。
博弈论是研究决策制定者在相互影响下进行决策的数学工具。
通过分析不同的博弈策略和可能的结果,博弈论可以帮助我们理解冲突和合作的情况,并提供一些决策建议。