_混合策略纳什均衡(张克勇2013)
- 格式:ppt
- 大小:367.50 KB
- 文档页数:48
博弈论教学/混合策略的纳什均衡出自MyKnowledgeBase< 博弈论教学Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡目录■1 复习■2 混合策略(Mixed strategy)■2.1 举例/Example■2.2 概念■2.3 纯策略和混合策略■2.4 混合策略的争议■3 混合策略的纳什均衡■3.1 基本概念■3.2 混合策略纳什均衡的存在性/纳什定理■3.3 学术争议与批评■4 混合策略纳什均衡举例■4.1 社会福利博弈Social Welfare Game■4.1.1 博弈分析(方法1:收益无差异)■4.1.2 博弈分析(方法2:图形分析法)■4.1.3 博弈分析(方法3:导数(Derivative)极值法)■4.2 普通例子■4.3 审计博弈(Tax Game)■4.4 激励的悖论[5]■4.5 求解纳什均衡的一般方法■5 多重纳什均衡■5.1 多重纳什均衡举例■5.1.1 夫妻之争■5.1.2 制式问题■5.1.3 市场机会博弈■5.2 多重纳什均衡分析■5.2.1 帕累托上策均衡(Pareto Dominated Equilibrium)■5.2.1.1 帕累托最优Pareto optimality■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium)■5.2.1.3 举例分析■5.2.2 风险上策均衡(Risk-dominant Equilibrium)■5.2.3 聚点均衡(Focal Points Equilibrium)■5.2.4 相关均衡■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义■7 作业■8 参考文献pure strategy)相对应。
混合策略:在博弈中,博弈方的策略空间为,则博弈方i以概率分布随机在其选策略中选择的“策略”,称为一个“混合策略”,其中,对都成立,且。
混合策略纳什均衡名词解释
嘿,朋友们!今天咱来聊聊混合策略纳什均衡!这可不是什么晦涩难懂的概念哦。
想象一下,在一个竞争的场景里,就像一场激烈的游戏,大家都在绞尽脑汁地想着怎么出招。
混合策略纳什均衡呢,就是在这种情况下,各方参与者都没办法通过单独改变自己的策略来获得更好的结果。
它就好像是一场微妙的平衡舞蹈!每个人都要在不同的选择之间跳跃,找到那个最合适的组合。
不是单纯地选择一个固定的策略,而是有时候这样,有时候那样,让对手捉摸不透。
好比是下棋,你不能总是走同样的几步,得灵活多变,根据对手的反应随时调整。
而且啊,这个均衡可不是那么容易达到的哦,需要各方参与者不断地试探、博弈。
它不是那种一眼就能看穿的简单玩意儿,而是隐藏在复杂的互动之中。
就像在迷雾中寻找方向,需要耐心和智慧。
在现实生活中,混合策略纳什均衡也无处不在呢!商业竞争中,企业要考虑怎么定价、怎么推广,不就是在寻找这种微妙的平衡吗?政治博弈中,各方势力也在不断调整策略,试图达到对自己最有利的状态。
甚至在我们的日常生活中,比如和朋友玩游戏,或者在一些选择中纠结,都能看到混合策略纳什均衡的影子。
它让我们明白,有时候没有绝对的最佳策略,只有在不断变化中找到的相对平衡。
混合策略纳什均衡就是这么神奇,这么有趣!它让我们看到了竞争和互动的复杂性,也让我们更加懂得如何在各种情况下做出明智的选择。
所以啊,别小瞧了这个概念,它可是有着大用处呢!。
博弈论混合策略纳什均衡名词解释博弈论混合策略纳什均衡是指在博弈论中,当参与者不能确定选
择某一个策略时,采取混合策略的情况下达到的均衡状态。
具体来说,混合策略是指在一个博弈中,参与者以一定的概率选
择不同的纯策略。
而纳什均衡是指在一个博弈中,参与者无法通过单
独改变自己的选择来获得更好的结果,即不存在任何参与者可以通过
改变自己的策略来让其他参与者不再选择当前策略。
混合策略纳什均衡是指游戏中所有参与者以一定的概率选择不同
的纯策略,并且这种概率分配对于所有参与者都是最优的。
也就是说,在混合策略纳什均衡下,参与者没有更好的选择可供其采取,而其他
参与者也没有更好的概率分配可供其选择。
拓展:
在博弈论中,还有许多其他类型的均衡概念,例如纯策略纳什均衡、帕累托均衡、部分均衡等等。
纯策略纳什均衡是指游戏中参与者
以确定性的纯策略进行选择,使得没有参与者可以通过改变其策略来
获得更好的结果。
帕累托均衡是指在一个博弈中,不存在可以改善任
何一个参与者的情况。
部分均衡是指只有某些参与者达到均衡状态,而其他参与者未达到均衡状态。
博弈论是研究决策制定者在相互影响下进行决策的数学工具。
通过分析不同的博弈策略和可能的结果,博弈论可以帮助我们理解冲突和合作的情况,并提供一些决策建议。
混合纳什均衡纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。
”也就是说,所有人的战略都是最优的。
而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。
a,b两个囚徒,a坦白b抵赖,b判10年,a判1年.若两人均坦白则各判5年,若两人均抵赖则都判2年。
a,b 面临抉择。
显然最好的策略是双方都抵赖,结果是大家都只被判2年。
但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。
这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他会坐10年牢,也是招了划算。
综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。
两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。
原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。
这就是著名的“囚徒困境”。
它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。
混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等。
假设这是个两个玩家的游戏。
玩家a有2种纯策略a和b,不能相互支配。
玩家b有2种纯策略c和d,不能相互支配。
设a选a的几率是p,则选b的几率为1-p;设b选c的几率是q,则选d的几率为1-q当a取某一个p=p0,b获得的总效用不为自己q的取值而改变;b取某一个q=q0,a获得的总效用不为自己p 的取值而改变,此时我们说(p0,1-p0)和(q0,1-q0)是一对混合策略下的纳什均衡。
混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。
混合策略纳什均衡计算方法(一)混合策略纳什均衡计算方法什么是混合策略纳什均衡混合策略纳什均衡是博弈论中的一个概念,指的是每个玩家都选择一定的概率来执行每一个可行的行动。
这样,游戏的结果不再是唯一的,而是有一定的概率分布。
如何计算混合策略纳什均衡计算混合策略纳什均衡需要用到线性规划的方法,具体步骤如下:1.确定每个玩家的策略空间,即每个玩家可选的所有策略。
2.建立概率分布矩阵,即每个玩家选择每个策略的概率。
3.利用概率分布矩阵和游戏的收益矩阵计算出每个玩家的期望收益。
4.建立线性规划模型来最大化每个玩家的期望收益。
5.求解线性规划模型得到混合策略纳什均衡。
混合策略纳什均衡的应用混合策略纳什均衡在实际应用中有广泛的应用。
比如在围棋、国际象棋等棋类游戏中,人类选手常常会使用混合策略来应对对手的不确定性。
同时,在市场竞争、拍卖、投资等领域,混合策略也可以用来帮助决策者做出最优的决策。
总结混合策略纳什均衡是博弈论中的重要概念,在实际应用中具有广泛的应用前景。
计算混合策略纳什均衡需要用到线性规划的方法,但具体计算步骤并不复杂。
我们可以通过深入理解和应用混合策略纳什均衡,来帮助我们更好地应对不确定性和竞争。
混合策略纳什均衡的优势混合策略纳什均衡作为一种考虑不确定性的策略,相较于确定性策略有以下优势:1.能够应对对手的随机性,减小被对手利用的风险;2.能够在一定程度上改变游戏的结果分布,增加自己的收益,同时降低失败的风险。
混合策略纳什均衡的局限性尽管混合策略纳什均衡具有很多优点,但是也存在以下局限性:1.混合策略需要玩家具有一定的判断力和计算能力,否则可能难以计算出最优解;2.没有一个确定的策略来保证获胜,更多地要依靠概率和运气;3.当游戏中有多个混合策略纳什均衡时,玩家可能难以选择最优的策略。
结语混合策略纳什均衡是一个重要的博弈论概念,应用范围广泛。
尽管混合策略存在一些局限性,但是这并不妨碍我们充分应用这一理论来帮助我们在不确定性和竞争中取得更好的结果。
条件混合策略的纳什均衡1. 引言嘿,大家好!今天咱们聊聊一个既有趣又有点深奥的话题——条件混合策略的纳什均衡。
听起来有点复杂?别担心,咱们用轻松的方式来聊,保证让你听得懂、记得住。
想象一下,你和你的朋友正在玩一个游戏,可能是扑克、棋类,或者甚至是猜拳。
这个游戏的关键在于,你的决策不仅仅取决于你自己的选择,还要考虑到对方的想法和选择。
这就是咱们今天要讲的核心——在不确定的情况下,怎样做出最优决策。
2. 纳什均衡简介2.1 什么是纳什均衡?那么,纳什均衡到底是个啥呢?简单说,就是一个状态,在这个状态下,任何一个玩家如果单独改变自己的策略,都会让自己变得更糟。
就像一场足球比赛,双方都在根据对方的表现调整策略,最终形成一种微妙的平衡。
你不动,我不动,大家都不动,这就是纳什均衡。
说白了,想要赢,你得懂得有时候不动也是一种策略。
2.2 条件混合策略接下来,咱们再说说“条件混合策略”。
乍一听,好像高深莫测,其实它就是在不同情况下随机选择不同的策略。
举个例子:想象你和朋友下棋,你可能在某一轮选择攻击,而在另一轮选择防守。
这种随机性可以让对手难以预测你的下一步动作,嘿,这就让游戏更有趣了,对吧?3. 条件混合策略的运用3.1 实际案例现在咱们把这个理论应用到实际中,看看它是如何运作的。
比如在商业竞争中,两家公司为了争夺市场份额,可能会在价格、广告和产品质量上进行博弈。
一家公司可能会在价格上采取“低价策略”,而另一家公司则可能选择“高价策略”,同时在广告上加大投入。
通过这样的条件混合策略,双方都可以在市场中找到一种平衡,既能保护自己的利益,又能不至于把对方逼得太狠。
3.2 生活中的例子不仅如此,这种策略在我们的日常生活中也屡见不鲜。
想象一下你和朋友一起去餐厅,点菜的时候总是考虑对方喜欢什么,而不是只顾着自己。
你可能今天想吃披萨,但考虑到对方可能更喜欢汉堡,你就故意“随机”选择一下,看看情况。
如果对方也点了披萨,嘿,你们就双赢了!这样的“条件混合策略”让你们的友谊更加稳固,岂不是一举两得?4. 结论通过上面的讨论,咱们发现,条件混合策略的纳什均衡不仅仅是个理论,还是生活中随处可见的智慧。
目录[隐藏]1 什么是混合策略纳什均衡2 解混合策略纳什均衡的方法3 混合策略纳什均衡的经典博弈——猜谜博弈[1]4 混合策略纳什均衡博弈与其他均衡的关系[1]5 参考文献[编辑][编辑][编辑]混合策略纳什均衡混合策略纳什均衡(Mixed Strategy Nash Equilibrium )什么是混合策略纳什均衡混合策略纳什均衡:在n 个参与人的博弈G={S 1 ,... S n ; u 1,...u n }中,混合策略组合构成一个纳什均衡,如果对于所有的i =1,2...,n 下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。
解混合策略纳什均衡的方法1、最大化支付法:即最大化各个参与人的效用函数。
2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。
混合策略纳什均衡的经典博弈——猜谜博弈[1]两个局中人A 、B 手里各拿一枚硬币,每人可以选择正面向上或反面向上,然后同时亮出,如果两枚硬币正反面相同,B 付给A1元钱,如果两枚硬币正反面不相同,A 付给B1元钱。
在这种情况下,局中人A 、B 如何选择呢?下图给出这个博弈的双变量收益矩阵。
这是一个两人零和博弈,在每一个结局中一方所得即为另一方所失,即两个局中人的收益之和恰好等于零。
在双变量收益矩阵中采用画线的方法,在这个博弈中找不到纯策略纳什均衡。
那么,猜谜博弈是否存在混合策略纳什均衡呢?1950年纳什证明了任何有限博弈都至少存在一个纳什均衡(包括纯策略纳什均衡和混合策略纳什均衡)。
第三章 纳什均衡及其应用3.1 混合策略纳什均衡1 鹰鸽博弈我们知道老鹰具有攻击性,而鸽子爱好和平。
在原始社会里有两个部落,可以做出两个行动:一是进攻一是和平,分别用鹰和鸽表示。
表1 鹰鸽博弈乙甲鹰 鸽该博弈的那是均衡为(鹰,鸽),(鸽,鹰)。
一些学者研究发现,在同一个地域内,“鹰”和“鸽”的比例为0.36:0.64。
事实上,设鹰鸽比为:1z z -,可以得出如下结果:()2514(1)1439E e z z z =-+-=-; ()95(1)514E d z z z =-+-=-90.3625z == 聪明的做法是:当鹰鸽比小雨0.36时,选择鹰策略;否则选择鸽策略。
使用混合策略方法分析:第一步:混合策略型表示:乙 鹰 鸽甲鹰 p 鸽 1-p第二步:计算期望效用:(925)514(259)514E p q q E q p p=-+-=++-甲乙第三步:作出最优反应函数91 259[0,1] 2590 25q p q q ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩若若若, 90 259[0,1] 259 1 25p q p p ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩如果如果如果 第四步:作出反应函数的图像第五步:根据交点,找出纳什均衡:其中(99,2525)是混合策略纳什均衡。
2 斗鸡博弈我的老家地处安徽最北部,苏鲁豫皖四省交界之处,东北处有条小河。
河边的棉花地里,经常有鹌鹑栖息在其间。
秋末冬初的农闲时节,小鹌鹑刚好长成。
村民结网捕鹌鹑把玩、斗鸟儿为乐。
每天早晨4点多钟出发,大约7点钟回来,雄性的鹌鹑留起来先要整夜整夜的熬鹌鹑、放在手里把鹌鹑,真正熟练了,才拿出来和别人的相斗。
设想两只鹌鹑要在场子里一决雌雄。
每只鹌鹑都有两个策略:攻击或逃跑。
由于两只鹌鹑实力相当,若同时选择进攻会两败俱伤;若一只进攻,一只逃跑,进攻者胜利。
逃跑的鹌鹑算是玩完了,以后再也没胆量进场子,主人也不回在把玩它,会用一块黑布把它的笼子蒙起来,培养成“叫子”,以后后捕鹌鹑的时候拎出去吸引同伴。