3-混合策略的纳什均衡
- 格式:pdf
- 大小:903.07 KB
- 文档页数:15
问题:博弈论三种均衡的异同结合工作实践举一个例子,谈以下三种均衡的异同,1、占优策略均衡,2、纳什均衡,3、混合策略纳什均衡。
国企办公室当中的智猪博弈。
“大猪”们辛辛苦苦加班,工资一分也不多拿,“小猪”们一边逍遥自在,工资一分也不少拿,这种情况在国企办公室里比比皆是。
很遗憾,我就是“大猪”们中的一员,因为我们什么都缺,尤其缺能干的人,就是不缺人。
严格占优均衡(DSE)、重复剔除占优均衡(IEDE)、纯策略纳什均衡(PNE)、混合策略纳什均衡(MNE),前一个均衡是后一个均衡的特例,后一个均衡是前一个均衡的扩展,即DSE是IEDE的子集,IEDE是PNE的子集,PNE是MNE的子集。
他们的区别如下:1、占优策略“不管你怎么做,我所做的都是我能做得最好的。
”其他人无论采取什么策略,目前你采取的策略就是最优的,永远不会改变。
2、纳什均衡:在一种策略组合上,其他人不改变策略时,那么你就不会改变策略,因为目前最优。
★“给定你的做法后,我所做的是我能做得最好的。
”★“给定我的做法后,你所做的是你能做得最好的。
”★如果你有占优策略, 你可以使用此策略, 以不变应万变;★如果你没有占优策略, 你必须随机应变。
在达到了纳什均衡之后, 所有参与者都没有动机想再变了。
纳什均衡是常态,帕累托最优几乎不存在。
经典案例:囚徒困境。
3、混合策略纳什均衡由所有参与人的混合策略构成的纳什均衡。
有些博弈不存在纳什均衡,或者纳什均衡不唯一,如猜硬币博弈。
要想为博弈方的选择和博弈结果做明细的预测,就要用到混合策略纳什均衡。
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。
混合战略纳什均衡及应用摘要:博弈论是运筹学的一个重要分支,类型众多。
其中,非合作博弈是现代博弈理论中的核心内容和重要基础。
本文在简要介绍了博弈论相关内容的基础上,重点介绍了非合作博弈中最重要、最核心的部分即Nash均衡。
在此基础上,以纳什均衡作为理论支撑点,结合得意矩阵分析解决了经济生活中的一些实际问题。
例如治理污水排放的制度设计问题。
关键词:博弈论;均衡点;得益矩阵;Nash均衡博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
非合作博弈是现代博弈理论中的核心内容和重要基础,而Nash均衡则是非合作博弈的核心部分。
要用博弈论解决现实经济生活中的决策问题,其关键在于如何根据行为中的支付矩阵得出纳什平衡点,通过分析决策者的心理活动来得到博弈模型,从而依据模型来针对生活中的实际问题制定相关的政策以预防不良现象的发生。
一、非合作博弈一般地,将不允许存在有约束力协议的博弈称为“非合作博弈”。
在该博弈中,每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策。
事实上,具有这种性质的策略组合,正是非合作博弈理论中最重要的一个概念——“纳什均衡”。
在博弈论里,有各种各样的均衡概念。
混合战略均衡是纳什均衡的一种,混合战略概念使博弈论的研究范围更加广泛。
混合战略纳什均衡在非合作博弈分析中具有十分关键的作用和地位,因此将着重介绍混合战略纳什均衡的定义。
显然,给定父母资助,儿子的最优战略是在家;给定儿子在家;父母的最优战略是不资助,给定父母不救济,儿子的最优战略是寻找工作;而给定儿子寻找工作,父母的最优战略是资助。
该博弈的显著特征是每个参与人都不能猜出对方的战略。
参与人是以一定的概率选择某种战略,故称这样的战略为混合战略。
在该博弈中,设想父母以的概率选择资助,的概率选择不资助。
那么,对儿子来说,选择寻找工作带来的期望效用为,选择在家带来的期望效用同样为。
可见,选择任何混合战略带来的期望效用都是相同的。
纳什均衡概念名词解释纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,这个选择不会被单方面的改变,否则对于另一方来说,选择其他策略反而更劣。
1. 概念解释纳什均衡的概念可以从两个方面进行解释。
从个人角度看,纳什均衡是指当每一个人都实施最优策略时,其它人不能从自己的策略中获得进一步的盈利收益;从社会角度看,纳什均衡则是指,当所有人都做出了最优策略时,整个社会得到了最大的总收益。
2. 纳什均衡的前提条件在博弈论中,纳什均衡并不是所有博弈都存在的。
对于一个博弈,存在纳什均衡需要满足以下条件:(1)所有博弈者都采取了最优策略,即无法通过改变策略来提高自己的收益;(2)每个博弈者的策略是对其他博弈者实施的策略的最佳反应;(3)每个博弈者都清楚地了解其他博弈者的策略。
3. 纳什均衡的类型在实际的博弈中,纳什均衡可以分为三种类型:(1)纯策略均衡:指每位参与者都只选定一个策略,并根据它的期望收益来进行决策,不存在概率因素。
(2)混合策略均衡:指每位参与者按一定的概率选定多个策略,并根据它的期望收益来进行决策,存在概率因素。
(3)多重纳什均衡:指博弈中存在多个均衡策略组合,每个均衡策略组合都符合博弈的前提条件。
4. 纳什均衡的意义和应用纳什均衡是博弈论的一个核心概念,其意义和应用非常广泛。
首先,纳什均衡可以用来预测和解释现实生活中的决策行为,如市场竞争、政府政策制定等。
其次,纳什均衡也可以用来指导协商和谈判的过程。
最后,纳什均衡还可以用来研究其他领域的决策行为,如军事战略、生态环境等。
综上所述,纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,是一种使得所有参与者都满意的稳定状态。
纳什均衡的应用领域非常广泛,其理论和方法也在不断地发展和完善。
混合纳什均衡混合纳什均衡是一种多人博弈模型,也被称为“混合博弈”,可以模拟多方参与者协商、合作和竞争的过程。
这种理论是基于纳什均衡的,在纳什均衡中,每个参与者都有唯一的利益,各参与者的最优策略协作,从而达到最大的利益。
混合纳什均衡是一种非零和纳什均衡,这意味着在一局游戏中,所有参与者可以实现共赢的结果,而不是某些参与者的利益以牺牲其他参与者的利益为代价。
这种理论很有用,因为它可以帮助参与者解决复杂的多方协商问题,降低买卖双方的损失。
混合纳什均衡有三类参与者:合作者、竞争者和不确定者。
这三类参与者行为的不同可能会影响混合纳什均衡的最终结果。
首先,合作者是指参与者之间相互合作,面对游戏的结果,合作者会达成有利于双方的互惠交易。
其次,竞争者是指参与者之间存在竞争,他们拼劲、追求自身最大利益,甚至牺牲他人利益也在所不惜。
最后,不确定者是指参与者对其他参与者的行为不太清楚,不确定者在游戏中会被动地接受其他参与者的影响,不会太过激进地为自身争取利益。
混合纳什均衡的应用非常广泛,它可以用来模拟经济、政治和外交等领域中的多方协商。
例如,混合纳什均衡可以用来模拟多个国家的贸易谈判,各国可以混合地拼争,双赢共赢的结果也可以从混合纳什均衡中获得。
此外,混合纳什均衡还可以用于多方竞争,各参与者一方面决策自身利益,另一方面也考虑到他人利益,以免损害自己的利益。
混合纳什均衡由一系列经典模型构成,例如拉斯维加斯博弈、巴斯-马丁斯博弈、多人贪心渐近博弈和贝叶斯优化博弈等等。
这些经典模型可以帮助参与者更容易地找到最大利益的解决方案,从而使参与者可以面对复杂的多方协商游戏实现共赢。
混合纳什均衡受到了日益普及和重视。
从商业活动到政治事务,混合纳什均衡已经被广泛地应用,而且也取得了许多成功案例。
在政治领域,混合纳什均衡可以帮助各个利益派系达成协议,减少谈判的紧张和矛盾,从而使多方收获相对平衡的政治结果。
此外,混合纳什均衡也有不足之处,例如模型的复杂性使得集成分析变得更加困难,可能引发新的潜在问题,而且由于参与者的利益不断变化,使用混合纳什均衡可能无法达到预期的最终结果。
目录[隐藏]1 什么是混合策略纳什均衡2 解混合策略纳什均衡的方法3 混合策略纳什均衡的经典博弈——猜谜博弈[1]4 混合策略纳什均衡博弈与其他均衡的关系[1]5 参考文献[编辑][编辑][编辑]混合策略纳什均衡混合策略纳什均衡(Mixed Strategy Nash Equilibrium )什么是混合策略纳什均衡混合策略纳什均衡:在n 个参与人的博弈G={S 1 ,... S n ; u 1,...u n }中,混合策略组合构成一个纳什均衡,如果对于所有的i =1,2...,n 下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。
解混合策略纳什均衡的方法1、最大化支付法:即最大化各个参与人的效用函数。
2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。
混合策略纳什均衡的经典博弈——猜谜博弈[1]两个局中人A 、B 手里各拿一枚硬币,每人可以选择正面向上或反面向上,然后同时亮出,如果两枚硬币正反面相同,B 付给A1元钱,如果两枚硬币正反面不相同,A 付给B1元钱。
在这种情况下,局中人A 、B 如何选择呢?下图给出这个博弈的双变量收益矩阵。
这是一个两人零和博弈,在每一个结局中一方所得即为另一方所失,即两个局中人的收益之和恰好等于零。
在双变量收益矩阵中采用画线的方法,在这个博弈中找不到纯策略纳什均衡。
那么,猜谜博弈是否存在混合策略纳什均衡呢?1950年纳什证明了任何有限博弈都至少存在一个纳什均衡(包括纯策略纳什均衡和混合策略纳什均衡)。
博弈论教学/混合策略的纳什均衡
出自MyKnowledgeBase
< 博弈论教学
Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡
目录
■1 复习
■2 混合策略(Mixed strategy)
■2.1 举例/Example
■2.2 概念
■2.3 纯策略和混合策略
■2.4 混合策略的争议
■3 混合策略的纳什均衡
■3.1 基本概念
■3.2 混合策略纳什均衡的存在性/纳什定理
■3.3 学术争议与批评
■4 混合策略纳什均衡举例
■4.1 社会福利博弈Social Welfare Game
■4.1.1 博弈分析(方法1:收益无差异)
■4.1.2 博弈分析(方法2:图形分析法)
■4.1.3 博弈分析(方法3:导数(Derivative)极值法)
■4.2 普通例子
■4.3 审计博弈(Tax Game)
■4.4 激励的悖论[5]
■4.5 求解纳什均衡的一般方法
■5 多重纳什均衡
■5.1 多重纳什均衡举例
■5.1.1 夫妻之争
■5.1.2 制式问题
■5.1.3 市场机会博弈
■5.2 多重纳什均衡分析
■5.2.1 帕累托上策均衡(Pareto Dominated Equilibrium)
■5.2.1.1 帕累托最优Pareto optimality
■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium)
■5.2.1.3 举例分析
■5.2.2 风险上策均衡(Risk-dominant Equilibrium)
■5.2.3 聚点均衡(Focal Points Equilibrium)
■5.2.4 相关均衡
■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义
■7 作业
■8 参考文献
pure strategy)相对应。
混合策略:在博弈中,博弈方的策略空间为
,则博弈方i以概率分布随机在其
选策略中选择的“策略”,称为一个“混合策略”,其中,对
都成立,且。
混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作
定义:在博弈中,假设是一个混合策略,如果
成立,则称是一个混合策略纳什均衡(
Equilibrium)。
如果对于局中人及其的每一个混合策略,局中人关于的期望盈利至少与局中人关于的期望盈利一样大,即则称混合策略组合是这个博弈的一个纳什均衡。
纳什定理:在一个由个博弈方构成的博弈中,如果
的战略空间都是有限集(对),则该博弈至少存在一个纳什均衡(纯策略或者混合策略)。
设和为纳什均衡点,
,如果,则
如果,则对于任意的都是最大值;如果,则,上式取最大值。
同理,,可得,
两者的交点为(0.5,0.2),如图所示。
图形分析方法
这个问题不存在纯策略的纳什均衡。
假设政府救济的概率为,流浪汉找工作的概率为,则
,
,让、分别对和求导数,并令,即,,可得,,最后政府的收益为,流浪汉的收益为
的概率为,博弈方
为,则对于博弈方采取何种策略,其收益是不变化
的(即其分别采取策略
,可得;同
理,可以求得;最后可得博弈方1的收益为,博弈方。