第3.2讲:纳什均衡(II):混合策略意义上的分析
- 格式:pptx
- 大小:729.46 KB
- 文档页数:44
浅析古诺模型的纳什均衡及应用【摘要】古诺模型是博弈论中的经典模型之一,通过分析双方角色和策略的选择,可以得出纳什均衡的解。
纳什均衡是指在博弈中每个参与者采取最佳应对策略的状态,使得没有一个参与者可以通过改变自身策略来获得更高的收益。
通过计算纳什均衡,可以确定在古诺模型中各方的最优策略选择。
古诺模型在博弈论中有着广泛的应用,能够描述各种决策情形,并帮助分析各方的利益冲突。
古诺模型也存在局限性,例如假设信息完全对称等问题。
纳什均衡的意义和应用前景则在于帮助理解博弈中的策略选择规律,为实际决策提供理论指导。
通过深入研究古诺模型和纳什均衡的概念与应用,可以更好地理解博弈论在现实中的应用。
【关键词】关键词:古诺模型、纳什均衡、博弈论、角色与策略、计算方法、局限性、意义和应用前景。
1. 引言1.1 古诺模型的基本概念古诺模型的基本概念是现代博弈论的基础之一。
古诺模型是由约翰·冯·诺依曼和奥斯卡·摩根斯特恩在20世纪40年代提出的博弈论模型,被广泛应用于经济学、政治学、生物学等领域。
古诺模型主要研究多方参与的博弈中的决策问题,其基本假设是参与者都具有理性并追求最大化自身利益。
在古诺模型中,参与者被称为玩家,每个玩家有自己的策略空间和支付函数。
策略空间是玩家可以选择的所有可能行动,支付函数则是描述了每个玩家在不同策略组合下所获得的收益。
古诺模型中的策略可以是纯策略,即玩家直接选择一个确定的行动,也可以是混合策略,即以一定概率选择不同的纯策略。
通过分析古诺模型中各个玩家的策略选择和收益情况,可以得到博弈的纳什均衡。
纳什均衡即在一个博弈中,每个玩家选择的策略都是最优的,给定其他玩家的策略时,自己没有动机单方面改变策略。
纳什均衡是古诺模型中的一个重要概念,也是博弈论中的核心内容之一。
1.2 纳什均衡的概念纳什均衡是博弈论中一个重要的概念,它由约翰·纳什于1950年提出。
在一个博弈中,如果每个参与者都选择了最优的策略,且已知其他人的选择情况下仍然坚持自己的选择,那么这种情况就被称为纳什均衡。
混合战略纳什均衡及应用摘要:博弈论是运筹学的一个重要分支,类型众多。
其中,非合作博弈是现代博弈理论中的核心内容和重要基础。
本文在简要介绍了博弈论相关内容的基础上,重点介绍了非合作博弈中最重要、最核心的部分即Nash均衡。
在此基础上,以纳什均衡作为理论支撑点,结合得意矩阵分析解决了经济生活中的一些实际问题。
例如治理污水排放的制度设计问题。
关键词:博弈论;均衡点;得益矩阵;Nash均衡博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
非合作博弈是现代博弈理论中的核心内容和重要基础,而Nash均衡则是非合作博弈的核心部分。
要用博弈论解决现实经济生活中的决策问题,其关键在于如何根据行为中的支付矩阵得出纳什平衡点,通过分析决策者的心理活动来得到博弈模型,从而依据模型来针对生活中的实际问题制定相关的政策以预防不良现象的发生。
一、非合作博弈一般地,将不允许存在有约束力协议的博弈称为“非合作博弈”。
在该博弈中,每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策。
事实上,具有这种性质的策略组合,正是非合作博弈理论中最重要的一个概念——“纳什均衡”。
在博弈论里,有各种各样的均衡概念。
混合战略均衡是纳什均衡的一种,混合战略概念使博弈论的研究范围更加广泛。
混合战略纳什均衡在非合作博弈分析中具有十分关键的作用和地位,因此将着重介绍混合战略纳什均衡的定义。
显然,给定父母资助,儿子的最优战略是在家;给定儿子在家;父母的最优战略是不资助,给定父母不救济,儿子的最优战略是寻找工作;而给定儿子寻找工作,父母的最优战略是资助。
该博弈的显著特征是每个参与人都不能猜出对方的战略。
参与人是以一定的概率选择某种战略,故称这样的战略为混合战略。
在该博弈中,设想父母以的概率选择资助,的概率选择不资助。
那么,对儿子来说,选择寻找工作带来的期望效用为,选择在家带来的期望效用同样为。
可见,选择任何混合战略带来的期望效用都是相同的。
混合策略纳什均衡混合策略纳什均衡是博弈论中一个重要的概念。
纳什均衡是指在一个博弈中,每个参与者都选择了最优的策略,而且即使其他参与者知道其他参与者的策略,他们也无法从自己的策略中获得更大的利益。
而混合策略则是指参与者通过随机化选择不同策略的概率来达到最优策略。
本文将深入探讨混合策略纳什均衡的概念、特点以及计算方法。
首先,混合策略纳什均衡是指参与者通过一定概率选择不同策略的方式达到最优策略。
在混合策略中,每个参与者都拥有一个策略概率分布,表示他们在不同策略下的选择概率。
这样,在博弈中,每个参与者将根据其策略概率分布中的概率随机选择其中一种策略。
对于每个参与者而言,他们的目标是通过选择最优的策略概率分布来最大化自己的期望收益或最小化自己的期望损失。
其次,混合策略纳什均衡与纳什均衡相比具有以下特点。
首先,混合策略纳什均衡可以推翻完全信息博弈中的固定策略均衡结果。
在完全信息博弈中,参与者可以根据对其他参与者策略的了解来做出精确决策,因此均衡状态是唯一确定的。
而在混合策略博弈中,由于参与者通过概率选择不同策略,他们无法准确地预测其他参与者的策略,因此均衡状态不再是唯一确定的。
其次,混合策略纳什均衡可以引入不确定性,增加博弈的复杂性。
参与者无法准确地预测其他参与者的策略,因此他们需要通过一定的概率选择策略来平衡风险与收益。
最后,混合策略纳什均衡可以通过均衡态的共同选择来实现长期的稳定状态。
在混合策略纳什均衡中,参与者通过随机化选择策略,从而消除了其他参与者可以预测自己策略的可能性,增加了稳定性。
最后,计算混合策略纳什均衡的方法主要有以下两种。
一种是通过计算参与者的最优策略概率分布来确定混合策略纳什均衡。
这种方法主要基于线性规划技术,通过最大化或最小化参与者的期望收益或损失来确定最优的策略概率分布。
另一种方法是通过迭代算法来求解混合策略纳什均衡。
这种方法主要是通过反复更新参与者的策略概率分布,直到达到均衡状态。
网球单打比赛发球与接发球战术博弈的混合策略纳什均衡研究刘畅;赵国辉;赵响【摘要】混合策略纳什均衡是博弈论中比较核心的概念,有着极其重要的作用.文中采用文献资料法、专家访谈法和数理统计法对网球单打比赛发球与接发球战术博弈中的“混合策略纳什均衡”进行了研究.研究得出:网球单打比赛的战术博弈是一种严格的双人零和博弈,在网球单打比赛的战术博弈中,要通过混合策略的使用来突破战术运用具有路径依赖的现象,即必须随机选择策略和重视选择各个策略的概率分布,让自己的策略选择不能带有很强的规律性.完全信息静态博弈中求预期得益的方法和反应函数可以用来求解网球单打比赛战术博弈的混合策略纳什均衡,满足纳什均衡的混合策略互为双方针对对手随机化策略的最佳对策.【期刊名称】《南京体育学院学报(社会科学版)》【年(卷),期】2017(031)006【总页数】5页(P47-50,66)【关键词】网球发球;网球接发球;博弈论;混合策略纳什均衡【作者】刘畅;赵国辉;赵响【作者单位】北京体育大学,北京100084;山西大学,山西太原030006;北京体育大学,北京100084【正文语种】中文【中图分类】G845博弈论所研究的博弈本质上就是个人、组队或其他组织的决策行为,特别是有策略互动和利益依存特征的决策行为[1]。
小到一些体育比赛,大到国家之间的倾销、反倾销、制裁和报复等,都包含博弈关系,都是博弈论研究的对象[2]。
体育博弈,是在一定的竞争规则和裁判法的限定下进行的最具理想意义的竞争与对抗[3]。
随着比赛激烈程度的增加,比赛中各种对抗与竞争表现出典型的博弈特征,这不仅加速了体育博弈理论的发展,而且也开始让更多研究者把兴趣点放在了结合各个运动项目的博弈研究上。
网球运动员在比赛中运用战术实际上就是一种体育博弈,双方运动员都有一些可以选择的战术策略,不同的战术策略进行对抗和交锋会产生不同的结果,且双方运动员都希望从中获取较好的收益,这就是一种具体的博弈。
博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石,对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。
本文首先将博弈划分为不同的类型,并对主要的均衡概念进行了数学描述,最后对不同的均衡概念进行了比较。
【关键词】博弈论;纳什均衡;重复博弈博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。
但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。
在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。
因此,本文将主要的博弈均衡概念进行分类和表述,并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。
一、博弈的主要类型博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。
依据不同的分类标准,博弈可以被划分为不同的类型。
1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。
动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。
Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。
重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。
2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。
目录[隐藏]1 什么是混合策略纳什均衡2 解混合策略纳什均衡的方法3 混合策略纳什均衡的经典博弈——猜谜博弈[1]4 混合策略纳什均衡博弈与其他均衡的关系[1]5 参考文献[编辑][编辑][编辑]混合策略纳什均衡混合策略纳什均衡(Mixed Strategy Nash Equilibrium )什么是混合策略纳什均衡混合策略纳什均衡:在n 个参与人的博弈G={S 1 ,... S n ; u 1,...u n }中,混合策略组合构成一个纳什均衡,如果对于所有的i =1,2...,n 下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。
解混合策略纳什均衡的方法1、最大化支付法:即最大化各个参与人的效用函数。
2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。
混合策略纳什均衡的经典博弈——猜谜博弈[1]两个局中人A 、B 手里各拿一枚硬币,每人可以选择正面向上或反面向上,然后同时亮出,如果两枚硬币正反面相同,B 付给A1元钱,如果两枚硬币正反面不相同,A 付给B1元钱。
在这种情况下,局中人A 、B 如何选择呢?下图给出这个博弈的双变量收益矩阵。
这是一个两人零和博弈,在每一个结局中一方所得即为另一方所失,即两个局中人的收益之和恰好等于零。
在双变量收益矩阵中采用画线的方法,在这个博弈中找不到纯策略纳什均衡。
那么,猜谜博弈是否存在混合策略纳什均衡呢?1950年纳什证明了任何有限博弈都至少存在一个纳什均衡(包括纯策略纳什均衡和混合策略纳什均衡)。
混合策略纳什均衡计算方法
混合策略纳什均衡是博弈论中的一种解决方法,它指的是在博弈中每个玩家都使用多种策略的概率分布,使得任何一个玩家单独改变自己的策略都不会导致自己的收益增加。
计算混合策略纳什均衡需要使用到线性规划的方法。
具体来说,可以通过列出每个玩家的收益矩阵和概率分布向量的线性规划问题,然后求解这些线性规划问题的最优解从而得到混合策略纳什均衡。
在求解线性规划时,通常使用单纯形法或内点法等算法。
这些算法的基本思想是从某个初始解开始,逐步移动到更优的解,直到不能找到更优解为止。
需要注意的是,在实际应用中,混合策略纳什均衡的计算可能比较复杂,特别是当博弈参与者数量较多或者策略空间较大时。
此外,即使得到了混合策略纳什均衡,也不一定能保证博弈的稳定性,因此需要对结果进行进一步的分析和评估。
总之,混合策略纳什均衡是博弈论中的一种重要解决方法,对于理解和分析博弈问题具有重要的意义。
纯策略纳什均衡和混合策略纳什均衡简单来说,纯策略纳什均衡指的是,参与人选择的策略是确定的。
比如,在性别之战中,我们通过每个参与人的最优反应确定了该博弈的两种纯策略,即(拳击,拳击)和(芭蕾,芭蕾)。
在纯策略纳什均衡的情况下,我们只能知道具体的纳什均衡下每个参与人的收益,并无法求得参与人进行该博弈的整个的期望收益。
(暂且称为期望收益吧),因为在参与人做选择时,并不知道对方会做出什么样的选择。
假设我们自己为参与人1,我们就会开始想,现在我也不知道对方(参与人2)会做什么样的选择,我先假设他选择芭蕾的概率为p 吧,那么他选择拳击的概率就是1-p,那么这个时候,我们自己在两种策略下的收益为,我们就会选择芭蕾,如果我们就会选择拳击。
我们可以画出参与人1的最优反应曲线E1是双方都百分百选择拳击,E2是双方都百分百选择芭蕾,也就是我们之前求出的纯策略纳什均衡,而E3就是我们要算的混合策略纳什均衡。
在该点U1=4/3由于博弈是对称的,U2=4/3由于参与人1在(拳击,拳击)时的收益1比选择(芭蕾,芭蕾)时的E3的收益4/3低,所以参与人1是肯定不会百分百选择E1作为均衡点的,同理,参与人2也不会百分百选择E2作为均衡点。
既然参与人都可以自主选择自己的概率,那么只有在混合策略纳什均衡点E3这一个均衡。
即参与人1分别以2/3和1/3的概率选择芭蕾和拳击,参与人2以1/3和2/3的概率选择芭蕾和拳击。
所以在这个博弈里,只有一个混合策略纳什均衡,也就是E3点所代表的均衡。
只要偏离这个点的概率,那么博弈的结果就会变为E1或者E2,这时总会有一个参与人不愿选择这样的结果,博弈无法达到均衡。
所以最终寻找这个严格混合策略纳什均衡点的过程可以陈述为,给定其他参与人的混合策略,目标参与人在可行行动中的任意随机选择都是无差异的。
即令2p=1-p,q=2(1-q),这就是寻找混合策略纳什均衡的解题方式。
也可以通过同时假设两个参与人的概率,写出每个参与人在假设概率下的效用,通过让双方同时效用最大化求解。