解释现实中的纳什均衡现象

格式：ppt
大小：1.33 MB
文档页数：36

下载文档原格式

/ 36

纳什均衡

纳什均衡简介纳什均衡，又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。

在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。

如果两个博弈的当事人的策略组合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。

一个策略组合被称为纳什均衡，当每个博弈者的均衡策略都是为了达到自己期望收益的最大值，与此同时，其他所有博弈者也遵循这样的策略。

纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是约翰·纳什在普林斯顿大学攻读博士学位时完成的。

实际上，博弈论的研究起始于1944年冯·诺依曼（Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。

然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“非合作博弈”做了明确的区分和定义。

阿尔伯特·塔克（Alberttucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。

它发展了本身很有意义的n人有限非合作博弈的概念和性质。

并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。

在概念和方法两方面，该论文都是作者的独立创造。

”纳什均衡例子博弈论中一个著名的例子就是囚徒困境。

囚徒困境是一个非零和博弈，说的是两个嫌疑犯甲和乙私人民宅联手作案，被警方逮住但未获证据。

警方于是将两个嫌疑犯分开审讯。

警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑3个月，对方将被判刑10年；若两人都不招供则因未获证据但私人民宅将各拘留1年；如果两人均招供，每人将被判刑5年。

浅析古诺模型的纳什均衡及应用

浅析古诺模型的纳什均衡及应用【摘要】古诺模型是博弈论中的经典模型之一，通过分析双方角色和策略的选择，可以得出纳什均衡的解。

纳什均衡是指在博弈中每个参与者采取最佳应对策略的状态，使得没有一个参与者可以通过改变自身策略来获得更高的收益。

通过计算纳什均衡，可以确定在古诺模型中各方的最优策略选择。

古诺模型在博弈论中有着广泛的应用，能够描述各种决策情形，并帮助分析各方的利益冲突。

古诺模型也存在局限性，例如假设信息完全对称等问题。

纳什均衡的意义和应用前景则在于帮助理解博弈中的策略选择规律，为实际决策提供理论指导。

通过深入研究古诺模型和纳什均衡的概念与应用，可以更好地理解博弈论在现实中的应用。

【关键词】关键词：古诺模型、纳什均衡、博弈论、角色与策略、计算方法、局限性、意义和应用前景。

1. 引言1.1 古诺模型的基本概念古诺模型的基本概念是现代博弈论的基础之一。

古诺模型是由约翰·冯·诺依曼和奥斯卡·摩根斯特恩在20世纪40年代提出的博弈论模型，被广泛应用于经济学、政治学、生物学等领域。

古诺模型主要研究多方参与的博弈中的决策问题，其基本假设是参与者都具有理性并追求最大化自身利益。

在古诺模型中，参与者被称为玩家，每个玩家有自己的策略空间和支付函数。

策略空间是玩家可以选择的所有可能行动，支付函数则是描述了每个玩家在不同策略组合下所获得的收益。

古诺模型中的策略可以是纯策略，即玩家直接选择一个确定的行动，也可以是混合策略，即以一定概率选择不同的纯策略。

通过分析古诺模型中各个玩家的策略选择和收益情况，可以得到博弈的纳什均衡。

纳什均衡即在一个博弈中，每个玩家选择的策略都是最优的，给定其他玩家的策略时，自己没有动机单方面改变策略。

纳什均衡是古诺模型中的一个重要概念，也是博弈论中的核心内容之一。

1.2 纳什均衡的概念纳什均衡是博弈论中一个重要的概念，它由约翰·纳什于1950年提出。

在一个博弈中，如果每个参与者都选择了最优的策略，且已知其他人的选择情况下仍然坚持自己的选择，那么这种情况就被称为纳什均衡。

纳什均衡理论课件

迭代逼近法
总结词
通过不断迭代和调整策略来逼近纳什均衡。
VS
详细描述
迭代逼近法是一种通过不断迭代和调整参与者的策略，以逐渐逼近纳什均衡的方法。这种方法可以在不知道具体的纳什均衡的情况下，通过迭代过程找到近似解。
04
纳什均衡的扩展与深化
非合作博弈中的纳什均衡
要点一
总结词
非合作博弈中，纳什均衡是指参与人选择策略时，没有达成任何协议或合作，各自追求自身利益的最大化。
纳什均衡理论课件
目录 CONTENTS
• 纳什均衡理论概述 • 纳什均衡的分类与特性 • 纳什均衡的证明方法 • 纳什均衡的扩展与深化 • 纳什均衡理论的现实应用 • 纳什均衡理论的前沿研究与展望
01
纳什均衡理论概述
定义与概念
纳什均衡定义：在博弈中，如果每个参与者的策略都是针对其他参与者的最优策略，则该博弈状态被称为纳什均衡。
社会学
纳什均衡理论在社会学中用于研究社会行为、合作与冲突、社会规范等领域，揭示了社会现象背后的博弈逻辑。
生物学
在生物学中，纳什均衡理论用于研究生物种群竞争、进化策略等领域，解释了生物种群之间的生存竞争与演化现象。
政治学
在政治学中，纳什均衡理论用于分析国际关系、政治竞争等领域，揭示了权力与利益分配的博弈逻辑。
社会冲突管理
在处理社会冲突时，可运用纳什均衡理论来分析各方的利益和策略，寻求最优解决方案。
公共资源管理
在管理公共资源时，政府可运用纳什均衡理论来分析个体和团体的竞争策略，制定最佳资源分配方案。
06
纳什均衡理论的前沿研究与展望
当前研究热点与难点
热点
复杂系统中的纳什均衡、多智能体系统中的纳什均衡、网络博弈中的纳什均衡

纳什均衡点

纳什均衡点纳什均衡点纳什均衡点（港译：纳殊均衡点），又称为非合作博弈均衡点，是博弈论的一个重要概念，以约翰·纳什命名。

如果某情况下无一参与者可以独自行动而增加收益，则此策略组合被称为纳什均衡点[1]。

[编辑本段]例子经典的例子就是囚徒困境，囚徒困境是一个非零和博弈。

大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑一年，而对方将被判刑十年；如果两人均招供，将均被判刑五年。

于是，两人同时陷入招供还是不招供的两难处境。

如果两人均不招供，将最有利，只被判刑三年。

但两人无法沟通，于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳氏均衡点。

这时，个体的理性利益选择是与整体的理性利益选择不一致的。

囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年；乙判刑一年不招供甲判刑一年；乙判刑十年甲判刑三年基于经济学中Rational agent的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被判刑三年就不会出现。

事实上，这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”（也叫非合作均衡），换言之，在此情况下，无一参与者可以“独自行动”（即单方面改变决定）而增加收获。

[编辑本段]学术争议和批评第一，纳什（Nash）的关于非合作（non-cooperative）博弈论的平衡不动点解（equilibrium/fixpoint）学术证明是非构造性的（non-constructive），就是说纳什用角谷静夫不动点定理（Kakutani fixed point theorem）证明了平衡不动点解是存在的，但却不能指出以什么构造算法如何去达到这个平衡不动点解。

这种非构造性的发现对现实生活里的博弈的作用是有限的，即使知道平衡不动点解存在，在很多情况下达不到并不能解决问题。

[来源请求]在数学意义上，纳什并没有超越角谷静夫不动点定理。

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡在纳什均衡中，你不一定满意其他的策略，但你的策略是回馈对手招数的最佳策略。

从囚徒困境中我们会发现，作为博弈各方的行动就是针对对方行动而确定的最佳对策，而一旦知道对方在做什么，就没人愿意改变自己的做法。

博弈论学把这么一个结果称为均衡。

这个概念是有普林斯顿大学数学家约翰·纳什提出的，因此被称为纳什均衡。

诺贝尔经济学奖获得者萨缪尔森有句名言，你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词，供给与需求。

博弈论专家坎多瑞引申说：“要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是纳什均衡”。

1950年，还是一名研究生的纳什写了一篇论文，题为《n人博弈的均衡问题》，该文只有短短一页纸，可就这短短一页纸成了博弈论的经典文献。

纳什的贡献是，他证明了在这一类的竞争中，在很广泛的条件下是有稳定解存在的，只要是别人的行为确定下来，竞争者就可以有最佳的策略。

那么，什么纳什均衡呢？简单说，就是一策略组合中，所有的参与者面临这样的一种情况：给定你的策略，我的策略是我最好的策略。

给定我的策略，你的策略也是你最好的策略，即双方在对方给定的策略下不愿意调整自己的策略。

纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具，所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展，甚至说是一场革命。

纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战，按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果，从纳什均衡引出一个悖论：从利己的目的触发，结果损人不利己。

“囚徒困境”就是如此，从这个意义说，纳什均衡提出的悖论实际上动摇了西方经济学的基石。

纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。

这个法则如下：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。

所谓博弈均衡，它是一稳定的博弈结果。

均衡是博弈的一结果，但不是说博弈的结果都能成为均衡。

解释现实中的纳什均衡现象

VS
政治联盟
在某些政治体系中，政治家或政党可能会结成联盟，以增加自己的政治影响力。这种联盟的形成也可以看作是一种纳什均衡。
国际贸易
关税壁垒
在国际贸易中，国家可能会采取关税壁垒来保护本国产业。如果所有国家都采取这种策略，最终可能导致全球贸易量下降，形成纳什均衡。
自由贸易协定
为了避免关税壁垒带来的负面影响，国家之间可能会达成自由贸易协定，降低或取消关税。这种协定的达成也可以看作是一种纳什均衡。
激励机制
设计合理的奖励机
制
通过设计合理的奖励机制，激励参与者采取合作行为，避免陷入纳什均衡。
惩罚不合作行为
对采取不合作行为的参与者进行适当的惩罚，以减少不合作行为的发生，促进合作。
引入竞争机制
通过引入竞争机制，激励参与者采取更好的策略和行为，打破纳什均衡。
信息披露
增加信息透明度
通过增加信息透明度，减少信息不对称，让参与者更好地了解彼此的策略和行为，从而避免陷入纳什均衡。
它是一种非合作博弈均衡，基于参与者理性假设和自利原则，是博弈论中的基本概念之一。
纳什均衡的重要性
揭示博弈中策略选择的本质
纳什均衡揭示了博弈中参与者策略选择的本质，即为了实现自身利益最大化，参与者会选择对自己最有利的策略。
指导政策制定
在政策制定中，了解纳什均衡的存在及其特点，有助于政府制定出更有效的政策，引导市场主体理性决策。
解释现实中的纳什均衡现象
目录
• 纳什均衡简介 • 纳什均衡的实例 • 现实生活中的纳什均衡现象 • 如何应对纳什均衡现象 • 纳什均衡的未来研究方向
01纳什均衡简介源自定义与概念纳什均衡是指在博弈论中，一种所有参与者都不愿意偏离的策略组合，即每个参与者都认为当前策略是最好的，不会选择其他策略。

博弈论中的纳什均衡

博弈论中的纳什均衡纳什均衡，Nash equilibrium ,又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。

其研究成果见于题为《非合作博弈》（1950）的博士论文。

该博士论文导致了《n人博弈中的均衡点》（1950）和题为《非合作博弈》（1951）两篇论文的发表。

纳什在上述论文中，介绍了合作博弈与非合作博弈的区别。

他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念，也就是不限于两人零和博弈。

该解概念后来被称为纳什均衡。

定义：纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。

也就是说，此时如果他改变策略他的支付将会降低。

在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

纳什均衡的经典范例就是囚徒博弈，但是研究博弈论常常会使人陷入一种只追求个人利益的误区，事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设，并不总能说明事实。

只是假定他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。

也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。

没有人会主动改变自己的策略以便使自己获得更大利益。

“囚徒的两难选择”有着广泛而深刻的意义。

个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。

纳什均衡

纳什均衡在政治学中的应用
选举策略：候选人在竞选活动中的决策和策略选择政治谈判：国家间在谈判过程中的策略选择和利益平衡国际关系：国家间在合作与竞争中的决策和策略选择政治制度设计：政治制度设计中的决策和策略选择，如选举制度、议会制度等
纳什均衡在管理学中的应用
战略决策：企业在市场竞争中，通过纳什均衡分析，制定最优策略。组织结构：纳什均衡理论可以帮助企业优化组织结构，提高管理效率。激励机制：纳什均衡理论在企业激励机制设计中，可以指导企业制定有效的激励措施。谈判与合作：纳什均衡理论在企业谈判与合作中，可以帮助企业实现利益最大化。
纳什均衡的应用
博弈论：纳什均衡是博弈论的核心概念，用于分析各种博弈问题经济学：纳什均衡在经济学中广泛应用，如市场均衡、价格均衡等政治学：纳什均衡在政治学中用于分析政治博弈，如选举、谈判等社会学：纳什均衡在社会学中用于分析社会现象，如群体行为、社会规范等
纳什均衡的求解方法
第二章
纳什均衡的求解条件
纳什均衡
目录
CONTENTS
01 纳什均衡的概念 02 纳什均衡的求解方法 03 纳什均衡与博弈论 04 纳什均衡的局限性
05 纳什均衡纳什均衡的定义
纳什均衡是指在一个博弈中，每个参与者的策略都是对其他参与者策略的最优反应。
纳什均衡是博弈论中的一个重要概念，由约翰·纳什提出。
纳什均衡的求解步骤
确定博弈的参与者和策略集
建立支付矩阵，表示参与者在不同策略下的收益
计算每个参与者的最佳反应策略
检查是否存在纳什均衡，即每个参与者的策略都是对其他参与者策略的最佳反应
如果存在纳什均衡，则求解得到均衡策略；如果不存在，则重新调整策略集或支付矩阵，重复步骤3-4。

4 纳什均衡

求解纳什均衡的反应函数法

当一个博弈可以用博弈矩阵表示出来时，我们可以用划线法找出其纳什均衡，但若一个博弈中参与人可选择的策略有无穷多个，无法用博弈矩阵表示时，要求出其纳什均衡，就要用到反应函数法。下面简要介绍库诺特寡头竞争模型帮助大家理解反应函数法。
库诺特寡头竞争模型
关于风险厌恶的统计

究竟应取具有支付优势的ＮＥ还是取具有风险优势的ＮＥ呢？假设你是一个很穷的学生或者下岗职工，好不容易在周末找了一个卖力气的工作。老板别出心裁的安排了两种工资支付方式：第一种：每天下班时领取100元；第二种：由抛硬币决定你是领200元，还是一无所得。你会选择哪一种工资支付方式？（注：两种方式的期望工资值相等）
假设：选民的政治态度从 0到 1排列，越往左代表越支持劳工阶层，越往右代表越支持企业主的利益。如下图所示：
民主党
0
· 1/2 3/4 · · 1/4
共和党
1
一个政党要想获胜，就要尽可能拉更多的选民，因此与哪个政党所宣传的政治态度接近的居民越多，哪个政党就获胜。

因此，我们会看到民主党会往右靠，宣布他们也要照顾到中产阶级的利益，甚至兼顾企业主发财；共和党也会向左靠，最终两党实际纲领非常接近，这就是两党执政的稳定性。（中庸之道与极端主义）由于政客们在竞选时是怎样有利于拉选票就怎样讲，当选就忘得一干二净，这就是两党执政的欺骗性。
（2）商业中心区的形成

在城市街道上，我们常见到一些地段上的商店十分拥挤，构成一个繁荣的商业中心区，但另一些地段却十分冷僻，没什么商店。对于这种现象，我们可以运用杂货铺定位模型加以解释。产品定位：趋同化差异化

纳什均衡与囚徒困境

交通拥堵中的纳什均衡
在交通拥堵中，如果所有驾驶员都选择走某一条路，那么这条路就会变得非常拥堵。
如果一个驾驶员选择走另一条路，那么他可能会更快地到达目的地，但其他驾驶员也可能会效仿，导致另一条路也变得拥堵。
纳什均衡在交通拥堵中的表现为：所有驾驶员都选择走同一条路，形成一种稳定的交通状态。
公共资源中的纳什均衡
建立信任
通过建立信任机制，让囚犯相信对方不会出卖自己，从而都
选择抵赖。
引入第三方监管
由第三方监管机构介入，制定规则并监督执行，确保双方都遵守规则。
改变奖励机制
改变奖励机制，使得双方都选择抵赖成为最优解，例如将坦白惩罚变得更重。
增加沟通机会
让囚犯有更多的沟通机会，了解对方的想法和处境，从而更
企业竞争中的囚徒困境
价格战
01
企业为了争夺市场份额，可能会采取降价策略，但这种策略可
能导致整个行业的利润下降。
技术研发
02
企业在研发新技术时面临投入不足或过度投入的困境，如何平
衡研发投入与市场收益是一大挑战。
广告策略
03
企业在广告投放上可能存在囚徒困境，过多的广告投入可能增
加品牌知名度，但也可能导致广告费用过高而降低利润。
01
02
03
公共资源是指那些不属于任何个人或组织的资源，如海洋、森林、空气等。
在公共资源的使用中，如果每个人或组织都过度使用资源，那么资源将会被耗尽或使用资源，导致资源的过度消耗和破坏，形成一种稳定的竞争状态。
05 囚徒困境的实例分析
促进学科发展
纳什均衡与囚徒困境的研究推动了博弈论和其他相关学科的发展，促进了学术交流和知识创新。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Nash:一个数学天才，1950年在22岁获得数学哲学博士学位，诺贝尔经济学奖得主，电影《Beautiful Mind》主人翁纳什均衡：在完全信息静态博弈中各方都实现个利益最大化的策略组合状态纯策略：假定每个参加者每次只选择一个策略进行博弈
1.2 占优策略
LOGO
占优策略:不论对方采取何种策略时，某一策略均为最优策略，则此策略为占优策略。
Ⅳ子博弈精炼纳什均衡
01
❖ 基本理论 ❖ 案例 ❖ 思考
0 2
❖ 基本 ❖ 扑克猜色 ❖ 案例
03
04
❖ 概念 ❖ 逆向归纳法 ❖ 国际贸易中的博
弈
❖ 案例 ❖ 定义 ❖ 讨论
LOGO
1Part 纯策略纳什均衡
◆ 基本理论 ◆案例 ◆思考
汇报人：胡春
2017/04/11
1.1 纳什均衡
LOGO
LOGO
解释现实中的纳什均衡To Explain Nash Equilibrium In Reality
汇报人：胡春
丽郭超
韩发周欣
2017/04/11
CONTE / 目录 LOGO
NTS
一、完全信息静态博弈
Ⅰ纯策略 Ⅱ混合策略纳什均衡纳什均衡
二、完全信息动态博
弈
Ⅲ完全且完美信息动态
博弈
结论：抢行是B的占优策略
B缓行：9＞8，司机A抢行
司机
缓行
A
B抢行：2＞1，司机A抢行
抢行
结论：抢行是A的占优策略
司机 B
缓行抢行 8，8 1，9 9，1 2，2
1.7 对纳什均衡的思考
LOGO
思考
自从古典经济学家亚当· 斯密提出西方经济学的基本前提— — “经济人” ,特别是经新古典经济学家的精确论述,将“ 经济人”作为整个西方经济学的逻辑起点之后,经济学家几乎用了一个世纪来证明斯密的核心理论，但是这种对于逻辑起点的证明至今没有完成
LOGO
F上级奖励反腐部门反腐部门的查处部门 R不腐败官员收益 K腐败官员被查处惩罚 A腐败收益 P腐败官员所耗时间、精力 W0官员现工资 W1退休工资
2.3 收益分析
LOGO
2.3 结果解释官员
LOGO
检察院
LOGO
完全且完美信息动态博
3 弈 Part ◆ 概念 ◆逆向归纳法 ◆国际贸易中的博弈
3.2 逆向归纳法
LOGO
由于参考者1能够和参与者2一样解出2的问题，参与者1可以预测到参与者2对1每一个可能行动a1所做出的反应，这样1在第一阶段要解决的问题可以归结为：
u a R a max ( , ( ))
a1A1 1 1 2 1
假定参与者1的最优化问题同样有惟一解，表示为 a1*，我们称（a1*,R2(a1*)）是这一博弈的逆向归纳解。
子博弈精炼纳什均
衡
3
12
0
1
21
0
逆向归纳解： (R,L’)
4.2 子博弈精炼纳什均衡定义
LOGO
子博弈精炼纳什均衡
定义（赛尔滕，1965）：如果参与者的战略在每一个子博弈中都构成了纳什均衡，则称纳什均衡是子博弈精炼的。
任何有限的完全信息动态博弈都存在子博弈精炼纳什均衡。
4.3 讨论——案例标准式
LOGO
参与者2
(L’,L’) (L’,R’) (R’,L’) (R’,R’
参
)
与
者 L 3,1 3,1 1,2 1,2
R 2,1 0,0 2,1 0,0
纯战略纳什均衡：(R,(R’,L’) ; (L,(R’,R’))
1
4.3 讨论——案例标准式
参与者1
L
R
参与者2
参与者2
LOGO
L’
R’ L’
汇报人：郭超
2017/04/11
3.1 完全且完美信息的动态博弈
LOGO
动态博弈：参与人的行动有先后顺序，而且行动在
后者可以观察到行动在先者的选择，并据此做出相
应的选择。
完全信息的博弈：参与者的收益函数是共同知识的博弈。
完全且完美信息的动态博弈：博弈进行的每一步当中，要选择行动的参与者都知道这一步之前博弈进行的整个过程。
L 参与者2
R 参与者2
参与者1战略
L’
R’ L’
R’
3
12
0
1
21
0
参与者2战略
4.2 子博弈精炼纳什均衡
参与者1
L
R
参与者2
参与者2
LOGO
解：解是对期望将要发生的情况给出相应的行动及结果均衡：均衡是战略集合（战略又是关于行动的完全的计划）
逆向归纳纳什均衡：
L’
R’ L’
R’ (R,(R’,L’))
与
p），参与人1的支付
人
为：
2
p(-1)+(1-p)（红色）
=p+(-1)(1-p)（黑
色）；
求得（1/2，1/2）是纳什混合战略均衡
2.3 案例：腐败治理
政府官员
β
1-β
腐败
不腐败
反腐
α
查处
F-C+R , -K
部
门1 不
0,
- 查 W0+W1+A
α处
-P
R-C , W0+W1
R, W0+W1
A
企业 B
做广告不做广
告
企业
做广告
10，5
15，0
不做广告
6，8
10，2
1.4 没有占优策略的博弈
LOGO
观察
A: 没有占优策略，取决于 B的选择
B: 做广告
问题
A的最佳选择是什么?
A
企业 B
做广告不做广
告
企业
做广告
10，5
15，0
不做广告
6，8
20，2
1.5 占优策略和纳什均衡
3.2 逆向归纳法
参与者1
L
R
参与者2
2 0
L’
R’
参与者1
1
1
L’’
R’’
LOGO
3
0
0
2
3.3 国际贸易中的博弈
LOGO
2001年中国加入了世界贸易组织。国际贸易中倾销是指在正常贸易中一国向另一国出口的某一产品价格低于其正常价值的价格。倾销对市场的破坏作用，各国便采取针对措施即反倾销来限制倾销。倾销商往往不愿就这样失去在进口国的利益，势必又会产生反倾销的新的对策——规避。例如转移生产、变成品输出为零件输出、改变产品型号等。为避免反倾销措施的失败，保护本国利益，捍卫法制的尊严，各个国家纷纷针对规避行为制定了反规避措施。
3.3 国际贸易中的博弈出口厂商
LOGO
不倾销
倾销
进口政府
15 不反倾销 10
反倾销出口厂商
16 不规避 8
规避进口政府
7 不反规避 11
反规避
12
8
7
12
3.3 国际贸易中的博弈
LOGO
维护公平竞争的贸易秩序
反倾销的意义
使受损害的产业得以较快康复和进行产业结构调整
为维护我国产业的经济安全发挥了重要作
企业2
价格不涨价变
企价格不 10， 100，-
业变
10
30
1
涨价 -20， 140， 30 企业1价格不变：10>-30，企业2应当选择“价格不变” 25
企业1涨价： 30>25，企业2应当选择“价格不变”
结论：“价格不变”是企业2的占优策略，企业1在决策时必须以此为前提
1.3 A、B企业广告博弈的损益矩阵
1/2
q)
q2=f(p)
预期收益大于他出黑色；当
2出红色的概
率q1/2，1出
红色的概率为
0，因为他出
q 黑色的期望收
益大于他出红
0
1/2
1
色。
2.2 扑克猜色游戏
参
与给定参与人1（q,1人 q），参与人2的支付 1 是：q+(-1)(1-q)
（红色）=(-1)q+(1q)（黑色）;
LOGO
参
给定参与人2（p,1-
所有以前的行动都合下参与者的收益
可以被观察到
都是共同知识
3.2 逆向归纳法
LOGO
当在博弈的第二个阶段参与者2行动时，由于其前参与者1已选择行动a1，他面临的决策问题可以表示为：
max u (a , a ) 假a定2对AA2 1中2的每一1 个a12，参与者2的最优化问题只有
惟一解，用R2（a1）表示，这就是参与者2对参与者 1的行动的反应（或最优反应）。
大部分经济学家只能认为这是一个不证自明的公理前提；有的经济学家更认为,西方“经济人”的合理性是上帝给予的
这一切表明纳什均衡理论的基础有其不扎实的一面。因为现实中的决策者常常并不只考虑最大限度地获得经济利益,有时候为了公平等方面的要求,会放弃部分或者全部经济利益。
LOGO
混合策略纳什均
2 衡 Part ◆ 基本介绍 ◆ 扑克猜色游戏 ◆ 案例
LOGO
占优策略
“我做我所能做最好的，不管你做什么 ”
“你做你所能做最好的，不管我做什么
”
NASH均衡：我所做的是给定你所做的我所能做的最好的你所做的是给定我所做的你所能做的最好的
1.6 为什么在城市中心道路上禁止汽车鸣喇叭？
LOGO
观察
A缓行: 9＞8，司机B抢行

解释现实中的纳什均衡现象

合集下载

纳什均衡

浅析古诺模型的纳什均衡及应用

纳什均衡理论课件

纳什均衡点

博弈论66个经典例子(9)不会令人后悔的纳什均衡

解释现实中的纳什均衡现象

博弈论中的纳什均衡

纳什均衡

4 纳什均衡

纳什均衡与囚徒困境

文档推荐

最新文档