答疑]动态博弈与子博弈精练纳什均衡

格式：pdf
大小：88.67 KB
文档页数：2

下载文档原格式

/ 2

子博弈精炼纳什均衡的基本概念

子博弈精炼纳什均衡的基本概念在动态博弈中，行动有先后次序，后行动者可以通过观察先行动者的行为，来获得有关先行动者的信息，从而证实或修正自己对先行动者的判断。

完全信息动态博弈，是指博弈中信息是完全的，即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解，但行动是有先后顺序的，后动者可以观察到前者的行动，了解前者行动的所有信息。

在不完全信息静态博弈中，参与人同时行动，没有机会观察到别人的选择。

而在不完全信息动态博弈中，问题变得更加简单。

博弈开始时，某一参与人既不知道其他参与人的真实类型，也不知道其他参与人所属类型的分布概率。

他只是对这一概率分布有自己的主观判断，即有自己的信念。

博弈开始后，该参与人将根据他所观察到的其他参与人的行为，来修正自己的信念。

并根据这种不断变化的信念，作出自己的战略选择。

动态博弈行动有先后顺序，不同的参与人在不同时点行动，先行动者的选择影响后行动者的选择空间，后行动者可以观察到先行动者做了什么选择，因此，为了做最优的行动选择，每个参与人都必须这样思考问题：如果我如此选择，对方将如何应对？如果我是他，我将会如何行动？给定他的应对，什么是我的最优选择？如下棋。

[1]子博弈精炼纳什均衡包含两层含义:（1）它是原博弈的纳什均衡；（2）它在每一个子博弈上给出纳什均衡。

子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的，而在其他情况下并不合理的行动规则在动态博弈中，参与人的行动有先后顺序，后行动的参与人在自己行动之前就可以观察到先行动者（参与人）的行为，并在此基础上选择相应的策略。

而且，由于先行动者拥有后行动者可能选择策略的完全信息，因而先行动者在选择自己的策略时，就可以预先考虑自己的选择对后行动者选择的影响，并采取相应的对策。

子博弈是指在动态博弈中，所有参与人先后都采取了一次行动后所构成的一组新的博弈，这组博弈中的每一个都称为“子博弈”。

当只当参与人的战略在其子博弈的系列（第二代、第三代…）中，每一个子博弈都构成纳什均衡，就构成了子博弈精练纳什均衡子博弈子博弈（Subgame）[编辑]什么是子博弈子博弈是指在动态博弈中，所有参与人先后都采取了一次行动后所构成的一组新的博弈，这组博弈中的每一个都称为“子博弈”。

子博弈精炼Nash均衡

x9
4,1
• 由于子博弈精炼Nash均衡在任一决策结上都能给出最优决策，这也使得子博弈精炼纳什均衡不仅在均衡路径(即均衡战略组合所对应的路径)上给出参与人的最优选择，而且在非均衡路径(即除均衡路径以外的其它路径)上也能给出参与人的最优选择。
• 所以，子博弈精炼Nash均衡不会含有参与人在博弈进程中不合理的、不可置信的行动。这就是子博弈精炼Nash均衡与Nash均衡的实质性区别。
• 我们知道，“新产品开发博弈”中，如果市场需求大的话，不管对方是否开发，每个企业都应选择“开发”。因此，“当企业1开发时，企业2开发”是合理的，但是，“当企业 1不开发时，企业2不开发”就不合理了。均衡(开发，(开发，不开发))不是关于博弈结果的合理预测。
例2：新产品开发博弈
企业1
开发
市场开发博弈——市场需求小
子博弈精炼纳什均衡的理解
• 只有当一个战略规定的行动在所有可能的情况下都为最优时，它才是一个合理的、可置信的战略。
• 子博弈精炼纳什均衡就是要剔除那些只在特定情况下合理而在其他情况下并不合理的行动规则。
二、子博弈精炼Nash均衡的求解
• 逆推归纳法是最常用的求解子博弈精炼 Nash均衡的方法。
• 由于参与人i选择行动L时使博弈进入了子博弈Γ(xi+1) ，因此，参与人i选择行动L的结果就是得到子博弈Γ(xi+1) 。
• 同样，参与人i选择行动R的结果就是得到子博弈Γ(xi+2) 。
• 所以，参与人i在信息集Ii ({xi})上的最优选择，取决于参与人i在信息集Ii ({xi})上可能采取的行动所导致的各个子博弈。
• 但是，如果在博弈开始之前，企业2采取某种行动使自己的支付(或行动空间)发生改变，那么原来不可置信的威胁就有可能变得可信。

答疑]动态博弈与子博弈精练纳什均衡

我们已经了解了完全信息静态博弈的内容。

这时候，参与人同时行动，或者不同时行动，但是后动的人观察不到先动的人的任何有关其行动的信息，这于同时行动等价。

这时候，任何一个参与人选择行动的时候，没有任何可以依据的信息。

当博弈成为动态的时候，参与人先后行动，后动者可以观察到先动者的行动，因此，后动者选择他的行动的时候，可以依据观察到的信息作选择。

因为先动者可能采取的行动是若干个，所以后动者就有可能观察到同样多的信息。

因此，这时后动者选择的已经不简单的行动，而是一套完整的行动计划——这套行动计划指出，在观察到不同的信息时该怎样随机应变选择自己的行动。

因此，现在后动者的选择变量就是行动计划，我们就把一套完整的行动计划叫做一个策略。

以下图为例，参与人1先动，之后参与人2行动，参与人2可以观察到参与人1的选择。

参与人的选择就是L或者R，这既是他的行动有时他的策略，因为参与人1行动时可能出现的信息只有一种情况——空信息集——因为他先动，这时什么信息也没有。

1行动之后，1的行动可以被2观察，因此2可能观察到的信息就有可能是L或者R，因此，2的行动会根据这些信息作出。

2的一套完整的行动计划应该告诉他，在观察到L时选择什么，观察到R时选择什么，由此我们也可以看出，如果2把行动的选择委托给另外的人，这个人可以根据2的行动计划处理任何可能发生或者面对的形式。

这样，2的行动计划——我们称为策略，就有四种可能：1，观察到L时，选F，观察到R时，选F。

我们用一个有序二维向量（F，F）表示。

2，观察到L时，选F，观察到R时，选C。

我们用一个有序二维向量（F，C）表示。

3，观察到L时，选C，观察到R时，选F。

我们用一个有序二维向量（C，F）表示。

4，观察到L时，选C，观察到R时，选C。

我们用一个有序二维向量（C，C）表示。

总结：参与人1的行动是L或者R，由于是先动，没有信息，所以策略也就是行动。

参与人2的行动是F或者C，由于是后动，有信息，策略是建立在信息上的完整行动——计划，有四个策略：（F，F），（F，C）（C，F）（C，C）。

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

一：子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前，我们需要先介绍“子博弈”这个概念。

子博弈（sub game）：由一个单结信息集X开始的与所有该决策结的后续结（包括终点结）组成的，能够自成一个博弈的原博弈的一部分。

即给定“历史”，每一个行动选择开始至博弈结束构成了的一个博弈，称为原动态博弈的一个“子博弈”。

子博弈可以作为一个独立的博弈进行分析，并且与原博弈具有相同的信息结构。

为了叙述方便，一般用表示博弈树中开始于决策结的子博弈。

譬如图3.5，该博弈存在3个子博弈：除了原博弈自己以外，还存在两个子博弈图3.6a 子博弈和图3.6b子博弈。

在静态博弈分析时，我们所说的战略是指参与人声明他将做出何种选择，而他们往往也是按照声明做出实际选择的；在动态博弈中，战略尽管仍然具有这种含义，但博弈在行动选择上参与人具有选择行动的先后顺序情况下，参与人有了一种额外的选择——事后机会主义，后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动，而放弃事前所声明的战略所规定的行动选择选择其行动。

这意味着，在动态博弈中，即使参与人人按事前所声明的战略组合构成一个纳什均衡，而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择，这些行动选择也可能并非参与人在对应信息集上的最优行动选择。

而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时，按照理性人假设，可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动，而是机会主义地选择最优的行动。

这样，具有这种特点的纳什均衡就是不可信的，即不能作为模型的预测结果，按照“精炼”纳什均衡的思想，应当将其消掉。

定义3.1：子博弈精炼纳什均衡（SPNE）：扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当：如果它是原博弈的纳什均衡；它在每一个子博弈上也都构成纳什均衡。

如果一个完美信息的动态博弈中，各博弈方的策略构成的一个策略组合满足：在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

博弈论练习题2答案

博弈论练习题（四）一、什么是子博弈精炼纳什均衡？答：将纳什均衡中包含的不可置信的威胁策略剔除出去。

它要求参与者的决策在任何时点上都是最优的。

由于剔除了不可置信的威胁，在许多情况下，精炼纳什均衡也就缩小了纳什均衡的个数。

只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。

或者说，组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。

二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大？为什么？答：正确，博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性，这是静态博弈的范畴。

除此之外，还要求相关的参与者具有层次较高的“交互理性”，要求不同个体之间在理性和行为方面具有一种“默契”。

即，人们的自身利益的最大化不仅取决于自己的选择，还取决于与之相关的其他人的选择与行为，那么为了实现自己的最大利益，个体的理性决策就必须考虑他人的理性选择与行为。

作为博弈论的基础，交互理性是其基本的理性要求。

博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以与各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。

也就是，每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略，还需知晓各种情况下自己最终的收益或其概率分布，并且每个博弈参与者都知道各个参与者掌握这些信息；更为重要的是，每个博弈参与者都知道所有参与者都是理性的，都知道其他博弈参与者知道所有参与者都是理性的，都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。

理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设，是实现交互理性和理性主义的纳什均衡的基本前提，这些，都是动态博弈的范畴。

因此说，参与者理性问题对动态博弈的分析影响更大。

三、纳什均衡和精炼纳什均衡存在哪些问题？答：纳什均衡存在的问题：(1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡，它是通过概率来计算纳什均衡，在这种均衡下，给定其他参与人的策略选择概率，每个参与人都可以为自己确定选择每一种策略的最优概率。

博弈论3-3子博弈完美纳什均衡

01子博弈02子博弈完美纳什均衡03承诺行动193.3 子博弈和子博弈完美纳什均衡例第三种开金矿博弈不借借不分分（1，0）不打打（0，4）（-1，0）（2，2）乙甲乙法律保障不足的开金矿博弈——分钱打官司都不可信子博弈不分分不打打（0，4）（-1，0）（2，2）甲乙子博弈可以看作是动态博弈中满足一定要求的次级博弈。

子博弈：由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的组成部分，称为原动态博弈的一个“子博弈”。

子博弈本身就是一个博弈！例第三种开金矿博弈不借借不分分（1，0）不打打（0，4）（-1，0）（2，2）乙甲乙法律保障不足的开金矿博弈——分钱打官司都不可信一级子博弈不分分不打打（0，4）（-1，0）（2，2）甲乙二级子博弈不打打（0，4）（-1，0）乙例子：仿冒和反仿冒博弈A不制止制止（-2，5）（2，2）（10，4）（5，5）不仿冒（0，10）仿冒不制止制止仿冒不仿冒BAB15例子：仿冒和反仿冒博弈（续）A不制止制止（-2，5）（2，2）（10，4）（5，5）不仿冒（0，10）仿冒不制止制止仿冒不仿冒BAB不制止制止（-2，5）（2，2）（10，4）（5，5）不制止制止仿冒不仿冒BAB不制止制止（2，2）（10，4）（5，5）仿冒不仿冒AB不制止制止（2，2）（10，4）B一级子博弈二级子博弈三级子博弈原博弈子博弈特点：（1）动态博弈本身不是它自己的子博弈。

（2）子博弈不能分割任何信息集。

首先，子博弈不能包括原博弈的第一个阶段，也就是说，原博弈不是自己的子博弈。

其次，子博弈必须有一个明确的初始信息集，意味着子博弈不能分割任何信息集。

122111221只有2个子博弈子博弈存在4个子博弈(Subgame-perfect Nash equilibrium)子博弈完美纳什均衡：如果一个完美信息的动态博弈的一个策略组合满足在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么称该策略组合为该动态博弈的一个“子博弈完美纳什均衡”。

第二章完全信息动态博弈篇章

第i个企业的利润函数为：

i (q1, q2 ) qi ( P(Q) c),i 1,2
斯坦克尔伯的寡头竞争模型

用逆向归纳法求解，首先考虑给定q1的情况下，企业2 的最优选择。企业2的问题是：
Max 2 (q1 , q2 ) q2 (a q1 q2 c)
最优化一阶条件意味着：
轮流出价的讨价还价模型

一般来说，如果 0 i 1, i 1, 2均衡结果不仅依赖于贴现因子的相对比率，而且依赖于博弈时间长度T和谁在最后阶段出价。然而这种依存关系随T的变大而变小；当T趋于无穷大时，我们得到“先动优势”：即如果 1 2 唯一的均衡是 x 1 (1 ). 定理（Rubinstein 1982）：在无限期轮流出价博弈中，唯一的子博弈精炼纳什均衡结果是： 1 2 1 * * x (if 1 2 x ) 1 1 2 1
典型的旅行者困境收益矩阵（仅考虑整数）
100 100 99 98 97 96 95 …… 5 4 3 2
100,100 101,97 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
99
97,101 99,99 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
第三章完全信息动态搏弈 -子博弈精炼纳什均衡

•
一博弈扩展式表述
二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡四应用举例斯坦克尔伯的寡头竞争模型
•
• •
轮流出价的讨价还价模型
囚徒的救赎旅行者困境五重复博弈
轮流出价的讨价还价模型(1)

《经济博弈论》复习题参考答案

《经济博弈论》复习题及参考答案一、名词解释1、混合战略纳什均衡如果在博弈的利益表中，无法找到任何一方都可以接受（不一定利益最大化）的方案，也就是没有哪一种组合是在给定对手策略下没有动机改变自己策略的情况。

这时博弈没有纯策略均衡，需要一个“概率表”指导博弈结果。

在博弈G={S1,S2……Sn；U1,U2……Un}中第i个博弈方策略空间为Si={Si1……Sik}则博弈方以概率分布Pi=(Pi……Pik)随机在k个可选策略中选的的策略称为一个混合策略纳什均衡。

2、子博弈精炼纳什均衡对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。

子博弈精练纳什均衡所要求的是参与人应该是序惯理性的。

对于有限完美信息博弈，逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。

3、完全信息动态博弈完全信息动态博弈，是指博弈中信息是完全的，即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解，但行动是有先后顺序的，后动者可以观察到前者的行动，了解前者行动的所有信息。

4、不完全信息动态博弈指在动态博弈中，行动有先后次序，博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率，即知道“自然”参与人的不同类型与相应选择之间的关系，但是，参与人并不知道其他的参与人具体属于哪一种类型。

由于行动有先后顺序，后行动者可以通过观察先行动者的行为，获得有关先行动者的信息，从而证实或修正自己对先行动者的行动。

5、完全信息静态博弈完全信息静态博弈指的是信息对于博弈双方来说是完全公开的情况下，双方在博弈中所决定的决策是同时的或者不同时但在对方做决策前不为对方所知的。

6、囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。

虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

完全信息动态博弈子博弈完美的纳什均衡

选择行动？
(1，--31，1) 软弱
乙
行动（0，-2，-20）
对抗
强硬
甲
丙
不行动（-2，1，-1）
不对抗
(-1，1，0)
.
例：
2 L
1 R
(200，200) M
S （a，b）
N 1
（50，300） T
(300，0)
? 若 a=100,b=150 ，SPNE 是什么？ ? 若改变a b的数值，能否使 L-N-T成为SPNE ？ ? 什么情况下， 2会获得300或更高的支付？
.
例：是否请律师？
? 某人在打一场官司，不请律师肯定会输，请律师后的结果与律师的努力程度有关。
? 假设律师努力工作（ 100 小时）时有50%的概率能赢，
不努力工作（ 10小时）只有15% 的概率能赢。
? 如果诉讼获胜可得到 250 万元的赔偿，失败则没有赔偿。 ? 委托方与律师约定根据结果向律师付费，赢官司律师可得赔偿金的10% ，失败则不付费。 ? 如果律师的效用函数为 m-0.05e,m 为报酬，e为付出时间，律师的机会成本为 5万元。
c
2
a
1 不可信
h f
(3, 6)
2
1
d
g
(2 , 4)
b ( 5 ，3 )
(8, 5)
不可信
.
例：
? 甲方是某国的一股企图对抗中央的地方势力 ? 乙方是该国中央政府 ? 丙方是支持甲方的某国际势力
.
威胁不
软弱 (1，-1，1)
可信
乙
行动（0，-2，-2）
对抗
强硬
甲
丙
不行动（-2，1，-1）

子博弈精炼纳什均衡名词解释

子博弈精炼纳什均衡名词解释嘿，朋友们！今天咱来聊聊子博弈精炼纳什均衡这个听起来有点高大上的玩意儿。

你看啊，这就好比是一场复杂的游戏。

在这个游戏里，每个人都有自己的策略和选择。

子博弈精炼纳什均衡呢，就是在这个游戏中的某个局部，大家都找到了一个最佳的玩法，谁也不愿意轻易改变。

咱可以想象一下，一群人在玩扑克牌，每个人都在算计着怎么出牌才能赢。

在某个特定的局面下，大家都形成了一种默契，都按照某种特定的方式出牌，因为这样对自己最有利呀。

这就是一种子博弈精炼纳什均衡。

它可不是随随便便就能达到的哦！就像爬山一样，得一步一步找到最合适的路径。

在这个过程中，大家都得不断地思考、算计，权衡各种利弊。

而且啊，它还很稳定呢，一旦达到了，就不太容易被打破。

比如说在商业竞争中，几家公司在市场上争斗。

他们会根据对手的行动来调整自己的策略，直到找到一个大家都觉得不错的状态，这其实就是一种子博弈精炼纳什均衡啦。

再想想下棋，每一步棋都是在追求一种平衡和最优解。

高手下棋的时候，不就是在寻找那个子博弈精炼纳什均衡嘛！他们可不会瞎走，都是深思熟虑的呀。

那这个子博弈精炼纳什均衡有啥用呢？用处可大啦！它能帮我们更好地理解人与人之间的互动和竞争。

知道了这个，我们就能在各种情况下做出更明智的选择。

比如说在谈判的时候，如果你能理解对方的策略，找到那个子博弈精炼纳什均衡，不就能更好地达成自己的目的了嘛！在团队合作中也是一样，大家找到共同的最优策略，工作就能更顺利地进行呀。

总之，子博弈精炼纳什均衡就像是一个隐藏在各种复杂局面背后的秘密武器。

只要我们能发现它、理解它、运用它，就能在生活和工作中更加得心应手。

难道不是吗？所以啊，大家可得好好琢磨琢磨这个有趣的概念哦！。

博弈论(2)专业知识

（4）依次类推，直到找到一种每个人都接受旳方案（当然，假如只剩余5号，他当然接受一种人独吞旳成果）。
假如你是第一种强盗，你该怎样提出分配方案才干使自己旳收益最大化呢？
博弈论2023
45
➢ 启示：第五人看似安全，其实并没利益，因为威胁不可置信。收买失意者更为轻易
为何革命者总是找穷苦人？为何恐怖分子在阿富汗受欢迎？为何组织中旳一把手，经常抛开二号人物，而与会计出纳打得火热？
策略组合s*，对于任意旳ε，存在着一种位于［0，1］区间上旳正数向量δ1，…，δn和一种完全混合策略向量σ1，…，σn,使得每一种策略都被策略（1-δi）si+δiσn所取代旳新博弈有一种纳什均衡，且该纳什均衡中旳每一种策略和s*旳距离不大于ε。
博弈论2023
35
例：出史密斯进
（1，1）上
注：不完全信息不等于不对称信息
博弈论2023
8
例：扑克牌游戏下注前行为规则。
（1）全部牌洗成面朝上； (完美，拟定）
（2）全部牌洗成面朝下且不能看自己旳牌； (不完全，对称，拟定)
（3）全部牌洗成面朝下且参加人只能看自己旳牌； (不完全，不对称，拟定)
（4）全部牌洗成面朝上，但每个参加人随即都能够用手护住并悄悄丢掉一张牌；
博弈论2023
4
博弈论2023
5
博弈论2023
6
博弈论2023
7
➢信息类型
完美perfect：每个信息集都是单结旳。
完全complete：自然(类型或支付)不首先行动或它旳最初行动被全部人观察到。
拟定certain：自然(类型或支付)不在任何一种参加人行动之后行动。
对称symmetric：没有人在行动时或终点结处拥有与其他人不同旳信息。

12完全信息动态博弈(子博弈完美的纳什均衡)

完全信息动态博弈

完全信息动态博弈
序贯博弈 Sequential Games 重复博弈 Repeated Games

逆推方法
Backward induction
博弈的扩展式 ——
博弈树
game tree
子博弈精炼的纳什均衡
SPNE
子博弈精炼纳什均衡 SPNE

子博弈精炼纳什均衡 SPNE

请用扩展式表示这一博弈
NE （高档，低档）&（低档，高档）
SPNE （高档，低档）
高
(500，500)
高
B1
低高
(1000，700) (700，1000)
A
低
B2
低
(600，600)
例：房地产开发竞争

有 A B 两家公司，各有两种选择开发/放弃 A公司资金充足—— 先行 B公司需要筹措资金—— 后行
承诺不可信
分 B 借（2，2）
不分
A 不借
（ 0， 4）
（1，0）
例：开金矿博弈 —— 三阶段博弈
有法律保障
分
B 借不分 A A 不借 (1，0) 不打（0，4）
威胁可信
(2，2)
打（1，0）
例：开金矿博弈 —— 三阶段博弈
法律保障不足
分
借 B1 不分 A A 不借 (1，0) 不打（0，4）
如何使威胁可信？
开发开发 A 放弃 B2 B1 放弃（ 2， 0）（ 0， 2）（ 0， 0） (0,-1.5） (2,-1.5）（-1，-1）
开发
放弃
SPNE（开发，放弃）
威胁可信，SPNE（放弃，开发）

博弈论中的博弈策略与纳什均衡

博弈论中的博弈策略与纳什均衡博弈论是一门研究决策制定和行为选择的学科，主要应用于经济学、政治学、社会学等领域。

在博弈论中，博弈策略和纳什均衡是两个重要的概念。

本文将探讨博弈策略和纳什均衡的含义、应用以及相关案例。

一、博弈策略的概念博弈策略是指在博弈过程中参与者采取的行动方案。

博弈策略的选择会影响参与者的利益和最终的结果。

博弈策略可以分为纯策略和混合策略两种形式。

1. 纯策略纯策略是指在博弈中，参与者只选择一种特定的行动方案。

例如，在一个两人零和博弈中，参与者可以选择合作或背叛。

如果参与者选择合作，那么他们的策略就是纯策略“合作”；如果参与者选择背叛，那么他们的策略就是纯策略“背叛”。

2. 混合策略混合策略是指在博弈中，参与者以一定的概率选择不同的纯策略。

例如，在一个两人博弈中，参与者可以选择以50%的概率选择合作，以50%的概率选择背叛。

这样的策略就是混合策略。

二、纳什均衡的概念纳什均衡是博弈论中的一个重要概念，指的是在一个博弈中，每个参与者都选择了最优的策略，而且没有动机再次改变策略。

纳什均衡是一种稳定的策略状态，参与者无法通过改变自己的策略来获得更好的结果。

纳什均衡可以分为纯策略均衡和混合策略均衡两种形式。

1. 纯策略均衡纯策略均衡指的是在一个博弈中，每个参与者都选择了一个特定的纯策略，而且没有其他纯策略可以给他们带来更好的结果。

在纯策略均衡下，每个参与者的策略选择是最优的。

2. 混合策略均衡混合策略均衡指的是在一个博弈中，每个参与者以一定的概率选择不同的纯策略，而且没有其他混合策略可以给他们带来更好的结果。

在混合策略均衡下，每个参与者的策略选择是最优的。

三、博弈策略与纳什均衡的应用博弈策略和纳什均衡在许多领域都有广泛的应用，尤其是在经济学和政治学中。

下面将介绍一些实际案例。

1. 俘虏困境俘虏困境是一个经典的博弈论案例。

在这个案例中，两名嫌疑人被关押在不同的牢房，警察给他们提供了一个选择：如果两人都保持沉默，那么他们都只会被判处轻罪；如果其中一个人供认，而另一个人保持沉默，供认者将被免罪，而保持沉默者将被判处重罪；如果两人都供认，那么他们都将被判处重罪。

子博弈精炼纳什均衡

子博弈精炼纳什均衡●将纳什均衡中包含的不可置信的威胁策略剔除出去。

它要求参与者的决策在任何时点上都是最优的，决策者要“随机应变”，“向前看”，而不是固守旧略。

●由于剔除了不可置信的威胁，在许多情况下，精炼纳什均衡也就缩小了纳什均衡的个数。

这一点对预测分析是非常有意义的。

与纳什均衡的区别●在纳什均衡中，参与人在选择自己战略时，把其他参与人策略当作给定的，不考虑自己的选择将如何影响对手的策略。

●实际上，当一个人行动在前，另一个人行动在后时，后者自然会根据前者的选择而调整自己的选择，前者在作选择时自然会理性地考虑这一点，所以不可能不考虑自己的选择对其对手选择的影响。

博弈表达的标准型与扩展型●博弈的标准型表达有三个要素：参与人，可选择策略及支付函数。

•两人有限策略博弈的标准型可用一个矩阵表来表示。

●扩展型表达包括五个要素：•（1）参与人；（2）每个参与人选择行动的时点；（3）每个参与人在每次行动时可供选择的行动集合；（4）每个参与人在每次行动时有关对手过去行动选择的信息；（5）支付函数。

市场进入阻挠博弈●假设一个企业A是市场上的唯一供给者，面临企业B可能的竞争威胁。

企业A有两种可选策略，即斗争与默许。

斗争表现为采用降低价格使B的收益为0，默许意味着维持高价格。

企业B也有两种策略：进入或者不进入。

假定进入之前垄断利润为300，进入之后寡头利润共为100（各得50），进入成本是10。

各种策略组合下的支付矩阵如下表：举例分析●该博弈显然有两个纳什均衡，即（进入，高价），（不进入，低价）。

●静态分析方法，得到两个纳什均衡。

分析●给定企业B进入的话，企业A选择高价时得50利润，选择低价时得不到利润，所以最优战略是高价（默许）。

同理，给定企业A高价时，进入策略成为企业B最优选择。

尽管在企业B 选择不进入时，企业A采取任何一种策略都是一样得，但只有当企业A选择低价时，不进入才是企业B的最优选择，所以（不进入，低价）也是一个纳什均衡，而（不进入，高价）不是纳什均衡。

子博弈纳什均衡恋爱中的博弈论纳什均衡的实际运

子博弈纳什均衡恋爱中的博弈论纳什均衡的实际运子博弈纳什均衡恋爱中的博弈论--"纳什均衡"的实际运用2010-11-18|Tag：2009年11月23日最近研究博弈论,顺便反思下爱情。

现在,我来说一个故事：电影《天下无贼》中的小偷情侣主角--刘德华和刘若英因为一次合伙盗窃被囚禁,法院已经确定他俩是合伙作案,但却没有足够的证据,于是法官隔离起两个人,分别对两个人说以下同样的话：如果你们都坦白你俩偷了东西,则你俩共同判刑5年；如果你坦白而她不坦白你俩偷了东西,则你立功释放而她判刑10年；如果你不坦白而她坦白你俩偷了东西,则相反,她立功释放而你判10年；如果你俩都不坦白,则我们没有证据,但因你俩有前科,所以共同扣留1年。

好了,我们已知她俩是情侣关系,心里都是想着让对方尽量少判一些,自己判多少年是其次。

现在我们来分析两个人心里的小九九：这时刘德华会这么想：若她坦白了,而自己也坦白了,则两人都判5年！而若自己不坦白,则自己判10年,但她无罪释放,这样对她就比较好。

所以若她坦白,我应该是不坦白对她好一些。

若她不坦白,而自己却坦白了,则我直接释放但她要判10年,这显然不行！而若我也不坦白,则两人都只扣留1年。

所以就算是她不坦白,我仍旧是不坦白对她会好一些。

最终,刘德华对法官说：我不承认我俩偷了东西。

而刘若英也想为了老公好,所以心中的想法跟刘德华是一样的,所以她也想着自己只要不坦白老公就可以早点出来,所以她也跟法官说：我不承认我俩偷了东西。

而我们知道,两个人都不坦白的结果是所有选择中最好的--只扣留1年。

好了,上面的故事告一段落,接下来有一个相同的故事,只是主人公不再是一对恋人,而是两个很自私的小偷。

他俩也合伙偷了东西,法官同样也对他们说了如上的话,那么这两个小偷心里会怎么想呢?小偷一：如果我俩都坦白,则两人都判5年,而若他坦白我不坦白,则我自己判10年！如果我俩都不坦白,则两人都扣留1年,但若是他不坦白我坦白,我无罪释放,哈哈！所以怎么看都是我坦白的好。

动态博弈、重复博弈练习题答案

动态博弈练习题一、名词解释1、子博弈完美纳什均衡如果在一个完美信息的动态博弈中，一个策略组合满足在整个动态博弈及它所有的子博弈中都构成纳什均衡，那么该策略组合称为—个“子博弈完美纳什均衡”。

因为要求在所有子博弈中都构成纳什均衡，因此子博弈完美纳什均衡能够排除均衡策略中不可信的行为(威胁或承诺)，因此具有真正的稳定性。

非子博弈完美的纳什均衡不能做到这一点。

子博弈完美纳什均衡是动态博弈分析的核心均衡概念。

子博弈完美纳什均衡本身也是纳什均衡，是比纳什均衡更强的均衡概念。

2、逆推归纳法从动态博弈的最后一个阶段博弈方的行为开始分析，确定所分析阶段博弈方的选择和路径，然后再确定前一个阶段博弈方的选择和路径，逐步倒到第一个阶段的分析方法，称为逆推归纳法。

逆推归纳法是动态博弈分析最重要、基本的方法。

二、单项选择题1.下列关于策略的叙述哪个是错误的（ C ）：A. 策略是局中人选择的一套行动计划；B. 参与博弈的每一个局中人都有若干个策略；C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的；D. 策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。

2. 子博弈精炼纳什均衡（ C ）：A. 是一个一般意义上的纳什均衡；B. 和纳什均衡没有什么关系；C. 要求某一策略组合在每一个子博弈上都构成一个纳什均衡；D. 要求某一策略组合在原博弈上都构成一个纳什均衡。

3．（C ）可以排除不可信威胁。

A．纳什均衡B．帕雷托上策均衡C．子博弈完美均衡D．风险上策均衡4. 寻找子博弈完美均衡的方法一般是（D ）。

A．划线法B．箭头法C．上策均衡分析D．逆推归纳法5.在动态博弈战略行动中，只有当局中人从实施某一威胁所能获得的总收益（ A ）不实施该威胁所获得的总收益时，该威胁才是可信的。

A 大于B 等于C 小于D 以上都有可能三、判断题1.子博弈精炼纳什均衡不是一个纳什均衡。

（ × ）2.在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。

子博弈精炼纳什均衡坏孩子例题

子博弈精炼纳什均衡坏孩子例题摘要：1.子博弈精炼纳什均衡的概念2.子博弈精炼纳什均衡的创立者3.子博弈精炼纳什均衡的例子4.子博弈精炼纳什均衡的应用正文：一、子博弈精炼纳什均衡的概念子博弈精炼纳什均衡（Subgame Perfect Nash Equilibrium）是一种在完全信息动态博弈中求解纳什均衡的方法。

它是由1994 年诺贝尔经济学奖获奖者、莱茵哈德·泽尔腾（Reinhard Selten）在20 世纪60 年代中期提出的。

泽尔腾将纳什均衡概念引入动态分析，为求解动态博弈问题提供了一种有效的工具。

二、子博弈精炼纳什均衡的创立者子博弈精炼纳什均衡的创立者是莱茵哈德·泽尔腾。

他在1965 年发表的《需求减少条件下寡头垄断模型》一文中，首次提出了这一概念。

在此基础上，泽尔腾对动态博弈进行了深入研究，并因此荣获1994 年诺贝尔经济学奖。

三、子博弈精炼纳什均衡的例子为了更好地理解子博弈精炼纳什均衡，我们可以通过一个例子来说明。

假设有两个玩家A 和B，他们要决定是否合作完成一个任务。

任务的完成需要两个玩家的共同努力，如果两人都努力，则任务完成概率高；如果只有一个人努力，则任务完成概率较低。

玩家A 和B 都可以选择努力或不努力。

在这个例子中，子博弈精炼纳什均衡的解为：A 和B 都努力。

这是因为，如果A 努力而B 不努力，那么任务很难完成，A 的收益会受到影响；同样，如果B 努力而A 不努力，任务也很难完成，B 的收益会受到影响。

因此，A 和B 都会选择努力，这样任务才能顺利完成，双方收益最大。

四、子博弈精炼纳什均衡的应用子博弈精炼纳什均衡在经济学、社会学、政治学等领域具有广泛的应用。

例如，在拍卖市场中，竞拍者可以通过子博弈精炼纳什均衡来确定最佳的竞拍策略；在劳资谈判中，雇主和工会可以通过子博弈精炼纳什均衡来达成最有利于双方的协议。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

我们已经了解了完全信息静态博弈的内容。

这时候，参与人同时行动，或者不同时行动，但是后动的人观察不到先动的人的任何有关其行动的信息，这于同时行动等价。

这时候，任何一个参与人选择行动的时候，没有任何可以依据的信息。

当博弈成为动态的时候，参与人先后行动，后动者可以观察到先动者的行动，因此，后动者选择他的行动的时候，可以依据观察到的信息作选择。

因为先动者可能采取的行动是若干个，所以后动者就有可能观察到同样多的信息。

因此，现在后动者的选择变量就是行动计划，我们就把一套完整的行动计划叫做一个策略。

以下图为例，参与人1先动，之后参与人2行动，参与人2可以观察到参与人1的选择。

1行动之后，1的行动可以被2观察，因此2可能观察到的信息就有可能是L或者R，因此，2的行动会根据这些信息作出。

这样，2的行动计划——我们称为策略，就有四种可能：
1，观察到L时，选F，观察到R时，选F。

我们用一个有序二维向量（F，F）表示。

2，观察到L时，选F，观察到R时，选C。

我们用一个有序二维向量（F，C）表示。

3，观察到L时，选C，观察到R时，选F。

我们用一个有序二维向量（C，F）表示。

4，观察到L时，选C，观察到R时，选C。

我们用一个有序二维向量（C，C）表示。

总结：参与人1的行动是L或者R，由于是先动，没有信息，所以策略也就是行动。

参与人2的行动是F或者C，由于是后动，有信息，策略是建立在信息上的完整行动——计划，有四个策略：（F，F），（F，C）（C，F）（C，C）。

参与人1
L R
参与人2 参与人2
F C F C
6 4 5 8
6 1 ‐10 ‐3
子博弈：在动态博弈中，我们现在接触到的都可以用树形图来表示。

从每一个结点开始的剩余博弈，就是这个动态博弈的子博弈。

在上面的图中，包括起始点在内，总共有三个结点，于是就有三个子博弈。

其中博弈本身也是一个子博弈。

子博弈精练纳什均衡：一组策略组合在所有的子博弈上都构成纳什均衡，那么这组策略称为子博弈精练纳什均衡。

在上图的例子中，{L，（F，F）}构成一个纳什均衡。

因为给定（F，F），参与1选L得到6，选R得到5，给定L，参与人2选（F，F）得6，选（F，C）得6，选（C，F）得1，选（C，C）得1。

选（F，F）最大化了自己的支。

但是{L，（F，F）}在红色线标出的这个子博弈中没有给出纳什均衡。

因为红色线构成的子博弈，相当于只有1个参与人2，有两种行动的单人博弈，这个子博弈的纳什均衡就是C，因为2选择F只能得到‐10<选C可以得到的‐3。

因此，{L，（F，F）}虽然是纳什均衡，但不是子博弈纳什均衡。

同理，我们也可以看出在兰色线构成的子博弈中，子博弈纳什均衡一定是F，所以子博弈精练纳什均衡中2的策略必须是（F，C），给定2的这一策略，1的最优策略就是R。

所以子博弈精练纳什均衡就是{R，（F，C）}，大家可以检验这个策略组合是否在所有的子博弈上都给出了纳什均衡。

答疑]动态博弈与子博弈精练纳什均衡

合集下载

子博弈精炼纳什均衡的基本概念

子博弈精炼Nash均衡

答疑]动态博弈与子博弈精练纳什均衡

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

博弈论练习题2答案

博弈论3-3子博弈完美纳什均衡

第二章完全信息动态博弈篇章

《经济博弈论》复习题参考答案

完全信息动态博弈子博弈完美的纳什均衡

子博弈精炼纳什均衡名词解释

博弈论(2)专业知识

12完全信息动态博弈(子博弈完美的纳什均衡)

博弈论中的博弈策略与纳什均衡

子博弈精炼纳什均衡

子博弈纳什均衡恋爱中的博弈论纳什均衡的实际运

动态博弈、重复博弈练习题答案

子博弈精炼纳什均衡坏孩子例题

文档推荐

最新文档