09 动态博弈的经典模型1

格式：ppt
大小：1.04 MB
文档页数：27

下载文档原格式

博弈论第三章完全且完美信息动态博弈

➢支付：这样假设支付情况：若美国“犯我”，中国“不犯人”，则支付向量为(2,-4)；若美国“不犯我”，中国“犯人”，则支付向量为(3,-5)；若美国“犯我”，中国“犯人”，则支付向量为(-2,-2)；若美国“不犯我”，中国“不犯人”，则支付向量为(1,1)。
我国犯我
犯人 (-2,-2) 不犯人 (2,-4)
大
小
1/2 1/2
B
开发
(4,4)
不开发
(8,0)
B
开发
(-3,-3)
B
不开
不开
发开
发
发
(1,0) (0,8) (0,0)
B 不开
开
发
发
(0,1) (0,0)
房地产开发博弈
垄断者容忍
进入
抵抗
(1,5) (-2,2)
进入者不进入垄断者
容忍抵抗
(0,10) (0,10)
静态博弈用扩展式表述
第一，一个博弈可能有不止一个纳什均衡。
第二，在纳什均衡中，参与人在选择自己的战略时，把其他参与人的战略当作给定的，不考虑自己的选择如何影响对手的战略。这个假设在研究静态博弈时是成立的，因为静态博弈下，所有参与人同时行动，无暇反应。但对动态博弈而言，这个假设就有问题了。当一个人行动在先，另一个人行动在后时，后者自然会根据前者的选择而调整自己的选择，前者自然会理性地预期到这一点，所以不可能不考虑自己的选择对其对手的选择的影响。
第三，与第二个问题相联系，由于不考虑自己选择对别人选择的影响，纳什均衡允许了不可置信威胁的存在。
根据博弈方是否相互了解得益情况，有“完全信息动态博弈”和“不完全信息动态博弈”之分；
根据是否所有博弈方都对自己选择前的博弃过程完全了解，有“完美信息动态博弈”和“不完美信息动态博弈”之分。

(完整)博弈论经典模型全解析(入门级)

博弈论经典模型全解析(入门级)1。

囚徒困境这是博弈论中最最经典的案例了-—囚徒困境,非常耐人寻味。

“囚徒困境"说的是两个囚犯的故事。

这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。

在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作）.这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放，因为只要他们拒不承认，警方无法给他们定罪.但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金.而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。

当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。

那么,这两个囚犯该怎么办呢？是选择互相合作还是互相背叛?从表面上看,他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。

但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子,他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。

这种想法的诱惑力实在太大了.但他也意识到,他的同伙也不是傻子，也会这样来设想他。

所以A犯的结论是，唯一理性的选择就是背叛同伙,把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。

而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。

所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。

企业在信息化过程中需要与咨询企业、软件供应商打交道的。

在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础,切不可贸然合作.在对对方有了足够的信任之后,诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。

博弈论的几个经典模型ppt课件

博弈论的几个经典模型
22
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题： • 冲突情形下，参与人的目标是什么？是采用(作为个人 ) 他自己的最好策略，还是采用 ( 作为集体的一员)他们共同的最好策略？前者导致均衡策略 ( 坦白，坦白 ) ，支付为 (-8 ， -8) ；后者的最好策略是 ( 抵赖，抵赖 ) ，支付为 (-1 ， -1) 。这里反映了个体理性行为与集体理性行为之间的矛盾、冲突。 • 此博弈只进行一次还是重复进行？如果博弈只进行一次，参与人似乎只有坦白才是最好的策略，因为没有理由相信对手会对你有信心，他总认为你自己会坦白；因此，双方都采取坦白策略。然而，若博弈进行多次，则结论将会发生变化。
第四章博弈论的几个经典模型
1
引言
博弈论又被称为对策论（Game Theory)，按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法，博弈论就是研究互动决策的理论。所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策，选择最有利于自己的战略(strategy)。
此外此外还与会计学还与会计学统计学统计学数学基础数学基础社会心理学社会心理学以及诸如认识论与伦理学等哲学分支有重要联以及诸如认识论与伦理学等哲学分支有重要联博弈论的几个经典模型按照按照aumannaumann所撰写的所撰写的新帕尔格雷夫经新帕尔格雷夫经济学大辞典济学大辞典博弈论博弈论辞条的看法辞条的看法标准的标准的博弈论分析出发点是理性的博弈论分析出发点是理性的而不是心理的而不是心理的或社会的角度或社会的角度

第三章完全信息动态博弈 ppt课件

条路径。但每条路径可由不同的策略组合决定。
例如，（开发,(不开发,开发)）决定了
A -> 开发 -> B -> 不开发 -> (1,0)
该路径还可由（开发,(不开发,不开发)）决定。
事实上，该问题共有4条路径，8种策略组合。
ppt课件
12
§2 子博弈精炼纳什均衡
对于动态博弈，Nash均衡可能并不是一个合理的预测。如房地产博弈:
又如，上例中，如果进入者先行动，而在位者在行动前能准确知道前者的行动，那么在位者的信息集为 {进入}或{不进入}。反之，若在位者先行动，则在位者的信息集为{进入，不进入}。
ppt课件
7
三、动态博弈的相关概念
（3） • 完美信息（Perfect information）：一个局中人在行动
时，对之前博弈进程有准确了解，即每一个信息集只包含一个值，则称该局中人具有完美信息。 • 如果动态博弈的所有局中人都有完美信息，则称为完美信息的动态博弈。 • 如果动态博弈中，存在部分局中人具有不完美信息，称为不完美信息的动态博弈。
思考：若进入者真的进入，在位者的最优行动是“默许”。所以“斗争”是一种不可置信的威胁（即使在位企业摆出一副“你进入我就斗争”的架势，进入企业不应被吓到）。而静态博弈承认这种不可置信的威胁，使（不进入，斗争）成为一个Nash均衡。
动态博弈解决方案：剔除不可置信的威胁策略
ppt课件
3
扩展阅读：不可置信的威胁策略引出信息经济学重要的概念—— 承诺行动(Commitment)。
ppt课件
18
三、逆向归纳法求解子博弈精炼Nash均衡
• 从动态博弈的最后一个阶段局中人的行为开始分析

《动态博弈模型》课件

子博弈精炼纳什均衡
在完全信息动态博弈中，子博弈精炼纳什均衡是指通过剔除不可置信威胁和承诺的策略，得到的均衡结果。
不完全信息动态博弈
不完全信息
在不完全信息动态博弈中，至少有一个参与者不拥有关于博弈的所有信息，包括其他参与者的类型、策略和支付函数。
贝叶斯纳什均衡
在不完全信息动态博弈中，贝叶斯纳什均衡是一个重要的概念，它是指所有参与者在给定自己类型和概率分布的条件下，采取的
劳动力市场
经典动态博弈模型用于研究劳动力市场的工资和就业问题，分析雇主和雇员之间的博弈关系。
在政治学中的应用
选举博弈
经典动态博弈模型用于分析选举中的竞选策略，如候选人如何制定竞选纲领、如何进行宣传等。
国际关系
该模型用于研究国家间的外交政策和国际合作，分析各国在利益冲突下的博弈行为。
立法博弈
触发战略
在重复博弈中，触发战略是指一种报复机制，如果某个参与者在某个阶段采取了不合作的策略，其他参与者会在未来的阶段采取报复措施。
04
动态博弈模型的求解方法
逆向归纳法
逆向归纳法是一种求解动态博弈的方法，通过逆向推理，从博弈的最后阶段开始分析，逐步向前推导，最终得出每个参与者的最优策略。
在求解过程中，逆向归纳法假设每个参与者都了解其他参与者的策略选择，并在此基础上选择自己的最优策略。
02
经典动态博弈模型介绍
囚徒困境
总结词
描述两个囚犯因相互背叛而导致双方都不利的结果。
详细描述
囚徒困境是一个经典的动态博弈模型，描述了两个囚犯因被警方逮捕而面临指控的情况。如果两个囚犯都保持沉默，他们都将得到较轻的刑罚；但如果其中一个囚犯背叛另一个，他将得到更轻的刑罚，而另一个囚犯将得到更重的刑罚。然而，如果两个囚犯都背叛彼此，他们都将得到更重的刑罚。因此，尽管合作是最佳策略，但每个囚犯都有动机背叛对方，导致双方都不利的结果。

博弈论3-4经典动态博弈模型

3.4 几个经典动态博弈模型453.4.1 寡占的斯塔克博格模型46动态的寡头产量竞争博弈厂商1先选择，厂商2后选择。

21q q Q +=121111112)](8[)(q q q q q c Q P q u -+-=-=221222222)](8[)(q q q q q c Q P q u -+-=-=策略空间：[0，Q max ]中所有实数。

Q max 为不至于使价格降到亏本的最大限度的产量。

Q Q P P -==8)(价格函数：边际生产成本：无固定成本得益函数：221==c c 2121116q q q q u --=2221226q q q q u --=47两阶段动态博弈。

第一阶段，厂商1选择产量；第二阶段，厂商2选择产量。

1 、第二阶段厂商2的选择目标：得益最大化。

求使自己得益最大化下的产量值，即最大化时的一阶条件：得益函数：2221226q q q q u --=用逆推归纳法进行分析：02602122=--⇒=∂∂q q q u 112213)6(21q q q -=-=求出厂商2对厂商1产量的反应函数：48两阶段动态博弈。

第一阶段，厂商1选择产量；第二阶段，厂商2选择产量。

2 、第一阶段厂商1的选择。

用逆推归纳法进行分析：12213q q -=厂商1可直接求出使自己得益最大化时的产量：厂商1知道2的决策思路：直接将上式代入厂商1的得益函数，得到：2112111121*211*211213)213(66),(q q q q q q q q q q q q u -=---=--=3030*1*111=⇒=-⇒=∂∂q q q u厂商1的最佳产量是生产3单位。

将之代入厂商2的反应函数，得到厂商2的最佳产量5.15.13*2=-=q 此时市场价格为3.5，双方的得益别为4.5和2.25单位。

3*1=q 12213q q -=用逆推归纳法分析得出，该动态博弈的唯一的子博弈完美纳什均衡：厂商1在第一阶段生产3单位产量，厂商2第二阶段生产1.5单位产量。

动态博弈经典模型 ppt课件

1905-1946
PPT课件
4
Stackelberg model —— 产量领先
假设:
两个厂家，行动有先后，leader / follower 产量竞争，leader 先行选择产量，follower 观
察到leader 的选择后再作选择
两个厂商都知道市场需求 Q 且 Q=q1+q2
1
21a2cq1
0
1
2
c

0
q1*

1 2
(a
q1c* )
12代(a入：c)
q2*

1 2
(a
q1
c)
q2*

1 4
(a
c)
总产量
Q＝3/4 (a-c)
价格： P = a-Q =1/4(a+3c)
利润:
1 p(q1 c) 1 8[ (a c)(a 3c) c] 2 p(q2 c) 1 16[(a c)(a 3c) c]
PPT课件
5
例题1 斯塔伯格均衡求解
假设：
市场的需求函数为： Q=120-P
(反)需求函数为： P=120-Q
边际成本 :
MC1=MC2=0
整个市场的需求量在厂商A和B之间进行分配
Q=q1+q2 P=120-Q=120-(q1+q2 )
PPT课件
6
厂商的利润函数为:
1(q1, q2 ) q1P(Q) q1(120 q1 q2 ) 2 (q1, q2 ) q2P(Q) q2 (120 q1 q2 )
PPT课件
14
斯塔伯格模型与古诺模型的比较

博弈论的几个经典模型

模型二、囚徒困境/非合作博弈
囚徒困境可以用来说明许多现象。
寡头定价拍卖出价推销员的努力政治上的讨价还价军备竞赛等（冲突中出现两败俱伤的情况,
往往要考虑到囚徒困境）
*（纯策略）纳什均衡
问题与思考
• 什么是博弈论？试举两个你生活中的例子说明。
• 某年在荷兰召开了一次“合作及社会两难困境研讨会”，与会者都是博弈论的专家。
基本术语
• 博弈涉及哪些内容呢？
博弈涉及至少两个独立的博弈参与者 (player)。
博弈涉及行动者存在着策略（strategy）选择的可能，博弈论用策略空间来表示参与者可以选择的策略。
参与者在不同策略组合下会得到一定的支付（payoff）。
对于博弈参与者来说，存在着一博弈结果。
对于游戏设计者，这是一个最好的
模型二、囚徒困境/非合作博弈
在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境” （prisoners’dilemma）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。
模型二、囚徒困境/非合作博假设：有两个小偷A弈和B联合犯事、私入
第四章博弈论的几个经典模型
讲授人谭建国
引言
博弈论又被称为对策论（ Game Theory)，按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann 教授的说法，博弈论就是研究互动决策的理论。所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决

经典动态博弈模型

3.4.3委托人—代理人理论
此时，代理人的利益也受到了不确定性的影响。委托代理模型的主要问题就是如何激励代理人努力工作。
此时，促使代理人选择努力工作的激励相容约束、参与约束、委托条件？
3.4.3委托人—代理人理论
四、选择报酬和连续努力水平的委托代理模型 (不是选择是否委托，而是选择报酬的水平，并且努力程度是可以连续变化的)
博弈过程相同，但是成果由自然来选择。
3.4.3委托人—代理人理论
有20和10单位两种产出，代理人努力时产出为20单位的概率为0.9，产出为10的概率为0.1；代理人偷懒时，产出为20的概率为0.1，产出为10的概率为0.9。R(0)=0.
此时引入自然(N)反映不确定性。此时的激励相容约束、参与约束、委托条件？
3.4.3委托人—代理人理论
根据松散程度、委托内容、监督难易等不同，委托人—代理人关系有多个不同的情况，其中最为关键的差异是监督的难易。有些可以直接从工作成果来监督，比如流水线上的工人的工作，而有些难以监督，比如：律师、教练等
委托人如何促使代理人的行为符合委托人的利益，是委托—代理理论的重要课题。
努力成果不确定，而且不可监督。考虑代理人有正的机会成本(U1),假设努力的负效应是努力水平的单调递增凸函数C=C(e)
产出R是努力水平e的随机函数，R=R(e)。 w=w(R)这意味着薪酬至少一部分是利润提成
3.4.3委托人—代理人理论
w与e有关，w=w(R)=w[R(e)]。委托人与代理人的得益分别为：
3.4.3 讨价还价(Bargaining)博弈
该模型有许多原型：利润分割、债务纠纷，或财产继承权的争执。第一、第二回合相当于纠纷的各方以不同形式调解的过程，而第三回合则相当于最后提交各司法或仲裁机构进行裁决。而消耗系数则相当于经济纠纷中，相关各方花费在谈判和诉讼等方面的时间和金钱代价。

14-动态博弈经典模型1详解

厂商A 先决定产量 q1，
厂商B根据厂商A的行为再决定产量 q2，厂商A在决策时会考虑厂商B的反应。

求解方法： Backward induction
第二阶段厂商B的最优选择：
max 2 (q1, q2 ) q2 (120 q1 q2 )
2 (q1 , q2 ) 120 q1 2q2 0 q2 q ,q ) * 1 12 120 q 2q 0 FOC：q2 ( (120 q1 )1 2 2 q2 2 q1为厂商A在第一阶 * 1 q2 (120 q1 ) 2 段的实际产量选择
例题2

斯塔伯格均衡求解
假设
市场的需求函数为： Q=a-P
反需求函数为：边际成本 : P=a-Q＝a-q1-q2 AC1= AC2=MC1=MC2=c
厂商A先决定产量 q1 厂商B根据厂商A的行为再决定 q2

ห้องสมุดไป่ตู้
厂商的利润函数为:
1 (q1 , q2 ) q1[ P(Q) MC ] q1 (a q1 q2 c) 1 (q1 , q2 ) q1[ P(Q) MC ] q1 (a q1 q2 c) 2 (q1 , q2 ) q2 [ P(Q) MC ] q2 (a q1 q2 c) 2 (q1 , q2 ) q2 [ P(Q) MC ] q2 (a q1 q2 c)
max 1 (q1 , q2* ) q1 (a q1 q2* c)
1 其中： q2 2 (a q1 c)
*
即：
max 1 (q1 , q ) q1[a q1 1 (a q1 c) c] 2

16动态博弈经典模型

滞胀

滞胀 stagflation
70年代中后期 —— 80年代前期
经济停滞 stagnation 并存通货膨胀 inflation
滞胀 stagflation
&
附加预期的菲利普斯曲线

米尔顿· 弗里德曼Milton Friedman，货币学派创始人
1976年因在消费分析、货币供应理论及历史、和稳定政策复杂性等方面的贡献获得诺贝尔经济学奖。
降低政策动态不一致性

委托代理 Delegation
Rogoff(1985)的模型认为可以把货币政策委派给一个较之总产出更关注通货膨胀的中央银行家，即通过任命一个“保守”的中央银行家来降低通货膨胀偏差（保持央行独立性）。只要公众确信决策者是保守的，那么公众的预期通货膨胀将降低，从而使中央银行能降低通货膨胀的偏差，使实际的通货膨胀与最优通货膨胀更加接近。

参与者：政府 / 私人（理性预期）战略：

私人：预期通涨率πe

政府：通货膨胀率π
私人部门先选择πe，政府部门再选择π

支付：

2 2 政府： M ( ,) y c ( y k y ) ,c > 0 , k > 1

宏观经济政策的动态一致性

根据附加预期的Phillips curve Nhomakorabea
Milton Friedman （1912—2006）
附加预期的菲利普斯曲线

埃德蒙.菲尔普斯Edmund Phelps，新凯恩斯主义经济学家 2006年因在宏观经济跨期决策权衡领域所取得的研究成就，获得诺贝尔经济学奖。

Edmund Phelps（1933－）

信息对抗的动态博弈模型分析

信息对抗的动态博弈模型分析在当今数字化和信息化高速发展的时代，信息对抗已成为一个备受关注的领域。

信息对抗不仅仅存在于军事战争中，也在商业竞争、网络安全等众多领域发挥着重要作用。

而动态博弈模型作为一种有效的分析工具，可以帮助我们更好地理解和应对信息对抗中的各种复杂情况。

一、信息对抗的基本概念信息对抗，简单来说，就是围绕信息的获取、处理、传输和利用等方面展开的竞争与对抗。

在这个过程中，各方都试图通过各种手段获取对自己有利的信息，同时阻止对方获取关键信息，或者干扰、破坏对方的信息系统。

信息对抗的形式多种多样，包括网络攻击与防御、情报收集与反情报、电子战、舆论战等等。

无论是在国家层面的战略决策，还是企业之间的商业竞争，信息的掌握和运用往往能决定胜负的走向。

二、动态博弈模型的特点动态博弈与静态博弈的最大区别在于，参与者的行动存在先后顺序，并且后行动者能够观察到先行动者的行动。

这种顺序性和观察性使得动态博弈更加贴近现实中的信息对抗场景。

在动态博弈中，参与者需要根据对手的行动不断调整自己的策略，预测对手的下一步行动，并考虑到长期的利益和风险。

同时，信息的不完全性和不确定性也是动态博弈的重要特点，参与者往往无法完全掌握对手的所有信息，这就增加了决策的难度和复杂性。

三、信息对抗中动态博弈模型的构建构建信息对抗的动态博弈模型，首先需要明确参与者。

这些参与者可以是国家、组织、企业甚至个人，他们在信息对抗中有着不同的目标和利益诉求。

接下来，要确定参与者的行动集合。

行动可以包括攻击对方的信息系统、采取防御措施、进行信息伪装、发布虚假信息等等。

同时，为每个行动设定相应的成本和收益。

然后，设定博弈的规则和顺序。

比如，是一方先行动，还是双方同时行动；行动的次数是否有限制；信息的传递和共享方式是怎样的等等。

最后，建立参与者的策略空间。

策略是参与者在不同情况下选择行动的方案，通过分析各种可能的策略组合，来预测博弈的结果。

四、动态博弈模型在信息对抗中的应用实例在网络安全领域，黑客与网络防御者之间的对抗就是一个典型的动态博弈。

博弈论_完全信息动态博弈

完全且完美信息动态博弈的子博弈
在完全且完美信息的动态博弈里，由于在每一个阶段需行动的局中人对该阶段以前的行动组合是完全了解的，所以在它的扩展式表述中，该节点一定是单信息节点。也就是说，每个信息集都是单节点信息集，因此在完全且完美信息的动态博弈里，从任何一个节点（不包括顶部节点和底部的终节点）出发，都存在一个子博弈对于取数游戏，若修改规则，可有更多子博弈
例子：私奔博弈
需看到的是，私奔决策是由卓文君做出的。她需要做出这样的选择，是因为她已经知道她父亲卓王孙反对把她嫁给穷书生司马相如。卓王孙甚至不惜以断绝父女关系作为威胁，让她断掉念头。可以用一个完全且完美信息的动态博弈来描述卓文君与其父亲之间的博弈。第一步，卓文君在“私奔”与“断绝想法”中选择第二步，父亲在“默认”与“断绝父女关系”选择
动态博弈的特征
收益函数
因行动组合的个数小于策略组合的个数，而且更为直观，所以在动态博弈中，出于分析的方便，局中人的支付函数是从行动组合到实数集的映射当有n个局中人时，每个行动组合对应一个n维的实数向量但如果动态博弈仍然用策略式来表述的话，其支付函数也仍然是从策略组合到实数集的映射对于完全信息的动态博弈，支付函数对各方而言，都是共同知识
例子
① 甲 ② 左右左乙 ② 右
(2, 0)
(2, -1)
(1, 0)
(3, 1)
13
① 左 ② 甲 ① (-1, 2) 前 (0, 4) 后 (1, 0) (0, 0) 前 (4, -1) 后 (3, 3) 乙甲
右
② 乙 ①
(3, 0, 0)
⑴
(1, 0, 3)
⑹
(2, 3, 1)
⑽
(3, 2, 9)

经典动态博弈模型

博弈策略
由于囚徒无法信任对方，最终都选择坦白，导致集体利益受损。
斗鸡博弈
描述
两只斗鸡在狭路相逢，每只斗鸡都有前进和后退两种选择。如果一只斗鸡前进，另一只后退，则前进的斗鸡获胜；如果两只都前进，则两败俱伤；如果两只都后退，则均无损失。
VS
博弈策略
由于存在两败俱伤的风险，双方更倾向于选择后退以避免损失。
予相应的奖励。
结论
智猪博弈表明，合理的激励机制和任务分配可以激发员工的积极性和创造力。
案例四：猎鹿博弈在国际政治中的影响
猎鹿博弈概述
猎鹿博弈描述了两个猎人合作与不合作对收益的影响，强调了合作的重要性。
国际政治中的影响
在国际关系中，国家间的合作与竞争往往受到猎鹿博弈的影响。合作可以带来共同利益，但也需要克服信任和利益冲突的问题。
02
03
公共品供给
在公共品供给中，政府可运用动态博弈模型分析不同主体之间的互动关系，提高公共品供给效率。
国际关系
贸易摩擦
在国际贸易中，国家之间可以通过动态博弈模型分析贸易摩擦的起因和解决方案，促进国际贸易的稳定发展。
地缘政治
在国际政治中，国家可以利用动态博弈模型分析地缘政治格局的变化趋势，制定合适的国际战略。
结论
斗鸡博弈表明，在竞争激烈的市场环境中，适当的妥协和沟
通对于避免损失至关重要。
案例三：智猪博弈在企业管理中的运用
智猪博弈概述
智猪博弈描述了大猪和小猪在同一个猪圈里抢食物的情况，强调了策略选择的重要
性。
企业管理中的运用
在企业中，智猪博弈可以应用于激励机制设计、项目管理等方面。例如，让有能力的人承担更多责任，同时给
经典动态博弈模型

博弈论的几个经典模型课件

02
在这个模型中，如果双方都抵赖，则各自获得2年的监禁；如果双方都坦白，则各自获得3年的监禁；如果一方坦白而另一方抵赖，则坦白的一方获得1年的监禁，抵赖的一方获得10年的监禁。
03
囚徒困境反映了人类在有限理性和不完全信息下的决策问题。
囚徒困境的策略和最优解
01
02
03
在囚徒困境中，每个参与者都有两种策略：坦
博弈论的发展趋势和应用前景
发展趋势
随着计算机科学的发展，博弈论在人工智能、机器学习等领域的应用逐渐增多。同时，博弈论也在生物学、环境科学、社会学等多个学科中得到广泛应用和发展。未来，博弈论将继续探索更为复杂和现实的模型，以解释和预测更为复杂的行为和现象。
应用前景
博弈论在经济学、政治学、军事等领域有着广泛的应用前景。例如，博弈论可以帮助理解国际贸易中的策略行为、国际政治中的权力均衡以及军事战略中的最优攻击策略等。此外，博弈论也在社交网络分析、市场机制设计等领域展现出强大的应用潜力。
政治学中的应用
投票悖论
投票悖论是指在某些情况下，多数投票的结果可能导致无法达成一致意见或产生不合理的结果。在政治学中，投票悖论被用于探讨民主制度的缺陷和改进方法。
权力均衡
权力均衡是一种政治博弈模型，它描述了政治权力在多个参与者之间的分配和转移。在政治学中，权力均衡被用于分析权力斗争、
政治制度稳定性和政策制定等问题。
纳什均衡模型被广泛应用于市场均衡、产业组织、公共经济学
等领域。
生物学
02
纳什均衡模型也被用于解释生物种群竞争、生态系统平衡等问
题。
社会学
03
纳什均衡模型可以用来分析社会现象，如犯罪、婚姻、教育等

博弈论经典模型全解析(入门级)

博弈论经典模型全解析〔入门级〕1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。

“囚徒困境”说的是两个囚犯的故事。

这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。

在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。

这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。

但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即揭发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。

而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对揭发者的奖赏。

当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。

那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从外表上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。

但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他单独坐牢。

这种想法的诱惑力实在太大了。

但他也意识到，他的同伙也不是傻子，也会这样来设想他。

所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。

而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。

所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。

企业在信息化过程中需要与咨询企业、软件供给商打交道的。

在与这些企业打交道的过程中，我们不可防止地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

FOC：
* 1
∂π 1 (q1 , q2 ) = a − 2q1 − 1 a + q1 − 1 c = 0 2 2 ∂q1
q = 1 (a − c) 2
q2 = 1 (a − c) 4
*
代入： q2 = 1 2 (a − q1 − c) 代入：
*
总产量
Q＝3/4 (a-c) (a-
价格： P = a-Q =1/4(a+3c) a价格：利润: 利润:
π 1 = p(q1 − c) = π 2 = p(q2 − c) =
斯塔伯格模型与古诺模型的比较
q2
古诺均衡点斯塔伯格均衡点
1/3(a1/3(a-c) 1/4(a1/4(a-c)
1/2(a1/2(a-c)
q1
斯塔伯格模型与古诺模型的比较
同：产量竞争异：先行优势 firstfirst- mover advantage 总产量高于古诺竞争价格低于古诺竞争总利润低于古诺竞争消费者剩余大于古诺竞争 compete on quantity
Equilibrium ，1934
Stackelberg model —— 产量领先
假设: 假设:
两个厂家，行动有先后，两个厂家，行动有先后，leader / follower 数量竞争，leader 先行选择产量，follower 观先行选择产量，察到leader 察到leader 的选择后再作选择两个厂商都知道市场需求 Q
案例：案例：运用公布价格策略抢占市场
德克萨斯仪器公司宣布了DRAM 两年内的价格。德克萨斯仪器公司宣布了DRAM 两年内的价格。一周后，鲍默公司宣布以低于德克萨斯公司的价格生一周后，产这种产品。产这种产品。几周后，摩托罗拉也宣称将以比鲍默公司更低的价格几周后，生产这种产品。生产这种产品。终于在几周后，终于在几周后，德克萨斯公司宣布其价格比摩托罗拉公司的价格还要低50% 50%，公司的价格还要低50%，而其他两家公司则宣称经过慎重考虑，他们不打算生产这种产品。重考虑，他们不打算生产这种产品。
第一阶段厂商A的最优选择：第一阶段厂商A的最优选择：
max π 1 (q1 , q2* ) = q1 (a − q1 − q2* − c)
其中： q2 = 1 2 (a − q1 − c) 其中：
*
即：
max π 1 (q1 , q2* ) = q1[a − q1 − 1 (a − q1 − c) − c] 2
第二阶段厂商B的最优选择：第二阶段厂商B的最优选择：
max π 2 (q1 , q2 ) = q2 (a − q1 − q2 − c)
FOC： ∂π 2 (q1 , q2 ) = a − q − 2q − c = 0 1 2 ∂q2
q2 = 1 (a − q1 − c) 2
*
q1为厂商A在第一阶为厂商A 段的实际产量选择
例题1 例题
假设：假设：
斯塔伯格均衡求解
市场的需求函数为： Q=120市场的需求函数为： Q=120-P (反)需求函数为：需求函数为：边际成本 : P=120P=120-Q
MC1=MC2=0
整个市场的需求量在厂商A 整个市场的需求量在厂商A和B之间进行分配 Q=q1+q2 P=120-Q=120P=120-Q=120-(q1+q2 )
厂商A 厂商A先决定产量 q1 厂商B根据厂商1 厂商B根据厂商1的行为再决定 q2
厂商的利润函数为: 厂商的利润函数为:
π 1 (q1 , q2 ) = q1[ P(Q) − MC ] = q1 (a − q1 − q2 − c) π = − = − − − π 2 (q1 , q2 ) = q2 [ P(Q) − MC ] = q2 (a − q1 − q2 − c)
（－1 （－1，0）
§3.2 动态博弈经典模型
Models
“第一个来的人得到了牡蛎，而第二个人只得到第一个来的人得到了牡蛎，了贝壳。了贝壳。” —— 钢铁大王安德鲁·卡内基安德鲁·
Stackelberg model (stackelberg , 1934)
德国经济学家斯塔伯格 Heinrich von Stackelberg 在1934 年出版的 “Marktform und Gleichgewicht (Market Structure and Equilibrium )” 中被阐述此模型也称 Stackelberg leadership model
斯塔伯格斯塔伯格 Stackelberg(1905-1946)， Stackelberg(1905-1946)，德国经济学家，其贡献德国经济学家，在于博弈论和寡头垄断理论 oligopoly theory 。主要著作：Market 主要著作： Structure and
Heinrich Freiherr von Stackelberg 19051905-1946
四类模型的比较
后动的优势
奥先行
麦1
A B A
（10，4） 10，（ 3， 6 ）（ 2， 7 ）（ 9， 5）
奥
B
麦2
A B
后动的优势
麦先行
AБайду номын сангаасB A
（4，10） 10）（ 7， 2 ）（ 6， 3 ）（ 5， 9 ）
奥1
麦
B
奥2
A B
现实案例
后动优势
secondsecond- mover advantage
FOC：
q2 = 1 (120 − q1 ) 2
*
第一阶段厂商A的最优选择：第一阶段厂商A的最优选择：
max π 1 (q1 , q2* ) = q1 (120 − q1 − q2* )
其中：其中：
*
q2* = 1 (120 − q1 ) 2
即：
max π 1 (q1 , q2 ) = q1[120 − q1 − 1 (120 − q1 )] 2
例：开金矿博弈 —— 三阶段博弈
有法律保障
分 B 借不分 A A 不借 (1，0) 不打（0，4） (2， (2，2) 打（1，0）
威胁可信
例：开金矿博弈 —— 三阶段博弈
法律保障不足
分 B 借不分 A A 不借 (1，0) 不打（0，4）
承诺不可信
(2， (2，2) 打
威胁不可信
厂商的利润函数为: 厂商的利润函数为:
π 1 (q1 , q2 ) = q1 P (Q) = q1 (120 − q1 − q2 ) π 2 (q1 , q2 ) = q2 P(Q) = q2 (120 − q1 − q2 )
厂商A 先决定产量厂商A 先决定产量 q1，厂商B根据厂商1的行为再决定厂商B根据厂商1的行为再决定产量 q2，再决定产量厂商A在决策时会考虑厂商B 反应。厂商A在决策时会考虑厂商B的反应。
例：开金矿博弈 —— 两阶段博弈
• B在开采价值为4万元的金在开采价值为4 矿时缺1 矿时缺1万元资金 • A恰好有1万元资金可以投恰好有1 资 • B向A将1万元，承诺开采到万元，金子后，与A对半分成金子后， • A是否应该将钱借给B？是否应该将钱借给B
承诺不可信
分 B 借不分 A 不借（1，0）（0，4）（2，2）
思考：思考：为什么 Follower 会处于劣势？会处于劣势？
Too much information hurting a player ！
思考：思考： Leader 如何具有优势？如何具有优势？
Leader 必须有承诺能力 commitment power 以先动表明承诺！以先动表明承诺！
FOC：
∂π 1 (q1 , q2 ) = 120 − 2q1 − 60 + q1 = 0 ∂q1
q1* = 60
q2*= 30
* 代入： q2 = 1 2 (120 − q1 ) 代入：
总产量均衡价格
Q＝60＋30＝90 P＝120－90＝30 先行优势
firstfirst- mover advantage
求解方法： Backward induction 求解方法：第二阶段厂商B的最优选择：第二阶段厂商B的最优选择：
max π 2 (q1 , q2 ) = q2 (120 − q1 − q2 )
∂π 2 (q1 , q2 ) = 120 − q1 − 2q2 = 0 ∂q2
q1为厂商A在第一阶为厂商A 段的实际产量选择
两个厂商获得的利润
π 1 = p ⋅ q1 = 30 × 60 = 1800 π 2 = p ⋅ q2 = 30 × 30 = 900
思考：先行者是否永远都有优势？思考：先行者是否永远都有优势？
例题2 例题
假设
斯塔伯格均衡求解
市场的需求函数为： Q=a市场的需求函数为： Q=a-P 反需求函数为：反需求函数为：边际成本 : P=aP=a-Q＝a-q1-q2 MC1=MC2=c

09 动态博弈的经典模型1

合集下载

博弈论第三章完全且完美信息动态博弈

(完整)博弈论经典模型全解析(入门级)

博弈论的几个经典模型ppt课件

第三章完全信息动态博弈 ppt课件

《动态博弈模型》课件

博弈论3-4经典动态博弈模型

动态博弈经典模型 ppt课件

博弈论的几个经典模型

经典动态博弈模型

14-动态博弈经典模型1详解

16动态博弈经典模型

信息对抗的动态博弈模型分析

博弈论_完全信息动态博弈

经典动态博弈模型

博弈论的几个经典模型课件

博弈论经典模型全解析(入门级)

文档推荐

最新文档

09 动态博弈的经典模型1

合集下载

博弈论第三章完全且完美信息动态博弈

(完整)博弈论经典模型全解析(入门级)

博弈论的几个经典模型ppt课件

第三章 完全信息动态博弈 ppt课件

《动态博弈模型》课件

博弈论3-4经典动态博弈模型

动态博弈经典模型 ppt课件

博弈论的几个经典模型

经典动态博弈模型

14-动态博弈经典模型1详解

16动态博弈经典模型

信息对抗的动态博弈模型分析

博弈论_完全信息动态博弈

经典动态博弈模型

博弈论的几个经典模型课件

博弈论经典模型全解析(入门级)

文档推荐

最新文档

第三章完全信息动态博弈 ppt课件