重复博弈和默契合谋 ppt课件

格式：ppt
大小：235.50 KB
文档页数：13

下载文档原格式

重复博弈.ppt

中科院博弈论课程-乔晗
4
重复博弈的三个特征
1. 阶段博弈之间没有物理上的联系，即前一阶段博弈的结果不改变后一阶段的结构（比如剪刀、石头、布的重复）；
2. 所有参与人观察到博弈过去的历史； 3. 参与人的总支付（报酬）是所有阶段博弈支付的
贴现值之和（局中人关心的不仅是现阶段收益，还包括未来收益，因而有积极性做出不同于一次性博弈的最优选择）。
{合作，不合作} {不合作，合作} {不合作，不合作} • 三阶段博弈？ • N阶段博弈？
中科院博弈论课程-乔晗
7
重复博弈的策略空间
• 单阶段博弈：局中人的选择无法建立在对手前阶段行动的基础上
• 重复博弈：过去的行动历史可以被观察到，局中人的选择可以建立在其他局中人过去行动的基础上
如：过去你欺骗我，这次我不与你合作
中科院博弈论课程-乔晗
动；（针锋相对）
• trigger strategies: 从合作开始，一直到有一方不合作，然后永远选择不合作。（触发）
……
局中人1
合作不合作
局中人2
合作
不合作
3,3
-1,4
4，-1
0，0
中科院博弈论课程-乔晗
9
重复博弈的策略空间
• 重复博弈中，局中人可以选择的策略空间变大 • 新策略的出现使得局中人可以对对方过去的行动
1 L1 2
R1 2
L2 1
R2 1
L2 1
R2 1
L1
R1
L1
R1
L1
R1
L1
R1
2
2
2
2
2
2
2
2
L2
R2 L2

博弈论课件4重复博弈

5 1 1 2 5
如果博弈方2采用H，总得益现值为：
1
V 4 V
因此当 1/ 4时，此触发策略纳什均衡策略。
4.3.2 惟一纯策略纳什均衡的无限次重复博弈
无限次重复博弈民间定理（弗里德曼，1971）
设G是一个完全信息的静态博弈，用(e1, , en )记G的纳什均衡得益，
用(x , 1
重复囚徒困境悖论和连锁店悖论
☻理论和实践的直觉矛盾，现实中寡头之间的价格战问题并不十分普遍，重复次数较大的实验研究的结果（重复200 次的囚徒困境）
☻泽尔腾(1978)，“连锁店悖论” （导论中的先来后到博弈），实际中对开头几个市场的进入者不计代价的打击
☻问题的症结与蜈蚣博弈类似，在于在较多阶段的动态博弈中逆推归纳法的适用性T t1t 1t1 2 23
t1
t 1
t
4.1.2 基本概念
平均得益：如果一常数作为重复博弈（有限次重复博弈或
无限次重复博弈）各个阶段的得益，能产生与得益序列
1， 2,相同的现在值，则称为1， 2,的平均得益
无限次重复博弈时
2 (1 )
1 2 23
4.2.3 多个纯策略纳什均衡的有限次重复博弈
三价博弈的两次重复博弈
+1
厂H 商M
1L
H
5，5 6，0 2，0
厂商2
M 0，6 3，3 2，0
L
0，2 0，2 1，1
+3
厂H 商M 1L
H
8，8 7，1 3，1
厂商2 M
1，7 4，4 3，1
L
1，3 1，3 2，2
三价博弈
两次重复三价博弈的等价博弈
有限次重复博弈民间定理

重复博弈博弈论课件.ppt

重复博弈
重复博弈

动态博弈的类型

序贯博弈sequential game

每一个阶段的博弈结构是不同的，即从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈。或者说，同样结构的博弈只出现一次。是指同样结构的博弈重复多次，其中的每次博弈称为 “阶段博弈”。如“囚徒困境”中小偷每次作案后判刑释放后又作案。分为有限次重复博弈与无限次重复博弈
H H 厂商1 M L 5， 5 6， 0 2，0
厂商2 M
L 0，2 0，2 1，1
0，6 3，3 2，0
触发策略可信的情况
博弈方1:第一次选H,如果第一次结果为 (H,H),则第二次选择 M;否则采用P 博弈方2:第一次选H,如果第一次结果为 (H,H),则第二次选择 M;否则采用Q
博弈方1 H M L P Q
5，5 6，0 2，0
重复两阶段三价博弈的等价博弈:如果认为触发策略不可信，即不可信报复, 最佳选择为(M,M)
触发策略可信性问题

实际上,触发策略中的报复机制的可信性是一个很复杂的问题,会受到相互预期等很多复杂因素的影响。例如，未偏离的一方并不想报复偏离的一方，而偏离的一方却因为害怕报复而采用L,结果心慈手软的未偏离一方再次遭受损失，这种可能性的存在会使得报复机制实施的可能性增加。此外，考虑策略的制定者和执行者分离的情况，执行者会严格执行决策者指令的情况等等。

在有限次重复博弈中，如果原博弈存在唯一的纯策略NE，则有限次重复博弈的唯一的均衡解就是各博弈方在每阶段中都采用原博弈的NE。因为每个阶段NE都是SPNE，即不存在不可信的威胁和许诺，因此重复博弈的解也是SPNE。

第讲博弈论重复博弈课件

反悔去用其他策略？
• 如果你知道对方会一直坦白，那么你的最佳应对是一直坦白 • T,T,T,T,… • T,T,T,T,…
第讲博弈论重复博弈
24
重复博弈和无名氏定理
• 考虑下列所谓的“冷酷策略”(grim strategies):
• 开始时选择抵赖；
• 选择抵赖直到有一方选择
囚徒
1
了坦白，然后永远选择坦
19
• 当博弈有多个纳什均衡时，参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为。
• 从而迫使大家合作
第讲博弈论重复博弈
20
今天欺骗的收获合作后的收获（承诺） – 欺骗后的收获（威胁）
教训：在发展关系的时候，承诺合作后的收益以及威胁欺骗的惩罚，有时能够激励今天良好行为的发生。而这种行为，有助于创建一个好的未来！
• 但这个机会主义行为将触发他的伙伴选择“永远坦白” 的惩罚，因此i随后每个阶段的支付都是-8。
• 因此，如果下列条件满足，给定对手没有选择坦白，i 将不会选择坦白
0 a ( 8 ) a 2 ( 8 ) . . 1 . a ( 1 ) a 2 ( 1 ) ...
即
8a 1 1a 1a
第讲博弈论重复博弈
• 今天投资100万元的项目，将来如能收回200万，也不能证明此项投资一定有效。因为如果这回收的 200万要等50年之后，今天衡量的价值就远低于100万。这是由于如果利率是3%，100万元存银行，50
年内得到的利息也将达338万元（利率为2%的话，50年的利息为169万元）。所以50年后回收200万的
白。
坦白抵赖
囚徒2 坦白抵赖 -8，-8 0，-10
-10, 0 -1,-1

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

在无限期重复博弈之下，子博弈精炼纳什均衡有多重性，
1）如果厂商选择冷酷策略，
什均衡？给定厂商一坚持冷酷战略，厂商二的战略分析
厂商一的行为
ห้องสมุดไป่ตู้
厂商二的行为
厂商二的收益
坚持冷酷战略
不会先选择不合作先选择不合作
厂商二一直合作（冷酷战略）厂商二先选择不合作厂商二一直合作
厂商二不合作（冷酷战略）
V=1/2π(m)+1/2δπ(m)+1/2δ^2π(m)+1/2δ^3π(m)+…. V'=π(m)+0*δ+0*δ^2+0*δ^3+… 0 0
重复博弈和默契合谋
3、上述条件之下，冷酷战略是否构成子博弈精炼纳什均衡？
在冷酷战略纳什均衡下，子博弈可以分为两类：
（1）没有厂商曾经选择不合作
（2）至少有一个厂商曾经选择不合作
重复博弈和默契合谋
4、子博弈精炼纳什均衡的多重性和无名氏定理
重复博弈和默契合谋
•
重复博弈和默契合谋
（3）小结：
重复博弈和默契合谋
重复博弈和默契合谋
1.默契合谋 ( Tacit Collusion )：即企业间通过相互观察或发出某种信号来传递信息，并预期竞争者的行为来实现，也有人戏称其为“早餐卡特尔”或“挤眼卡特尔”。
2.所谓默契合谋，是指寡头垄断企业以一种非合作的方式进行勾结。
重复博弈和默契合谋
1.前提假设（1）两家厂商之间的产品完全相同（2）两家厂商无固定成本，且成本函数相同，边际成
重复博弈和默契合谋
1、冷酷战略：（1）诱惑：开始选择合作，制定价格P=P(M); （2）惩罚：选择合作直到一方选择了不合作，然后永远
选择不合作，制定价格为P=MC。注意：根据这个战略，一旦一个厂商在某个阶段选择了
不合作，那么它便会一直选择不合作
重复博弈和默契合谋
2、什么条件之下，冷酷战略构成纳
例子：以囚徒困境为例，如果每次判刑不是很重，那么两个囚犯在刑满释放之后再作案，作
重复博弈和默契合谋
（2）基本特征： 1、阶段博弈之间没有“物质上”的联系，前一个
阶段的博弈不改变后阶段的博弈； 2、所有的参与人都观测到过去的博弈的历史，知
道对方过去的选择； 3、参与人的总支付是所有现阶段博弈支付的贴现
（2）、当阶段博弈有多个纳什均衡的时候，参与人可以使用不同的纳什均衡惩罚或者奖励第一阶段不合作或者合作的行为，而这点在阶段博弈只有唯一的纳什均衡是办不到的。
重复博弈和默契合谋
3、有限次重复博弈下默契合谋的可能性结论：有限期重复博弈只是阶段博弈的T次简单重复，
也就是说企业始终制定了等于边际成本的价格水平，无法构成合谋。
值之和或者加权平均。
重复博弈和默契合谋
2、有限次重复博弈的一个定理
定理：令G是阶段博弈，G(T)是G重复T次的重复博弈 (T<∞)，那么如果G有唯一的纳什均衡，重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。
注：（1）、可以理解为只要博弈的重复次数是有限的，重复本身并不改变囚徒困境的均衡结果。
本都为C （3）同时决策，决策变量是价格
2.结论
Bertrand均衡是唯一的，即两家企业的价格相同且等
于边际成本C，经济利润为零。
重复博弈和默契合谋
1.重复博弈的概念和基本特征
（1）概念：“重复博弈”(repeat game)是指同样的结构的博弈重复多次，其中每次博弈称为“阶段博弈”(stage game)。

重复博弈和默契合谋 ppt课件

合集下载

重复博弈.ppt

博弈论课件4重复博弈

重复博弈博弈论课件.ppt

第讲博弈论重复博弈课件

文档推荐

最新文档