- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
民间定理
25
4.2.4 民间定理
在一次性博弈中,纯策略纳什均衡的得益为(1,4) 和(4,1) ,最差的均衡得益数组(个体理性得益)为 w=(1,1)
厂 商 得 益 2 (1,1)
民间定理
(1,4)
(3,3)
(4,1)
阴影部分的点对应的双方 得益,可用子博弈完美纳 什均衡或这种均衡的极限 来实现它
结论:在有限次重复博弈 G(T) 中,如果原博弈G 存在 唯一的纯策略纳什均衡组合,则重复博弈的唯一的子博 弈完美纳什均衡解为各博弈方在每阶段都采取的原博弈 纳什均衡策略
有限次重复的囚徒困境博弈
13
4.2.2 有限次重复的囚徒困境博弈
有限次重复的囚徒困境博弈的含义:
在原博弈具有唯一均衡的有限次重复博弈中,由于完全理 性的博弈方具有“共同知识”的分析推理能力,因此在从 最后阶段开始的逆推过程中,仍然无法摆脱囚徒困境
有限次重复博弈的概念
4
4.1.1 有限次重复博弈的概念
子博弈:从某一阶段(不包括第一阶段)开始,包含以 后所有阶段的重复博弈的一部分 策略:博弈方在每个阶段针对每种情况如何行动的计划 (在每一阶段之前,博弈方可以观察到以前博弈的结果)
有限次重复博弈的概念
5
4.1.1 有限次重复博弈的概念
路径: 由每个阶段博弈结果(原博弈的一个策略组合) 连接而成。对于具有n个策略组合的原博弈,重复T次的 路径数为nT,重复博弈的求解即找出具有稳定性的均衡 路径 得益:不同于一般的动态博弈,重复博弈的得益为各个 阶段得益的加总。考虑到时间的价值,需要引进“贴现 系数”将未来的得益折算成当期得益的价值
有限次重复博弈的概念
6
4.2 有限次重复博弈
有限次重复的猜硬币博弈——原博弈为零和博弈
有限次重复的囚徒困境博弈——原博弈有唯一纯策 略的纳什均衡 有多个纳什均衡的重复博弈的策略设计——触发策略 有多个纳什均衡的重复博弈的得益范围——民间定理
有限次重复博弈
7
4.2.1 有限次重复的猜硬币博弈
-5,-5
不坦白
0, -8
不坦白
-8, 0
-1, -1
将该博弈重复进行2次,每次双方会采取什么策略呢?各 自采取的策略和仅进行1次该博弈时采取的策略一样吗? 求解思路:对于有限次重复囚徒困境博弈,根据动态博弈 的逆推归纳法求解。
有限次重复的囚徒困境博弈
11
4.2.2 有限次重复的囚徒困境博弈
两个人玩猜硬币的游戏。每次的收益情况如下: 猜硬币方 正面 盖 硬 币 方 正面 反面 反面
-1,1
1,-1
1,-1
-1,1
重复进行10次该游戏,每次双方会采取什么策略呢?各自采 取的策略和仅进行1次该游戏时采取的策略一样吗?
有限次重复的猜硬币博弈
8
4.2.1 有限次重复的猜硬币博弈
该博弈为零和博弈,双方不可能合作。 博弈双方采取的策 略与博弈进行的次数无关 重复博弈中的子博弈完美纳什均衡由原博弈各个阶段的纳 什均衡构成
厂商2 A B
1, 4
0,0
A
厂商1
3,3
4,1
B
有两个纳什均衡的重复博弈
19
4.2.3 有两个纳什均衡的重复博弈
触发策略分析:
第一阶段博弈方1和2都采取合作(A),并针对对 方的不合作(B),都设计了在后续2个阶段采取不 合作(B)的相应惩罚措施;
如果对方在第一阶段中采取了合作行为,在后续阶 段的策略设计中要保证博弈结局具有稳健性。后续 阶段的策略设计是为了实现双方的行动协调,以保 证实现纳什均衡(B,A)或(A,B)
民间定理
30
4.2.4 民间定理
例
L M R
双方各五种可选策略重复博弈
L
1,1 0,5 0,0
M
5,0 4,4 0,0
R
0,0 0,0 3,3
P
0,0 0,0 0,0
Q
0,0 0,0 0,0
P
Q
0,0
0,0
0,0
0,0
0,0
0,0
4,1/2
0,0
0,0
1/2,4
图
民间定理
双方各五种可选策略重复博弈
有两个纳什均衡的重复博弈
20
4.2.3 有两个纳什均衡的重复博弈
触发策略结果分析:
子博弈路径(A,A),(A,B),(B,A)为子博弈纳 什均衡
因为后续两阶段的结局(A,B)和(B,A)为纳什 均衡,而第一阶段的合作结局(A,A) 是由于触发策略 针对对方偏离合作的行为设计了后续两阶段都不合作的 惩罚措施,其单方面偏离的路径(B,A)(B,A) (B,B)收益并不增加,因此不存在偏离的动机
第四讲 重复博弈
苏兵
西安工业大学经济管理学院 2009年8-12月
主要内容
重复博弈的概念 有限次和无限次重复博弈的子博弈完美纳什均衡的求解 方法 无限次重复博弈古诺模型和效率工资模型
主要内容
2
4.1 重复博弈的概念
重复博弈
由简单的静态博弈(或动态博弈)的有限次(或无限次) 重复进行构成的 每一阶段博弈方、策略集合、规则和得益多个纳什均衡的重复博弈可以设计多种策 略,在双方缺乏沟通的情况下,结局具有不确定性 具有多个纳什均衡的重复博弈哪些收益是可以实现 的呢?
民间定理
23
4.2.4 民间定理
个体理性得益:
不管对方采取何种行动,只要自己的行为合理就可以 保证实现的收益
可实现得益: 各纯策略组合得益的加权平均数组。注意:并非一定 是均衡策略的组合得益
32
民间定理
4.2.4 民间定理
有两个纳什均衡的重复博弈
21
4.2.3 有两个纳什均衡的重复博弈
有限次重复的市场机会博弈的启示
增大对未来的预期:对未来的预期,是影响我们行为的重 要因素。一种是预期收益:我们这样做,将来有什么好处; 一种是预期风险:这样做可能面临的问题
有两个纳什均衡的重复博弈
22
4.2.4 民间定理
问题提出
民间定理
27
4.2.4 民间定理
多种策略博弈的重复博弈:两人各三种可选策略
L L
1,1 0,5
M
5,0 4,4
R
0,0 0,0
M
R
0,0
0,0
3,3
该博弈具有两个纯策略纳什均衡和一个混合策略纳什均衡, 但是双方存在一个更好的得益(4,4)。对于二次重复博弈, 根据民间定理可以设计一个触发策略来实现这个得益
B
在有限次重复以上博弈的情况下,两个厂商应该如何选 择,以使得其各自的长期利益最大呢?
17
有两个纳什均衡的重复博弈
4.2.3 有两个纳什均衡的重复博弈
此博弈具有2个纯策略纳什均衡(1,4)(4,1)和混合 策略纳什均衡概率(0.5,0.5) 考虑两次重复博弈
轮换策略:由原博弈的纳什均衡组合而成的路径,路 径为(A,B),(B,A),(A,B)…每阶段的平均得益为 (4+1)/2=2.5,高于混合策略的得益2 触发策略:博弈方首先采取合作行为,如果发现对方 没有进行合作,那么在后续阶段的博弈中采取不合作 策略进行惩罚,得益为(8,8),每阶段平均得益为 (2.67,2.67)
例子
多场决胜负的体育比赛(有限次) 两寡头市场上两个厂商之间的竞争(无限次)
重复博弈的概念
3
4.1.1 有限次重复博弈的概念
有限次重复博弈:给定一个博弈 G ,重复进行 T 次 G ,并且在每次重复之前各博弈方都能观察到以前博 弈的结果,称为 G 的一个“T次重复博弈”,记为 G(T)。其中,G 成为 G(T) 的原博弈。每次重复称为 G(T) 的一个阶段
有限次重复的囚徒困境博弈
15
4.2.2 有限次重复的囚徒困境博弈
连锁店悖论
一个在n个市场都开设有连锁店的企业,对于各个市场的 竞争者是否应该加以打击排斥?
可看成一个n次重复的重复博弈 由“先来后到”博弈分析可知,原博弈的唯一子博弈完美 纳什均衡是(竞争者进入,连锁企业不打击) 现实中:连锁企业对开头几个进入者进行打击,吓退其余 潜在进入者,总体上合算
有限次重复的猜硬币博弈
9
4.2.1 有限次重复的猜硬币博弈
有限次重复猜硬币博弈的启示 所有以零和博弈为原博弈所构成的重复博弈与猜硬币博 弈构成的重复博弈一样,各博弈方的正确策略就是在每 次重复中都采用一次性博弈中的纳什均衡策略
有限次重复的猜硬币博弈
10
4.2.2 有限次重复的囚徒困境博弈
坦白 坦白
第一阶段双方采取(M,M)策略,如果博弈方 1偏离,第 二阶段采取(Q,Q)策略对博弈方1进行惩罚,对博弈方 2 进行奖励 同理,如果博弈方 2偏离了此策略,那么采取(P,P)策略 对博弈方 2进行惩罚,对博弈方 1进行奖励 如果双方都没有偏离,那么第二阶段采取具有较高收益 的纳什均衡(R,R)策略 如果双方都偏离了此策略,第二阶段同样采取纳什均衡 的(R,R)策略
有限次重复的囚徒困境博弈
16
4.2.3 有两个纳什均衡的重复博弈
有限次重复的市场机会博弈:两个厂商1和2,同时面临 两个市场机会A和B。假设每个厂商都只能选择其中一个 市场发展,即他们的可选择策略都是A或B,其得益矩阵 如图所示 厂商2 A A 厂商1