第2章 -智猪博弈

  • 格式:ppt
  • 大小:265.50 KB
  • 文档页数:25

下载文档原格式

  / 25
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例3 用智猪博弈模型解释广告市 场现象
• 在广告市场上,花钱制作广告的多数是 大企业,小企业做广告是得不偿失的。 小企业通常模仿大企业的产品,等待大 企业通过广告打开市场后出售廉价产品 。
例4 用智猪博弈模型解释企业技 术创新
在现实经济活动中,大、小企业的行为就很不一 样。大企业财大气粗,他有设立研发机构,不 断开发新产品;花大本钱做广告来扩大市场。 而小企业实力不济,则没有这种积极性。从博 弈的角度讲,小企业的最优选择“仿制”,等 大企业开发出市场后坐收渔翁之利,这是典型 的“搭便车”行为。因此,不分企业的具体情 况就说小企业观念落后,不注意开发新产品, 也不善于开拓市场,是乎是有点不着边际。
第二章 智猪博弈 (boxed pigs)
游戏2:智猪博弈
假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪食 槽,另一头安装着控制猪食供应的按钮,按一下按钮会 有10个单位的猪食进槽,但是谁按按钮就会首先付出2个
单位成本,若大猪先到槽边,大猪吃9个单位,小猪吃1
个单位;若同时到槽边,大猪吃7个单位,小猪吃3个单 位;若小猪先到槽边,大猪吃6个单位,小猪吃4个单位 那么,在两头猪都有智慧的前提下,谁去按按钮?
• 股份公司,股东承担监督经理的职能,但 股东中有大股东和小股东,他们得到的收 益不一样,大股东类似“大猪”和小股东 类似“小猪”,小股东达大股东的便车。
• 改革中,只要一部分人可能比另一部分人 得到多,那么这部分人就会有改革的积极 性,即使改革往往是“大猪”推动的,政 府应该创造更多的“大猪”,改革的速度 就会加快。
不能用重复剔除解的博弈
• 许多博弈没有占优均衡,也没有重复剔除的占 优均衡。考虑如下博弈:
C1 C2 C3
R1
R2 R3
0,4 4,0
4,0
0,4
5,3
5,3
3,5
3,5
6,6
可理性化的选择
• Rationalizable strategy: 不能被重复剔除的 战略;或者说,可以被合理的信念(belief) 所支持的行为;
最优选择
• 这个博弈只要求一阶理性共识就可以预测均衡 结果: • 如果R相信C是理性的,R就知道C不会选择C3, 所以R的最优选择是R1; • 如果C相信R是理性的,C就知道R不会选择R2, 所以C的最优选择是C2。 • 但要C预期R不会选择R3,需要二阶理性共识; 要R不预期C会选择C1,需要三阶理性共识。
4、领导行为理应高贵?
• 智猪博弈的反思 • 案例:能力越大责任越大?(蜘蛛侠)
R排除C选择C1
R believes C believes R believes C is rational
(C1,C2)
R1 C2
好事变坏事?
• 在单人决策中,个人给定选择在所有情况下的收益都 增加,一个人的状况不会变得更坏,但博弈中则不同。

上 下 -1, 3 0Leabharlann Baidu 2

2, 1 3, 4 上 下
左 1, 3 0, 2
右 4, 1 3, 4
选择越多,对理性共识的要求越高
C1 R1 R2 R3 C2 C3 1,20 2,0 4,3 C4 10,10 20,0 50,1
5,10 0,11 4,0 1,1
3,2
0,4
R4
2,93 0,92
0,91 100,90
(1)Zero-order CKR: C not choose C4 for C is rational (2)1st-order CKR: R not choose R4 for R (b) C (3)2nd-order CKR: C not choose C1 for C(b)R(b)C (4)3rd-order CKR: R not choose R1 for R(b)C(b)R(b)C (5)4th-order CKR: C not choose C3 for C(b) R(b)C(b)R(b)C (6)5th-order CKR: R not choose R3 for R(b) C(b) R(b)C(b)R(b)C so, (R2,C2) is an equilibrium
例1 用智猪博弈模型解释股市现象
• 智猪模型在例3.2中已给出,其重复剔除 的占优战略均衡为{大猪选择“按”,小 猪选择“等待”}。在股市中,大户是“ 大猪”,散户是“小猪”。大户要自己 搜集信息,进行投资分析,而散户只是 选择“跟大户”。
例2 用智猪博弈模型解释股份公 司治理结构
• 在股份公司中,大股东是“大猪”,小股东是 “小猪”。尽管股东承担着监督经理的职能, 但大股东和小股东从监督中得到的收益并不一 样。监督经理需要付出搜集信息和花费时间的 成本。在监督成本相同的情况下,大股东从监 督中得到的好处显然多于小股东。因此,均衡 状态下大股东担当起搜集信息、监督经理的责 任,而小股东则搭大股东的便车。正是基于这 种理由,大股东有选举投票权,通过投票权行 使对经理的监督。
怎么解决搭便车问题
该博弈得到的结论是,多劳者不多得,小猪占了大猪的便宜 。但是否可修改博弈的规则,使大猪和小猪各尽所能,各获所 得呢?如安排大、小两个踏板,大猪踩大踏板,得到较多的饲 料,小猪踩小踏板,得到较少的饲料;或者规定大猪和小猪轮 流去踩踏板等等。可见,不同的博弈规则会带来不同的结果。
当然,在现实生活中,由于不同的原因,确实会存在大猪 和小猪,由于它们的地位不同,其行为方式也有很大的不同 ,这是值得关注和研究的。
• 例5 产品安全监管中的智猪博弈
• 产品安全监管中,下级绝对服从上级,上级可以通过考 核挂钩、评奖、处分等方式激励下级单位和个人。 • 但是主动权在上级,下级基本上只是被动接受,构成了 “智猪博弈”的条件,使下级处于应付状态,只要不出 事就可以放心。 • 工作既要做好,又要防止上级的突击检查,心思不能固 定,精力主要放在可能被检查到的地方和单位,其他的 只好放在后面。如此一来,工作动力不足,工作的扎实 程度不够,往往是表面功夫、官样文章。
重复剔除与理性共识
• 重复剔除不仅要求每个人是理性的,而且要求每个人 知道其他人是理性的,每个人知道每个人知道每个人 是理性的,如此等等,即理性是“共同知识”(共识)
C1
R1 R2 R3 10,4 9, 9 1,98
C2 1, 5 0, 3 0,100
C3 98,4 99,8 100,98
这个博弈只要求 一阶理性共识就 可以预测均衡结 果。 如果把(下-左) 的第一个数字改为 11呢?
C1 R1 R2 R3 10,4 9, 9 1,98
C2 1, 5 0, 3 0,100
C3 98,4 99,8 11,98
理性共识
(common knowledge of rationality)
• (1)Zero-order CKR: 每个人都是理性的,但不知 道其他人是否是理性的; • (2)first-order CKR: 每个人是理性的,并且知道 其他每个人也都是理性的,但并不知道其他人 是否知道自己是理性的; • (3)second-order CKR: (1)+(2)+每个人知道(2) • nth-order CKR: R(b)C(b)R(b)……C(b)R is rational,
重复剔除占优均衡
• “重复剔除严格劣策略”(iterated elimination of strictly dominated strategy)的思路:首先找出博弈参与人的劣 策略(dominated strategy)(假定存在的话),把这个劣 策略剔除后,剩下的是一个不包含已剔除劣战略的新 的博弈;然后在剔除这个新的博弈中的劣策略;继续 这个过程,直到没有劣策略存在。如果剩下的策略组 合是唯一的,这个唯一的策略组合就是“重复剔除占 优均衡”(iterated dominance equilibrium)。 • 如果这样的解存在,我们说该博弈是“重复剔除占优 可解的”(iterated dominance solvable).
• 工作人员的努力有两种,一种是生产性努 力,即努力工作;另一种是分配性努力, 即千方百计地争名夺利。 • 如果一个执法单位的计量能力很差,也 就是说一个人的努力程度与其经济报酬、 政治待遇之间只有松散的联系,那么这个 单位的执法绩效就会很低,因为该执法组 织存在着明显的“偷懒”与“搭便车”的 机会主义行为。
智猪博弈模型
小猪 按 等待 4,4 0,0
大 猪
按 等待
5,1 9,-1
智猪博弈的支付矩阵
大猪:按 小猪:等 结论:能者多劳,但 不一定多得
“智猪博弈”(boxed pigs)
• 有些博弈没有占优均衡,但通过剔除“劣”策 略,我们可以预测博弈的结果。
这个博弈中,大猪的最优选择依赖于小猪的选择,但小猪的最 优选择与大猪的选择无关。如果大猪知道小猪的理性的,大猪将选 择“按”。均衡是“大猪按,小猪等待”。 “劣”策略:无论对方选择什么,如果自己选择A得到的收益总 是小于选择B得到的收益,A就是相对于B的劣战略。
Consistently aligned beliefs (CAB)
• 考虑(R3,C3):对方不会犯预期错误:R选 择R3,如果他认为C会选择C3;C会选择C3, 如果他认为R会选择R3。 • CAB:每个人对别人行为的预期(信念)是正 确的; • Harsanyi doctrine: 如果两个理性的人具有相同 的信息,他们一定会得出相同的推断和相同的 结论; • Robert Aumann: rational agents cannot agree to disagree.