- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 两个均衡无差异:没有明 确的好与坏
24
一般博弈
l
r
• 如左图博弈,存在弱
劣策略时易出现多重
U
1,1
0,0
NE。
D
0,0
0,0
25
聚点( focal point)均衡
• 如何在多重NE中选择一个确 定的结果呢?
• 谢林(Schelling) (1961)提 出——“聚点”
– 根据博弈规则以外的某些特定 信息(如共同的社会规范、知 识或某些特征)从多个NE中确 定出一个
– 彼此最优反应:在对方的最优反应下的反应最优 • 没有一个局中人会轻易改变策略而使自己蒙受损失; – 即任何改变NE状态的策略将不会严格增加自身 的效用。
17
NE的特点:
• 不后悔: – 即其他人不改变行为的前提下,自己改变行为 没有好处; – 只有在NE时才不后悔; • 如对方如果选择非NE策略,你先NE策略会 后悔;
若策略组合 (s1 ,s2 , si, ,sn ) 满足:
u i(s 1 ,s 2 , ,s i 1 ,s i ,s i 1 , s n ) u i(s 1 , ,s i 1 ,s i,s i 1 , s n )
则称 (s1,s2,sn) 是博弈G的一个NE。 等价定义:
在博弈 G S 1 ,S 2 , S n ;u 1 ,u 2 , u n 中,若策略组合 (s1,s2,sn)
– 强NE比弱NE更容易取舍(因为弱均衡有无差异的 策略存在);
• 强NE对博弈支付矩阵的微小改变不敏感。
16
NE的含义:
博弈G的NE指这样一个策略组合:
• 为了极大化自己的收益(效用),每个局中人所采 取的策略必定是其它局中人所采取策略的最优反应;
– 给定你的策略,我的策略是最优的;(同时)给定我 的策略,你的策略是最优的;
➢ 显然,只有遵守协议带来的效用大于不遵守协议的效 用时,每个参与人才会遵守协议。
➢ 如果没有参与人有积极性不遵守协议,则该协议就是 自动实施的,则该协议就构成一个NE.
19
三、NE解的特征
(一)单一NE的博弈
– 有唯一的NE解。
20
囚徒困境
• 唯一的NE: (D,D)
2
• 如(C,C)就不是NE, 因为:
• 可从哪方面对上述模型进行扩展?(射门力度和 精确度)
9
最佳策略的正式定义
• 定义一:如果满足以下条件,则参与人i的策略 s i是
对手策略s-i的最佳对策BR:
u i(si,s i)u i(si',s i) si' Si
• 定义二:s i 最大化了对手选 S-i时我的收益: si au m gu a i(s x i',s i)
– 聚点就成为博弈的最终结果, 是多个NE解中的一个
• 如在一双行道上的两个相对 开车的人,各自既可选择左 行(L),也可右行(R); 共同的交通规则下,结果 (R,R)。
26
性别战
• 两NE: (F,F)和(O,O)
– 对两博弈人(夫妇), 这两均衡解不是无差异 的。
27
实验:性别战之一
• 假设你和你的女(男)朋友正在进行“性别战” 博弈。实验人群分为男、女生两组,男、女两类 实验者均做为博弈人1(丈夫)在看踢足球、看歌 剧这两个行动中进行选择。
• 如果降低b(即降低了协同性)会如何? – 会出现剪刀效应(BR1更陡、更平缓BR2): • 参与人1会减少努力; • 2知道1会降低努力水平,2也会降低自己的努力水 平; • ····
14
二、纳什均衡的定义
在博弈 G S 1 ,S 2 , S n ;u 1 ,u 2 , u n 中,对 si Si (in)
36
实验五——合作与风险偏好
• 对称的合作博弈:有 两个NE: (A, A)和(B, B) 问:你认为博弈结果 应该是哪一个呢?
• 实验结果:
– 人数: – (A, A): – (B, B):
37
• 说明:
– (A, A)帕累托占优于(B,B); – 但博弈人选择A的风险高于B; – 实验结果是(B,B)更有可能。
满足:
m si Si u ai(sx i,s i)ui(si,s i)
则称 (s1,s2 , sn )是G的一个NE策略组合。
15
• 定义:策略组合 s*是博弈G的一个纯策略纳什均
衡(a pure strategy Nash equilibrium),当且仅
当对所有博弈人i和所有策略
– 定义:纯策略NE是严格的,当且仅当
完全信息静态博弈
LEC04 纳什均衡
内容概览
一、最优反应(best response) 二、纳什均衡的定义
– 有关NE的几点说明
三、NE解的特征 (一)单一NE的博弈 (二)有多个NE的博弈 – 聚点( focal point)均衡 – 聚点实验 » 性别战实验一——四 »实验六五——合作与风险偏好 – 对NE信念的说明
• 博弈规则: – 只能选择一次;不能讨论,窥视
28
实验结果:
– Men are simply more aggressive creatures...
29
实验:性别战之二
• 博弈规则: – 你作为博弈人1先进行选择;你选完后对方再 选择;对方选择时无法观察到你的选择;
• 问你如何进行选择?
30
2
回顾
• 重复剔除严格劣战略法 – 严格的前提假设:所有参与人是理性的;理性是共 同知识 – 解完全信息静态博弈问题的一种方法。
• 因有严格假设前提,不是所有博弈都能用该方法。 • 纳什均衡(Nash Equilibrium,NE)的提出:对所有
有限次博弈来说,从纳什均衡角度是可解的,且至少 有一个纳什均衡解。
l
r
• U1(L,l)=4。
队 员L
4,-4 9,-9
• 你作为A队队员该如何选择? – 有无劣策略?
M
6,-6 6,-6
R
9,-9 4,-4
8
• M是你无论如何都不会选的,为什么? – 因为不论对方门将的可能选择是什么,M都不 是最优策略;(试做图分析)
• 结论: – 不要选择一个在任何信念下都不是最佳策略的 策略。
– 博弈人2选C时,博弈 1 人1会偏离C而选D;
– 博弈人1选D时,博弈 人2也会偏离C而选D;
– 2选D时,1只会选D;说明:
反之亦然。
1. 严格劣势策略永远不会形成NE;
2. 重复剔除劣策略均衡属于NE.21
一般博弈
• 唯一的NE: (U,L) • 求解方法:划线法
• NE与重复剔除的占优均衡 之间的关系:
BR2(s1) =1+bs1=s2*
参与人1的哪些策略是非最佳策略? (作图 分析)
12
• 参与人1(or 2)的非最佳策略: – [0,1)和(2,4];
• 因参与人永远不会选其非最佳策略,因此可剔除 ,缩小策略选择范围到[1,2]; – 再找非最佳策略:[1,5/4) 和 (7/4,2]; – 剔除
– 这种信息示意可以是有作为的、也可以是无作为的; – 但博弈的标准型分析无法捕捉到这种信念形成过程。
• 新信息的来源,即推动参与人信念更新的因素有 哪些呢?
39
信念的来源
1. 博弈规则 2. 事先的交流 3. 聚点
– 社会规范、或某些显著的特征(如对风险的厌恶)会促使参与 人选择某个特定策略
• 反映了信念的自我实施(self-fulfilling)(分析 见下页) ;
18
信念自我实施的含义:
• 假设n个参与人在博弈前协商达成一个协议:
(s1 ,s2 , si , ,sn )
– 其中si* 是协议规定的参与人i的策略;
– 在给定其他参与人都遵守协议、且没有外在强制情况 下,是否有任何参与人有积极性不遵守这个协议?
– “cheap talk”:这种事先的口头宣告的交流方式 • 发出的信号(message)是没有成本的; • 博弈的分析不应该考虑这种信号的作用,为什 么?(见下页)
33
• 博弈人2的策略集变为:
– {Ff, Fo, Of, Oo}
(第1个数字:实际选择的策 略;第2个数字代表:宣布 的策略)
• 博弈支付没有变,实质博 弈、博弈结果不变
合伙人博弈 (Partnership Game)
两个人要共同完成一个合作项目(如律师事务所),各 自都需要对项目做出努力,最后平分利润;
• 博弈人:各持50%股份的两个股东; • 策略:每个股东要选择为项目投入的精力,即努力水
平(小时数),如Si=[0,4];(连续策略)
• 收益:
– 项目收益4(s1+s2+bs1s2)(b=[0,1/4],表示协同性); – u1(s1,s2)= 2(s1+s2+bs1s2)- s12
F
• 然而,2的宣告对1是一个
成功的误导信号,使1认
为2会选她喜欢的策略
“O”。
O
F
O
Ff
Fo
Of Oo
2,1
0,0
2, 1
0,0
0,0
1,2
0, 0
1,2
34
实验:性别战之四
• 博弈规则: – 在开始博弈前,博弈人2(妻子)有机会事先 宣布,但2却选择了沉默;
• 问你如何进行选择?
35
• 实验结果:说明: – ”沉默”会被看作博弈人2软弱的表现,会导 致1选择“O”的人数减少。
• ·····(重复剔除非最佳策略的过程) • 结果:两参与人最优反应函数的交点,即
– s1*= s2*= 1/(1-b)。
合伙人会努力工作达到最优解吗?最优效率解在实 际中是否总能达到呢?最优效率解收效如何?