北大精品课件:博弈论及公共政策之完全信息静态博弈
- 格式:doc
- 大小:19.00 KB
- 文档页数:6
博弈论与公共政策
北大精品课件
完全信息静态博弈
主要内容
一、博弈的标准式表述
二、占优策略均衡
三、重复剔除的占优均衡
四、纳什均衡
五、多重纳什均衡的比较
六、混合策略
七、应用举例
何谓静态博弈?
开始时由参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果。
何谓完全信息静态博弈?
每一参与者的收益函数在所有参与者之间是共同知识。
一、博弈的标准式表述
博弈的标准式表述包括三个方面的内容:
(1)博弈的参与者
(2)每个参与者可供选择的策略集
(3)针对所有参与者可能选择的策略组合,每个参与者获得的收益
对于一个 n 人博弈,设各参与者的策略空间依次为 S1,S2, …,Sn ,收益函数分别为u1,u2, …,un ,其中 ui (s1,s2, …,sn) 为参与者选择策略组合(s1,s2, …,sn) 时参与者 i 的收益,则可用标准式将该博弈表示如下:
G = {S1,S2, …,Sn ; u1,u2, …,un }
在双人有限策略的情况下,可以用双变量矩阵更直观地表述博弈。
例1:囚徒困境
但是,如果参与者超过2人,则用双变量矩阵形式来表示博弈就不那么方便了,甚至根本无法采用这种形式。
例2:三人有限策略博弈
二、占优策略均衡
1、占优策略
在博弈中,如果不管其他参与者选择什么策略,某个参与者的特定策略都优于或至少不劣于其他所有策略,那么,我们就说这个特定策略是该参与者的占优策略。
在前面的囚徒困境博弈中,“招认”就是每个囚徒的占优策略。
2、占优策略均衡
如果每个参与者都存在占优策略,那么由这些占优策略构成的组合就称为占优策略均衡。
在前面的囚徒困境中,(招认,招认)就构成一个占优策略均衡。
注意:
占优策略均衡只要求每个参与者是理性的,而并不要求每个参与者知道其他参与者是理性的,也就是说,不要求“理性”是共同知识。
例3:公共产品的供应问题
A、B两人同住一室,现在,他们考虑是否购买一台电视机。
电视机的价格为4000元,每个人从看电视中获得的效用各为3000元。
假定他们根据下列程序决定是否购买电视机:
每人把是否购买电视机的想法写在一张纸条上,如果两人都认为应该购买,则平均分担购买电视机的费用。
如果两人都认为不应该购买,则不购买电视机。
如果只有一人提出购买而另一人不想购买,则由提出购买的人独自购买电视机。
每个人会如何决策?
三、重复剔除的占优均衡
1、重复剔除的占优均衡
首先从某一参与者的策略集里剔除掉一个劣策略,再重新考察各个参与者剩下的策略中哪些是劣策略并剔除其中之一,不断继续这一过程直到每个参与者都仅剩一个策略为止,最后得到的策略组合就称为重复剔除的占优均衡。
例4:俾斯麦海之战
在单人决策中,当所有情况下的收益都增加(至少不减少)时,当事者的境
况不会变得更坏,但在博弈中则未必。
比较下面的两个博弈:
例 5
2、理性共识
重复剔除的占优均衡不仅要求每个参与者是理性的,而且要求“理性”是参与者的共同知识,即参与者具有“理性共识”(Common Knowledge of Rationality,简记为CKR)。
理性共识可划分为不同的层次:
零阶理性共识:每个人都是理性的,但不知道其他人是否理性。
一阶理性共识:每个人是理性的,并且知道其他人也都是理性的,但并不知道其他人是否知道自己是理性的。
二阶理性共识:每个人是理性的,也知道其他人都是理性的,而且知道其他人知道自己是理性的,但不知道其他人是否知道自己知道他们知道自己是理性的。
依此类推。
例 6
选择越多(行动空间越大),对理性共识的要求越高。
请看下例:
例 7
四、纳什均衡
许多博弈既不存在占优策略均衡,也不存在重复剔除的占优均衡。
例 8
1、纳什均衡的定义
如果存在这样一个策略组合――给定该策略组合中其他参与者的选择,没有人有积极性改变自己的选择,我们就说该策略组合是一个纳什均衡。
交通规则问题就是一个很好的例子:
例9:交通规则问题
纳什均衡是一种一致预期:基于信念的选择是合理的;支持选择的信念是正确的。
这种一致预期能够自我实现,不会出错:如何所有人认为这个结果会出现,
这个结果就会出现。
以交通规则问题为例,如果甲认为乙预期甲将靠右走,甲就确实会选择靠右走。
2、纳什均衡的意义
如果某个策略组合为纳什均衡,那么任何一个参与者都没有激励独自背离他所选定的策略。
这就是说,该策略组合是“策略稳定”或“自动实施”的。
换一种说法,如果参与者事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。
3、严格纳什均衡与弱纳什均衡
4、用划线法求纳什均衡
例 10
5、纳什均衡与重复剔除的占优均衡之间的关系
命题一:
纳什均衡不会被重复剔除严格劣策略过程所剔除。
命题二:
如果重复剔除严格劣策略过程最终只剩下唯一的策略组合,那么这一策略组合为该博弈唯一的纳什均衡。
命题三:
不能被重复剔除严格劣策略过程所剔除的策略组合,不一定是纳什均衡。
例11:约会博弈
命题四:
重复剔除弱劣策略过程有可能剔除弱纳什均衡,但不会剔除严格纳什均衡。
例 12
五、多重纳什均衡的比较
1. 聚点均衡
2. 帕累托效率标准
3. 强均衡
4. 抗联盟(抗共谋)纳什均衡
博弈实验1
分钱财博弈
例2:三人有限策略博弈
六、混合策略
1、混合策略
所谓混合策略,就是参与者以一定的概率从几种纯策略中随机选择。
有些博弈不存在纯策略纳什均衡,但存在混合策略纳什均衡。
例13:监督博弈
监督
不监督
偷懒
不偷懒
1,-1
-1,2
-2,3
2,2
例14:单<a name=baidusnap0></a>相思</B>
例15:划拳博弈
2、说明
(1)一个给定的纯策略可能会严格劣于一个混合策略,即使这个纯策略并不严格劣于其他任何一个纯策略。
例16
(2)一个给定的纯策略可以是针对对手的一个混合策略的最优反应,即使这一纯策略并不是针对对手的任何一个纯策略的最优反应。
例17
(3)给定其他参与者的策略,参与者的一个混合策略要成为其最优反应,混合策略中每一个概率大于0的纯策略本身也必须是其最优反应。
3、混合策略纳什均衡的充要条件
对任一参与者,凡是以正的概率被选择的纯策略应带来相等的期望收益,且不低于以零概率被选择的纯策略带来的期望收益。
4、混合策略纳什均衡的求法
(1)对于每个参与者,选择其纯策略空间的一个子集。
构造一个一般化的混合策略组合。
(2)检查是否存在参数(概率)使得该混合策略组合满足混合策略纳什均衡的充要条件。
若存在,则为混合策略纳什均衡。
(3)不断重复前两步,直到完成对各参与者所有子集组合的分析为止。
例18:求混合策略均衡
5、对混合策略的理解
参与者 i 的混合策略可以解释为其对手对于 i 将会选择哪一个纯策略的不确定性,实际上,在 i 的心中,可能依据自己掌握的一点儿私人信息已经选择了某一纯策略。
不过,由于其他参与者不能观察到 i 的私人信息,他们无法确定 i 的选择,我们就用 i 的混合策略表示其他参与者的这种不确定性。
博弈实验2
公共汽车让座博弈
6、纳什定理(纳什均衡的存在性)
在博弈中,如果 n 是有限的,并且对每个 i ,Si 是有限的,则博弈至少存在一个纳什均衡,均衡可能包含混合策略。
七、应用举例
例19:古诺的双头垄断模型
例20:伯川德的双头垄断模型
例21:最后要价仲裁
例22:公共地的悲剧
三个选民(1、2、3)要就三个备选方案(A、B、C)进行投票。
采用多数票制,但为了避免出现僵局,现在选民1担任主席,主席的权力体现在:如果三个人的投票结果没有哪个方案胜出,那么作为主席的1就拥有最终决定权。
各人的偏好顺序如下表所示。
以上信息为共同知识。
你认为每个人会如何投票,最终哪个方案被选中呢?
博弈实验3。