博弈论与公共政策
北大精品课件
完全信息静态博弈
主要内容
一、博弈的标准式表述
二、占优策略均衡
三、重复剔除的占优均衡
四、纳什均衡
五、多重纳什均衡的比较
六、混合策略
七、应用举例
何谓静态博弈?
开始时由参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果。
何谓完全信息静态博弈?
每一参与者的收益函数在所有参与者之间是共同知识。
一、博弈的标准式表述
博弈的标准式表述包括三个方面的内容:
(1)博弈的参与者
(2)每个参与者可供选择的策略集
(3)针对所有参与者可能选择的策略组合,每个参与者获得的收益
对于一个 n 人博弈,设各参与者的策略空间依次为 S1,S2, …,Sn ,收益函数分别为u1,u2, …,un ,其中 ui (s1,s2, …,sn) 为参与者选择策略组合(s1,s2, …,sn) 时参与者 i 的收益,则可用标准式将该博弈表示如下:
G = {S1,S2, …,Sn ; u1,u2, …,un }
在双人有限策略的情况下,可以用双变量矩阵更直观地表述博弈。
例1:囚徒困境
但是,如果参与者超过2人,则用双变量矩阵形式来表示博弈就不那么方便了,甚至根本无法采用这种形式。
例2:三人有限策略博弈
二、占优策略均衡
1、占优策略
在博弈中,如果不管其他参与者选择什么策略,某个参与者的特定策略都优于或至少不劣于其他所有策略,那么,我们就说这个特定策略是该参与者的占优策略。
在前面的囚徒困境博弈中,“招认”就是每个囚徒的占优策略。
2、占优策略均衡
如果每个参与者都存在占优策略,那么由这些占优策略构成的组合就称为占优策略均衡。
在前面的囚徒困境中,(招认,招认)就构成一个占优策略均衡。
注意:
占优策略均衡只要求每个参与者是理性的,而并不要求每个参与者知道其他参与者是理性的,也就是说,不要求“理性”是共同知识。
例3:公共产品的供应问题
A、B两人同住一室,现在,他们考虑是否购买一台电视机。电视机的价格为4000元,每个人从看电视中获得的效用各为3000元。
假定他们根据下列程序决定是否购买电视机:
每人把是否购买电视机的想法写在一张纸条上,如果两人都认为应该购买,则平均分担购买电视机的费用。如果两人都认为不应该购买,则不购买电视机。如果只有一人提出购买而另一人不想购买,则由提出购买的人独自购买电视机。
每个人会如何决策?
三、重复剔除的占优均衡
1、重复剔除的占优均衡
首先从某一参与者的策略集里剔除掉一个劣策略,再重新考察各个参与者剩下的策略中哪些是劣策略并剔除其中之一,不断继续这一过程直到每个参与者都仅剩一个策略为止,最后得到的策略组合就称为重复剔除的占优均衡。
例4:俾斯麦海之战
在单人决策中,当所有情况下的收益都增加(至少不减少)时,当事者的境