信息与策略经济学
第3章
不完全信息静态博弈
3.1 不完全信息静态博弈与哈萨尼转换……………….…………………………... 3-1 3.2 不完全信息静态博弈求解……………………………………………………… 3-2 3.3 不完全信息静态博弈在产业竞争的应用……………………………………….3-5 3.3.1阻绝新厂之进入……………………………………………………………3-5 3.3.2寡占竞争……………………………………………………………………3-7 3.4 拍卖与出价策略………………………………………………………………...3-10 3.
4.1 最高价拍卖…………………….………………………………………...3-10 3.4.2 次高价拍卖………………………..……………………………..………3-12 3.5 实例与应用:拍卖与公共政策………………………………………………….3-13 3.6 小结……………………………………………………………………………...3-14 练习题……………………………………………………………………………...… 3-15 参考文献………………………………………………………………………………3-16
3.1 不完全信息静态博弈与哈萨尼转换:
不完全信息(Incomplete Information):不知对手的报酬。John Harsanyi (1967, 1968)假设知道对手报酬可能有的型态(type )及其机率分布。
:不完全信息博弈可以表示成不完美信息博弈(Incomplete Information);要求参赛者知道对手可能属于几个型态(type )
之一及这几个型态的机率分布:, n , i T t i 1 , i =∈,机率
) (i i i t t P -
在原来博弈的表示 ))( ),)(,(N i i N i i U S N ∈∈=Γ正常表示法中必须加入)(i T 和)(i P
静态贝氏博弈(Static Bayesian Game )
))( ,)( ),)( ),)(,(N i i N i i N i i N i i U P T A N ∈∈∈∈=Γ,其中i i i t a A ∈)(行动空间,i T t ∈i 型态空间(type space),) (i i i t t P -是第i 位参赛者类型是i t 时对其他参赛者
)(i -各自型态)(i t -的主观机率看法),,,,,(111n i i i t t t t t +--=,i U 是i 的报
酬,);,,(1i n i i t a a U U =。
10/25/2003
? Prof. Ho-Mou Wu
巫和懋
静态贝氏博弈的逐步描述:
(1) 自然(Nature)决定型态),,(1n t t t =,此型态向量发生的事先机率(prior probability)为P (t );
(2) 参与者i 被告知他自己的型态i t ,但不知他人的型态;
(3) 参与者i 形成对他人型态的预期)|(i i i t t P -,并在此预期下选择行动i a 以求取自身预期效用的最大;
(4) 当所有参与者的行动i a 均为给定其对手行动i a -的最适反应时,则达到一种纳什均,称之为贝氏纳什均衡(Bayesian Nash Equilibrium)。
在前面几章谈过,当博弈的信息集合中均只包含一个元素时,参赛者能够掌握完整的历史(complete history)。但在静态贝氏博弈中,参赛者并不知道过去完整的历史。更精确的说,在以上描述的静态贝氏博弈中,信息集合中包含了超过一个以上的元素(对手可能有超过一个以上的型态),这些多个元素就是多种型态(type)所造成参赛者拥有的是不完美的信息(Imperfect Information),不完全信息博弈也因此可转换为不完美信息博弈(games of imperfect information)。
贝氏纳什均衡(Bayesian Nash Equilibrium, BNE )
定义:在上述博弈Γ中,某一策略组合{
}N i i
i
t a ∈)( *如果满足以下条件,则称为贝氏纳
什均衡(BNE ):对所有i ,
)
),(( ) ( Max )(*
t )( *i -i i i i i i i i T Αt a i i t a t a U t t P Arg t a i
i
i i ---∈-∑∈均成立。
3.2 不完全信息静态博弈求解
例1:有无江湖道义
Type I(机率μ) Type II(机率1-μ) 乙有义气
招认y
2 不认1-y 2 甲 招认 不认
策略 甲: (x, 1-x)
乙: (y 1, 1- y 1) 若为 Type I
(y 2, 1- y 2) 若为 Type II
乙正常囚犯 招认 y 不认1-y 甲 x 招认
1-x 不认
乙知其最佳策略为Type I 时 招认 (y 1=1) Type II 时 不招认 (y 2=0) 甲的最佳策略为招认 x=1 (为什么?) 贝氏纳许均衡可表为:
不影响甲的均衡策略,为什么? 例2: 法官私恩与江湖道义
囚犯甲是法官亲戚,若无人招认,不但不关,还有国家赔偿(1)
x
招
x
招
x -1 不招 x -1 不招
BNE :乙知道自己最适策略,一般情况下认罪,若有江湖道义则不招认(0y ,1y 21==) 甲的最适策略: 0x =时报酬为 μ91)1(18-=-+-μμ
1x =时报酬为 μ5)1(05-=-+-μμ
因此,若μμ591->-,亦即 4
1
<μ,则x = 0(不招) 若μμ591-=-,亦即 4
1
=μ,则[]1,0x ∈ 若μμ591-<-,亦即 4
1
>μ,则x =1(招)
存在3组BNE :
1. x =0,y 1=1,y 2=0(若4
1
<μ)
2. x []1,0∈,y 1=1,y 2=0(若4
1=μ) 3. x =1,y 1=1,y 2=0(若4
1>
μ) 2有優勢
例3:价格战
Type I(机率μ) Type II(机率1-μ) 乙(高成本)
高价 y
低价1-y
甲 X 高价
1-x 低价
策略 甲: (x, 1-x)
乙: (y 1, 1- y 1) 若为 Type I (y 2, 1- y 2) 若为 Type II
乙知道其最佳策略为Type I 时低价 (y 1=0)
Type II 时高价 (y 2=1)
甲的策略x = 1时报酬为 0?μ- 5(1-μ) = 5-5μ x = 0时报酬为 2 ?μ+8 (1-μ) = 8-6μ 因为 8-6μ> 5-5μ,x = 0(价格)是甲的最佳策略。
贝氏纳许均衡(BNE): x = 0, y 1 = 0, y 2 = 1, or
何时甲可能因信念μ改采其它策略?见下例。
例4:价格战
Type I(机率μ) Type II(机率1-μ) 乙(消费者重品质)
高价 y 低价1-y
甲 X 高价
1-x 低价
策略 甲: (x, 1-x)
乙: (y 1, 1- y 1) 若为 Type I (y 2, 1- y 2) 若为 Type II
乙知道其最佳策略为Type I 时低价 (y 1=0) Type II 时高价 (y 2=1)
乙(低成本)
高价 y 低价1-y 甲 X 高价
1-x 低价
乙(一般商品)
高价 y 低价1-y 1 甲 X 高价
1-x 低价
甲不知乙的确切型态,只知机率分布为(μ, 1-μ) 甲的策略x = 1时报酬为 0·μ+ 5(1-μ) = 5-5μ x = 0时报酬为 4μ+3 (1-μ) = 3+μ
若5-5μ> 3+μ亦即μ<2
1
时,x = 1 (高价)
若5-5μ= 3+μ亦即μ=21
时,x=0到1(混合策略)
若5-5μ< 3+μ亦即μ>2
1
时,x = 0 (低价)
贝氏纳许均衡(BNE)因信念而变:
3.3 不完全信息静态博弈应用
3.3.1阻绝新厂商之进入:
原厂商可建新生产线以吓阻潜在竞争者进入 完全信息博弈:
新
原厂商
建 此时纳什均衡为(不建,进入) 不建
报酬为(2, 1)
不完全信息博弈:原厂商的建厂成本是私有信息,外人难以得知;但不外二种
可能,高成本3C H =或低成本5.1C L =。假使潜在厂商知道机率,就可把这博弈转成「不完美信息博弈」:
p 1 1-P 1
3C H =(如上) 5.1C L =
H x 或 L x 各有1P 及)P -(11 机率的可能
H x -1L x -1
扩展式表示法: )() ,() (i i i i i t P t t P t t P --= )
()
()|(B P B A P B A P = ( 0, -1 ) ( 2, 0 ) ( 2, 1 ) ( 3, 0 ) ( 1.5, -1 ) ( 3.5, 0 ) ( 2, 1 ) ( 3, 0 )
1在 信息集合3C H =时,决策建生产线机率为H x 信息集合5.1C L =时,决策建生产线机率为L x
2在唯一信息集合上,决策进入的机率为y
◇最适反应 ),(*L H x x y y =,再求BNE
)(*y x x H H =(此外0=H x 是优势策略)
)(*y x x L L =
2’s strategy :0=y 时报酬为0
1=y 时报酬为)2x )(p (11)x 1x )(p (1p L 1L L 11--+=-+--+
因此,若0))(-2x p (11L 1>-+,亦即)
p -2(11
x 1L <,则1y =
若0))(-2x p (11L 1=-+,亦即)
p -2(11
x 1L =
,则[]
1 ,0y ∈ )y (x y L *=,
若0))(-2x p (11L
1<-+,亦即)
p -2(11
x 1L >,则0y =
因0x H =
以上需要1)p 1(21≥-,亦即2
1p 1≤
1’s strategy : 1x L =时报酬为y)-3.5(11.5y +,x H = 0
0x L =时报酬为y)-3(12y +
因此,若>+y)-3.5(11.5y y)-3(12y +,亦即2
1
y <,则1x L =
若=+y)-3.5(11.5y y)-3(12y +,亦即2
1
y =
,则L x []1 ,0∈ (y)x x L *L = 若<+y)-3.5(11.5y y)-3(12y +,亦即2
1
y >,则0x L = 若2
1
p 1<
,则存在3个BNE : 1.0x H =, 1x L =, 0y = (纯粹策略均衡) 可吓阻进入
2.0x H =, 0x L =, 1y = (纯粹策略均衡) 类似完全信息N.E.(不建,选入)
3.0x H =, )
p -2(11
x 1L =, 21y =(混合策略均衡)
(y)
x L *L =)
1p -2(11 1
x L
3.3.2 寡占竞争
库诺寡占下单方面成本不确定:
P =10-(q 1+q 2) C 1=3 C 2=?
??>->-L
H
q q 22
24產量 低成本 產量 高成本 2自己知道,但对手不知,认为各有
2
1
的机率。 此为Bayesian Nash Game 贝氏博弈,
其中型态空间{高成本,低成本},相应机率为(21,2
1
)。
1.只有一个信息集合,双方同时出招—静态博弈 π1=(10-q 1-q 2)q 1-3q 1
π2=(10-q 1-q 2)q 2-C 2q 2 C 2=?
??>->-L
H
q q 22
24 q 2H max(10-q 1-q 2-4)q 2?F.O.C 6-q 1-2q 2=0 ?q 2H =21
(6-q 1
) q 2L max(10-q 1-q 2-2)q 2?F.O.C 8-q 1-2q 2=0 ?q 2L =2
1
(8-q 1)
q 1 max ζπ1=21(7-q 1-q 2H )q 1+2
1
(7-q 1-q 2L )q 2
? F .O.C 7-2q 1-q 2H +7-2q 1-q 2L =0 ?q 1=4
1
((7-q 2H )+(7-q 2L ))最适反应
q 1=41(7-3+21q 1+7-4+21q 1)=41(7+q 1) ?q 1*=3
7
最
适
反应
q 2H *=21(6-37)=611 q 2L *=21(8-37)=6
17
H L
3
上图为完全信息博弈 p =10-(q 1+q 2),C 1=3,c 2=3
π1=(7-q 1-q 2)q 1 ?最适反应 q 1-21
(7-q 2)
π2=(7-q 1-q 2)q 2 ?最适反应 q 2=21
(7-q 1)
q 1=21(7-27+21q 1) ?43q 1=47,q 1*=3
7
=q 2*
q 2 q 1
4 3
7
3.5 6 7 8
3.4 拍卖与最适出价策略B i d d i n g S t r a t e g i e s i n A u c t i o n s
US 1994-1996: FCC airwave auction, revenues=$23 billion.
拍卖的方式:
(A). Sealed-Bid Auction 密封出价
有first-price auction 及second-price auction, 参与者只能出价一次。 (B). Open-Outcry Auction 公开喊价
有English (ascending) auction 及Dutch (descending) auction ,也有其它变化型态。
另依评价可分为private-value auction (像古董,各人独特或主观价值不同)与common-value auction (像油田,标得后价值对各参与者大致相同,但出价时各人信息不同只有very noisy signal ,对各参与者的估价也认知不同)。对private-value auctions 而言,有以下的对应关系,但此关系在common-Value auctions 未必成立。以下几节考虑private-value auctions 。
Open Format Sealed-Bid Format
3.4.1最高价拍卖(F i r s t -P r i c e A u c t i o n ):
同时密封出价,出价最高者得标,并以最高价购得拍卖标的物(静态不完全信息博弈) Players : i , j
Action Space :出价 b i
Type Space :i 认定标的物之价值 V i (Private-Value )
Beliefs :参赛者均认为对手的 Vj 在 [A, B] 之间,每点机率相同,均匀分配(Uniform Distribution)。
Payoffs :u i =〔b 1, b 2 , V 1, V 2〕= ?
??>-otherwise if
0b b b V j i i i
Strategies :[]i i i V b b =
Dutch (Descending) English (Ascending)
First Price
Second Price
(Vickrey)
Bidding
最高价拍卖的最适策略
考虑线性最适反应 [][]2222211111V k a V b ,V k a V b +=+= 选择[]i i V b 求取 Prob {}j i b b >[]i i b V -之最大
Prob {}j i b b >= Prob {}j j j i V k a b +>= Prob ??????????- )()(A B j k A j k j a i b --- i b Max ( )i b i V A B j k A j k j a i b -?????? ? ?--- )()( 求解得 i V i k i a i V j a A j k i b +=?? ? ??++=21 所以 2 1 =i k ,同理可得 2 1=j k . 因为)221 ,221A i (a j a )A j (a i a +=+=,所以2 A j a i a ==。 二人出价时的最适策略为() 2,1 , )(21 2121=-+=+=+=*i A i V A i V A i V i k i a i V i b Optimal bidding strategy : 一般而言,提高i b 造成第一项增加但第二项减少,依此寻找最适i b 。 i i V b >,shade down you bid! 当赢者诅咒不重要时(Private-Value Auctions),个人出价会随参赛者人数增加而上升(以增加获胜机会)。 最高价拍卖与多个买主 若有n 个买主, i =1,…,n ,假设A=0 每位都出价i kV ,则第一位买主得标的条件是i 1kV b ≥ , i =2,…, n ) (}{Prob } wins if gains {} winning of Prob {Max i b i V j b i b i b -?>=? r i V i b i 亦即 k b V 1i ≤,i =2,…, n 概率为1 n 1k b -? ?? ??? 第一位买主[]11b b V 1-Max 1 n 1k b -? ? ? ??? 一阶段条件求解可得n 出价者之最佳策略 []11i *i V V n 1n V b k =?? ? ???-=。 一般而言,[])(1 *A V n n A V b i i i --+ = 3.4.2 次高价拍卖(S e c o n d -P r i c e A u c t i o n ): (又称Vickrey’s Auction):出价最高者得标,但以次高价购得拍卖标的物。 类似情况:Open-outcry English Auction 。 Payoff :()?????≡>-=≠≠ otherwise , 0 if , i j i j i j i j i n 1n 1i r b Max b b Max V b ...b ,V ...V u A. 出价b (1) i r (2) i b B. 出价i b >i V ,因i r 而有三种情况: (1) i r (2) i V Note: 以上考虑均为Private-Value auctions ,若考虑油田拍卖等Common-Value auctions ,则English auction 与Vickrey auction 不等值,在English auction 中有信息的揭露,而在Vickrey auction 中一次出招了结,没有信息的揭露。其次,在Common-Value auctions 时必须考虑赢者诅咒(winner’s curse),参与者可能向下修正后再出价,以上所得结果必须再修正。 3.5 实例与应用:拍卖与公共政策 A. 1994年英国的Manchester United 足球组织拍卖,Manchester United 拥有大联盟电视转播权利金收益的7%,该电视转播权也是每年经由拍卖决定权利金,两者均采英式拍卖方法。B Sky B (Rupert Murdoch 旗下的卫星电视公司)决定参与Manchester United 的拍卖,该策略有何优势?反对者认为B Sky B 会造成『踏脚石效果』(toehold effect),影响电视市场竞争,要求政府干涉,如此要求是否能有理论根据? B. 拍卖失败的案例很多,成功的拍卖必须: (1). 防止勾结:参与者长久且多处接触,可能形成隐性勾结(采动态奖惩策略),在英式拍卖喊价过程中也可利用早期出价过程揭露信息。 (2). 防止参与者吓阻进入:参与者越多越有利卖方,但买方可展现它的强势作风 (参赛者非对称时)或它得标后可获利更高(标的物是互补品或有综效),其它竞争者会避免陷入赢者诅咒而谨慎参与或出价。拍卖方式中又以英式拍卖最有利强势参赛者,因永远有机会加价。 (3).慎选拍卖方式:除英式、密封外,可慎选底价。政府官员事先声称可卖得底价的二十倍,这代表什么意义? (4).政府要考虑产业结构:政府拍卖权限,允许一家厂商最多获得一个许可或不加限制,会影响未来的产业竞争态势。 C. (1).虽然英式拍卖所得期望收益有可能较高,但是在英式拍卖中出价者较易形成 勾结,而且英式拍卖较不易吸引足够多的出价者(相较于密封出价拍卖而言)。所以,密封次高价拍卖也有其优点。 (2).若决定使用英式拍卖,可采防范措施:包含让出价者保持匿名,不透露参赛 者人数,要求出价为整数金额等。 (3).在密封出价拍卖中,因为拍卖过程不会揭露信息,出价者必须多花成本收集 信息才能正确出价。在最高价拍卖中,未必由最乐观出价者得胜(缺乏效率性)。 在最高价与次高价拍卖中非最乐观的参与者也有诱因出高价,造成预期收益可能较英式拍卖为高。 3.6 小结 除了前面10点策略性思考原则外,再加入 11.在不完全信息博弈中,将不确定情况化约为几种可能的『型态』,并附以『机率』, 将有助于策略性思考,可依此分析拍卖的最适出价策略与最佳机制设计。 练习题 1. 在本章3.3.1节中, 若2 1 p 1=,则只存在2组BNE ,为何? 若2 1 p 1> 呢?请讨论此机率重要性。 如果2观察到1的决策是否建新生产线后,才决定是否进入此产业,则博弈会呈现何种类型?均衡解呢? 2. 在本章应用2中的Type Ⅰ博弈与原先常见的「囚犯困境」有何不同?解呢? 若无法官私恩,(把报酬1改回 -1),则此贝氏博弈均衡为何? 若两人均有江湖道义(无法官私恩),均衡为何?是贝氏博弈吗? 若只有一人有江湖道义,而且机率为)1(μ-时另一人也可能有江湖道义,均衡为何? 3. 讨论3.5节实例是Private-Value 还是Common-Value 拍卖?政府是否应干涉足球组织的拍卖? 4. (a)在密封出价与公开喊价的Common-Value 拍卖中,何者造成较严重的赢者诅咒 Winner’s Curse 现象?再考虑各种拍卖方式的对应关系。 (b)在信息不足与信息较充足的拍卖中,何者造成较严重的赢者诅咒现象?赢者诅咒现象严重程度增加,是否会造成出价更保守? 5. 以拍卖方而言,何者是较佳策略? (a).揭露拍卖品信息 (b).揭露参赛人数信息 (c).订定最低价格 (d).相似或相关产品同时拍卖 参考文献 1.J. Harsanyi, “Games with Incomplete Information Played by Bayesian Players, Part I-III,” Management Science 1967-68. 2.W. V ickrey, “Counterspeculation, Auction and Competitive Sealed Tenders,” Journal of Finance 1961, 8-37. 3.P. Milgrom and R. Weber, “A Theory of Auctions and Competitive Bidding,” Econometrica 1982, 1089-1122. 4.R. Wilson, “Strategic Analysis of Auctions,” in Handbook of Game Theory, 1993. 5. D. Baron and R. Myerson, “Regulating a Monopolist with Unknown Cost,” Ecoometrica 1982, 911-930. 6.P. Klemperer, “Auction Theory: A Guide to the Literature,” Journal of Economic Surveys 1999, 227-286. 7.V. Krishna, Auction Theory, Academic Press 2002.