博弈论 第一章
- 格式:doc
- 大小:333.80 KB
- 文档页数:21
1完整信息静态博弈1.0 对策论研究的内容与根本形式对策论研究的内容对策论研究多个行为主体的决议问题。
对策论研究的形式博弈 (game),由多个行为主体组成的系统。
例Stackelberg modelCournot model博弈的种类参加者行动的时间与次序同时行动——静态博弈;先后行动——动向博弈。
参加者的信息多少信息同样——完整信息;信息不一样——不完整信息。
1.1 根本理论 : 博弈的标准式和纳什平衡例 1少儿游戏:“石头、剪刀、布〞。
博弈的准式表示(normal-form representation)(1) 参加人( player).n个参加人: 1, 2, ⋯, i, ⋯, n.(2)略 (strategy).一个参加人的略是他采纳的一个行。
参加人 i 的略: s i.参加人 i 的略空 : S i .略的一个合 : s ={s1,s2, ⋯, s n}.化表示: s-i ={ s1,⋯, s i -1, s i+1, ⋯ , s n }.(3)利润 (payoff).参加人i 的利润: u i= u i(s1,s2, ⋯, s n)n 个参加人博弈的准形式表示:G = {S1, S2,⋯S,n;u1, u2,⋯u,n}完整信息 (complete information) :每个参加人知道其余人的略空和利润。
静博弈(static game):全部的参加人同行。
每一个人行,不知道其余人的行。
例 1〔〕:博弈 {石、剪刀、布 } 的描绘:参加人:1,2。
略空:S1 = S2 = {石、剪刀、布 }利润:两人出手的函数u1 (石,石 ) = 0, u1 (石,剪刀 ) = 1, u1 (石,布 ) = -1⋯u2 (石,石 ) = 0, u2 (石,剪刀 ) = -1,u2 (石,布 ) = 1⋯⋯利润表:两个参加人,有限个略的博弈的表示方法。
P2石头剪刀布石头0 , 01,-1-1 ,1P剪刀-1,10 , 0 1 ,-11布 1 ,-1-1,10 , 0博弈的:可否知道每个参加人的略?例 2: 囚犯窘境 (The Prisoner ’s Dilemma)囚犯2缄默招认缄默-1 ,-1-9 ,0囚犯1招认0 ,-9-6 ,-6囚犯 1 的考:无方缄默是招,自己“招〞好于“缄默〞。
第一章引言一、博弈的定义二、博弈的要素三、博弈的结构与分类四、博弈的发展历程五、主要应用领域一、博弈的定义博弈就是策略对抗,或策略起关键作用的游戏←博弈Game,博弈论Game Theory,Game即游戏、竞技←游戏和竞技等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊拉克、以色列和巴勒斯坦一、博弈的定义一个非技术性定义定义:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
一、博弈的定义1、博弈论是研究决策主体的行为相互作用时的策略以及这种策略均衡问题的理论——张维迎《博弈论与信息经济学》2、博弈论可以定义为对理性决策者之间冲突与合作的数学模型的研究——R.B.Myerson(2007年诺奖得主)《博弈论——矛盾冲突分析》1991年开篇第一句话四个核心方面博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行为(Actions)博弈的次序(Order)博弈方的得益(Payoffs)←1、博弈方和局中人:博弈中的决策主体,通过选择行动(或策略)以最大化自己的支付(效用、收益)。
可以是自然人,也可以是团体,比如企业、国家等←2、虚拟参与人(pseudo-player):又称“自然”(nature)指决定外生随机变量的概率分布机制。
比如,市场需求的大小,就业率的高低等等。
←3、策略(战略):相机行动方案(支配参与者在什么时候选择什么行动)。
注:a 战略是行动规则,而不是行动自身;b 静态博弈中,战略等同于行动;c 战略必须是完备的,它要给出参与人在每一种可想象到的情况下的行动选择,即使参与人并不预期这些情况会发生。
←4、支付(收益):参与者策略选择并实施后的结果,是参与人从博弈中获得多少的体现,与策略组合相对应。
1 完全信息静态博弈1.0 对策论研究的内容与基本形式对策论研究的内容对策论研究多个行为主体的决策问题。
对策论研究的形式博弈(game),由多个行为主体构成的系统。
例Stackelberg modelCournot model博弈的类型参与者行动的时间与顺序同时行动——静态博弈;先后行动——动态博弈。
参与者的信息多少信息相同——完全信息;信息不同——不完全信息。
1.1 基本理论: 博弈的标准式和纳什均衡例1 儿童游戏:“石头、剪刀、布”。
博弈的标准式表示(normal-form representation)(1) 参与人( player).n 个参与人:1, 2, …, i, …, n.(2) 战略(strategy).一个参与人的战略是他采取的一个行动。
参与人i 的战略:s i.参与人i 的战略空间: S i.战略的一个组合: s ={s1,s2, …, s n}.简化表示:s-i ={ s1,…, s i -1,s i+1, …, s n }.(3) 收益(payoff).参与人i 的收益:u i= u i(s1,s2, …, s n)n个参与人博弈的标准形式表示:G = {S1, S2, …, S n;u1, u2, … , u n}完全信息(complete information):每个参与人知道其他人的战略空间和收益。
静态博弈(static game):所有的参与人同时行动。
每个人行动时,不知道其他人的行动。
例1(续):博弈{石头、剪刀、布} 的描述:参与人:1,2。
战略空间:S1 = S2 = {石头、剪刀、布}收益:两人出手的函数u1 (石头,石头) = 0,u1 (石头,剪刀) = 1,u1 (石头,布) = -1 …u2 (石头,石头) = 0,u2 (石头,剪刀) = -1,u2 (石头,布) = 1 ……收益表:两个参与人,有限个战略的博弈的表示方法。
P2石头剪刀布石头0 ,0 1 ,-1 -1 ,1P1剪刀-1 ,1 0 ,0 1 ,-1布 1 ,-1 -1 ,1 0 ,0博弈的问题:能否知道每个参与人选择的战略?例2: 囚徒困境(The Prisoner’s Dilemma)囚徒 2沉默招认沉默-1 ,-1 -9 ,0囚徒 1招认0 ,-9 -6 ,-6囚徒1的考虑:无论对方选沉默还是招认,自己选“招认”好于“沉默”。
囚徒2的考虑:无论对方选什么,“招认”好于“沉默”。
两人的选择: (招认,招认)。
定义:s i'是s i''的严格劣势战略(strictly dominated),如果:u i(s i',s-i) <u i(s i'',s-i)“沉默”是“招认”的严格劣战略例3:参与人2左中右上 1 ,01,3 3 ,0参与人1 中0, 2 0 ,1 6 ,0下0, 2 2, 4 5, 3参与人1: 没有严格劣战略。
参与人2: “右”严格劣于“中”考虑:重复剔除严格劣战略(iterated elimination of strictly dominated strategies)可预见的两人选择: (下, 中)。
例4: 图 1.1.4参与人2左中右上0 ,4 4,0 5 ,3参与人1 中4, 0 0 ,4 5 ,3下3, 5 3, 5 6, 6两人都没有严格劣战略。
两人会如何选择各自的战略?定义:s * = (s 1*,…,s n *)是一个纳什均衡(Nash equilibrium), 如果u i (s i *,s -i *) ≥ u i (s i ,s -i *)纳什均衡为最大化问题的解ii S s ∈max u i = u i (s 1*, …, s i , …, s n *)各例中的纳什均衡: 囚徒困境: (招认,招认) 例3: (下,中)例4( 图1. 1. 4): (下, 右).纳什均衡与重复剔除严格劣势战略的关系: 没有被剔除的唯一的战略组合是纳什均衡.如果战略是一个纳什均衡,它们在重复剔除严格劣势战略后留下.多个纳什均衡例5 性别战 (the battle of the Sexes)帕特 歌剧 拳击歌剧 2 ,1 0 ,0克里斯拳击 0 ,0 1 ,2纳什均衡: (歌剧,歌剧),(拳击,拳击)1.2 应用例 古诺双头垄断模型(Cournot Model of Duopoly )二个企业,生产产量: q 1, q 2市场需求: P = a – Q , Q = q 1 + q 2 企业成本: C i (q i ) = cq i , i = 1, 2.企业利润:πi (q 1, q 2) = Pq i – C i (q i ) = (a – (q 1 + q 2))q i – cq i , 博弈的描述:参与人:企业1,企业2 战略:产量 q i 收益:πi (q 1, q 2) 企业 i 选择产量求ii S s ∈max πi (s i , , s j *):一阶条件11dq d π = a – c – 2q 1 – q 2* = 0 和22dq d π = a – c –q 1* –2q 2 = 0 厂商选择自己利润最大的产量q 1 =22q c a -- q 2 =21q c a -- 解纳什均衡得q 1* = q 2* =3ca -利润π1 = π2 = ( a – c – (3c a -+3c a -))3ca - = 9)(2c a -当 u i 是可微分的时候 , 纳什均衡为下列方程组的的解:in i s s s s u ∂∂),...,,(21= 0, i = 1,…, n思考:用重复剔除严格劣势战略求纳什均衡 比较:如果两个厂商生产q 1 = q 2 =4ca - 利润π1 =π2 = ( a – c – (4c a -+4c a -))4ca - = 8)(2c a -例 贝特兰德双头垄断模型(Bertrand Model of Duopoly ) 两个企业生产有差别的商品。
消费者对企业 i 的需求q i (p i , p j ) = a – p i + bp j , 成本: C i (q i ) = cq i , i = 1, 2. 战略 s i : p i ≥ 0收益: πi (p i , p j ) = (a – p i + bp j )( p i – c )纳什均衡 (p 1*, p 2*) 满足max πi (p i , p j *) = max (a – p i + bp j *)( p i – c )解得 p 1* = p 2* = bca -+2例 最后要价仲裁 (Final-offer Arbitration)一个企业和一个工会,通过一个仲裁人决定工资。
企业和工会同时提出工资: w f, w u仲裁人有一个标准:x,选择双方提议中比较靠近x的提议:如果x < ( w f + w u )/2,则w f如果x > ( w f + w u )/2,则w uw f(w f + w u )/2x w u企业和工会不知道x,但知道x的分布函数F(x)和密度函数f(x)。
分析w f 被选择的概率:Prob {x <2ufww+} = F⎪⎪⎭⎫⎝⎛+2ufwww u被选择的概率:Prob{ x >2ufww+} = 1 –F⎪⎪⎭⎫⎝⎛+2ufww期望工资Ew = w f F⎪⎪⎭⎫⎝⎛+2ufww+ w u 1 –F⎪⎪⎭⎫⎝⎛+2ufwww f* 满足fwm in w f F⎪⎪⎭⎫⎝⎛+2*ufww+ w u* 1 –F⎪⎪⎭⎫⎝⎛+2*ufwww u* 满足uwmax w f*F⎪⎪⎭⎫⎝⎛+2*ufww+ w u 1 –F⎪⎪⎭⎫⎝⎛+2*ufww由一阶条件F⎪⎪⎭⎫⎝⎛+2ufww+21wf f ⎪⎪⎭⎫⎝⎛+2ufww-21wu f ⎪⎪⎭⎫⎝⎛+2ufww= 021wf f ⎪⎪⎭⎫⎝⎛+2ufww+ 1 - F⎪⎪⎭⎫⎝⎛+2ufww-21wu f ⎪⎪⎭⎫⎝⎛+2ufww= 0 由此解出工资的均衡提议。
两式相减F⎪⎪⎭⎫⎝⎛+2ufww=21两式相加w u*f ⎪⎪⎭⎫⎝⎛+2ufww–w f*f ⎪⎪⎭⎫⎝⎛+2ufww= 1如果x为正态分布: x ~ N(m, σ2)2**ufww+= mw u* –w f*=)(1mf= 22πσ,纳什均衡w u* = m +2/2πσ, w f* = m–2/2πσ例公共财产问题一个村庄,有n个村民,在公共草地上放羊。
村民i放牧的羊数:g i全村的羊总数:G = g1+ ... + g n养一只羊的(私人)成本为c,一只羊的价值为v(G)当G < G max, v(G) > 0, v'(G) < 0, v''(G) < 0当G > G max , v (G ) = 0每个村民选择养羊数量使自己收益最大g i v (G ) – cg i 一阶条件v (G ) + g i v ' (G ) – c = 0, i = 1,..., n 将n 个等式相加得到nv (G ) + G v ' (G ) – nc = 0 即纳什均衡G 1满足v (G 1) +nG 1v ' (G 1) – c = 0 全村在总收益最大的放牧数G 2满足max G 2 v (G 2) – cG 2 一阶条件v (G 2) + G 2 v ' (G 2) – c = 0 G 1与 G 2哪一个大? G1大vv (G ) O G max GG v ' (G )/nv' (G)G v' (G)决策问题:在条件变差时, 收益上升还是下降?在通常的(一人)决策中,如果有几个选择,决策者选择收益最大的一个。
如果外界条件改变,使他的一个或几个收益下降,则它无论怎样选择,都不会使收益比原来更大。
例在一块田里选择种植的(纯)收入:棉花3000元花生3700元玉米3500元如果成本上升,收入变为棉花3000元花生3200元玉米3400元人决策收益通常下降例在多人决策时的收益下降与增加(1)初始时参与人 2T1T2S15,48,3参与人1S2 4 ,3 6 ,5均衡为(S1,T1),参与人1的收益为5。
(2)外界条件使参与人1在选择S1时的收益下降参与人2T1T2S13,45,2参与人1S24, 3 6,5均衡变为(S2,T2)参与人1的收益为6。
多人决策时,收益可能上升。
1.3 混合战略和均衡的存在例1 儿童游戏:“石头、剪刀、布”不存在纳什均衡。
如何选择战略?例6 猜硬币(Matching Pennies)参与人2正面反面正面-1,1 1,-1参与人1反面1,-1 -1,1也不存在纳什均衡。