博弈论 第一章
- 格式:doc
- 大小:333.80 KB
- 文档页数:21
1完整信息静态博弈1.0 对策论研究的内容与根本形式对策论研究的内容对策论研究多个行为主体的决议问题。
对策论研究的形式博弈 (game),由多个行为主体组成的系统。
例Stackelberg modelCournot model博弈的种类参加者行动的时间与次序同时行动——静态博弈;先后行动——动向博弈。
参加者的信息多少信息同样——完整信息;信息不一样——不完整信息。
1.1 根本理论 : 博弈的标准式和纳什平衡例 1少儿游戏:“石头、剪刀、布〞。
博弈的准式表示(normal-form representation)(1) 参加人( player).n个参加人: 1, 2, ⋯, i, ⋯, n.(2)略 (strategy).一个参加人的略是他采纳的一个行。
参加人 i 的略: s i.参加人 i 的略空 : S i .略的一个合 : s ={s1,s2, ⋯, s n}.化表示: s-i ={ s1,⋯, s i -1, s i+1, ⋯ , s n }.(3)利润 (payoff).参加人i 的利润: u i= u i(s1,s2, ⋯, s n)n 个参加人博弈的准形式表示:G = {S1, S2,⋯S,n;u1, u2,⋯u,n}完整信息 (complete information) :每个参加人知道其余人的略空和利润。
静博弈(static game):全部的参加人同行。
每一个人行,不知道其余人的行。
例 1〔〕:博弈 {石、剪刀、布 } 的描绘:参加人:1,2。
略空:S1 = S2 = {石、剪刀、布 }利润:两人出手的函数u1 (石,石 ) = 0, u1 (石,剪刀 ) = 1, u1 (石,布 ) = -1⋯u2 (石,石 ) = 0, u2 (石,剪刀 ) = -1,u2 (石,布 ) = 1⋯⋯利润表:两个参加人,有限个略的博弈的表示方法。
P2石头剪刀布石头0 , 01,-1-1 ,1P剪刀-1,10 , 0 1 ,-11布 1 ,-1-1,10 , 0博弈的:可否知道每个参加人的略?例 2: 囚犯窘境 (The Prisoner ’s Dilemma)囚犯2缄默招认缄默-1 ,-1-9 ,0囚犯1招认0 ,-9-6 ,-6囚犯 1 的考:无方缄默是招,自己“招〞好于“缄默〞。
第一章引言一、博弈的定义二、博弈的要素三、博弈的结构与分类四、博弈的发展历程五、主要应用领域一、博弈的定义博弈就是策略对抗,或策略起关键作用的游戏←博弈Game,博弈论Game Theory,Game即游戏、竞技←游戏和竞技等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊拉克、以色列和巴勒斯坦一、博弈的定义一个非技术性定义定义:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
一、博弈的定义1、博弈论是研究决策主体的行为相互作用时的策略以及这种策略均衡问题的理论——张维迎《博弈论与信息经济学》2、博弈论可以定义为对理性决策者之间冲突与合作的数学模型的研究——R.B.Myerson(2007年诺奖得主)《博弈论——矛盾冲突分析》1991年开篇第一句话四个核心方面博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行为(Actions)博弈的次序(Order)博弈方的得益(Payoffs)←1、博弈方和局中人:博弈中的决策主体,通过选择行动(或策略)以最大化自己的支付(效用、收益)。
可以是自然人,也可以是团体,比如企业、国家等←2、虚拟参与人(pseudo-player):又称“自然”(nature)指决定外生随机变量的概率分布机制。
比如,市场需求的大小,就业率的高低等等。
←3、策略(战略):相机行动方案(支配参与者在什么时候选择什么行动)。
注:a 战略是行动规则,而不是行动自身;b 静态博弈中,战略等同于行动;c 战略必须是完备的,它要给出参与人在每一种可想象到的情况下的行动选择,即使参与人并不预期这些情况会发生。
←4、支付(收益):参与者策略选择并实施后的结果,是参与人从博弈中获得多少的体现,与策略组合相对应。
第一章博弈论的发展一、博弈论的由来博弈论是一门年轻的学科,起源于本世纪初,在二战后发展成为一门完整而丰富的理论体系。
其中博弈译自英文的Game,字面意义可直译为游戏,我国学术界的另一种译法是博弈。
从名称上可以体会到博弈论的来源。
如同概率论来自对掷色子,彩票等随机性行为的观察和研究(概率论的起源有一个故事,两个人为一笔奖金而打赌,约定谁先赢到一定局数就获得全部奖金,但因故没有赌完,各自赢得一定局数,于是请数学家裁定每个人应该得到多少,数学家分析了各自获得最终胜利的概率,应按比例进行分配),博弈论起源于对国际象棋,扑克等竞赛活动的认识。
这也许可以说体现了西方精神与东方精神的差别,在中国人不屑深究其内在意义的地方西方人发展起了一种科学。
一旦以严肃认真的科学态度去分析游戏,它的思想成果即刻就超越了它原来的研究对象,博弈论的对象很快扩展为广泛存在于人类生活各个方面的人与人之间利益相互制约下进行策略选择时的理性行为及相应结局。
豪尔绍尼在诺贝尔获奖辞中是这样定义博弈论的:“博弈论是关于策略相互作用的理论,就是说,它是关于社会形势中理性行为的理论,其中,每个局中人对自己行动的选择必须以他对其他局中人将如何反应的判断为基础”。
简言之,博弈论研究人与人之间“斗智”的形式和后果。
当人们的利益存在着冲突时,每个人所获得的利益不仅取决于自己所采取的行动,也取决于其他人同时采取的行动或者对自己行动的反应。
例如,我国人们喝酒时有猜拳的习气,一个人是否被罚一杯不仅取决于自己伸出的手指数目与说出的数字,还取决于对手的选择。
由于人与人之间利益存在磨擦的情况出现于几乎所有的人类活动中,博弈论即具有了广阔的用武之地。
值得注意的是,博弈论研究的目的并非帮助特定一方胜券在握,而是描述在这种形势中各方理性选择自己的行动会达成的结果。
由于它研究人们决策相互影响的形势,国内为了突出它博弈略的强调,常常将其译为学术气氛更浓的博弈论。
博弈论这种译法来自于港台,由于它更贴近英语原文的风格以及更为直观,现下逐渐流行起来。
博弈论第一章总结那咱就开始唠唠博弈论第一章的那些事儿哈。
博弈论啊,这可是个超级有趣的东西呢。
第一章就像是打开博弈论大门的一把小钥匙,虽然小,但可重要啦。
这第一章啊,主要就是给咱介绍啥是博弈论的基本概念。
就好比是你要去一个新地方,先得知道这个地方是干啥的,大概啥样对吧。
博弈论呢,简单来说就是研究在不同的决策情况下,人们或者各方之间是怎么互相影响的。
比如说啊,下象棋的时候,你走一步,对方走一步,你每一步的决策都要考虑到对方可能会干啥,对方也是一样,这就是一种博弈呀。
这里面有个很重要的点就是参与者。
这些参与者就像一场大戏里的演员,每个参与者都有自己的目标,就像演员都有自己的角色任务一样。
比如说在商业竞争里,那些公司就是参与者,每个公司都想赚更多的钱,扩大自己的市场份额,这就是他们的目标啦。
而且这些参与者的决策可不是瞎做的哦,都是为了达到自己的目标去想办法的。
再说说策略这个事儿。
策略就像是每个参与者手里的武器或者魔法棒。
不同的参与者有不同的策略可以选择。
还拿商业竞争举例哈,如果一家公司想要增加市场份额,它可以选择降低价格,提高产品质量,或者做很多广告这些策略。
而且每个策略都会对其他参与者产生影响呢。
比如说你降价了,别的公司可能就会受到影响,也跟着降价或者想出其他办法来应对。
信息也是博弈论第一章里不能少的部分。
信息就像是在黑暗里的灯光,有多少信息就决定了你能多清楚地看清局势。
要是你知道很多关于其他参与者的信息,比如他们的策略啦,他们的目标啦,那你做决策的时候就更有把握。
但是要是你啥都不知道,就像在黑夜里瞎摸,那可就危险啦。
比如说在谈判的时候,如果一方知道另一方的底线,那这一方就有更大的优势,能更好地争取自己的利益。
这第一章的博弈论啊,其实就是把这些基本的东西一股脑儿地摆在我们面前,让我们对博弈论有个初步的认识。
它告诉我们在各种情况下,人与人、公司与公司、国家与国家之间的互动都是有规律可循的。
就像我们解开一个谜题一样,每一个概念都是一块小拼图,当我们把这些小拼图都搞清楚了,就能慢慢看到整个博弈论这个大拼图的全貌啦。
1 完全信息静态博弈1.0 对策论研究的内容与基本形式对策论研究的内容对策论研究多个行为主体的决策问题。
对策论研究的形式博弈(game),由多个行为主体构成的系统。
例Stackelberg modelCournot model博弈的类型参与者行动的时间与顺序同时行动——静态博弈;先后行动——动态博弈。
参与者的信息多少信息相同——完全信息;信息不同——不完全信息。
1.1 基本理论: 博弈的标准式和纳什均衡例1 儿童游戏:“石头、剪刀、布”。
博弈的标准式表示(normal-form representation)(1) 参与人( player).n 个参与人:1, 2, …, i, …, n.(2) 战略(strategy).一个参与人的战略是他采取的一个行动。
参与人i 的战略:s i.参与人i 的战略空间: S i.战略的一个组合: s ={s1,s2, …, s n}.简化表示:s-i ={ s1,…, s i -1,s i+1, …, s n }.(3) 收益(payoff).参与人i 的收益:u i= u i(s1,s2, …, s n)n个参与人博弈的标准形式表示:G = {S1, S2, …, S n;u1, u2, … , u n}完全信息(complete information):每个参与人知道其他人的战略空间和收益。
静态博弈(static game):所有的参与人同时行动。
每个人行动时,不知道其他人的行动。
例1(续):博弈{石头、剪刀、布} 的描述:参与人:1,2。
战略空间:S1 = S2 = {石头、剪刀、布}收益:两人出手的函数u1 (石头,石头) = 0,u1 (石头,剪刀) = 1,u1 (石头,布) = -1 …u2 (石头,石头) = 0,u2 (石头,剪刀) = -1,u2 (石头,布) = 1 ……收益表:两个参与人,有限个战略的博弈的表示方法。
P2石头剪刀布石头0 ,0 1 ,-1 -1 ,1P1剪刀-1 ,1 0 ,0 1 ,-1布 1 ,-1 -1 ,1 0 ,0博弈的问题:能否知道每个参与人选择的战略?例2: 囚徒困境(The Prisoner’s Dilemma)囚徒 2沉默招认沉默-1 ,-1 -9 ,0囚徒 1招认0 ,-9 -6 ,-6囚徒1的考虑:无论对方选沉默还是招认,自己选“招认”好于“沉默”。
囚徒2的考虑:无论对方选什么,“招认”好于“沉默”。
两人的选择: (招认,招认)。
定义:s i'是s i''的严格劣势战略(strictly dominated),如果:u i(s i',s-i) <u i(s i'',s-i)“沉默”是“招认”的严格劣战略例3:参与人2左中右上 1 ,01,3 3 ,0参与人1 中0, 2 0 ,1 6 ,0下0, 2 2, 4 5, 3参与人1: 没有严格劣战略。
参与人2: “右”严格劣于“中”考虑:重复剔除严格劣战略(iterated elimination of strictly dominated strategies)可预见的两人选择: (下, 中)。
例4: 图 1.1.4参与人2左中右上0 ,4 4,0 5 ,3参与人1 中4, 0 0 ,4 5 ,3下3, 5 3, 5 6, 6两人都没有严格劣战略。
两人会如何选择各自的战略?定义:s * = (s 1*,…,s n *)是一个纳什均衡(Nash equilibrium), 如果u i (s i *,s -i *) ≥ u i (s i ,s -i *)纳什均衡为最大化问题的解ii S s ∈max u i = u i (s 1*, …, s i , …, s n *)各例中的纳什均衡: 囚徒困境: (招认,招认) 例3: (下,中)例4( 图1. 1. 4): (下, 右).纳什均衡与重复剔除严格劣势战略的关系: 没有被剔除的唯一的战略组合是纳什均衡.如果战略是一个纳什均衡,它们在重复剔除严格劣势战略后留下.多个纳什均衡例5 性别战 (the battle of the Sexes)帕特 歌剧 拳击歌剧 2 ,1 0 ,0克里斯拳击 0 ,0 1 ,2纳什均衡: (歌剧,歌剧),(拳击,拳击)1.2 应用例 古诺双头垄断模型(Cournot Model of Duopoly )二个企业,生产产量: q 1, q 2市场需求: P = a – Q , Q = q 1 + q 2 企业成本: C i (q i ) = cq i , i = 1, 2.企业利润:πi (q 1, q 2) = Pq i – C i (q i ) = (a – (q 1 + q 2))q i – cq i , 博弈的描述:参与人:企业1,企业2 战略:产量 q i 收益:πi (q 1, q 2) 企业 i 选择产量求ii S s ∈max πi (s i , , s j *):一阶条件11dq d π = a – c – 2q 1 – q 2* = 0 和22dq d π = a – c –q 1* –2q 2 = 0 厂商选择自己利润最大的产量q 1 =22q c a -- q 2 =21q c a -- 解纳什均衡得q 1* = q 2* =3ca -利润π1 = π2 = ( a – c – (3c a -+3c a -))3ca - = 9)(2c a -当 u i 是可微分的时候 , 纳什均衡为下列方程组的的解:in i s s s s u ∂∂),...,,(21= 0, i = 1,…, n思考:用重复剔除严格劣势战略求纳什均衡 比较:如果两个厂商生产q 1 = q 2 =4ca - 利润π1 =π2 = ( a – c – (4c a -+4c a -))4ca - = 8)(2c a -例 贝特兰德双头垄断模型(Bertrand Model of Duopoly ) 两个企业生产有差别的商品。
消费者对企业 i 的需求q i (p i , p j ) = a – p i + bp j , 成本: C i (q i ) = cq i , i = 1, 2. 战略 s i : p i ≥ 0收益: πi (p i , p j ) = (a – p i + bp j )( p i – c )纳什均衡 (p 1*, p 2*) 满足max πi (p i , p j *) = max (a – p i + bp j *)( p i – c )解得 p 1* = p 2* = bca -+2例 最后要价仲裁 (Final-offer Arbitration)一个企业和一个工会,通过一个仲裁人决定工资。
企业和工会同时提出工资: w f, w u仲裁人有一个标准:x,选择双方提议中比较靠近x的提议:如果x < ( w f + w u )/2,则w f如果x > ( w f + w u )/2,则w uw f(w f + w u )/2x w u企业和工会不知道x,但知道x的分布函数F(x)和密度函数f(x)。
分析w f 被选择的概率:Prob {x <2ufww+} = F⎪⎪⎭⎫⎝⎛+2ufwww u被选择的概率:Prob{ x >2ufww+} = 1 –F⎪⎪⎭⎫⎝⎛+2ufww期望工资Ew = w f F⎪⎪⎭⎫⎝⎛+2ufww+ w u 1 –F⎪⎪⎭⎫⎝⎛+2ufwww f* 满足fwm in w f F⎪⎪⎭⎫⎝⎛+2*ufww+ w u* 1 –F⎪⎪⎭⎫⎝⎛+2*ufwww u* 满足uwmax w f*F⎪⎪⎭⎫⎝⎛+2*ufww+ w u 1 –F⎪⎪⎭⎫⎝⎛+2*ufww由一阶条件F⎪⎪⎭⎫⎝⎛+2ufww+21wf f ⎪⎪⎭⎫⎝⎛+2ufww-21wu f ⎪⎪⎭⎫⎝⎛+2ufww= 021wf f ⎪⎪⎭⎫⎝⎛+2ufww+ 1 - F⎪⎪⎭⎫⎝⎛+2ufww-21wu f ⎪⎪⎭⎫⎝⎛+2ufww= 0 由此解出工资的均衡提议。
两式相减F⎪⎪⎭⎫⎝⎛+2ufww=21两式相加w u*f ⎪⎪⎭⎫⎝⎛+2ufww–w f*f ⎪⎪⎭⎫⎝⎛+2ufww= 1如果x为正态分布: x ~ N(m, σ2)2**ufww+= mw u* –w f*=)(1mf= 22πσ,纳什均衡w u* = m +2/2πσ, w f* = m–2/2πσ例公共财产问题一个村庄,有n个村民,在公共草地上放羊。
村民i放牧的羊数:g i全村的羊总数:G = g1+ ... + g n养一只羊的(私人)成本为c,一只羊的价值为v(G)当G < G max, v(G) > 0, v'(G) < 0, v''(G) < 0当G > G max , v (G ) = 0每个村民选择养羊数量使自己收益最大g i v (G ) – cg i 一阶条件v (G ) + g i v ' (G ) – c = 0, i = 1,..., n 将n 个等式相加得到nv (G ) + G v ' (G ) – nc = 0 即纳什均衡G 1满足v (G 1) +nG 1v ' (G 1) – c = 0 全村在总收益最大的放牧数G 2满足max G 2 v (G 2) – cG 2 一阶条件v (G 2) + G 2 v ' (G 2) – c = 0 G 1与 G 2哪一个大? G1大vv (G ) O G max GG v ' (G )/nv' (G)G v' (G)决策问题:在条件变差时, 收益上升还是下降?在通常的(一人)决策中,如果有几个选择,决策者选择收益最大的一个。
如果外界条件改变,使他的一个或几个收益下降,则它无论怎样选择,都不会使收益比原来更大。
例在一块田里选择种植的(纯)收入:棉花3000元花生3700元玉米3500元如果成本上升,收入变为棉花3000元花生3200元玉米3400元人决策收益通常下降例在多人决策时的收益下降与增加(1)初始时参与人 2T1T2S15,48,3参与人1S2 4 ,3 6 ,5均衡为(S1,T1),参与人1的收益为5。
(2)外界条件使参与人1在选择S1时的收益下降参与人2T1T2S13,45,2参与人1S24, 3 6,5均衡变为(S2,T2)参与人1的收益为6。
多人决策时,收益可能上升。
1.3 混合战略和均衡的存在例1 儿童游戏:“石头、剪刀、布”不存在纳什均衡。
如何选择战略?例6 猜硬币(Matching Pennies)参与人2正面反面正面-1,1 1,-1参与人1反面1,-1 -1,1也不存在纳什均衡。