当前位置:文档之家› 博弈论复习题(1)

博弈论复习题(1)

1.设一四阶段两博弈方之间的动态博弈如图所示。试找出全部子博弈,讨论该博弈中的可信性问题,求子博弈完美纳什均衡策略组合和博弈的结果。

2.假设一个工会是一个寡头垄断市场中所有企业唯一的劳动力供给者,就像汽车工人联合会对于通用、福特、克莱斯勒等大的汽车厂家。令博弈各方行动的时间顺序如下:(1)工会确定单一的工资要求w ,适用于所有的企业(2)每家企业i 了解到w ,然后同时分别选择各自的雇佣水平L i ;(3)工会的收益为(w-w α)L ,其中w α为工会成员到另外的行业谋职可取得的收入,L=L 1+…L n 为工会在本行业企业的总就业水平;企业i 的利润为π(w ,L i ),其中决定企业i 利润水

A

B

B A h g (2,4)

(8,5)

(3,6)

(4,3)

b (5,3)

a c d f e

平的要素如下。

所有企业都有同样的生产函数:产出等于劳动力q i=L i。市场总产出为Q=q1+…+q n时的市场出清价格为p(Q)=a-Q。为使问题简化,假设企业除了工资支出外没有另外的资本。求出此博弈的子博弈精炼解。在子博弈精炼解中,企业的数量是如何影响工会的效应的?为什么?(吉本斯2.2节 2.7答案)

3.下图所示的同时行动博弈重复进行两次,并且第二阶段开始前双方可观测到第一阶段的结果,不考虑贴现因素。变量x大于4,因而(4,4)在一次性博弈中并不是一个均衡收益。对什么样的x,(双方参与者同时采取)下述战略是一个子博弈完美纳什均衡?

第一阶段选择Q i,如果第一阶段的结果为(Q1,Q2),在第二阶段选择P i;如果第一阶段的结果为(y,Q2),其中y≠Q1,第二阶段

选择R i;如果第一阶段的结果为(Q1,z),其中z≠Q1,第二阶段选择S i;如果第一阶段结果为(y,z),其中y≠Q1,且z≠Q2,则在第二阶段选P i

P2 Q2 R2 S2

P1

Q1

R1

S1

(2.10吉本斯)

思路:逐个分析上述的四种情形:

第一种情形,第一阶段选择Qi,第二阶段选择Pi,即双方均采取合作的策略,得益均为6;

第二种情形和第三种情形下,实际上有一方是采取了不合作,其得益为x,另一方即利益受损方得益为2;

第四种情形实际上是双方都不采取合作的策略,而根据题目要求,对于x,下述战略是一个子博弈精炼纳什均衡,所以x必须小于双方均合作时的收益6,否则第一种情形不会出现,因为既然x>6了,双方均会选择不合作而使情形一不会出现。

由题目先前给定的条件x<4,综合之得x的取值为(4,6)。(可参见教材68页的分析)

4.两个人A,B分一个冰淇淋。第一阶段A提出分割方案,B可以接受或者拒绝,接受则博弈结束,若拒绝B提出分配方案;同样,A可

以接受或者拒绝,如果拒绝,就提出自己的分配比例。博弈结束。假定接受的利益和拒绝的利益相同的时候,大家都会选择接受。冰淇淋在每个阶段会化掉1/3(整体的1/3)。试分析这个博弈的子博弈完美纳什均衡是什么。

如果每阶段冰淇淋只化掉1/3,采用逆向归纳法。最后一个阶段应该是A在分,如果B拒绝,两人都是0,A的分配不会使B得到的更差,所以为了最大化自己的利益,A便让自己得到1/3,B一丁点也得不到。为了防止这一点,在第二阶段B分配的时候,就不会让A 分到的比1/3少,否则A会拒绝,B就得不到好处了。B会将剩下的2/3平分,两人各得1/3。深知这一点后,第一阶段在冰淇淋没化的时候A如果让B得到的不少于1/3,B就不会拒绝。这样A可以将2/3分给自己,1/3分给B,实现自己利益最大化。此时便达到了纳什均衡

如果每阶段冰淇淋只化掉1/3,采用逆向归纳法。最后一个阶段应该是A在分,如果B拒绝,两人都是0,A的分配不会使B得到的更差,所以为了最大化自己的利益,A便让自己得到1/3,B一丁点也得不到。为了防止这一点,在第二阶段B分配的时候,就不会让A 分到的比1/3少,否则A会拒绝,B就得不到好处了。B会将剩下的2/3平分,两人各得1/3。深知这一点后,第一阶段在冰淇淋没化的时候A如果让B得到的不少于1/3,B就不会拒绝。这样A可以将2/3分给自己,1/3分给B,实现自己利益最大化。此时便达到了纳什均衡

5. 两个寡头企业进行价格竞争博弈,企业1的利润函数是

()q c aq p ++--=21π,企业2的利润函数是()p b q +--=22π,其中p 是

企业1的价格,q 是企业2的价格。求: (1)两企业同时决策的纯策略纳什均衡; (2)企业1先决策的子博弈完美纳什均衡; (3)企业2先决策的子博弈完美纳什均衡;

(4)是否存在参数a ,b ,c 的特定值或范围,使得两个企业都希望自己先决策(博弈论习题【1】P9 习题三)

6. 试分析为什么在很多商业街上麦当劳与肯德基都是选在商业街的中心段,且比邻而居。(博弈论习题【1】P5 最后一句)

假设在一条繁华的商业街有A、B、C、D、E五个商业点可以作为开店的位置,每个商业点消费者数量相同,麦当劳和肯德基可以选择A、B、C、D、E五个地点中任意一个作为店址。(1)两家店不同时决策。不妨设肯德基先决策,麦当劳再决策(这也符合中国实际情况,中国肯德基数量为麦当劳的3倍,整体发展优于麦当劳,所以一般会先有肯德基),而消费者会选择距离他们最近的店面去消费,若距离一样,则消费者以等概率选择两家店。

基于以上假设就可以对参与人麦当劳(记为M)、肯德基(记为K)决策进行分析。K首先进行决策,作为一个理性决策者,K会考虑M的决策。若K选择A,则M会选择B,此时,K

只能得到A的顾客,其收益不妨记为1,而M的收益则为4,这显然不是最优策略。若K选择B,则M会选择C,在这种情况下,K的收益为2,M的收益为3。按照这样的思路分析下去,可以得知K选择C是最优策略。此时,无论M选择哪里作为店址,K的收益都不会小于M。之后轮到M进行决策,若选择A,则K的收益为3.5,M的收益为1.5,不是最佳应对。以此对每个店址进行分析,可知M选择C是对K选择C的最佳应对。在这种情况下,K和M 的收益都为2.5,两家店平分所有的顾客,两家店的决策也互为最佳应对,达到了纳什均衡。所以,肯德基和麦当劳的店址会选择在同一地点。

(2)两家店同时决策。此时两家店的收益矩阵,如下:

在这种情况下,直接寻找纳什均衡不是那么容易,但是通过上面的收益矩阵可以看出,对于肯德基,策略A和策略E是严格非优策略,因为在肯德基选择A或E的任何场合,它也可以通过选择B来获得一个严格的较高收益。与此类似,对于麦当劳,策略A和策略E也是严格非优策略,因为在任何场合,麦当劳可以选择通过选择B来获得一个严格的较高收益。

理性的参与人不会有任何兴趣去选择采取一个非优策略,因为那总是可以通过一个其他收益更高的策略来替代。因此,肯德基不会选择A和E,并且因为麦当劳知道这个博弈的结构,包括肯德基的收益情况,所以麦当劳也知道肯德基不会采取选择A和E。因此这两个策略在博弈中会被有效的去除。同样的道理,对于麦当劳也是如此。这是,我们可以得到一个化简后的博弈收益矩阵,这个矩阵只包括B、C、D三个策略,如下:

这时可以再次发现对于肯德基,策略B和D是严格非优策略,对于麦当劳,策略B和D也是严格非优策略,化简后对于每个参与人都只有一种策略C,即可得到策略组(C,C)。当然一种更简单和更方便的方法是直接发现该博弈结构中存在纳什均衡(C,C)。这表明肯德基和麦当劳同时决策时,最后的结果也会是两家店选址在一起。

综合上面的讨论,可见肯德基和麦当劳总是比邻而开,并不是偶然,而是理性博弈后的必然。

7. 设有一批选民在一个单位区间从左(x=0)到右(x=1)均匀分布,为一个职位参加竞选的每个候选人同时选择其竞选基地(即在x=0与1之间的一个点)。选民观察候选人的选择,然后每一投票人把票投给其基地离自己最近的候选人。比如,如果有两个候选人,他们分

别在x=0.3和x=0.6选择基地,则处于x=0.45左边的所有选民都会把票投给候选人1,右边的人都会把票投给候选人2,这样候选人2就可以得到55%的选票赢得这场选举。假设候选人只关心他能否当选,他们根本一点都不关心其基地。如果有两个候选人,博弈的纯策略纳什均衡是什么?(吉本斯1。8)

8. 假定古诺的寡头垄断模型中有n个企业,令qi代表企业i的产量,且Q=q1+……+qn表示市场总产量,p表示市场出清价格,并假设反需求函数由p(Q)=a-Q给出(设Q<a,其他情况下p=0).并设企业i生产出的qi的总成本Ci(qi)=cqi,即没有固定成本,且边际成本为常数c,这里设c<a,根据古诺的假定,企业同时就产量进行决策。求出博弈的纳什均衡。当n趋向于无穷时,将会发生什么情况?(博弈论习题【1】P3 第八题)

不完全信息博弈

1. 考虑两企业采用伯川德竞争,即静态情况下的价格竞争。两企业

间存在着信息不对称,并且产品存在差异。对企业i 的需求(,)i i j i i j q p p a p b p =--,两企业的成本都为0。企业i 的需求对企业

j 价格的敏感程度有可能高,也可能较低,也就是说,b i 可能等于b H ,也可能等于b L ,这里b H ﹥b L ﹥0。对每个企业,b i =b H 的概率为θ,b i =b H 的概率为1-θ,并且与b j 的值无关。每一企业知道自己的b i ,但不知道对方的,所有这些都是共同知识。此博弈中的行动空间、类型空间、推断以及效用函数各是什么?双方的策略空间各是什么?此博弈对称的纯策略贝叶斯纳什均衡应满足那些条件?求出这样的均衡解。

2、试分析下面完全但不完美动态博弈的贝叶斯精炼均衡。

贝叶斯精炼均衡应该满足如下四个条件:

条件 1:在各个信息集处,轮到选择的博弈方必须有关于博弈达到该信息集中每个节点的可能性的“判断”。

对非单节点信息集,一个“判断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信息集,则可理解为“判断达到该节点的概率为1”

条件2:给定轮到选择博弈方的“判断”,他的后续策略必须是“序列理性”的。即在

给定此判断和“其他博弈方后续策略”的情况下,该博弈方其后的行为选择意在使自己的期望得益最大。

条件3:在均衡路径上的信息集处,“判断”要符合贝叶斯法则和各博弈方的均衡策

略。

条件4:在非均衡路径上的信息集处,“判断”也要符合贝叶斯法则和各博弈方在此

处可能有的均衡策略。

当一个策略组合及相应的判断满足这四个条件时称为“完美贝叶斯均衡”。

第一种解释分析:

上图是一个有三个博弈方的三阶段不完美信息动态博弈。在该博弈中,博弈方3 的信息集是一个两节点信息集。

如果博弈方1第一阶段选F ,则博弈过程会经历多节点信息集假设博弈方3“判断”博弈方2选L 和R 的概率分别是 p 和1-p

,最终共有四种可能的结果,各方得益如图所示。

先考察博弈方3的选择,他选 U 的期望得益为:

,选 D 的期望得益为 , 因此当 ,即p <l/3 时他该选U ,

当 p >l/3 时,他该选D ,P=1/3 时选U 、D 或者混合策略都可以。

先假设博弈方3“判断” p >1/3,此时他的合理选择是D ;再来看博弈方2的选择,因为L 是他相对于R 的严格上策,因此他无需考虑博弈方3在第三阶段如何选择,而唯一地只选

1(1)22P P P ⨯+-⨯=-3(1)112P P P ⨯+-⨯=+212P P ->+

择L。可知,博弈方3“判断”p>1/3是符合博弈方2 的均衡策略的。

又,既然博弈方2只会选L,故,完全符合博弈方2均衡策略的博弈方3的“判断”应该是p=1。

对于博弈方1而言,他知道从博弈方2选择开始的子博弈的均衡必然为(L,D),意味着自己选择F可以获得3单位得益,比选B得益2要好,因此F是他的均衡策略。均衡策略组合(F,L,D)以及与之相应的博弈方3的“判断”p = 1完全符合完美贝叶斯均衡的条件1–3,并且由于在上述策略组合下不存在不在均衡路径上需要判断的信息集,因此条件4 自动满足,可以肯定这是一个完美贝叶斯均衡。

第二种解说分析:

由于在该博弈中,从博弈方2 的单节点信息集开始的子博弈实际上是一个静态博弈(由于博弈方3对博弈方2的行为具有不完美性,因此相当于他们同时做出行为选择),如下图所示。

显然,该静态博弈有唯一的纳什均衡(L,D),故整个博弈有唯一子博弈完美纳什均衡(F,L,D)。

为了说明条件4的必要性,考察另一个策略组合(B,L,U)及博弈方3相应的“判断”p=0。

该策略组合是一个纳什均衡,原因是不论博弈方1 选什么策略,博弈方2的最佳反应对策都是L;而当博弈方3判断p=0 的情况下,U是他对博弈方2的最佳反应对策;对于博弈方1 来说,当其他两方的策略是(L,U)时,当然是选 B 合算,从而(B,L,U)满足相互是对对方策略的最佳反应对策。

其次在博弈方3“判断”p=0时,(B,L,U)是序列理性的,且在均衡路径(B)上没有多节点信息集,条件3自动满足。即策略组合(B,L,U)和博弈方3的“判断” p=O是满足完美贝叶斯均衡的条件1—3的。

然而,仅此就断定它是一个完美贝叶斯均衡是有问题的,因为这时各博弈方得益(2,0,O)是极不理想的。

此时条件4就可以起作用了。在(B,L,U)策略组合下,博弈方3的信息集正是不在均衡路径上的信息集,但博弈方3在此处的“判断”p=0显然与博弈方2的策略L不相符合。因此上述策略组合和“判断”不能构成完美贝叶斯均衡,这就把(B,L,U)排除出了完美贝叶斯均衡的范畴,从而使得完美贝叶斯均衡是更加可靠、稳定和合理的均衡概念。

4. 分析下图中的博弈可能存在哪几类均衡?试分析其精炼贝叶斯均衡。

(1)自然选择发送者类型,告诉发送者,接受者不知道发送者真是类型,但类型的概率分布(0.5,0.5)是共同知识。

(2)对于假设存在混同均衡(L ,L ),成立的条件是接收者对于发送者发送L 的信号的反应是选择a1,对发送R 的信号的反应是a2——接收者均衡策略为(a1,a2)。接收者对信号R 的反应是选择a2的条件是:1*q+0(1-q )<0*q+2(1-q),得出q<2/3,所以精炼贝叶斯均衡为(L ,L ),(a1,a1接收者),p=0.5,q<2/3。

(3)对于混同均衡(R ,R )由贝叶斯法则得(q ,1-q )=(0.5,0.5),接收者对于信号R 的反应是选择a2,类型为t1的发送者支付为0,类型为t2的发送者支付为1,接收者对L 的最优反应是a1(无论p 为多少),此时t1支付为1,t2支付为2,(R ,R )不可能称为混同均衡。

(3)对于分离均衡(L ,R ),接收者的两个信息集都在均衡路径上,于是p 、q 都由贝叶斯法则与发送者的策略确定p=1,q=0 ;给定p=1,接收者对于信号L 的反应是选择a1;给定q=0,接收者对于信号R 的最优反应是选择a2,t1、t2支付均为1,给定接收者的最优战略(a1,a2),t2有积极性偏离R 的策略,所以不存在分离均衡(L ,R )

(4)对于分离均衡(R ,L ),由贝叶斯法则,得到p=0,q=1,给定p=0,接收者对于信号L 的反应是选择a1;给定q=1,接收者对于信号R 的最优反应是选择a1,t1、t2支付均为2,给定接收者的最优战略(a1,a1),t1、t2均无积极性偏离(R ,L),所以[(R ,L),(a1,a1),p=1,q=1]为精炼贝叶斯均衡。

5.假设市场上存在着两类工人,以他们的生产率来区分。k H 型工人具有生产率为k=2,而k L 型工人的生产率为k=1。要达到给定的教育水平,花在k L 型工人身上的成本要大于花在k H 型工人身上的成本。特别地,对于k 型工人,每e 个单位的教育成本为c(e ;k)=e/k 。对一

(1,3(4,0(2,4(0,12,1)(0,0)1,0)1,2)

个k型个人的效用函数为U(w,e;k)=w-c(e;k)。

(a)工人的教育水平影响他的生产率吗?如果公司和工人具有关于k值得相同的信息,什么是最优的教育水平?

现在假设工人的生产率不能被厂商观察到,但他的教育水平能被厂商观察到。进一步假设,厂商相信大于或等于某一特定水平e p的教育水平是高生产率的信号,而低于这一教育水平的则是低生产率的信号。因此厂商提供工资的根据是:如果e≥e p,则w(e)=2,而如果e﹤e p,则w(e)=1。

(b)给定这些工资,计算每一类代理人会选择的教育水平。

(c)找出有关e p的必要条件,使得教育是一个有效传递生产率的信号。

(d)证明,由(c)得出的e p值,与厂商在均衡处的信念是一致的。(e)讨论得出的结果

6. 两个合伙人必须就其合伙企业进行清算。合伙人1现在拥有权益份额为s,合伙人2拥有1-s。两合伙人同意进行如下博弈:合伙人1提出一个价格p,然后合伙人2可以选择以ps的价格购买合伙人1

的股份,或以p(1-s)的价格将自己的股份卖给合伙人1.假设两个合伙人对拥有全部企业价值的估价相互独立,且服从〔0,1〕区间的均匀分布,以上是共同知识,但每一个合伙人的估价是私人信息。求出博弈的精炼贝叶斯均衡。

解:设合伙人1、2对拥有全部企业价值的估价分别为v1、v2,收益函数分别为U1、U2,由题目条件可以得出,

U1=ps-v1s 当合伙人2向合伙人1购买;

U1=v1s-p(1-s) 当合伙人1向合伙人2购买。

U2=ps-v1s 当合伙人2向合伙人1购买;

U2=v1s-p(1-s) 当合伙人1向合伙人2购买。

由于两个合伙人对拥有全部企业价值的估价相互独立,且服从〔0,1〕区间的均匀分布,由逆向归纳法可以得出该博弈的精炼贝叶斯均衡:当ps-v1s>v1s-p(1-s),且v2s-ps>p(1-s)-v2s,即v1

反之,当v2< p/(2s)

7. 企业和工会进行下面的两阶段谈判博弈。企业利润π服从o到1之间的均匀分布,工会的保留工资为wr,以上都是共同知识,只有企业才了解π的真实值。假定0<wr<1/2,求出下面博弈的精炼贝叶斯均衡:

a 在第一阶段的开始,工会向企业提出一个工资要价w1

b 企业或接受或拒绝w1,如果企业接受w1,则两阶段都可以开工生产,于是工会的收益为2w1,企业的收益为2(π-w1)(不考虑贴现因素)。如果企业拒绝w1,则第一期就没有产出,且企业和工会第一阶段的收益都等于0;

c 在第二阶段的开始(假定企业拒绝了w1),企业向工会提出一个工资出价w2;

d 工会或接受或拒绝这一出价,如果工会接受w2,则第二期会有产出,于是第二期(也是全部)的收益为工会w2,企业为π-w2(第一期收益为0).如果工会拒绝w2,则没有产出,工会在第二期赚得其保留工资w,企业关闭,收益为0.

信息经济学习题

1. 经理有三个可能的行动{}123,,a a a a =,企业有两个可能的利润水平:

100H L ππ==和;对应不同选择的利润的概率分别为:123211(),()()323

H H H f a f a f a πππ===和。假定经理的效用函数为

()U g a =,其中w 是工资收入,123()53,()8()4g a g a g a ===;经理的保留效用为U=0。

(1) 如果经理的选择是可观测的,什么是最优工资合同?

(2) 证明:如果经理的选择是不可观测的,那么,没有合同可以使

得经历选择a 2。当2()g a 满足什么值时,a 2是可以实现的。

(3) 什么是经理的选择不可观测时的最优激励合同?

(4) 假定

1()g a =1()(0,1)H f a x π=∈。如果经理的选择是可观

测到的,当x 趋向于1时,最优合同是什么?如果经理的选择不可观测到,当x 趋向于1时,最优合同又是什么?

博弈论复习题及答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。() 博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×) 上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论复习题及答案

可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);?利润的大小取决于双方的策略组合(收益函数);?博弈有四种策略组合,其结局是:? (1)双方都不涨价,各得利润10单位;? (2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;? (3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;? (4)双方都涨价,可口可乐利润140,百事可乐利润35;? 画出两企业的损益矩阵求纳什均衡。 9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。 (1)将这一市场用囚徒困境的博弈加以表示。 (2)解释为什么均衡结果可能是两家公司都选择竞争性策略。 );若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。 12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出: (1)有哪些结果是纳什均衡? (2)两厂商合作的结果是什么? 答(1)(低价,高价),(高价,低价) (2)(低价,高价) 13、A、B两企业利用广告进行竞争。若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。 (1)画出A、B两企业的支付矩阵。 (2)求纳什均衡。

(完整版)博弈论复习讨论题

1、人与人之间的博弈是什么关系? 既可以是竞争关系,也可以是合作关系 2、因为博弈论的研究而获得1994年诺贝尔经济学奖的是 泽尔腾、海萨尼、纳什 3、学习博弈论的目的只是为了在今后与他人的博弈中能够打败对手(×) 4、博弈是指在一定的游戏规则约束下,基于(直接)相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 5、如果博弈前的损益总和与博弈后的损益总和相等,该博弈称为零和博弈 6、策略具有以下特性:完整性、不可观察性、多样性 7、人在博弈中并不是完全理性的(√) 8、博弈论的建立基于两大假设,其中除了人的理性以外,还有一个是(人的认知) 9、囚犯困境的根本原因在于个人行为的负外部性(私人成本与社会成本的差异) 10、在囚犯困境的博弈中,事先订立攻守同盟一定是有用的(×) 11、(占优)策略是指无论其他参与者采取什么策略,某参与者采用该策略的结果都优于或不劣于其他策略。 12、以下现象哪些明显属于“囚犯困境”?价格战、公地悲剧、环境污染 13、“好货不便宜、便宜没好货”其实是一个“智猪博弈”,这是因为不懂行的人占了懂行的人的便宜 14、之所以会出现“万元陷阱”,是因为:不懂得止损、沉没成本 15、智猪博弈是一个搭便车的博弈。一方付出了相应的代价,双方共享了所得到的收益。(√) 16、人在“亏损”的情况下,会从一个风险(厌恶)者变成了风险偏好者。 17、以下哪些博弈不属于竞争关系?同学聚会 18、哪些行业是赢者通吃的?演艺界、搜索引擎、门户网站 19、杭州试行的“谦让牌”之所以没效果,是因为宣传力度不够(×) 20、汇合点(Meeting point)必须是(共同)知识才有用 21、以下是某教授和学生张三之间的策略表达式:教授选择放过该学生的概率是多少?50% 22、以下是某教授和学生张三之间的策略表达式:张三选择平时勤快的概率是多少?20% 23、纯策略是指如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动(√)

博弈论复习题及答案

博弈论 2、可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是: (1)如果双方都不涨价,各得利润10单位; (2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30; (4)如果双方都涨价,可口可乐利润140,百事可乐利润35; 求纳什均衡。 博弈的稳定状态有两个:都不涨价或者都涨价(均衡),均衡称为博弈的解。 3、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到;都去按则同时到。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益): 小猪 按等待 大猪按 5,1 4,4 等待 9,-1 0,0 求纳什均衡。 在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。即不管大猪选择按还是不按,小猪的最佳策略都是等待。也就是说,无论如何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。所以纳什均衡是(大猪按,小猪等待)。 4、根据两人博弈的支付矩阵回答问题: a b A B (1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈(6分) (2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。 (3)求出该博弈的混合策略纳什均衡。(7分) (1)策略 甲:AB 乙:ab 博弈树(草图如下: (2)Pure NE (A, a); (B, b) 都是Pareto有效,仅(B, b)是K-H有效。

博弈论复习题及答案

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题?

博弈论复习题及答案

可口可乐与百事可乐参与者的价格决策:双方都可以保持价格不变或者提高价格策略;博弈的目标和得失情况体现为利润的多少收益;利润的大小取决于双方的策略组合收益函数;博弈有四种策略组合,其结局是: 1双方都不涨价,各得利润10单位; 2可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; 3可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30; 4双方都涨价,可口可乐利润140,百事可乐利润35; 画出两企业的损益矩阵求纳什均衡; 9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场;如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元;如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元; 1将这一市场用囚徒困境的博弈加以表示; 2解释为什么均衡结果可能是两家公司都选择竞争性策略; 答:1用囚徒困境的博弈表示如下表: 北方航空公司 合作竞争

合作500000,500000 0,900000 新华航空公司 竞争900000,0 60000,60000 2如果新华航空公司选择竞争,则北方航空公司也会选择竞争60000>0;若新华航空公司选择合作,北方航空公司仍会选择竞争900000>500000;若北方航空公司选择竞争,新华航空公司也将选择竞争60000>0;若北方航空公司选择合作,新华航空公司仍会选择竞争900000>0;由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元; 12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润单位:万元由下图的得益矩阵给出: 1有哪些结果是纳什均衡 2两厂商合作的结果是什么 答1低价,高价,高价,低价 2低价,高价 13、A、B两企业利用广告进行竞争;若A、B两企业都做广告,在未来销售中,A 企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B 企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企

博弈论练习题1

人力资源管理 209120222005 魏丽娜 博弈论练习题 博弈论练习题(一) 一、下面哪些问题适用博弈来模型化∶ 1、石油输出国组织(OPEC)成员国选择其年产量; 2、通用汽车公司向USX购买钢材; 3、两厂商,一家制造螺钉,一家制造螺帽,是用公制还是英制; 4、公司董事会为其总经理(CEO)设立一项期股安排; 5、联合果品公司决定招募工人; 6、一电力公司估计了未来10年对电力的需求后,决定是否购置一套新的发电机组。解:第1、2、3、6适用博弈来模型化。 1——多人博弈,2——单人博弈,3——双人博弈,6——单人博弈。 博弈论练习题(二) 一、构造具有下述性质的2*2博弈的例子 1、不存在纯战略纳什均衡; 2、不存在弱帕累托优势战略组合; 3、至少有两个纳什均衡,其中一个帕累托优于其它所有的战略组合; 4、至少有三个纳什均衡。 解:(1)不存在纯策略纳什均衡: 例如:监督博弈:以下博弈矩阵中参与人1表示收税人,参与人2表示纳税人。a表示应缴纳税收数额,c表示检查成本,F表示逃税的罚款。 (2)不存在弱帕累托优势战略组:

例如:囚徒困境 (3)至少有两个纳什均衡,其中一个帕累托优于其它所有的战略组合: 例如:廉价磋商: 该博弈有两个纳什均衡(X1 ,Y1),(X2 ,Y2)。显然(X1 ,Y1)帕累托优于(X2 ,Y2)。 (4)至少有三个纳什均衡: 例如:分蛋糕:两个人分1000克蛋糕,规则是每个参与人各自写出自己要求的数量,交给仲裁人,若两人要求数量总和不超过1000克,没人可以获得自己要求的数量,若两人的要求超过1000克,则每个人一无所获。 二、不协调博弈 有一男一女,各自选择是看足球还是看时装表演。男的愿意看足球,女的喜欢看时装。男的想和女方在一起,女的却想躲开男方。 1、构造一个博弈矩阵来表示这个博弈,选择相应的数值以符合男、女的偏好; 2、若女方先采取行动,将发生什么? 3、该博弈中存在先动优势吗? 4、在完全信息的静态博弈中,存在纯战略纳什均衡吗? 解:1、其博弈矩阵如下: 该博弈也有两个纳什均衡(足球,足球),(电影,电影)。实际生活中可能是先动优势,谁先买票跟谁去;也可能达成默契,一次看足球,一次看电影。 2、若女方先行动,则男方有后动优势。女方先行动,男方后行动,则存在先动劣势,而有

博弈论总结复习题包括答案

博弈论 题型一:纯策略纳什均衡 1、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按 钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到;都去按则同时到。若大猪先到,大猪吃到 9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示(每格 第一个数字是大猪的得益,第二个数字是小猪的得益): 小猪 按等待 大猪按5, 1 4, 4 等待9, -1 0, 0 求纳什均衡。 在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是 最好选择等待。即不管大猪选择按还是不按,小猪的最佳策略都是等待。也就是说,无论如 何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按 的话还可以有4个单位的收益。所以纳什均衡是(大猪按,小猪等待)。 题型二:混合策略的纳什均衡 2、求出下面博弈的纳什均衡(含纯策略和混合策略)o 乙 T R 由划线法易知,该矩阵博弈没有纯策略Nash均衡。 可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0-i-5-8-6=-9,i—-1

可得混合策略Nash均衡 -- -- (( ,),(4, 3) 9 9 7 7 据说是去年考了的原题! 3、Smith和John玩数字匹配游戏,每个人选择1、2、3,如果数字相同,John 给Smith 3美元,如果不同,Smith给John 1美元。 (1)列出收益矩阵。 (2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少? 答:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳什均衡。 (2) Smith 选(1/3 , 1/3 , 1/3 )的混合概率时, 1 1 1 1 John选1的效用为:U i=-X4 3片一X H--X丄一一 3 3 3 3 John选2的效用为:U 2 =_lx H--1X(- 3>lx L丄 3 3 3 3 John 选3 的效用为:U 3 =—ix 1+-IX 1+—1“_ 3)=-4 3 3 3 3 类似地,John选(1/3 , 1/3 , 1/3 )的混合概率时, Smith选1的效用为:U 1 = J X’虑_1) =4 3 3 3 3 Smith 选2 的效用为:U 2*=4-x( 1 片4 x 3^-lx (- 1)=4 3 3 3 3 Smith选3的效用为:U 3 = ->( -1) +」M丄)+-氐3=4 3 3 3 3 因为Ui U2 Us, U 1 U2 Us ,所以: ■ 1 11 1 1 1 n T u TT i c TT i ,| ----- -------- )是纳什均衡,策略值分别为John: U =一;Smith : U •=—。 L3 33 333 J 3 3

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 1、囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 2、子博弈精炼纳什均衡不是一个纳什均衡。(×) 3、若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。() 4、博弈中知道越多的一方越有利。(×) 5、纳什均衡一定是上策均衡。(×) 6、上策均衡一定是纳什均衡。(√) 7、在一个博弈中只可能存在一个纳什均衡。(×) 8、在一个博弈中博弈方可以有很多个。(√) 9、在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 10、在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 11、在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×) 12、上策均衡是帕累托最优的均衡。(×) 13、因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。(×) 14、在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因 此总是有利的。(×)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 15、囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。(×) 16、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√) 17、不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 18、多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√)19、如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论复习题及答案

博弈论 2、可口可乐及百事可乐〔参及者〕的价格决策:双方都可以保持价格不变或者提高价格〔策略〕;博弈的目标和得失情况表达为利润的多少〔收益〕;利润的大小取决于双方的策略组合〔收益函数〕;博弈有四种策略组合,其结局是: 〔1〕如果双方都不涨价,各得利润10单位; 〔2〕如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; 〔3〕如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30; 〔4〕如果双方都涨价,可口可乐利润140,百事可乐利润35; 求纳什均衡。 博弈的稳定状态有两个:都不涨价或者都涨价〔均衡〕,均衡称为博弈的解。 3、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供给的按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的本钱。谁去按按纽那么谁后到;都去按那么同时到。假设大猪先到,大猪吃到9个单位,小猪吃到一个单位;假设同时到,大猪吃7个单位,小猪吃3个单位;假设小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除本钱后的支付矩阵可如下表示〔每格第一个数字是大猪的得益,第二个数字是小猪的得益〕: 小猪 按等待 大猪按 5,1 4,4 等待 9,-1 0,0 求纳什均衡。 在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。即不管大猪选择按还是不按,小猪的最正确策略都是等待。也就是说,无论如何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。所以纳什均衡是〔大猪按,小猪等待〕。 4、根据两人博弈的支付矩阵答复以下问题: a b A B (1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈〔6分〕 (2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。 (3)求出该博弈的混合策略纳什均衡。〔7分〕 (1)策略 甲:AB 乙:ab 博弈树〔草图如下: (2)Pure NE (A, a); (B, b) 都是Pareto有效,仅(B, b)是K-H有效。

博弈论复习题

博弈论复习题

《博弈论》复习思考题 1.法律和信誉是维持市场有序运行的两个基本机制。请结合重复博弈理论谈谈信誉机制发生作用的几个条件。 2.经济发展史表明,在本来不认识的人之间建立相互之间的信任关系是经济发展的关键。为什么? 3.在传统社会中,即使没有法律,村民之间也可以建立起高度的信任。请结合博弈理论解释其原因。 4.在旅游地很容易出现假货,而在居民小区的便利店则很少出现假货,请结合博弈论的相关理论进行解释。 5.有效的法律制度对经济发展具有什么作用?请结合博弈理论谈谈你的理解。 6.试用博弈理论解释家族企业为什么难以实行制度化管理? 7.固定资产投资为什么可以作为一种可置信的承诺? 8.以汽车保险为例谈谈因为信息不对称所可能产生的道德风险问题,并提出一种解决道德风险的方案。 9.以公司为例,谈谈所有者与经营者的分离可能产生的道德风险问题。 10.在波纳佩岛上,谁能种出特别大的山药,谁的社会地位就高,谁就能赢得人们的尊敬并可担任公共职务。请结合信号传递模型谈谈波纳佩岛上的这种奇异风俗。 11.一位男生在女朋友过生日时送给女朋友三百元人民币,他的女朋友往往感觉受到了侮辱。而他女朋友可能会欣然接受父母亲的现金礼

21.有两个局中人甲和乙,他们轮流选择一个介于2和10之间的整数(可以重复)。甲先选。随着博弈的进行,不断将两人所选的数字合起来累加。当累计总和达到100的时候,博弈结束。这时候判所选数字恰好使累计总和达到100的局中人为胜者。 (1)谁将赢得这场博弈? (2)请分析每个局中人的最优策略(完整的行动计划)。 22.甲和乙两人进行一场选择奖金和分配奖金的博弈。甲决定总奖金数额的大小,他可以选择10元和100元。乙则决定如何分配甲所选择的奖金数额,乙也有两个选择:将这笔奖金在甲和乙之间平分,或者乙得90%,甲得10%。请以适当的方式具体表达下列博弈,并找出相应的均衡结果。 (1)甲和乙同时行动。 (2)甲先行动。 (3)乙先行动。 这些博弈是囚徒困境博弈吗? 23.扑克牌只有黑红二色。现在考虑玩一种“扑克牌对色”游戏。甲乙二人各出一张扑克牌。翻开以后,如果二人出牌的颜色一样,甲输给乙一支铅笔;如果二人出牌的颜色不一样,乙输给甲一支铅笔。试把扑克牌对色游戏表达为一个博弈。该博弈是否存在纯策略纳什均衡,为什么? 24.试设计一种机制,解决情侣博弈中存在两个纳什均衡的“不确定”

博弈论复习题

一、名词解释 1. 博弈:即若干个人、队组或其他组织,面对一定的环境,在一定的规则下,同时或先 后,一次或多次,从各自允许的行动或策略中进行选择并加以实施,各自取得相 应结果或收益的过程。 2. 囚徒困境:囚徒困境是两个嫌疑犯作案后被警察抓住,分别被关在不同房间审讯。警 察告诉他们:如果两人都坦白,各判刑8 年;如果两个都抵赖,各判1年(因 证据不足);如果其中一人坦白另—人抵赖,坦白者放出去,抵赖的判刑10 年。结果,两个嫌疑犯都选择坦白,各判刑八年。事实上,如果两人都抵赖,各 判一年,显然这个结果好,但帕累托改进办不到,因为它不能满足人类的理性要 求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理 性,聪明的人类会因为自己的聪明而作茧自缚。它是博弈论的非零和博弈中具代 表性的例子,反映个人最佳选择并非团体最佳选择,揭示了个人理性和集体理性 的矛盾。 3. 非合作博弈与合作博弈:非合作博弈与合作博弈之间的区别主要在于人们的行为 相互作用时,当事人能否达成一个具有约束力的协议。如果有,就是合作博弈; 如果没有,就是非合作博弈。 4. 常和博弈与变和博弈:零和博弈是指在任意战略组合下“总支付”均为零的博 弈,如通常的打赌博弈.常和博弈是指在任意战略组合下“总支付”均为一个常 数的博弈,如若干个人分一笔固定奖金的博弈.变和博弈也称非常和博弈,意味 着不同的策略组合或结果下各博弈方的得益之和一般是不相同的. 5. 博弈论:博弈论是研究决策主体的行动发生直接相互作用时候的决策以及这种决策的均 衡问题的,也就是说,当一个主体,好比一个人或一个企业的选择受到其它人或 其它企业选择的影响,而且反过来影响其它人、其它企业选择时的决策问题和均 衡问题. 6. 战略:也称策略,是参与人在给定信息集的情况下的行动规则,它规定参与人 在何时采用哪种行动;也是一种“相机行动方案”,指导参与人如何对其它参 与人的行动做出反应. 7. 均衡:是指所有参与人的最优的战略组合,在均衡战略组合下,任何参与人没有改变 自己战略的动机,即如果改变战略,自己的支付不会得到增加或效用得到改善. 8. 均衡路径:一个纳什均衡结果在博弈树中所形成的路径. 9. 占优均衡:在一个博弈中,如果每个参与人都有“占优战略”存在,那么每个参与人的 占优战略的组合就称为“占优战略均衡”,并且是唯一的“占优 战略均衡”.(一个战略称为某个参与人的“占优战略”是指不管其他参与人选择 什么战略,这个战略都是该参与人的最好的战略.) 10. 重复剔除劣战略的占优均衡:对于一个理性的参与人,是不可能选择“劣策

1“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1. 博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2. 博弈中通常包括下面的内容,除了()。 A. 局中人 B. 占优战略均衡 C. 策略 D. 支付 3. 在具有占优战略均衡的囚徒困境博弈中()。 A. 只有一个囚徒会坦白 B. 两个囚徒都没有坦白 C. 两个囚徒都会坦白 D. 任何坦白都被法庭否决了 4. 在多次重复的双头博弈中,每一个博弈者努力()。 A. 使行业的总利润达到最大 B. 使另一个博弈者的利润最小 C. 使其市场份额最大 D. 使其利润最大 5. 一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6. 对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A. 囚徒困境式的均衡 B. 一报还一报的均衡 C. 占优策略均衡 D. 激发战略均衡 7. 如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一 期违约,博弈者在现期也违约的策略称为()。 A. 一报还一报的策略 B. 激发策略 C. 双头策略 D. 主导企业策略 8. 在囚徒困境的博弈中,合作策略会导致()。 A. 博弈双方都获胜 B. 博弈双方都失败

C. 使得先采取行动者获胜 D. 使得后采取行动者获胜 9. 在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B. 当一个寡头行业面对的是重复博弈时 C. 当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10. 一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A. 主导策略 B. 激发策略 C. 一报还一报策略 D. 主导策略 11. 关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12. 下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的

博弈论复习题及答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。 (V) 子博弈精炼纳什均衡不是一个纳什均衡。(X )若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。() 博弈中知道越多的一方越有利。(X)纳什均衡一定是上策均衡。(X ) 上策均衡一定是纳什均衡。(V) 在一个博弈中只可能存在一个纳什均衡。(X)在一个博弈中博弈方可以有很多个。(V)在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(V ) 在博弈中纳什均衡是博弈双方能获得的最好结果。(X )在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(X ) 上策均衡是帕累托最优的均衡。(X)因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (X)在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(X) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (X) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(V )不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(V )多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(V ) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论复习题(1)

1.设一四阶段两博弈方之间的动态博弈如图所示。试找出全部子博弈,讨论该博弈中的可信性问题,求子博弈完美纳什均衡策略组合和博弈的结果。 2.假设一个工会是一个寡头垄断市场中所有企业唯一的劳动力供给者,就像汽车工人联合会对于通用、福特、克莱斯勒等大的汽车厂家。令博弈各方行动的时间顺序如下:(1)工会确定单一的工资要求w ,适用于所有的企业(2)每家企业i 了解到w ,然后同时分别选择各自的雇佣水平L i ;(3)工会的收益为(w-w α)L ,其中w α为工会成员到另外的行业谋职可取得的收入,L=L 1+…L n 为工会在本行业企业的总就业水平;企业i 的利润为π(w ,L i ),其中决定企业i 利润水 A B B A h g (2,4) (8,5) (3,6) (4,3) b (5,3) a c d f e

平的要素如下。 所有企业都有同样的生产函数:产出等于劳动力q i=L i。市场总产出为Q=q1+…+q n时的市场出清价格为p(Q)=a-Q。为使问题简化,假设企业除了工资支出外没有另外的资本。求出此博弈的子博弈精炼解。在子博弈精炼解中,企业的数量是如何影响工会的效应的?为什么?(吉本斯2.2节 2.7答案) 3.下图所示的同时行动博弈重复进行两次,并且第二阶段开始前双方可观测到第一阶段的结果,不考虑贴现因素。变量x大于4,因而(4,4)在一次性博弈中并不是一个均衡收益。对什么样的x,(双方参与者同时采取)下述战略是一个子博弈完美纳什均衡? 第一阶段选择Q i,如果第一阶段的结果为(Q1,Q2),在第二阶段选择P i;如果第一阶段的结果为(y,Q2),其中y≠Q1,第二阶段

博弈论期末复习题

博弈论期末复习题

一、支付矩阵 1、试给出下述战略式表述博弈的纳什均衡 B A L R U 1,3 2,5 D 4,1 6,2 解:由划线解得知有一个纯战略均衡(R D,)再看看它是否有混合战略均衡 设B以) 1, (γ γ-玩混合战略,则有 均衡条件: γ γ γ- = - + ⋅ =2 ) 1(2 1 ) (U V A γ γ γ2 6 ) 1(6 4 ) (- = - + ⋅ = D V A γ γ2 6 2- = - 得1 4> = γ,这是不可能的,故无混合战略均衡,只有这一个纯战 略均衡。 2、试将题一中的支付作一修改使其有混合战略均衡 解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。 B L R U 5,6 2,5 2

3 A D 4,1 6,2 将博弈改成上述模型,则 )1(64)1(25γγγγ-+=-+ γγ2632-=+ 得 54=γ 同样,设A 的混合战略为)1,(θθ-,则 )1(25)1(16θθθθ-+=-⋅+ θθ3251+=+ 2 1=θ 于是混合战略均衡为⎭ ⎬⎫⎩⎨⎧⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛51,54,21,21。 二、逆向归纳法 1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡 1 2 1 2

4

5

6 02)4(21=---q q c 得 24)(1 2q c c q --= (2) 代入式(1): 4 3 2123814423 41242123 2421231 2212/32/312/3112 1212 1q q cdc q dc q c q +=⎥ ⎥⎦⎤⎢⎢⎣⎡⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛+--=+--=---=⎰⎰⎰ 得11=q 代入式(2): 23)(2 c c q -= 若1=c ,则121==q q 121==ππ 若信息是完全的且1=c ,则古诺博弈均衡为15321<==q q ,125272 1>==ππ。 这说明信息不完全带来的高效率。 2、完美信息动态博弈。会用策略式表达、扩展式表达。用方框找纳什均衡,用树找子博弈精炼均衡。讲理由,看例题。

相关主题
文本预览
相关文档 最新文档