当前位置:文档之家› “博弈论”习题和参考答案与解析

“博弈论”习题和参考答案与解析

《博弈论》习题

一、单项选择题

1.博弈论中,局中人从一个博弈中得到的结果常被称为()。

A. 效用

B. 支付

C. 决策

D. 利润

2.博弈中通常包括下面的内容,除了()。

A.局中人

B.占优战略均衡

C.策略

D.支付

3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有一个囚徒会坦白

B.两个囚徒都没有坦白

C.两个囚徒都会坦白

D.任何坦白都被法庭否决了

4.在多次重复的双头博弈中,每一个博弈者努力()。

A.使行业的总利润达到最大

B.使另一个博弈者的利润最小

C.使其市场份额最大

D.使其利润最大

5.一个博弈中,直接决定局中人支付的因素是()。

A. 策略组合

B. 策略

C. 信息

D. 行动

6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时

的博弈具有()。

A.囚徒困境式的均衡

B.一报还一报的均衡

C.占优策略均衡

D.激发战略均衡

7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。

A.一报还一报的策略

B.激发策略

C.双头策略

D.主导企业策略

8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双方都获胜

B.博弈双方都失败

C.使得先采取行动者获胜

D.使得后采取行动者获胜

9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时

B.当一个寡头行业面对的是重复博弈时

C.当一个垄断行业被迫重复地与一个寡头行业博弈时

D. 当一个寡头行业进行一次博弈时

10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。

A.主导策略

B.激发策略

C.一报还一报策略

D.主导策略

11.关于策略式博弈,正确的说法是()。

A. 策略式博弈无法刻划动态博弈

B. 策略式博弈无法表明行动顺序

C. 策略式博弈更容易求解

D. 策略式博弈就是一个支付矩阵

12.下列关于策略的叙述哪个是错误的():

A. 策略是局中人选择的一套行动计划;

B. 参与博弈的每一个局中人都有若干个策略;

C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;

D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

13. 囚徒困境说明():

A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果;

B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡;

C. 双方都依照自己的利益行事,结果一方赢,一方输;

D、每个局中人在做决策时,不需考虑对手的反应

14. 一个博弈中,直接决定局中人损益的因素是():

A. 策略组合

B. 策略

C. 信息

D. 行动

15. 动态博弈参与者在关于博弈过程的信息方面是()

A 不对称的

B 对称的

C 不确定的

D 无序的

16. 古诺模型体现了寡头企业的( )决策模型。

A 成本

B 价格

C 产量

D 质量

17.伯特兰德模型体现了寡头企业()决策模型。

A 成本

B 价格

C 产量

D 质量

18. 用囚徒困境来说明两个寡头企业的情况,说明了:()

A、每个企业在做决策时,不需考虑竞争对手的反应

B、一个企业制定的价格对其它企业没有影响

C、企业为了避免最差的结果,将不能得到更好的结果

D、一个企业制定的产量对其它企业的产量没有影响

19. 子博弈精炼纳什均衡():

A. 是一个一般意义上的纳什均衡;

B. 和纳什均衡没有什么关系;

C. 要求某一策略组合在每一个子博弈上都构成一个纳什均衡;

D. 要求某一策略组合在原博弈上都构成一个纳什均衡。

20. 在一般产品销售市场上,以下哪种原因导致了逆向选择。 ( )

A 产品质量的不确定性

B 私人信息

C 公共信息

D 产品价格

21. 完全信息动态博弈参与者的行动是( )

A 无序的

B 有先后顺序的

C 不确定的

D 因环境改变的

22. 市场交易中普遍存在的讨价还价属于哪种博弈。()

A 完全信息静态博弈

B 完全信息动态博弈

C 不完全信息静态博弈 D不完全信息动态博弈

23.下面哪种模型是一种动态的寡头市场博弈模型()

A 古诺模型

B 伯川德模型

C 斯塔克尔伯格模型 D田忌齐威王赛马

24.博弈方根据一组选定的概率,在两种或两种以上可能行为中随机选择的策略为()

A 纯策略

B 混合策略

C 激发策略 D一报还一报策略

25.影响重复博弈均衡结果的主要因素是()

A 博弈重复的次数

B 信息的完备性

C 支付的大小

D A和B

26.在动态博弈战略行动中,只有当局中人从实施某一威胁所能获得的总收益()不

实施该威胁所获得的总收益时,该威胁才是可信的。

A 大于

B 等于

C 小于

D 以上都有可能

二、判断正误并简要说明理由

1. 纳什均衡一定是上策均衡,上策均衡一定是纳什均衡。

2.在一个博弈中博弈方可以有很多个。

3. 在一个博弈中只可能存在一个纳什均衡。

4. 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。

5. 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。

6.由于两个罪犯只打算犯罪一次,所以被捕后才出现了不合作的问题即囚徒困境。但如果他们打算重复合伙多次,比如说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供。

7. 在博弈中纳什均衡是博弈双方能获得的最好结果。

8. 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

9. 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

10. 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒

都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。

11. 斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润。

12.在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互

制约关系,使重复博弈无法实现更高效率均衡的关键问题。

13. 子博弈精炼纳什均衡不是一个纳什均衡。

14. 零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合

战略纳什均衡。

15.原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:

采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。

16.在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利

的。

三、计算与分析题

1、A、B两企业利用广告进行竞争。若A、B两企业都做广告,在未来销售中,A企业可以获

得20万元利润,B企业可获得8万元利润;若A企业做广告,B 企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A 企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。

(1)画出A、B两企业的损益矩阵。

(2)求纯策略纳什均衡。

2、可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策

略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:

(1)双方都不涨价,各得利润10单位;

(2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;

(3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;

(4)双方都涨价,可口可乐利润140,百事可乐利润35;

画出两企业的损益矩阵求纳什均衡。

3、假定某博弈的报酬矩阵如下:

(1)如果(上,左)是上策均衡,那么,a>?, b>?, g?

(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足?

4、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。

(1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

5、博弈的收益矩阵如下表:

(1)如果(上,左)是占优策略均衡,则a、b、c、d、e、f、g、h之间必然满足哪些关系?(尽量把所有必要的关系式都写出来)

(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足?

(3)如果(上,左)是上策均衡,那么它是否必定是纳什均衡?为什么?

(4)在什么情况下,纯策略纳什均衡不存在?

6、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到;都去按则同时到。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。求(1)各种情况组合扣除成本后的支付矩阵

(2)求纳什均衡。

7、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:

(1)有哪些结果是纳什均衡?

(2)两厂商合作的结果是什么?

8、求出下列博弈的所有纯策略纳什均衡。

9、求出下面博弈的纳什均衡(含纯策略和混合策略)。

10、根据两人博弈的损益矩阵回答问题:

(1)写出两人各自的全部策略。

(2)找出该博弈的全部纯策略纳什均衡。

(3)求出该博弈的混合策略纳什均衡。

11、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍, 市场需求函

数为Q=200-P 。

求:(1)若两个厂商同时决定产量,产量分别是多少?

(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?

(3)用该案例解释囚徒困境。

12、假设双头垄断企业的成本函数分别为:1120Q C =,2222Q C =,市场需求曲线为Q P 2400-=,其中,21Q Q Q +=。

(1)求出古诺(Cournot)均衡情况下的产量、价格和利润,求出各自的反应函数,并图示均衡点。

(2)求出斯塔克博格(Stackelberg)均衡情况下的产量、价格和利润。

(3)说明导致上述两种均衡结果差异的原因。

13.下面的得益矩阵两博弈方之间的一个静态博弈,该博弈有没有纯策略的纳什均衡,博弈的结果是什么?

14. 两个兄弟分一块冰激凌。哥哥先提出一个分割比例,弟弟可以接受或拒绝,接受则按哥

哥的提议分割,若拒绝就自己提出一个比例。但这时候冰激凌已化得只剩1/2了,对弟弟提议的比例哥哥也可以接受或拒绝,若接受则按弟弟的建议分割,若拒绝冰激凌会全部化光。因为兄弟之间不应该做损人不利己的是,因此我们假设接受和拒绝利益相同时兄弟俩都会接受。求该博弈的子博弈完美纳什均衡。

15.如果学生在考试之前全面复习,考好的概率为90%,如果学生只复习一部分重点,则有

50%的概率考好。全面复习花费的时间t1=100 小时,重点复习之需要花费t2=20 小时。

学生的效用函数为:U=W-2e,其中W是考试成绩,有高低两种分数Wh和Wl,e为努力学习的时间。问老师如何才能促使学生全面复习?

16.在下列监工与工人之间的博弈中,试用划线法分析该博弈有无纯策略纳什均衡;如果没有,那么写出混合策略纳什均衡的结果。

17.求解下列博弈的纳什均衡。

18.某人正在打一场官司,不请律师肯定会输,请律师后的结果与律师的努力程度有关。假设当律师努力工作(100小时)时有50%的概率能赢,律师不努力工作(10小时)则只有15%的概率能赢。如果诉讼获胜可得到250万元赔偿,失败则没有赔偿。因为委托方无法监督律师的工作,因此双方约定根据结果付费,赢官司律师可获赔偿金额的10%,

失败则律师一分钱也得不到。如果律师的效用函数为

e

m05

.0

.

,其中

m

是报酬,

e

是努力小时数,且律师有机会成本5万元。求这个博弈的均衡。

四、论述题

1、解释“囚犯困境”,并举商业案例说明。

2、用“小偷与守卫的博弈”说明“激励(监管)悖论”。

《博弈论》习题参考答案

一、单项选择题

1~5 B. B. C. D. A. 6~10 C. A. A. D. C.

11~15. B. C. A. A. C. 16~20 C. B. C. C. B.

21~26. B. B. C. B. D. A.

二、判断正误并简要说明理由

1、F 上策均衡是比纳什均衡更严格的均衡。所以上策均衡一定是纳什均衡,而纳什均衡不一定是上策均衡,

2、T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈

3.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在多个纳什均衡,如性别战。

4.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与

损失之和恒为零,所以双方不存在合作可能性

5.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳

什均衡

6.F 只要两囚犯只打算合作有限次,其最优策略均为招供。比如最后一次合谋,两小偷被抓住了,因为将来没有合作机会了,最优策略均为招供。回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢。依此类推,对于有限次内的任何一次,两小偷均不可能合作。

7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较

大的策略,并不保证结果是最好的。

8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而

减低自己的收益

10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

11.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时

12. .T无限次重复博弈没有结束重复的确定时间;而在有限次重复博弈中,存在最后一次重

复,并且正是有结束重复的确定时间,使重复博弈无法实现更高效率均衡。

13. F 子博弈精炼纳什均衡一定是一个纳什均衡。

14.F零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈

的混合战略纳什均衡。

15.T 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,因此不管是重复有限

次还是无限次,不会和一次性博弈有区别。

16.F 动态博弈是指各博弈方的选择和行动又先后次序的博弈。动态博弈的信息可以是不对

称的。所以策略分为先发制人和。斯塔克伯格博弈揭示“先发制人”更有利,而“后发制人”-----后行动的博弈方可以先观察对方行为后再选择行为反而处于不利境地。

三、计算与分析题

1、(1)

(2)纯策略纳什均衡为(做广告,做广告),(不做广告,不做广告)。

2

价)

3、 (1)如果(上,左)是上策均衡,那么,a>e b>d, gh

(2)如果(上,左)是纳什均衡,a>e b>d,不等式必须满足

4、

5、略

6、

纳什均衡为(按,等)。

7、略

8、纯策略纳什均衡(B ,甲),(A ,丙)

9、

甲 乙 L R U

D

(1)不存在纯策略纳什均衡

(2)设甲选择“U ”的概率为P1,则选择“D ”的概率为1-P1

乙选择“L ”的概率为P2,则选择“R ”的概率为1-P2

对甲而言,最佳策略是按一定的概率选“上”和“下”,使乙选择“左”和“右”的期望值相等

即 P1*8+(1-P1)*0= P1*1+(1-P1)*5

解得 P1=5/12

即(5/12,7/12)按5/12概率选“上”、7/12概率选“下”为甲的混合策略Nash 均衡 对乙而言,最佳策略是按一定的概率选“左”和“右”,使乙选择“上”和“下”的期望值相等

即 P2*5+(1-P2)*0= P2*2+(1-P2)*4

解得 P2=4/7

即(4/7,3/7)按4/7概率选“左”、3/7概率选“右”为乙的混合策略Nash均衡

10、略。

11、见笔记

12、见笔记。

13.

首先,运用严格下策反复消去法的思想,不难发现在博弈方1的策略中,B是相对于T的严格下策。把博弈方1的B策略消去后又可以发现,博弈方2的策略中C是相对于R的严格下策,从而也可以消去。

两个博弈方各消去一个策略后的博弈是如下的两人2×2博弈,已经不存在任何严格下策。再运用划线或箭头法,很容易发现这个2×2博弈有两个纯策略纳什均衡(M,L)和(T,R)。

由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,一次性静态博弈的结果不能肯定。由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可以是4个纯策略组合中的任何一个。

14.

假设哥的方案是S1:1-S1,其中S1是自己的份额,弟的方案是S2:1-S2,S2是哥的份额,那么可用如下的扩展形表示该博弈:

运用逆推归纳法先分析最后一阶段哥的选择。由于只要接受的利益不少于不接受的利益哥就会接受,因此在这个阶段只要弟的方案满足S2/2≥0,也就是S2≥0,哥就会接受,否则不会接受。由于冰激凌的份额不可能是负数,也就是说因为哥不接受弟的方案冰激凌会全部化掉,因此任何方案哥都会接受。

现在回到前一阶段弟的选择。由于弟知道后一阶段哥的选择方法,因此知道如果不接受前一阶段哥提出的比例,自己可以取S2=0,独享此时还未化掉的1/2块冰激凌;如果选择接受前一阶段哥的提议,那么自己将得到1-S1,显然只要1-S1≥1/2,即S1≤1/2,弟就会接受哥的提议。

再回到第一阶段哥的选择。哥清楚后两个阶段双方的选择逻辑和结果,因此他在这一阶段选择S1=1/2,正是能够被弟接受的自己的最大限度份额,超过这个份额将什么都不能得到,因此S1=1/2是最佳选择。

综上,该博弈的子博弈完美纳什均衡是:哥哥开始时就提议按(1/2,1/2)分割,弟弟接受。

15. 本题中老师的调控手段高分和低分的差距。该博弈的扩展形如下:

学生选择全面复习的期望得益是U1=0.9(Wh-200)+ 0.1 (Wl-200 )

重点复习的期望得益是U2=0.5(Wh-40)+ 0.5(Wl-40 )

只有当U1》U2时学生才会选择全面复习。根据U1》U2我们可以算出Wh- Wl》400。这就是老师能有效全面复习需要满足的条件。其实在奖学金与成绩挂钩时,Wh- Wl也可以理解成不同等奖学金的差额。

16.没有纯策略均衡,只有混合策略均衡((0.25,0.75),(0.5,0.5))

17.可以根据画线法求得有唯一纯策略均衡(上,左)

18.参见第15题

四、论述题

1、解释“囚犯困境”,并举商业案例说明。

(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。(2)囚徒困境的策略矩阵表。每个囚徒都有两种策略:坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。

(3)分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都“坦白”。给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。

这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不论对方如何选择,个人的最优选择是坦白。其结果是双方都坦白。

(4)商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。

2、用“小偷与守卫的博弈”说明“激励(监管)悖论”。

(1)假设条件举例:偷窃和防止偷窃是小偷和门卫之间进行博弈的一场游戏。门卫可以不睡觉,或者睡觉。小偷可以采取偷、不偷两种策略。如果小偷知道门卫睡觉,他的最佳选择就是偷;如果门卫不睡觉,他最好还是不偷。对于门卫,如果他知道小偷想偷,他的最佳选择是不睡觉,如果小偷采取不偷,自己最好去睡觉。

(2)小偷与门卫的支付矩阵表(假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住):

(3)分析:通过划线法可知:这个博弈是没有纳什均衡的。门卫不睡觉,小偷不偷,双方都没有收益也没有损失;门卫不睡觉,小偷偷,门卫因为是本职工作得不到奖励,小偷被判刑丧失效用2单位;门卫睡觉,小偷不偷,门卫睡觉的很愉快得到效用2单位,小偷没有收益也没有损失;门卫睡觉,小偷偷,门卫因失职被处分而丧失效用1单位,小偷偷窃成功获得效用1单位。

(4)“激励(监管)悖论”说明:现实中,我们看到,当门卫不睡觉时,偷窃分子便收敛一阵;严打的时期一过,偷窃分子又开始兴风作浪,在不能容忍小偷过分猖狂的时候,门卫不得不再次开始认真。即偷的小偷越多,那么不睡觉的门卫将会越多,偷的小偷越少,不睡觉的门卫将越少;反过来,不睡觉的门卫越多,偷的小偷就越少,不睡觉的门卫越少,偷的小偷就越多。如果偷窃集团倾巢出动,那么门卫的选择也是全部不睡觉,但门卫一旦全部不睡觉,小偷最好选择全部不偷,小偷一旦选择全部不偷,门卫最好全部选择睡觉。

(5)结论:加重对小偷的处罚在长期中并不能抑制偷窃(而只能使门卫偷懒);加重处罚失职门卫恰恰是会降低偷窃发生的概率。这种门卫和小偷的博弈所揭示的,政策目标和政策结果之间的这种意外关系,常被称为“激励的悖论”。

博弈论复习题及答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。() 博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×) 上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论习题及解答

※第一章绪论 §1.2 1. 什么是博弈论?博弈有哪 些基本表示方法?各种表示法 的基本要素是什么?(见教材) 2. 分别用规范式和扩展式表 示下面的博弈。 两个相互竞争的企业考虑同 时推出一种相似的产品。如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。 3. 什么是特征函数? (见教材) 4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子? 原因:个体理性与集体理性的矛盾。 例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡 1. 什么是纳什均衡? (见教材) 2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。 先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。然后用划线法求出该矩阵博弈的纯策略Nash均衡。 3. 求出下面博弈的纳什均衡。 由划线法易知,该矩阵博弈没有纯策略Nash均衡。 由表达式(2.3.13)~(2.3.16)可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1 将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。 解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)} 令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x) 作出三条直线,如下图,图中粗的折线,就是F(x)的图象

“博弈论”习题和参考答案与解析

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双方都获胜 B.博弈双方都失败 C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的

博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题?

博弈论作业和答案解析浙江财经大学张老师作业答案解析

第1 次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企 业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足: W1/2

“博弈论”习题参考附标准答案

“博弈论”习题参考附标准答案博弈论 博弈论是研究人类决策制定和行为选择的一门学科,它涉及到多个参与者之间的冲突和利益博弈。通过分析和建模参与者的决策过程,博弈论可以帮助我们理解和预测各种决策情况,并提供策略和解决方案。本文将介绍几个典型的博弈论习题,并附上标准答案作为参考。 1. 囚徒困境 囚徒困境是博弈论中最著名的问题之一。假设两名囚徒被捕,检察官分别问他们是否承认自己犯罪。如果只有一个人承认犯罪,他会得到从轻判决;如果两人都承认,他们将得到较重的判决;如果两人都否认,那么他们将得到较轻的判决。但是,由于彼此的不信任和利益冲突,囚徒往往会选择自私的策略,即承认犯罪。 这个问题可以用一个博弈矩阵来表示: 囚徒B承认囚徒B否认 囚徒A承认 -5,-5 -10,0 囚徒A否认 0,-10 -1,-1 其中左上角的数字表示囚徒A和B都承认犯罪时的判决结果,右下角的数字表示囚徒A和B都否认犯罪时的判决结果。通过分析博弈矩阵,可以发现最优策略是双方都选择否认犯罪。 2. 纳什均衡

纳什均衡是博弈论的一个重要概念,它指的是参与者在给定其他参 与者策略的情况下,无法通过单方面改变自己策略来获得更好结果的 状态。以两个司机选择路线为例,假设他们可以选择两条路线,每个 司机希望自己的路线时间最短。若两个司机都选择第一条路线,他们 的到达时间相同,这是一个纳什均衡;若一个司机选择第一条路线, 另一个司机选择第二条路线,他们的到达时间将不同,这不是一个纳 什均衡状态。 3. 合作与背叛 合作与背叛是博弈论中经常出现的主题,也是人们日常生活和商业 交易中的重要决策。例如,两个公司可以选择合作开展某项业务,也 可以选择相互竞争。合作可以带来双方共同的利益,但也需要相互信任;而背叛则是一种自私的策略,可以追求个体利益,但可能破坏双 方的合作关系。 4. 平衡策略 在博弈论中,平衡策略指的是使得参与者无法通过改变自己的策略 来达到更好结果的策略选择。在一些特殊的情况下,博弈存在多个平 衡策略。例如,在二人零和游戏中,如果两个参与者都采用最优策略,则可能存在多个平衡策略。 通过上述几个典型的博弈论习题的分析,我们可以看到博弈论在解 决决策问题和分析社会现象中的重要性。博弈论的应用涉及到经济学、管理学、政治学等多个领域。通过理解和应用博弈论,人们可以更好 地预测和解决实际问题,提高决策的质量和效果。

博弈论复习题及答案

可口可乐与百事可乐参与者的价格决策:双方都可以保持价格不变或者提高价格策略;博弈的目标和得失情况体现为利润的多少收益;利润的大小取决于双方的策略组合收益函数;博弈有四种策略组合,其结局是: 1双方都不涨价,各得利润10单位; 2可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; 3可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30; 4双方都涨价,可口可乐利润140,百事可乐利润35; 画出两企业的损益矩阵求纳什均衡; 9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场;如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元;如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元; 1将这一市场用囚徒困境的博弈加以表示; 2解释为什么均衡结果可能是两家公司都选择竞争性策略; 答:1用囚徒困境的博弈表示如下表: 北方航空公司 合作竞争

合作500000,500000 0,900000 新华航空公司 竞争900000,0 60000,60000 2如果新华航空公司选择竞争,则北方航空公司也会选择竞争60000>0;若新华航空公司选择合作,北方航空公司仍会选择竞争900000>500000;若北方航空公司选择竞争,新华航空公司也将选择竞争60000>0;若北方航空公司选择合作,新华航空公司仍会选择竞争900000>0;由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元; 12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润单位:万元由下图的得益矩阵给出: 1有哪些结果是纳什均衡 2两厂商合作的结果是什么 答1低价,高价,高价,低价 2低价,高价 13、A、B两企业利用广告进行竞争;若A、B两企业都做广告,在未来销售中,A 企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B 企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企

博弈论复习题及答案

可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:(1)双方都不涨价,各得利润10单位; (2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)双方都涨价,可口可乐利润140,百事可乐利润35; 画出两企业的损益矩阵求纳什均衡。 9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。 (1)将这一市场用囚徒困境的博弈加以表示。 (2)解释为什么均衡结果可能是两家公司都选择竞争性策略。 答:(1)用囚徒困境的博弈表示如下表: 北方航空公司 合作竞争

合作500000,500000 0,900000 新华航空公司 竞争900000,0 60000,60000 (2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。 12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出: (1)有哪些结果是纳什均衡? (2)两厂商合作的结果是什么? 答(1)(低价,高价),(高价,低价) (2)(低价,高价) 13、A、B两企业利用广告进行竞争。若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;

博弈论总结复习题包括答案

博弈论 题型一:纯策略纳什均衡 1、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按 钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到;都去按则同时到。若大猪先到,大猪吃到 9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示(每格 第一个数字是大猪的得益,第二个数字是小猪的得益): 小猪 按等待 大猪按5, 1 4, 4 等待9, -1 0, 0 求纳什均衡。 在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是 最好选择等待。即不管大猪选择按还是不按,小猪的最佳策略都是等待。也就是说,无论如 何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按 的话还可以有4个单位的收益。所以纳什均衡是(大猪按,小猪等待)。 题型二:混合策略的纳什均衡 2、求出下面博弈的纳什均衡(含纯策略和混合策略)o 乙 T R 由划线法易知,该矩阵博弈没有纯策略Nash均衡。 可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0-i-5-8-6=-9,i—-1

可得混合策略Nash均衡 -- -- (( ,),(4, 3) 9 9 7 7 据说是去年考了的原题! 3、Smith和John玩数字匹配游戏,每个人选择1、2、3,如果数字相同,John 给Smith 3美元,如果不同,Smith给John 1美元。 (1)列出收益矩阵。 (2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少? 答:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳什均衡。 (2) Smith 选(1/3 , 1/3 , 1/3 )的混合概率时, 1 1 1 1 John选1的效用为:U i=-X4 3片一X H--X丄一一 3 3 3 3 John选2的效用为:U 2 =_lx H--1X(- 3>lx L丄 3 3 3 3 John 选3 的效用为:U 3 =—ix 1+-IX 1+—1“_ 3)=-4 3 3 3 3 类似地,John选(1/3 , 1/3 , 1/3 )的混合概率时, Smith选1的效用为:U 1 = J X’虑_1) =4 3 3 3 3 Smith 选2 的效用为:U 2*=4-x( 1 片4 x 3^-lx (- 1)=4 3 3 3 3 Smith选3的效用为:U 3 = ->( -1) +」M丄)+-氐3=4 3 3 3 3 因为Ui U2 Us, U 1 U2 Us ,所以: ■ 1 11 1 1 1 n T u TT i c TT i ,| ----- -------- )是纳什均衡,策略值分别为John: U =一;Smith : U •=—。 L3 33 333 J 3 3

博弈论期末复习题及答案

博弈论期末复习题 8.设古诺模型中有刀家厂商。©为厂商(的产■卫=如+…+孙为市场总 产■/为市场出清价格,且己知P= P(Q) = a- Q(当Q

9・两摞头古诺模型,P(0)=G -Q 竿与上题相同,但两个厂商的 边际成本不同, 分别为c,和s 如果0 Vc <a/2,问纳什均衡 产■各为多少?如果心<c 2<a-t 但2。■则纳什均衡产 ■又为多少? (1)两个厂商的利润函数为: 孤 = 冷―GQ. — (« — g ; — qj)q, — e© 将利润函数对产量求导并令貝为0得: 許=a -町 _ 匚-2q, = 0 解得两个厂商的反应函数为: 务=(d — q, — c t )/2 或具体芻成: *?] — (a —空—门)/2 (12 = (a — g c :)/2 (2)与0 V G < "2时.我们根据上述两个厂商的反应函数. 直接求岀两个厂商的纳什均衡产屋分别为: (3) 当门< 但2门> a +G 时,根据反应函数求出来 的厂商2产试《<0-这倉味着厂商2不会生产,这时厂商1成了 主断厂商,厂商1的最优产宦选择是利润最大化的垄断产杲 6=9・=— 2 ~ 因此这种情况下的纳什均衡为[& — G )/2, 0] 3 不=(100 一虫一車一 qdqi — 2% =托—芳.二座务 7T? == (100 — q }—血—的)阪—加=—―芈 ----------- a 2 分别对g,和如求偏导数并令为0得: Qi u — 2门+化 4

博弈论复习题及答案

作而另一方却选择降低价格,那么合作的厂商获利将为零,竞争厂商将获利900000元。 〔1〕将这一市场用囚徒困境的博弈加以表示。 〔2〕解释为什么均衡结果可能是两家公司都选择竞争性策略。 答:〔1〕用囚徒困境的博弈表示如下表: 〔2〕如果新华航空公司选择竞争,那么北方航空公司也会选择竞争〔60000>0〕;假设新华航空公司选择合作,北方航空公司仍会选择竞争〔900000>500000〕。假设北方航空公司选择竞争,新华航空公司也将选择竞争〔60000>0〕;假设北方航空公司选择合作,新华航空公司仍会选择竞争〔900000>0〕。由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。 12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润〔单位: 万元〕由以下列图的得益矩阵给出: 〔1〕有哪些结果是纳什均衡? 〔2〕两厂商合作的结果是什么? 答〔1〕〔低价,高价〕,〔高价,低价〕 〔2〕〔低价,高价〕 13、A、B两企业利用广告进行竞争。假设A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;假设A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;假设A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;假设A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。 〔1〕画出A、B两企业的支付矩阵。 〔2〕求纳什均衡。 3. 答:〔1〕由题目中所提供的信息,可画出A、B两企业的支付矩阵〔如下表〕。 〔2〕因为这是一个简单的完全信息静态博弈,对于纯策纳什均衡解可运用划横线法求解。 如果A厂商做广告,那么B厂商的最优选择是做广告,因为做广告所获得的利润8大于不做广告获得的利润2,故在8下面划一横线。如果A厂商不做广告,那么B厂商的最优选择也是做广告,因为做广告获得的利润为12,而不做广告的利润为6,故在12下面划一横线。 如果B厂商做广告,那么A厂商的最优选择是做广告,因为做广告获得的利润20大于不做广告所获得的利润10,故在20下面划一横线。如果B厂商不做广告,A厂商的最优选择是不做广告,因为不做广告获得的利润30大于做广告所获得的利润25,故在30下面划一横线。 在此题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是A、B两厂商都做广告。

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 1、囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 2、子博弈精炼纳什均衡不是一个纳什均衡。(×) 3、若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。() 4、博弈中知道越多的一方越有利。(×) 5、纳什均衡一定是上策均衡。(×) 6、上策均衡一定是纳什均衡。(√) 7、在一个博弈中只可能存在一个纳什均衡。(×) 8、在一个博弈中博弈方可以有很多个。(√) 9、在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 10、在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 11、在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×) 12、上策均衡是帕累托最优的均衡。(×) 13、因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。(×) 14、在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 15、囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果, 是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。(×) 16、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√) 17、不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的 有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复 博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 18、多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两 阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√)19、如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么 可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论复习题及答案

博弈论 2、可口可乐及百事可乐〔参及者〕的价格决策:双方都可以保持价格不变或者提高价格〔策略〕;博弈的目标和得失情况表达为利润的多少〔收益〕;利润的大小取决于双方的策略组合〔收益函数〕;博弈有四种策略组合,其结局是: 〔1〕如果双方都不涨价,各得利润10单位; 〔2〕如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; 〔3〕如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30; 〔4〕如果双方都涨价,可口可乐利润140,百事可乐利润35; 求纳什均衡。 博弈的稳定状态有两个:都不涨价或者都涨价〔均衡〕,均衡称为博弈的解。 3、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供给的按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的本钱。谁去按按纽那么谁后到;都去按那么同时到。假设大猪先到,大猪吃到9个单位,小猪吃到一个单位;假设同时到,大猪吃7个单位,小猪吃3个单位;假设小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除本钱后的支付矩阵可如下表示〔每格第一个数字是大猪的得益,第二个数字是小猪的得益〕: 小猪 按等待 大猪按 5,1 4,4 等待 9,-1 0,0 求纳什均衡。 在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。即不管大猪选择按还是不按,小猪的最正确策略都是等待。也就是说,无论如何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。所以纳什均衡是〔大猪按,小猪等待〕。 4、根据两人博弈的支付矩阵答复以下问题: a b A B (1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈〔6分〕 (2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。 (3)求出该博弈的混合策略纳什均衡。〔7分〕 (1)策略 甲:AB 乙:ab 博弈树〔草图如下: (2)Pure NE (A, a); (B, b) 都是Pareto有效,仅(B, b)是K-H有效。

“博弈论”习题及参考答案

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

A 纯策略 B 混合策略 C 激发策略 D一报还一报策略 25.影响重复博弈均衡结果的主要因素是() A 博弈重复的次数 B 信息的完备性 C 支付的大小 D A和B 26.在动态博弈战略行动中,只有当局中人从实施某一威胁所能获得的总收益()不 实施该威胁所获得的总收益时,该威胁才是可信的。 A 大于 B 等于 C 小于 D 以上都有可能 二、判断正误并简要说明理由 1. 纳什均衡一定是上策均衡,上策均衡一定是纳什均衡。 2.在一个博弈中博弈方可以有很多个。 3. 在一个博弈中只可能存在一个纳什均衡。 4. 因为零和博弈中博弈方之间关系都是竞争性 的、对立的,因此零和博弈就是非合作博弈。 5. 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 6.由于两个罪犯只打算犯罪一次,所以被捕后才出现了不合作的问题即囚徒困境。但如果他们打算重复合伙多次,比如说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供。

博弈论复习题及答案

博弈论 判断题〔每题1分,共15分〕 囚徒困境说明个人的理性选择不一定是集体的理性选择。〔√〕 子博弈精炼纳什均衡不是一个纳什均衡。〔×〕 假设一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。〔〕博弈中知道越多的一方越有利。〔×〕 纳什均衡一定是上策均衡。〔×〕 上策均衡一定是纳什均衡。〔√〕 在一个博弈中只可能存在一个纳什均衡。〔×〕 在一个博弈中博弈方可以有很多个。〔√〕 在一个博弈中如果存在多个纳什均衡那么不存在上策均衡。〔√〕 在博弈中纳什均衡是博弈双方能获得的最好结果。〔×〕 在博弈中如果某博弈方改变策略后得益增加那么另一博弈方得益减少。〔×〕上策均衡是帕累托最优的均衡。〔×〕 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 〔×〕 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。〔×〕 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。〔×〕 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。〔√〕不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。〔√〕 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。〔√〕 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能〔但不必〕存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

相关主题
文本预览
相关文档 最新文档