当前位置:文档之家› 博弈论复习题及答案

博弈论复习题及答案

博弈论复习题及答案
博弈论复习题及答案

博弈论

2、可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:

(1)如果双方都不涨价,各得利润10单位;

(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;

(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;

(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;

求纳什均衡。

博弈的稳定状态有两个:都不涨价或者都涨价(均衡),均衡称为博弈的解。

3、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到;都去按则同时到。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益):

小猪

按等待

大猪按 5,1 4,4

等待 9,-1 0,0

求纳什均衡。

在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。即不管大猪选择按还是不按,小猪的最佳策略都是等待。也就是说,无论如何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。所以纳什均衡是(大猪按,小猪等待)。

4、根据两人博弈的支付矩阵回答问题:

a b

A

B

(1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈(6分)

(2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。

(3)求出该博弈的混合策略纳什均衡。(7分)

(1)策略

甲:AB

乙:ab

博弈树(草图如下:

(2)Pure NE (A, a); (B, b)

都是Pareto 有效,仅(B, b)是K-H有效。 (3)Mixed NE ((2/5, 3/5); (2/3, 1/3))

5、用反应函数法求出下列博弈的所有纯战略纳什均衡。 参与人2

a b c d A

参与人1

B C

D

解答:

纯策略纳什均衡为(B ,a )与(A ,c )

分析过程:设两个参与人的行动分别为12a a 和,

player1的反应函数221222,,(),B a a B a b

R a A a c

C a d =??

=?=?

=??=?如果如果如果或者D,如果

player2的反应函数112111

,,(),D c a A a a B

R a c a C c a =??

=?=?=??=?如果如果如果,如果

交点为(B ,a )与(A ,c ),因此纯策略纳什均衡为(B ,a )与(A ,c )。

6、(entry deterrence 市场威慑)考虑下面一个动态博弈:首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。

.

左图:温柔型 右图:残酷型

(1) 找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均衡(12分) (2) 已有企业为温柔型的概率至少多少时,新企业才愿意进入(8分)

(1) 温柔 NE (in, accommodate) 和 (out, fight)。 SPNE 为(in, accommodate)

残酷 NE (out, fight). SPNE 同理 (2)

2010(1)0p p -->= 1/3p >=得到

8、博弈方1 和博弈方 2就如何分 10,000 元钱进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额 A 和 B ,0≤A ,B ≤10,000。如果 A+B ≤10,000,则两博弈方的要求得到满足,即分别得 A 和 B ,但如果 A+B>10,000,则该笔钱就没收。问该博弈的纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额?为什么?

答十、纳什均衡有无数个。最可能的结果是(5000,5000)这个聚点均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。 (1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。 答:(1)用囚徒困境的博弈表示如下表:

(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000

元。

12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位: 万元)由下图的得益矩阵给出:

-10,25)

10,20)

20,30)

-10,0)

(1)有哪些结果是纳什均衡? (2)两厂商合作的结果是什么?

答(1)(低价,高价),(高价,低价) (2)(低价,高价)

13、A 、B 两企业利用广告进行竞争。若A 、B 两企业都做广告,在未来销售中,A 企业可以获得20万元利润,B 企业可获得8万元利润;若A 企业做广告,B 企业不做广告,A 企业可获得25万元利润,B 企业可获得2万元利润;若A 企业不做广告,B 企业做广告,A 企业可获得10万元利润,B 企业可获得12万元利润;若A 、B 两企业都不做广告,A 企业可获得30万元利润,B 企业可获得6万元利润。 (1)画出A 、B 两企业的支付矩阵。

(2)求纳什均衡。

3. 答:(1)由题目中所提供的信息,可画出A 、B 两企业的支付矩阵(如下表)。

(2)因为这是一个简单的完全信息静态博弈,对于纯策纳什均衡解可运用划横线法求解。

如果A 厂商做广告,则B 厂商的最优选择是做广告,因为做广告所获得的利润8大于不做广告获得的利润2,故在8下面划一横线。如果A 厂商不做广告,则B 厂商的最优选择也是做广告,因为做广告获得的利润为12,而不做广告的利润为6,故在12下面划一横线。

如果B 厂商做广告,则A 厂商的最优选择是做广告,因为做广告获得的利润20大于不做广告所获得的利润10,故在20下面划一横线。如果B 厂商不做广告,A 厂商的最优选择是不做广告,因为不做广告获得的利润30大于做广告所获得的利润25,故在30下面划一横线。

在本题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是A 、B 两厂商都做广告。

15、求出下面博弈的纳什均衡(含纯策略和混合策略)。

L R

U D

由划线法易知,该矩阵博弈没有纯策略Nash 均衡。 可得如下不等式组

Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1

可得混合策略Nash 均衡((

9891,),(7

374,)

16、 某产品市场上有两个厂商,各自都可以选择高质量,还是低质量。相应的利润由如下得益矩阵给出: (1) 该博弈是否存在纳什均衡?如果存在的话,哪些结果是纳什均衡?

参考答案:

由划线法可知,该矩阵博弈有两个纯策略Nash 均衡,即(低质量, 高质量), (高质量,低质量)。

乙企业

高质量 低质量

甲企业

高质量 低质量

该矩阵博弈还有一个混合的纳什均衡

Q=a+d-b-c= -970,q=d-b= -120,R= -1380,r= -630,可得138

63

y ,9712x =

= 因此该问题的混合纳什均衡为))138

75

,13863(),9785,9712((。

17、甲、乙两企业分属两个国家,在开发某种新产品方面有如下收益矩阵表示的博弈关系。试求出该博弈的纳什均衡。如果乙企业所在国政府想保护本国企业利益,可以采取什么措施?

乙企业 开发 不开发

甲企业

开发 不开发

解:用划线法找出问题的纯策略纳什均衡点。

??

????--0,0100,00,10010,10 所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。 该博弈还有一个混合的纳什均衡((

111,1110),(11

1

,1110))。 如果乙企业所在国政府对企业开发新产品补贴a 个单位,则收益矩阵变为:

??

????++--0,0a 100,00,100a 10,10,要使(不

开发,开发)成为该博弈的唯一纳什均衡点,只需a>10。此时乙企业的收益为100+a 。

18、博弈的收益矩阵如下表:

(1)如果(上,左)是占优策略均衡,则a 、b 、c 、d 、e 、f 、g 、h 之间必然满足哪些关系?(尽量把所有必要的关系式都写出来)

(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足? (3)如果(上,左)是占优策略均衡,那么它是否必定是纳什均衡?为什么?

(4)在什么情况下,纯战略纳什均衡不存在?

答:(1)e a >,g c >,d b >,h f >。本题另外一个思考角度是从占优策略均衡的定义出发。对乙而言,占优策略为),(),(h d f b >;而对甲而言,占优策略为),(),(g e c a >。综合起来可得到所需结论。

(2)纳什均衡只需满足:甲选上的策略时,d b >,同时乙选左的策略时,e a >。故本题中纳什均衡的条件为:d b >,e a >。

(3)占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。 (4)当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。

19、Smith 和John 玩数字匹配游戏,每个人选择1、2、3,如果数字相同, John 给Smith 3美元,如果不同,Smith 给John 1美元。 (1)列出收益矩阵。

(2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少? 答:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳什均衡。

(2)Smith 选(1/3,1/3,1/3)的混合概率时, John 选1的效用为:31131131)3(311-=?+?+-?=U John 选2的效用为:31131)3(311312-=?+-?+?=U John 选3的效用为:31)3(311311313-=-?+?+?=

U 类似地,John 选(1/3,1/3,1/3)的混合概率时,

Smith 选1的效用为:31)1(31)1(31331'1

=-?+-?+?=U Smith 选2的效用为:31)1(31331)1(31'2

=-?+?+-?=U Smith 选3的效用为:3

1331)1(31)1(31'3

=?+-?+-?=U 因为321U U U ==,'3

'2'1U U U ==,所以: ??

????)31,31,31(),31,31,31(是纳什均衡,策略值分别为John :31-=U ;Smith :31'

=U 。

20、假设双头垄断企业的成本函数分别为:1120Q C =,2

222Q C =,市场需求曲线为Q P 2400-=,其

中,21Q Q Q +=。

(1)求出古诺(Cournot )均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点。

(2)求出斯塔克博格(Stackelberg )均衡情况下的产量、价格和利润,并以图形表示。

(3)说明导致上述两种均衡结果差异的原因。 答:(1)对于垄断企业1来说:

2

19020)](2400m ax[211

121Q Q Q Q Q Q -=

?-+-

这是垄断企业1的反应函数。

其等利润曲线为:21211122380

Q Q Q Q --=π 对垄断企业2来说:

4

502)](2400m ax[122

2

221Q Q Q Q Q Q -

=?-+-

这是垄断企业2的反应函数。

其等利润曲线为:2

2212242400Q Q Q Q --=π

在达到均衡时,有:

???==??

?? ??

--=308024501902

1

11Q Q Q Q 均衡时的价格为:180)3080(2400=+?-=P

两垄断企业的利润分别为:

12800802308028038021=?-??-?=π 3600304308023040022=?-??-?=π

均衡点可图示为:

(2)当垄断企业1为领导者时,企业2视企业1的产量为既定,其反应函数为:

4/5012Q Q -=

则企业1的问题可简化为:

???==?-????????? ??

-+-3

/803/280204502400max 21

1

111Q Q Q Q Q Q

均衡时价格为:1603803

2802400=???

??+-=P 利润为:3/392001=π,9/256002=π

该均衡可用下图表示:

企业2领先时可依此类推。

(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。而企业2获得的利润较少。这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势”

21、在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q 1-q 2-q 3,这里q i 是企业i 的产量。每一企业生产的单位成本为常数c 。三企业决定各自产量的顺序如下:(1)企业1首先选择q 1≥0;(2)企业2和企业3观察到q 1,然后同时分别选择q 2和q 3。试解出该博弈的子博弈完美纳什均衡。

答:该博弈分为两个阶段,第一阶段企业1选择产量q 1,第二阶段企业2和3观测到q 1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。

(1)假设企业1已选定产量q 1,先进行第二阶段的计算。设企业2,3的利润函数分别为:

223212cq q )q q q a (----=π 323213cq q )q q q a (----=π

由于两企业均要追求利润最大,故对以上两式分别求一阶条件:

023212

2

=----=??c q q q a q π (1)

0c q 2q q a q 3213

3

=----=?π? (2) 求解(1)、(2)组成的方程组有:

3

c

q a q q 1*

3*2--=

= (3) (2)现进行第一阶段的博弈分析: 对与企业1,其利润函数为;

113211cq q )q q q a (----=π 将(3)代入可得:

3

)

c q a (q 111--=

π (4)

式(4)对q 1求导:

0c q 2a q 11

1

=--=?π? 解得:

)c a (2

1

q *1-=

(5) 此时,2*

1)c a (12

1

-=

π (3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:

)c a (21q *1-=

,)c a (6

1q q *3*2-==

25、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍, 市场需求函数为Q=200-P 。 求(1)若两个厂商同时决定产量,产量分别是多少?

(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?

答:(1)分别求反应函数,180-2Q1-Q2=0,180-Q1-2Q2=0,Q1=Q2=60 (2)200-2Q=20,Q=90,Q1=Q2=45

26、一个工人给一个老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于 50 元的负效用,老板想克扣工资则总有借口扣掉60 元工资,工人不偷懒老板有 150 元产出,而工人偷懒时老板只有 80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道。请问:

(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示 该博弈并作简单分析。

(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示该博 弈并作简单分析。

(1)完全信息动态博弈。

博弈结果应该是工人偷懒,老板克扣。

(2)完全信息静态博弈,结果仍然是工人偷懒,老板克扣。

27、举一个你在现实生活中遇到的囚犯两难困境的例子。

答:在校园的人行道交叉路口,无需红绿灯。现在两人分别骑车从东西方向和南北方向通过路口。若同时往前冲,必定相撞,各自支付为(-2,-2);若同时停下,都不能按时前进,支付为(0,0);若一人前进一人停下,支付为(2,0)或(0,2)。相应的策略和支付矩阵如下表。

28、给定两家酿酒企业A、B的收益矩阵如下表:

表中每组数字前面一个表示B企业的收益,后一个数字表示B企业的收益。

(1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡?

(2)存在帕累托改进吗?如果存在,在什么条件下可以实现?福利增量是多少?

(3)如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡?如何改变上述A、B企业的收益才能使该博弈不存在均衡?

答:(1)有两个纳什均衡,即(啤酒,白酒)、(白酒,啤酒),都是纳什均衡而不是占优策略均衡。

(2)显然,(白酒,啤酒)是最佳均衡,此时双方均获得其最大收益。若均衡解为(啤酒,白酒),则存在帕累托改善的可能。方法是双方沟通,共同做出理性选择,也可由一方向另一方支付报酬。福利由800+900变为900+1000,增量为200。

(3)如将(啤酒,白酒)支付改为(1000,1100),则(啤酒,白酒)就成为占优策略均衡。比如将(啤酒,白酒)支付改为(800,500),将(白酒,啤酒)支付改为(900,500),则该博弈就不存在任何占优策略均衡或纳什均衡。

30、在纳税检查的博弈中,假设A 为应纳税款,C 为检查成本,F 是偷税罚款,且C

(1)写出支付矩阵。 (2)分析混合策略纳什均衡。 答:(1)该博弈的支付矩阵如下表:

(2)先分析税收检查边际:因为S 为税务机关检查的概率,E 为纳税人逃税的概率。给定E ,税收机关选择检查与否的期望收益为:

C A EF E C A E F C A E K -+=--++-=)1)(()(),1(

)1()1(0),0(E A E A E E K -+-+?=

解),0(),1(E K E K =,得:)/(F A C E +=。

如果纳税人逃税概率小于E ,税收机关的最优决策是不检查,否则是检查。 再分析逃税边际:给定S ,纳税人选择逃税与否的期望收益是:

S F A S S F A S K )()1(0)()1,(+-=-?+--=

A S A AS S K -=--+-=)1)(()0,(

解)0,()1,(S K S K =,得:)/(F A A S +=。即如果税收机关检查的概率小于S ,纳税人的最优选择是逃税,否则是交税。

因此,混合纳什均衡是(S ,E ),即税收机关以S 的概率查税,而纳税人以E 的概率逃税。

31、判断下列说法正确:

(1)斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润。

(2)由于两个罪犯只打算犯罪一次,所以被捕后才出现了不合作的问题即囚徒困境。但如果他们打算重复合伙多次,比如说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供。

答:(1)正确。在斯塔克博格模型中,领导者可以根据跟随者的反应曲线来制定自己的最优产量。其利润一定不会小于古诺均衡下的利润,否则,领导者将采取古诺博弈中双方同时行动的策略而获得古诺均衡的利润。

(2)错误。只要两囚犯只打算合作有限次,其最优策略均为招供。比如最后一次合谋,两小偷被抓住了,因为将来没有合作机会了,最优策略均为招供。回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢。依此类推,对于有限次内的任何一次,两小偷均不可能合作。

34、假设古诺的双寡头模型中双寡头面临如下一条线性需求曲线:

P=30-Q

其中Q 为两厂商的总产量,即Q=Q 1+Q 2。

再假设边际成本为零,即 MC 1=MC 2=0

解释并讨论此例的纳斯均衡,为什么其均衡是一种囚徒困境。

厂商1的总收益TR 1由下式给出: 22

12

1111Q Q Q Q 30Q )Q 30(PQ TR --=-==

厂商1的边际收益MR1为:

MR1=30-2Q1-Q2

利用利润最大化条件MR1=MC1=0,得厂商1的反应函数(reaction function)或反应曲线为:

Q1=15-0.5Q2(6-1)

同理可得厂商2的反应曲线为:

Q2=15-0.5Q1(6-2)

均衡产量水平就是两反应曲线交点Q1和Q2的值,即方程组6-1和6-2的解。可以求得古诺均衡时的均衡产量水平为:Q1=Q2=10。

因此,在本例中,两个寡头的总产量Q为Q1+Q2=20,均衡价格为P=30-Q=10。

刚才我们讨论了两寡头厂商相互竞争时的均衡产量。现在我们放松第(6)条不能串谋的假设,假定两寡头可以串谋。它们能共同确定产量以使总利润最大化。

这时,两厂商的总收益TR为:

TR=PQ=(30-Q)Q=30Q-Q2

其边际收益MR为:

MR=30-2Q

根据利润最大化条件MR=MC=0,可以求得当Q=15时总利润最大。如果两厂商同意平分利润,每个寡头厂商将各生产总产量的一半,即Q1=Q2=7.5。其实,任何相加为15的产量Q1和Q2的组合都使总利润最大化,因此,把Q1+Q2=15称为契约曲线,而Q1=Q2=7.5是契约曲线上的一个点。

我们还可以求得当价格等于边际成本时,Q1=Q2=15,各厂商的利润为零。

35、两家电视台竞争周末黄金时段晚8点到10点的收视率,可选择把较好的节目放在前面还是后面。他们决

策的不同组合导致收视率如下:

(1)如果两家是同时决策,有纳什均衡吗?

有(前面,后面)

(2)如果双方采用规避风险的策略,均衡的结果是什么?

此题应用的思想是最大最小收益法:

也就是说,在对手采取策略时,所获得的最小收益中的最大值。

电视台1:对方采取前面战略的最小收益为18

对方采取后面战略的最小收益为16

固电视台1 会选择收益为18的战略——前面

电视台2:前面的策略是一个优超策略——前面

策略均衡为(前面,前面)

(3)如果电视台1先选择,结果有什么?若电视台2先选择呢?

(4)如果两家谈判合作,电视台1许诺将好节目放在前面,这许诺可信吗?结果能是什么? 电视台1 许诺将好节目放在前面的许诺不可信。 因为电视台2,前面为占优策略,

而在电视台2 ,选择前面的时候,电视台1 选择后面的收益要大于前面的收益。 所以,最终结果为(前面,后面)

36、如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。试问δ应满足什么条件,才存在子博弈完美纳什均衡?

参考答案:

由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白),均衡结果为(1,1),采用触发策略,局中人i 的策略组合s 的最好反应支付)s ,s (P m ax )s (i i i S s i i

i -∈=φ=5,P i (s*)=4,P i (s c

)=1。若存在子博弈完美纳什均衡,

必须满足:4

11545)s (P )s ()s (P )s (c i *i *i *i =--=-φ-φ≥δ,即只有当贴现因子δ>1/4时,才存在子博弈完美纳什均衡。

37、在Bertrand 价格博弈中,假定有n 个生产企业,需求函数为P=a-Q ,其中P 是市场价格,Q 是n 个生产企业的总供给量。假定博弈重复无穷多次,每次的价格都立即被观测到,企业使用“触发策略”(一旦某个企业选择垄断价格,则执行“冷酷策略”)。求使垄断价格可以作为完美均衡结果出现的最低贴现因子δ是多少。并请解释δ与n 的关系。 分析:此题可分解为3个步骤

(1)n 个企业合作,产量总和为垄断产量,价格为垄断价格,然后平分利润。

(2)其中一个企业采取欺骗手段降价,那个这家企业就占有的全部市场,获得垄断利润 (3)其他企业触发战略,将价格降到等于边际成本,所有的企业利润为零。 参考答案:

(1)设每个企业的边际成本为c ,固定成本为0 P=a-Q

TR=P*Q=(a-Q)*Q MR=a-2Q 因为:MR=MC a-2Q=c 则:Q=(a-c)/2 P=(a+c)/2

π=(P-c)*Q=(a-c)2/4 每家企业的利润为(a-c)2/4n

(2)假设A 企业自主降价,虽然只是微小的价格调整,但足以占领整个市场 ,获得所有的垄断利润——(a-c)2/4

(3)其他企业在下一期采取冷酷策略,使得所有企业的利润为0 考虑:

A 企业不降价: (a-c)2/4n , (a-c)2/4n , ……

A 企业降价: (a-c)2/4, 0, ……

使垄断价格可以作为完美均衡结果,就要使得不降价的贴现值大于等于降价的贴现值。 设贴现因子为δ

A 不降价的贴现值: [(a-c)2/4n][1/(1- δ)] A 降价的现值: (a-c)2/4

于是:[(a-c)2/4n][1/(1- δ)]≥ (a-c)2/4 解得: δ≥1-1/n

38、假设某劳动市场为完全竞争市场,其供求函数如下: S L

:W=120+2L D L

:W=360-L

已知某厂商(在完全竞争市场下)的生产函数为 f(L,K)=10L 0.5K 0.5

(K=100)

且其产品的需求与供给函数分别为

论述题(每小题20分,共20分)

解释“囚犯困境”,并举商业案例说明。

囚徒困境是博弈论里最著名的例子之一,几乎所有的博弈论著作中都要讨论这个例子。这个例子是这样的:两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,则很难对他们提起刑事诉讼,因而两囚徒可以期望被从轻发落入狱2年;另一方面,如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。表6-2给出了囚徒困境的策略式表述。这里,每个囚徒都有两种策略:坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。(注意,这里的得益是负值。)

表6-2 囚徒困境

在囚徒困境这个模型中,纳什均衡就是双方都坦白,给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。而且这里双方都坦白不仅是纳什均衡,而且是一个上策(dominant strategy)均衡,即不论对方如何选择,个人的最优选择是坦白。因为如果乙不坦白,甲坦白的话就被轻判1年,不坦白的话就判2年,坦白比不坦白要好;如果乙坦白,甲坦白的话判5年,不坦白的话判10年,所以,坦白仍然比不坦白要好。这样,坦白就是甲的上策,当然也是乙的上策。其结果是双方都坦白。这个组合是纳什均衡。

寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。

解释“智猪博弈(boxed pigs)”,并举商业案例说明。

智猪博弈的例子讲的是:猪圈里有一头大猪和一头小猪,猪圈的一头有一个猪食槽,另一头安装一个按扭,控制着猪食的供应。每按一下按扭会有10个单位的猪食进槽,但谁按按扭谁就要付2个单位的成本并且晚到猪食槽。若大猪先到猪食槽,大猪吃到9个单位,小猪只能吃到1个单位;若小猪先到猪食槽,大猪吃到6个单位,小猪吃4个单位;若同时到,大猪吃到7个单位,小猪只能吃3个单位。表6-3列出了对应于不同策略组合的得益水平。例如,表中第一格表示大猪小猪同时按按扭,从而同时走到猪食槽,大猪吃7个,小猪吃3个,除去2个单位成本,得益分别为5和1。

表6-3 智猪博弈

从表6-3可以看到,对于小猪来说,如果大猪按,它则不按更好;如果大猪不按,它不按也更好,所以,不论大猪按还是不按,它的最优策略都是不按。给定小猪不按,大猪的最优选择只能是按。所以,纳什均衡就是大猪按,小猪不按,各得4个单位猪食。

市场中的大企业与小企业之间的关系类似智猪博弈。大企业进行研究与开发,为新产品做广告,而对小企业来说这些工作可能得不偿失。所以,小企业可能把精力花在模仿上,或等待大企业用广告打开市场后再出售廉价产品。

解释““夫妻博弈”(battle of the sexes)”,并举商业案例说明。

“夫妻博弈”(battle of the sexes)的例子讲的是一对谈恋爱的男女安排业余活动,他们有二种选择,或去看足球比赛,或去看芭蕾舞演出。男方偏好足球,女方偏好芭蕾,但他们宁愿在一起,不愿分开。表6-6给出了这个博弈的得益矩阵。在这个博弈中,如果双方同时决定,则有两个纳什均衡,即都去看足球比赛和都去看芭蕾演出。但是到底最后他们去看足球比赛还是去看芭蕾演出,并不能从中获得结论。如果假设这是个序列博弈,例如,当女方先作出选择看芭蕾演出时,男方只能选择芭蕾;当女方先选择了看足球比赛时,男方也只能选择足球。反之,当男方先选择了看足球比赛时,女方只能选择看足球比赛;当男方先选择了看芭蕾演出时,女方只能选择芭蕾。

表6-6 夫妻博弈

在这个博弈例子中,先行动者具有明显的优势,女方通过选择芭蕾造成一种既成事实,使得男方除了一起去看芭蕾之外别无选择。这就是我们在斯塔克尔伯格模型中提到的先动优势(first mover advantage)。在那个模型中,先行动的厂商选择一个很高的产量水平,从而使它的竞争对手除了选择小的产量水平之外没有多大的选择余地。

解释古诺模型。

解释斯塔克尔伯格模型。

●斯塔克尔贝里(1934)提出一个双头垄断的动态模型,其中一个支配企业(领导者)首先行动,然后

从属企业(追随者)行。比如在美国汽车产业发展史中的某些阶段,通用汽车就扮演过这种领导者的角色(这一例子把模型直接扩展到允许不止一个追随企业,如福特、克莱斯勒等等)。根据斯塔克尔贝里的假定,模型中的企业选择其产量,这一点和古诺模型是一致的(只不过古诺模型中企业是同时行动的,不同于这里的序贯行动)。

博弈的时间顺序如下:(1)企业1选择产量q1 >0; (2)企业2观测到然后选择产量q2 >0(3)企业1的收益由下面的利润函数给出:

●这里P(Q)=a-Q,是市场上的总产品Q=q1+q2时的市场出清价格,c是生产的边际成本,为一常数

(固定成本为0)。

●为解出这一博弈的逆向归纳解,我们首先计算企业2对企业1任意产量的最优反应,R2(q1)应

满足:

●对上面的通过求极值可得:

●已知q1< a-c,在前面我们分析同时行动的古诺博弈中,得出的R2(q1)和上式完全一致,两者的

不同之处在于这里的R2(q1)是企业2对企业1已观测到的产量的真实反应,而在古诺的分析中,R2(q1)是企业2对假定的企业1的产量的最优反应,且企业1的产量选择是和企业2同时作出的。

●由于企业1也能够像企业2一样解出企业2的最优反应,企业1就可以预测到他如选择q1,企业

2将根据R2(q1)选择产量。那么在博弈的第一阶段,企业1的问题就可表示为:

●解得:

●这就是斯塔克尔贝里双头垄断博弈的逆向归纳解。

●对斯塔科尔贝里双头垄断博弈的逆向归纳解的评价:

●回顾在古诺博弈的纳什均衡中,每一企业的产量为(a一c)/3,也就是说,斯塔克尔贝里博弈中

逆向归纳解的总产量3(a-c)/4,比古诺博弈中纳什均衡的总产量2(a-c)/3要高,从而斯塔克尔贝里博弈相应的市场出清价格就比较低。不过在斯塔克尔贝里博弈中,企业1完全可以选择古诺均衡产量(a一c)/3 ,这时企业2的最优反应同样是古诺均衡的产量,也就是说在斯塔克尔贝里博弈中,企业1完全可以使利润水平达到古诺均衡的水平,而却选择了其他产量,那么企业1在斯塔克尔贝里博弈中的利润一定高于其在古诺博弈中的利润。但斯塔克尔贝里博弈中的市场出清价格降低了,从而总利润水平也会下降,那么和古诺博弈的结果相比,在斯塔克尔贝里博弈中,企业1利润的增加必定意味着企业2福利的恶化。

●和古诺博弈相比,斯塔克尔贝里博弈中企业2利润水平的降低,揭示了单人决策问题和多人决

策间题的一个重要不同之处。在单人决策理论中,占有更多的信息决不会对决策制定者带来不利,然而在博弈论中,了解更多的信息(或更为精确地说,是让其他参加者知道一个人掌握更多的信息)却可以让一个参与者受损。

解释里昂惕夫的工会模型。

●在里昂惕夫(1946)模型中,讨论了一个企业和一个垄断的工会组织(即作为企业劳动力惟一供给者

的工会组织)的相互关系:工会对工资水平说一不二,但企业却可以自主决定就业人数(在更符合现实情况的模型中,企业和工会间就工资水平讨价还价,但企业仍自主决定就业,得到的定性结果与本模型相似)。工会的效用函数为U(W, L),其中W为工会向企业开出的工资水平,L为就业人数。

●假定U(W, L)是W和L的增函数。企业的利润函数为,

其中R (L)为企业雇佣L名工人可以取得的收入(在最优的生产和产品市场决策下),假定R (L)是增函数,并且为凹函数。

●假定博弈的时序为:(1)工会给出需要的工资水平W;(2)企业观测到(并接受)W,随后选择雇佣人

数L;(3)收益分别为U(W, L)和。即使没有假定U(W, L)和R (L)的具体的表达式,从而无法明确解出该博弈的逆向归纳解,但我们仍可以就解的主要特征进行讨论。

●首先,对工会在第一阶段任意一个工资水平w,我们能够分析在第二阶段企业最优反应L*(W)的特

征。给定w,企业选择L*(W)满足下式:

●一阶条件为:

●为了满足上述一阶条件,假设R’(0)=∞; R’(∞)=0.

●下面的图把L *(w)表示为w的函数(但坐标轴经过旋转以便于和以后的数据相比较),并表示出它

和企业每条等利润线交于其最高点。若令L保持不变,

●L保持不变,w降低时企业的利润就会提高,于是较低的等利润曲线代表了较高的利润水平。

●这张图描述了工会的无差异曲线,若令L不变,当w提高时工会的福利就会增加。于是较高的无

差异曲线代表了工会较高的效用水平。

●下面我们分析工会在第一阶段的问题,由于工会和企业同样可以解出企业在第二阶段的问题,工

会就可预测到如果它要求的工资水平为w1,企业最优反应的就业人数将会是L*(w1)。那么,工会在第一阶段的问题可以表示为:

●表现在图中的无差异曲线上就是,工会希望选择一个工资水平w,由此得到的结果(w, L*(w))处

于可能达到的最高的无差异线上。这一最优化间题的解为w*,这样一个工资要求将使得工会通过(w*, L*(w*))的无差异曲线与L*(w)相切于该点,如图所示。从而(w*, L*(w*))就是这一工资与就业博弈的逆向归纳解。

●更进一步我们还可以看出,(w‘*,L*(w*))是低效率的,在上图中,如果w和L处于图中阴影部分

以内,企业和工会的效用水平都会提高。这种低效率对实践中企业对雇佣工人数量保持的绝对控制权提出了质疑。(允许工人和企业就工资相互讨价还价,但企业仍对雇佣工人数量绝对控制,也会得到相似的低效率解)。

解释伯特兰德模型。

用“小偷与守卫的博弈”说明“激励悖论”。

犯罪和防止犯罪是罪犯和警察之间进行博弈的一场游戏。警察可以加强巡逻,或者休息。犯罪者可以采取作案、不作案两种策略。如果罪犯知道警察休息,他的最佳选择就是作案;如果警察加强巡逻,他最好还是不作案。对于警察,如果他知道犯罪者想作案,他的最佳选择是加强巡逻,如果犯罪者采取不作案,自己最好去休息。当然,犯罪者和警察都不可能完全知晓对方将采取的行动,因此他们都将估计对方采取某种行动的概率,从而决定自己要采取的行动。结果是,他们将以一定的概率随机地采取行动,这叫“混合策略”。我们可以简单地分析一下混合策略(对数字不感兴趣的读者可以不看下面一段)。下面是犯罪者与警察的支付矩阵(假定犯罪者在警察休息时一定作案成功,在警察巡逻时作案一定会被抓住):

犯罪者

不作案作案

警察巡逻 0,0 2,-2

休息 2,0 -1,1

这个矩阵的数字含义可以表示,警察巡逻,犯罪者不作案,双方都没有收益也没有损失;警察巡逻,犯罪者作案,警察因抓到罪犯受到表彰,得到效用2单位,罪犯被判刑丧失效用2单位;警察休息,犯罪

博弈论试题

杭州师范大学2010-2011学年第二学期通识 课程期末考试 《博弈论与企业管理》试卷 一、单项选择题(本大题共12题,每题3分,共36分) 1. 下列关于优势策略均衡和纳什均衡的描述正确的是( ) A 优势策略均衡肯定是纳什均衡; B 纳什均衡都是优势策略均衡; C 纳什均衡是特殊的优势策略均衡; D 以上三种情况都有可能 2. 以下关于承诺的描述不准确的是( ) A 承诺使威胁可置信; B 承诺往往对自己构成约束; C 承诺往往不需要成本; D 承诺往往会给自己带来成本,但最终结果使自己有利 3. 对于以下报酬矩阵,哪个命题是正确的( ) 【 A 甲和乙都有占优策略; B 只有甲有占优策略; C 只有乙有占优策略; D 两人都没有占优策略 4. 对于如下报酬矩阵,乙的占优策略是( ) (

A 上; B 中; C 左; D 右 5. 对于题4的报酬矩阵,以下哪个是纳什均衡( ) A (上,左);B (上,右);C (下,右);D (上,中) 6. 对于题4的报酬矩阵,如果乙先走一步,并且知道甲再作决策时已经知道乙的决策,那么,乙将采取( ) A 左; B 中; C 右; D 上 7. 交易双方信息不对称,比如买房不知道卖方的一些情况,是由于( ) A 卖方故意隐瞒自己的一些情况; B 买方自身的认识能力有限; C 买方掌握完全信息的成本太高; D 以上三种情况都有可能 8. 面对不对称信息,下列哪一项不能为消费者减少信息不对称( ) A 品牌;B 低价格 C 产品保证 D 长期质量保证书 9. 下列哪一项不是高质量的信号( ) ) A 产品保证; B 延长的质量保单; C 暂时的经营场所; D 被认可的品牌 10.在二手市场上,( ) A 买主知道商品的质量,而卖主不知道; B 买主不知道商品的质量,而卖主知道; C 卖主和买主都知道商品的质量是低的; D 卖主和买主都不知道商品的质量是低的 11.一个有效的激励机制必须能够( ) A 使代理人参与工作的净收益不低于不工作也能得到的收益; B 使代理人让委托人满意的努力水平也是给代理人带来最大净收益的努力水平; C 尽可能地减少或消除代理人的目标函数与委托人的目标函数之间的冲突; D 以上都是 12.在信息不对称的劳动力市场,效率最低的激励机制是( ) A 固定工资;B 效率工资;C 利润分享; D 提成 二、简答题(本大题共6题,第1、2、3题每题4分,第4、5、6题每题6分,共30分) 1.一个博弈如果出现两败俱伤的结果,这样的博弈一定是非合作的零和博弈吗 … 2.两个罪犯只打算合伙犯罪一次,所以被捕后出现了囚徒困境的情况。如果这两个罪犯准备合伙犯罪30次,那么在开始的犯罪活动中如果被捕,还会出现囚徒困境吗 3.请举例分析说明在什么条件下博弈者采取威胁对方的策略可以奏效。 4.某博弈的报酬矩阵如下:

浙大博弈论考试题目

博弈论考试 1、完全信息静态博弈 1“老师点名和学生逃课”的案例 构建如下模型:老师 点名不点名 学生逃课a1,b1 a2,b2 不逃课a3,b3 a4,b4 结果:(1)老师每次点名,学生每次不逃课 a3> a1 ,b3> b4 ,a2< a4 ,b2< b1 (2)老师每次不点名,学生每次不逃课 a4> a2 , b4> b3 , a1< a3 , b1< b2 (3)老师有时候点名,学生有时候逃课 a1< a3 , a2> a4 , b1> b2 , b3< b4 (4)老师每次不点名,学生每次逃课 a2> a4 , b2> b1 , a3< a1 , b3< b4 2市场占有者和想进入市场者 构建模型:占有者 默认斗争 进入者进入(40,50)(-10,0) 不进入(0,300)(0,300) 没有占优战略均衡,也没有重复剔除的占优均衡。 结果:(1)占有者默认,进入者进入时,占有者会损失部分利益 (2)占有者斗争,进入者进入,则占有者利益变0,而进入者为负,两败俱伤,因而占有者“斗争”是弱劣战略。 (3)占优者默认,进入者不进入,则占有者获得全部市场 (4)(斗争,不进入时,占有者仍获得全部市场。 综上存在两个纳什均衡,(进入,默认)和(不进入,斗争) 3应试教育和素质教育学生 应试教育素质教育 学校应试教育(0,0)(0,-1) 素质教育(-1,0)(1,1) (1)假设学校和学生都采取应试教育为(0,0),那么若他们都转向素质教育达到最优结局(1,1),(2)但如果单方面采取素质教育,另一方为应试教育,其支付就变为-1,比如如果学校重视应试成绩,而学生重视素质教育,学生单方面受损,为-1 (3)若学校注重素质教育,而学生只注重成绩,学校的策略难以推行,支付为-1. 此博弈中存在两个纳什均衡,即(应试,应试)和(素质,素质),虽然(素质,素质)是最优纳什均衡,但一方采取素质教育存在风险:另一方为应试时,支付变为-1;若采取应试没有变为-1的风险,那么最终结局为(应试,应试)。4两个人合作开发一项产品假设项目开发成功每人收益为4,失败时收益为 0,偷懒者的机会成本为1

博弈论期末习题

《博弈论》期末习题 专业:经济学学号:2 ;姓名:王兆丽 一、试写出掷硬币博弈的局中人及其策略与得益函数,并写出双变量得 益矩阵。 答:局中人:盖硬币者和猜硬币者。 策略:有正面和反面两种可选择策略,若猜对,猜者得1盖者-1.否则猜者-1盖者1.由于每一方都不会让对方在选择之前知道自己的决策,所以可以看做是同时做决策的。 双变量得益矩阵; 猜硬币方 二、试举生活中的一例,说明囚徒困境是如何产生的?并试分析可能走 出囚徒困境的途径。 答:例子:中国移动和中国联通之间的价格战。 产生原因:囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。 可能走出的囚徒困境途径:(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚,那么就会制止这种现象发生。(2)忠诚文化。有时候,建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中,团体产生所面临的囚徒困境问题的轻重程度是不同的,这种差异的根本来源就是各个组织有自己的文化。(3)长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财,合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。 答:1、该博弈共包括四个子博弈:(1)从博弈方1选择R 以后博弈方2的第二 阶段选择开始的三阶段动态博弈;(2)从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈;(3)第三阶段博弈方1选择A 以后博弈方2 的单人博弈;(4)第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中 任何一个的得益都相同,因此在这阶段随意选择一个都可以。倒退回第三阶段, 博弈方1选择AB中任何一个都可以。再推回第二阶段,博弈方2选择L将得到 3选择R得到2,因此选择L;最后回到第一阶段,博弈方1选择L得到2选择 R得到3,。所以该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择R, 博弈方2第二阶段选择L,即(3,1)是该博弈的完美纳什均衡。 四、两个寡头企业进行价格竞争博弈,企业1的利润函数是 q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1 的价格,q 是企业2的价格。求: 1.两个企业同时决策的纯战略纳什均衡; 两个企业同时定价。根据两个企业的得益函数,很容易导出它们各自的反应 函数:απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论考试题目

博弈论考试题 一、名词解释(20分) 1.纳什均衡 2.子博弈完美均衡 3.重复博弈 4.贝叶斯博弈 二、简答题(30分) 1.按照信息和顺序,博弈有哪些分类?且对应的均衡概念分别是什 么? 2.在完全信息静态博弈中,求纳什均衡的方法有几种,分别是什么? 3.对于重复博弈,合作解可能在哪些情况下产生? 三、分析题(25分,每小题5分) 假设公安局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就取决于两者对于犯罪事实的供认。这两名犯罪嫌疑人在公安局是分别关押以防他们串供。两名犯罪嫌疑人都知道,如果他们都交代犯罪事实,则可能将各被判5年;如果他们都不交代,则有可能会被较轻的妨碍公务罪各判2年;如果一人交代,另一人不交代,交代者会被立即释放,不交代者被判8年。回答以下问题:(1)请写出这两名犯罪嫌疑人博弈的支付矩阵。 (2)假设这两名犯罪嫌疑人都是自私且不讲江湖道义的人,同时被审问且不能够相互沟通串供。请给出该博弈的纳什均衡。(3)说明这两个囚徒的困境在哪里?

(4)利用囚徒困境博弈对下面现象进行解释:电信市场上移动和联通的价格战。 (5)请指出一种走出囚徒困境的办法。 四、计算题(25分) 企业甲和企业乙都是家电制造商,他们都可以选择生产高端或是低端产品,两企业在不同选择下的利润如以下得益矩阵所示。假设企业甲先于企业乙进行产品选择并投入生产,企业乙在决定生产时已经知道企业甲的选择,而且这一点大家都知道。 (1)请写出该博弈的扩展式; (2)该博弈的子博弈完美均衡是什么? 企业2 高端低端 高端 企业1 低端 答题要求: 1.必须手写; 2.稿纸单面书写; 3.下周三上午统一交。

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论复习题及答案

囚徒困境说明个人得理性选择不一定就是集体得理性选择。(√) 子博弈精炼纳什均衡不就是一个纳什均衡。(× ) 若一个博弈出现了皆大欢喜得结局,说明该博弈就是一个合作得正与博弈.()博弈中知道越多得一方越有利。( ×) 纳什均衡一定就是上策均衡。(× ) 上策均衡一定就是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。 (×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√) 在博弈中纳什均衡就是博弈双方能获得得最好结果。 (× ) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少. (×)上策均衡就是帕累托最优得均衡。(×) 因为零与博弈中博弈方之间关系都就是竞争性得、对立得,因此零与博弈就就是非合作博弈。 (×) 在动态博弈中,因为后行动得博弈方可以先观察对方行为后再选择行为,因此总就是有利得。(×) 在博弈中存在着先动优势与后动优势,所以后行动得人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒得困境博弈中两个囚徒之所以会处于困境,无法得到较理想得结果,就是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢得时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益得策略组合.(√)不存在纯战略纳什均衡与存在惟一得纯战略纳什均衡,作为原博弈构成得有限次重复博弈,共同特点就是重复博弈本质上不过就是原博弈得简单重复,重复博弈得子博弈完美纳什均衡就就是每次重复采用原博弈得纳什均衡。(√ ) 多个纯战略纳什均衡博弈得有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略与纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)得子博弈完美均衡结局,其中对于任意得t<T,在t阶段得结局并不就是G得Nash均衡.(√)(或:如果阶段博弈G={A1,A2,…,An; u1,u2,…,un)具有多重Nash均衡,那么该重复博弈G(T)得子博弈完美均衡结局,对于任意得t<T,在t阶段得结局一定就是G得Nash均衡。) 零与博弈得无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈得混合战略纳什均衡.(√)(或:零与博弈得无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈得混合战略纳什均衡.(×)) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈得纯战略纳什均衡本身就是各局中人能实现得最好结果,符合所有局中人得利益,因此,不管就是重复有限次还就是无限次,不会与一次性博弈有区别。(√) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一得纳什均衡不就是效率最高得战略组合,存在潜在合作利益得

博弈论习题集

PROBLEM SET I OF GAME THEORY 1. State whether the following games have unique pure strategy solutions, and if so what they are and how they can be found. (1) Player 2 Player 1 (2) Player 2 Player 1 (3) Player 2 Player 1 2. Draw the normal form game for the following game and identify both the pure-and mixed-strategy equilibria. In the mixed-strategy Nash equilibrium determine each firm ’s expected profit level if it enters the market. There are two firms that are considering entering a new market, and must make their decision without knowing what the other firm has done. Unfortunately the market is only big enough to support one of the two firms. If both firms enter the market, then they will each make a loss of £ only

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

博弈论考试试题

博弈论考试试题 你有三个小时考试时间。回答所有问题。考试内容比较多,我在认为最难的问题旁边标注了星号,如果你担心不够时间,可以把这些带星号的问题留到最后才做。 1.(55分钟—36分)简略回答下面每个子问题。请写出你的计算过程,并在你不能给出正式结论时,提供大概的解释,那样我可以给你部分分数。 (a)尽可能给出正式的说明,指出一个观察到的行为是无穷连续的多级博弈意味什么?给出一个不是无穷连续博弈的例子。 (b)尽可能给出正式的说明,指出一个一般性支持的性质意味着什么?在课上我们看到什么理论关于一般性支持的性质? (c)课堂上,在说明带有可观察行为的有限扩展型博弈和无限期多级博弈时,我不同地详细讲述了支付函数。支付函数范畴是如何不同?为什么我做出这个改变? (d)在扩展型博弈中给出一个策略的正式定义。 (e)给出一个博弈的例子,其中一个看起来不合理的结果在一个子博弈完美均衡里变成可能。(f)下面显示的扩展型博弈里,博弈者1有多少个纯策略?写出正常形式的支付矩阵。这个博弈有多少子博弈? (g)找出下面博弈中全部的纳什均衡。

(h )找出二阶段博弈的子博弈完美均衡,博弈者在成本a/16处选择a ,于是博弈者1和2同时行动进行博弈,如下面所示。 (i )找出同时行动博弈中的纳什均衡,其中博弈者1选择1a ∈?,博弈者2选择2a ∈?,支付是,

考虑如下的关于信任的博弈,这在很多试验中都做过。试验者从给博弈者1$10和给博弈者2$0开始。然后试验者问博弈者1愿意将多少美元给博弈者2来帮助他。如果他选择给x美元给试验者,则试验者给博弈者2 *3x。随后,博弈者2有机会将一些或全部(或没有)他获得的钱给博弈者1。 (a)假定这两个博弈者都是风险中性的,仅关心他们自己的支付,找出这个博弈的子博弈完美均衡。(顺便说明,子博弈完美均衡不像在试验中出现。通常博弈者1给出一些,但不会把全部的钱给回试验者) (b) 这个博弈有博弈者获得更高支付的纳什均衡吗? (c)假定我们修改了博弈,以致在上述的两阶段后,博弈者1有机会打博弈者2。假定这将减少博弈者1的效用1美元,减少博弈者2的效用5美元。这将改变你们在(a)和(b)中的答案吗?如果我们在第二阶段后有如下显示的博弈会怎么样呢?作个你认为合理的预测。 (d*)对这个试验结果的另一个解释是,博弈者可以是无私心的。说明无私心的最简单表达——每个博弈者最大化他自己的美元支付和其他博弈者美元支付的权重和——除了权重上一个特别(非强迫)的选择,不能解释试验规则性。你能想出可能被用来说明试验结果的效用函数吗?

博弈论复习题及答案

博弈论复习题及答案 Pleasure Group Office【T985AB-B866SYT-B182C-BS682T-STT18】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些基本特点是什么 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈请求出其中的纳什均衡

答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险有什么办法可以解决道德风险问题 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 F 2 B 2 F 1 B 1 答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是H 选择F1和N 选择F2,以及H 选择B1和N 选择B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和“R ”的行动,其收益如下:当A 选左,B 选L 时,A 的收益为2 ,B 的收益为3;当A 选左,B 选R 时,A 的收益为1 ,B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1;当A 选右,B 选R 时,A 的收益为N H

博弈论测试题

博弈论测试题十一 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我” 个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题? 答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。 (2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。 精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。 四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发? 答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。 五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:

博弈论考题与答案

一、假设市场上有三个垄断企业,企业无生产成本,问达到纳什均衡时的产量为多少?假设市场的价格和数量之间P=a—b*Q 解: 二、什么是纳什均衡,你是如何理解纳什均衡的? 答:纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。如上述,在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。 三、构建一个博弈,说明如何杜绝学生考试作弊现象(参考高薪养廉博弈) 答: 四、给出该博弈的纳什均衡,并用消除劣势战略法,找出 (R1,C3)这个纳什均衡。 C1 C2 C3 R1 2,12 1,10 1,12 R2 0,12 0,10 0,11 R3 0,12 0,10 0,13 五、两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两人同时出令。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,计算其混合战略纳什均衡。 答:设S为棒子T为老虎C为鸡W为虫子,则其支付矩阵为: 2 S T C W S 0,0 1,-1 0,0 -1,1 1 T -1,1 0,0 1,-1 0,0 C 0,0 -1,1 0,0 1,-1 W 1,-1 0,0 -1,1 0,0 设1、2出STCW的概率分别为P1P2P3P4和Q1Q2Q3Q4,则矩阵达到均衡时,2的期望收益必须满足:0*p1—1*p2+0*p3+1*p4=1*p1+0*p2—1*p3+0*p4=0*p1+1*p2+0*p3—1*p4= —1*p1+0*p2+1*p3+0*p4 整理为—p2+p4=p1—p3= —p1+p3 由于上式为对称的,所以,p1=p2=p3=p4,又p1+p2+p3+p4=1,可得p1=p2=p3=p4=0.25. 同理q1=q2=q3=q4=0.25 综上所述,混合战略的纳什均衡为:A1(0.25,0.25,0.25,0.25)A2(0.25,0.25,0.25,0.25) 六、5个海盗抢到了100颗宝石,每一颗大小和价值都一样他们决定这么分:抽签决定自己的号码(1、2、3、4、5)。首先,1号提出分配方案。然后大家5人进行表决,当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳌鱼。如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳖鱼。以次类推。假定每个个强盗都是经济学假设的“理性人”,假定每个判决都能顺利执行。那么,如果你是第一个强盗,你该如何提出分配方案才能够使自己的收益最大化? 七、假设选民政治态度是成线性均匀分布的,说明为什么两党政治具有欺骗性,如果是三党政治情况如何,为什么? 答:政党和政治家争取选民情况实际上就和杂货铺定位博弈一样。工党一定要打出劳工代言人的旗帜,所以他是站在左边的,左边是他的地盘。但是只有左边一半的选民,还不足以保证胜出。为了在竞选中获胜,他要想办法把中间的在两党之间摇摆的选民争取过来。最好的办法,就是使自己的竞选纲领向“右”的方向靠过去一点,就是在竞选中宣布也要照顾中产阶级的利益。移过去一点,地盘就可能大一点。同样,原来立党之本是在“右”边的保守党,在竞选的过程中,也要往左边靠,争取更多的选民。这样斗法的结果,在漫长的竞选过程中,虽然两党的漫骂不断升级,但是实际纲领却不断靠近,直到两个政党在中点紧挨在一起,才是稳定的纳什均衡。 这个政党纲领向中点移动的机制,也说明西方两党政治的欺骗性。竞选的时候,怎样有利于拉票就怎样讲,当选以后,可以忘得一干二净。在这个意义上,我们说不要以为哪个政党上台这些西方国家的态度就会改变,确实很有道理。政党政治,本来在理论上有促使政治家个人操守不可太放肆的优点。但是在西方国家,小学生都知道政治家说的话不可靠,无奈制度决定了,每次竞选,人们只能在那少数政治家之间作出他信非常有限的选择。 为什么第三个政党难成气候?这是因为,如果三个政党的位置不相同,不在同一个点上,那么他们都有向中点

博弈期末考试总结

博弈与决策答案 一、名词解释(每小题2分,共16分) 1、博弈 博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以施,并从中各自取得相应结果或收益的过程, 2、占优战略均衡 占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的优策略的基础上达到均衡. 3、重复博弈 重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题, 4、序列博弈 序列博弈是指对局者选择策略有时问先后的顺序,某些对局者可能率先采取行动.序列博也是一种动态博弈. 5、动态博弈 动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动. 6、占优战略均衡--占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的占优策略的基础上达到均衡. 7、完全信息---完全信息是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息. 8、得益 得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西. 9,博弈论:博弈论就是系统的研究各种各样的博弈问题,寻求各博弈方合理选择策略的情况下博弈的解,并对这些解进行讨论分析的理论。 10,纳什战略均衡:纳什战略均衡指在均衡中,每个博弈参与人都确信,在给定其他参与人选择的策略的情况下,该参与人选择了最优策略以回应对手的策略。 11,静态博弈:静态博弈是指在博弈中,参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体行动。 二、、简答题(每小题6分,共24分) 1、占优战略均衡和纳什均衡的联系与区别如下: 1)每一个占优战略均衡都是纳什均衡,而每一个纳什均衡却未必是占优战略均衡; 2)用重复剔除严格劣战略方法,保留下的唯一的重复剔除的占优均衡,就是纳什均衡. 3)纳什均衡,不会被重复剔除严格劣战略方法剔除掉(但弱劣战略剔除,可能会剔除纳什衡): 4)经重复剔除严格劣战略之后,有不唯一的多个哉略组合保留,其中有的战略组合不一定纳什均衡.即重复剔除严格劣战略方法,无法确保将所有非纳什均衡战略剔除,没有被剔的战略组合不一定是纳什均衡. 5)没有占优战略均衡的博弈,不能用重复剔除严格劣战略方法求解的博弈,可以有纳什均衡2,博弈的构成要素有哪些?并对其进行说明。 2、博弈一般由以下几个要素组成,包括:参与人、行动、信息,策略、得益、结果、均衡等.

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论试题及答案

诚信考试沉着应考杜绝违纪 《博弈论》试卷 课堂周四(7/8) 院系专业万方电气系通信工程 学号 余数 0 姓名

河南理工大学2010–2011学年第1学期 《博弈论》课程期末考试试卷 开课学院:经济管理学院,考试形式:开卷,允许带___________入场 考试时间:2010年12月25日-12月25日, 所需时间:周 考生姓名:学号:专业: 题序一二三四五六七八总分得分 评卷人 1、第一题:(10分) (1)举一个你所经历情侣博弈的情形,在实际博弈中你采取什么行动让自己收益最大; 答:作为一个男生,我想很多机会都是把握在自己手中的,情侣博弈有二个“纳什均衡”,一次博弈的结局究竟落到哪一个“纳什均衡”,关键就是要看遇事时自己如何去选择了。 例如:周末和女朋友去逛商场,应该客观地按照需求去采购,在了解女朋友的爱好的前提下,想办法引导她去看性价比最高的商品,并给予一定建议。遇到她特别喜欢的衣服或饰物,只要价格合理,又能满足生活需要,在对方征求意见时应该支持购买并给予肯定答复;当遇到不合理的购买选择时,应简明扼要地说出其不适之处,并建议对方到其它她喜欢的物品处,挑选令其满意的商品。购物中间一旦遇到对方生气或者发火,可以宽容地对待对方,以显示出自己的城府,若对方为无理取闹,应该坦诚地向对方说明情况,让对方明白自己在为她考虑,说明都说清楚了事情也就简化了。另外,在购物结束前,可以给女朋友买些她喜欢的零食,或者一起去对方喜欢的餐饮店,休息的同时也可调节一下情调,让双方都能够感觉到两个人在一起的幸福与甜蜜。 总结一下,在这场情侣博弈中,要想让自己获得最大收益,必须努力做到认真、善意、宽容、强硬、简单明了各种措施相结合。 2、第二题:(20分) 请举例说明下列说法是否正确,构造博弈模型具体说明,阐述原因。 (1)判断分析“先下手为强” 答:“先下手为强”并不满足所有的情形。 博弈中,在有多个"纳什均衡"的情况下,常常是先动手的一方会占一些优势,这和课例中“囚徒困境”情形类似,有一个最佳策略,古代的很多例子也证明了此点,如:诸葛亮先下手为强,占据荆州要势;日本先下手为强,偷袭美国的珍珠港,不然就不会有第二次世界大战;三国曹操先下手为强,迎接汉献帝,后挟天子以令诸侯等。要指出的是,“动态博弈”中也是有很多后动优势的情形,一般是在方案已经制定,自身实力比较弱,需要选择决策的时候,主动放弃先发权利,变先动劣势为后动优势。如:三人参加选举,支持率分别为15%,35%,50%,这个时候,如果15%者先采取行动,可能会立刻被强敌灭掉,所以他必须保存实力,保持低调,不介入强者的争斗,由另两位先动手,争取灭掉一方后均分失败者的支持率,虽然这样扔处于劣势,但比最初情况要好很多。所以,在面对选择

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

相关主题
文本预览
相关文档 最新文档