当前位置:文档之家› 博弈论练习题答案 张照贵

博弈论练习题答案 张照贵

博弈论练习题答案 张照贵
博弈论练习题答案 张照贵

博弈论练习题(一)

一、下面哪些问题适用博弈来模型化∶

1、石油输出国组织(OPEC)成员国选择其年产量;

2、通用汽车公司向USX购买钢材;

3、两厂商,一家制造螺钉,一家制造螺帽,是用公制还是英制;

4、公司董事会为其总经理(CEO)设立一项期股安排;

5、联合果品公司决定招募工人;

6、一电力公司估计了未来10年对电力的需求后,决定是否购置一套新的发电机组。

问题1和3可以用博弈来模型化

二、博弈论与经济学的关系是什么?经济学的变化趋势是什么?

答:

(1)博弈论与经济学的关系:

1、博弈论在经济学中的应用最广泛、最成功。

2、经济学家对博弈论的贡献越来越大。

3、经济学和博弈论研究的模式是一样的。经济学和博弈论都强调个人理性,即在给定的约束条件下追求效用最大化。

(2)经济学发展的几个趋势

博弈论成为主流经济学的基石,反映了经济学发展的几个趋势∶

1、经济学研究的对象越来越转向个体。

2、经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响及作用,人们之间利益的一致与冲突,竞争与合作的研究。

3、经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。

三、博弈论的构成要素有哪些?

答:广义上讲博弈论则主要由以下五大要素构成:

一,决策主体(Player):又称局中人或博弈方,指的是博弈中能独立决策、独立行动并承担决策结果的个人或组织。

二,策略空间(Strategy space):又称策略集,是指供参与者选择的策略和行动空间。

三,效用(Utility):也就是博弈者之间相互争夺的利益。博弈双方或多方都是围绕一定利益展开的,因此博弈胜负的评判结果主要是靠策略选择后的得失来衡量。

四,次序(Orders):即各博弈方在决策时有先后之分,因为博弈方在决策选择上要不时地调整改善,一定要十分注重次序轻重的问题。如果决策的次序和实施时间不同,则博弈的结果必会有所差别。

五,博弈均衡:博弈虽然是为了利益和胜利,但并非是利益尽占,而是要遵循均衡理论。

四、二人博弈有何特点?

答:双人博弈(即有且只有两个参与人的博弈,称为双人博弈),有如下一些特点∶

1.两参与人之间的关系并不总是相互对抗的,有时会出现利益一致的情况;

2.信息多的一方不能保证得益也较多;

3.个人理性并不一定导致集体理性。

五、如何理解完全信息与不完全信息,完美信息与不完美信息?

答:(1)完全信息与不完全信息:

1、如果参与人完全了解所有参与人各种情况下的得益(支付函数),称此参与人具有完全信息。

2、如果参与人不完全了解其他参与人的得益,则该参与人具有不完全信息。 (2)完美信息与不完美信息

1、在动态博弈中,若参与人完全了解自己行动之前的整个博弈过程,称此参与人具有完美信息(完美回忆)。

2、若参与人不完全了解自己行动之前的整个博弈过程,则该参与人具有不完美信息。

六、如何理解静态博弈与动态博弈?

答:从行为的时间序列性,博弈论可分为两类:

静态博弈,是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动; 动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

例如,"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。

七、如何理解纳什均衡?占优均衡,反复剔除严格劣战略均衡与纳什均衡的关系。 答:(1)纳什均衡的直观意义

在n 人参与的博弈中,给定其他参与人战略的条件下,每个参与人选择自己的最优战略,所有参与人选择的战略构成一个战略组合。所有参与人的最优战略构成的战略组合,称为纳什均衡。纳什均衡是完全信息静态博弈的解。

(2)纳什均衡的数学表达:

有n 个参与人的战略表述博弈∶ G={S1,. . . ,Sn ;u1 ,. . . ,un } ,战略组合: , 是一个纳什均衡,如果对于每一个i , 是给定其他参与人选择 的情况下第i 个参与人的最优战略,即 (3)占优战略均衡、重复剔除占优均衡、纳什均衡的关系

1、每一个占优战略均衡、重复剔除占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或重复剔除占优均衡。

因为构成纳什均衡的唯一条件是参与人对其他参与人均衡战略的最优选择。而占优战略均衡则要求它是对所有其他参与人的任何战略组合的最优选择,则自然它也是对所有其他参与人的某个特定的战略组合的最优选择。而重复剔除占优均衡则要求它是在重复剔除过程中剩下的唯一的战略组合。

2、纳什均衡一定是在重复剔除严格劣战略(不适合弱劣战略剔除)过程中没有被剔除掉的战略组合,但没有被剔除的战略组合不一定是纳什均衡,除非它是唯一的。

八、实际中如何分析预测博弈的结果。 答:实际中描述一个博弈至少必须包括:参与人,战略,支付。而行动与信息则是建筑材料。参与人,行动的结果合起来称为博弈规则,建模者目的在于运用博弈的规则来确定均衡

),,,(***1*n i S S S S

=*

i S ),,,,,(*

*1*1*1*n i i i

S S S S S +--=i S s S S u S S u i i i i i i i i ?∈?≥--,),,(),(***

博弈论练习题(二)

一、 构造具有下述性质的2*2博弈的例子 1、 不存在纯战略纳什均衡;

2、 不存在弱帕累托优势战略组合;

3、 至少有两个纳什均衡,其中一个帕累托优于其它所有的战略组合;

4、 至少有三个纳什均衡。

二、不协调博弈

有一男一女,各自选择是看足球还是看时装表演。男的愿意看足球,女的喜欢看时装。男的想和女方在一起,女的却想躲开男方。

1、 构造一个博弈矩阵来表示这个博弈,选择相应的数值以符合男、女的偏好;

2、 若女方先采取行动,将发生什么?

3、 该博弈中存在先动优势吗?

4、 在完全信息的静态博弈中,存在纯战略纳什均衡吗? 答:

1、

如支付矩阵所示,该博弈模型存在一个占优均衡。

2、如果女方先采取行动,她将会为自己买一张时装票,为男友买一张足球票,以达到效用最大。或者只买一张时装票给自己。

3、该博弈中不存在先动优势。

原因:即使男方存在先动优势,抢先购买两张足球票,女方也不会去看球,即策略(足球、

足球)不是纳什均衡。同理,若女方存在先动优势,则她不会同时购买两张时装票,由于她想躲开男方,因此她会为自己买一张时装票,同时为男方买一张足球票,或者只买一张时装票给自己,即策略(时装、时装)不是纳什均衡。

4、由纳什均衡的存在性定理可知:每一个有限博弈至少存在一个纳什均衡(纯战略或混合战略的)。因此,完全信息的静态博弈中,至少存在一个纯策略的纳什均衡。

三、变化的囚徒困境

在X 与Y 两囚徒博弈中,X 有前科,故无论谁坦白或抵赖,X 都至少要比Y 多判5年。构造一个博弈矩阵,并找出该博弈的纳什均衡。

Y

构造博弈举矩阵如上图所示,该博弈有两个纳什均衡,即(坦白、坦白)、(抵赖、抵赖)

四、有两个厂商的古诺模型,q i 是厂商i 的产量,Q=q 1+q 2为市场总产量。价格为产量的减函数,且p (Q )=a - Q ,没有固定成本,但边际成本不同,分别为c 1和c 2。如果0a+c 1,则纳什均衡的产量又为多少? 解:两厂商均无固定成本,单位边际成本分别为C1,C2 。则两厂商的利润函数分别为: 厂商1

厂商2

分别对u1 ,u2求偏导数并令其为零,则有∶

得到:q1=(a+c2-2c1) / 3 q2=(a+c1-2c2)/3 即为纳什均衡的产量,此时0

如果如果c 1a+c 1,此时q1>0 厂商1的均衡产量仍然为q1=(a+c2-2c1) / 3,q2<0,此时厂商2选择不生产,即产量为0

五、有如下博弈矩阵

求解混合纳什均衡。

解:设X 选择策略X1 X2 X3的概率分别为P (1) P (2) P (3),则有:

Y 选择Y1获得支付的期望值为: 8P (1)+12 P (2)+ 4 P (3) ...... 1 Y 选择Y2获得支付的期望值为: 4P (1)+6 P (2)+ 12P (3) (2)

2)(*

1*

21=---q q c a 0

2*

2*12=---q q c a )(X

2

1

2111112111111)()]([)(q q q q c a q c q q a q q c Q p q u ---=-+-=-=2

2

2122222122222)()]([)(q q q q c a q c q q a q q c Q p q u ---=-+-=-=

Y 选择Y3获得支付的期望值为: 12P (1)+2 P (2)+ 8P (3) …… 3 由1 = 2 =3 ,P (1)+ P (2)+ P (3)= 1 得到 P (1)= 5/12 P (2)=1/4 P (3)= 1/3

同理,因为X 的得意与Y 的得意相等,则Y 选择Y1 Y2 Y3的概率也分别为 P (1)= 5/12 P (2)=1/4 P (3)= 1/3

博弈论练习题(三)

一、有一个两参与人的四阶段之间的动态博弈如下图所示。试找出全部子博弈,讨论该博弈中的可信性问题,求子博弈完美纳什均衡战略组合和博弈的结果。

动态博弈采用逆向归纳法:

(1)从子博弈1(如图)开始:2会选择其可以获得的最大支付的策略(3、6) (2) 子博弈2(如图),1会选择策略(4 、3),以满足其收益最大化的意愿。 (3)子博弈3(如图),2会选择策略(2 、4) (4)最后,子博弈4(如图),1会选择策略(U ,(5 、3))

由以上分析知该博弈可信,子博弈完美纳什均衡战略组合为(U ,(5 、3))

二、三寡头市场需求函数P=100-Q ,Q 是三个厂商的产量之和,并且已知三个厂商都有常数边际成本2,无固定成本。如果厂商1和2先同时决定产量,厂商3根据厂商1、2的产量决策,问三厂商各自的产量和利润是多少? 答:(1)首先考虑1 2厂商 由古诺模型,可知其产量

Q1=Q2=(a-c)/(n+1)=(100-0)/(2+1)=100/3 (推到过程同第2章习题4) (2)然后考虑厂商3:

利润U3=Q3*P=Q3*(100-Q1-Q2-Q3)=100/3*Q3-Q3*Q3

对U3求导,令U3'=0,解得:Q3=50/3,这样Q1,Q2,Q3都求出,然后是U1,U2,U3

U3=Q3*P=50/3 * 50/3=2500/9

U1=U2=Q1*P=100/3 * 50/3=500/3

三、两次重复下面这个得益矩阵表示的两人静态博弈。问能否有一个精炼纳什均衡战略组合,实现第一阶段的得益是(4,4)?如能,给出双方的战略,如不能,证明为什么不能。如果战略组合(x 3,y 1)的得益改为(1,5),会发生什么变化,至少能在部分阶段

子博弈1

实现(4,4)的条件是什么?

Y

X

答:(1) (3 ,1)和(1 ,2),但对双方均有利的战略组合(X3 , Y3)不是纳什均衡,因此在一次博弈中不可能出现。

(2)采用“触发战略”,即首先试探合作,如果对方合作,则给予奖励;如果对方不合作,则给予惩罚。

我们先假设这种触发策略可行,则第一阶段合作两方的策略为(X3 , Y3),支付为(4,4),第二阶段合作双方的策略为(X1, Y1)或(X2,Y2),此时支付分别为(3,1)和(1,2)达到纳什均衡。

采用触发战略的两个参与人的战略是:

参与人X的战略:第一次选X3,则参与人Y为了收益最大必定会选择Y3,此时的策略为(X3 ,Y3)。在种情况下,Y的收益总和分别为4+2=6 或4+1=5

参与人Y的战略:第一次选择Y3,如果第一次的结果是(X3, Y3),则第二次选择Y1,相当于参与人给X第一次采取合作态度的奖励;如果参与人X在第一次选择X1,则第二次选择Y2,相当于给参与人X在第一次选择不合作态度给予惩罚。这两种情况下X的收益总和分别为:4+3=7 5+1=6 ,选择合作可以使得X两次收益总和最大,所以X会选择合作。

(3)综上所述,存在着精炼的纳什均衡使得第一个阶段的得意时(4,4)

(4)若战略组合(x3,y1)的得益改为(1,5),即支付矩阵如下:

Y

X

此时,采用触发战略的两个参与人的战略是:

参与人X的战略:第一次选X3,若参与人为了收益最大会Y1,此时的策略为(X3 ,Y1),则X在第二阶段选X1以报复Y,在种情况下,Y的收益总和分别为5+1=6;若Y选择合作,则第一阶段策略组合为(X3, Y3),参与人X第二将诶段选择X1以对Y进行报复,此时参与人Y两阶段的收益总和为4+1=5,小于不合作时的收益总和,因此参与人Y不会选择合作,而会选择不合作。

参与人Y的战略:第一次选择Y3,如果第一次的结果是(X3, Y3),则第二次选择Y1,相当于参与人给X第一次采取合作态度的奖励;如果参与人X在第一次选择X1,则第二次选择Y2,相当于给参与人X在第一次选择不合作态度给予惩罚。这两种情况下X的收益总和分别为:4+3=7 5+1=6 ,选择合作可以使得X两次收益总和最大,所以X会选择合作。(与未改变前情况相同)因此,实现第一阶段得益(4,4)的精炼纳什均衡战略组合不存在。

(5)至少能在部分阶段实现(4,4)的条件是:设(x3,y1)的得益改为(1,a),则有a+1<5,即a<4。

博弈论练习题(四)

一、什么是子博弈精炼纳什均衡?

答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。

二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么?

答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”

个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。

三、纳什均衡和精炼纳什均衡存在哪些问题?

答:纳什均衡存在的问题:

(1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。

(2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。

精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。

四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?

答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。

五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:

博弈重复次数有限,意味着存在所有参与人都可以预测到的“最后一次”。在最后的阶段博弈中,如果某一参与人选择了自己的占优战略,给其他参与人造成损失,则其他参与人不可能报复。所有的参与人都明白这一点,因而在最后一次阶段博弈中都会选择占优战略,换句话说,在给定最后阶段所有参与人都会选择占优战略的前提下,所有的参与人在倒数第二阶段的博弈中也都会选择占优战略。由此从最后的阶段开始,逐个阶段进行推理,可以得出以下结论:在阶段博弈有唯一的纳什均衡时,有限次重复博弈的唯一子博弈精炼纳什均衡结果,是阶段博弈的纳什均衡重复。这就是说,每个阶段博弈出现的都是一次性博弈的均衡结果。

六、无限次重复博弈均衡解的得益一定会优于原博弈均衡解的得益吗?

答:不一定。例如:无限次重复博弈的古诺博弈,此博弈是相同博弈重复无限次,当冷酷战略是整个博弈的纳什均衡时,当然也就是每个阶段的纳什均衡。此时,无限次重复古诺博弈的冷酷战略已意味着是两厂商在两种战略间进行选择的囚徒困境博弈,一是选择生产垄断产量的一半Q/2,另一是选择生产背叛产量时,冷酷战略是无限次重复古诺博弈的一个子博弈精炼纳什均衡。贴现因子较大说明未来的利益较大,对两厂商都有较大的吸引力,一般情况下,两厂商不会为了短期利益而背叛对方而失去较大的长远利益,即两厂商都有坚持冷酷战略的积极性。而当时,意味着冷酷战略不再是一个子博弈精炼纳什均衡。贴现因子较小说明未来的利益对两厂商都不具有吸引力,选择背叛才是两厂商的最优选择。这种条件下,博弈无限次重复也不能提高一次性博弈的得益。

七、触发战略所构成的均衡都是子博弈精炼纳什均衡吗?

答:“触发战略”是这样一种战略∶首先试探合作,如果对方合作,则给予奖励;如果对方不合作,则给以惩罚。在原博弈有多个纳什均衡的条件下,在重复博弈时,通过触发战略提高了双方的收益。首先,在第二次博弈时意味着该博弈结束,而均衡结果是原博弈的纳什均衡,双方都没有偏离的意愿;其次,第一次选的策略虽不是原博弈的纳什均衡,如果某一方偏离会增加收益,但这样会遭到对方第二次选另外的策略的惩罚而损失收益,使总得益减少。预见到这一点,只顾眼前不顾长远的偏离是得不偿失的事,因此双方会坚持选使总收益最大的策略。所以,触发战略构成的均衡都是子博弈精炼纳什均衡。

八、什么是冷酷战略?什么是针锋相对战略?什么是最小最大战略?

答:冷酷战略也称为触发战略,这种战略做法是∶

1、参与人在博弈开始时均选择合作;

2、只要对方一直选择合作,则继续合作下去,但当某一时刻对方选择了不合作,则一直永远选择不合作来惩罚对方的背叛行为。

针锋相对战略:参与人在博弈开始时选择合作;在时期t选择对方在时期t-1期所采用的战略,即如果对方在t-1期背叛(不合作),则自己在t期也选择背叛。

最小最大战略:最小最大战略是指当违规者不采取合作行为而对他进行惩罚时,违规者可能得到的最严厉的制裁的战略(相应的,违规者为了减少惩罚对自己的影响,而使自己得益最大的战略。

博弈论试题

杭州师范大学2010-2011学年第二学期通识 课程期末考试 《博弈论与企业管理》试卷 一、单项选择题(本大题共12题,每题3分,共36分) 1. 下列关于优势策略均衡和纳什均衡的描述正确的是( ) A 优势策略均衡肯定是纳什均衡; B 纳什均衡都是优势策略均衡; C 纳什均衡是特殊的优势策略均衡; D 以上三种情况都有可能 2. 以下关于承诺的描述不准确的是( ) A 承诺使威胁可置信; B 承诺往往对自己构成约束; C 承诺往往不需要成本; D 承诺往往会给自己带来成本,但最终结果使自己有利 3. 对于以下报酬矩阵,哪个命题是正确的( ) 【 A 甲和乙都有占优策略; B 只有甲有占优策略; C 只有乙有占优策略; D 两人都没有占优策略 4. 对于如下报酬矩阵,乙的占优策略是( ) (

A 上; B 中; C 左; D 右 5. 对于题4的报酬矩阵,以下哪个是纳什均衡( ) A (上,左);B (上,右);C (下,右);D (上,中) 6. 对于题4的报酬矩阵,如果乙先走一步,并且知道甲再作决策时已经知道乙的决策,那么,乙将采取( ) A 左; B 中; C 右; D 上 7. 交易双方信息不对称,比如买房不知道卖方的一些情况,是由于( ) A 卖方故意隐瞒自己的一些情况; B 买方自身的认识能力有限; C 买方掌握完全信息的成本太高; D 以上三种情况都有可能 8. 面对不对称信息,下列哪一项不能为消费者减少信息不对称( ) A 品牌;B 低价格 C 产品保证 D 长期质量保证书 9. 下列哪一项不是高质量的信号( ) ) A 产品保证; B 延长的质量保单; C 暂时的经营场所; D 被认可的品牌 10.在二手市场上,( ) A 买主知道商品的质量,而卖主不知道; B 买主不知道商品的质量,而卖主知道; C 卖主和买主都知道商品的质量是低的; D 卖主和买主都不知道商品的质量是低的 11.一个有效的激励机制必须能够( ) A 使代理人参与工作的净收益不低于不工作也能得到的收益; B 使代理人让委托人满意的努力水平也是给代理人带来最大净收益的努力水平; C 尽可能地减少或消除代理人的目标函数与委托人的目标函数之间的冲突; D 以上都是 12.在信息不对称的劳动力市场,效率最低的激励机制是( ) A 固定工资;B 效率工资;C 利润分享; D 提成 二、简答题(本大题共6题,第1、2、3题每题4分,第4、5、6题每题6分,共30分) 1.一个博弈如果出现两败俱伤的结果,这样的博弈一定是非合作的零和博弈吗 … 2.两个罪犯只打算合伙犯罪一次,所以被捕后出现了囚徒困境的情况。如果这两个罪犯准备合伙犯罪30次,那么在开始的犯罪活动中如果被捕,还会出现囚徒困境吗 3.请举例分析说明在什么条件下博弈者采取威胁对方的策略可以奏效。 4.某博弈的报酬矩阵如下:

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) ~ 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) — 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论复习题及答案

囚徒困境说明个人得理性选择不一定就是集体得理性选择。(√) 子博弈精炼纳什均衡不就是一个纳什均衡。(× ) 若一个博弈出现了皆大欢喜得结局,说明该博弈就是一个合作得正与博弈.()博弈中知道越多得一方越有利。( ×) 纳什均衡一定就是上策均衡。(× ) 上策均衡一定就是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。 (×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√) 在博弈中纳什均衡就是博弈双方能获得得最好结果。 (× ) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少. (×)上策均衡就是帕累托最优得均衡。(×) 因为零与博弈中博弈方之间关系都就是竞争性得、对立得,因此零与博弈就就是非合作博弈。 (×) 在动态博弈中,因为后行动得博弈方可以先观察对方行为后再选择行为,因此总就是有利得。(×) 在博弈中存在着先动优势与后动优势,所以后行动得人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒得困境博弈中两个囚徒之所以会处于困境,无法得到较理想得结果,就是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢得时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益得策略组合.(√)不存在纯战略纳什均衡与存在惟一得纯战略纳什均衡,作为原博弈构成得有限次重复博弈,共同特点就是重复博弈本质上不过就是原博弈得简单重复,重复博弈得子博弈完美纳什均衡就就是每次重复采用原博弈得纳什均衡。(√ ) 多个纯战略纳什均衡博弈得有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略与纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)得子博弈完美均衡结局,其中对于任意得t<T,在t阶段得结局并不就是G得Nash均衡.(√)(或:如果阶段博弈G={A1,A2,…,An; u1,u2,…,un)具有多重Nash均衡,那么该重复博弈G(T)得子博弈完美均衡结局,对于任意得t<T,在t阶段得结局一定就是G得Nash均衡。) 零与博弈得无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈得混合战略纳什均衡.(√)(或:零与博弈得无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈得混合战略纳什均衡.(×)) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈得纯战略纳什均衡本身就是各局中人能实现得最好结果,符合所有局中人得利益,因此,不管就是重复有限次还就是无限次,不会与一次性博弈有区别。(√) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一得纳什均衡不就是效率最高得战略组合,存在潜在合作利益得

博弈论习题集

PROBLEM SET I OF GAME THEORY 1. State whether the following games have unique pure strategy solutions, and if so what they are and how they can be found. (1) Player 2 Player 1 (2) Player 2 Player 1 (3) Player 2 Player 1 2. Draw the normal form game for the following game and identify both the pure-and mixed-strategy equilibria. In the mixed-strategy Nash equilibrium determine each firm ’s expected profit level if it enters the market. There are two firms that are considering entering a new market, and must make their decision without knowing what the other firm has done. Unfortunately the market is only big enough to support one of the two firms. If both firms enter the market, then they will each make a loss of £ only

博弈复习题及参考答案

第一章复习题 2,4,5,6,7 第一章参考答案 2、设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。如果设定博弈模型时不专门设定后两个方面,就是隐含假定是完全、完美信息和完全理性的非合作博弈。 4、“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整个、个体利益共同的最优。简单地说,“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。 现实中“囚徒的困境”类型的问题是很多的。例如厂商之间价格战、恶性的广告竞争,初中、中等教育中的应试教育等,其实都是“囚徒的困境”博弈的表现形式。 5、首先可根据博弈方的行为逻辑,是否允许存在有约束力协议,分为非合作博弈和合作博弈两大类。 其次可以根据博弈方的理性层次,分为完全理性博弈和有限理性博弈两大类,有限理性博弈就是进化博弈。 第三是可以根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。 第四是根据博弈问题的信息结构,根据博弈方是否都有关于得益和博弈过程的充分信息,分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈和不完全信息动态博弈几类。 第五是根据得益的特征分为零和博弈、常和博弈和变和博弈。 第六是根据博弈中博弈方的数量,可将博弈分为单人博弈、两人博弈和多人博弈。 第七是根据博弈方策略的数量,分为有限博弈和无限博弈两类。 9、(a )根据问题的假设,该博弈的得益矩阵和扩展形表示分别如下: 自 然 赚(35%) 亏(65%) 开 我 不开

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

博弈论测试题

博弈论测试题十一 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我” 个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题? 答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。 (2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。 精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。 四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发? 答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。 五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:

博弈论复习题及答案

博弈论复习题及答案 Pleasure Group Office【T985AB-B866SYT-B182C-BS682T-STT18】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些基本特点是什么 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈请求出其中的纳什均衡

答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险有什么办法可以解决道德风险问题 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 F 2 B 2 F 1 B 1 答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是H 选择F1和N 选择F2,以及H 选择B1和N 选择B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和“R ”的行动,其收益如下:当A 选左,B 选L 时,A 的收益为2 ,B 的收益为3;当A 选左,B 选R 时,A 的收益为1 ,B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1;当A 选右,B 选R 时,A 的收益为N H

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

博弈论习题及参考答案

《博弈论》习题 一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 博弈双方都失败 B.博弈双方都获胜A. C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈

博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题?

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈常包括下面的容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

博弈论试题集

(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。最后取光者得胜。 显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜。因此我们发现了如何取胜的法则:如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)的倍数,就能最后获胜。 这个游戏还可以有一种变相的玩法:两个人轮流报数,每次至少报一个,最多报十个,谁能报到100者胜。 取石子(一) 时间限制:3000ms |内存限制:65535KB 难度:2 描述 一天,TT在寝室闲着无聊,和同寝的人玩起了取石子游戏,而由于条件有限,他/她们是用旺仔小馒头当作石子。游戏的规则是这样的。设有一堆石子,数量为N (1<=N<=1000000),两个人轮番取出其中的若干个,每次最多取M个 (1<=M<=1000000),最先把石子取完者胜利。我们知道,TT和他/她的室友都十分的聪明,那么如果是TT先取,他/她会取得游戏的胜利么? 输入 第一行是一个正整数n表示有n组测试数据 输入有不到1000组数据,每组数据一行,有两个数N和M,之间用空格分隔。

对于每组数据,输出一行。如果先取的TT可以赢得游戏,则输出“Win”,否则输出“Lose”(引号不用输出) 最优解: #include using namespace std; int main() { int k; long m,n; cin>>k; while(k--)

博弈论试题集

(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。最后取光者得胜。 显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余得物品,后者取胜.因此我们发现了如何取胜得法则:如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走m+1—k个,结果剩下(m+1)(r—1)个,以后保持这样得取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)得倍数,就能最后获胜。 这个游戏还可以有一种变相得玩法:两个人轮流报数,每次至少报一个,最多报十个,谁能报到100者胜. 取石子(一) 时间限制:3000 ms | 内存限制:65535 KB 难度:2 描述 一天,TT在寝室闲着无聊,与同寝得人玩起了取石子游戏,而由于条件有限,她/她 们就是用旺仔小馒头当作石子.游戏得规则就是这样得。设有一堆石子,数量为N(1<=N<=1000000),两个人轮番取出其中得若干个,每次最多取M个(1<=M<=1000000),最先把石子取完者胜利。我们知道,TT与她/她得室友都十分得聪 明,那么如果就是TT先取,她/她会取得游戏得胜利么? 输入 第一行就是一个正整数n表示有n组测试数据 输入有不到1000组数据,每组数据一行,有两个数N与M,之间用空格分隔。 输出 对于每组数据,输出一行。如果先取得TT可以赢得游戏,则输出“Win",否则输出 “Lose”(引号不用输出) 样例输入 样例输出

最优解: #include〈iostream> using namespacestd; intmain() { int k; ?longm,n; ?cin>>k; ?while(k--) { ?cin>>n>>m; ??if(n%(m+1)==0) ??cout<<"Lose"〈〈endl; else cout〈<"Win"〈<endl; ?} } 巴什博弈变形: 有两种解,依实际情况而定: 取石子(七) 时间限制:1000 ms | 内存限制:65535 KB 难度:1

博弈论期末复习题要点

一、支付矩阵 1、试给出下述战略式表述博弈的纳什均衡 B A U D 解:由划线解得知有一个纯战略均衡(R D ,) 再看看它是否有混合战略均衡 设B 以)1,(γγ-玩混合战略,则有 均衡条件: γγγ-=-+?=2)1(21)(U V A γγγ26)1(64)(-=-+?=D V A γγ262-=- 得14>=γ,这是不可能的,故无混合战略均衡,只有这一个纯战 略均衡。 2、试将题一中的支付作一修改使其有混合战略均衡 解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。 B A U D 将博弈改成上述模型,则 )1(64)1(25γγγγ-+=-+ γγ2632-=+ 得 5 4 = γ 同样,设A 的混合战略为)1,(θθ-,则

)1(25)1(16θθθθ-+=-?+ θθ3251+=+ 2 1= θ 于是混合战略均衡为? ???????? ????? ??51,54,21,21。 二、逆向归纳法 1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a 的概率为P , 则1选L '的支付P P P 32)1(25+=-+= 1选R '的支付P P P P 3233)1(36+>+=-+=

故1必选R '。 ? 给定1在第二个决策结上选R ',2在左边决策结上会选a ,故子博弈精炼均衡 为 {}),(,,d a R L ' 四、两个厂商生产相同产品在市场上进行竞争性销售。第1个厂商的成本函数为 11q c =,其中1q 为厂商1的产量。第2个厂商的成本函数为22cq c =,其中2q 为厂商 2的产量,c 为其常数边际成本。两个厂商的固定成本都为零。厂商2的边际成本c 是厂商2的“私人信息”,厂商1认为c 在?? ????2 3,21上呈均匀分布。设市场需求函数为 214q q P --=,其中P 为价格,两个厂商都以其产量为纯战略,问纯战略贝叶斯均 衡为何? 解:给定2q ,厂商1的问题是 1 211 1)14( )1(max 1 q q q q P q ---=-=π 因)(22c q q =。厂商1不知道c ,故目标函数为 ?? ????--=---??2 /3212112 /31212112 11 )(3max )1)(4(max dc c q q q q dc q c q q q q 一阶条件: 0)(232 /3212 1 =- -? dc c q q 得 ?-=2 /3212 1)(2123dc c q q (1) 厂商2的问题是: 22 2122212 2)4( )4( )(max 2 q q q q c q c q q q c P q ---=---=-=π 一阶条件: 02)4(21=---q q c

博弈论试题

Problem set for week 7 1. In the partial equilibrium intertemporal model, assume the utility function as in the handout, and assume that the consumer lives only two periods, hence the intertemporal budget constraint is ()()111t t t t C Y r Y C ++=++? i) Derive the first order conditions for the Lagrangian optimisation problem for a consumer who chooses optimal consumption in the two periods, subject to the intertemporal budget constraint, and show that they imply the Euler Equation for optimal consumption is 111t t C r C θ ++=+ answer: ()() ()()()11111111111 1max ln ln 1subject to 1or 01hence Lagrangean is 1max ln ln 11first order conditions 101101101henc t t t t t t t t t t t t t t t t t t t t t t C C C Y r Y C C Y Y C r C Y C C Y C r C C r C Y Y C r θ λθλλθ++++?++?+?+++?+?++=++???=+??+ +???++?? ?=?=++?=+1e 111111which rearranges to give the answer. t t C r C θ+=++ iii) Assume that r = θ. Use this to show that, for sufficiently small r, ()1112 t t t t C C Y Y ++=≈+ and interpret your answer (hint, use the Euler equation and substitute into the budget constraint) Answer:

相关主题
文本预览
相关文档 最新文档