当前位置:文档之家› 博弈论习题及解答

博弈论习题及解答

博弈论习题及解答
博弈论习题及解答

※第一章绪论

§1.2

1. 什么是博弈论?博弈有哪

些基本表示方法?各种表示法

的基本要素是什么?(见教材)

2. 分别用规范式和扩展式表

示下面的博弈。

两个相互竞争的企业考虑同

时推出一种相似的产品。如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。

3. 什么是特征函数? (见教材)

4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?

原因:个体理性与集体理性的矛盾。

例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡

1. 什么是纳什均衡? (见教材)

2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。

先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。然后用划线法求出该矩阵博弈的纯策略Nash均衡。

3. 求出下面博弈的纳什均衡。

由划线法易知,该矩阵博弈没有纯策略Nash均衡。

由表达式(2.3.13)~(2.3.16)可得如下不等式组

Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1

将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。

解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}

令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)

作出三条直线,如下图,图中粗的折线,就是F(x)的图象

由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:

由公式计算得:。

所以该博弈的纳什均衡点为((2/3,1/3),(0,1/2,1/2)),博弈的值为1。

5. 用线性规划法求矩阵博弈的解。

将矩阵中的所有元素都加4,得

将数据代入(2.4.34)和(2.4.35)可得局中人1的混合策略,(0.45,0.24,0.31), 将数据代入(2.4.36)和(2.4.37)可得局中人2的混合策略,((0.31,0.24,0.45)) 6. 某产品市场上有两个厂商,各自都可以选择高质量,还是低质量。相应的利润由如下得益矩阵给出:

(1) 该博弈是否存在纳什均衡?如果存在的话,哪些结果是纳什均衡?

由划线法可知,该矩阵博弈有两个纯策略Nash均衡,即(低质量, 高质量), (高质量,低质量)。

该矩阵博弈还有一个混合的纳什均衡

Q=a+d-b-c= -970,q=d-b= -120,R= -1380,r= -630,可得??

因此该问题的混合纳什均衡为。

(2) 如果各企业的经营者都是保守的,井都采用最大最小化策略,结果如何?

?(高质量, 高质量),(低质量,低质量)。

7. 甲、乙两人就如何分100元钱进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额s1和s2,0≤s1,s2≤100。如果s1+s2≤100,则两人各自得到自己所提出的数额;如果s1+s2>100,双方均获得0元。试求出该博弈的纳什均衡。

该博弈的纳什均衡为下图的线段AB:即:s1+s2=100,s1,s2∈[0,100]。

8. 假设古诺寡头垄断模型中有n个企业,令qi表示企业i的产量,且

Q=q1+…+qn表示市场总产量,p表示市场出清价格,并假设逆需求函数由

p(Q)=a-Q给出(设Q

解:厂商i的利润为:πi=p(Q)-cqi=(a-Q-c)qi

令,则有:q=a-c-Q*? ?????????????(1)

()组成该博弈的纯策略纳什均衡点。

式(1)两边同时求和,可得:,于是,

,此时p*=a-Q*=,当n趋于无群大时,有Q*=a-c, q=0,p*=c,说明此时各厂商的产品价格等于边际成本,这时的市场已是完全竞争市场。

9. 对于下列的威慑进入博弈,首先计算垄断情况下的产量与价格组合,再计算存在竞争的情况下两企业的产量与价格组合,并对这两种情况下的结果作比较分析。假定进入者相信垄断在位者在随后的阶段将会维持它的产量水平。市场需求曲线由方程p=10-2Q给出,其中p是市场价格,Q是总的市场产量。假定在位者

和进入者有相同的总成本函数TCi=+4qi,其中i=1,2分别表示在位者和进入

者。

解:设垄断在位者的产量策略为q1,价格为p1;进入者的产量为q2,价格为p2。

其利润分别为:π1,π2。

先讨论垄断在位者不威慑的情形。

若进入者进入,各自利润为

求导得:

解得均衡时q1=q2=1,则p=8,利润为:π1=π2=。

若进入者不进入,则q2=0。

由得q1=,则相应地有p=7, π1=4。

如果垄断在位者进行威慑,由以上分析可知,如果两者都生产,则最大产量为2。所以垄断在位者采取威慑为永远取产量为2,此时,若进入者进入,均衡分析如下:

,,则有q2=,p=5, π1=,π2=0.

若进入者选择不进入:q2=0,p=6, π1=。

由以上计算分析可以看出,垄断在位者的威慑是可信的。垄断在位者的产量为2,进入者进入后无利可图,所以选择不进入。市场价格为6。

10. 甲、乙两企业分属两个国家,在开发某种新产品方面有如下收益矩阵表示的博弈关系。试求出该博弈的纳什均衡。如果乙企业所在国政府想保护本国企业利益,可以采取什么措施?

解:用划线法找出问题的纯策略纳什均衡点。

??

所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。

该博弈还有一个混合的纳什均衡((),())。

如果乙企业所在国政府对企业开发新产品补贴a个单位,则收益矩阵变为:

,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需

a>10。此时乙企业的收益为100+a。

11. 假设有一博弈G=[N,S,P],其中

N={1,2},S1=[10,20],S2=[0,15],,。试求出最优反应函数,并求出均衡点。

解:令,,得最优反应函数:

由此进一步可求得,它们在题设要求的可行域内,所以均衡点为(330/23,80/23)。

12. 证明教材中定理2.4.6。

证明:设矩阵博弈G1的纳什均衡为(X*,Y*),其中

X*=(x1,x2,…,xm),Y*=(y1,y2,…,yn),由纳什均衡的定义,有

,即。由于d是常数,因此有。显然不等式

是成立的,此即为。所以(X*,Y*)是矩阵博弈G2的纳什均衡点,并且

※第三章纳什均衡的扩展与精炼

1. 什么是完全信息和不完全信息?什么是完美信息和不完美信息?在海萨尼转换中,自然对局中人类型的确定都是有限的吗?举例说明。(见教材)

2. 什么是重复博弈中的策略?什么是一个重复博弈中的子博弈?什么是一个子博弈完美纳什均衡? (见教材)

3. 以下(虚线框中的)子博弈的划分是否正确?

答:两个扩展式中的子博弈划分均不正确,图1中的划分对同一信息集产生了分割,图2中的子博弈不是开始于单节信息集的决策结点。

4. 在双寡头古诺模型中,设逆需求函数为p=a-Q,其中Q=q1+q2为市场总需求,但a有aH和aL两种可能的情况,并且企业1知道a究竟是aH还是aL,而企业2只知道a=aH和a=aL的概率分别是θ和1-θ,该信息是双方都知道的。双方的总成本函数分别是cq1和cq2。如果两企业同时选择产量,双方的策略空间是什么?试计算出贝叶斯纳什均衡。

假设企业2的产量为q2,企业1将选择q1最大化利润函数

(这里a取aH或aL)

由此得:

企业2将选择q2最大化它的期望利润

由此得:

在均衡时,q1,q2应满足

由此得:

企业1的策略为:

企业2的策略为:

因此博弈的贝叶斯纳什均衡是:当a=aH时,企业1生产;当a=aL时,企业

1生产,企业2生产。

5. 在下面的静态贝叶斯博弈中,求出所有的纯策略贝叶斯纳什均衡。

(1) 自然决定收益情况是由博弈1给出,还是由博弈2给出,选择每一博弈的概率相等;

(2) 局中人1了解到自然选择了博弈1,还是选择了博弈2,但局中人2不知道;

(3) 局中人1选择行动T或B,同时局中人2选择行动L或R;

(4) 根据自然选择的博弈,两局中人得到相应的收益。

博弈1 博弈2

自然选择了博弈1时,局中人1选择T,自然选择了博弈2时,局中人1选择B。局中人2的策略是根据期望收益最大的原则确定。

局中人2的选择策略L的期望收益为0.5×1+0.5×0=0.5,选择策略R的期望收益为0.5×0+0.5×2=1,因此局中人2会选择策略R。

该博弈的纯策略贝叶斯纳什均衡为:自然选择博弈1时,局中人1选择T,自然选择博弈2时,局中人1选择B;局中人2会选择策略R。

6. 在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q1-q2-q3,这里qi 是企业i的产量。每一企业生产的单位成本为常数c。三企业决定各自产量的顺序如下:(1)企业1首先选择q1≥0;(2)企业2和企业3观察到q1,然后同时分别选择q2和q3。试解出该博弈的子博弈完美纳什均衡。

答:该博弈分为两个阶段,第一阶段企业1选择产量q1,第二阶段企业2和3观测到q1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈

进行求解。

(1)假设企业1已选定产量q1,先进行第二阶段的计算。设企业2,3的利润函数分别为:

由于两企业均要追求利润最大,故对以上两式分别求一阶条件:

(1)

(2)

求解(1)、(2)组成的方程组有:

(3)

(2)现进行第一阶段的博弈分析:

对与企业1,其利润函数为;

将(3)代入可得:

(4)

式(4)对q1求导:

解得:

(5)

此时,

(3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:

,

7. 如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。试问δ应满足什么条件,才存在子博弈完美纳什均衡?

由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白),均衡结果为

(1,1),采用触发策略,局中人i的策略组合s的最好反应支付

=5,Pi(s*)=4,Pi(sc)=1。若存在子博弈完美纳什均衡,必须满足:

,即只有当贴现因子>1/4时,才存在子博弈完美纳什

均衡。

8. 假设有一博弈G=[N,S,P],其中

N={1,2},S1=[0,50],S2=[0,50],,

,i=1,2。(1)求纳什均衡点;(2)在纳什均衡下的最优反应

函数;(3)若该博弈重复无限次,是否存在触发策略构成的子博弈完美纳什均衡,其条件是什么?

解:局中人1,2的最优反应函数分别为:

s1=5+1/2s2 s2=20/3+1/3s1

由此得唯一的纯策略纳什均衡点:sc=(10,10).相应的有P(sc)=(1000,1500). 容易求得s*=(35,30),相应的有P(s*)=(1750,3000),.

当时,存在触发策略构成的子博弈完美纳什均衡(s*,sc)

9. 求如图所示完全信息动态博弈的子博弈完美纳什均衡(图中数字(a,b,c)分别表示局中人1、2、3的收益)。

答:局中人1采取A2行动,局中人2采取行动B1时,局中人3必然采取C2行动(因为3<6),因而该博弈的顶点只能是(7,6,6)。同样对于局中人3右边一个子博弈,必然采取C1行动(9>2),因而该博弈的顶点只能是(2,1,9)。进而原博弈简化为:

这时,假设局中人1采取行动A1,对于左边一个子博弈,局中人3必定采取行动C2(3<8),因而在该子博弈顶点的结果只会是(1,7,8).同样,若局中人1采取行动A2,此时局中人2必然采取行动B1(6>1),因而在该子博弈顶点的结果只会是(7,6,6).进而,该博弈又简化为:

这时,局中人1必然选择行动A2(1<7)。由于局中人1选择A2时,局中人2选择B1,进而局中人3选择C2。因此,策略组合

(A2,B1,((A1,C2),(B1,C2),(B2,C1)))构成整个博弈的子博弈完美纳什均衡(这里(A1,C2)表示如果局中人1选择A1,则局中人3选择C2,对(B1,C2),(B2,C1)的解释类似)。

10. 考虑如下诉讼威胁博弈。

如果提起诉讼的话,局中人1为原告,局中人2为被告,博弈顺序如下:(1) 原告决定是否指控被告,指控的成本是c1;(2) 如果决定指控的话,在告上法庭之前,原告提出一个无协商余地的赔偿金额s以私了;(3) 被告决定接受还是拒绝原告的要求;(4) 如果被告拒绝原告的要求,原告决定是放弃还是上法庭,自己的成本是c2,给被告带来的成本是d;(5) 如果告上法庭,原告以概率P胜诉而获得赔偿r,否则什么也得不到。

试问胜诉概率P满足什么条件时,原告的诉讼威胁才是可信的?

一)局中人1不指控局中人2时两个人的收益均为0

二)局中人1决定指控局中人2,在告上法庭之前,局中人1提出一个无协商余地的赔偿金额s以私了,

(1)当局中人2接受要求时局中人的收益为s-c1;局中人2的收益为-s;

(2)当局中人2拒绝局中人1的要求,

1)局中人1放弃上诉时,局中人1的收益为-c1,局中人2的收益为0;

2)当局中人1起诉时,局中人1的期望收益为Pr-(c1+c2);局中人2的期望收益为-Pr-d

因此,当局中人1的期望收益Pr-(c1+c2)>max{0,s-c1},即P>max{(c1+c2)/r, (s+c2)/r}时原告的诉讼威胁是可信的。

11. 在伯川德模型中,假定有n个生产企业,需求函数为(b>0),其中pi是企业i的定价,qi是企业i的需求量。假设企业生产没有固定成本,并且边际成本为常数c,c

分以下几个步骤进行。

1)计算纳什均衡

当企业i选择价格pi,其它企业选择价格pj(j=1,2,…,n,j≠i)时,企业i的利润为:

,i=1,2,…,n

价格组合()若是纳什均衡,则对每个企业i,应是如下最优问题

的解:

求解该问题,得;

i=1,2,..,n

解该方程组,得:,i=1,2,…,n

企业i的利润为:

2) 计算垄断情况下的价格

若n家企业合并为一家,即形成垄断价格,则n家企业的价格相同,即

p1=p2=…=pn.

可求得总利润最大时的价格为:

那么每个企业的利润为(这里(n-1)b<1)

易证,即在垄断价格下,各企业的利润增加了。

3) 计算使垄断价格可以作为完美均衡结果出现的最低贴现因子δ,并解释δ与n的关系。

当时,触发策略(p*,pc) 是子博弈完美纳什均衡.

12. 有一在位企业生产某种产品,其成本可能低,也可能高。该企业可以选择低价或高价两种策略。另一企业准备进入生产同类产品,但完全不知道在位企业的生产成本是高还是低,只能观察到其价格是低价还是高价。其具体收益见下面博弈的扩展式表述。求该博弈的子博弈完美贝叶斯纳什均衡。

该题的求解与第115页例题类似。

13.求例3.4.1的子博弈完美贝叶斯纳什均衡。

※第四章谈判与协调

1. 帕累托占优均衡和纳什均衡的关系是什么?

纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈

中,若均为G的其纳什均衡,若满足

则称为博弈G的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡

中收益最大的一种均衡。

2. 分别找出具有下列性质的2人博弈的例子。 (1) 不存在纯策略纳什均衡;

(2) 至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1)不存在纯策略的纳什均衡:

该博弈不存在纯策略的纳什均衡 (2)

该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均衡

。很显然,(和平,和平)是一个帕累托占优

纳什均衡。

3. 假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC1=0.1q +20q1+100000 TC2=0.4q +32q2+20000

这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由

所以:

求解方程组得

将,代入到,中去得到最优解

4. 你能否对如下的CG-2×2博弈中x的变化设计出一些实验方案,来讨论是帕累托占优思想还是风险占优思想在策略选择中起主要作用。

设计试验

(1) a

(2)x.>1000 这时是帕累托占优思想起主要作用。都会选择行动2。

※第五章合作博弈

1. 设三人联盟博弈的特征函数v的值是:

v({i})=0,i=1,2,3;v({1,2})=2/3,v({1,3})=7/12,v({2,3})

=1/2, v({1,2,3})=1。求出该联盟博弈的核心,并用图形表示出来。

2. 假设有一3人合作博弈,其特征函数为:v({1, 2,

3})=200,v({1,2})=150,v({1,3})=110,

v({2,3})=20,v({1})=100,v({2})=10,v({3})=0。计算该合作博弈的Shapley值,核心,最小ε-核心,稳定集,内核和核仁。

3. 考虑有如下特征函数v的4人合作博弈:

v({1,2, 3, 4})=2,v({1, 2, 3})= 1, v({1, 2, 4})=2, v({1, 3, 4})=0, v({2,

3, 4})=1,v({1, 2})=0, v({1,3})=-1,

v({1,4})=1,v({2,3})=0,v({2,4})=1,v({3,4})=0,v({1})=-1,v({2})=0,v({3}) =-1,

v({4})=0.

4. 证明下面的10人博弈v不具有稳定集。

设N={1,2,…,10},N上博弈v的特征函数为:

v(N)=5,v({1,3,5,7,9})=4,v({3,5,7,9})=v({1,5,7,9})=v({1,3,7,9})=3,v({1 ,4,7,9})=v({3,6,7,9})=v({2,5,7,9})=2,v({3,5,7})=v({1,5,7})=v({1,3,7}) =2,v({3,5,9})=v({1,3,9})=v({1,5,9})=2,v({1,2})=v({3,4})=v({5,6})=v({7 ,8})=v({9,10})=1,v({i})=0,i∈N,v(S)=0,对任意其它的联盟S N。

5. 五个人(分别用1,2,3,4,5表示)拟合伙开公司,经测算,一年可获利润100万。你认为应如何分配?试用合作博弈的方法给出此问题的分配方案。

6. 某矿业集团下属有四个矿,这四个矿都需要建立一个水处理厂以处理矿井水,方案有两种:(1)各家单独建站;(2)四家联合兴建一个大型的水处理厂,用管道把矿井水输送到总站集中处理。经估算,合建一个大型水处理厂,加上敷设管道的费用,要比单独建四个小厂的总费用少。这样四家有意台作兴建一个大厂,使总费用碱少从而也使各自的建设费用减少。但合建大厂的方案能否实施,显然要看总的建设费用分摊得是否合理。如果某个矿分摊到的费用比单独建厂的费用还多,它显然不会接受合作的方案。问题是如何合理地分摊费用,使合怍兴建大厂的方案得以实现。

经测算得知,建设水厂的费用主要由三部分组成。土建、设备和管道;在该矿区建设一个大型水厂的总投资费用为318万元。如单独建厂,1矿需投资166万元;2矿需投资63万元;3矿需投资120万元;4矿需投资100万元。进一步测算得具体数据如下:

C(N)=318,C(Φ)=0,C({1})=l66,C({2})=63,C({3})=120,C({4})=l00,C({1,2})= 200, C({1,

3})=228,C({1,4})=226,C({2,3})=150,C({2,4})=150,C({3,4})=175,C({1,2,3} )=258,C({1,2,

4})=280,C({2,3,4})=230,C({1,3,4})=285.

这里C({i,j})和C({i,j,k})分别表示第i,j个矿和第i,j,k个矿联合建厂时所发生的费用(i,j,k=

1,2,3,4) ,C(N)表示所有四家工厂联合时的费用,C({i})表示第i个矿单独建厂时的费用,C(Φ)表示不建厂时的情形。

博弈论期末习题

《博弈论》期末习题 专业:经济学学号:2 ;姓名:王兆丽 一、试写出掷硬币博弈的局中人及其策略与得益函数,并写出双变量得 益矩阵。 答:局中人:盖硬币者和猜硬币者。 策略:有正面和反面两种可选择策略,若猜对,猜者得1盖者-1.否则猜者-1盖者1.由于每一方都不会让对方在选择之前知道自己的决策,所以可以看做是同时做决策的。 双变量得益矩阵; 猜硬币方 二、试举生活中的一例,说明囚徒困境是如何产生的?并试分析可能走 出囚徒困境的途径。 答:例子:中国移动和中国联通之间的价格战。 产生原因:囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。 可能走出的囚徒困境途径:(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚,那么就会制止这种现象发生。(2)忠诚文化。有时候,建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中,团体产生所面临的囚徒困境问题的轻重程度是不同的,这种差异的根本来源就是各个组织有自己的文化。(3)长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财,合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。 答:1、该博弈共包括四个子博弈:(1)从博弈方1选择R 以后博弈方2的第二 阶段选择开始的三阶段动态博弈;(2)从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈;(3)第三阶段博弈方1选择A 以后博弈方2 的单人博弈;(4)第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中 任何一个的得益都相同,因此在这阶段随意选择一个都可以。倒退回第三阶段, 博弈方1选择AB中任何一个都可以。再推回第二阶段,博弈方2选择L将得到 3选择R得到2,因此选择L;最后回到第一阶段,博弈方1选择L得到2选择 R得到3,。所以该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择R, 博弈方2第二阶段选择L,即(3,1)是该博弈的完美纳什均衡。 四、两个寡头企业进行价格竞争博弈,企业1的利润函数是 q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1 的价格,q 是企业2的价格。求: 1.两个企业同时决策的纯战略纳什均衡; 两个企业同时定价。根据两个企业的得益函数,很容易导出它们各自的反应 函数:απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

博弈论第七章习题

第七章习题 一、判断下列表述是否正确,并作简单分析 (1)海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈,说明有了海萨尼转换,不完全信息静态博弈和一般的不完美信息动态博弈是等同的,不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。 答:错误。即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈,也是一种特殊的有两个阶段同时选择的不完美信息动态博弈,对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。 (2)完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。 答:正确。完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。 (3)证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。 答:正确。我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。与一般双方报价拍卖的区别只是交易对象,标的不是一件而是有许多件。 (4)静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型,都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。

答:错误。不是因为能够迷惑其他博弈方,而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略,从而也就无法找出自己的最优策略。其实,在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选择,其他博弈方也会替他考虑。因为设定自己所有类型下的行为,实际上是要弄清楚其他博弈方对自己策略的判断。 (5)“鼓励—响应”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。 答:错误。“鼓励—响应”机制也就是说真话的直接机制,实际上只保证博弈方揭示,也就是说出自己的真实类型。 博弈方不直接选择行为,也不保证根据真实类型行为,更谈不上一定能实现最理想的结果。因为直接机制的结果常常是带有随机选择机制的,并不一定理想。实际上对所有博弈方都理想的结果在静态贝叶斯博弈中本身不一定存在。 二、双寡头古诺模型,倒转的需求函数为 ()P Q a Q =-, 其中12Q q q =+为市场总需求,但a 有h a 和l a 两种可能的情况,并且厂商1知道a 究竟是h a 还是l a , 而厂商2只知道h a a =的概率是θ, l a a =的概率是1θ-,这种信息不对称情况双方都是了解的。双方的总成本仍然是i i i c q cq =。如果两厂商同时选择产量,问双方的策略空间是什么?本博弈的贝叶斯纳什均衡是什么? 解:设厂商1已知h a a =时的产量为11()h q a q =,已知l a a =时的产量是11()l q a q =;再假设厂商2的产量是 2q ,这两个函数关系就是两个厂商的策略空间。 11211()h h h h h a q q q cq π=---

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

博弈论复习题及标准答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。( ) 博弈中知道越多的一方越有利。( ×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。 (×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√ ) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√ ) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论复习题及答案

囚徒困境说明个人得理性选择不一定就是集体得理性选择。(√) 子博弈精炼纳什均衡不就是一个纳什均衡。(× ) 若一个博弈出现了皆大欢喜得结局,说明该博弈就是一个合作得正与博弈.()博弈中知道越多得一方越有利。( ×) 纳什均衡一定就是上策均衡。(× ) 上策均衡一定就是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。 (×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√) 在博弈中纳什均衡就是博弈双方能获得得最好结果。 (× ) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少. (×)上策均衡就是帕累托最优得均衡。(×) 因为零与博弈中博弈方之间关系都就是竞争性得、对立得,因此零与博弈就就是非合作博弈。 (×) 在动态博弈中,因为后行动得博弈方可以先观察对方行为后再选择行为,因此总就是有利得。(×) 在博弈中存在着先动优势与后动优势,所以后行动得人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒得困境博弈中两个囚徒之所以会处于困境,无法得到较理想得结果,就是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢得时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益得策略组合.(√)不存在纯战略纳什均衡与存在惟一得纯战略纳什均衡,作为原博弈构成得有限次重复博弈,共同特点就是重复博弈本质上不过就是原博弈得简单重复,重复博弈得子博弈完美纳什均衡就就是每次重复采用原博弈得纳什均衡。(√ ) 多个纯战略纳什均衡博弈得有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略与纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)得子博弈完美均衡结局,其中对于任意得t<T,在t阶段得结局并不就是G得Nash均衡.(√)(或:如果阶段博弈G={A1,A2,…,An; u1,u2,…,un)具有多重Nash均衡,那么该重复博弈G(T)得子博弈完美均衡结局,对于任意得t<T,在t阶段得结局一定就是G得Nash均衡。) 零与博弈得无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈得混合战略纳什均衡.(√)(或:零与博弈得无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈得混合战略纳什均衡.(×)) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈得纯战略纳什均衡本身就是各局中人能实现得最好结果,符合所有局中人得利益,因此,不管就是重复有限次还就是无限次,不会与一次性博弈有区别。(√) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一得纳什均衡不就是效率最高得战略组合,存在潜在合作利益得

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论习题及解答

※第一章绪论 §1.2 1. 什么是博弈论?博弈有哪 些基本表示方法?各种表示法 的基本要素是什么?(见教材) 2. 分别用规范式和扩展式表 示下面的博弈。 两个相互竞争的企业考虑同 时推出一种相似的产品。如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。 3. 什么是特征函数? (见教材) 4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子? 原因:个体理性与集体理性的矛盾。 例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡 1. 什么是纳什均衡? (见教材) 2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。 先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。然后用划线法求出该矩阵博弈的纯策略Nash均衡。 3. 求出下面博弈的纳什均衡。 由划线法易知,该矩阵博弈没有纯策略Nash均衡。 由表达式(2.3.13)~(2.3.16)可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1 将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。 解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)} 令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x) 作出三条直线,如下图,图中粗的折线,就是F(x)的图象

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

博弈论习题及参考答案

《博弈论》习题 一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 博弈双方都失败 B.博弈双方都获胜A. C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题 5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。 假设前提 假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程 从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。 3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。 不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。 同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。分析 1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。 不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。 如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方案岂不成了自掘坟墓! 再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5

博弈论复习题及答案

名词解释(每题7 分,共 2 8 分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10 分,共40 分) 1、博弈的基本要素有哪些? 基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。

3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能 猎到所 需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题? 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代 理人行 动,造成信息不对称,从而出现代理人选择不利于委托人的行 为的一种现 象;解决道德风险的方法可以用签订合同、派人监督,以 及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 H B i 答:根据上方的矩阵图, 我们可得出其博弈中存在两种策略的纳 什均衡:分别是 H 选择F1和N 选择F2,以及H 选择B1和N 选择 B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和R ”的行动,其收益如下:当 A 选左,B 选L 时,A 的收益为2,B 的收益为3 ;当A 选左,B 选R 时,A 的收益为1 , B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1 ; 当A 选右,B 选R 时,A 的收益为0,B 的收益为2。请画出该博弈 的博弈树,并求出该博弈的均衡解。 四、论述题(16分) 1、请结合你的工作或生活,谈谈对行动的可信性的理解,有什么方 法可以建立可信的策略行动。 答:每一种策略性行动都面临着可信性的问题, 人们不一定相信 策略性行动的提出者会实施其行动。 因此提出者必须做一些辅助工作 F 2 B 2

博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题?

相关主题
文本预览
相关文档 最新文档