当前位置：文档之家› 博弈论基础作业及答案

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业

一、名词解释

纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡

贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识

见PPT

二、问答题

1.举出囚徒困境和智猪博弈的现实例子并进行分析。

囚徒困境的例子：军备竞赛；中小学生减负；几个大企业之间的争相杀价等等；

以中小学生减负为例：在当前的高考制度下，给定其他学校对学生进行减负，一个学校最好不减负，因为这样做，可以带来比其他学校更高的升学率。给定其他学校不减负，这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此，不论其他学校如何选择，这个学校的最佳选择都是不减负。每个学校都这样想，所以每个学校的最佳选择都是不减负，因此学生的负担越来越重。

请用同样的方法分析其他例子。

智猪博弈的例子：大企业开发新产品；小企业模仿；股市中，大户搜集分析信息，散户跟随大户的操作策略

以股市为例：给定散户搜集资料进行分析，大户的最佳选择是跟随。而给定散户跟随，大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随，散户的最佳选择都是跟随。因此如果大户和散户是聪明的，并且大户知道散户也是聪明的，那么大户就会预见到散户会跟随，而给定散户跟随，大户只有自己分析。

请用同样的方法分析其他例子。

2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。

破釜沉舟是一个承诺行动。目的是要断绝自己的退路，让自己无路可退，让自己决一死战变得可以置信。也就是说与敌人对决时，只有决一死战，这样才可以取得胜利。否则，如果不破釜沉舟，那么遇到困难时，就很有可能退却，也就无法取得胜利。穷寇勿追就是要给对方一个退路，由于有退路，对方就不会殊死抵抗。否则，对方退无可退，只有坚决抵抗一条路，因而必然决一死战。自己也会付出更大的代价。

3.当求职者向企业声明自己能力强时，企业未必相信。但如果求职者拿出自己的各种获奖证书时，却能在一定程度上传递自己能力强的信息。这是为什么由于口头声明几乎没有成本，因此即便是能力差的求职者也会向企业声明自己能力强。当然能力强的人也会声明自己的能力强。也就是说不同类型的求职者为了赢得职位会做出同样的声明。这样口头声明就不能有效的传递信息，因此企业不会轻易相信。而求职者拿出获奖证书就成了一个信号博弈。由于获得证书是要付出代价的，但代价却引人而异。能力强的个人可以相对轻易获得证书，而能力弱的个人却很难获得证书，以至于能力弱的人认为化巨大的代价获得证书，从而获得企业的职位是不划算的，因此干脆就不要获奖证书。因此获奖证书就成为个人能力的信号。

4.五个海盗抢得100颗钻石,他们为分赃发生了争议,最后达成协议,由抓阄确定出分赃顺序，然后按照民主程序进行分赃。首先由1号海盗提出分赃方案,五人共同举手表决。若赞成的占一半以上（不包括一半的情况）,就按1号提出的方案分赃,否则1号将被扔到海里喂鲨鱼。接着由2号提出方案, 四人共同举手表决。若赞成的占一半以上（不包括一半的情况）,就按2号提出的方案分赃,否则2号将被扔到海里喂鲨鱼,依此类推。如果你是1号海盗,你该提什么样的方案说明理由。

假设（1）五个强盗都很聪明，而且大家知道大家很聪明，大家知道大家知道大家很聪明，如此等等。

（2）每个海盗都很贪婪，希望获得尽可能多的钻石，但是又不想为了钻石丢掉性命。

（3）给定一个方案，只有该方案大于他的备选方案所获的钻石时，海盗才选择赞成。

第一个海盗的提议应该是：五个海盗分别获得的钻石数目为97，0，1，0，2，或者97，0，1，2，0。

具体理由自己思考，方法是倒推法。三、计算题

1.试计算表1中的战略式博弈的重复剔除劣战略均衡。

表1 一个战略式表述博弈

U M

D 对B 而言，战略M B 的战略M ；构成新的博弈如下

A U M

在新的博弈中，

对于A 而言，战略U 严格劣于D(因为1<3,2<7)，因此剔除A 的战略U ，构成新的博弈如下：

D 对于新的博弈中，已经没有严格该博弈不是重复剔除严格劣战略可解的。

但是存在弱劣战略。对于B 而言，战略L 弱劣于R （因为6=6，1<8）,因此剔除B 的弱劣战略L ，构成新的博弈如下：

D 在新的博弈中，对于A 而言，战略M 2<7）,因此剔除A 的战略M ，构成新的博弈如下：

因此，重复剔除（弱）劣战略均衡为（D ，R ）

（ps: 如果同学们用划线的方法求纳什均衡，就可以发现纯战略nash 均衡有两个：（M,L ）和（D,R ）但采用剔除弱劣战略的方法，把其中一个纳什均衡剔除掉了）

2. 试给出下述战略式表述博弈的所有纳什均衡。

给定1选择U ，2的最佳选择是R(给定1选择D ，2的最佳选择是L （因为4>2），在相应位置划线给定2选择L ，1的最佳选择是D （理由自己写），在相应位置划线给定2选择R ，1的最佳选择是U （理由自己写），在相应位置划线找两个数字下都划线的，显然有两个纯战略纳什均衡：),(R U 和),(L D 据Wilson 的奇数定理，可能有一个混合战略均衡。设1选U 的概率为θ，那么选D 的概率为θ-1 设2选L 的概率为γ，那么选R 的概率为γ-1，

如果存在混合战略，那么2选战略L 和R 的期望收益应该应该相等，因此应有

)1(23)1(42θθθθ-+==-+=R L U U

?=θ 自己求解（2分）同样，1选战略U 和D 的期望收益应该应该相等得混合均衡：

3.市场里有两个企业1和2。每个企业的成本都为0。市场的逆需求函数为P=16-Q 。其中P 是市场价格，Q 为市场总产量。

（1）求古诺（Cournot ）均衡产量和利润。

（2）求斯坦克尔伯格（Stackelberg ）均衡产量和利润。

(1)设两个企业的产量分别为1q ，2q ，有21q q Q +=，因此利润函数分别为：利润最大化的一阶条件分别为：因此企业1和企业2的反应函数分别为：联立，得到?21==q q 。自己求解

（2）设企业1先行，企业2跟进。两个企业的产量分别为1q ，2q ，因此利润函数分别为：

由逆向归纳法，在第二阶段，企业2在已知企业1的产量的情况下，最优化自己的产量，从而得到企业2的反应函数：因此企业2的反应函数为：2

161

2q q -=

在第一阶段，企业1考虑到企业2的反应，从而自己的利润函数为：

16(1616)16(1

1211212111211q q q q q q q q q q q ---=--=--=π （2分）要使企业1的利润最大，应满足一阶条件：01

=??q π 得到?1=q 。

所以?2=q 。

（PS: 古诺模型是完全信息静态博弈，求的是纳什均衡；斯坦伯格模型是完全信息动态博弈，求的是子博弈精炼纳什均衡）

4.（1）试给出图1中的完全信息动态博弈的子博弈精炼均衡和均衡结果。（2）倘若2告诉1：2的战略是),,(j i c ，问此时1的最优战略是什么（3）在（2）中，1和2的

战略组合构成一个纳什均衡吗均衡结果是什么（4）（3）中的纳什均衡不是子博弈精炼的，原因是什么

答：（1）（由逆向归纳法，子博弈精炼均衡为，均衡结果为（4，6）。（2）若2的战略为),,(j i c ，则1的最优战略为),(f b 。

（3）给定2的战略为),,(j i c ，1的最优战略为),(f b ；反之，给定1的战略

),(f b ，战略),,(j i c 是2的一个最优战略。所以它们构成一个纳什均衡，均衡结果为

（6,3）。

（4）因为2的战略),,(j i c 中含有不可置信的威胁i ，使1在f 和g 之间不敢选g 。当博弈进行到2在l 与i 之间进行选择的时候，2必会选l ，给定如此，1选g 而不是f ，此时2会选e ，这就是子博弈精炼均衡。

5、试解出下述不完美信息动态博弈的精炼贝叶斯均衡。 1 R

L 2

当“2”看见“1”， “1”选L '的概率为1－P ，则“2”选l “2”选r 的期望支付为

当P P ->+231，即4

P 时，“2”选l ，而给定“2”选l ，“1”选L 收益为2，选L '的收益为3，选R 的收益为1，因此“1”会选L '。而给定“1”选L '，“2”认为4

=P （注意：P 是“1”选L 的概率），与41>P 矛盾。故4

>P 不会有均衡；

当P P -≤+231，即4

≤P 时，“2”选r ，给定“2”选r ，“1”选L 收益为0，选L '的

收益为7，选R 的收益为1，因此“1”会选L '。而给定“1”选L '，“2”认为0=P ，与

≤P 吻合。于是，得到均衡战略：{}r P L ,0,='，即“1”在第一阶段选择L '，“2”虽然看

不到“1”的选择，但“2”认为“1”选择L 的概率为0，所以“2”在第二阶段选择r ，这样的战略构成了一个贝叶斯精炼纳什均衡。均衡结果为（7，2）。

博弈论作业汇总

第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作，每家企业只有一个工作岗位。工作申请规则如下：每个学生只能向其中一家企业申请工作；如果一家企业只有一个学生申请，该学生获得工作；如果一家企业有两个学生申请，则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足：W1/2

博弈论期末习题

《博弈论》期末习题专业：经济学学号：2 ；姓名：王兆丽一、试写出掷硬币博弈的局中人及其策略与得益函数，并写出双变量得益矩阵。答：局中人：盖硬币者和猜硬币者。策略：有正面和反面两种可选择策略，若猜对，猜者得１盖者－１.否则猜者－１盖者１.由于每一方都不会让对方在选择之前知道自己的决策，所以可以看做是同时做决策的。双变量得益矩阵；猜硬币方二、试举生活中的一例，说明囚徒困境是如何产生的？并试分析可能走出囚徒困境的途径。答：例子：中国移动和中国联通之间的价格战。产生原因：囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整体、个体利益共同的最优。简单的说，囚徒困境问题都是个体理性与集体理性的矛盾引起的。可能走出的囚徒困境途径：(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚，那么就会制止这种现象发生。（2）忠诚文化。有时候，建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中，团体产生所面临的囚徒困境问题的轻重程度是不同的，这种差异的根本来源就是各个组织有自己的文化。（3）长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复，如果这个“多次”足够长，那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财，合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。答：1、该博弈共包括四个子博弈：（1）从博弈方1选择R 以后博弈方2的第二阶段选择开始的三阶段动态博弈；（2）从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈；（3）第三阶段博弈方1选择A 以后博弈方2 的单人博弈；（4）第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中任何一个的得益都相同，因此在这阶段随意选择一个都可以。倒退回第三阶段，博弈方1选择ＡＢ中任何一个都可以。再推回第二阶段，博弈方２选择Ｌ将得到３选择Ｒ得到２，因此选择Ｌ；最后回到第一阶段，博弈方１选择Ｌ得到２选择Ｒ得到３,。所以该博弈的子博弈完美纳什均衡为：博弈方１第一阶段选择Ｒ，博弈方２第二阶段选择Ｌ，即（３,１）是该博弈的完美纳什均衡。四、两个寡头企业进行价格竞争博弈，企业1的利润函数是 q c aq p ++--=21)(π，企业2的利润函数是p b q +--=22)(π，其中p 是企业1 的价格，q 是企业2的价格。求： 1．两个企业同时决策的纯战略纳什均衡；两个企业同时定价。根据两个企业的得益函数，很容易导出它们各自的反应函数：απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

博弈论作业

博弈论作业一、下面的得益矩阵表示博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡？博弈的结果是什么？博弈方 2 L C R 博弈 T 方 M 1 B 答：此博弈有两个纳什均衡：1、ML 得益（3，4） 2、TR 得益（4，2）二、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡与得益。博弈方 2 L R 博弈 T 方 B 1 答：（一）求混合策略均衡 1、博弈方1的概率P 则对博弈方2而言，有 1×P ＋2（1－P ）＝2×P ＋0（1－P ） 2－P ＝2P P ＝2／3 当P ﹤2／3，2－P ﹥2P ，则q ﹡＝1是最合适的策略,即选择L 。当P ＝2／3，2－P ＝2P ，则q ﹡∈（0，1）是最适合反应。当P ﹥2／3，2－P ﹤2P ，则q ﹡＝0是最适合策略，即选择R 。 2、给定博弈方2的概率q 则对博弈方1而言，有 2×q ＋0（1－q ）＝1×q ＋3（1－q ） 2q ＝3－2q q ＝3／4 当q ﹤3／4，2q ﹤3－2q ，则P ﹡＝0是最合适的策略,即选择B 。当q ＝3／4，2q ＝3－2q ，则P ﹡∈（0，1）是最适合反应。

当q﹥3／4，2q﹥3－2q，则P﹡＝1是最适合策略，即选择T。所以：混合策略的均衡点为（2／3，3／4）。（二）得益： ∪1＝2×P×q＋0×P×(1－q)＋1×(1－P)×q ＋3(1－P)(1－q) ＝2×2／3×3／4＋1×1／3×3／4＋3×1／3×1／4 ＝3／2 ∪2＝1×P×q＋2×P×(1－q)＋2×(1－P)×q ＋0(1－P)(1－q) ＝1×2／3×3／4＋2×2／3×1／4＋2×1／3×3／4 ＝4／3 三、设一四阶段两博弈方之间的动态博弈如下图所示。试找出全部子博弈，求子博弈完美纳什均衡策略组合和博弈的结果。答：依据逆推归纳法得出：此博弈均衡为b，得益（5，3）；路径为b, d, e, h。四、两次重复下面的得益矩阵表示的静态博弈。设计一个处罚策略。博弈方 2 L R S 博弈 T 方 M 1 B

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料第一章导论 1.博弈的概念：博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，并从中各自取得相应结果的过程。它包括四个要素：参与者，策略，次序和得益。 2.一个博弈的构成要素：博弈模型有下列要素：(1)博弈方。即博弈中决策并承但结果的参与者．包括个人或组织等：(2)策略。即博弈方决策、选择的内容，包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序：次序不同一般就是不同的博弈，即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果，可以是经济利益，也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别：合作博弈：允许存在有约束力协议的博弈；非合作博弈：不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时，当事人能否达成一个具有约束力的协议。假设博弈方是两个寡头企业，如果他们之间达成一个协议，联合最大化垄断利润，并且各自按这个协议生产，就是合作博弈。如果达不成协议，或不遵守协议，每个企业都只选择自己的最优产品（价格），则是非合作博弈。合作博弈：团体理性（效率高，公正，公平）非合作博弈：个人理性，个人最优决策（可能有效率，可能无效率） 4.完全理性和有限理性: 完全理性：有完美的分析判断能力和不会犯选择行为的错误。有限理性：博弈方的判断选择能力有缺陷。区分两者的重要性在于如果决策者是有限理性的，那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距，以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性：个体理性：以个体利益最大为目标；集体理性：追求集体利益最大化。第一章课后题：2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方，即博弈中进行决策并承担结果的参与者;(2)策略(空间)，即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等;(3)得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量;(4)博弈次序，即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构，即博弈方相互对其他博弈方行为或最终利益

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业一、名词解释纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。囚徒困境的例子：军备竞赛；中小学生减负；几个大企业之间的争相杀价等等；以中小学生减负为例：在当前的高考制度下，给定其他学校对学生进行减负，一个学校最好不减负，因为这样做，可以带来比其他学校更高的升学率。给定其他学校不减负，这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此，不论其他学校如何选择，这个学校的最佳选择都是不减负。每个学校都这样想，所以每个学校的最佳选择都是不减负，因此学生的负担越来越重。请用同样的方法分析其他例子。智猪博弈的例子：大企业开发新产品；小企业模仿；股市中，大户搜集分析信息，散户跟随大户的操作策略以股市为例：给定散户搜集资料进行分析，大户的最佳选择是跟随。而给定散户跟随，大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随，散户的最佳选择都是跟随。因此如果大户和散户是聪明的，并且大户知道散户也是聪明的，那么大户就会预见到散户会跟随，而给定散户跟随，大户只有自己分析。请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。破釜沉舟是一个承诺行动。目的是要断绝自己的退路，让自己无路可退，让自己决一死战变得可以置信。也就是说与敌人对决时，只有决一死战，这样才可以取得胜利。否则，如果不破釜沉舟，那么遇到困难时，就很有可能退却，也就无法取得胜利。穷寇勿追就是要给对方一个退路，由于有退路，对方就不会殊死抵抗。否则，对方退无可退，只有坚决抵抗一条路，因而必然决一死战。自己也会付出更大的代价。

博弈论基础作业及答案【最新资料】

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是：每一个局中人选择一个策略，由所有局中人的策略构成了一个策略组合；在其它局中人选定策略不变的情况下，若某一个局中人单独地违背自己已选的策略，那么他的收益只会下降（或收益不会增加）。这样的策略组合构成一个均衡局势，并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时，就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈中，若均为G 的其纳什均衡，若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?，0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡； (2)至少有两个纳什均衡，并且其中之一是帕累托占优均衡。（1 ）不存在纯策略的纳什均衡：该博弈不存在纯策略的纳什均衡（2）该博弈有三个纳什均衡：（战争，战争）、（和平，和平）和一个混合策略纳什均衡。很显然，（和平，和平）是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业，它们的成本函数分别为： TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品，其市场需求函数为：Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。解：由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争和平国家 1战争-5，-58，-10和平-10，810，10

博弈期末考试总结

博弈与决策答案一、名词解释（每小题2分，共16分） 1、博弈博弈是指一些个人、团队或其他组织，面对一定的环境条件，在一定的规则约束下，依靠掌握的信息，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以施，并从中各自取得相应结果或收益的过程， 2、占优战略均衡占优战略均衡是指在博弈中，如果所有参与人都有占优策略存在，博弈将在所有参与人的优策略的基础上达到均衡． 3、重复博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题， 4、序列博弈序列博弈是指对局者选择策略有时问先后的顺序，某些对局者可能率先采取行动．序列博也是一种动态博弈． 5、动态博弈动态博弈是指在博弈中，参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动． 6、占优战略均衡--占优战略均衡是指在博弈中，如果所有参与人都有占优策略存在，博弈将在所有参与人的占优策略的基础上达到均衡． 7、完全信息---完全信息是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息． 8、得益得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西． 9，博弈论：博弈论就是系统的研究各种各样的博弈问题，寻求各博弈方合理选择策略的情况下博弈的解，并对这些解进行讨论分析的理论。 10，纳什战略均衡：纳什战略均衡指在均衡中，每个博弈参与人都确信，在给定其他参与人选择的策略的情况下，该参与人选择了最优策略以回应对手的策略。 11，静态博弈：静态博弈是指在博弈中，参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体行动。二、、简答题（每小题6分，共24分） 1、占优战略均衡和纳什均衡的联系与区别如下： 1)每一个占优战略均衡都是纳什均衡，而每一个纳什均衡却未必是占优战略均衡； 2)用重复剔除严格劣战略方法，保留下的唯一的重复剔除的占优均衡，就是纳什均衡． 3)纳什均衡，不会被重复剔除严格劣战略方法剔除掉（但弱劣战略剔除，可能会剔除纳什衡）： 4)经重复剔除严格劣战略之后，有不唯一的多个哉略组合保留，其中有的战略组合不一定纳什均衡．即重复剔除严格劣战略方法，无法确保将所有非纳什均衡战略剔除，没有被剔的战略组合不一定是纳什均衡． 5)没有占优战略均衡的博弈，不能用重复剔除严格劣战略方法求解的博弈，可以有纳什均衡2，博弈的构成要素有哪些？并对其进行说明。 2、博弈一般由以下几个要素组成，包括：参与人、行动、信息，策略、得益、结果、均衡等．

博弈论试题及答案

诚信考试沉着应考杜绝违纪《博弈论》试卷课堂周四（7/8）院系专业万方电气系通信工程学号余数 0 姓名

河南理工大学2010–2011学年第1学期《博弈论》课程期末考试试卷开课学院：经济管理学院，考试形式：开卷，允许带___________入场考试时间：2010年12月25日－12月25日, 所需时间：周考生姓名：学号：专业：题序一二三四五六七八总分得分评卷人 1、第一题：（10分）（1）举一个你所经历情侣博弈的情形，在实际博弈中你采取什么行动让自己收益最大；答：作为一个男生，我想很多机会都是把握在自己手中的，情侣博弈有二个“纳什均衡”，一次博弈的结局究竟落到哪一个“纳什均衡”，关键就是要看遇事时自己如何去选择了。例如：周末和女朋友去逛商场，应该客观地按照需求去采购，在了解女朋友的爱好的前提下，想办法引导她去看性价比最高的商品，并给予一定建议。遇到她特别喜欢的衣服或饰物，只要价格合理，又能满足生活需要，在对方征求意见时应该支持购买并给予肯定答复；当遇到不合理的购买选择时，应简明扼要地说出其不适之处，并建议对方到其它她喜欢的物品处，挑选令其满意的商品。购物中间一旦遇到对方生气或者发火，可以宽容地对待对方，以显示出自己的城府，若对方为无理取闹，应该坦诚地向对方说明情况，让对方明白自己在为她考虑，说明都说清楚了事情也就简化了。另外，在购物结束前，可以给女朋友买些她喜欢的零食，或者一起去对方喜欢的餐饮店，休息的同时也可调节一下情调，让双方都能够感觉到两个人在一起的幸福与甜蜜。总结一下，在这场情侣博弈中，要想让自己获得最大收益，必须努力做到认真、善意、宽容、强硬、简单明了各种措施相结合。 2、第二题：（20分）请举例说明下列说法是否正确，构造博弈模型具体说明，阐述原因。（1）判断分析“先下手为强” 答：“先下手为强”并不满足所有的情形。博弈中，在有多个"纳什均衡"的情况下,常常是先动手的一方会占一些优势，这和课例中“囚徒困境”情形类似，有一个最佳策略，古代的很多例子也证明了此点，如：诸葛亮先下手为强，占据荆州要势；日本先下手为强，偷袭美国的珍珠港，不然就不会有第二次世界大战；三国曹操先下手为强，迎接汉献帝，后挟天子以令诸侯等。要指出的是，“动态博弈”中也是有很多后动优势的情形，一般是在方案已经制定，自身实力比较弱，需要选择决策的时候，主动放弃先发权利，变先动劣势为后动优势。如：三人参加选举，支持率分别为15%，35%，50%，这个时候，如果15%者先采取行动，可能会立刻被强敌灭掉，所以他必须保存实力，保持低调，不介入强者的争斗，由另两位先动手，争取灭掉一方后均分失败者的支持率，虽然这样扔处于劣势，但比最初情况要好很多。所以，在面对选择

张维迎《博弈论与信息经济学》部分答案

张维迎《博弈论与信息经济学》部分习题答案如果图片不显示，用打印预览就可以了。 P127 第一题：领悟精神就可以了，而且每本书上都有这些例题，不找了。第二题： UMD 为参与人1的战略，LMR 为参与人2的战略。前面的数字代表参与人1的得益，后面的代表参与人2的得益。参与人2的R 战略严格优于M 战略，剔除参与人2的M 战略，参与人1的U 战略优于M 战略，剔除参与人1的M 战略，参与人1的U 战略优于D 战略，剔除参与人1的D 战略，参与人2的L 战略优于R 战略，剔除参与人2的R 战略。最后均衡为U ，L （4，3）。这样可能看不清，按照步骤一步步画出图就好多了。第三题：恩爱型厌恶型用划线法解出，恩爱的都活着或者都死，厌恶的或者受罪，死了对方另一个人开心的不得了。第四题：没有人会选择比原来少的钱，战略空间为{原来的钱，比原来多的钱}。支付为{0，原来的钱，比原来多的钱}。纳什均衡为选择原来的钱。要画图自己画画。第五题：n 个企业，其中的一个方程：π1＝q 1（a －（q 1＋q 2＋q 3……q n ）－c ），其他的类似就可以了，然后求导数，结果为每个值都相等，q 1= q 2=……q n =(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。

第六题：在静态的情况下，没有一个企业愿意冒险将定价高于自己的单位成本C ，最终P=C ，利润为0。因为每个参与人都能预测到万一自己的定价高于C ，其他人定价为C 那么自己的利益就是负的（考虑到生产的成本无法回收）。就算两个企业之间有交流也是不可信的，最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争，一定会取得一个P 1=P 2=P 均衡。此时利润不为零，双方将不在进行价格竞争。第七题：设企业的成本相同为C ，企业1的价格为P 1，企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2)，π2=(P 2-C)(a-P 2+P 1)。一阶最优：a-2P 1+C+P 2=0，a-2P 2+C+P 1=0。解得：P 1=P 2=a+C ，π1=π2=a 2。第八题：不会！到纳什均衡为(A,A,A),(A,B,A),(B,B,B),(A,C,C),(C,C,C)。第十题：无纯战略纳什均衡，设参与人1为P 1～P 4，参与人2为Q 1～Q 4。得到：-Q 2+Q 4=Q 1-Q 3=Q 2-Q 4=-Q 1+Q 3，推出：Q 1=Q 2=Q 3=Q 4=1/4。同理P 1=P 2=P 3=P 4=1/4。以上述的概率在杆子，老虎，鸡，虫子中选择一个。

经济博弈论第1次作业

博弈论第1次作业 1、两个人分4只乒乓球，每个人同时独立地提出自己想得到的球数。设参与人1想得到s 1只，参与人2想得到s 2只球，分配的规则是：如果s 1 + s 2 ≤4，那么每个参与人均能得到自己想要的数量；如果s 1 + s 2 >4，那么两个参与人什么也得不到。（1）写出参与人1,2的战略空间S 1，S 2；（2）画出该博弈的双变量收益矩阵；（3）用划线法找出该博弈的全部纯战略纳什均衡。 2、精神病医生A 、B 同时在一条很长的公路边选择各自的诊所位置，这条公路用从0到1的区间表示。公路0到1/4这个区间属于俄勒冈州，从1/4到1这个区间属于加利福尼亚州。医生A （参与人1）同时拥有俄勒冈州和加利福尼亚州的行医执照，而医生B （参与人2）只有俄勒冈州的行医执照。假设病人沿这条公路是均匀分布的，每个病人都就近看病，每个医生的收益就是到他诊所就诊的病人比例。设医生A （参与人1）的战略空间（选择诊所的位置）为{}10,1/8,1/4,3/8,1/2,5/8,3/4,7/8,1 S =；医生B （参与人2）的战略空间为{}20,1/8,1/4S =。（1）试画出博弈的双变量收益矩阵；（2）利用划线法找出该博弈的纯战略纳什均衡。 3、在下图所示的战略式表述的博弈中，有没有占优战略均衡？有没有重复剔除严格劣战略的占优均衡？有没有纳什均衡？如果有，请写出相应的均衡。参与人2 参与人1 L M R U M D 4、下图是两人博弈的战略式表述形式，其中参与人1的战略空间S 1={U,D}，参与人2的战略空间S 2={L,R}。

参与人2 L M 参与人1 U D 这里a ，b ，c ，d ，e ，f ，g ，h 为参数。（1）设S*=（U,L ）是此博弈的严格占优战略均衡，问：上述参数之间应满足哪些条件？（2）设S*=（U,R ）是此博弈的重复剔除严格劣战略的占优均衡，问：上述参数之间应满足哪些条件？（用两种剔除顺序讨论）（3）设S*=（D ，R ）是此博弈的纳什均衡，问：上述参数之间应满足哪些条件？（4）设S 1*=（U ，L ）和S 2*=（D ，R ）是此博弈的纳什均衡，问：上述参数之间应满足哪些条件？这时两个参与人有无严格劣战略？ 5、求下图所示战略式表述的博弈的混合战略纳什均衡。参与人2 L R 参与人1 U D 6 B A L R U D 7、A 、B A 企业可以获得18万元利润，B 企业可以获得10万元利润；若A 企业做广告，B 企业不做广告，A 企业可以获得30万元利润，B 企业可以获得4万元利润；若A 企业不做广告，B 企业做广告，A 企业可以获得13万元利润，B 企业可以获得16万元利润；若A 、B 两企业都不做广告，A 企业可以获得35万元利润，B 企业可以获得8万元利润。试求：（1）画出A 、B 企业的支付矩阵。（2）求出该博弈的纯策略纳什均衡。 8、两个厂商生产一种完全同质的商品，该商品的市场需求函数为P Q -=100，设厂商1和厂商2都没有固定成本。若他们在相互知道对方边际成本的情况下，同时作出产量决策是分别生产20单位和30单位。问这两个厂商的边际成本各是多少？各自的利润是多少？

博弈论第4章答案

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4，1 0，0 3，0 0，1 2，2 2，2 纯战略纳什均衡：( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡：( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡：( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡：( R, M ’ ) 子博弈精炼纳什均衡：( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2，2 2，2 3，0 0，1 0，1 3，0 六种纯战略组合，每种组合中都至少有一方存在偏离的动机，因此不存在纯战略纳什均衡，因此也就不存在纯战略精炼贝叶斯均衡。求混合战略精炼贝叶斯均衡：设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下，参与者2选择L ’和R ’的收益无差异，则： 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略，参与者1选择L 、M 、R 的收益无差异，则： 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又联立得所以 L L M L L M L R L

4.3答案（见4.5） 4.4 表示方法第一个括号，逗号左边为type 1发送者信号，逗号右边为type 1发送者信号；第二个括号，逗号左边为接收到L 信号的反应，逗号右边为接收到R 信号的反应； P 为信号接收者对type 1发送L 的推断，q 为信号接收者对type 1发送R 的推断（a ） [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== （b ） [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案（a ） [(,),(,),1/3,1/2]R R u d p q >= （b ） 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题 1.博弈论中，局中人从一个博弈中得到的结果常被称为（）。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容，除了（）。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中（）。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中，每一个博弈者努力（）。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中，直接决定局中人支付的因素是（）。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言，无论对手作何选择，其总是拥有惟一最佳行为，此时的博弈具有（）。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作，博弈者就在现期合作；但如果另一个博弈者在前一期违约，博弈者在现期也违约的策略称为（）。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中，合作策略会导致（）。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候，囚徒困境式博弈均衡最可能实现（）。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致，这种策略是一种（）。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈，正确的说法是（）。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的（）： A. 策略是局中人选择的一套行动计划； B. 参与博弈的每一个局中人都有若干个策略； C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的； D. 策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。 13. 囚徒困境说明（）： A. 双方都独立依照自己的利益行事，则双方不能得到最好的结果； B. 如果没有某种约束，局中人也可在（抵赖，抵赖）的基础上达到均衡； C. 双方都依照自己的利益行事，结果一方赢，一方输； D、每个局中人在做决策时，不需考虑对手的反应 14. 一个博弈中，直接决定局中人损益的因素是（）： A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是（） A 不对称的 B 对称的 C 不确定的 D 无序的

博弈论基础作业及答案

博弈论基础作业及答案 Company number：【0089WT-8898YT-W8CCB-BUUT-202108】

博弈论试题

杭州师范大学2010-2011学年第二学期通识课程期末考试《博弈论与企业管理》试卷一、单项选择题（本大题共12题，每题3分，共36分） 1. 下列关于优势策略均衡和纳什均衡的描述正确的是（） A 优势策略均衡肯定是纳什均衡； B 纳什均衡都是优势策略均衡； C 纳什均衡是特殊的优势策略均衡； D 以上三种情况都有可能 2. 以下关于承诺的描述不准确的是（） A 承诺使威胁可置信； B 承诺往往对自己构成约束； C 承诺往往不需要成本； D 承诺往往会给自己带来成本，但最终结果使自己有利 3. 对于以下报酬矩阵，哪个命题是正确的（） A 甲和乙都有占优策略； B 只有甲有占优策略； C 只有乙有占优策略； D 两人都没有占优策略 4. 对于如下报酬矩阵，乙的占优策略是（） A 上； B 中； C 左； D 右

5. 对于题4的报酬矩阵，以下哪个是纳什均衡（） A （上，左）；B （上，右）；C （下，右）；D （上，中） 6. 对于题4的报酬矩阵，如果乙先走一步，并且知道甲再作决策时已经知道乙的决策，那么，乙将采取（） A 左；B 中； C 右；D 上 7. 交易双方信息不对称，比如买房不知道卖方的一些情况，是由于（） A 卖方故意隐瞒自己的一些情况； B 买方自身的认识能力有限； C 买方掌握完全信息的成本太高； D 以上三种情况都有可能 8. 面对不对称信息，下列哪一项不能为消费者减少信息不对称（） A 品牌；B 低价格 C 产品保证 D 长期质量保证书 9. 下列哪一项不是高质量的信号（） A 产品保证； B 延长的质量保单； C 暂时的经营场所； D 被认可的品牌 10.在二手市场上，（） A 买主知道商品的质量，而卖主不知道； B 买主不知道商品的质量，而卖主知道； C 卖主和买主都知道商品的质量是低的； D 卖主和买主都不知道商品的质量是低的 11.一个有效的激励机制必须能够（） A 使代理人参与工作的净收益不低于不工作也能得到的收益； B 使代理人让委托人满意的努力水平也是给代理人带来最大净收益的努力水平； C 尽可能地减少或消除代理人的目标函数与委托人的目标函数之间的冲突； D 以上都是 12.在信息不对称的劳动力市场，效率最低的激励机制是（） A 固定工资；B 效率工资；C 利润分享； D 提成二、简答题（本大题共6题，第1、2、3题每题4分，第4、5、6题每题6分，共30分） 1.一个博弈如果出现两败俱伤的结果，这样的博弈一定是非合作的零和博弈吗 2.两个罪犯只打算合伙犯罪一次，所以被捕后出现了囚徒困境的情况。如果这两个罪犯准备合伙犯罪30次，那么在开始的犯罪活动中如果被捕，还会出现囚徒困境吗 3.请举例分析说明在什么条件下博弈者采取威胁对方的策略可以奏效。 4.某博弈的报酬矩阵如下：（1）如果（上，左）是优势策略均衡，那么a ，b ，c ，d 应满足什么条件（2）如果（上，左）是纳什均衡，那么，又应该满足什么条件（3）如果（上，左）是优势策略均衡，那么，它是否必定是纳什均衡为什么

博弈论作业

博弈论作业 Company number：【0089WT-8898YT-W8CCB-BUUT-202108】

博弈论作业博弈论作业一、下面的得益矩阵表示博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡博弈的结果是什么博弈方 2 L C R 博弈 T 方 M 1 B 答：此博弈有两个纳什均衡：1、ML 得益（3，4） 2、TR 得益（4，2）二、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡与得益。博弈方 2 L R 博弈 T 方 B 1 答：（一）求混合策略均衡 1、博弈方1的概率P 则对博弈方2而言，有 1×P ＋2（1－P ）＝2×P ＋0（1－P ） 2－P ＝2P P ＝2／3 当P ﹤2／3，2－P ﹥2P ，则q ﹡＝1是最合适的策略,即选择L 。当P ＝2／3，2－P ＝2P ，则q ﹡∈（0，1）是最适合反应。当P ﹥2／3，2－P ﹤2P ，则q ﹡＝0是最适合策略，即选择R 。 2、给定博弈方2的概率q 则对博弈方1而言，有 2×q ＋0（1－q ）＝1×q ＋3（1－q ） 2q ＝3－2q q ＝3／4 当q ﹤3／4，2q ﹤3－2q ，则P ﹡＝0是最合适的策略,即选择B 。当q ＝3／4，2q ＝3－2q ，则P ﹡∈（0，1）是最适合反应。当q ﹥3／4，2q ﹥3－2q ，则P ﹡＝1是最适合策略，即选择T 。所以：

混合策略的均衡点为（2／3，3／4）。（二）得益： ∪1＝2×P ×q ＋0×P ×(1－q)＋1×(1－P)×q ＋3(1－P)(1－q) ＝2×2／3×3／4＋1×1／3×3／4＋3×1／3×1／4 ＝3／2 ∪2＝1×P ×q ＋2×P ×(1－q)＋2×(1－P)×q ＋0(1－P)(1－q) ＝1×2／3×3／4＋2×2／3×1／4＋2×1／3×3／4 ＝4／3 三、设一四阶段两博弈方之间的动态博弈如下图所示。试找出全部子博弈，求子博弈完美纳什均衡策略组合和博弈的结果。答：依据逆推归纳法得出：此博弈均衡为b ，得益（5，3）；路径为b, d, e, h 。四、两次重复下面的得益矩阵表示的静态博弈。设计一个处罚策略。博弈方 2 L R S 博弈 T 方 M 1 B 答：此博弈有两个均衡： TL 得益（3，1） MR 得益（8，7）博弈方1：第一阶段选B ，如果第一阶段博弈的结果为（B ，S ），第二阶段选M ，否则第二阶段选T ；博弈方2：第一阶段选S ，如果第一阶段博弈的结果为（B ，S ）第二阶段选R ，否则第一阶段选L 。得益：TL （3，1） MR （8，7 ） BS （10，10）结果如下图：博弈方 2 L R S 博弈 T 方 M 1 B 求得三个均衡：TL 得益（6，2） MR 得益（11，8） BS 得益（18，17）

高校博弈论期末试卷

高校博弈论期末试卷(每题10分)1、在下面的战略式表述博弈中，说明两个参与人是否有占优战略及其理由，是否有占优战略均衡，若有，说明均衡结果。DURowColumnRL3,07,-12,55,12、在下面的战略式表述博弈中，说明战略组合(U,L)不是纳什均衡和(D,R)是纳什均衡的理由。DURowColumnRL9,55,36,79,53、求下面扩展式表述博弈的纳什均衡及结果。进入者不进入进入在位者默许斗争默许斗争(0,400)(0,400)(10,30)(40,50)4、求下面战略式表述博弈的混合战略纳什均衡，画出反应对应图。DURowColumnRL2,24,33,42,25、在下面的扩展式表述博弈中，写出两个参与人的战略空间，求其子博弈精炼纳什均衡及结果。在位者默许斗争进入者进入者不进入不进入进入进入(100,90)(0,-10)(300,0)(300,0)6、求下面扩展式表述博弈的子博弈精炼纳什均衡及结果。 3RLDU21(40,50,10)(0,30,20)INOUT(0,50,20)(10,60,0)7、图示以下列战略式表述博弈为阶段博弈的无限重复博弈的纳什威胁点、可行支付集合、个人理性支付集合、个人理性可行支付集合和子博弈精炼可达到的支付集合。DURowColumnRL8,80,66,02,28、写出下列扩展式表述博弈的战略式表述，求出这个博弈的纳什均衡及结果，如何使两个企业既守法又不减少所获收益？企业1违法守法企业2守法违法守法违法(1,1)(2,-1)(-1,2)(1,1)9、在以下静态贝叶斯博弈中，在位者知道自己是低成本的，进入者不知道在位者是高成本还是低成本，但知道在位者是高成本的概率是60%，两个参与人同时行动，画出这个博弈的扩展式表述，说明在进入者选择进入的情况下在位者在两种成本情况下的战略选择，计算进入者两种战略选择的期望支付，写出这个博弈的贝叶斯纳什均衡及结果。在位者低成本[0.4]高成本[0.6]斗争默许斗争默许进入0,4000,4000,3000,300-10,10030,80-10,040,50进入进入者不进入10、在下列不完全信息动态博弈中，自然首先选择参与人1的类型，参与人1知道自己的类型，参与人2不知道参与人1的类型，但知道参与人1属于t1和t2类型的先验概率，（1）写出两个参与人的战略空间；（2）判断在给定的先验概率条件下，若参与人1选择L，参与人2会选择U还是D，若参与人1选择R，参与人2会选择U还是D；（3）给定参与人2的这种选择，若参与人1是t1类型的，将选择L还是R，若参与人1是t2类型的，将选择L还是R；（4）若参与人2观察到参与人1选择R，计算他认为参与人1是t1类型的后验概率，若参与人2观察到参与人1选择L，计算他认为参与人1是t1类型的后验概率；（5）写出这个博弈的精炼贝叶斯均衡，说明参与人1采用的是何种战略。