博弈论第四章习题.doc

格式：doc
大小：84.00 KB
文档页数：7

下载文档原格式

博弈论基础讲义-第四章

第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子：一般计算2.例子：分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的，即在给定信念的条件下，以及其他参与人的选择条件下，自身选择是最优的例1：子博弈最优——纳什均衡(,)L l是否合理？——如果参与人2有机会选择，肯定选r而不是l；——(,)L l不是子博弈精炼纳什均衡。

例2：单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡；——但如果参与人2有机会选择，但肯定选择d；——(,,)D a l不满足单点信息集理性。

例3：多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡；——(,)A r不满足多点信息集理性。

2.一致信念例1：与客观事实一致u=是否合理？——参与人2的信念2/3——2/3u=是不合理的，因为任何到达参与人2信息集都不可能产生此后验概率；——后验信念必须与先念信念保持一致。

例2：前后信念一致——参与人2的第2个信息集上的信念，是否合理？——不合理，给定参与人战略和第1个信息集的信念，利用贝叶斯法则计算信念与此不一致；——参与人前后信念保持一致。

例3：独立偏离——参与人3的信念0.9u =是否合理？——参与人1和参与人3的偏离是独立的，所以参与人3的合理信念为0.1u =；——不同参与人之间的偏离是独立的总结，一致信念要求：参与人偏离最小化,，参与人之间偏离是独立的；二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性；——定义信息集1.3和2.2的信念？2.定义a.行为战略：参与人在某个信息集到行动集映射，——如果某个状态真正发生，参与人如何决策；——序贯理性是否满足？b.序贯理性：在任何信息集上，参与人在给定信念和所有后续行为战略，选择自身行为战略最大化预期效用。

博弈论(第四章)

谢富纪 2009年3月 11
2.有限次重复博弈
有唯一纯策略纳什均衡博弈的有限次重复博弈
有限次重复博弈的囚徒困境博弈，可以理解成警察给两人两次交代的机会。
囚徒2 坦白不坦白
囚徒 1
坦白
不坦白
-5， -5
-8， 0
0， -8
-1， -1
谢富纪 2009年3月
12
2.有限次重复博弈
因为重复博弈全过程是一种动态博弈过程，从第二阶段开始。此前的博弈已是既成的事实，而在此后又没有任何的后继阶段，因此实现本阶段最大利益是两博弈方在该阶段的唯一原则。结果是（坦白，坦白），
谢富纪 2009年3月
29
2.有限次重复博弈
本博弈中之所以不能或不能部分实现最佳结果
（A，A），是因为在两次重复博弈中博弈方没
有运用触发策略的条件或者说机会。后面的选择并不取决于第一次博弈的结果。
谢富纪 2009年3月
30
2.有限次重复博弈
厂商2 得益
（1，4）（1.5，3）（3，3）
谢富纪 2009年3月
17
2.有限次重复博弈
削价竞争博弈
高价寡高价头 1 低价
寡头2
低价
100，100 20，150 150，20 70，70
由于两个寡头在同一市场的竞争可以看作维持很长时间，因此可以看作是重复博弈。然而结果是令人遗憾的。
谢富纪 2009年3月 18
2.有限次重复博弈
两个悖论
谢富纪 2009年3月
27
2.有限次重复博弈
两市场博弈的重复博弈
厂商 2 A 厂A 商 1 B B
3，3
1，4
4，1
0，0

博弈论第四章

（1）起始结是一个单结的信息结;
（2）子博弈保留了原博弈的所有结构。则称它为原博弈的一个子博弈（子博弈）。
按照博弈树的延伸的时序，或者按照博弈树生长的时序，我们用一个扁椭圆形的虚线的圈，把所论局中人在同一个时点的若
干决策节点罩起来，成为他的一个信息集。
（1）起始结是一个单结的信息结
x1
L L 1 2 S L 2 S （1，1）（2，2） 1 （-1，-1）（-1，-1） S 2 L L S （2，2）
镇上能卖6000元；但如果另一家商铺同时在小镇上卖
鞭炮，价格下跌使得这批鞭炮只能卖4000元。纳什均
衡是什么？
• 假设甲先行动，商铺乙看到对方的选择后再决定是否
进货，子博弈精炼纳什均衡是什么？
如果甲先行动，但在博弈开始前商铺主乙有一次行动A 的机会，利用子博弈精炼均衡概念分析下述两种情况下
的博弈结果：何行动他都不会改变这个决定；
一颗大树表示一个博弈，一颗小树同样可以表示
一个博弈。如果小树是大树的一颗子树，并且
小树表示的博弈不破坏大树表示的博弈的结构，
那么小树表示的博弈，就叫做大树表示的博弈
的子博弈。
一、子博弈（sub-game）
子博弈定义：在一个扩展型博弈中，如果一个博弈由它的一个决策结及其所有后续结构成，并满足:
信息集的时候，面临决策的局中人对于博弈迄今的历史是
不清楚的，他不清楚博弈具体走到了他的这个信息集里面的哪个决策节点。
在市场进入博弈中，包含3个子博弈（包括原博弈）。而在囚徒博弈中，只有一个子博弈(?)
收益： A
B 容忍
进入抵抗 A 不进入 B
B
抵赖
B 抵赖
-1 ，-1 -9 ，0 0 ，-9

博弈论课后习题

Document serial number [UU89WT-UU98YT-UU8CB-UUUT-UUT108]第一章导论1、什么是博弈博弈论的主要研究内容是什么2、设定一个博弈模型必须确定哪儿个方面3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

4、"囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。

5、博弈有哪些分类方法，有哪些主要的类型6、你正在考虑是否投资100万元开设一家饭店。

假设情况是这样的：你决定开，则的概率你讲收益300万元（包括投资），而的概率你将全部亏损；如果你不开，则你能保住本钱但也不会有利润，请你（a）用得益矩阵和扩展形式表示该博弈；（b）如果你是风险中性的，你会怎样选择（c）如果你是风险规避的，且期望得益的折扣系数为，你的策略选择是什么（d）如果你是风险偏好的，期望得益折算系数为，你的选择又是什么7、一逃犯从关押他的监狱中逃走，一看守奉命追捕。

如果逃犯逃跑有两条可选择的路线，看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可以少坐10年牢，但一旦被抓住则要加刑10年；看守抓住逃犯能得到1000元奖金。

请分别用得益矩阵和扩展形式表示该博弈，并作简单分析。

第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么2、为什么说纳什均衡是博弈分析中最重要的概念3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。

4、多重纳什均衡是否会影响纳什均衡的一致预测性质，对博弈分析有什么不利影响5、下面的得益矩阵表示两博弈方之间的一个静态博弈。

该博弈有没有纯策略纳什均衡t専弈的结果是什么6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

7、博弈方1和2就如何分10 000元进行讨价还价。

假设确定了以下规则:双方同时提出自己要求的数额S1和S2, 0< sl,s2< 10 000,如果sl+s2W10 000,则两博弈方的要求都得到满足，即分别得到si和s2, 但如果是sl+s2>10 000,则该笔钱就被没收。

(完整word版)博弈论练习题

1、纳什均衡一定是上策均衡，但并非每一个上策均衡都是纳什均衡。

（×）2、如果重复博弈的次数较少，但两家厂商都具有完全理性，则相互合作仍能实现。

（×）1、贝叶斯纳什均衡属于哪种博弈中的均衡状态？（C ）A、完全信息静态博弈；B、完全信息动态博弈；C、不完全信息静态博弈；D、不完全信息动态博弈。

2、下列正确的表述是（A ）。

A、任何市场竞争都可由市场博弈来概括B、剔除不可置信的威胁后的纳什均衡属于精炼贝叶斯纳什均衡C、股票投资者之间的博弈属于零和博弈D、“摸着石子过河”属于完全信息动态博弈3、下述错误的表述是（C ）。

A、现实中，信息不对称比信息对称更为普遍B、道德风险源于代理人的理性行为C、父子合开的小企业中不存在委托——代理问题D、委托人与代理人的利益几乎不可能完全一致4、右图为某一博弈的得益矩阵，据此可知：（D. ）A.甲与乙均没有上策B.甲与乙均有上策C.甲有上策而乙没有上策D.甲没有上策而乙有上策5、对于右下图表示的博弈，其上策均衡或纳什均衡A.左上角B.右上角C.左下角D.右下角6、乒乓球团体赛中双方出场阵营的选择和确定属于（A. ）。

A.静态博弈B.动态博弈C.零和博弈D.合作博弈7、就足球比赛中的比分而言，比赛属于（ B ）。

A.零和博弈B.变和博弈C.常和博弈D.静态博弈8、就排球比赛中的输赢结果而言，比赛属（A. ）。

A.零和博弈B.变和博弈C. 常和博弈D.静态博弈假设有10 名劳动者，其中10 - x名是低能力的，另外x名是高能力的。

这10 名劳动者是企业的潜在员工。

现在，企业因业务扩展需要招聘1 名高能力劳动者。

又假设这10 名劳动者都渴望到这家企业去工作。

假设企业对高能力者愿意支付2元的工资，对低能力者支付1元的工资；高能力劳动者保留工资是1元，低能力者保留工资是0.5元。

请回答如下一些问题：1)假设信息是完全的（即劳动者的能力写在脸上，人人皆知），企业具有完全的谈判能力（即只支付员工保留工资水平的工资），则招聘结果将如何？由于信息是完全的，企业将大大降低招聘的风险，并以高能力劳动者可以接受的保留工资1元，从X名高能力劳动者中招聘到一名员工,市场交易顺利进行。

博弈论课后习题答案

博弈论课后习题答案第四部分课后习题答案1. 参考答案:括号中的第一个数字代表乙的得益，第二个数字代表甲的得益，所以a表示乙的得益，而b表示甲的得益。

在第三阶段，如果，则乙会选择不打官司。

这时逆推回第二阶段，甲会选择a,0不分，因为分的得益2小于不分的得益4。

再逆推回第一阶段，乙肯定会选择不借，因为借的最终得益0比不借的最终得益1小。

在第三阶段，如果，则乙轮到选择的时候会选择打官司，此时双方得益是(a,b)。

a,0逆推回第二阶段，如果，则甲在第二阶段仍然选择不分，这时双方得益为(a,b)。

b,2在这种情况下再逆推回第一阶段，那么当时乙会选择不借，双方得益(1，0)，当a,1时乙肯定会选择借，最后双方得益为(a,b)。

在第二阶段如果，则甲会选择a,1b,2分，此时双方得益为(2，2)。

再逆推回第一阶段，乙肯定会选择借，因为借的得益2大于不借的得益1，最后双方的得益(2，2)。

根据上述分析我们可以看出，该博弈比较明确可以预测的结果有这样几种情况:(1)，此时本博弈的结果是乙在第一阶段不愿意借给对方，结束博弈，双方a,0得益(1，0)，不管这时候b的值是多少;(2)，此时博弈的结果仍然012,,,ab且是乙在第一阶段选择不借，结束博弈，双方得益(1，0);(3)，此时博ab,,12且弈的结果是乙在第一阶段选择借，甲在第二阶段选择不分，乙在第三阶段选择打，最后结果是双方得益(a,b);(4)，此时乙在第一阶段会选择借，甲在第二阶段会选择分，ab,,02且双方得益(2，2)。

要本博弈的“威胁”，即“打”是可信的，条件是。

要本博弈的“承诺”，即a,0“分”是可信的，条件是且。

a,0b,2注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况，因为这些时候博弈方的选择很难用理论方法确定和预测。

不过最终的结果并不会超出上面给出的范围。

2. 参考答案:静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。

博弈论课后习题

第一章导论1、什么是博弈博弈论的主要研究内容是什么2、设定一个博弈模型必须确定哪几个方面3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

4、“囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。

5、博弈有哪些分类方法，有哪些主要的类型6、你正在考虑是否投资100万元开设一家饭店。

假设情况是这样的：你决定开，则的概率你讲收益300万元（包括投资），而的概率你将全部亏损；如果你不开，则你能保住本钱但也不会有利润，请你（a）用得益矩阵和扩展形式表示该博弈；（b）如果你是风险中性的，你会怎样选择（c）如果你是风险规避的，且期望得益的折扣系数为，你的策略选择是什么(d)如果你是风险偏好的，期望得益折算系数为，你的选择又是什么7、一逃犯从关押他的监狱中逃走，一看守奉命追捕。

如果逃犯逃跑有两条可选择的路线，看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可以少坐10年牢，但一旦被抓住则要加刑10年；看守抓住逃犯能得到1000元奖金。

请分别用得益矩阵和扩展形式表示该博弈，并作简单分析。

4、多重纳什均衡是否会影响纳什均衡的一致预测性质，对博弈分析有什么不利影响5、下面的得益矩阵表示两博弈方之间的一个静态博弈。

该博弈有没有纯策略纳什均衡博弈的结果是什么6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

7、博弈方1和2就如何分10 000元进行讨价还价。

假设确定了以下规则：双方同时提出自己要求的数额S1和S2，0≤s1,s2≤10000,如果s1+s2≤10 000，则两博弈方的要求都得到满足，即分别得到s1和s2，但如果是s1+s2＞10 000,则该笔钱就被没收。

问该博弈的纯策略纳什均衡是什么如果你是其中一个博弈方，你会要求什么数额，为什么8、设古诺模型中有n家厂商、qi 为厂商i的产量，Q=q1+…+qn 为市场总产量、P为市场出清价格，且已知P=P(Q)=a-Q(当Q＜a时，否则P=0)。

博弈论第四章

4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。

参与人2 不知道t，但知道t的概率分布。

博弈的时序：（1）参与人1选择行动a1∈A1;（2）参与人2观察a1，选择a2∈A2博弈的收益：u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2，10，0参与人 1 M0, 20，1R1, 31, 3纯战略纳什均衡: (L，L'), (R，R')均为子博弈精炼纳什均衡(无子博弈)。

但是(R, R')不可信。

排除不可信的纳什均衡：要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下，博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。

例要求3的说明参与人1的类型空间：{ t1，t2，t3，t4 }行动空间：A= { L，R}推断p i: 观察到L后，参与人1的类型是t i的概率。

推断q i: 观察到R后，参与人1的类型是t i的概率。

p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略： t 1选 L ，t 2选 L ， t 3选R ，t 4 选R 。

参与人2对p i 与 q i 的推断：p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。

博弈论第四章完全且完美信息动态博弈

0，0
需求小的情况开发商A
开发商B 开发不开发
开发 -3000，-3000 1000，0
不开发 0，1000
0，0
精的扩展式表述包括四个要素:
✓ 参与人集合（Player） ✓ 每个参与人的战略集合（Strategy） ✓ 博弈的顺序（Order） ✓ 由战略组合决定的每个参与人的支付（Payoff）
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
精选PPT
12
动态博弈的战略
精选PPT
13
动态博弈的战略的表述
✓ 战略：参与人在给定信息集的情况下选择行动的规则，它规定参与人在什么情况下选择什么行动，是参与人的“相机行动方案”。
si表示第i个参与人的特定战略
Si si代表第i个参与人所有可选战择略的集合
如果n个参与人每人选择战一略个， n维向量s （s1，s2，，si，，sn）称为一个战略组合 si表示第i个人选择的战略
精选PPT
6
扩展式表示的一个例子
精选PPT
7
博弈树始于局中人1 的一个决策结点，这时1
要从L和R中作出选择，如果局中人1选择L，其后就
到达局中人2 的一个决策结点，这时，局中人2要
从L′和R′中作出选择。类似地，如果局中人1选择R，则将到达局中人2的另一个决策结点。
这时局中人2从L′和R′中选择行动。无论局中人2 选择了哪一个，都将到达终结点 (即博弈结束)且两局中人分别得到相应终点节下面的收益。

经济博弈论(第三版)复习题及答案%20谢识予著

1
自然赚（35%）我开不开开不开亏（65%）
（300）（100）
（0）Байду номын сангаас（100）
（b）如果我是风险中性的，那么根据开的期望收益与不开收益的比较： 0.35×300+0.65×0=105＞100 肯定会选择开。（c）如果成功的概率降低到 0.3，那么因为这时候开的期望收益与不开的收益比较： 0.30×300+0.70×0=90＜100 因此会选择不开，策略肯定会变化。（d）如果我是风险规避的，开的期望收益为： 0.9×（0.35×300+0.65×0）=0.9×105=94.5＜100 因此也会选择开。（e）如果我是风险偏好的，那么因为开的期望收益为： 1.2×（0.35×300+0.65×0）=1.2×105=126＞100 因此这时候肯定会选择开。 10、首先需要注意的是，在该博弈方的得益单位不同，逃犯得到的是增加或者减少的刑期（年），而看守得到的则是奖金（元），因此除非先利用效用概念折算成相同的单位，否则两博弈方的得益相互之间不能比较和加减。直接采用单位不同的得益，该博弈的得益矩阵如下：看路线一 -10，1000 10，0 守路线二 10，0 -10，1000
其实，根据该得益矩阵不难得到与上述动态博弈相同的结论，仍然是工人会选择偷懒和老板会选择克扣。这个博弈实际上与囚徒的困境是相似的。
第二章复习题
4，5，5，7，9，10
第二章参考答案
4、多重纳什均衡不会影响纳什均衡的一致预测性质。这是因为一致预测性不是指各个博弈方有一致的预测，而是指每个博弈方自己的策略选择与自己的预
逃犯
路线一路线二
该博弈的扩展形表示如下：
逃犯路线一看守路线一路线二路线一路线二路线二

4博弈论基础作业及答案.doc

博弈论基础作业一、名词解释纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识见PPT二、问答题1 •举出囚徒困境和智猪博弈的现实例子并进行分析。

囚徒困境的例子：军备竞赛；中小学生减负；几个大企业之间的争相杀价等等；以屮小学生减负为例：在当前的高考制度下，给定其他学校对学生进行减负, 一个学校最好不减负，因为这样做，可以带來比其他学校更高的升学率。

给定其他学校不减负，这个学校的最佳应对也是不减负。

否则自己的升学率就比其他学校低。

因此，不论其他学校如何选择，这个学校的最佳选择都是不减负。

每个学校都这样想，所以每个学校的最佳选择都是不减负，因此学生的负担越来越重。

请用同样的方法分析其他例子。

智猪博弈的例子：大金业开发新产品；小企业模仿；股市中，大户搜集分析信息，散户跟随大户的操作策略以股市为例：给定散户搜集资料进行分析，大户的最佳选择是跟随。

而给定散户跟随，大户的最佳选择是自己搜集资料进行分析。

但是不论大户是选择分析还是跟随，散户的最佳选择都是跟随。

因此如果大户和散户是聪明的，并且大户知道散户也是聪明的，那么大户就会预见到散户会跟随，而给定散户跟随，大户只有自己分析。

请用同样的方法分析其他例子。

2•请用博弈论來说明“破釜沉舟”和“穷寇勿追”的道理。

破釜沉舟是一个承诺行动。

H的是要断绝自己的退路，让自己无路可退，让自己决一死战变得可以置信。

也就是说与敌人对决时，只有决一死战，这样才可以取得胜利。

否则，如果不破釜沉舟，那么遇到困难时，就很有可能退却，也就无法取得胜利。

穷寇勿追就是要给对方一个退路，由于有退路，对方就不会殊死抵抗。

否则，对方退无可退，只有坚决抵抗一条路，因而必然决一死战。

口己也会付出更大的代价。

3.当求职者向企业声明自己能力强吋，企业未必相信。

但如果求职者拿出自己的各种获奖证书吋，却能在一定程度上传递自己能力强的信息。

这是为什么？由于口头声明几乎没有成本，因此即便是能力差的求职者也会向企业声明自己能力强。

博弈论各章节课后习题答案 (4)

第四章谈判与协调1.帕累托占优均衡和纳什均衡的关系是什么?纳什均衡的基本思想是：每一个局中人选择一个策略，由所有局中人的策略构成了一个策略组合；在其它局中人选定策略不变的情况下，若某一个局中人单独地违背自己已选的策略，那么他的收益只会下降（或收益不会增加）。

这样的策略组合构成一个均衡局势，并命名为纳什均衡。

纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。

一个博弈中有不止一个纳什均衡时，就构成一个多重纳什均衡问题。

在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。

其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。

在博弈中，若均为G 的其纳什均衡，若满足[,{},{}]i i G N S P =12,,,m s s s ∗∗∗⋯0i s ∗，0()()i i i j P s P s ∗∗>1,2,,,1,2,,i n j m==⋯⋯则称为博弈G 的帕累托占优纳什均衡。

可见帕累托占有纳什均衡是纳什均衡中收益最大0i s ∗的一种均衡。

2.分别找出具有下列性质的2人博弈的例子。

(1)不存在纯策略纳什均衡；(2)至少有两个纳什均衡，并且其中之一是帕累托占优均衡。

（1）不存在纯策略的纳什均衡：该博弈不存在纯策略的纳什均衡（2）该博弈有三个纳什均衡：（战争，战争）、（和平，和平）和一个混合策略纳什均衡。

很显然，（和平，和平）是一个帕累托占优纳什均衡。

2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业，它们的成本函数分别为：TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+200002122这两个企业生产一同质产品，其市场需求函数为：Q=4000-10p 。

试分别基于古诺模型和纳什谈判模型求解两企业的利润。

解：由和400010Q p =−12Q q q =+得124000.1()p q q =−+战争和平国家1战争-5，-58，-10和平-10，810，10所以：[]21121114000.1()(0.120100000)q q q q q π=−+−++211213800.10.2100000q q q q =−−−[]22122224000.1()(0.43220000)q q q q q π=−+−++221223680.10.520000q q q q =−−−12113800.10.40q q q π∂=−−=∂21223680.10q q q π∂=−−=∂21123800.10.403680.10q q q q −−=⎧⎨−−=⎩求解方程组得12880280q q =⎧⎨=⎩将，代入到，中去得到最优解1q 2q 1π2π*1*25488019200ππ⎧=⎪⎨=⎪⎩4.你能否对如下的CG-2×2博弈中x 的变化设计出一些实验方案，来讨论是帕累托占优思想还是风险占优思想在策略选择中起主要作用。

35博弈论-第四章

第四章完全信息动态博弈更为现实的考虑是将静态博弈动态化，动态化后，纳什均衡这一概念是否仍然有效呢？答案是部分有效的。

如果不存在动态不一致，那么纳什均衡在完全信息动态博弈中仍不失为一个有用的均衡概念，但纳什均衡概念本身并不能保证不出现动态不一致，为了克服这一点在纳什均衡的基础上生产了所谓子博弈完美均衡。

而这一章，我们将围绕这子博弈完美均衡来展开。

第一节完美信息与完全但不完美信息完全信息动态博弈可以分为两类，即完美信息与完全但不完美信息。

所谓的完美信息博弈，是指博弈中的后行动者始终能够观察到前行动者的行动，因而动态博弈中不存在参与者同时行动这样的情况。

而完全但不完美信息博弈，则指动态博弈中，至少存在两个参与者同时行动的情况，因而“后行动者”无法观察到“前行动者”的行动。

我们不妨用两个例子来加以说明。

例4.1 动态囚徒困境囚徒1图4-1 动态囚徒困境例4.2 取消管制政府图4-2 取消管制与图4-2完全等价的表示方法见图4-3。

政府图4-3 取消管制定义4.1完美信息动态博弈就是不存在同时行动的完全信息动态博弈。

显然，运用策略式来描述动态博弈会非常不便，特别是当信息不完全时更是如此，为了更简便地描述动态博弈，我们将引入一种新的博弈表达式——扩展式。

第二节动态博弈的扩展式我们把博弈中所有从开始到结束的行动序列称为全历史(Terminal history)，而用参与者函数来表示在每一个全历史上，在博弈进行到某个阶段时谁来行动。

因而要完整地描述一个动态博弈，必须具备四个要素：（1）参与者集合；（2）全历史集合；（3）参与者函数；（4）偏好。

如果我们把全历史表示成一个行动序列(a1, a2,…, a K)（K为自然数，当K→∞时，就表示无穷动态博弈），那么(a1, a2, …, a m)，其中m K≤，就称为全历史(a1, a2, …, a K)的子历史(Subhistory)。

当m < K时，(a1,a2, …, a m)就是全历史(a1, a2, …, a K)的真子历史(Proper subhistory)。

博弈论第4章答案

R R M 4.1.a 标准式1↖2 L ’ R ’4，1 0，0 3，0 0，1 2，2 2，2纯战略纳什均衡：( L, L ’ ) ( R, R ’ )子博弈精炼纳什均衡：( L, L ’ ) ( R, R ’ )精炼贝叶斯纳什均衡：( L, L ’ )4.1.b 标准式1↖2 L ’ M ’ R ’1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4纯战略纳什均衡：( R, M ’ )子博弈精炼纳什均衡：( R, M ’ )精炼贝叶斯均衡: 没有4.2标准式1↖2 L ’ R ’2，2 2，2 3，0 0，1 0，1 3，0六种纯战略组合，每种组合中都至少有一方存在偏离的动机，因此不存在纯战略纳什均衡，因此也就不存在纯战略精炼贝叶斯均衡。

求混合战略精炼贝叶斯均衡：设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p −−参与者2选择L ’和R ’的概率分别为,(1)q q −在给定参与者1的战略下，参与者2选择L ’和R ’的收益无差异，则： 1212120*1*1*0*p p p p p p +=+⇒=给定参与者2的战略，参与者1选择L 、M 、R 的收益无差异，则：12121212[3*0*(1)][0*3*(1)]2*(1)41:**,*112p q q p q q p p p p p p q +−=+−=−−====又联立得所以 L LML LM L RL4.3答案（见4.5）4.4表示方法第一个括号，逗号左边为type 1发送者信号，逗号右边为type 1发送者信号；第二个括号，逗号左边为接收到L 信号的反应，逗号右边为接收到R 信号的反应； P 为信号接收者对type 1发送L 的推断，q 为信号接收者对type 1发送R 的推断（a ）[(,),(,),1/2][(,),(,),1/2][(,),((1),),1/2][(,),(,),1,0]R R u u p R R d u p R R d u u p L R u d p q αα><+−===（b ）[(,),(,),1/2,2/3][(,),(,),1,0][(,),(,),0,1]L L u u p q L R d u p q R L u d p q =<====中文版习题4.5答案（a ）[(,),(,),1/3,1/2]R R u d p q >=（b ）12121212[(,,),(,),1/3,1/2][(,,),(,),1/2,0]L L L u u p p q q L L R u d p p q q ==+<==+=。

博弈论习题及解答

※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?（见教材）2. 分别用规范式和扩展式表示下面的博弈。

两个相互竞争的企业考虑同时推出一种相似的产品。

如果两家企业都推出这种产品，那么他们每家将获得利润400万元；如果只有一家企业推出新产品，那么它将获得利润700万元,没有推出新产品的企业亏损600万元；如果两家企业都不推出该产品，则每家企业获得200万元的利润。

企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? （见教材）4. 产生“囚犯困境”的原因是什么？你能否举出现实经济活动中囚徒困境的例子？原因：个体理性与集体理性的矛盾。

例子：厂商之间的价格战，广告竞争等。

※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? （见教材）2. 剔除以下规范式博弈中的严格劣策略，再求出纯策略纳什均衡。

先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。

然后用划线法求出该矩阵博弈的纯策略Nash均衡。

乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。

乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知，该矩阵博弈没有纯策略Nash均衡。

由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。

解：设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线，如下图，图中粗的折线，就是F(x)的图象由图可知，纳什均衡点与β1无关，所以原问题化为新的2*2矩阵博弈：由公式计算得：。

博弈论第四章习题

第四章习题一、如果T次重复齐威王田忌赛马，双方在该重复博弈中的策略是什么？博弈结果如何？答：因为这是零和博弈，结论比较具体。

重复Nash 均衡，均以1/6的概率选择各个策略，期望收益分别为1和-1。

因为这是竞争性的零和博弈，无论是有限次重复博弈还是无限次的重复博弈，均不能达成合作的条件。

二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。

答：火车站和机场餐饮业的服务的顾客往往是一次性的，回头客和常客也比较少，价格高，质量差，一次性博弈。

效率也比较低。

商业区和居民区的餐饮业和商业服务业，回头客和常客比较多，比较注重信誉，质优、价廉，重复博弈。

效率也比较高。

三、有限次重复博弈和无限次重复博弈有什么区别？这些区别对我们有什么启发？答：动态博弈的逆向归纳法可以用于有限次重复博弈，但不能用于无限次重复博弈，主要用逆向归纳法。

无限次重复博弈的效率往往高于有限次重复博弈。

当重复次数较少不一定考虑贴现问题，但无限次重复博弈必须考虑贴现问题。

启发：重视有限次与无限次的区别，区分和研究这两类博弈，在实践方面重要启发是促进和保持经济的长期稳定和可持续发展，提高社会经济效率是非常有意义的。

四、判断下列表述是否正确，并作简单讨论：（1）有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。

答：不一定。

对于有两个以上纯策略纳什均衡的条件下就不一定。

如“触发策略”就不是。

（2）有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。

答：是，根据子博弈完美纳什均衡的要求，最后一次必须是原博弈的一个纳什均衡。

（3）无限次重复博弈均衡解的得益一定优于原博弈均衡解的得益。

答：错。

如严格竞争的零和博弈就不优于。

（4）无限次重复古诺产量博弈不一定会出现合谋生产垄断产量的现象。

答：正确。

合谋生产垄断产量是有条件的，由贴现率来反映，当不满足条件时，就不能构成激励。

（5）如果博弈重复无限次或者每次结束的概率足够小，而得益的时间贴现率充分接近1，那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。

吉本斯-博弈论基础答案

2
1 2 的收益贴现到t期可得 1 − δ (a − c) / 8 ， 1 2 2 触发战略有效的条件是： 1 − δ (a − c ) / 8 > (a − c) / 4 ，得到： δ > 1/ 2
（可参见谢识予的《经济博弈论》习题解答）。 2.14 略 2.15 （1）垄断的产量、价格、利润： π=Q(a-Q)-CQ 利润最大化时：a-2Q=C，从而 Q=(a-c)/2. 此时价格为(a-c)/2。（2）古诺均衡下的产量、价格、利润： π=(a-∑qi) qi -cqi
（*）
因此当增加 S 时， U1 ( I c − S ) 会减小，同时， d ( S + B ) / dS > 0 ， ∴ S + B 会增加，
∴ U 2 ( S + B ) 会增加，因为（*）式， U 2 ( S + B ) 增加的幅度比 U1 ( I1 − S ) 减小的幅度大，所以
如果参与者推断自然选择左边博弈的概率23参与者2选l如果参与者推断自然选择左边博弈的概率23参与者2选l和选r无差异如果参与者推断自然选择左边博弈的概率23参与者2选r如果参与者推断自然选择左边博弈的概率23参与者2选l如果参与者推断自然选择左边博弈的概率23参与者2选l和选r无差异如果参与者推断自然选择左边博弈的概率23参与者2选r自然选择左边博弈时参与者1选t参与者2选l
由一阶条件 ∂π i / ∂qi = 0 ，可得： qi = (a − q− i − c) / 2 … … （ 1）
* *
（ 1）式两端乘以 2，再减 qi ，可得： qi = a − Q − c … … （ 2），对于任意的 i 都成立。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第四章习题
一、如果T次重复齐威王田忌赛马，双方在该重复博弈中的策略是什么？博弈结果如何？
答：因为这是零和博弈，结论比较具体。

重复Nash 均衡，均以1/6的概率选择各个策略，期望收益分别为1和-1 o
因为这是竞争性的零和博弈，无论是有限次重复博弈还是无限次的重复博弈，均不能达成合作的条件。

二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。

答：火车站和机场餐饮业的服务的顾客往往是一次性的，回头客和常客也比较少，价格高，质量差，一次性博弈。

效率也比较低。

商业区和居民区的餐饮业和商业服务业，回头客和常客比较多，比较注重信誉，质优、价廉，重复博弈。

效率也比较高。

三、有限次重复博弈和无限次重复博弈有什么区
别？这些区别对我们有什么启发？
答：动态博弈的逆向归纳法可以用于有限次重复博弈，但不能用于无限次重复博弈，主要用逆向归纳
法。

无限次重复博弈的效率往往高于有限次重复博弈。

当重复次数较少不一定考虑贴现问题，但无限次重复博弈必须考虑贴现问题。

四、判断下列表述是否正确，并作简单讨论：
(1)有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。

答：不一定。

对于有两个以上纯策略纳什均衡的条件下就不一定。

如“触发策略”就不是。

(2)有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。

答：是，根据子博弈完美纳什均衡的要求，最后一次必须是原博弈的一个纳什均衡。

(3)无限次重复博弈均衡解的得益一定优于原博
弈均衡解的得益。

答：错。

如严格竞争的零和博弈就不优于。

(4)无限次重复古诺产量博弈不一定会出现合谋
生产垄断产量的现象。

答：正确。

合谋生产垄断产量是有条件的，由贴现率来反映，当不满足条件时，就不能构成激励。

(5)如果博弈重复无限次或者每次结束的概率足够小，而得益的时间贴现率$充分接近1,那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。

答：这就是无限次重复博弈的民间定理。

(6)触发策略所构成的均衡都是子博弈完美纳什均衡。

答：错误。

触发策略本身并不能排除重复博弈中不可信的威胁和承诺，因此由触发策略构成的不一定是子博弈完美纳什均衡。

五、为什么消费者偏好去大商店买东西而不太信赖走街穿巷的小商贩？
答：去大商店买东西，重复博弈——合作诚信问题；走街穿巷的小商贩，一次性博弈——没有合作的必要，存在不诚信和欺诈。

建立信用制度和诚信档案的必要性。

六、寡头的古诺产量博弈中，如果市场需求p=130-2,边际成本 C = 30且没有固定成本，贴现因子$ = 0.9。

如果该市场有长期稳定性，问两个厂商能否维持垄断产量？
解：『=(130-/-必-30气古诺产量
［刀)—(130 —q、— % )公—3。

％
* * 100 * * 10000
01=02=-^，利泅为：羽=缶=3—
垄断产量勿= (13O — 0)g — 3Og,
A q,n = 50，兀m = 2500
市场长期稳定的，翕= 1250
2
1250(1 + ^ +罗+.・.)=^^ = 12500, 3 = 0.9 1-3
如果一厂商偏离：勿］=(130 - 25 - 0)0 - 30., n% =37.5, <=1406.25
成，山皿* 10000,£ £2、牌皿* 100003
那么：1406.25 + ---- (3+罗+••.) = 1406.25 + --
9 9(1- $)
= 1406.25 +10000 = 11406.2502500
因此，坚持垄断产量是明智的。

七、如果上一题厂商1的边际成本该为10,厂商
2695.312 51 — 5 二
610.937
51一3
=
2的边际成本仍然是30。

假设市场仍然是长期稳定的, 而且两个厂商已经达成了厂商1生产3/4,厂商2生产1/4的垄断产量分配协议，问这种协议是否能够长期维持？
解.J 羽=(13。

-01 -02)01 T°01古诺产量
［刀2 =(130-01 - 02)02 - 3002
* 140 * 80 打心乌* 19600 * 6400
0 =^~902=§,木j/门为：心=—-—,刀2=-g-
垄断产量71= (130 - Q)Q- 0.75 x 102 - 0.25 x 300，
= 115Q_Q2,
=> Q n = 57.5 ,产量分别为：43.125 , 14.375 ;
心加=2695.3125, 7T2tn= 610.9375
如果两个厂商均不偏离：
厂商1偏离:
丸1 = (130 -14.375 - ％-10/ = 105.625/ -g：, q x
=52.8125,徇=278926
2789.16 +以迎(^+郡+・・・)= 2789.16 + 19600
9
=22389.16 < 26953.125 不偏离
厂商2偏离：
勿2 = (130-43.125 -02)02 -3。

02，02 = 28.4375,
"2 =808.6914
808.6914 +竺匹($+普+...)= 808.6914 + 6400
9
=7208.6914 > 6109.375 偏离
还可以计算出不同的3,可以进一步讨论。

八、两个人合作开发一项产品，能否成功与两个
人的工作态度有关，设成功概率如下:
B
A
努力偷懒努力9/163/8偷懒3/81/4
再假设成功时每人有4单位的利益，失败则双方
都没有利益，偷懒本身有1单位的利益。

问该博弈无限次重复博弈的均衡是什么？
解：根据问题的假设，该博弈的得益矩阵如下:
B
A
努力偷懒
努力9/4, 9/43/2, 5/2偷懒5/2, 3/22, 2
一次性博弈显然是囚徒困境式博弈，唯一的纳什
均衡两人都偷懒，双方的期望得益都是2。

在无限次重复博弈中，假设双方为了在共同努力
当满足:
4(1 —3) 一 2 (1 也就是S>-时采取这
2
方面实现合作采取如下的触发策略：开始时努力，一旦发现对方不努力，则自己也偷懒。

我们可以分析当贴现因子3符合什么条件时，该策略构成子博弈完美纳什均衡。

.、Q Q
不偏离：一(1 + 3+$2 +...)=——
4 4(1 — 3)
c 1 o
偏离：- + 2(J + ^2+--*) = - + —^―
2 2 (D
种触发策略是正确的，否则，偏离是正确的。

当曷时，两博弈方都采用这样的触发策略是本
博弈的子博弈完美纳什均衡；如果驾，则上述触发策略组合不是子博弈完美纳什均衡，两人都会采取偷懒的策略。

博弈论第四章习题.doc

合集下载

博弈论基础讲义-第四章

博弈论(第四章)

博弈论第四章

博弈论课后习题

(完整word版)博弈论练习题

博弈论课后习题答案

博弈论课后习题

博弈论第四章

博弈论第四章完全且完美信息动态博弈

经济博弈论(第三版)复习题及答案%20谢识予著

4博弈论基础作业及答案.doc

博弈论各章节课后习题答案 (4)

35博弈论-第四章

博弈论第4章答案

博弈论习题及解答

博弈论第四章习题

吉本斯-博弈论基础答案

文档推荐

最新文档

博弈论第四章习题.doc

合集下载

博弈论基础讲义-第四章

博弈论(第四章)

博弈论第四章

博弈论课后习题

(完整word版)博弈论练习题

博弈论 课后习题答案

博弈论课后习题

博弈论第四章

博弈论第四章 完全且完美信息动态博弈

经济博弈论(第三版)复习题及答案%20谢识予著

4博弈论基础作业及答案.doc

博弈论各章节课后习题答案 (4)

35博弈论-第四章

博弈论第4章答案

博弈论习题及解答

博弈论第四章习题

吉本斯-博弈论基础答案

文档推荐

最新文档

博弈论课后习题答案

博弈论第四章完全且完美信息动态博弈