博弈与决策作业1(答案)
- 格式:doc
- 大小:103.50 KB
- 文档页数:5
题库一、名词解释1.动态博弈动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。
2.逆向归纳法对于动态博弈,特别是在完全信息条件下,最简单的方法就是逆向归纳法。
就是从最后一个阶段或者最后一个子博弈开始逆推向上,逐步向前倒推以求解动态博弈均衡。
3.重复博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题。
4. 第二价格密封拍卖是由1996年诺贝尔经济学奖获得者威廉•维克瑞设计的,因而又被称为是“维克瑞拍卖”,具体规则如下:每个竞标者分别向拍卖方提交自己的报价,而且他们不知道别人的出价,出价最高的竞标者获得该物品,并按所有的出价中仅次于最高出价的第二高价格支付给卖家。
5.完全信息是指所有参与者各自选择行动的不同组合所决定的收益对所有参与者来说是共同知识。
共同知识就是你知道,我知道,你知道我知道的信息。
6.子博弈直观的含义是原博弈的一个部分,它本身也可以作为一个博弈进行分析,博弈树的一个子树所代表的博弈就是子博弈,子博弈的起始点是某个选择的终点,包括这个终点及所有后续结及枝及终点结之后的收益,构成了一个子博弈树,这个博弈树所代表的博弈称为子博弈。
7.公共信息如果有些信息是博弈参与者都知道的,或者是所有有关的参与者都知道的,这些信息就叫“公共信息”或者“共同知识”。
8.贝叶斯纳什均衡不完全信息静态博弈的均衡称为贝叶斯纳什均衡。
是指在不完全信息静态博弈中在给定自己类型以及其他参与者的类型与策略选择之间关系的条件下,使得自己的期望效用最大。
9.博弈论博弈论是指研究多个个体或团队在特定条件制约下的对局中,利用相关方的策略而实施对应策略的科学。
10.纳什均衡对于每一个参与者来说是这样一种组合,即给定其他参与者的策略,每一个参与者的这个策略能使其效用最大化。
其含义为:当博弈的所有参与者在某一选定的策略组合下都没有动机(单方面)偏离自己选定的策略时,该组合策略就是纳什均衡。
第1次作业1、考虑一个工作申请的博弈。
两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。
工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。
现在假定每家企业的工资满足:W1/2<W2<2W1,则问:a .写出以上博弈的战略式描述b .求出以上博弈的所有纳什均衡(包括混合策略均衡) 2、设古诺模型中有n 家厂商。
i q 为厂商i 的产量,12n Q q q q =+++L 为市场总产量。
P 为市场出清价格,且已知Q a Q P P-==)((当a Q <时,否则0=P )。
假设厂商i 生产产量i q 的总成本为i i i i cq q C C ==)(,也就是说没有固定成本且各厂的边际成本都相同,为常数)(a c c <。
假设各厂同时选择产量,该模型的纳什均衡是什么?当趋向于无穷大时博弈分析是否仍然有效?3、两个厂商生产一种完全同质的商品,该商品的市场需求函数为P Q -=100,设厂商1和厂商2都没有固定成本。
若他们在相互知道对方边际成本的情况下,同时作出产量决策是分别生产20单位和30单位。
问这两个厂商的边际成本各是多少?各自的利润是多少?4、五户居民都可以在一个公共的池塘里放养鸭子。
每只鸭子的收益v 是鸭子总数N 的函数,并取决于N 是否超过某个临界值N ;如果N N<,收益N N v v -==50)(;如果N N ≥时,0)(≡N v 。
再假设每只鸭子的成本为2=c 元。
若所有居民同时决定养鸭的数量,问该博弈的纳什均衡是什么?5、三对夫妻的感情状态可以分别用下面三个得益矩阵对应的静态博弈来表示。
问:这三个博弈的纳什均衡分别是什么?这三对夫妻的感情状态究竟如何?6、两个个体一起参加某项工程,每个人的努力程度[0,1](1,2)i e i ∈=,成本为()(1,2)i c e i =,该项目的产出为12(,)f e e 。
博弈与决策一、名词1.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。
2.完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。
3.博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。
4.动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。
5.纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。
6.非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。
7.纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。
8.纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。
二、请用剔除劣势策略的方法寻找以下博弈的最优策略。
要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。
乙甲答:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行;(2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列;(3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]百事可乐答:(1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行;(2)对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列; (3)余下的策略组合是(低价,低价),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]员工乙员工甲答:(1)对员工乙而言,策略R 是明显劣势策略,用竖线划去“R ”所对应的列;(2)对员工甲而言,在员工乙剔除R 策略之后,C 策略是劣势策略,用横线划去“C ”所对应的行;(3)对员工乙而言,此时劣势的策略是L ,用竖线划去“L ”所对应的列; (4)对员工甲而言,此时劣势的策略是D ,用竖线划去“D ”所对应的行; (5)余下的策略组合是(U ,M ),这就是该博弈的最优结果。
博弈论参考答案博弈论参考答案博弈论是一门研究决策制定的学科,它涉及到多个参与者之间的相互作用和决策过程。
在博弈论中,参与者的目标是最大化自己的利益,但是他们的决策又会受到其他参与者的影响。
因此,博弈论提供了一种分析决策制定的工具和方法。
博弈论的基本概念是博弈,它是指参与者根据一定的规则进行决策的过程。
在博弈中,每个参与者都有自己的策略和目标,他们通过不同的决策来达到自己的目标。
博弈论研究的重点是分析参与者之间的相互作用和决策过程,以及他们的策略选择和结果。
在博弈论中,最常见的博弈形式是零和博弈和非零和博弈。
零和博弈是指参与者的利益完全相反,他们的利益总和为零。
在这种情况下,一个参与者的利益的增加必然意味着其他参与者的利益的减少。
非零和博弈则是指参与者的利益可以同时增加或减少,他们的利益总和不一定为零。
博弈论中的一个重要概念是纳什均衡,它指的是在一个博弈中,每个参与者选择的策略都是最优的,即使其他参与者的策略发生改变也不会改变自己的策略。
纳什均衡是博弈论中的一个重要解概念,它帮助我们理解参与者之间的相互作用和决策过程。
除了纳什均衡,博弈论还有其他一些解概念,如帕累托最优解和博弈树。
帕累托最优解是指在一个博弈中,存在一种策略选择使得每个参与者的利益都得到最大化,而没有其他策略可以使任何一个参与者的利益得到进一步增加。
博弈树则是一种图形化的表示方式,它将博弈的过程和决策树结合起来,帮助我们分析和理解博弈的过程和结果。
博弈论在许多领域都有应用,如经济学、政治学、生物学等。
在经济学中,博弈论被广泛应用于分析市场竞争、价格战略等。
在政治学中,博弈论被用来分析国际关系、选举策略等。
在生物学中,博弈论被用来分析动物行为、进化策略等。
总之,博弈论是一门研究决策制定的学科,它提供了一种分析决策制定的工具和方法。
通过博弈论的研究,我们可以更好地理解参与者之间的相互作用和决策过程,为决策制定提供参考和指导。
博弈论在许多领域都有应用,它对我们理解和解决实际问题具有重要的意义。
博弈与决策平时作业参考答案(2)一、名词解释1.不确定性:就是指经济行为者在爭先不能准确地知道口己的某种决策的结果,或者说,只要经济行为主体的一种决策的可能结果不止一种,就会产生不确定性。
2.最大期望收益法:就是在事件结果不确定的情况下,应该选择给他带来“期望收益”最人的策略。
3.混合策略:如果在每个给定信息下,参与者只能以某种概率选择不同地策略,就称为混合策略。
4.支付均等法:当一个参与者在均衡屮应用一个混合策略时,他所得到的支付必须与他在混合策略屮所应用的每一个纯策略的支付相同。
5.子博弈:如杲从第一阶段以外的某个阶段开始的后续博弈阶段,也有初始信息集,具备进行博弈所需要的各种信息,能够自成一个博弈,我们就将这个博弈阶段称为原动态博弈的一个“子博弈”。
6.逆向归纳法:从最后一个阶段或最后一个子博弈开始逆推上去,逐步向前倒推以求解动态博弈均衡,这就是逆向归纳法。
7.承诺:就是对愿意与你合作的人给予回报的方式。
8.空洞威胁:当发出威胁的博弈参与者选择威胁所宣称的行动策略时,对自己并没冇好处,这就不町信了,这叫做“空洞威胁”。
二、请用最大期望收益法寻找最优策略。
要求:(1)写出计算步骤;(2)给出蝕优的策略结果。
甲乙两家企业,为了市场份额的争夺,在价格定制问题上各有两种纯策略,如图2-1所示。
两家企业都知道口己在各个策略组合下的收益悄况,但绘并不知道対方的收益。
假设甲釆取U的概率为0.3,乙采取/?的概率为0.6o答:(1)当乙采取策略的可能性为0.6时,采取厶策略的可能性为0.4,那么甲据此判断采取自己的策略(/时所获得的可能的期望收益E(7(C/)=0.6x2+0.4x3=2.4。
甲釆取口己的策略D时所获得的可能的期望收益E(/(D)=0.6x4+0.4xl=2.8o很显然,甲应该选杼策略Q,因为EU(D)> EUS(2)当甲釆取(/策略的可能性为0.3时,采取Q策略的可能性为0.7,那么乙据此判断采取自己的策略厶时所获得的可能的期望收益E(/(L)=0.3xl+0.7x4=3.1 o乙采取自己的策略R时所获得的可能的期望收益E(/(7?)=0.3x4+0.7x2=2.6o很显然,乙应该选择策略厶,因为EU(L)> EU(R)。
测验一题目1博弈当中通常包括下面的内容,除了()。
正确的答案是:支付题目2题目3题目4题目5题目6题目7题目8题目9题目10题目11题目12题目13题目14题目15题目16题目17题目18题目19题目20题目21题目22题目23题目24题目25测验二题目2题目3题目4题目5题目6题目7题目8题目9题目1011题目12题目13题目14题目15题目16题目17题目18题目19题目20题目2122题目23题目24题目25测试三题目1题目2题目3题目4题目5题目67题目8KMRW声誉模型的提出者是美国经济学家曼柯?奥尔逊。
正确的答案是“错”。
题目9题目10声誉模型表明,博弈参与者具有外生的合作倾向。
正确的答案是“错”。
题目11题目12题目13题目14题目15题目16题目17题目18题目19题目20题目21题目22题目23题目24题目25测试四题目1题目2题目3题目4题目5题目6题目7题目8题目9题目10题目11题目12题目13题目14委托人提供一个合约,让代理人在努力工作时所获得的收益大于不努力工作时的收益,这就是激励相容约束。
正确的答案是“对”。
题目15题目16题目17题目18题目19题目20题目21题目22题目23题目24题目25如果一个企业设定了一系列岗位应聘条件,求职者根据这些条件,并针对自己的能力大小判断自己是否符合岗位要求,这就属于(? ? ? ?)问题。
正确答案是:信号筛选。
战略博弈习题答案战略博弈习题答案战略博弈是一种通过推演和思考来制定最优决策的过程。
在这个过程中,我们需要分析各种可能的情况和对手的行为,以制定最佳的策略。
下面将给出几个战略博弈习题的答案,希望能够帮助读者更好地理解和应用战略博弈的原理。
习题一:囚徒困境在囚徒困境中,两个囚徒面临合作与背叛的选择。
如果两个囚徒都选择合作,则每个人都会获得较轻的刑罚;如果两个囚徒都选择背叛,则每个人都会获得较重的刑罚;如果一个囚徒选择合作而另一个囚徒选择背叛,则合作的囚徒将会受到极重的刑罚,而背叛的囚徒将会获得较轻的刑罚。
答案:在囚徒困境中,最稳定的策略是背叛。
因为无论对方选择合作还是背叛,背叛都能够保证自己获得较轻的刑罚。
这是一个典型的非合作博弈,每个囚徒都会选择背叛,因为他们无法相信对方会选择合作。
习题二:博弈论中的狼羊菜问题在一个河边,有一只狼、一只羊和一堆菜。
现在农夫要将它们一只一只地运到河对岸,但是他只能带一样东西过河。
而且,如果农夫不在场时,狼会吃羊,羊会吃菜。
答案:农夫首先带羊过河,然后回来自己过河,然后带狼过河,但是农夫带狼过河后,要把狼放在对岸,然后回到河这边,再带羊过河,最后带菜过河。
这样可以确保在任何时候都不会有狼吃羊或羊吃菜的情况发生。
习题三:拍卖策略在拍卖中,不同的竞拍者会根据自己的估价来决定出价。
最终,出价最高的竞拍者将赢得物品,并支付自己的出价。
答案:在拍卖中,最理性的策略是出价等于自己对物品的估价。
这样可以最大程度地保证自己以最低的价格赢得物品。
然而,在实际拍卖中,竞拍者还需要考虑其他竞拍者的行为,以及拍卖的规则和策略。
因此,拍卖策略的制定需要综合考虑多种因素。
总结:战略博弈是一个复杂而有趣的领域,它涉及到许多数学和逻辑原理。
在解决战略博弈问题时,我们需要深入分析各种可能的情况和对手的行为,以制定最佳的策略。
本文给出了几个常见的战略博弈习题的答案,希望能够帮助读者更好地理解和应用战略博弈的原理。
“博弈论”习题参考附标准答案博弈论博弈论是研究人类决策制定和行为选择的一门学科,它涉及到多个参与者之间的冲突和利益博弈。
通过分析和建模参与者的决策过程,博弈论可以帮助我们理解和预测各种决策情况,并提供策略和解决方案。
本文将介绍几个典型的博弈论习题,并附上标准答案作为参考。
1. 囚徒困境囚徒困境是博弈论中最著名的问题之一。
假设两名囚徒被捕,检察官分别问他们是否承认自己犯罪。
如果只有一个人承认犯罪,他会得到从轻判决;如果两人都承认,他们将得到较重的判决;如果两人都否认,那么他们将得到较轻的判决。
但是,由于彼此的不信任和利益冲突,囚徒往往会选择自私的策略,即承认犯罪。
这个问题可以用一个博弈矩阵来表示:囚徒B承认囚徒B否认囚徒A承认 -5,-5 -10,0囚徒A否认 0,-10 -1,-1其中左上角的数字表示囚徒A和B都承认犯罪时的判决结果,右下角的数字表示囚徒A和B都否认犯罪时的判决结果。
通过分析博弈矩阵,可以发现最优策略是双方都选择否认犯罪。
2. 纳什均衡纳什均衡是博弈论的一个重要概念,它指的是参与者在给定其他参与者策略的情况下,无法通过单方面改变自己策略来获得更好结果的状态。
以两个司机选择路线为例,假设他们可以选择两条路线,每个司机希望自己的路线时间最短。
若两个司机都选择第一条路线,他们的到达时间相同,这是一个纳什均衡;若一个司机选择第一条路线,另一个司机选择第二条路线,他们的到达时间将不同,这不是一个纳什均衡状态。
3. 合作与背叛合作与背叛是博弈论中经常出现的主题,也是人们日常生活和商业交易中的重要决策。
例如,两个公司可以选择合作开展某项业务,也可以选择相互竞争。
合作可以带来双方共同的利益,但也需要相互信任;而背叛则是一种自私的策略,可以追求个体利益,但可能破坏双方的合作关系。
4. 平衡策略在博弈论中,平衡策略指的是使得参与者无法通过改变自己的策略来达到更好结果的策略选择。
在一些特殊的情况下,博弈存在多个平衡策略。
博弈与决策网上作业答案第一次作业答案1.博弈当中通常包括下面的内容,除了(支付 ?? )。
2.博弈论中,局中人从一个博弈中得到的结果常被称为(损益 ? ? ? ? )3.一个博弈中,直接决定局中人损益的因素是(? 策略组合? ? ? )4.下列关于策略的叙述哪个是错误的(一个局中人在原博弈中的策略和在子博弈中的策略是相同的? ? ? )5.囚徒困境说明(?双方都独立依照自己的利益行事,则双方不能得到最好的结果???????? )6.在具有占优策略均衡的囚徒困境博弈中(?两个囚徒都会坦白???? )7.策略式博弈,正确的说法是(策略式博弈无法表明行动顺序? ? ?? )8.市场交易中普遍存在的讨价还价属于哪种博弈。
(完全信息动态博弈? ? ?? ? )9.公共物品的特征是(不用购买就可消费? ? ? ? )10.下面哪一项物品具有非排他性(?国防 ? ?? )11.在一个博弈中博弈方可以有很多个V12.在一个博弈中只可能存在一个纳什均衡。
X13.在博弈中知道越多的一方越有利。
X14.在博弈中纳什均衡是博弈双方能获得的最好结果。
X15.在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。
X16.纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。
V17.囚徒困境说明个人的理想选择不一定是集体的理想选择。
V18囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
X19.纳什定理说明在任何一个有n个博弈方存在的有限博弈中,都至少存在一个纳什均衡。
V20.根据参与人行动的是否同步来区分,博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。
V21.在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。
X22.子博弈可以从一个多节点信息集开始。
X23.公共物品实际上就是公用的物品。
博弈论?习题一、单项选择题1.博弈论中,局中人从一个博弈中得至口的结果常被称为〔〕. A?效用B.支付C.决策D.利润2.博弈中通常包括下面的内容,除了〔〕.A.局中人B.占优战略均衡C策略D?支付3.在具有占优战略均衡的囚徒困境博弈中〔〕.A.只有一个囚徒会坦白氏两个囚徒都没有坦白C?两个囚徒都会坦白D.任何坦白都被法庭否决了4.在屡次重复的双头博弈中,每一个博弈者努力〔〕.A.使行业的总利润到达最大B?使另一个博弈者的利润最小C?使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是〔〕A.策略组合B.策略C信息D.行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最正确行为,此时的博弈具有〔〕0A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D?激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为〔〕.A.一报还一报的策略B.激发策略8.在囚徒困境的博弈中,合作策略会导致〔〕oA博弈双方都获胜B博弈双方都失败C使得先米取行动者获胜D使得后米取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现〔〕oA.当一个垄断竞争行业是由一个主导企业限制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时一个企业米取的彳丁为10.与另一个企业在前一阶段采取的行为一致〞这种策略是一种〔〕A.主导策略B.激发策略C.一报还一报策略D.主导策略11-关于策略式博弈,正确的说法是〔〕0A.策略式博弈无法刻划动态博弈B.策略式博弈无法说明行动顺序C.策略式博弈更容易求解D.策略式博弈就是一个支付矩阵12.以下关于策略的表达哪个是错误的〔〕:A.策略是局中人选择的一套行动方案;B.参与博弈的每一个局中人都有假设干个策略;C.一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D.策略与行动是两个不同的概念,策略是行动的规那么,而不是行动本身.13.囚徒困境说明〔〕:A.双方都独立依照自己的利益行事,那么双方不能得到最好的结果;B.如果没有某种约束,局中人也可在〔抵赖,抵赖〕的根底上到达均衡;C.双方都依照自己的利益行事,结果一方赢,一方输;D.每个局中人在做决策时,不需考虑对手的反响14.一个博弈中,直接决定局中人损益的因素是〔〕:A.策略组合B.策略C信息D.行动15.动态博弈参与者在关于博弈过程的信息方面是〔〕A不对称的B对称的C不确定的D无序的16.古诺模型表达了寡头企业的〔〕决策模型A本钱B价格C产量D质量17.伯特兰德模型表达了寡头企业〔〕决策模型.A本钱价格C产量 D 质量18.用囚徒困境来说明两个寡头企业的情况,说明了:〔〕A、每个企业在做决策时,不需考虑竞争对手的反响E. 一个企业制定的价格对其它企业没有影响C、企业为了预防最差的结果,将不能得到更好的结果D、一个企业制定的产量对其它企业的产量没有影响19.子博弈精炼纳什均衡〔〕:A.是一个一般意义上的纳什均衡;B.和纳什均衡没有什么关系;C.要求某一策略组合在每一个子博弈上都构成一个纳什均衡;D.要求某一策略组合在原博弈上都构成一个纳什均衡.20.在一般产品销售市场上,以下哪种原因导致了逆向选择.〔〕A产品质量的不确定性B私人信息C公共信息D产品价格21.完全信息动态博弈参与者的行动是〔〕A无序的B有先后顺序的C不确定的D因环境改变的22.市场交易中普遍存在的讨价还价属于哪种博弈.〔〕A完全信息静态博弈B完全信息动态博弈C不完全信息静态博弈D不完全信息动态博弈23.下面哪种模型是一种动态的寡头市场博弈模型〔〕A古诺模型B伯川德模型C斯塔克尔伯格模型D田忌齐威王赛马24?博弈方根据一组选定的在两种或两种以上可能行为中随机选择的策略为血玄〔、A纯策略B混合策略C激发策略D 一报还一报策略25.影响重复博弈均衡结果的主要因素是〔〕A博弈重复的次数B信息的完备性C支付的大小DA和B26.在动态博弈战略行动中,只有当局中人从实施某一威胁所能获得的总收益()不实施该威胁所获得的总收益时,该威胁才是可信的.A大于B等于C小于D以上都有可能二、判断正误并简要说明理由I,纳什均衡一定是上策均衡,上策均衡一定是纳什均衡.2?在一个博弈中博弈方可以有很多个.3.在一个博弈中只可能存在一个纳什均衡.4.由于零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈.5.在一个博弈中如果存在多个纳什均衡那么不存在上策均衡.6.曲于两个罪犯只打算犯罪一次〞所以被捕后才出现了不合作的问题即囚徒困境.但如果他们打算重复合伙屡次,比方说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供.7,在博弈中纳什均衡是博弈双方能获得的最好结果.8.在博弈中如果某博弈方改变策略后得益增加那么另一博弈方得益减少.9,纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合.10.囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是由于两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长.11.斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润.12.在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系〞使重复博弈无法实现更高效率均衡的关键问题.13.子博弈精炼纳什均衡不是一个纳什均衡.14.零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡.15.原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别.16.在动态博弈中,由于后行动的博弈方可以先观察对方行为后再选择行为 ,因此总是有利的.入计算与分析题1、A、B两企业利用广告进行竞争.假设A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;假设A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;假设A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;假设A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润.〔,〕画出A、B两企业的损益矩阵.〔2 〕求纯策略纳什均衡.2、可口可乐与百事可乐〔参与者〕的价格决策:双方都可以保持价格不变或者提升价格〔策略〕;博弈的目标和得失情况表达为利润的多少〔收益〕;利润的大小取决于双方的策略组合〔收益函数〕;博弈有四种策略组合,其结局是:〔1〕双方都不涨价,各得利润10单位;〔2 〕可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30 ;(3 )可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30 ;(4 )双方都涨价,可口可乐利润140,百事可乐利润35 ;画出两企业的损益矩阵求纳什均衡.3、假定某博弈的报酬矩阵如下:(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>?(2 )如果(上,左)是纳什均衡,上述哪几个不等式必须满足4、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场.如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元.如果一方在价格决策方面选择合作而另一方却选择降低价格,那么合作的厂商获利将为零,竞争厂商将获利900000元.(1)将这一市场用囚徒困境的博弈加以表示.(2 )解释为什么均衡结果可能是两家公司都选择竞争性策略.5、博弈的收益矩阵如下表:⑴如果(上/左)是占优策略均衡/那么a、b、c、d、G、f、g、h之间必然满足哪些关系〔尽量把所有必要的关系式都写出来〕〔2 〕如果〔上,左〕是纳什均衡,那么〔1〕中的关系式哪些必须满足〔3 〕如果〔上,左〕是上策均衡,那么它是否必定是纳什均衡为什么〔4 〕在什么情况下,纯策略纳什均衡不存在6、猪圈里有一头大猪和_头小猪,猪圈的一头有一个饲料槽,另一头装有限制饲料供给的按钮.按一下按钮就会有,0个单位饲料进槽,但谁按谁就要付出2个单位的本钱.谁去按按纽那么谁后到;都去按那么同时到.假设大猪先到,大猪吃到9个单位,小猪吃到一个单位;假设同时到,大猪吃7个单位,小猪吃3个单位;假设小猪先到,大猪吃六个单位,小猪吃4个单位.求〔1〕各种情况组合扣除本钱后的支付矩阵〔2 〕求纳什均衡.7、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润〔单位:万元〕由以下图的得益矩阵给出:1〕有哪些结果是纳什均衡(2 )两厂商合作的结果是什么8、求出以下博弈的所有纯策略纳什均衡.9、求出下面博弈的纳什均衡(含纯策略和混合10、根据两人博弈的损益绸邛仲I答问题:(1) ◎出两人各自的金部策略.图示均衡点.(2 )求出斯塔克博格rstackelberg )均衡情况下的产量、价格和利润.(3)说明导致上述两种均衡结果差异的原因.13.下面的得益矩阵两博弈方之间的一个静态博弈,该博弈有没有纯策略的纳什均衡,博弈的结果是什么14.两个兄弟分一块冰激凌.哥哥先提出一个分割比例 ,弟弟可以接受或拒绝,接受那么按哥哥的提议分割,假设拒绝就自己提出一个比例.但这时候冰激凌已化得只剩1/2 了,对弟弟提议的比例哥哥也可以接受或拒绝,假设接受那么按弟弟的建议分割,假设拒绝冰激凌会全部化光.由于兄弟之间不应该做损人不利己的是“因此我们假设接受和拒绝利益相同时兄弟俩都会接受.求该博弈的子博弈完美纳什均衡.15?如果学生在测试之前全面复习,考好的概率为90%,如果学生只复习一局部重点,那么有50% 的概率考好.全面复习花费的时间tl = 100小时,重点复习之需要花费t2=20小时.学生的效用函数为:U二W-2巳其中W是测试成绩,有上下两种分数Wh和Wl, e为努力学习的时间.问老师如何才能促使学生全面复习16?在以下监工与工人之间的博弈中,试用划线法分析该博弈有无纯策略纳什均衡;如果没有,那么写出混合策略纳什均衡的结果.监工17 ?求解以下博弈的纳什均衡.博弈方29 18 ?某人正在打一场官司,不请律师肯定会输,请律师后的结果与律师的努力程度有关.假设当律师努力工作〔100小时〕时有50%的概率能赢,律师不努力工作<10小时〕那么只有15%的概率能赢.如果诉讼获胜可得到250万元赔偿,失败那么没有赔偿.由于委托方无法监督律师的工作,因此双方约定根据结果付费,赢官司律师可获赔偿金额的10%,失败那么律师一分钱也得不到.如果律师的效用函数为m 0.05e,其中m是报酬e是努力小时数,且律师有时机本钱5万元.求这个博弈的均衡.四、论述题Is解释"囚犯困境;并举商业案例说明.2、用〃小偷与守卫的博弈"说明〃鼓励〔监管〕悖论"博弈论?习题参考答案>单项选择题r 5 B. B. C.D ' A.11 15. B. C. A.6 10 C. A. A.D. C.16 20 C. B. C.21 26. B. B. C. B. D. A.,判断正误并简要说明理由1. F 上策均衡是比纳什均衡更严格的均衡.所以上策均衡一定是纳什均衡 一定是上策均衡,2. T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈3. IF 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在多个纳什均衡4. T 零和博弈才旨参与博弈各方在严格竞争下,一方收益等于另一方损失与损失之和恒为零,所以双方不存在合作可能性而纳什均衡不 ,如性别战.,博弈各方收益 ,只能有一个5.T上策均衡是通过严格下策消去法〔重复剔除下策〕所得到的占优策略纳什均衡6.IF只要两囚犯只打算合作有限次,其最优策略均为招供.比方最后一次合谋,两小偷被抓住了,由于将来没有合作时机了,最优策略均为招供.回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢.依此类推,对于有限次内的任何一次,两小偷均不可能合作.7.F纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的.团F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.T虽然斯塔格伯格模型各方利润总和小于古诺模型〞但是领导者的利润比古诺模型时12..T无限次重复博弈没有结束重复确实定时间;而在有限次重复博弈中,存在最后一次重复,并且正是有结束重复确实定时间,使重复博弈无法实现更高效率均衡.13.F子博弈精炼纳什均衡一定是一个纳什均衡.14.F零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡.15.T原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,因此不管是重复有限次还是无限次,不会和一次性博弈有区别.16.F动态博弈是指各博弈方的选择和行动又先后次序的博弈.动态博弈的信息盯以是不对称的.所以策略分为先发制人和.斯塔克伯格博弈揭示“先发制人〞更有禾L而"后发制人"后行动的博弈方可以先观察对方行为后再选择行为反而处于不利境地.三、计算与分析题Is (1)(2)纯策略纳什均衡为(做广告,做广告),(不做广告,不做广告)得长价-20, 30140,35纳什均衡〔不涨价,不涨价〕,〔涨价,涨价〕.从帕累托均衡角度,为〔涨价,涨价〕3、〔 1〕如果〔上/左〕是上策均衡,那么,a>e b>d, g<c, f>h 〔2 〕如果〔上〕左〕是纳什均衡,a>e b>d,不等式必须满足新华航空北方航空 合作竞争50, 50 90, 00, 90 6, 65、 略纳什均衡为〔按,等〕 7、略8、纯策略纳什均衡〔氏甲〕,〔⑴不存在纯策略纳什均衡合作肓争⑵设甲选择"U"的概率为概率为1-P1乙选择"『的概率为P2,贝V选择" R" 的概率为1-P2对甲而言,最正确策略是按定的概率选〃上"和‘下’,使乙选择“左〃和〃右"的期望值相等即PI*8+ (l-PI) *0-P1*1+ (1-P1) *5解得PI = 5/12即⑸12, 7/12 )按5/12概率选〃上“、7/12概率选〃下"为甲的混合策略Nash均衡对乙而言,最正确策略是按一定的概率选“左“和“右",使乙选择〃上"和‘下’的期望值相等即P2*5+(l-P2)*0- P2*2 + (l-P2)*4即(4/7, 3/7肢4/7概率选‘左’、3/7概率选"右"为乙的混合策略Nash均衡10、略.11、见笔记12、见笔记.13、首先,运用严格下策反复消去法的思想,不难发现在博弈方1的策略中,B是相对于T的严格下策.把博弈方1的B策略消去后又可以发现,博弈方2的策略中C是相对于R的严格下策,从而也可以消去.两个博弈方各消去一个策略后的博弈是如下的两人2X 2博弈,己经不存在任何严格下策.再运用划线或箭头法,很容易发现这个2X2博弈有两个纯策略纳什均衡(M,L )和(1R ) 0由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,一次性静态博弈的结果不能肯定.由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可以是4个纯策略组合中的任何一个.14.假设哥的方案是SI: 1-S1淇中S1是自己的份额,弟的方案是S2: 1-S2, S2是哥的份额,那么可用如下的扩展形表示该博弈:Hi SiC5V2eS? 2)CO O)运用逆推归纳法先分析最后一阶段哥的选择.由于只要接受的利益不少于不接受的利益哥就会接受,因此在这个阶段只要弟的方案满足S2/2 $0,也就是S2$0,哥就会接受,否那么不会接受.由于冰激凌的份额不可能是负数,也就是说由于哥不接受弟的方案冰激凌会全部化掉〞因此任何方案哥都会接受.现在回到前一阶段弟的选择.由于弟知道后一阶段哥的选择方法,因此知道如果不接受前一阶段哥提出的比例,自己可以取S2=0,独享此时还未化掉的1/2块冰激凌;如果选择接受前一阶段哥的提议,那么自己将得到出1,显然只要l-Sn/2 ,即S1W1/2,弟就会接受哥的提议.再回到第一阶段哥的选择.哥清楚后两个阶段双方的选择逻辑和结果 ,因此他在这一阶段选择Sl = 1/2,正是能够被弟接受的自己的最大限度份额,超过这个份额将什么都不能得到,因此SI二1/2是最正确选择.综上,该博弈的子博弈完美纳什均衡是:哥哥开始时就提议按(1/2J/2)分割,弟弟接受.15.此题中老帅的调控于段高分和低分的差距.该博弈的扩•展形如下:只有当Ul» U2时学生才会选择全面复习.根据Ul» U2我们可以算出Wh- WD 400o这就是老师能有效全面复习需要满足的条件.其实在奖学金与成绩挂钩时,Wh- W1也可以理解成不同等奖学金的差额.16泄有纯策略均衡,只有混合策略均衡((0. 25,0.75 ),(0. 5,0. 5 ))17. 可以根据画线法求得有唯一纯策略均衡(上,左)18.参见第15题四、论述题1、解释〃囚犯困境〃,并举商业案例说明.(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯.他们被分别关在不同的牢房无法互通信息.各囚徒都被要求坦白罪行.如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年.(2)囚徒困境的策略矩阵表.每个囚徒都有两种策略:坦白或不坦白.表中的数字分别代表囚徒甲和乙的得益.囚徒乙3〕分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都〃坦白〃.给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白.这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不管对方如何选择,个人的最优选择是坦白.其结果是双方都坦白.4〕商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境.当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润.但卡特尔协定不是一个纳什均衡,由于给尢双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润.2用〞小偷与守卫的博弈〃说明〃鼓励〔监管〕悖论〃.〔1〕假设条件举例:偷窃和预防偷窃是小偷和门卫之间进行博弈的一场游戏.门卫可以不睡觉,或者睡觉.小偷可以采取偷、不偷两种策略.如果小偷知道门卫睡觉, 他的最正确选择就是偷;如果门卫不睡觉,他最好还是不偷.对于门卫,如果他知道小偷想偷,他的最正确选择是不睡觉,如果小偷采取不偷,自己最好去睡觉.〔2 〕小偷与门卫的支付矩阵表〔假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住〕:。
“博弈论”习题和参考答案与解析《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。
A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。
A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。
A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。
A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
博弈与决策
平时作业参考答案(1)
一、名词解释
1.博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。
2.完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。
3.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。
4.动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。
5.非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。
6.纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。
7.纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。
8.纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。
二、请用剔除劣势策略的方法寻找以下博弈的最优策略。
要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。
乙
甲
答:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行;
(2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列;
(3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]
百事可乐
答:(1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行;
(2)对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列; (3)余下的策略组合是(低价,低价),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]
员工乙
员工甲
答:(1)对员工乙而言,策略R 是明显劣势策略,用竖线划去“R ”所对应的列;
(2)对员工甲而言,在员工乙剔除R 策略之后,C 策略是劣势策略,用横线划去“C ”所对应的行;
(3)对员工乙而言,此时劣势的策略是L ,用竖线划去“L ”所对应的列; (4)对员工甲而言,此时劣势的策略是D ,用竖线划去“D ”所对应的行; (5)余下的策略组合是(U ,M ),这就是该博弈的最优结果。
三、根据优势策略下划线法找出以下博弈的纯策略纳什均衡,并指出是否存在混合策略纳什均衡。
要求: (1)划出相应优势策略的下划线;(2)给出最优的博弈结果。
2号厂商
X
Y
1号厂商
A
B
答:(1)下划线如图所示;
(2)只形成一个纯策略纳什均衡,即(A,X)。
(3)博弈的结果为(10,4),即1号厂商获得10单位支付,2号厂商获得4单位支付。
(4)按照纳什均衡存在性定理,这里不存在混合策略纳什均衡。
[注:括号的数字和字母顺序不能颠倒]
2号厂商
X Y
1号厂商A
B
答:(1)下划线如图所示;
(2)没有形成一个纯策略纳什均衡。
(3)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。
[注:括号的数字和字母顺序不能颠倒]
2号厂商
W X Y
1号厂商A
B
答:(1)下划线如图所示;
(2)形成两个纯策略纳什均衡,即(A,Y)和(B,W)。
(3)博弈的结果有两个:(4,5),即1号厂商获得4单位支付,2号厂商获得5单位支付;(8,6),即1号厂商获得8单位支付,2号厂商获得6单位支付。
(4)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。
[注:括号的数字和字母顺序不能颠倒]
四、在以下博弈矩阵图中找出哪一个是囚徒困境博弈,并简要解释理由。
乙
坏心好心
甲坏心
好心
图1-1
乙
坏心好心
甲坏心
好心
图1-2
乙
坏心好心
甲坏心
好心
图1-3
答:(1)利用下划线法找出博弈的纳什均衡,如图所示。
(2)囚徒困境反映的是基于个人理性的个体最佳选择并非集体最佳选择,参与者之间会选择相互“坏心”,而且对双方而言,(好心,好心)的结果一定要比(坏心,坏心)更好。
(3)在三个博弈中,图1-1不是囚徒困境博弈,因为参与者甲在选择“好心”(即合作)策略时才能实现均衡。
图1-2所示的博弈为囚徒困境博弈,因为参与者只有在都选择“坏心”(即不合作)策略时才能实现均衡。
图1-32所示的博弈也不是囚徒困境博弈,因为对乙而言,(坏心,坏心)的结果比(好心,好心)的结果有利。
五、博弈分析
假设你所在的公司现在的发展虽然还可以,但是未来前景不容乐观,所以老板只能对一个人加薪。
如果你和你的同事之间只有一个人提出来加薪的请求,老板会考虑为提出要求的这个
员工加薪,当然不会对那个没有提出来的员工加薪了。
但是假如你和你的同事两个人一起提出来要加薪,那么老板就只有选择同时辞退你们俩。
请给出这个博弈的矩阵分析图,并解释你最优的策略。
答:该博弈矩阵如下:
同事
要求不要求
你
要求
不要求
根据下划线方法,在这个博弈中,我们可以找到两个纳什均衡,即(要求,不要求)和(不要求,要求)。
这个结果说明,你和同事只能一方提出加薪的要求才可以,同时选择要求加薪的行动只会带来最坏的结果——都被辞退。
换句话说,你要想获得福利的改进,就应该先行一步提出来加薪的要求。
而假如你看到你的同事首先选择了要求加薪的策略之后,你最好不再提出来这样的要求。