博弈与决策作业1(答案)
- 格式:doc
- 大小:103.50 KB
- 文档页数:5
题库一、名词解释1.动态博弈动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。
2.逆向归纳法对于动态博弈,特别是在完全信息条件下,最简单的方法就是逆向归纳法。
就是从最后一个阶段或者最后一个子博弈开始逆推向上,逐步向前倒推以求解动态博弈均衡。
3.重复博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题。
4. 第二价格密封拍卖是由1996年诺贝尔经济学奖获得者威廉•维克瑞设计的,因而又被称为是“维克瑞拍卖”,具体规则如下:每个竞标者分别向拍卖方提交自己的报价,而且他们不知道别人的出价,出价最高的竞标者获得该物品,并按所有的出价中仅次于最高出价的第二高价格支付给卖家。
5.完全信息是指所有参与者各自选择行动的不同组合所决定的收益对所有参与者来说是共同知识。
共同知识就是你知道,我知道,你知道我知道的信息。
6.子博弈直观的含义是原博弈的一个部分,它本身也可以作为一个博弈进行分析,博弈树的一个子树所代表的博弈就是子博弈,子博弈的起始点是某个选择的终点,包括这个终点及所有后续结及枝及终点结之后的收益,构成了一个子博弈树,这个博弈树所代表的博弈称为子博弈。
7.公共信息如果有些信息是博弈参与者都知道的,或者是所有有关的参与者都知道的,这些信息就叫“公共信息”或者“共同知识”。
8.贝叶斯纳什均衡不完全信息静态博弈的均衡称为贝叶斯纳什均衡。
是指在不完全信息静态博弈中在给定自己类型以及其他参与者的类型与策略选择之间关系的条件下,使得自己的期望效用最大。
9.博弈论博弈论是指研究多个个体或团队在特定条件制约下的对局中,利用相关方的策略而实施对应策略的科学。
10.纳什均衡对于每一个参与者来说是这样一种组合,即给定其他参与者的策略,每一个参与者的这个策略能使其效用最大化。
其含义为:当博弈的所有参与者在某一选定的策略组合下都没有动机(单方面)偏离自己选定的策略时,该组合策略就是纳什均衡。
第1次作业1、考虑一个工作申请的博弈。
两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。
工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。
现在假定每家企业的工资满足:W1/2<W2<2W1,则问:a .写出以上博弈的战略式描述b .求出以上博弈的所有纳什均衡(包括混合策略均衡) 2、设古诺模型中有n 家厂商。
i q 为厂商i 的产量,12n Q q q q =+++L 为市场总产量。
P 为市场出清价格,且已知Q a Q P P-==)((当a Q <时,否则0=P )。
假设厂商i 生产产量i q 的总成本为i i i i cq q C C ==)(,也就是说没有固定成本且各厂的边际成本都相同,为常数)(a c c <。
假设各厂同时选择产量,该模型的纳什均衡是什么?当趋向于无穷大时博弈分析是否仍然有效?3、两个厂商生产一种完全同质的商品,该商品的市场需求函数为P Q -=100,设厂商1和厂商2都没有固定成本。
若他们在相互知道对方边际成本的情况下,同时作出产量决策是分别生产20单位和30单位。
问这两个厂商的边际成本各是多少?各自的利润是多少?4、五户居民都可以在一个公共的池塘里放养鸭子。
每只鸭子的收益v 是鸭子总数N 的函数,并取决于N 是否超过某个临界值N ;如果N N<,收益N N v v -==50)(;如果N N ≥时,0)(≡N v 。
再假设每只鸭子的成本为2=c 元。
若所有居民同时决定养鸭的数量,问该博弈的纳什均衡是什么?5、三对夫妻的感情状态可以分别用下面三个得益矩阵对应的静态博弈来表示。
问:这三个博弈的纳什均衡分别是什么?这三对夫妻的感情状态究竟如何?6、两个个体一起参加某项工程,每个人的努力程度[0,1](1,2)i e i ∈=,成本为()(1,2)i c e i =,该项目的产出为12(,)f e e 。
博弈与决策一、名词1.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。
2.完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。
3.博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。
4.动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。
5.纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。
6.非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。
7.纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。
8.纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。
二、请用剔除劣势策略的方法寻找以下博弈的最优策略。
要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。
乙甲答:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行;(2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列;(3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]百事可乐答:(1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行;(2)对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列; (3)余下的策略组合是(低价,低价),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]员工乙员工甲答:(1)对员工乙而言,策略R 是明显劣势策略,用竖线划去“R ”所对应的列;(2)对员工甲而言,在员工乙剔除R 策略之后,C 策略是劣势策略,用横线划去“C ”所对应的行;(3)对员工乙而言,此时劣势的策略是L ,用竖线划去“L ”所对应的列; (4)对员工甲而言,此时劣势的策略是D ,用竖线划去“D ”所对应的行; (5)余下的策略组合是(U ,M ),这就是该博弈的最优结果。
博弈论参考答案博弈论参考答案博弈论是一门研究决策制定的学科,它涉及到多个参与者之间的相互作用和决策过程。
在博弈论中,参与者的目标是最大化自己的利益,但是他们的决策又会受到其他参与者的影响。
因此,博弈论提供了一种分析决策制定的工具和方法。
博弈论的基本概念是博弈,它是指参与者根据一定的规则进行决策的过程。
在博弈中,每个参与者都有自己的策略和目标,他们通过不同的决策来达到自己的目标。
博弈论研究的重点是分析参与者之间的相互作用和决策过程,以及他们的策略选择和结果。
在博弈论中,最常见的博弈形式是零和博弈和非零和博弈。
零和博弈是指参与者的利益完全相反,他们的利益总和为零。
在这种情况下,一个参与者的利益的增加必然意味着其他参与者的利益的减少。
非零和博弈则是指参与者的利益可以同时增加或减少,他们的利益总和不一定为零。
博弈论中的一个重要概念是纳什均衡,它指的是在一个博弈中,每个参与者选择的策略都是最优的,即使其他参与者的策略发生改变也不会改变自己的策略。
纳什均衡是博弈论中的一个重要解概念,它帮助我们理解参与者之间的相互作用和决策过程。
除了纳什均衡,博弈论还有其他一些解概念,如帕累托最优解和博弈树。
帕累托最优解是指在一个博弈中,存在一种策略选择使得每个参与者的利益都得到最大化,而没有其他策略可以使任何一个参与者的利益得到进一步增加。
博弈树则是一种图形化的表示方式,它将博弈的过程和决策树结合起来,帮助我们分析和理解博弈的过程和结果。
博弈论在许多领域都有应用,如经济学、政治学、生物学等。
在经济学中,博弈论被广泛应用于分析市场竞争、价格战略等。
在政治学中,博弈论被用来分析国际关系、选举策略等。
在生物学中,博弈论被用来分析动物行为、进化策略等。
总之,博弈论是一门研究决策制定的学科,它提供了一种分析决策制定的工具和方法。
通过博弈论的研究,我们可以更好地理解参与者之间的相互作用和决策过程,为决策制定提供参考和指导。
博弈论在许多领域都有应用,它对我们理解和解决实际问题具有重要的意义。
博弈与决策平时作业参考答案(2)一、名词解释1.不确定性:就是指经济行为者在爭先不能准确地知道口己的某种决策的结果,或者说,只要经济行为主体的一种决策的可能结果不止一种,就会产生不确定性。
2.最大期望收益法:就是在事件结果不确定的情况下,应该选择给他带来“期望收益”最人的策略。
3.混合策略:如果在每个给定信息下,参与者只能以某种概率选择不同地策略,就称为混合策略。
4.支付均等法:当一个参与者在均衡屮应用一个混合策略时,他所得到的支付必须与他在混合策略屮所应用的每一个纯策略的支付相同。
5.子博弈:如杲从第一阶段以外的某个阶段开始的后续博弈阶段,也有初始信息集,具备进行博弈所需要的各种信息,能够自成一个博弈,我们就将这个博弈阶段称为原动态博弈的一个“子博弈”。
6.逆向归纳法:从最后一个阶段或最后一个子博弈开始逆推上去,逐步向前倒推以求解动态博弈均衡,这就是逆向归纳法。
7.承诺:就是对愿意与你合作的人给予回报的方式。
8.空洞威胁:当发出威胁的博弈参与者选择威胁所宣称的行动策略时,对自己并没冇好处,这就不町信了,这叫做“空洞威胁”。
二、请用最大期望收益法寻找最优策略。
要求:(1)写出计算步骤;(2)给出蝕优的策略结果。
甲乙两家企业,为了市场份额的争夺,在价格定制问题上各有两种纯策略,如图2-1所示。
两家企业都知道口己在各个策略组合下的收益悄况,但绘并不知道対方的收益。
假设甲釆取U的概率为0.3,乙采取/?的概率为0.6o答:(1)当乙采取策略的可能性为0.6时,采取厶策略的可能性为0.4,那么甲据此判断采取自己的策略(/时所获得的可能的期望收益E(7(C/)=0.6x2+0.4x3=2.4。
甲釆取口己的策略D时所获得的可能的期望收益E(/(D)=0.6x4+0.4xl=2.8o很显然,甲应该选杼策略Q,因为EU(D)> EUS(2)当甲釆取(/策略的可能性为0.3时,采取Q策略的可能性为0.7,那么乙据此判断采取自己的策略厶时所获得的可能的期望收益E(/(L)=0.3xl+0.7x4=3.1 o乙采取自己的策略R时所获得的可能的期望收益E(/(7?)=0.3x4+0.7x2=2.6o很显然,乙应该选择策略厶,因为EU(L)> EU(R)。
测验一题目1博弈当中通常包括下面的内容,除了()。
正确的答案是:支付题目2题目3题目4题目5题目6题目7题目8题目9题目10题目11题目12题目13题目14题目15题目16题目17题目18题目19题目20题目21题目22题目23题目24题目25测验二题目2题目3题目4题目5题目6题目7题目8题目9题目1011题目12题目13题目14题目15题目16题目17题目18题目19题目20题目2122题目23题目24题目25测试三题目1题目2题目3题目4题目5题目67题目8KMRW声誉模型的提出者是美国经济学家曼柯?奥尔逊。
正确的答案是“错”。
题目9题目10声誉模型表明,博弈参与者具有外生的合作倾向。
正确的答案是“错”。
题目11题目12题目13题目14题目15题目16题目17题目18题目19题目20题目21题目22题目23题目24题目25测试四题目1题目2题目3题目4题目5题目6题目7题目8题目9题目10题目11题目12题目13题目14委托人提供一个合约,让代理人在努力工作时所获得的收益大于不努力工作时的收益,这就是激励相容约束。
正确的答案是“对”。
题目15题目16题目17题目18题目19题目20题目21题目22题目23题目24题目25如果一个企业设定了一系列岗位应聘条件,求职者根据这些条件,并针对自己的能力大小判断自己是否符合岗位要求,这就属于(? ? ? ?)问题。
正确答案是:信号筛选。
战略博弈习题答案战略博弈习题答案战略博弈是一种通过推演和思考来制定最优决策的过程。
在这个过程中,我们需要分析各种可能的情况和对手的行为,以制定最佳的策略。
下面将给出几个战略博弈习题的答案,希望能够帮助读者更好地理解和应用战略博弈的原理。
习题一:囚徒困境在囚徒困境中,两个囚徒面临合作与背叛的选择。
如果两个囚徒都选择合作,则每个人都会获得较轻的刑罚;如果两个囚徒都选择背叛,则每个人都会获得较重的刑罚;如果一个囚徒选择合作而另一个囚徒选择背叛,则合作的囚徒将会受到极重的刑罚,而背叛的囚徒将会获得较轻的刑罚。
答案:在囚徒困境中,最稳定的策略是背叛。
因为无论对方选择合作还是背叛,背叛都能够保证自己获得较轻的刑罚。
这是一个典型的非合作博弈,每个囚徒都会选择背叛,因为他们无法相信对方会选择合作。
习题二:博弈论中的狼羊菜问题在一个河边,有一只狼、一只羊和一堆菜。
现在农夫要将它们一只一只地运到河对岸,但是他只能带一样东西过河。
而且,如果农夫不在场时,狼会吃羊,羊会吃菜。
答案:农夫首先带羊过河,然后回来自己过河,然后带狼过河,但是农夫带狼过河后,要把狼放在对岸,然后回到河这边,再带羊过河,最后带菜过河。
这样可以确保在任何时候都不会有狼吃羊或羊吃菜的情况发生。
习题三:拍卖策略在拍卖中,不同的竞拍者会根据自己的估价来决定出价。
最终,出价最高的竞拍者将赢得物品,并支付自己的出价。
答案:在拍卖中,最理性的策略是出价等于自己对物品的估价。
这样可以最大程度地保证自己以最低的价格赢得物品。
然而,在实际拍卖中,竞拍者还需要考虑其他竞拍者的行为,以及拍卖的规则和策略。
因此,拍卖策略的制定需要综合考虑多种因素。
总结:战略博弈是一个复杂而有趣的领域,它涉及到许多数学和逻辑原理。
在解决战略博弈问题时,我们需要深入分析各种可能的情况和对手的行为,以制定最佳的策略。
本文给出了几个常见的战略博弈习题的答案,希望能够帮助读者更好地理解和应用战略博弈的原理。
“博弈论”习题参考附标准答案博弈论博弈论是研究人类决策制定和行为选择的一门学科,它涉及到多个参与者之间的冲突和利益博弈。
通过分析和建模参与者的决策过程,博弈论可以帮助我们理解和预测各种决策情况,并提供策略和解决方案。
本文将介绍几个典型的博弈论习题,并附上标准答案作为参考。
1. 囚徒困境囚徒困境是博弈论中最著名的问题之一。
假设两名囚徒被捕,检察官分别问他们是否承认自己犯罪。
如果只有一个人承认犯罪,他会得到从轻判决;如果两人都承认,他们将得到较重的判决;如果两人都否认,那么他们将得到较轻的判决。
但是,由于彼此的不信任和利益冲突,囚徒往往会选择自私的策略,即承认犯罪。
这个问题可以用一个博弈矩阵来表示:囚徒B承认囚徒B否认囚徒A承认 -5,-5 -10,0囚徒A否认 0,-10 -1,-1其中左上角的数字表示囚徒A和B都承认犯罪时的判决结果,右下角的数字表示囚徒A和B都否认犯罪时的判决结果。
通过分析博弈矩阵,可以发现最优策略是双方都选择否认犯罪。
2. 纳什均衡纳什均衡是博弈论的一个重要概念,它指的是参与者在给定其他参与者策略的情况下,无法通过单方面改变自己策略来获得更好结果的状态。
以两个司机选择路线为例,假设他们可以选择两条路线,每个司机希望自己的路线时间最短。
若两个司机都选择第一条路线,他们的到达时间相同,这是一个纳什均衡;若一个司机选择第一条路线,另一个司机选择第二条路线,他们的到达时间将不同,这不是一个纳什均衡状态。
3. 合作与背叛合作与背叛是博弈论中经常出现的主题,也是人们日常生活和商业交易中的重要决策。
例如,两个公司可以选择合作开展某项业务,也可以选择相互竞争。
合作可以带来双方共同的利益,但也需要相互信任;而背叛则是一种自私的策略,可以追求个体利益,但可能破坏双方的合作关系。
4. 平衡策略在博弈论中,平衡策略指的是使得参与者无法通过改变自己的策略来达到更好结果的策略选择。
在一些特殊的情况下,博弈存在多个平衡策略。
博弈与决策
平时作业参考答案(1)
一、名词解释
1.博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。
2.完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。
3.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。
4.动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。
5.非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。
6.纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。
7.纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。
8.纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。
二、请用剔除劣势策略的方法寻找以下博弈的最优策略。
要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。
乙
甲
答:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行;
(2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列;
(3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]
百事可乐
答:(1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行;
(2)对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列; (3)余下的策略组合是(低价,低价),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]
员工乙
员工甲
答:(1)对员工乙而言,策略R 是明显劣势策略,用竖线划去“R ”所对应的列;
(2)对员工甲而言,在员工乙剔除R 策略之后,C 策略是劣势策略,用横线划去“C ”所对应的行;
(3)对员工乙而言,此时劣势的策略是L ,用竖线划去“L ”所对应的列; (4)对员工甲而言,此时劣势的策略是D ,用竖线划去“D ”所对应的行; (5)余下的策略组合是(U ,M ),这就是该博弈的最优结果。
三、根据优势策略下划线法找出以下博弈的纯策略纳什均衡,并指出是否存在混合策略纳什均衡。
要求: (1)划出相应优势策略的下划线;(2)给出最优的博弈结果。
2号厂商
X
Y
1号厂商
A
B
答:(1)下划线如图所示;
(2)只形成一个纯策略纳什均衡,即(A,X)。
(3)博弈的结果为(10,4),即1号厂商获得10单位支付,2号厂商获得4单位支付。
(4)按照纳什均衡存在性定理,这里不存在混合策略纳什均衡。
[注:括号的数字和字母顺序不能颠倒]
2号厂商
X Y
1号厂商A
B
答:(1)下划线如图所示;
(2)没有形成一个纯策略纳什均衡。
(3)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。
[注:括号的数字和字母顺序不能颠倒]
2号厂商
W X Y
1号厂商A
B
答:(1)下划线如图所示;
(2)形成两个纯策略纳什均衡,即(A,Y)和(B,W)。
(3)博弈的结果有两个:(4,5),即1号厂商获得4单位支付,2号厂商获得5单位支付;(8,6),即1号厂商获得8单位支付,2号厂商获得6单位支付。
(4)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。
[注:括号的数字和字母顺序不能颠倒]
四、在以下博弈矩阵图中找出哪一个是囚徒困境博弈,并简要解释理由。
乙
坏心好心
甲坏心
好心
图1-1
乙
坏心好心
甲坏心
好心
图1-2
乙
坏心好心
甲坏心
好心
图1-3
答:(1)利用下划线法找出博弈的纳什均衡,如图所示。
(2)囚徒困境反映的是基于个人理性的个体最佳选择并非集体最佳选择,参与者之间会选择相互“坏心”,而且对双方而言,(好心,好心)的结果一定要比(坏心,坏心)更好。
(3)在三个博弈中,图1-1不是囚徒困境博弈,因为参与者甲在选择“好心”(即合作)策略时才能实现均衡。
图1-2所示的博弈为囚徒困境博弈,因为参与者只有在都选择“坏心”(即不合作)策略时才能实现均衡。
图1-32所示的博弈也不是囚徒困境博弈,因为对乙而言,(坏心,坏心)的结果比(好心,好心)的结果有利。
五、博弈分析
假设你所在的公司现在的发展虽然还可以,但是未来前景不容乐观,所以老板只能对一个人加薪。
如果你和你的同事之间只有一个人提出来加薪的请求,老板会考虑为提出要求的这个
员工加薪,当然不会对那个没有提出来的员工加薪了。
但是假如你和你的同事两个人一起提出来要加薪,那么老板就只有选择同时辞退你们俩。
请给出这个博弈的矩阵分析图,并解释你最优的策略。
答:该博弈矩阵如下:
同事
要求不要求
你
要求
不要求
根据下划线方法,在这个博弈中,我们可以找到两个纳什均衡,即(要求,不要求)和(不要求,要求)。
这个结果说明,你和同事只能一方提出加薪的要求才可以,同时选择要求加薪的行动只会带来最坏的结果——都被辞退。
换句话说,你要想获得福利的改进,就应该先行一步提出来加薪的要求。
而假如你看到你的同事首先选择了要求加薪的策略之后,你最好不再提出来这样的要求。