当前位置:文档之家› 博弈与决策作业3(答案)

博弈与决策作业3(答案)

博弈与决策作业3(答案)
博弈与决策作业3(答案)

博弈与决策

平时作业参考答案(3)

一、名词解释

1.网络外部性:如果一种产品对消费者的价值会随着其他使用者数量增加而增加,这种产品就具有网络外部性。2.大规模协调博弈:源于网络外部性,假如有成千上万的人在同时进行一次性博弈,那就形成了大规模协调博弈。3.重复博弈:指同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”。

4.无名氏定理:只要博弈参与者具有足够的耐心,那么在满足博弈参与者个人理性约束的前提下,博弈参与者之间就总有多种可能达成合作均衡。

5.针锋相对策略:如果博弈参与者第一步采取合作,此后每一步都重复对方上一步的行动,要么是合作要么是背叛,只要是博弈没有确定的期限,由于长期利益对短期行为的制约作用,因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的,那么就会形成一种持续合作的态势。

6.冷酷策略:是指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。

7.双边博弈:在某些博弈中,每个博弈者的策略组合都相同,博弈者之间的支付或收益对称,这种博弈被称之为双边博弈。

8.演化稳定策略:说的是,如果均衡一旦得以形成,此后偏离均衡的运动就会受到自然选择的打击。

二、请分析以下重复博弈的合作与背叛问题。

1.图3-1和3-2的两个囚徒困境博弈会一直重复下去,而且没有确切的截止日期,请问哪个博弈的参与者更有可能出卖对方?为什么?

好心坏心

甲好心

坏心

图3-1

好心坏心

好心

坏心

图3-2

答:图3-1所示的囚徒困境博弈的参与者更容易背叛对方。

这图3-1和图3-2的两个博弈中,双方都使用好心时,各自获得20个单位的支付。一个参与人在对方好心而自己使坏心时获得的支付是不一样的,图3-1为40个单位,远大于好心时的20个单位;图3-2 为22个单位,仅稍大于好心时的20个单位。所以,图3-1中的参与者更容易背叛对方。

2.图3-3和3-4的两个囚徒困境博弈会一直重复下去,而且没有确切的截止日期,请问哪个博弈的参与者更有可能出卖对方?为什么?

好心坏心

甲好心

坏心

图3-3

好心坏心

甲好心

坏心

图3-4

答:图3-3所示的囚徒困境博弈的参与者更容易背叛对方。

这图3-3和图3-4的两个博弈中,双方都使用好心时,各自获得20个单位的支付;一个参与人在对方好心而自己使坏心时获得的支付为40单位。在图3-3中,即使对方也使用了坏心,双方也还各自获得18个单位支付,与都好心时相差2个单位;而在图3-4中则降低为15个单位,与都好心时相差了5个单位,背叛要付出比较高的代价。所以,图3-3中的参与者更容易背叛对方。

三、分析以下博弈的结果及策略。

要求: (1)给出可能的博弈均衡;(2)写出应采取的行动策略。

1.假设你是一位非常出众的男士,有一位热恋的女朋友,她各方面则比较普通。今天晚上在洋河体育场有一场足球比赛,你想去看足球比赛。而此时,在奥体中心也有一场王菲的演唱会,你的女朋友想去听演唱会。博弈矩阵如下,请:(1)分析该博弈的均衡;(2)面对着冲突,你有哪些行动可以选择?

女方

足球赛演唱会

男方足球赛

演唱会

答:(1)根据下划线法,如图所示,博弈均衡为(足球赛,足球赛)或者(演唱会,演唱会),即二人要么都去看球赛,要么都去听演唱会。

(2)你可以选择:一是主动告诉女方,愿意陪她去听演唱会;二是主动告诉她,你很想去看足球赛,希望她可以陪你去看;三是自己先发制人地买好两张足球赛的票,告诉女方你已经买了票;四是利用你自身的优势,告诉她要是不陪你去,有其他人愿意陪你去。

2.你和你的朋友分别经营着一家企业,你们二人可以考虑合作,也可以不合作。当然,基于产品和市场的预期不同,现在有两种情形出现,分别的博弈矩阵如图3-5和3-6所示。请你分析:(1)两种情形分别属于什么博弈?(2)给出博弈的均衡结果。

合作不合作

合作

不合作

图3-5

合作不合作

合作

不合作

图3-6

答:(1)图3-5属于合作博弈,是猎鹿博弈。有两个纯策略纳什均衡,即(合作,合作)和(不合作,不合作)。如果对方愿意开展合作,甲和乙的最优行动选择就是选择合作,从而各自获取10个单位的支付。

(2)图3-6属于不合作博弈,是囚徒困境博弈。有一个纯策略纳什均衡,即(不合作,不合作)。由于个人理性的存在,甲乙双方只有选择不合作,从而各自获得4个单位的支付。

四、请解释以下问题。

1.Windows操作系统与大规模协调博弈以及网络外部性有什么关系?

答:Windows操作系统的使用具有网络外部性,使用该系统的人越多,这个系统的价值就会变得越高。这样一来,使用者就要考虑使用哪种操作系统的普及率更高。假如有成千上万的人在同时进行一次性博弈,那就形成了大规模协调博弈。

2.如果你是一个理性的人,看到周围的朋友都逐渐拥有了QQ账号,你应该怎么做?为什么?

答:QQ这种即时通讯工具,具有很强的网络外部性,使用QQ的人越多,通过QQ形成的交际网络就变得越大,其网络价值就越高了。而如果你周围使用QQ进行聊天交流的人越多,你拥有的QQ账号所起的作用就越大。所以,你应该也申请一个QQ账号。

3.微软公司为什么在一定程度上默认盗版的泛滥?

答:微软公司在一定程度上默许了盗版的泛滥,实际上就是让自己的产品在市场上逐步深入,得到了更多的使用客户,从而让新使用者首先想到的就是要配备安装微软公司的Windows系列操作系统,从而充分发挥其产品的网络外部性。正是盗版帮助了微软公司在中国的发展,没有盗版就没有微软如今在中国市场上的垄断地位。

五、博弈分析

假设你是一家上市公司的董事长,可以选择如实披露财务数据或向投资者说谎也就是发布虚假的信息,投资者可以选择投资或不投资。博弈矩阵如下。请分析该博弈的均衡策略,你们公司该怎么做?为什么?

投资者

投资不投资

上市公司如实披露

虚假披露

答:如果这是一个单期博弈的话,其纳什均衡只有一个(虚假披露,不投资),即上市公司选择披露虚假财务信息,投资者选择不投资,双方的博弈支付均为0。

如果是多期重复博弈的话,情况就不一样了,只要在没有明确截止期限的情况下,就可以实现(如实披露,投资)这个博弈结果。但是,一旦企业披露的信息有误,有虚假的成分,那么投资者就不会再相信这个上市公司,就在接下来的博弈中选择不投资。

所以,上市公司要想和投资者达成合作,就必须向外部的投资者树立一种较强的正面的声誉,不能披露任何虚假的信息,并致力于长期维护这个声誉,从而保证合作得以持续,(如实披露,投资)这个结果才会出现。

新《博弈与决策》期末复习指导

第一章博弈论的基本理论 (一)博弈论的基本概念 博弈:现实生活中,不同的决策人为了争夺资源、争夺机会使得决策人处于相互依存的复杂关系中,这就不得不思考他人有针对性行为对自身所产生的影响。 博弈就是一种游戏,在这种状态下,参与者必须作出选择,并对对方的选择作出判断,这种判断和选择决定了博弈的结果。每个对弈者在决定采取何种行动时不但要根据自身的利益和目的行事,也要考虑自身的决策行为对其他人的可能影响,以及其他人的行为对自身的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。 博弈论:就是以参与人之间有针对性的行为产生的互动过程为研究对象的理论,探讨在互动过程中参与人的一般行为规律。博弈论的核心问题在于如何在“策略互动”的局势中找到局中人的最佳行为方式,使得采用最佳行为方式的局中人能获得最大的收益。所以博弈论可以简单理解尾研究策略互动局势中的局中人的理性行为的理论。 (二)博弈论的构成要素 1、博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略、得益、结果、均衡等。 2、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体); 3、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策; 4、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排; 5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西; 6、均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博弈规则来决定均衡。 二、博弈论的发展简史 1、萌芽阶段:博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 2、产生阶段:1944年科学家冯·诺伊曼和经济学家奥斯卡·摩根斯坦合著《博弈论与经济行为》将二人博弈推广到n 人博弈结构并将博弈论系统的应用于经济领域,标志着博弈论作为一门独立的的学科诞生。 3、发展阶段:1950年,约翰·纳什(John Nash)引入均衡(解)的概念,即纳什均衡,将博弈论从零和博弈推进到非零和博

博弈论(整理过名词解释和简答)

名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响 6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。 13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件: (1)决策结x是单结信息集; (2)在一个信息集的决策结必须是同一个决策结的后续结。 14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。 15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动; 动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。 17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。 18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。 19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。

博弈与决策作业1(答案)

博弈与决策 平时作业参考答案(1) 一、名词解释 1.博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。 2.完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。 3.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。 4.动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。 5.非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。 6.纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。 7.纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。 8.纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。 二、请用剔除劣势策略的方法寻找以下博弈的最优策略。 要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。 乙 甲 答:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行; (2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列; (3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。 [注:步骤(1)(2)颠倒亦可]

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈与决策题库

题库 一、名词解释 1.动态博弈 动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。 2.逆向归纳法 对于动态博弈,特别是在完全信息条件下,最简单的方法就是逆向归纳法。就是从最后一个阶段或者最后一个子博弈开始逆推向上,逐步向前倒推以求解动态博弈均衡。 3.重复博弈 重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题。 4. 第二价格密封拍卖 是由1996年诺贝尔经济学奖获得者威廉?维克瑞设计的,因而又被称为是“维克瑞拍卖”,具体规则如下:每个竞标者分别向拍卖方提交自己的报价,而且他们不知道别人的出价,出价最高的竞标者获得该物品,并按所有的出价中仅次于最高出价的第二高价格支付给卖家。 5.完全信息 是指所有参与者各自选择行动的不同组合所决定的收益对所有参与者来说是共同知识。共同知识就是你知道,我知道,你知道我知道的信息。 6.子博弈 直观的含义是原博弈的一个部分,它本身也可以作为一个博弈进行分析,博弈树的一个子树所代表的博弈就是子博弈,子博弈的起始点是某个选择的终点,包括这个终点及所有后续结及枝及终点结之后的收益,构成了一个子博弈树,这个博弈树所代表的博弈称为子博弈。 7.公共信息 如果有些信息是博弈参与者都知道的,或者是所有有关的参与者都知道的,这些信息就叫“公共信息”或者“共同知识”。 8.贝叶斯纳什均衡 不完全信息静态博弈的均衡称为贝叶斯纳什均衡。是指在不完全信息静态博弈中在给定自己类型以及其他参与者的类型与策略选择之间关系的条件下,使得自己的期望效用最大。 9.博弈论 博弈论是指研究多个个体或团队在特定条件制约下的对局中,利用相关方的策略而实施对应策略的科学。 10.纳什均衡 对于每一个参与者来说是这样一种组合,即给定其他参与者的策略,每一个参与者的这个策略能使其效用最大化。其含义为:当博弈的所有参与者在某一选定的策略组合下都没有动机(单方面)偏离自己选定的策略时,该组合策略就是纳什均衡。 11.混合策略 如果在每个给定信息下,参与者只能以某种概率选择不同的策略,就称为混合策略。换句话说,所谓混合策略,不是参与者纯粹地选择什么策略,而是随机地,或者说是以百分之多少的概率选择某一个策略。 12.信息甄别 是指在博弈中没有私人信息的一方为了减弱非对称信息对自己的不利影响,以便能够区分不同交易对象而提出的一种交易方式,比如契约、条件等。通俗地讲,信息甄别就是“如何让别人讲真话”的方法。 13.参与人

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

国家开放大学2020年春季学期电大考试《博弈与决策》形成性考核

博弈与决策平时作业 学生姓名: 学生学号: 分校、工作站: 教学班:

博弈与决策 第1次平时作业 一、名词解释 1.博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。 2.完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。 3.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。 4.动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。 5.非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。 6.纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。 7.纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。 8.纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。 二、请用剔除劣势策略的方法寻找以下博弈的最优策略。 要求: (1)写出剔除的步骤或顺序; (2)画出相应的剔除线; (3)给出最优的博弈结果。 乙

甲 答:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行; (2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列; (3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。 百事可乐 答:(1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行; (2)对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列; (3)余下的策略组合是(低价,低价),这就是该博弈的最优结果。 员工乙 员工甲 答:(1)对员工乙而言,策略R 是明显劣势策略,用竖线划去“R ”所对应的列; (2)对员工甲而言,在员工乙剔除R 策略之后,C 策略是劣势策略,用横线划去“C ”所对应的 行; (3)对员工乙而言,此时劣势的策略是L ,用竖线划去“L ”所对应的列; (4)对员工甲而言,此时劣势的策略是D ,用竖线划去“D ”所对应的行; (5)余下的策略组合是(U ,M ),这就是该博弈的最优结果

博弈论复习题及答案

囚徒困境说明个人得理性选择不一定就是集体得理性选择。(√) 子博弈精炼纳什均衡不就是一个纳什均衡。(× ) 若一个博弈出现了皆大欢喜得结局,说明该博弈就是一个合作得正与博弈.()博弈中知道越多得一方越有利。( ×) 纳什均衡一定就是上策均衡。(× ) 上策均衡一定就是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。 (×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√) 在博弈中纳什均衡就是博弈双方能获得得最好结果。 (× ) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少. (×)上策均衡就是帕累托最优得均衡。(×) 因为零与博弈中博弈方之间关系都就是竞争性得、对立得,因此零与博弈就就是非合作博弈。 (×) 在动态博弈中,因为后行动得博弈方可以先观察对方行为后再选择行为,因此总就是有利得。(×) 在博弈中存在着先动优势与后动优势,所以后行动得人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒得困境博弈中两个囚徒之所以会处于困境,无法得到较理想得结果,就是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢得时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益得策略组合.(√)不存在纯战略纳什均衡与存在惟一得纯战略纳什均衡,作为原博弈构成得有限次重复博弈,共同特点就是重复博弈本质上不过就是原博弈得简单重复,重复博弈得子博弈完美纳什均衡就就是每次重复采用原博弈得纳什均衡。(√ ) 多个纯战略纳什均衡博弈得有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略与纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)得子博弈完美均衡结局,其中对于任意得t<T,在t阶段得结局并不就是G得Nash均衡.(√)(或:如果阶段博弈G={A1,A2,…,An; u1,u2,…,un)具有多重Nash均衡,那么该重复博弈G(T)得子博弈完美均衡结局,对于任意得t<T,在t阶段得结局一定就是G得Nash均衡。) 零与博弈得无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈得混合战略纳什均衡.(√)(或:零与博弈得无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈得混合战略纳什均衡.(×)) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈得纯战略纳什均衡本身就是各局中人能实现得最好结果,符合所有局中人得利益,因此,不管就是重复有限次还就是无限次,不会与一次性博弈有区别。(√) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一得纳什均衡不就是效率最高得战略组合,存在潜在合作利益得

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

博弈论与纳什均衡

第22卷哈尔滨师范大学自然科学学报 Vol .22,No .42006 第4期 NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY 博弈论与纳什均衡 郭 鹏 (中国矿业大学) 杨晓琴 (鸡西大学) 【摘要】 纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础. 关键词:博弈论;纳什均衡;非合作博弈 收稿日期:2006-02-15 0 引言 博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具. 简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是 效用(U tility ),是可以定义或量化的参与人的利 益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈. 1 博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失. 博弈论模型可以用五个方面来描述:G ={P,A,S,I,U ) P:为局中人,博弈的参与者,也称为“博弈 方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标. A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.

博弈论作业及答案 浙江财经大学 张老师作业答案

第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2

《博弈与决策》期末复习资料.doc

《博弈与决策》期末复习资料 一、期末考试形式和时间 半开卷时间:90分钟 二、考试题型 1、名词解释(每小题5分,共20分); 2、简答题(每小题10分,共30分); 3、论述题(每小题15分,共30分); 4、案例分析题(共20分)参考复习资料如下: 三、名词解释 1.信号传递:在信息经济学里,具有优势的一方(拥有私人信息的一方)采取某种行动向信息劣势一方(不了解对方私人信息的一方)发送相关信号,来告诉对方自己的真实类型。 2.非合作博弈:是指参与人之间没有一个对各方具有约束力的协议,参与人不在协议范围内进行的博弈。 3.重复博弈:是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题。 4.第一价格密封拍卖:在这种拍卖模式下,投标者利用秘密方式(比如将报价写好装入一个信封)同时投标,所有的投标人都不知道其他投标人的出价,且一旦呈交了投标就没有机会更新。拍卖人当众打开这些信封,出价最高者就是赢者,可以以其所报出的最高价格购买被拍卖物品。 5.静态博弈:是指在博弈中,参与人同时选择或虽非同时选择单后行动者并不知道先行动者采取了什么具体行动。 6.逆向归纳法:就是从最后一个阶段或最后一个子博弈开始逆推上去,逐步向前倒推以求解动态博弈均衡。 7.精炼叶贝斯纳什均衡:在不完全信息动态博弈下,如果给定参与者自己的特征和其他参与者特征概率分布的情况下,每个参与者选择的策略能使自己的期望支付达到最大化, 也就是没有人积极选择其他策略,这就形成了“精炼贝叶斯纳什均衡”。 8.第二价格密封拍卖:每个竞标者分别向拍卖方提交自己的报价,而且他们不知道别人的出价,出价最高的竟标者将获得物品,并按所有的出价中仅次于最高出价的第二高价格支付给卖家。 9.不完全信息:是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数信息了解的不够或者不是对所有参与人的特征策略空间及收益函数都有准确的信息。 10.子博弈:是指它本身可以作为一个独立的博弈进行分析,它是原博弈的一部分。任何博弈本身可被称为自身的一个子博弈。 11.完美信息:某个参与人行动前,有足够的信息来确定已经行动的参与人选择了什么行动,这种信息结构称为完美信息。 12.贝叶斯纳什均衡:在给定自己类型以及给定其他参与者的类型与策略选择之间关系的条件下,使自己的棋王小勇最大化,这时形成的一个纳什均衡,就称为“贝叶斯纳什均衡”。 13.参与人:指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体); 14.占优战略均衡:占优战略均衡是指在博弈中,如果所有参与人都有占优战略存在,博弈将在所有参与人占优战略的基础上达到均衡。 15.行动:行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 16.动态博弈:动态博弈是指在博弈屮,参与人的行动有先后顺序II后行动者能够观察到先行动者所选择的行动。 17.劣策略:在博弈中,不论其他参与人采収什么策略,某一参与人可能采取的策略中对自己严格不利的策略。 18.信息集:是指某一参与人在某一阶段的行动时由博弈历史信息反映的那一组都有可能是真

博弈论复习题(附答案)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

第17章 决策与博弈论

第17章决策与博弈论 17.1 复习笔记 1.博弈论的基本概念 (1)博弈及其三个要素 博弈论是在一个简化的体系里描述复杂的决策问题,这些决策问题往往涉及多个行为者,他们之间的决策相互依存,相互作用。 博弈包含三个要素:①参与者;②决策;③报酬。 (2)合作与非合作博弈 如果在博弈参与者之间可形成共同计划的决策这类具有约束性的合同,那么这类博弈被称为合作性的博弈。 如果在参与者之间不能达成或实施有约束性的合同,这类博弈则被称作非合作性的博弈。 (3)主导策略(占优策略均衡) 主导策略是指对某参与者而言,不管其竞争对手的反应如何,这一决策总是最优的策略。 2. 纳什均衡 (1)纳什均衡 纳什均衡是指在给定对方行动的前提下可以给每个参与者都带来最佳结果的某种决策(或行动)。达到纳什均衡时,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而这个均衡没有人有积极性去打破。 占优策略均衡即是一种纳什均衡。占优策略均衡若存在,只存在惟一均衡,而纳什均衡可能存在多重解。 (2)最大极小决策(囚徒困境) 最大极小决策反映的是,从个人角度出发所选择的占优策略,从整体来看,却是最差的结局,即个人理性与团体理性的冲突。这一决策可以发生在不少的博弈场合,也可以解释卡特尔联盟的不稳定性。 (3)混合策略 在有些博弈中,仅采取一种决策或一种行动的“纯决策”不是最好的决策,即可能不存在纳什均衡。而以某特定的概率P选择一种行为,以1-P的概率选择另一种行为,则有可能是纳什均衡的解。这时的选择被称为混合策略。但反过来需要注意,存在混合策略均衡的博弈也有可能存在非混合策略的均衡。 3. 重复博弈 重复博弈即同一个博弈被重复多次的动态博弈,它是反复不断进行的。 在无限期重复博弈中,对于任何一个参与者的欺骗和违约行为,其他参与者总会有机会给予报复。所以,每一个参与者都不会采取违约或欺骗的行为,囚犯困境合作的均衡解是存在的。但在有限期重复博弈中,在博弈一开始的第1期,每个参与者就会采取欺骗或违约的不合作策略。所以,在有限期重复博弈中,囚犯困境博弈的纳什均衡是参与者的不合作。 4. 顺序博弈 顺序博弈是参与者轮换行动的博弈。分析顺序博弈要比参与者同时决策的博弈简单得多,其关键在于考虑每个参与者可能的行动及其理性的对策。 5. 威胁与承诺 行业的主导企业或者在位企业为了维护自己的地位或阻止新企业进入,往往会采用威胁或承诺的手段。 威胁通常是不付诸实际行动的,即不会改变报酬矩阵,最终往往使得发出威胁一方无法

博弈论习题及参考答案

《博弈论》习题 一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 博弈双方都失败 B.博弈双方都获胜A. C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈

博弈论知识点总结完整版

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965) c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968) d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i,si*称为参与人 i的严格占优战略,如果满足: ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣”的含义: 设s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。 b、定义:重复剔除严格策略就是 各参与人在其各自策略集中, 不断剔除严劣策略…如果最终 各参与人仅剩下一个策略,则 该策略组合就被称为重复剔除 严劣策略均衡。 (二):纳什均衡(Nash Equilibrium) 2.1纳什均衡定义:对于一个策略式表述的博弈G={N,S i, u i,i∈N},称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡,如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i 的最优策略(经济理性策略),即:u i(s i*, s-i*)

博弈与决策作业2(答案)

博弈与决策 平时作业参考答案(2) 一、名词解释 1.不确定性:就是指经济行为者在事先不能准确地知道自己的某种决策的结果,或者说,只要经济行为主体的一种决策的可能结果不止一种,就会产生不确定性。 2.最大期望收益法:就是在事件结果不确定的情况下,应该选择给他带来“期望收益”最大的策略。 3.混合策略:如果在每个给定信息下,参与者只能以某种概率选择不同地策略,就称为混合策略。 4.支付均等法:当一个参与者在均衡中应用一个混合策略时,他所得到的支付必须与他在混合策略中所应用的每一个纯策略的支付相同。 5.子博弈:如果从第一阶段以外的某个阶段开始的后续博弈阶段,也有初始信息集,具备进行博弈所需要的各种信息,能够自成一个博弈,我们就将这个博弈阶段称为原动态博弈的一个“子博弈”。 6.逆向归纳法:从最后一个阶段或最后一个子博弈开始逆推上去,逐步向前倒推以求解动态博弈均衡,这就是逆向归纳法。 7.承诺:就是对愿意与你合作的人给予回报的方式。 8.空洞威胁:当发出威胁的博弈参与者选择威胁所宣称的行动策略时,对自己并没有好处,这就不可信了,这叫做“空洞威胁”。 二、请用最大期望收益法寻找最优策略。 要求: (1)写出计算步骤;(2)给出最优的策略结果。 甲乙两家企业,为了市场份额的争夺,在价格定制问题上各有两种纯策略,如图2-1所示。两家企业都知道自己在各个策略组合下的收益情况,但是并不知道对方的收益。假设甲采取U的概率为0.3,乙采取R的概率为0.6。 乙 L R 甲U D 答:(1)当乙采取R策略的可能性为0.6时,采取L策略的可能性为0.4,那么甲据此判断采取自己的策略U时所获得的可能的期望收益EU(U)=0.6×2+0.4×3=2.4。甲采取自己的策略D时所获得的可能的期望收益EU(D)=0.6×4+0.4×1=2.8。很显然,甲应该选择策略D,因为EU(D)> EU(U)。 (2)当甲采取U策略的可能性为0.3时,采取D策略的可能性为0.7,那么乙据此判断采取自己的策略L时所获得的可能的期望收益EU(L)=0.3×1+0.7×4=3.1。乙采取自己的策略R时所获得的可能的期望收益EU(R)=0.3×4+0.7×2=2.6。很显然,乙应该选择策略L,因为EU(L)> EU(R)。

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

相关主题
文本预览
相关文档 最新文档