博弈中的“嵌套问题”-修订版
- 格式:pdf
- 大小:142.65 KB
- 文档页数:4
博弈理论目录0.为何要学习博弈论别人的信封诱人吗一元面钞的价格悖论肯德鸡和麦当劳的恶性竞争陆贾分金享天年模仿还是创新法不责众的尴尬1.博弈论的基本知识一些基本概念博弈的类型2.完全信息静态博弈占优策略均衡纳什均衡和严格均衡标准对策式的纳什解求法混合策略的纳什均衡纳什均衡的存在性多重纳什均衡的确定3.完全且完美信息动态博弈完全且完美信息动态博弈的一般概述博弈的展开型表述扩展式表述的纳什均衡子博弈精炼纳什均衡后向归纳法后向归纳法的缺陷4.重复博弈多阶段博弈的信息结构有限次重复博弈无限次重复博弈重复博弈的变异结构5.完全但不完美信息动态博弈不完美信息博弈的一般概述完美贝叶斯均衡6.不完全信息静态博弈静态贝叶斯博弈的一般表述贝叶斯均衡不完全信息与混合战略7.不完全信息动态博弈动态贝叶斯博弈的一般概述精炼贝叶斯纳什均衡精炼贝叶斯均衡的发展策略不确定性和均衡的演化8.合作均衡纳什谈判解:二人合作n人合作对策9.博弈结构与均衡礼仪分配先占优势和后发优势耐心与纳什均衡多数和少数的互动实力、成本、信息和地位新古典经济学认为,经济学是研究稀缺资源如何有效配置的;而张维迎(1996,2)1认为经济学是研究理性的人如何行为的。
实际上,两种理解都存在很大的偏颇,它们的根本缺陷都是将研究的手段当成了目的。
我们认为,经济学研究的目的是探讨经济运行的规律以及如何提高人们的生活水平,或者如黄有光所说,是为了增进人们的快乐。
因此,一般来说,经济学研究的主要内容就包括两个方面,一是人与人之间的社会关系方面,其中主要的就是生产方式以及与之相适应的生产关系;另一个是人与自然的关系方面,即技术关系方面,主要是研究稀缺性资源的配置问题。
由于人与人之间的快乐存在冲突,因此人们往往希望最大限度的增进自己的快乐和福利,因此,就必然存在种种的互动行为,博弈论就是探讨人们之间的这种行为的。
究其实质,博弈论是一种分析工具,用来探讨人们的互动行为,是人们为增进快乐或福利的手段;研究的视角不同,如合作的与非合作的,为他利己的和为己利他的,揭示的博弈机制也必然不同。
博弈论判断题(每小题1分,共15分)1、囚徒困境说明个人的理性选择不一定是集体的理性选择。
(√)2、子博弈精炼纳什均衡不是一个纳什均衡。
(×)3、若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。
()4、博弈中知道越多的一方越有利。
(×)5、纳什均衡一定是上策均衡。
(×)6、上策均衡一定是纳什均衡。
(√)7、在一个博弈中只可能存在一个纳什均衡。
(×)8、在一个博弈中博弈方可以有很多个。
(√)9、在一个博弈中如果存在多个纳什均衡则不存在上策均衡。
(√)10、在博弈中纳什均衡是博弈双方能获得的最好结果。
(×)11、在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。
(×)12、上策均衡是帕累托最优的均衡。
(×)13、因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。
(×)14、在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。
(×)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。
15、囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
(×)16、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。
(√)17、不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。
(√)18、多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。
心理博弈测试题库答案及解析在进行心理博弈测试时,解析答案是十分重要的,因为它能够揭示我们在心理博弈中的行为模式和思维方式。
下面是一些常见的心理博弈测试题目以及它们的答案和解析。
题目一:A和B两人共同合作完成一个项目,他们将获得一笔奖金作为回报。
奖金的大小将由他们的合作表现来决定。
如果A和B都合作,则奖金将平均分配给他们;如果其中一人选择不合作而另一人选择合作,则不合作的人将获得全部奖金,而合作的人将一无所得。
如果两人都选择不合作,则他们都将一无所获。
答案及解析:这是一个典型的囚徒困境问题。
理性的选择是不合作,因为不合作确保了至少能获得全部奖金的可能性。
另一方面,合作需要对另一人也选择合作的行为做出假设。
在这种情况下,最优的选择是不合作。
题目二:A和B两人被告知他们将进行一场竞争性的考试,考试将评选出一个得分最高的人。
然而,如果A和B的得分相同,则他们将获得相等的奖励。
这时你是A还是B?答案及解析:这个问题考察的是人们在竞争中的态度。
如果你选择A,那你可能更加倾向于领先和胜利。
反之,如果你选择B,那你可能更加倾向于平等和公平。
这个问题没有绝对的正确答案,而是取决于每个人的价值观和思维方式。
题目三:A和B两人面临一个合作的机会,他们可以共同努力完成一个任务,并共享奖励。
然而,如果其中一人决定放弃任务,另一个人将独自承担任务和相应的风险。
在这种情况下,你会选择合作还是放弃?答案及解析:这个问题涉及到合作与自利之间的权衡。
如果你选择合作,那你可能更注重团队合作和共同利益。
反之,如果你选择放弃,那你可能更注重个人的风险和利益。
同样地,这个问题没有绝对的正确答案,而是取决于每个人的价值观和思维方式。
通过解析这些心理博弈测试题目的答案,我们可以更好地了解自己的行为模式和决策方式。
在现实生活中,我们常常面临各种各样的心理博弈,了解自己的偏好和思维方式能够帮助我们做出更明智的决策。
以上是心理博弈测试题库的答案及解析。
博弈对策练习题博弈论是研究决策者在多方参与的情况下进行决策的数学理论。
在博弈中,每个参与者都追求自己的利益,并且根据其他参与者的策略来进行决策。
为了更好地理解博弈论的概念和原理,以下是一些博弈对策练习题,帮助你更好地掌握该理论。
题目1:假设有两个参与者,参与者A和参与者B。
两个参与者分别有两种策略可供选择:策略X和策略Y。
他们的收益矩阵如下所示:参与者BX Y参与者AX 2,2 0,3Y 3,0 1,1请回答以下问题:1. 如果两个参与者都只追求自己的个人利益,他们应该选择什么策略?2. 如果两个参与者追求最大化两者的总收益,他们应该选择什么策略?3. 是否存在一种策略组合,能够实现两个参与者的最佳利益?题目2:假设有两个参与者,参与者A和参与者B,他们需要同时选择一个数字。
他们可以选择的数字范围是1到10。
如果两个参与者选择的数字之和大于等于15,则参与者A获胜;否则,参与者B获胜。
如果两个参与者选择的数字相同,则为平局。
请回答以下问题:1. 参与者A和参与者B应该选择什么数字才能使自己的获胜概率最大化?2. 为了增加自己的获胜概率,参与者A应该如何反应参与者B的选择?题目3:假设有三个参与者,参与者A、参与者B和参与者C。
他们需要同时选择一个方向:左侧(L)或右侧(R)。
他们的利益矩阵如下所示:参与者CL R参与者AL 2,2 0,4R 3,1 1,3请回答以下问题:1. 如果每个参与者都只追求自己的个人利益,他们应该选择什么方向?2. 是否存在一种策略组合,能够实现每个参与者的最佳利益?以上是关于博弈对策的练习题。
通过解答这些问题,你可以更好地理解博弈论中的决策策略与利益的关系。
祝你在博弈中取得好成绩!。
五、树上删边游戏1.游戏规则从某一棵树上删除一条边,同时删去所有在删除边后不再与根相连的部分。
双方轮流进行,无法再进行删除者判定为失败,也就是比你拿掉最后一部分你就赢了。
一个游戏中有多棵树,我们把它们的根都挂在天花板上…或者说,放在地板上也行..这么做是为了方便后面的一些解释和处理。
在这篇文章中,我们讨论的将是公平游戏,也就是双方可以删除任意的边,我们称这个游戏为:Green Ha2.竹子竹子!为了更好地解决树上删边游戏的相关问题,我们引入“竹子”。
竹子长的像下面这样图2.1根据上面的游戏规则,拿掉竹子上的某一节,那么竹子上面的那些也会跟着被删掉。
仔细想想会发现,这不就是最简单的Nim游戏吗?有很多堆火柴,每次只能拿走某一堆火柴中的任意数量的火柴。
而这里则是有很多个种在地板上的竹子,我们每次只能选一根出来,任意砍掉一部分或者全部。
既然发现这是Nim游戏了,那么相应3.克朗原理(Colon Principle)搞定竹子之后,我们就可以来研究树上删边游戏究竟要怎么解决。
其实,树上删边游戏就是个披了层树皮的Nim游戏。
为什么这么说呢,我们介绍克朗原理克朗原理:对于树上某一个点,它的分支可以转换为以这个点为根的一根竹子,这个竹子的长度等于它各个分支的边的数量的异或和。
(怕翻译不好所以把原文放上来:When branches come together at a vertex, one may replace the branches by a non-branching stalk of length equal to their nim sum.)现在我们来分析下图所示的树上删边游戏。
图3.1对于第一个图,1号点有2个分支,分支上的边树分别为1、1,异或和为0,所以1号点的分支被替换为长度为0的竹子,也就是说上面两个分支被删掉了。
所以对于2号点,就剩下2个分支,同理被消掉。
最后这个图被转化为一根长度为1的竹子,其SG值为1。
博弈论的总结|博弈论总结博弈论学习的个人总结刘艳丽第一局部:根本情况视频耶鲁公开课《博弈论》1----5讲,人人影视参考资料:耶鲁校园网《博弈论--战略分析^p 入门》,美,罗杰A麦凯恩,原毅军译,机械工业出版社,2022,42元《策略博弈》,阿维纳什迪克西特,蒲勇健译,中国人民大学出版社,第二版,2022,65元班级:工商,人力08级学生课时:8节我的时间投入:视频26个小时;书籍,25小时;上网时间,无法统计。
第二局部:知识层面一、The five lessons:五个根本的结论1、Don"t play a strictly dominated strategy2、Rational choices can lead to bad outes3、You can"t get what you want4、Put yourself in other people"s shoes5、Yale students are evil二、Game 2: "pick a number."数字游戏Without showing your neighbor what you"re doing, put in the box below a whole number between 1 and a 100 [whole number between 1 and 100--integer.] We will calculate the average number chosen in the class. The winner in this game is the person whose number is closest to two-thirds times the average in the class.三、The Prisoners" Dilemma:some exles囚徒困境A joint projectPrice petitionA mon resourceGlobal warming and carbon emissionsmunication,contracts,treaties betweencountries,regulation,education cannot work Solutions OF The Prisoners" Dilemma: changing payoffs.改变收益构造四、The ingredients of a game:博弈的根本构造Players:i 、jStrategies:"si" to be a particular strategy of Player iSi" to be the set of alternatives."s" to mean a particular play of the gamePayoffs:"U" for utile, to be Player i"s payoff.the way up to Player N"s choices.profileS-i" to mean a strategy choice for everybody except person "i."Assume that everybody knows the possible strategies everyone else could choose and everyone knows everyone else"s payoffs五、如何寻找博弈平衡解1、成绩案例-----求解方法,如存在最优策略,那么选择最优。
博弈中的“嵌套问题”
Phybi
Math group
Humanity group
Carridon University
1.无间道-谍中谍
参见电影《无间道-I,II》,这个希望后来者详细分析.
2.剪刀石头布
二人A,B博弈,策略空间维数都为3,且两空间相等.我们令其元素剪刀石头布为{a,b,c}收益空间均为{胜,平,负},我们用{1,0,-1}表示.很容易写出A,B两人的收益函数.
开始出拳应该是随机的,之后双方都会观察对方的出拳套路,如果允许的思考时间足够长,则其中会出现“嵌套问题”,比如:前手A出两次剪刀,B出两次石头;A就会猜测对方可能继续出石头,以及B则猜测对方继续出剪刀,我们称这
两个个现象为一阶嵌套.考虑A的一阶嵌套,则描述一阶嵌套的公式为fA1=fA(B)B的二阶嵌套为fB2=fB(fA1)=fB(fA(B))
而更复杂的是,A猜测:B猜测自己(A)要出剪刀,它必然出石头,于是A采取出布的策略.我们称此为“二阶嵌套”.简而言之,一阶嵌套就是“A猜(B 猜A),并且根据B因其对A的猜想,做出的获胜测量,采取恰当策略获胜”.这是一个三阶嵌套,用公式表示为:fA3=fA(fB2)=f(fB(fA(B)))
为了更好地理解嵌套的概念,我们最后举例说明“三阶嵌套”.A猜测,B已经猜测到了A能猜到自己B猜测A的策略,即A将出布,则B将出剪刀,于是A采取出石头的策略期望获胜.用公式表示为fA(fB(fA(B))).此种嵌套理论上可以无限循环下去,但现实意义不大,特别是多因素下,过高阶的嵌套是无意义的.
我们可以认为,有应用价值的嵌套,应该不超过5阶.
3.贾贵-黑藤嵌套
在抗日情景喜剧《地下交通站》某集中,有这样一个剧情.敌人(日伪和日军)(简称D)获得八路军(简称B)的情报(在高庄开会),如果B不知道D知道(自己开会的消息),则D可以成功攻击B.然而贾贵在黑藤的授意下,在鼎香楼散布D攻击B的消息.最终野尻依然下令按原计划,贾贵说,这难道不会扑空吗?野尻的逻辑是,既然八路知道了敌人要攻击的消息,并且敌伪知道自己走漏了消息,比如会认为敌伪不会攻击,因而放松警惕,照常开会;如果这样,攻击就能成功.
然而,石青山猜到了野尻的这个逻辑,设下伏击,大获全胜.下面我们就用嵌套公式来描述这个过程.先看敌军方面,一阶:敌人知道八路军开会的消息:
fD1=fD(B),三阶:敌人知道八路军知道自己知道八路军要开会的消息:fD3=fD (fB(fD(B)))于是采取按原计划攻击的策略,以为能获得成功.
对于八路军B,二阶嵌套:八路军知道敌人知道自己要开会的消息:嵌套公式为fB2=fB(f1D)=fB(fD(B)),四阶嵌套,八路军知道敌人知道,八路军知道,敌人知道,八路军知道(攻击计划泄露),嵌套公式为fB4=fB(fD3)=fB(fD(fB(fD (B)))),即八路军敌人在fD3的嵌套公式下,会按计划攻击,所以设下伏击.
从上面的演算可知,二维博弈中,嵌套公式可以用AB相互的低阶嵌套公式递推.即:A的高阶基于B的次一低阶嵌套.反之亦然,即B的高阶基于A的次一低阶嵌套.所以,我们很容易写出任何阶数的嵌套公式.递推公式为:
fA N=fA(fB N-1)
以及:
fB N=fB(fA N-1)
-phybi嵌套公式-
此处还有一个需要讨论的是,二人博弈的嵌套问题中,我们需要设置一个起点,可以是A,也可以是B,但是现实的状况是,可能会有自然的,确定的一个起点,比如上述例子中,八路军开会的消息,就很自然地成为嵌套的起点.而剪刀石头布案例中,游戏双方都可以作为分析起点——他们是等价的.将嵌套理论应用于博弈论,我们不知道起点的选择,是否会对决策和收益产生影响,后继的研究,留给后来者吧!
尾论
基于本小研究,我们认为博弈论应该纳入一个新空间:信息空间.而“嵌套问题”的研究,是这个信息空间结构的重要组成部分.希望有兴趣的研究者继续.此外,本研究只考虑了信息空间,由信息空间映射的决策空间,也存在嵌套现象,其代数结构也留给后继者.
2020.07.10。