海盗分金 囚徒困境 丛林法则
- 格式:doc
- 大小:161.50 KB
- 文档页数:25
“海盗分金币”问题的逻辑推理与延伸归纳(A类)北京化工大学理学院李晓琼摘要:“海盗分金币”问题是一个典型的博弈类问题。
本文通过对此问题的逻辑推理给出答案,并在此基础上做了延伸讨论,同时分析了在改变某一条件后的另一问题。
关键词:海盗分金币;博弈;逻辑;推理1.背景五个海盗抢到了100枚金币,他们决定这么分:1.抽签决定自己的号码:5 4 3 2 1;2.首先,由5号提出分配方案,然后5人共同进行表决,如果有半数或半数以上人同意时,就按照他的提案进行分配,否则5号将被扔入大海喂鲨鱼;3.在5号死后,由4号提出分配方案,然后4人进行表决,如果有半数或半数以上人同意时,就按照他的提案进行分配,否则4号将被扔入大海喂鲨鱼;4.以次类推。
海盗们基于三个因素来做决定:1. 要能存活下来;2. 自己得到的利益最大化;3. 在所有其他条件相同的情况下,优先选择把别人扔出船外。
问题:第一个提出分配方案的海盗怎样分配才能够使自己免于下海且获得最多金币?1.1.分析1)假设只有2号与1号两个人来分配,则2号为了自己利益最大化会提出占有全部金币,而1号无论赞同与反对都不会得到金币。
1号为使自己利益的最大化,会保全3号的生命以求得到金币。
2号的决策是:海盗名称: 2 1得金币数:100 02)假设由3,2,1号三人来分配,则1号只要能得到一枚金币就一定会支持3号的方案。
3号会做出这样的分配方案,自己得99枚金币,1号得1枚金币,而无论2号赞同与反对都不会得到金币,所以2号会保全4号的生命以求得到金币。
3号的决策是:海盗名称: 3 2 1得金币数:99 0 13)假设由4,3,2,1号四个人来分配,4号所提出的方案只要得到其他三人中的任意一人的支持就能保全自身,同时利益最大。
由上一步分析,除非4号分100枚金币给3号,否则就不能确定得到3号的支持。
4号为了利益最大化,他只要得到2,1号至少一人的支持就能保证自己不被处死,且他只需支付一个人金币。
智力题5个海盗分金币的答案是什么智力题题目可以以任何形式考察答题人的注意力、观察力、逻辑思维、想象力、记忆力。
你听过5个海盗分金币的智力题吗?下面店铺跟你分享一下5个海盗分金币的智力题及答案。
智力问题:5个海盗怎么分金币?5个海盗抢得100枚金币后,讨论如何进行公正分配。
他们商定的分配原则是:(1)抽签确定各人的分配顺序号码(1,2,3,4,5);(2)由抽到1号签的海盗提出分配方案,然后5人进行表决,如果方案得到超过半数的人同意,就按照他的方案进行分配,否则就将1号扔进大海喂鲨鱼;(3)如果1号被扔进大海,则由2号提出分配方案,然后由剩余的4人进行表决,当且仅当超过半数的人同意时,才会按照他的提案进行分配,否则也将被扔入大海;(4)依此类推。
这里假设每一个海盗都是绝顶聪明而理性,他们都能够进行严密的逻辑推理,并能很理智的判断自身的得失,即能够在保住性命的前提下得到最多的金币。
同时还假设每一轮表决后的结果都能顺利得到执行,那么抽到1号的海盗应该提出怎样的分配方案才能使自己既不被扔进海里,又可以得到更多的金币呢?智力题答案:5个海盗将金币按以下方法分配1:96 2:0 3:0 4:2 5:2首先,当对3的方案表决时,4会支持3,因为否则的话他就要被5反对,从而死。
因此,如果1,2死了,3的方案肯定是100,0,0,并且一定会得到3和4的支持,此时4,5的收入为0,因此1,2可以贿赂4,5而得到支持。
同时3的期望收入为100,他必定会不顾一切地反对1,2。
而如果1死了,2的方案肯定是98,0,1,1,并且一定会通过。
所以1的最优方案为96,0,0,2,2,并且一定会通过。
其实98,0,0,1,1也可以,并且有可能通过(看4,5的心情和残忍程度而定)。
高智商智力题推荐:帽子问题一群人开舞会,每人头上都戴着一顶帽子。
帽子只有黑白两种,黑的至少有一顶。
每个人都能看到其他人帽子的颜色,却不知自己的。
主持人先让大家看看别人头上戴的什么帽子,然后关灯,如果有人认为自己戴的是黑帽子,就打自己一个耳光。
【博弈论】海盗分⾦问题HDU 1538 A Puzzle for Pirates这是⼀个经典问题,有n个海盗,分m块⾦⼦,其中他们会按⼀定的顺序提出⾃⼰的分配⽅案,如果50%或以上的⼈赞成,则⽅案通过,开始分⾦⼦,如果不通过,则把提出⽅案的扔到海⾥,下⼀个⼈继续。
现在给出n,问第k个海盗(第n个海盗先提⽅案,第1个最后提⽅案)可以分到多少⾦⼦,还是会被扔到海⾥去。
⾸先我们讲⼀下海盗分⾦决策的三个标准:保命,拿更多的⾦⼦,杀⼈,优先级是递减的。
同时分为两个状态稳定状态和不稳定状态:如果当n和m的组合使得最先决策的⼈(编号为n)不会被丢下海, 即游戏会⽴即结束, 就称这个状态时"稳定的". 反之, 问题会退化为n-1和m的组合, 直到达到⼀个稳定状态, 所以称这种状态为"不稳定的".接下来我们从简单的开始分析:如果只有两个⼈的话:那么2号开始提出⽅案,这时候知道不管提什么,他⾃⼰肯定赞成,⼤于等于半数,⽅案通过,那么2号肯定把所有的⾦⼦都给了⾃⼰。
如果只有三个⼈的话:那么3号知道,如果⾃⼰死了,那么2号肯定能把所有⾦⼦拿下,对于1号来说没有半点好处。
那么他就拿出⾦⼦贿赂1号,1号拿到1个⾦⼦,总⽐没有好,肯定赞成3号,剩下的3号拿下。
如果只有四个⼈的话:那么4号知道,如果⾃⼰死了,那么1号拿到1个⾦⼦,2号什么都没有,3号拿下剩下的⾦⼦。
那他就可以拿出部分⾦⼦贿赂2号,2号知道如果4号死了,⾃⼰将什么都没有,他肯定赞成4号。
如此类推下去,如果n<=2*m时候,前⾯与n相同奇偶性的得到1个⾦⼦,剩下的第n个⼈全部拿下。
但是会有⼀个问题便是,如果⾦⼦不够贿赂怎么办:我们将问题具体化:如果有500个海盗,只有100个⾦⼦,那么前⾯200个已经分析过了。
对于201号来说,拿出100个⾦⼦贿赂前⾯的第200号分⾦⼦时拿不到⾦⼦的100个⼈。
⾃⼰不拿⾦⼦,这样刚好有101票保证⾃⼰不死,如果分给之前能拿到⾦⼦的⼈,那么之前拿不到⾦⼦的⼈反正⽆论如何也拿不到⾦⼦,不如把你杀了。
海盗分金博弈论的故事海盗分金--博弈论的故事(一)海盗分金5名海盗分100枚金币。
规则是大家抽签分出1-5号,并按顺序提方案。
1号首先提方案,5人表决,当超半数同意时有效;否则1号将被抛入大海。
然后,2号提方案,4人表决,评判方式同上。
以此类推。
假定每个人都很聪明,1号提出什么方案,能使自己收益最大?答案是:(97、0、1、0、2)或(97、0、1、2、0)。
推理:假定1-3号都抛入大海,那末4号也活不了,所以,4号必须保住3号。
据此,3号可提方案(100、0、0)。
2号推知3号方案,可提出(98、0、1、1)方案,来拉拢4号和5号。
1号推知2号方案,可推出上述方案,拉拢住3号,以及4号或5号中的1人。
(二)博弈论与博弈类型博弈(Game),本是游戏、竞赛的意思。
所要解决的核心问题是:参与博弈的其他人员会怎么做?我应采取怎样的对策来取得最佳效果?博弈的例子到处可见:讨价还价、划拳、小孩猜拳、下棋、打牌,以及"三十六计"、"田忌赛马"等。
博弈论作为一种理论,最先是由美国经济学家冯·诺伊曼在1937年提出来的,他与经济学家奥斯卡·摩根斯坦于1944年合著的《博弈论与经济行为》公认为博弈论诞生的标志。
今天,博弈论已为数学的一个较为完善的分支,并在许多领域被运用。
在经济学领域的影响被称为"现代经济学的一次大的革命"。
博弈类型:1.静态博弈与动态博弈。
前者指参与者同时行动、同时出牌或亮招,如招标、考试等;后者指参与者的行动有先后次序,如下棋、战争、商业竞争等。
2.完全信息博弈与不完全信息博弈。
前者指参与者互相都"知己知彼",否则就是后者。
3.零和博弈与非零和博弈。
前者指"你赢的就是我输的",如打麻将、下棋等;后者指大家的得失总和不为零,如势均力敌的战争会使两败俱伤,而商业合作会使"双赢"。
五海盗分金的管理经济学原理五海盗分金问题是一个经典的经济学问题,它涉及到资源分配和决策制定等方面的管理经济学原理。
这个问题假设有五名海盗在分一笔价值不菲的金子,他们每个人都想尽可能多地获得金子。
五名海盗分别是A、B、C、D和E,他们按照顺序进行决策。
管理经济学原理在这个问题中扮演着重要的角色。
以下是介绍五海盗分金的管理经济学原理:1. 资源稀缺性与效用最大化首先,五海盗分金问题涉及到资源稀缺性和效用最大化的概念。
金子是有限的资源,而每个海盗都希望获得尽可能多的金子。
他们必须在分配金子的过程中平衡自己的利益和效用,以实现自己的目标。
在经济学中,效用最大化是个人或组织在资源稀缺的条件下追求最大化其收益的行为准则。
在这个问题中,每个海盗都试图最大化自己的金子份额,从而获得最大的效用。
2. 风险决策与信息不对称五海盗分金问题也涉及到风险决策和信息不对称的概念。
每个海盗在决策时都面临着风险,因为他们不知道其他海盗会做出什么样的决策。
此外,每个海盗都拥有不同的信息和知识,这使得信息不对称成为分金决策的一个重要因素。
在管理经济学中,风险决策是指在不确定条件下进行的决策。
在这个问题中,每个海盗都必须根据有限的信息做出决策,而这些信息可能不完全准确或者存在偏差。
由于信息不对称,每个海盗都面临着风险,因此他们必须权衡风险和收益之间的关系。
3. 权力与博弈论五海盗分金问题还涉及到权力与博弈论的概念。
每个海盗都有一定的权力来影响分金的决策,但他们的权力大小不一。
例如,第一个海盗可以提出一种分金方案,而其他四个海盗可以选择接受或拒绝这个方案。
如果第一个海盗提出的方案被接受,那么他可以获得更多的金子;如果方案被拒绝,那么他可能会失去更多的金子甚至一无所有。
在博弈论中,权力是指一个参与者能够影响其他参与者决策的能力。
在这个问题中,每个海盗都有一定的权力来影响分金的决策,但他们的权力大小取决于他们的威慑力、实力和策略等因素。
博弈论可以帮助我们理解每个海盗如何运用自己的权力来最大化自己的收益。
史上最烧脑逻辑问题:海盗分金币问题。
能看懂解析的都是天才!不说废话,直接上题!海盗分金币问题:5个海盗抢得了100个金币,现对这100个金币进行分配。
分配规则如下:首先抽签决定分配顺序,然后1号海盗进行分配,剩余4个海盗对1号海盗的分配方案进行投票,如果达到半数投赞成票,则方案通过,否则,杀死1号海盗;继续由2号海盗提出分配方案,剩余3个海盗进行投票,规则同上,以此类推。
假设这5个海盗都是懂逻辑的天才,请问几号海盗分得最多?具体怎么分配才能达到利益最大化?这个问题按照常人的思维,太简单了,5个海盗,100个金币,平均每个人分20个就完事了。
但是对于5个都懂逻辑的海盗可不会这么想。
海盗的思维方式是这样的:1、保命最重要;2、在能够保命的前提下,尽量多分金币;3、在保证前两条的前提下,尽量杀死对方。
最终分配结果绝对超出你的想象!我们首先来解决第一个问题:抽签公平吗?如果在没有人作弊的前提下,抽签显然是最公平的方案,抽到几号签完全是个人运气,所以就不再纠结这个问题了,我们将讨论的重心放在分配的规则上。
直接考虑5个人的情况太复杂了,我们把问题简化一下,从最简单的情况入手。
(1)首先考虑2个海盗:此时1号海盗进行分配,2号海盗进行投票。
注意分配方案需要得到半数人的支持,而此时只有1个人拥有投票权,那么2号海盗就拥有1票否决权。
那么1号海盗应该怎么分配,2号才能同意呢?显然,平分的方案2号是肯定不可能同意的。
那有人会想到1号将所有金币都给2号,自己1个金币也不要。
那么这样分1号就能保命了吗?答案是否定的。
因为无论1号怎么分,2号都可以说不同意,然后就有资格杀死1号。
此时,100个金币仍然都是2号的,而且他还没有后顾之忧。
所以结论是:当只剩下2个海盗时,无论1号怎么分配,1号都是必死无疑!(2)接下来考虑3个海盗:此时1号海盗进行分配,2号和3号海盗进行投票。
此时有2个人拥有投票权,只需要争取到1个人同意就行了。
5个海盗抢到了100颗宝石,每一颗都一样的大小和价值连城。
他们决定这么分:1、抽签决定自己的号码(1,2,3,4,5)2、首先,由1号提出分配方案,然后大家5人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。
3、如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。
4、以次类推……条件:每个海盗都是很聪明的人,都能很理智的判断得失,从而做出选择。
问题:第一个海盗提出怎样的分配方案才能够使自己的收益最大化?这是经济学上的“海盗分金”模型,上大学那阵还在课上讨论过。
基于模型的前提假设,可以做出如下推理:从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。
所以,4号惟有支持3号才能保命。
3号知道这一点,就会提出“100,0,0”的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。
不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放弃3号,而给予4号和5号各一枚金币。
由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。
这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。
由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。
这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。
分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。
五个海盗分金币的故事个海盗分金币的故事,告诉了人们做事要善于思考,懂得变换思维为自己取得最大利益。
故事:五个海盗抢到了 100 个金币,每一颗都一样的大小和价值连城。
他们决定这么分:1(抽签决定自己的号码 ------ [1、2、3、4、5]2(首先,由 1 号提出分配方案,然后大家 5 人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。
3(如果 1 号死后,再由 2 号提出分配方案,然后大家 4 人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。
4(以次类推条件:每个海盗都是很聪明的人,都能很理智的判断得失,从而做出选择。
问题:第一个海盗提出怎样的分配方案才能够使自己免于下海以及自己获得最多的金币呢,-------------------------------------------------------------------------------此题公认的标准答案是:1 号海盗分给 3 号 1 枚金币, 4号或 5 号2 枚金币,自己则独得 97 枚金币,即分配方案为(97,0,1,2,0)或(97,0,1,0,2)。
现来看如下各人的理性分析: 首先从 5 号海盗开始,因为他是最安全的,没有被扔下大海的风险,因此他的策略也最为简单,即最好前面的人全都死光光,那么他就可以独得这100 枚金币了。
接下来看 4 号,他的生存机会完全取决于前面还有人存活着,因为如果 1 号到 3 号的海盗全都喂了鲨鱼,那么在只剩 4 号与 5 号的情况下,不管 4 号提出怎样的分配方案,号一定都会投反对票来让 4 号去喂鲨鱼, 5 以独吞全部的金币。
哪怕 4 号为了保命而讨好 5 号,提出(0,100)这样的方案让 5 号独占金币,但是 5 号还有可能觉得留着 4 号有危险,而投票反对以让其喂鲨鱼。
因此理性的 4 号是不应该冒这样的风险,把存活的希望寄托在 5 号的随机选择上的,他惟有支持 3 号才能绝对保证自身的性命。
恩格斯说过:‚伟大的阶级,正如伟大的民族一样,无论从哪方面学习都不如从自己所犯的错误中学习来得快。
‛企业家必须认真对待的或许不会发生的故事——‚海盗分金‛话说五个海盗抢得100枚金币,他们通过了这样一个关于分配的制度安排:1、抽签决定各人的号码(1,2,3,4,5);2、由1号提出分配方案,然后5人表决,当且仅当超过半数同意,方案才能通过,否则他将被扔入大海喂鲨鱼;3、1号死后,由2号提方案,4人表决,当且仅当超过半数同意,方案才能通过,否则2号同样被扔入大海;4、依次类推……假定‚每个海盗都是很聪明的人,都能很理智的判断得失,从而做出选择‛,那么‚第一个海盗提出怎样的分配方案才能够使自己的收益最大化?‛据说,凡在20分钟答出此题的人有望在美国赚取8万以上的年薪。
标准答案是:1号海盗分给3号1枚金币,4号或5号海盗2枚,独得97枚。
分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。
推理过程是这样的:从后向前推,如果1-3号海盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。
所以,4号惟有支持3号才能保命。
3号知道这一点,就会提(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票他的方案即可通过。
不过,2号推知到3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。
由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。
这样,2号将拿走98枚金币。
不过,2号的方案会被1号所洞悉,1号并将提出(97 ,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。
由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。
这无疑是1号能够获取最大收益的方案了!思考:1、当老大是不容易的,企业家就是要把各方面‚摆平‛。
这里说的企业家包括熊比特说的政治家。
2、任何‚分配者‛想让自己的方案获得通过的关键是事先考虑清楚‚挑战者‛的分配方案是什么,并用最小的代价获取最大收益,拉拢‚挑战者‛分配方案中最不得意的人们。
想一想历朝历代的农民起义,想一想绵延起不断的宫廷斗争,想一想我们这个时代比比皆是的结盟与背叛,想一想企业内部的明争暗斗,想一想办公室脚下使绊的政治,哪一个得胜者不是采用的类似‚海盗分金‛的办法?为什么革命者总是找穷苦人,因为他们是最失意的人。
为什么恐怖分子拉登在沙特阿拉伯没有市场,在阿富汗却大受欢迎,因为阿富汗是全球化的弃儿。
为什么企业中的一把手,在搞内部人控制时,经常是抛开二号人物,而与会计和出纳们打得火热,难道不是因为公司里的小人物好收买,而二号人物却总是野心勃勃地想着取而代之……3、国际交易中的先发优势和后发劣势。
1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。
这不正是全球化过程中先进国家先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利。
却因不得不看别人脸色行事而只能分得一小杯羹。
这难道不是后发劣势的写照?可以预料,如果中国人总是处于5号位臵,总是坐等别人制定规则,未来就不见得会比5号好到那里去!4、海盗的逻辑当然不是真实世界的唯一内幕。
‚海盗分金‛模型是一个非常精致的模型,但它只是一个有益的智力测验,而现实世界要比这个模型复杂得多。
5、现实中肯定不会是人人都绝顶聪明兼‚绝对理性‛。
回到‚海盗分金‚的模型中,只要3号,4号或5号中有一个人偏离了绝对聪明兼绝顶理性的假设,海盗1号保不准就会被扔到海里去了。
所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,而断断不敢自取97颗金币,拼了性命去狂赌。
6、偏好和效用及其替代是另外的一个大问题。
现实中人们是如此的复杂,某人的神经末稍微偏离一毫,就可能表现得对金币满不在乎而偏偏喜欢看同伙被扔进海里喂鲨鱼。
果真如此,1号自以为得计的方案岂成了自掘坟墓!7、再就是俗话所说的‚人心隔肚皮‛。
这翻译成经济学语言则是信息不对称。
由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会象杂草般疯长,并借机获益。
譬如,2号完全可以对3、4、5号大放烟幕弹,假称对于1号所提出任何分配方案,他一定会再多加上一个金币给他们。
果真如此,结果又当如何?8、通常,在现实世界中,人人都有自认的公平标准,因而时常会嘟嚷:‚谁动了我的奶酪‛?而且,规则是由人制订的,所以,当人一旦意识到这个规则对自己不利的时候,并且知道这对大多数人不利的时候,就会想到修改规则。
也就是我们说的‚文化可以颠覆制度‛。
可以料想,一旦1号所提方案和大家所想的不符合的时候,就会有人大闹……当大家都闹将起来的时候,1号能拿着97枚金币毫发不损地、镇定自若地走出去吗?最大的可能就是,海盗们会要求修改规则,然后重新分配。
9、假如由一次博弈变成重复博弈呢?比如,大家讲清楚下次再得100枚金币时,先由2号海盗来分……然后是3号……这颇有点象美国总统选举,轮流主政。
说白了,其实是民主制度下的分赃制。
可能还会有比这更闹得凶的。
比如,四人会想:1号居然要独得97枚金币,这还得了。
于是,他们立即形成一个反1号的大联盟并制定出新规则:四人平分金币,独将1号扔进大海……这便是阿Q式的革命理想:高举平均主义的旗臶,将富人扔进死亡深渊,睡吴妈的床……10、制度的重要在这个故事中得到了最突出的体现,这样一个分配制度,很容易诱导人们走向自相残杀,这是在游戏中容易被人忽略的。
美国的总统制度中有一条重要的规则是,总统下台后可以建一个图书馆(当然还有其它优厚的条件),而不是‚推到海里‛,这就保证了文明的权力交替,可以想象,如果所有的总统都没有好下场,那总统不仅不愿意下台,而且还会做很多的保护自己的手脚,政治就不可能清明。
11、现实的确是太复杂了。
这也说明制度是多么的重要,也说明参与制度的制定是多么重要。
12、每个个体在每一件事上都诉诸理性,是不经济的。
因为理性的成本太高了,所以人们在多数事情上,是按社会的规范和习俗行事。
还有很多,不能全说出来了,留给大家在实践中思考和总结。
囚徒困境的理论研究第一部分:什么是囚徒困境(prisoner's dilemma)一、囚徒困境(prisoner's dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。
在重复的囚徒困境中,博弈被反复地进行。
因而每个参与者都有机会去‚惩罚‛另一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。
二、经典的囚徒困境1950年,由就职于兰德公司的梅里尔〃弗勒德(Merrill Flood)和梅尔文〃德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特〃塔克(Albert T ucker)以囚徒方式阐述,并命名为‚囚徒困境‛。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称‚背叛‛对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相‚合作‛),则二人同样判监半年。
若二人都互相检举(互相‚背叛‛),则二人同样判监2年。
用表格概述如下:甲沉默(合作)甲认罪(背叛)乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年解说如同博弈论的其它例证,囚徒困境假定每个参与者(即‚囚徒‛)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为‚严格劣势‛,理性的参与者绝不会选择。
另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。
以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。
但根据以上假设,二人均为理性的个人,且只追求自己个人利益。
均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。
这就是‚困境‛所在。
例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
三、一般形式整理囚徒困境的基本博弈结构,可更清楚地分析囚徒困境。
实验经济学常用这种博弈的一般形式分析各种论题。
以下是实现一般形式的其中一例:有两个参与者和一个庄家。
参与者每人有一式两张卡片,各印有‚合作‛和‚背叛‛。
参与者各把一张卡片文字面朝下,放在庄家面前。
文字面朝下排除了参与者知道对方选择的可能性1。
然后,庄家翻开两个参与者卡片,根据以下规则支付利益:一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。
二人都合作:各得3分(合作报酬)。
二人都背叛:各得1分(背叛惩罚)。
用支付矩阵表格展示支付如下(以红和蓝分别表示二参与者):一般形式囚徒困境的支付矩阵合作背叛合作3, 3 0, 5背叛5, 0 1, 1以‚T、R、P、S‛符号表示合作背叛合作R, R S, T背叛T, S P, P以‚胜-负‛术语表示合作背叛合作胜-胜大负-大胜背叛大胜-大负负-负简单博弈获得的点数可以得出一些一般化的结论。