当前位置：文档之家› 海盗分金囚徒困境丛林法则

海盗分金囚徒困境丛林法则

恩格斯说过：?伟大的阶级，正如伟大的民族一样，无论从哪方面学习都不如从自己所犯的错误中学习来得快。?

企业家必须认真对待的或许不会发生的故事——

?海盗分金?

话说五个海盗抢得100枚金币，他们通过了这样一个关于分配的制度安排：

1、抽签决定各人的号码（1，2，3，4，5）；

2、由1号提出分配方案，然后5人表决，当且仅当超过半数同意，方案才能通过，否则他将被扔入大海喂鲨鱼；

3、1号死后，由2号提方案，4人表决，当且仅当超过半数同意，方案才能通过，否则2号同样被扔入大海；

4、依次类推……

假定?每个海盗都是很聪明的人，都能很理智的判断得失，从而做出选择?，那么?第一个海盗提出怎样的分配方案才能够使自己的收益最大化？?

据说，凡在20分钟答出此题的人有望在美国赚取8万以上的年薪。

标准答案是：1号海盗分给3号1枚金币，4号或5号海盗2枚，独得97枚。分配方案可写成（97，0，1，2，0）或（97，0，1，0，2）。

推理过程是这样的：从后向前推，如果1-3号海盗都喂了鲨鱼，只剩4号和5号的话，5号一定投反对票让4号喂鲨鱼，以独吞全部金币。所以，4号惟有支持3号才能保命。3号知道这一点，就会提（100，0，0）的分配方案，对4号、5号一毛不拔而将全部金币归为已有，因为他知道4号一无所获但还是会投赞成票，再加上自己一票他的方案即可通过。不过，2号推知到3号的方案，就会提出（98，0，1，1）的方案，即放弃3号，而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利，他们将支持他而不希望他出局而由3号来分配。这样，2号将拿走98枚金币。不过，2号的方案会被1号所洞悉，1号并将提出（97 ，0，1，2，0）或（97，0，1，0，2）的方案，即放弃2号，而给3号一枚金币，同时给4号（或5号）2枚金币。由于1号的这一方案对于3号和4号（或5号）来说，相比2号分配时更优，他们将投1号的赞成票，再加上1号自己的票，1号的方案可获通过，97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了！

思考：

1、当老大是不容易的，企业家就是要把各方面?摆平?。这里说的企业家包括熊比特

说的政治家。

2、任何?分配者?想让自己的方案获得通过的关键是事先考虑清楚?挑战者?的分配方案是什么，并用最小的代价获取最大收益，拉拢?挑战者?分配方案中最不得意的人们。想一想历朝历代的农民起义，想一想绵延起不断的宫廷斗争，想一想我们这个时代比比皆是的结盟与背叛，想一想企业内部的明争暗斗，想一想办公室脚下使绊的政治，哪一个得胜者不是采用的类似?海盗分金?的办法？

为什么革命者总是找穷苦人，因为他们是最失意的人。为什么恐怖分子拉登在沙特阿拉伯没有市场，在阿富汗却大受欢迎，因为阿富汗是全球化的弃儿。为什么企业中的一把手，在搞内部人控制时，经常是抛开二号人物，而与会计和出纳们打得火热，难道不是因为公司里的小人物好收买，而二号人物却总是野心勃勃地想着取而代之……

3、国际交易中的先发优势和后发劣势。1号看起来最有可能喂鲨鱼，但他牢牢地把握住先发优势，结果不但消除了死亡威胁，还收益最大。这不正是全球化过程中先进国家先发优势吗？而5号，看起来最安全，没有死亡的威胁，甚至还能坐收渔人之利。却因不得不看别人脸色行事而只能分得一小杯羹。这难道不是后发劣势的写照？可以预料，如果中国人总是处于5号位臵，总是坐等别人制定规则，未来就不见得会比5号好到那里去！

4、海盗的逻辑当然不是真实世界的唯一内幕。?海盗分金?模型是一个非常精致的模型，但它只是一个有益的智力测验，而现实世界要比这个模型复杂得多。

5、现实中肯定不会是人人都绝顶聪明兼?绝对理性?。回到?海盗分金?的模型中，只要3号，4号或5号中有一个人偏离了绝对聪明兼绝顶理性的假设，海盗1号保不准就会被扔到海里去了。所以，1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住，而断断不敢自取97颗金币，拼了性命去狂赌。

6、偏好和效用及其替代是另外的一个大问题。现实中人们是如此的复杂，某人的神经末稍微偏离一毫，就可能表现得对金币满不在乎而偏偏喜欢看同伙被扔进海里喂鲨鱼。果真如此，1号自以为得计的方案岂成了自掘坟墓！

7、再就是俗话所说的?人心隔肚皮?。这翻译成经济学语言则是信息不对称。由于信息不对称，谎言和虚假承诺就大有用武之地，而阴谋也会象杂草般疯长，并借机获益。譬如，2号完全可以对3、4、5号大放烟幕弹，假称对于1号所提出任何分配方案，他一定会再多加上一个金币给他们。果真如此，结果又当如何？

8、通常，在现实世界中，人人都有自认的公平标准，因而时常会嘟嚷：?谁动了我的

奶酪?？而且，规则是由人制订的，所以，当人一旦意识到这个规则对自己不利的时候，并且知道这对大多数人不利的时候，就会想到修改规则。也就是我们说的?文化可以颠覆制度?。可以料想，一旦1号所提方案和大家所想的不符合的时候，就会有人大闹……当大家都闹将起来的时候，1号能拿着97枚金币毫发不损地、镇定自若地走出去吗？最大的可能就是，海盗们会要求修改规则，然后重新分配。

9、假如由一次博弈变成重复博弈呢？比如，大家讲清楚下次再得100枚金币时，先由2号海盗来分……然后是3号……这颇有点象美国总统选举，轮流主政。说白了，其实是民主制度下的分赃制。可能还会有比这更闹得凶的。比如，四人会想：1号居然要独得97枚金币，这还得了。于是，他们立即形成一个反1号的大联盟并制定出新规则：四人平分金币，独将1号扔进大海……这便是阿Q式的革命理想：高举平均主义的旗臶，将富人扔进死亡深渊，睡吴妈的床……

10、制度的重要在这个故事中得到了最突出的体现，这样一个分配制度，很容易诱导人们走向自相残杀，这是在游戏中容易被人忽略的。美国的总统制度中有一条重要的规则是，总统下台后可以建一个图书馆（当然还有其它优厚的条件），而不是?推到海里?，这就保证了文明的权力交替，可以想象，如果所有的总统都没有好下场，那总统不仅不愿意下台，而且还会做很多的保护自己的手脚，政治就不可能清明。

11、现实的确是太复杂了。这也说明制度是多么的重要，也说明参与制度的制定是多么重要。

12、每个个体在每一件事上都诉诸理性，是不经济的。因为理性的成本太高了，所以人们在多数事情上，是按社会的规范和习俗行事。

还有很多，不能全说出来了，留给大家在实践中思考和总结。

囚徒困境的理论研究

第一部分：什么是囚徒困境（prisoner's dilemma）

一、囚徒困境（prisoner's dilemma）

是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。

在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去?惩罚?另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。

囚徒困境的主旨为，囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在资讯不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。但实际上，执法机构不可能设立如此情境来诱使所有囚徒招供，因为囚徒们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以执法者所设立之利益（刑期）作考量。

二、经典的囚徒困境

1950年，由就职于兰德公司的梅里尔〃弗勒德（Merrill Flood）和梅尔文〃德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特〃塔克（Albert T ucker）以囚徒方式阐述，并命名为?囚徒困境?。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：

若一人认罪并作证检控对方（相关术语称?背叛?对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

若二人都保持沉默（相关术语称互相?合作?），则二人同样判监半年。

若二人都互相检举（互相?背叛?），则二人同样判监2年。

用表格概述如下：

甲沉默（合作）甲认罪（背叛）

乙沉默（合作）二人同服刑半年甲即时获释；乙服刑10年

乙认罪（背叛）甲服刑10年；乙即时获释二人同服刑2年

解说

如同博弈论的其它例证，囚徒困境假定每个参与者（即?囚徒?）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为?严格劣势?，理性的参与者绝

不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：

若对方沉默、背叛会让我获释，所以会选择背叛。

若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。

这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是?困境?所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。

三、一般形式

整理囚徒困境的基本博弈结构，可更清楚地分析囚徒困境。实验经济学常用这种博弈的一般形式分析各种论题。以下是实现一般形式的其中一例：

有两个参与者和一个庄家。参与者每人有一式两张卡片，各印有?合作?和?背叛?。参与者各把一张卡片文字面朝下，放在庄家面前。文字面朝下排除了参与者知道对方选择的可能性1。然后，庄家翻开两个参与者卡片，根据以下规则支付利益：一人背叛、一人合作：背叛者得5分（背叛诱惑），合作者0分（受骗支付）。

二人都合作：各得3分（合作报酬）。

二人都背叛：各得1分（背叛惩罚）。

用支付矩阵表格展示支付如下（以红和蓝分别表示二参与者）：

一般形式囚徒困境的支付矩阵合作背叛

合作3, 3 0, 5

背叛5, 0 1, 1

以?T、R、P、S?符号表示合作背叛

合作R, R S, T

背叛T, S P, P

以?胜－负?术语表示合作背叛

合作胜-胜大负-大胜

背叛大胜-大负负-负

简单博弈获得的点数可以得出一些一般化的结论。

T、R、P、S符号表

符号分数英文中文（非术语）解释

T 5 Temptation 背叛诱惑单独背叛成功所得。

R 3 Reward 合作报酬共同合作所得

P 1 Punishment 背叛惩罚共同背叛所得

S 0 Suckers 受骗支付被单独背叛所获

若以T（Temptation）=背叛诱惑，R（Reward）=合作报酬，P（Punishment）=背叛惩罚，S（Suckers）=受骗支付，以个人选择得分而言，可得出以下不等式。

T>R>P>S

（解：从5>3>1>0获得以上不等式）

若以整体获分而言，将得出以下不等式。

2R>T+S或2R>2P

（解：2×3>5+0或2×3>2x1；合作2人共得6分，比起互相背叛的共得2分及单独背叛的共得5分，显然合作获分比背叛高。合作在团体而言是支配性策略。）而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+ S。就是说将使参与者脱离困境。以上理论是道格拉斯〃霍夫施塔特创建的。

四、现实的例子

上述例子可能显得不甚自然，但现实中，无论是人类社会或大自然都可以找到类似囚徒困境的例子，将结果划成同样的支付矩阵。社会科学中的经济学、政治学和社会学，以及自然科学的动物行动学、进化生物学等学科，都可以用囚徒困境分析，模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用，说明这种博弈的重要性。以下为各界例子：

1、政治学例子：军备竞赛

在政治学中，两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择：增加军备（背叛）、或是达成削减武器协议（合作）。两国都无法肯定对方会遵守协议，因此两国最终会倾向增加军备。似乎自相矛盾的是，虽然增加军备会是两国的?理性?行为，但结果却显得?非理性?（例如会对经济造成都有损坏等）。这可视作遏制理论的推论，就是以强大的军事力量来遏制对方的进攻，以达到和平。

2、经济学例子：关税战

两个国家，在关税上可以有以两个选择:

提高关税，以保护自己的商品。（背叛）

与对方达成关税协定，降低关税以利各自商品流通。（合作）

当一国因某些因素不遵守关税协定，独自提高关税（背叛），另一国也会作出同样反应（亦背叛），这就引发了关税战，两国的商品失去了对方的市场，对本身经济也造成损害（共同背叛的结果）。然后二国又重新达成关税协定。（重复博弈的结果是将发现共同合作利益最大。）

3、商业例子：广告战

商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。

两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。

此二公司可以有二选择：

互相达成协议，减少广告的开支。（合作）

增加广告开支，设法提升广告的质量，压倒对方。（背叛）

若二公司不信任对方，无法合作，背叛成为支配性策略时，二公司将陷入广告战，而广告成本的增加损害了二公司的收益，这就是陷入囚徒困境。在现实中，要二互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。

4、自行车赛例子

自行车赛事的比赛策略也是一种博弈，而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自由车赛中有以下情况：选手们在到终点前的路程常以大队伍（英文:Peloton）方式前进，他们采取这策略是为了令自己不至于太落后，又出力适中。而最前方的选手在迎风时是最费力的，所以选择在前方是最差的策略。通常会发生这样的情况，大家起先都不愿意向前（共同背叛），这使得全体速度很慢，而后通常会有二或多位选手骑到前面，然后一段时间内互相交换最前方位臵，以分担风的阻力（共同合作），使得全体的速度有所提升，而这时如果前方的其中一人试图一直保持前方位臵（背叛），其他选手以及大队伍就会赶上（共同背叛）。而通常的情况是，在最前面次数最多的选手（合作）通常会到最后被落后的选手赶上（背叛），因为后面的选手骑在前面选手的冲流之中，比较不费力。

五、与囚徒困境相关的各事件

1、异想

威廉〃庞德斯通（William Poundstone）在他的著作中，以一新西兰的例子来说明囚徒困境。在新西兰，报亭即无管理员也不上锁，买报纸的人自行放下钱后拿走报纸。当然某些人可能取走报纸却不付钱（背叛），但由于大家认识到如果每个人都偷窃报纸（共同背叛）会造成以后不方便的有害结果，这种情形很少发生。这例子特别之处是新西兰人并没有被任何其他因素影响而能脱离囚徒困境。并没有任何人特别去注意报亭，人们守规则是为了避免共同背叛带来的恶果。这种避免囚徒困境的大家共同的推理或想法被称为?异想（magical thinking）?。[3]

2、?认罪减刑?不可行

囚徒困境的结论是许多国家中认罪减刑（英文：plea bargain）被禁止的原因之一。囚徒困境带来的结论是：如果有二个罪犯，其中一人犯罪而另外一人是无辜的，犯罪

者会为了减刑坦白一切甚至冤枉清白者（单独背叛）。最糟糕的情况是，如果他们二人都被判入狱，坦白的犯罪者刑期少，坚持无罪的冤枉者刑期反而更多。

3、公用品悲剧

现实的博弈参与者不只一方，会有多方参与的囚徒困境。加勒特〃詹姆斯〃哈丁（Garrett James Hardin）的公用品悲剧就是一例：?公用品悲剧是指凡是属于最多数人的公共财产常常是最少受人照顾的事物?，例如渔业，公海中的鱼是属于公共的，而在本身不滥捕其他人也滥捕的思想下，渔民会没有节制的大捞特捞，结果海洋生态破坏，渔民的生计也受影响（共同背叛的结果）。但是，多方囚徒困境的提法有待商榷，因为其总是可以被分解为一组组经典的二方囚徒困境。就是说只有二方的囚徒困境，没有多方的。所谓多方的囚徒困境只是由多个二方囚徒困境混杂在一起而形成的错觉。

六、重复的囚徒困境

罗伯特〃阿克塞尔罗德在其著作《合作的进化》中，探索了经典囚徒困境情景的一个扩展，并把它称作?重复的囚徒困境?（IPD）。在这个博弈中，参与者必须反复地选择他们彼此相关的策略，并且记住他们以前的对抗。阿克塞尔罗德邀请全世界的学术同行来设计计算机策略，并在一个重复囚徒困境竞赛中互相竞争。参赛的程序的差异广泛地存在于这些方面：算法的复杂性、最初的对抗、宽恕的能力等等。

阿克塞尔罗德发现，当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后，从利己的角度来判断，最终?贪婪?策略趋向于减少，而比较?利他?策略更多地被采用。他用这个博弈来说明，通过自然选择，一种利他行为的机制可能从最初纯粹的自私机制进化而来。

最佳确定性策略被认为是?以牙还牙?，这是阿纳托尔〃拉波波特（Anatol Rap oport）开发并运用到锦标赛中的方法。它是所有参赛程序中最简单的，只包含了四行BASIC语言，并且赢得了比赛。这个策略只不过是在重复博弈的开头合作，然后，采取你的对手前一回合的策略。更好些的策略是?宽恕地以牙还牙?。当你的对手背叛，在下一回合中你无论如何要以小概率（大约是1%~5%）时而合作一下。这是考虑到偶尔要从循环背叛的受骗中复原。当错误传达被引入博弈时，?宽恕地以牙还牙?是最佳的。这意味着有时你的动作被错误地传达给你的对手：你合作但是你的对手听说你背叛了。

通过分析高分策略，阿克塞尔罗德指定了策略获得成功的几个必要条件。

1、友善

最重要的条件是策略必须?友善?，这就是说，不要在对手背叛之前先背叛。几乎所有的高分策略都是友善的。因此，完全自私的策略仅仅出于自私的原因，也永远不会首先打击其对手。

2、报复

但是，阿克斯洛德主张，成功的策略必须不是一个盲目乐观者。要始终报复。一个非报复策略的例子是始终合作。这是一个非常糟糕的选择，因为?下流?策略将残酷地剥削这样的傻瓜。

3、宽恕

成功策略的另一个品质是必须要宽恕。虽然它们不报复，但是如果对手不继续背叛，它们会一再退却到合作。这停止了报复和反报复的长期进行，最大化了得分点数。

4、不嫉妒

最后一个品质是不嫉妒，就是说不去争取得到高于对手的分数（对于?友善?的策略来说这也是不可能的，也就是说?友善?的策略永远无法得到高于对手的分数）。

因此，阿克塞尔罗德得到一种给人以乌托邦印象的结论，认为自私的个人为了其自私的利益会趋向友善、宽恕和不嫉妒。阿克塞尔罗德关于重复囚徒困境的研究的重要结论之一，是友善的家伙能先完成交易。

重新考虑经典的囚徒困境一节中给定的军备竞赛模型：结论是，只是理性策略增进了军事力量，似乎两个国家都宁可花费其GDP在枪炮而不是黄油上。有趣的是，企图说明对抗国家实际上以这种方式（在?重复囚徒困境假定?下的不同时期，军费支出在?高?和?低?之间反复）竞赛的尝试，却经常表明假定的军备竞赛并没有如预想的那样出现。（例如希腊人和土耳其人的军费支出，看来并不像遵循?以牙还牙?的重复囚徒困境式的军备竞赛，却更可能是被其国内的政策所驱使。）这可能是一次性博弈和重复性博弈中的理性行为不同的例子。

对一次性囚徒困境博弈来说，最佳（点数最大化的）策略是简单地背叛；正如前面解释的，无论对手的行动可能是什么，这都是真实的。但是，在重复的囚徒困境博弈中，最佳策略依赖于可能的对手的策略，和他们怎样对背叛和合作作出反应。例如，考虑这样一个人群，那里每个人每次都背叛，除了一个人是遵循以牙还牙策略。这个人处于一种轻微的不利地位，因为第一回合的损失。在这样的人群中，对这个人来说最佳策略就是每次都背叛。在一个有一定的百分比的总背叛者而剩下的则是以牙还牙者的人群中，对个人来说的最佳策略依赖于这个百分比和博弈的长度。

一般有两种方法得到最佳策略：

贝叶斯纳什均衡：如果对抗策略的统计分布能被确定（例如，50％以牙还牙，50％一直合作），就能从数学上获得最佳的相对策略[4]。

已经有了人群的蒙特卡罗模拟，在这里低分个人消失了，高分个人一再被生产出来（一种获得最佳策略的天才算法）。决赛人群中的算法合成通常依赖于初赛人群中的算法合成。

尽管以牙还牙始终被认为是最可靠的基本策略，但是在重复囚徒困境的20周年纪念赛中，来英国南安普敦大学的一个小组（由尼古拉斯〃詹宁斯（Nicholas Jenning s）[1]领导，包括了拉蒂普〃达什（Rajdeep Dash）、萨瓦帕里〃拉姆琼（Sarvapali R amchurn）、亚历克斯〃罗杰斯（Alex Rogers）斯和皮鲁克里士南〃维特林根（Peruk rishnen Vytelingum））介绍了一个新的策略，这个策略证明了它比以牙还牙更成功。

这个策略依赖于程序之间的合作，为单一程序中获得了最高的点数。南安普敦大学提交了60个程序参与竞赛，这些程序的开头被设计成通过一组5到10个的动作去彼此识别。一旦这些识别被作出，一个程序将总是合作，其他程序则总是背叛，保证背叛者得到最大的点数。如果程序识别出它在操作一个非南安普敦参与者，这程序将持续地背叛，企图去最小化竞争程序的得分。结果[5]，这个策略以获得前3位结束了竞赛，也得到了大量接近底部的位臵。虽然这个策略显著地证明了比以牙还牙有效，但是这是因为利用了下述事实：在这个特殊的竞赛中，多重通道是被允许的。在一方只能控制单一参与者的竞赛中，以牙还牙确实是更好的策略。

如果重复囚徒困境将被精确地重复N次，已知N是一个常数，那么会产生另一个有趣的事实。纳什均衡就是每次都背叛。这很容易用归纳法证明。你也可以在最后的回合背叛，既然你的对手将没有机会惩罚你。因此，你们都将在最后的回合背叛。这时，你可以在倒数第二回合中背叛，既然最后一回无论你做什么，你的对手都将背叛。依此类推。为了合作以保持请求，这时未来必须对两个参与者来说是不确定的。一个解决方案是让博弈总次数N变成随机的。对未来的预期必须是无法确定的长度。

另一个单独的案例是?永不停止?的囚徒困境。这个博弈被重复很多次，而且你的分数是一个平均数（当然是用计算机计算的）。

囚徒困境博弈是某些人类合作和信任理论的基础。假定囚徒困境能够模拟需要信任的两人之间的交流，群体的合作行为可以用有多个参与者的、重复博弈的变体来模拟。这从而引起了许许多多学者经久不衰的兴趣。1975年，格罗夫曼（Grofman）和普尔（Pool）估计，致力于这方面研究的学术文章，数量超过2000篇。

5、学习心理学和博弈论

当博弈参与者能学会估计其他参与者背叛的可能性，他们自身的行为就为他们关于其他人的经验所影响。简单的统计显示，总体上，缺乏经验的参与者与其他参与者的互动，或者是典型的好，或者是典型的坏。如果他们在这些经验的基础上行动，（通过更多的背叛或合作，否则）他们可能在未来的交易中受损。随着经验逐渐丰富，他们获得了对背叛可能性的更真实的印象，变得更成功地参与博弈。不成熟的参与者经历的早期交易对他们未来参与的影响，可能比这些交易对成熟的参与者的影响要大得多。这个原理部分地解释了，为什么年轻人的成长经验这么具有影响力，以及为什么他们特别容易被欺负，有时他们本身最后也成为欺凌弱小者。

群体中背叛的可能性，可以被合作的经验所削弱[6]，因为先前的博弈建立了信任。因此自我牺牲行为可以，例如，加强团体的道德品质。如果团体很小，积极行为更可能以互相肯定的方式——鼓励这个团体中的个人继续合作——得到反馈。这与相似的困境有关：鼓励那些你将援助的人，从可能使他们处于危险的境地的行为中得到满足。这类方法主要在互惠利他主义、群选择、血缘选择和道德哲学的研究中涉及。

七、相关的博弈

1、封闭袋子交易

霍夫施塔特2曾提出，像囚徒困境一类的问题，若以简单博弈的形式来说明，人们会较容易理解。例如他以?封闭袋子交易?的简单博弈来说明此论题：两人面对面互相交换封闭的袋子，共同了解其中一方放钱，另一方放商品。双方可以诚实的依照承诺，把东西放到袋子里交换；又或者交空袋子给对方，选择背叛。

在这场博弈中，由于背叛可获得巨大利益，必然有多人选择背叛。这意味着理性的商人不会进行这种交易，因而?封闭袋子交易?将由于逆向选择而失去市场。

2、是敌是友?

?是敌是友？?是一个竞赛表演节目，从2002年到2005年在美国竞赛表演广播网（Game Show Network）放映。这是一个用真人进行的囚徒困境博弈例子，不过情景是人造的。这个竞赛表演有三对人参与竞争。当每对人被淘汰时，他们做一个囚徒困境博弈，决定如何分他们的奖品。如果他们都合作（?朋友?），他们的奖品就被平分。如果一个合作而另一个背叛（?敌人?），背叛者得到所有的奖品，合作者什么都得不到。如果都背叛，那么两人都一无所获。注意，这个支付矩阵与前述标准的支付矩阵不同，因为发生?都背叛?的情形和?我合作而对手背叛?的情形，其损失是一样的。和标准囚徒困境的稳定均衡相比，?都背叛?是不稳固的均衡（weak equ ilibrium）。如果你知道你的对手将成为?敌人?，这时你的选择无法影响你的奖品。在某种意义上，?是敌是友?拥有一个介于?囚徒困境?和?小鸡?之间的支付模型。

这个支付矩阵是：

如果参与者都合作，每人得到+1。

如果都背叛，每人得到0。

如果甲合作而乙背叛，甲得到0而乙得到+2。

是敌是友对于想对囚徒困境作现实分析的人将是有用的。注意到，参与者只能进行一次，所以所有涉及重复进行博弈的观点都不适用，?以牙还牙?策略也无法发展出来。

在是敌是友中，每个参赛者被允许做一个声明，使另一半友在双方秘密决定合作或背叛之前，确信他的友善。可能?打破制度?的方法将是一个参与者告诉他的对手：?我会选择做敌人。如果你相信我后来会和你分奖品的话，就选择做朋友。否则，如果你选择做敌人，我们都回空手而回。?一个更贪婪的版本将是：?我将选择做敌人。我会给你百分之X，剩下的百分之（100-X）归我。所以，要或不要，要么我们都得到一些，要么我们都一无所获。?（在最后通牒博弈中时。）现在，奸计就是去尽量减少那个百分之X，并保持另一个竞争者仍然选择做朋友。基本上，这个参与者必须知道这个界限，在这里他的对手从看到他一无所获中得到的效用，要超过他从肯定能赢得的金钱中得到的效用，如果他顺利的话。

在竞赛中这个方法从未被试验过；可能是因为裁判们不会允许，而且即使允许，不平等厌恶也会由于这个规则的使用而导致较低的期望收益。（最后通牒博弈中尝试了这个方法，结果导致对高而不平等的出价的拒绝——在一些案例中，相当于两周的工资优先于两个参与者一无所获被决绝。）

3、核心理念：博弈全输，合作双赢。

4、应用要诀：注重合作，力求双赢；注重策略选择，善于换位思考。

5、应用领域：政治、经济、军事、企业经营、社会生活、组织管理。

第二部分：?囚徒困境?的深刻哲理

简单地说就是，在一个集体里，有可能每个人的选择都是理性的，但对于整个集体来说其结果却不是理性的。就是双方都以自己的利益最大为标准，结果双方的利益都受到损害。

第三部分：怎样才能摆脱?囚徒困境?

博弈双方都付出代价，失去自己不愿失去的东西，只有这样才能共存并且摆脱囚徒困境，这有如壮士断臂，不得不为，也乐得为之。

如果说?兄弟阋于墙，共御外侮?是理想化的摆脱囚徒困境的策略，那么出卖?兄弟?以还得自己的平安，则是处于囚徒困境下本能的选择。趋利避害是人的本能，在经济行为和社会行为中这一本能都鲜明地体现着。

值得注意的是，并不是所有的?囚徒困境?都需要走出来或都需要解脱。如果所有的罪犯都走出了困境，那么将对社会产生灾难性后果，社会将充满了犯罪和混乱。

1、建立长期博弈，即建立多次合作，也称多次囚徒困境。

2、信息对称

3、团结合作

囚徒困境的实际应用

第一、教育方面

1、考试作弊，一个?理性?与道德博弈的囚徒困境

考试作弊不正是一个囚徒困境吗？一个关于选择的困境。这给我提供了一个从经济学和博弈论的角度谈谈考试作弊的理由。

按照经济学的理论，?理性人?总是要追求利益最大的话的。在考试中，作弊的预期收益＞作弊成本即可成为作弊的充分理由和追求。

按照博弈论，?理性人?仍然要追求自身利益最大化，作弊就自然成为了囚徒困境。大家都诚信考试是理想状态，当然好；但如果个别或部分人作弊成功，其收益要明显大于诚信，会产生?竞争成就感?；如果大部分人作弊，诚信者的收益将相对严重减少，会产生强烈的?被剥夺感?，于是他们可能会采取措施维护自己的利益，这措施往往是破坏作弊者的收益（举报——但现实中，因为考后证据难以落实等问题，此类选择较少）或者是同样作弊（这一选择据笔者所知是作弊呈上升趋势的主要原因之一）。

于是，在?理性人?的博弈游戏里，道德被忽视了不被选择了。

那么，从学校的角度如何破解这一困境？破除是必须的，既合理（坚守公平原则）又合情（据有关调查显示，大部分作弊者和不作弊者一样也是反对作弊的！）。

笔者认为，可以尝试从以下方面入手。

一者，提高作弊成本。这是降低作弊收益的最重要步骤。是乎可以首先提高作弊的风险成本：严格严肃规章制度，依法按章严惩作弊者；其次，提高作弊者的边际成本：提高作弊的被追究率，提高的反动是降低，降低考试收益的价值（这一点后面继续谈）；提高作弊的期间成本：用高科技对付高科技（魔高一尺，道高一丈的博弈结果是魔想成魔只能高十丈，而高十丈的成本可能早已经大于收益）；提高作弊的心理成本：用真正可以触及人心灵的舆论和道德环境造成作弊者心理成本的提高（笔者并不否认诚信签名、保证等措施的符号意义和仪式效应，但笔者也不认为它们属于真正可以触及心灵的范畴，如果属于，从人性善的假设出发，作弊早已应该减少或者消失了）。

二者，降低考试收益的价值（笔者并不否定考试的价值也不仅仅着眼于反对作弊，而是从素质教育的宗旨出发思考问题）。这是常常被忽略的或者不愿意正视的或者比较难以解决的。我们不得不承认，现行的考试的价值很高或者过高。一个分数几乎可以决定与学生有关的一切，就业、提干、入党、评优、奖学金等等等等，而这一点是乎并不符合素质教育的要求。在超高收益和相对低廉的成本对比诱惑下，从高考到职称考试到等级考试到一般考试，作弊几乎成为不可避免（这是一个现实判断，而非道德判断，正如老鼠过街人人喊打，而老鼠仍然存在一样）。从学校的角度看，社会对外语计算机等级考试的追求我们无能为力，无法降低其价值。但，我们完全有能力和条件适当降低一般考试的价值。笔者认为，途径是乎有二，一是深化考试改革，适当改变考试方式，比如增加口试、平时考核、实践等，既可以消除作弊的机会又是推进素质教育的很好途径；二是从推进素质教育的高度出发，完善各种考评制度，强化对学生的综合考评，真正做到德智体美并重。这是指挥棒，是至关重要的。

从博弈者的角度看，如何破除这一囚徒的困境？

我认为，在作弊这个囚徒困境中，作弊并非真正的理性选择，它更象是一场赌博，其赌注是未来的生活，因为一旦被发现，面临的将是极其严厉的处罚。在心理学上有一个效应叫?控制错觉?，我们都以为我们可以控制未发生的事情，但这是错觉，实际上没有人可以控制。

我们都承认，过去现在和将来，作弊一定有没被发现的，也一定有被发现的。当我们在博弈中准备自己的策略时，我的建议是，我们应该思考的问题绝对不应该是：被发现为什么就一定是我？我们应该思考的问题应该绝对应该是：为什么被发现的一定不是我？！

我们需要真正的理性，真正的理性就是，要破除我们的?控制错觉?。破除困境的方法很简单，就是不作囚徒（为什么要博弈？原本不需要的。我们只需要按自己的原则做事，不需要参考别人的策略），更不作赌徒（无数个现实早已证明了，赌博不会有真正的赢家。何况这是一个我们根本输不起的赌博？输不起的赌博，不赌是最好的选择）。

以上完全是从经济学和博弈论的角度分析。在现实里，问题就复杂多了。人毕竟不仅仅是?理性人?还是?情感人?，既有?本我?又有?超我?还有?自我?。从?现实人??真实人??完整人?的角度看，思想教育指导、道德舆论引导意义是非常重大的。

不管怎么看，在现行的规章制度下，作弊都是一个损人未必利己更可能损己的选择，是非理性的。

2、考生家长的?囚徒效应?——高考话题

高考来临，上海徐汇区的孙女士成了大忙人。并不是因为她是考生家长，而是因为她的儿子曾患有多动症，医生曾给他开过专治此病的精神类药物利他林。她的同事及熟人纷纷托她带着儿子和儿子的病历，到医院去，对医生谎称丢了药，需要重新配药。等她拿着药回到单位，每个考生家长分4片，刚刚从医院配的药很快一抢而空。

有的家长声称这是往届高考考生的经验之谈：服了这种药以后，精神高度集中，思维清晰敏捷，容易发挥出好的成绩。虽然谁都明白：?是药三分毒。?吃下去肯定会对孩子产生副作用，但一心想让孩子取得好成绩的考生家长此时却产生了?囚徒效应?：如果我的孩子不吃兴奋剂，别的考生要是吃了怎么办？那我们岂不是吃亏了吗？

其实利他林在网上就有卖的，打的旗号是?美国全进口利他林?，化学成分是哌甲酯，俗称聪明药。每瓶480元，每个考生一般只买4粒。一心想让孩子服药后超常发挥的家长们往往通过网上药店团购——此时的兴奋剂对考生身体的危害已经不再是零星的、散兵游勇式的袭击，而变成了有组织的大兵团作战。兴奋剂与考生家长的愚昧无知结合的结果，对考生身心健康的影响不容忽视。

其实利他林是专治多动症的，多动症的孩子服用以后，刺激大脑皮层，使其集中注意力，但正常的孩子吃了却因药物的刺激反倒难以集中注意力，只会使孩子发挥失常，甚至造成难以预料的后果。

众所周知，国家早已不再为大学毕业生分配工作，而且大学学费高昂。如果现在的高考还像封建社会的科举那样，经过几场考试就能有官做，这些一心想让孩子在高考中脱颖而出的家长还会怎样？会不会?上天入地下黄泉?，去寻找观世音菩萨，让她用杨枝净水点化一下自己孩子的脑袋，从而让孩子一举考中北大清华呢？

高考考的是考生的知识储备，考的是考生心理素质的好坏，任何外力的作用都只能干扰能力的正常表现，破坏考生的心态平衡。

3、利用?囚徒困境?解决学生早恋问题

有一位经验丰富的班主任在送毕业班时，发现临近毕业时，班上男女学生出现了一些不正常现象，交往过密。还有部分学生日记里透露出对某人的好感，隐约感觉到他们在谈情说爱，但苦于找不到证据，问了一些同学，他们都说不知道。最后，这位老师想到了?囚徒困境?。于是，她找到她最信任的一位学生——也是位早恋者。开始，她毫不犹豫地否认了，她说：?这是我和朋友之间的秘密，我不能出卖朋友。?这位老师立刻说：?难道你从未把老师当朋友？老师一直把你当成最好的朋友，况且你说了，只有天知、地知、你知、我知。我也跟谁都不会说。只要你说了，老师也不会处分你，还给你保密。?经过非常轻松朋友式的交谈，那位女同学向老师坦言了同学之间谈情说爱的惊人内幕：两个班大部分学生都在谈情说爱，而且有的学生深陷其中、不能自拔，学习成绩一落千丈。

了解情况后，这位老师又用了走去?囚徒困境?的方法，分别让那些早恋的学生承认并正视自己不当的思想和行为，通过近两个多月地努力，终于拯救了这批早恋的学生，让他们重新回到了正常的学习生活和与同学间的正常交往中来。

4、素质教育：走出迷茫待何时

众所周知，中国传统的文化观念也在其中起着非常重要的作用。望子成龙、望女成凤的观念根深蒂固，很多家长不太关注孩子的全面发展，把眼睛仅盯在了孩子的学习成绩上。而就学校和社会而言，基本上也是以成绩作为衡量学生的一把尺子，这样的尺子既不能对学生进行全面公正的评价，也难免不在学生成长过程中造成人格和心理的扭曲。

推行素质教育存在的误区

在21世纪教育沙龙中，大家对素质教育的几个误区进行了分析。

首先，素质教育是不是要全盘否定应试教育？否定考试？在对应试教育的一片否定声中，有人表达了一种独到的见解：应试教育在鼓励竞争、磨炼意志、选拔人才等方面还是起到了一定积极的作用。也有人认为，在高等教育资源供小于求的情况下，高考制度仍不失为一项公平的选拔手段。21世纪实验学校校长丁浩生就说：?素质教育的提出，绝对不是简单地来对付应试教育。?中央民族大学的一位老教授也说：?应试教育和素质教育并非鱼和熊掌不可兼得。?北京师范大学褚宏启教授分析道，应试教育和素质教育并不是一个非此及彼的关系。实际上一个真正有水平的校长和局长，既能让学生考得好，也能让学生其他素质得到发展。

在素质教育与应试教育这对矛盾面前，经过争论与探讨，大家得出了这样的共识：考试本身并没有错，在现实情况下，考试仍然是选拔人才最公平的手段。只是不应把考试和分数作为唯一追求的教育目标，更不应作为评价学生和教育成效的唯一尺度。

其次，开展素质教育是不是就是让孩子学钢琴、学绘画？针对目前孩子负担越来越重的状况，翔宇教育集团校长卢志文提出了?闲暇教育?的概念，他认为，中国孩子缺少闲暇，缺少属于自己的时间和空间。爱玩是孩子的天性，我们要正确引导，让他们在乐趣中学到知识。许多人都赞叹孩子小小的年纪就?多才多艺?，而恰恰是这种多才多艺，泯灭了他们的天性，让他们失去了创造性，因为这种才艺也许并非是孩子的兴趣所在，往往是家长重压的结果。?做中学?的实践者江苏教研办毛曙阳老师认为，我们在孩子成长的阶段，更应该注意发掘他的兴趣，这样才更有利于创新思维的培养，而不是生硬地去灌输?知识?。

再者，减负的结果怎么变成了增负？有人用博弈论中著名的?囚徒博弈?来形容这种情形：大家都喊着给孩子?减负?，在这种情况下，无论别人是不是真的减负，我继续给孩子补课才是上策，因为素质的提高显然没有分数的提高来得明显。而奉行这条原则的人恰恰占了大多数。尽管也有极少数人是敢于吃螃蟹者，但减负的结果却带来?四面楚歌?，于是，学生的负担非但未减反而越来越重。这种结果与初衷背道而驰的教训提醒了人们，在现行教育体制下的羁绊下，在根深蒂固的传统观念面前，任何改革之举要想完全?离经叛道?并不是一件容易的事情。

循序渐进地推进素质教育。

中国有句古话，一口吃不成个胖子。教育改革同样应该循序渐进，因为它关系到亿万孩

子的前途。

专家认为，我们现在强调素质教育，不是从零开始，不是对以往的全盘否定，而是要去粗取精、去伪存真。原教育部副部长韦钰也说，改革需要时间，它是一个发展的过程，教育问题和就业等许多问题都紧密联系，而就业问题不是一两天就能解决的。她所主导的以培养儿童科学素养为主的?做中学?项目，就是先从幼儿园和小学阶段做起，淡化分数色彩。四川教育学院叶上雄认为，在推行素质教育的过程中，政府担负着最重要的责任，学校和教师是主力军，家长则扮演配角。现在推进素质教育遇到困难，不是要追究谁的责任，首当其冲的是必须明确政府应该发挥的作用。

有人形容教育、医疗和住房已经成为压在人们头上的?三座大山?，而素质教育也许是医治?病态?教育的一剂良药。然而要让这苦口的良药发挥药效，还有很长的路要走。

第二、商业中的囚徒困境现象

暑假，到过常德市商业步行街的人，都会发现有趣的?囚徒困境?现象：七月初，步行街各个服装店，都大肆推出降价广告：有的降价百分之五十到六十，甚至有的降价百分之八十到九十。调查发现：原来，这些商贩担心自己的利益受损，一人降价，风声鹤唳，纷纷降价，打起了价格战。因为商贩想：如果我不降价，我的商品就会严重滞销，我就成了最大的受害者了。就这样价格战硝烟四起、商贩们遍体鳞伤，这些商贩的收益也同比下降。当夏季服装卖出后秋季服装远未旺销时，大部分商贩很长时间无生意可做，结果受益的是广大的消费者。

第三、政治方面的囚徒困境现象

*六方会谈：由「囚徒博弈」到「斗鸡博弈」

第4轮六方会谈签署共同声明后不足24小时，北韩坚持美国先提供轻水核电反应堆「显示诚意」才放弃核计划，评论认为这是「边缘策略(brinksmanship)」，是节外生枝。其实北韩的行为是声明的必然结果，因为声明只为美朝两国的博弈换了场景，并不代表博弈的终结。即使这篇幅所限不能刊登那些(1，0，-1，1)的量化数字，我们依然可以使用博弈论(gametheory)的原理探讨这盘棋局。

「囚徒博弈」的起点

首轮六方会谈举行于2003年8月，背景是美朝双方的极度互不信任。北韩公开承认提炼核元素、退出核不扩散条约，摆明对美国绝不卖帐；美国把北韩归类为邪恶轴心，令它在伊拉克变天后成为高危国家，亦显示了布殊主义的一贯挑衅。双方失去直接沟通的空间，因为金正日担心作出「萨达姆式合作」只会令美国受惠；布殊在不知虚实的情况下，亦有理由担心若不乘伊战余威对北韩「先发制人」，驻韩驻日数万美军将沦为核人质。这个有两大资讯盲点：北韩不知道邻国会否援手，美国不知道北韩真正斤两，都朝最坏方向打算，放弃任何合作的选择。

上述背景，大部分符合博弈论的「囚徒悖论(prisoner dilemma game)」。根据这个悖论，

当两名同党被单独囚禁，都会担心对方招供成为污点证人，累自己成为判囚20年的主犯，所以在两害相权取其轻的「主导策略(dominant strategy)」下各自招供，宁愿一齐成为共犯入狱5年，却不知若双方保持缄默，反而判刑更轻。美朝双方的资讯落差，就是监狱那道墙。布殊和金正日，都是囚徒。

乐观其成的「斗鸡博弈」

六方会谈的主要工作是拆除那道墙，而不是改变客观环境。两者相当不同、也经常引起误解。中国作为主要调停人，角色只是向各方摸清底牌，草拟不同方案让各方接受。假如美朝在六方会谈之前合作能够得到「一篮子」好处，调停后不会变成「两篮子」。会谈最大功能，只是令美朝双方更了解对方的底线，消减资讯落差。六方声明不过敬告世人一声「收到」，没有作出任何人事地物时的具体承诺。拆除那道墙以后，又会怎样？这就是典型的「斗鸡博弈(chicken game)」。

美朝双方现在不再相信共同不合作会带来利益、而且明白这会带来灾难，这和会谈前的格局已经不同。但根据理性计算，他们知道各自的让步只会便宜对方，所以继续坚持「框架下的立场」来谋取最大利益。整份六方声明，实在是让美朝两国自行「斗鸡」的指令。它的第五条最堪玩味：「六方同意根据承诺对承诺、行动对行动原则，采取协调一致步骤，分阶段落实上述共识」。什么是「承诺对承诺、行动对行动」？北韩承诺放弃核计划，美国承诺尊重北韩主权和提供经援，两个承诺的「对」，就是一场斗鸡博弈。究竟是北韩先放弃核计划美国才尊重北韩主权提供援助，还是相反？语焉不详。北韩在谈判后立刻斗鸡，是意料中事。

假如六方会谈在外交以外，制造了新的东亚环境，加强美朝双方放弃对抗的诱因，甚至真的搞出「东北亚合作组织」，那又怎样？这就变成一局「聚合博弈(convergence game)」，两国都相信合作是最好选择，就不会有第五论会谈。

为什么不是「聚合博弈」？

问题是六方会谈另外四方，固然担心美朝「囚徒博弈」拖垮经济制造难民殃及池鱼，但假如两国变成真正合作伙伴，出现强大的大韩民族主义也好、让美国加强在北韩的发言权也好，对其他大国都没有好处。

结果会谈的大赢家不是美朝，而是大有面子的中国。美国攻打伊拉克时，北京不断强调要在联合国框架内解决问题，但这次它能够扮演独特角色，就没有拉出联合国解决北韩问题，否则那样的谈判，倒可能有好事者质问为何没有出现「聚合博弈」。这是近代中国外交代表作，大概也会成为外交史经典，但至于是一本什么样的经，就见仁见智了。

第四、医疗方面的囚徒困境现象

*拿什么告别医患之间的囚徒困境

今年5月28日晚，湖南株洲市第二医院发生一起医患纠纷，因一名患者死亡，值班医生、护士、急诊科护士长遭到患者家属殴打，该事件导致医院门、急诊瘫痪两天。（7月23日《中国青年报》）

据报道，这起事件的网络视频中，死者家属殴打医护人员，在医院门诊大厅搭灵堂，逼迫医生、护士守灵、烧纸。这样的殴打和羞辱，让人简直难以相信。从深圳市某医院的医生和护士戴钢盔上班，到福建南平的医患冲突，再到动不动就耸人听闻的医生被打甚至被杀事件，传递给全国600万医务工作者的，是怎样一种负面暗示。在这样的环境下，很多医生不愿意自己的子女从事医疗工作的现象也就不足为奇。

而作为患者来讲，他们面对的又何尝不是一种恐惧：医疗费用的奇高、医德的滑坡，以及医疗事故的层出不穷带来的不信任情绪。以至于每一个患者走进医院的时候，都会心生忐忑：我会碰到医德差的医生吗？我会出医疗事故吗？我会负担起那高额的看病费用吗？

这样一来，双方都会处于不自觉的恐惧中。医生会担心自己遭到某些患者的殴打、羞辱，为了避免医疗事故的争议，很多医生采取小病?大检查?，以避免漏诊、误诊；一些医生明哲保身，不开没有把握的刀，或在各种治疗方法中选择风险系数较低的?姑息疗法?。这样的选择，能对患者有什么帮助，至于医学进步更是一种奢谈。患者处于恐惧中，自然会格外敏感，会对一些本来正常或很小的医疗问题神经过敏，甚至大打出手。一旦有治疗效果不佳甚至患者死亡的情况发生，往往会爆发更大的矛盾。

某网站曾经做过一次调查，结果所有的患者都抱怨自己在看病过程中受到过不公正待遇，而几乎所有的医生又抱怨自己从事的是最难的职业，压力最大，收入一般。在医患双方的互相抱怨和过度自我保护中，却是医患关系愈加糟糕的困境。很多优秀医生因为不堪忍受压力，告别了这个行当，很多患者，更是宁愿自己买药治病，也不到医院接受诊疗。

在一个双方都对对方感到恐惧的环境中，医学进步和医患关系融洽是不可能的。正如有关专家提出的那样，中国的医患之间，是一种典型的?囚徒困境?。?囚徒困境?的结果，是双方都受损失，而且对对方更加恐惧和反感。

给医生和患者营造一个免于恐惧的环境，是当前改善医患关系最重要的。我们自然寄希望与医生和患者个人素质的提高，医生能恪守?德为医之本?，而患者也能真正尊重医生，但更重要的是，如何通过制度的设计来把握双方的利益平衡点，通过第三方的介入来协调医患的纠纷，从而改善陷入困境的医患关系。

丛林法则；

丛林法则是自然界里生物学方面的物竞天择、适者生存、优胜劣汰、弱肉强食的规律法则。它包括两个方面的基本属性。一是它的自然属性；另一个是它的社会属性。自然属性是受大自然的客观因素影响，不受人性、社会性的因素影响。自然界中的资源有限，只能强者才能获得最多。它体现在植物界方面。丛林法则的社会属性一般体现在动物界。人作为高等动物，他在生产力、科学技术发达的时候，特别是现代，人类利用自己的主观意志，改变了许多丛林法则的自然属性，改变为以人的意志为主的客观事实。例如：人能改变植物、动物的物种，生存条件、环境，也可以决定它们的生死状况，人为地改变了丛林法则的自然属性，这就是丛林法则的社会属性。

人也可以改变人类的生产、生活、生存条件以及环境、生死存活状况等。用马列主义毛泽东思想的辩证唯物主义观点来判别，阶级斗争是决定的因素。而阶级和阶级斗争是由世界观来决定的。

编辑本段术语简介

弱肉强食，优胜劣汰

一棵伟岸的大树，长在丛林中。它的顶端极力向上，以寻求最多的阳光雨露；它粗大的的枝干尽可能地占领着空间，以呼吸最新鲜的空气；它的根系极尽繁茂，以汲取大地最多的精华。然而，在大树旁边，几棵瘦弱的小树却在生存的边缘挣扎，它们枝干细脆，叶片已接近枯黄。

小树愤怒地盯着大树：?你已经足够强大，为什么还要限制我的生长？?大树漠然地看了它一眼，冷淡地说：?对于我来说，你的生长永远是个威胁，这就是丛林法则，弱肉强食是它最典型的特征。?

自然界中存在丛林法则是必然的。因为，整个自然界的生存资源在总数上是有限的，为了生存和繁衍后代，自然就会出现有我没你、有你没我的竞争，实力不够的生物只好被淘汰，成为生物链上上一级生物口中餐。俗话?大鱼吃小鱼，小鱼吃虾米，虾米吃淤泥?就是对这一现象最通俗的描述。

弱肉强食——动物界的丛林法则

春风将一棵草籽刮落在大树下，没几天，这棵种子就从泥土的缝隙中伸出幼嫩的小脸，羞涩地轻摇着身姿，张望着庞大的世界。一滴又一滴露水从大树的枝干上滴下，滋养着正在蓬勃生长的小草。草儿抬起头：?大树先生，谢谢您的帮助！??哈哈哈哈……?大树浑厚的笑声在丛林中回荡：?别客气，丛林的法则似乎互相帮助的。你只管放心地长吧，不管发生什么事，我会尽我的一切力量帮助你的。?小草感动得流出了眼泪。它一次次地长高，一次次的倒下，终于长成一片嫩绿如茵的草坪。见此情景，一直没有作声的小树不解的问：?你疯了吗？为什么那么卖力地生长？?小草回答说：?我不能辜负大树先生的希望。?小树嗤之以鼻，摇头冷笑：?它很吝啬，你看他把我挤成这样，我都要无立足之地了。??但为什么，它会这样如此不同地对我？??因为你的存在不仅不会对它构成威胁，还会养护它脚下的土地，使它生存的土壤变得肥沃。? 丛林中，不仅仅只有血肉模糊的弱肉强食，互利互惠也是丛林法则的重要组成，和其他生物合作未尝不是一个明智的选择。鱼类和鸡类的群居可以壮声势，以避免出现被强者全体消灭的惨境；一只狼面对更强大的对手或许势单力薄，而一群狼则天下无敌，谁也惹不起。可见，互利互惠的目的是为了获得更多、更好的资源，是为了达到一种共赢的局面。

夜晚下了一场暴雨。第二天，太阳升起的时候，风住雨停了。大家惊讶的发现，大树的树干被折断了，庞大的身躯凌乱地躺在地上，而它旁边的小树却安然无恙地站在那儿。大树奇怪地问小树：?这么大的风你怎么会没事？我如此强大都不能幸免遇难，而弱小的你却能逃过一劫。?小树说：?正是你的高大招致了你的毁灭，难道你忘了‘树大招风’、‘木秀于林风必摧之’的古训了吗？?

这也是丛林法则，丛林中的强弱位臵不可能永远不变。你只有抓住一切机会，磨练意志，锻炼身体，才能在竞争中获胜。

丛林法则是一个社会学政治学概念，指的是在法治不健全的社会，专制生活，人际关系个人和组织关系都遵循弱肉强食的规则，武力成为决定命运、决定生死存亡的决定性力量。

编辑本段观点评价

正面观点

物竞天择适者生存，不能适应环境，就只能被环境淘汰。

实力弱小的时候，采取结盟不失为一种策略。

同类竞争，异类共赢。

强弱是可以逆转的，所以时刻要有危机意识。

反面观点

但是也有人认为丛林法则不是完全适用于人类社会，因为毕竟人类社会不同于无序竞争的原始丛林，人类社会是智慧生物构成。在人类社会发展过程中，随着文明程度的不断提高，人与人之间不会一直停留在弱肉强食状态，强权就是真理在人类社会是行不通的，即使暂时存在也是不能长久的，因为人类不同于低等生物，人类强者或者弱者也都是暂时性状态，人与人之间也应该是平等的，每个人都有权享有天赋的人权。

丛林法则只是人类社会的所谓强者们以及甘愿被欺凌的弱者们用来欺骗自身的说法，这种说法可能会欺骗多数人，也可能长时间的欺骗少数人，但不可能永远欺骗所有人。

而人类在自然界，作为食物链顶端的智慧生命，更加不可以完全遵照丛林法则，因为从地球生态上来看如果完全按照丛林法则发展行事，那么人类为了自身的发展可以无

海盗分金子智力题

海盗分金币： 5个海盗抢得100枚金币后，讨论如何进行公正分配。他们商定的分配原则是：（1）抽签确定各人的分配顺序号码（1，2，3，4，5）；（2）由抽到1号签的海盗提出分配方案，然后5人进行表决，如果方案得到超过半数的人同意，就按照他的方案进行分配，否则就将1号扔进大海喂鲨鱼；（3）如果1号被扔进大海，则由2号提出分配方案，然后由剩余的4人进行表决，当且仅当超过半数的人同意时，才会按照他的提案进行分配，否则也将被扔入大海；（4）依此类推。这里假设每一个海盗都是绝顶聪明而理性，他们都能够进行严密的逻辑推理，并能很理智的判断自身的得失，即能够在保住性命的前提下得到最多的金币。同时还假设每一轮表决后的结果都能顺利得到执行，那么抽到1号的海盗应该提出怎样的分配方案才能使自己既不被扔进海里，又可以得到更多的金币呢？解题思路1：首先从5号海盗开始，因为他是最安全的，没有被扔下大海的风险，因此他的策略也最为简单，即最好前面的人全都死光光，那么他就可以独得这100枚金币了。接下来看4号，他的生存机会完全取决于前面还有人存活着，因为如果1号到3号的海盗全都喂了鲨鱼，那么在只剩4号与5号的情况下，不管4号提出怎样的分配方案，5号一定都会投反对票来让4号去喂鲨鱼，以独吞全部的金币。哪怕4号为了保命而讨好5号，提出（0，100）这样的方案让5号独占金币，但是5号还有可能觉得留着4号有危险，而投票反对以让其喂鲨鱼。因此理性的4号是不应该冒这样的风险，把存活的希望寄托在5号的随机选择上的，他惟有支持3号才能绝对保证自身的性命。再来看3号，他经过上述的逻辑推理之后，就会提出（100，0，0）这样的分配方案，因为他知道4号哪怕一无所获，也还是会无条件的支持他而投赞成票的，那么再加上自己的1票就可以使他稳获这100金币了。但是，2号也经过推理得知了3号的分配方案，那么他就会提出（98，0，1，1）的方案。因为这个方案相对于3号的分配方案，4号和5号至少可以获得1枚金币，理性的4号和5号自然会觉得此方案对他们来说更有利而支持2号，不希望2号出局而由3号来进行分配。这样，2号就可以屁颠屁颠的拿走98枚金币了。不幸的是，1号海盗更不是省油的灯，经过一番推理之后也洞悉了2号的分配方案。他将采取的策略是放弃2号，而给3号1枚金币，同时给4号或5号2枚金币，即提出（97，0，1，2，0）或（97，0，1，0，2）的分配方案。由于1号的分配方案对于3号与4号或5号来说，相比2号的方案可以获得更多的利益，那么他们将会投票支持1号，再加上1号自身的1票，97枚金币就可轻松落入1号的腰包了。

经典推理题目：海盗分金问题

有10个强盗a~j，得到100个金币，决定分掉，分法怪异：首先a提出分法，b~j表决，如果不过半数同意，就砍掉a的头。然后由b来分，c~j表决，如果不过半数同意，就砍掉b 的头。依次类推，如果假设强盗都足够聪明，在不被砍掉头的同时获得最多的金币。问：最后结果如何（精确结果）。分析与解答所有的海盗都乐于看到他们的一位同伙被扔进海里，不过，如果让他们选择的话，他们还是宁可得到一笔现金。他们当然也不愿意自己被扔到海里。所有的海盗都是有理性的，而且知道其他的海盗也是有理性的。此外，没有两名海盗是同等厉害的——这些海盗按照完全由上到下的等级排好了座次，并且每个人都清楚自己和其他所有人的等级。这些金块不能再分，也不允许几名海盗共有金块，因为任何海盗都不相信他的同伙会遵守关于共享金块的安排。这是一伙每个人都只为自己打算的海盗。最凶的一名海盗应当提出什么样的分配方案才能使他获得最多的金子呢？为方便起见，我们按照这些海盗的怯懦程度来给他们编号。最怯懦的海盗为1号海盗，次怯懦的海盗为2号海盗，依次类推。这样最厉害的海盗就应当得到最大的编号，而方案的提出就将倒过来从上至下地进行。分析所有这类策略游戏的奥妙就在于应当从结尾出发倒推回去。游戏结束时，你容易知道何种决策有利而何种决策不利。确定了这一点后，你就可以把它用到倒数第2次决策上，依次类推。如果从游戏的开头出发进行分析，那是走不了多远的。其原因在于，所有的战略决策都是要确定：“如果我这样做，那么下一个人会怎样做？” 因此，在你以下海盗所做的决定对你来说是重要的，而在你之前的海盗所做的决定并不重要，因为你反正对这些决定也无能为力了。记住了这一点，就可以知道我们的出发点应当是游戏进行到只剩两名海盗，即1号和2号的时候。这时最厉害的海盗是2号，而他的最佳分配方案是一目了然的：100块金子全归他一人所有，1号海盗什么也得不到。由于他自己肯定为这个方案投赞成票，这样就占了总数的50%，因此方案获得通过。现在加上3号海盗。1号海盗知道，如果3号的方案被否决，那么最后将只剩2个海盗，而1号将肯定一无所获。此外，3号也明白1号了解这一形势。因此，只要3号的分配方案给1号一点甜头使他不至于空手而归，那么不论3号提出什么样的分配方案，1号都将投赞成票。因此，3号需要分出尽可能少的一点金子来贿赂1号海盗，这样就有了下面的分配方案：3号海盗分得99块金子，2号海盗一无所获，1号海盗得1块金子。 4号海盗的策略也差不多。他需要有50%的支持票，因此同3号一样也需再找一人做同党。他可以给同党的最低贿赂是1块金子，而他可以用这块金子来收买2号海盗。因为如果4号被否决而3号得以通过，则2号将一块也得不到。因此，4号的分配方案应是：99块金子归自己，3号一块也得不到，2号得1块金子，1号也是一块也得不到。 5号海盗的策略稍有不同。他需要收买另两名海盗，因此至少得用2块金子来贿赂，才能使自己的方案得到采纳。他的分配方案应该是：98块金子归自己，1块金子给3号，1块金子给1号。这一分析过程可以照着上述思路继续进行下去。每个分配方案都是惟一确定的，它可以使提出该方案的海盗获得尽可能多的金子，同时又保证该方案肯定能通过。照这一模式进行下去，10号海盗提出的方案将是96块金子归他所有，其他编号为偶数的海盗各得1块金子，而编号为奇数的海盗则什么也得不到。这就解决了10名海盗的分配难题。

海盗分金博弈

海盗分金博弈关键词：海盗分金；利益最大化；喂鲨鱼一、问题提出 1假设： 5个海盗抢得100枚金币后，讨论如何进行公正分配。他们商定的分配原则是：（1）抽签确定各人的分配顺序号码（5，4，3，2，1）；（2）由抽到5号签的海盗提出分配方案，然后5人进行表决，如果方案得到半数或半数以上的人同意，就按照他的方案进行分配，否则就将5号扔进大海喂鲨鱼；（3）如果5号被扔进大海，则由4号提出分配方案，然后由剩余的4人进行表决，只有当达到半数的人同意时，才会按照他的提案进行分配，否则也将被扔入大海；（4）依此类推。 2条件：（1）每个海盗都是很聪明的人，都能很理智的判断得失，从而做出选择；（2）海盗之间不会相互串谋；（3）海盗在自己的收益最大化的前提下乐意看到其他海盗被扔入大海喂鲨鱼。（因为其他海盗被扔入大海喂鲨鱼符合每个海盗的最大化利益。） 3问题：第一个海盗提出怎样的分配方案才能够使自己的收益最大化？二、问题解法（0，100，0，0，0）0） 0，1，0，98）利用逆推法：（1）假设5、4、3号已被扔入海中，则2号的方案为0、100，2号自己支持这个方案就满足半数或半数以上的人同意的条件，所以这个方案必定能通过；（2）3号的方案必为1、0、99，1号在这个方案能得到1个金币比2号的方案0个金币要好，所以1号会同意这个方案，不管给多少金币给2号，2号都不可能支持这个方案，因为如果3号死了，2号会得到100金币，所以1、3号支持，超过半数，这个方案必定能通过；（3）4号的方案必为0、1、0、99，因为只要半数人同意，方案就会通过，4号只要给

2号1个金币，2号就会同意，方案也就能通过，而若要1号同意，至少要给1号2个金币，要3号同意则要100个金币，都不符合利益最大化；（4）5号的方案必为1、0、1、0、98，这个方案要至少3人同意才能通过，所以除5号自己外，还要有2人同意，在4号的方案中1号和3号一个金币也得不到，故只要各给他们1个金币他们就会同意，而若要2号同意则需2个金币，要4号同意则需100金币，根据利益最大化要求，给1号和3号各1个金币，而给2号和4号0个金币。故答案是：1、0、1、0、98。三、问题扩展现在假设是N个海盗分M个金币，其他条件不变，则N号海盗应该提出怎样的分配方案？（1）当2≤N≤2M+2时，从上述解法推知，2k号的海盗分给号码是小于2k的偶数号的海盗1个金币，自己拿剩余的M-k+1个金币，其他人0个，显然这里k=1,2,3,…,M+1; 2k+1号的海盗分给号码是小于2k+1的奇数的海盗1个金币，自己拿剩余的M-k个金币，其他人0个，显然这里k=1,2,3,…,M。所以就有2≤N≤2M+2时， N=2k (k=1,2,3,…,M+1)，N号海盗提出的方案应为（0,1,0,1,…, 0, M-k+1）； N=2k+1 (k=1,2,3,…,M)，N号海盗提出的方案应为（1,0,1,0,…, 1,0, M-k）。（2）当N＞2M+2时，就会发现金币不够分，再用上面的方法就不行了。 N=2M+3时，需要M+2个人同意才满足半数或半数以上的人同意的条件，前2M+2个人中号码是奇数的海盗有M+1个，现在只有M个金币，故只有分到金币的M个人会同意，再加上他自己，共有M+1个人同意，少于半数，所以他会被扔进大海里喂鲨鱼； N=2M+4时，需要M+2个人同意才满足半数或半数以上的人同意的条件，前2M+2个人中号码是奇数的海盗有M+1个，现在只有M个金币，故只有分到金币的M个人会同意，2M+3号也一定会同意（不同意的话，就轮到他做决策，他一定会被扔进大海里喂鲨鱼），再加上他自己，共有M+2个人同意，刚好半数，他的方案是（1,0,1,0,…, 1,0,0,0,1,…, 1,0, 1,0, 0,0），即给从前M+1个号码是奇数的海盗中任取M个给1个金币，其他人给0个； N=2M+5时，需要M+3个人同意才满足半数或半数以上的人同意的条件，只要给2M+4号方案中得益是0的人1个金币，他们就会同意（当然也可以给得1个金币的人多于1个金币，但这不符合利益最大化条件），还有就是不能确定前2M+2个人中号码是奇数的海盗中哪一个得0个金币，故这一个也应该剔除，所以应该从前2M+2个人中号码是偶数的海盗（M+1个），2M+3，2M+4号海盗中（即2M+4号方案中得益一定是0的人，共M+3个）任选M个给1个金币，其他得0个，加上自己共M+1个同意，故2M+5号海盗会被扔进大海里喂鲨鱼； N=2M+6时，需要M+3个人同意才满足半数或半数以上的人同意的条件，只要给2M+4号方案中得益一定是0的人1个金币，他们就会同意，所以应该从M+3个海盗中任选M个给1个金币，其他得0个，2M+5号一定会同意，加上自己共M+2个同意，故2M+6号海盗也会被扔进大海里喂鲨鱼； N=2M+7时，需要M+4个人同意才满足半数或半数以上的人同意的条件，只要给2M+4号方案中得益一定是0的人1个金币，他们就会同意，所以应该从M+3个海盗中任选M个给1个金币，其他得0个，2M+5、2M+6号一定会同意，加上自己共M+3个同意，故2M+7号海盗还是会被扔进大海里喂鲨鱼； N=2M+8时，需要M+4个人同意才满足半数或半数以上的人同意的条件，只要给2M+4号方案中得益一定是0的人1个金币，他们就会同意，所以应该从M+3个海盗中任选M个给1个金币，其他得0个，2M+5、2M+6、2M+7号一定会同意，加上自己共M+4个同意，

史上最强高难度智力题(带完整答案版)

1、海盗分金问题传说，从前有五个海盗抢得了100枚金币.他们通过了一个如何确定选用谁的分配方案的安排.即： 1.抽签决定各人的号码（1，2，3，4，5）； 2.先由1号提出分配方案，然后5个人表决.当且仅当超过半数人同意时，方案才算被通过，否则他将被扔入大海喂鲨鱼； 3.当1号死后，再由2号提方案，4个人表决，当且仅当超过半数同意时，方案才算通过，否则2号同样将被扔入大海喂鲨鱼； 4.往下依次类推…… 根据上面的这个故事，现在提出如下的一个问题.即：我们假定每个海盗都是很聪明的人，并且都能够很理智地判断自己的得失，从而做出最佳的选择，那么第一个海盗应当提出怎样的分配方案才能够使自己不被扔入大海喂鲨鱼，而且收益还能达到最大化呢？ 2、帽子问题（疯狗问题与此同理）一群人开舞会，每人头上都戴着一顶帽子。帽子只有黑白两种，黑的至少有一顶。每个人都能看到其他人帽子的颜色，却不知自己的。主持人先让大家看看别人头上戴的什么帽子，然后关灯，如果有人认为自己戴的是黑帽子，就打自己一个耳光。第一次关灯，没有声音。于是再开灯，大家再看一遍，关灯时仍然鸦雀无声。一直到第三次关灯，才有劈劈啪啪打耳光的声音响起。问有多少人戴着黑帽子？参考：

3、称球问题一共12个一样的小球，其中只有一个重量与其它不一样(未知轻重)，给你一个天平，只称三次，找出那个不同重量的球？如果一共13个一样的小球，其中只有一个重量与其它不一样(未知轻重)，给你一个天平，只称三次，找出那个不同重量的球？参考： 4、分金条问题你让某些人为你工作了七天，你要用一根金条作为报酬。这根金条要被分成七块。你必须在每天的活干完后交给他们一块。如果你只能将这根金条切割两次，你怎样给这些工人分？ 5、猴子搬香蕉问题一个小猴子边上有100根香蕉，它要走过50米才能到家，每次它最多搬50根香蕉，每走1米就要吃掉一根，请问它最多能把多少根香蕉搬到家里参考：

海盗分金问题总结

海盗分金题目： 5名海盗抢得了窖藏的100块金子，并打算瓜分这些战利品。这是一些讲民主的海盗（当然是他们自己特有的民主），他们的习惯是按下面的方式进行分配：最厉害的一名海盗提出分配方案，然后所有的海盗（包括提出方案者本人）就此方案进行表决。如果50%或更多的海盗赞同此方案，此方案就获得通过并据此分配战利品。否则提出方案的海盗将被扔到海里，然后下一名最厉害的海盗又重复上述过程。所有的海盗都乐于看到他们的一位同伙被扔进海里，不过，如果让他们选择的话，他们还是宁可得一笔现金。他们当然也不愿意自己被扔到海里。所有的海盗都是有理性的，而且知道其他的海盗也是有理性的。此外，没有两名海盗是同等厉害的——这些海盗按照完全由上到下的等级排好了座次，并且每个人都清楚自己和其他所有人的等级。这些金块不能再分，也不允许几名海盗共有金块，因为任何海盗都不相信他的同伙会遵守关于共享金块的安排。这是一伙每人都只为自己打算的海盗。最凶的一名海盗应当提出什么样的分配方案才能使他获得最多的金子呢？一、经济学上的“海盗分金”模型经济学上有个“海盗分金”模型，是说5个海盗抢得100枚金币，他们按抽签的顺序依次提方案：首先由1号提出分配方案，然后5人表决，超过半数同意方案才被通过，否则他将被扔入大海喂鲨鱼，依此类推。假定“每人海盗都是绝顶聪明且很理智”，那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化？” 推理过程是这样的：从后向前推，如果1至3号强盗都喂了鲨鱼，只剩4号和5号的话，5号一定投反对票让4号喂鲨鱼，以独吞全部金币。所以，4号惟有支持3号才能保命。 3号知道这一点，就会提出“100，0，0”的分配方案，对4号、5号一毛不拔而将全部金币归为已有，因为他知道4号一无所获但还是会投赞成票，再加上自己一票，他的方案即可通过。不过，2号推知3号的方案，就会提出“98，0，1，1”的方案，即放弃3号，而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利，他们将支持他而不希望他出局而由3号来分配。这样，2号将拿走98枚金币。同样，2号的方案也会被1号所洞悉，1号并将提出（97，0，1，2，0）或（97，0，1，0，2）的方案，即放弃2号，而给3号一枚金币，同时给4号（或5号）2枚金币。由于1号的这一方案对于3号和4号（或5号）来说，相比2号分配时更优，他们将投1号的赞成票，再加上1号自己的票，1号的方案可获通过，97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了！答案是：1号强盗分给3号1枚金币，分给4号或5号强盗2枚，自己独得97枚。分配方案可写成（97，0，1，2，0）或（97，0，1，0，2）。 “海盗分金”其实是一个高度简化和抽象的模型，体现了博弈的思想。在“海盗分金”模型中，

海盗分金币问题

有五个海盗，在海上抢来了一百颗钻石，每一颗都价值连城。五个海盗都很贪婪，他们都希望自己能分得最多的钻石，但同时又都很明智。于是他们按照抽签的方法，排出一个次序。首先由抽到一号签的海盗说出一套分钻石的方案，如果5 个人中有50％以上（不含50％）的人同意，那么便依照这个方案执行，否则的话，这个提出方案的人将被扔到海里喂鱼，接下来再由抽到二号签的海盗继续说出一套方案，然后依次类推到第五个。前提是五个海盗都很聪明。游戏规则就是这样残酷，现在问题出来了：如果你是抽到一号签的海盗，你计划提出一套什么样的方案，在保住小命的前提下，分得最多的钻石？答案: 要回答这个问题，一般人肯定会想到，1号必须先让另外两个人同意，所以，他可以自己得到32颗，而给2号3号各34颗。但只要仔细想想，就会发现不可能， 2号和3号有积极性让1号死，以便自己得到更多。所以，1号无奈之下，可能只有自己得0，而给2和3各50颗。但事实证明，这种做法依然不可行。为什么呢？因为我们要先看4号和5号的反应才行。很显然，如果最后只剩下4和5，这无论4提出怎样的方案，5号都会坚决反对。即使4号提出自己要0，而把100颗钻石都给5，5也不会答应――因为5号愿意看到4号死掉。这样，5号最后顺利得到100颗钻石——因此，4的方案绝对无法获得半数以上通过，如果轮到4号分配，4号只有死，只有死！由此可见，4号绝对不会允许自己来分。他注定是一个弱者中的弱者，他必须同意3号的任何方案！或者1号2号的合理方案。可见，如果1号2号死掉了，轮到3号分，3号可以说：我自己100颗，4号5号0颗，同意的请举手！这时候，4号为了不死，只好举手，而5号暴跳如雷地反对，但是没有用。因为3个人里面有2个人同意啊，通过率66.7％，大于50％！由此可见，当轮到3号分配的时候，他自己100颗，4和5都是0。因此，4和5不会允许轮到3来分。如果2号能够给4和5一些利益，他们是会同意的。比如2的分配方案是：98，0，1，1，那么，3的反对无效。4和5都能得到1，比3号来分配的时候只能得到0要好得多，所以他们不得不同意。由此看来，2号的最大利益是98。1号要收买2号，是不可能的。在这种情况下，1号可以给4号和5号每人2颗，自己收买他们。这样，2号和3号反对是无效的。因此，1号的一种分配方案是：96，0，0，2，2。

博弈模型建立

博弈论期末测评姓名：游龙城专业：土木工程班级：104 学号：1008070417 任课老师：胡鸣时间：2011 12 28

1：博弈模型的建立 “海盗分赃”模型 5个海盗抢到100颗宝石，在如何分赃的问题上争吵不休。于是他们决定：（1）抽签决定个人的号码[1，2，3，4，5]。（2）由1号提出分配方案。然后5人表决，如果方案超过半数同意就被通过，否则就把1号丢入大海。（3）1号死后，由2号提出分配方案。然后4人表决，当且仅当超过半数同意时方案通过，否则就把2号丢入大海。（4）以此类推，直到找到一个大多数人能接受的方案。如果只剩下5号，他一人获得全部宝石。现在假定每个强盗都是足够理智能判断得失的“理性人”。为了避免不必要的争执，我们还假定每个方案都能顺利表决并按照约定规则执行。那么，如果你是第一个海盗，你该如何提出分配方案使自己的利益最大化？ 2: 三要素，博弈方，支付函数，博弈分析和结果，均衡结果，博弈结果，博弈结果的效率分析。严酷的分配规则给人的第一印象是：如果我抽到了1号，那将是一件十分不幸的事。因为作为第一个提出分配方案的人，能活下去的机会微乎其微。即使1颗宝石都不要，全部都给其余4人，分配方案也有可能被大家反对，只有死路一条。如果你也这样想，那么答案会大大出乎你的意料：1号海盗留给3号1颗宝石，留给5号2颗宝石，自己独得97颗。分配方案可以写成[97，0，1，0，2]。只要你没有被吓倒，不妨站在剩下4人的角度分析：显然，5号是最不合作的，因为他没有死亡的威胁，从直觉上说，每扔下一个对手他就离获得全部宝石更近一步。4号正好相反，他的生存机会完全取决于前面有人活着，因此4号值得争取。3号对前面2位的命运完全不在乎，因为轮到他提出方案时，他只需要得到4号的支持再加上自己一票即可通过。那么2号呢？他需要得到3票才能活命......

智力题100道

头脑风暴--世界500强经典智力题 3 第二部分题目：智力题1(海盗分金币)——海盗分金币 5个海盗抢得100枚金币后，讨论如何进行公正分配。他们商定的分配原则是：（1）抽签确定各人的分配顺序号码（1，2，3，4，5）；（2）由抽到1号签的海盗提出分配方案，然后5人进行表决，如果方案得到超过半数的人同意，就按照他的方案进行分配，否则就将1号扔进大海喂鲨鱼；（3）如果1号被扔进大海，则由2号提出分配方案，然后由剩余的4人进行表决，当且仅当超过半数的人同意时，才会按照他的提案进行分配，否则也将被扔入大海；（4）依此类推。这里假设每一个海盗都是绝顶聪明而理性，他们都能够进行严密的逻辑推理，并能很理智的判断自身的得失，即能够在保住性命的前提下得到最多的金币。同时还假设每一轮表决后的结果都能顺利得到执行，那么抽到1号的海盗应该提出怎样的分配方案才能使自己既不被扔进海里，又可以得到更多的金币呢智力题2(猜牌问题) S 先生、P先生、Q先生他们知道桌子的抽屉里有16张扑克牌：红桃A、Q、4 黑桃J、8、4、2、7、3 草花K、Q、5、4、6 方块A、5。约翰教授从这16张牌中挑出一张牌来，并把这张牌的点数告诉P先生，把这张牌的花色告诉Q先生。这时，约翰教授问P先生和Q 先生：你们能从已知的点数或花色中推知这张牌是什么牌吗于是，S先生听到如下的对话：P 先生：我不知道这张牌。 Q先生：我知道你不知道这张牌。P先生：现在我知道这张牌了。 Q先生：我也知道了。听罢以上的对话，S先生想了一想之后，就正确地推出这张牌是什么牌。请问：这张牌是什么牌智力题3(燃绳问题) 烧一根不均匀的绳，从头烧到尾总共需要1个小时。现在有若干条材质相同的绳子，问如何用烧绳的方法来计时一个小时十五分钟呢智力题4(乒乓球问题) 假设排列着100个乒乓球，由两个人轮流拿球装入口袋，能拿到第100个乒乓球的人为胜利者。条件是：每次拿球者至少要拿1个，但最多不能超过5个，问：如果你是最先拿球的人，你该拿几个以后怎么拿就能保证你能得到第100个乒乓球智力题5(喝汽水问题) 1元钱一瓶汽水，喝完后两个空瓶换一瓶汽水，问：你有20元钱，最多可以喝到几瓶汽水智力题6(分割金条) 你让工人为你工作7天，给工人的回报是一根金条。金条平分成相连的7段，你必须在每天结束时给他们一段金条，如果只许你两次把金条弄断，你如何给你的工人付费头脑风暴--世界500强经典智力题 4 智力题7(鬼谷考徒) 孙膑，庞涓都是鬼谷子的徒弟；一天鬼出了这道题目：他从2到99中选出两个不同的整数，把积告诉孙，把和告诉庞。庞说：我虽然不能确定这两个数是什么，但是我肯定你也不知道这两个数是什么。孙说：我本来的确不知道，但是听你这么一说，我现在能够确定这两个数字了。庞说：既然你这

博弈论中的几个经典问题

几个博弈论中的经典问题博弈论（Game Theory），亦名“对策论”、“赛局理论”，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。几个重要的概念 1、策略(strategies)：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。 2、得失(payoffs)：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。 3、次序（orders）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。 4、博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a，那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。

海盗博弈论

海盗博弈论 Charlesgao发表于2011-06-09 17:39:44 海盗分金是一个非常古老的问题，在1999年《科学美国人》正式把它发表之前，已经至少流行10年了，相信很多人都有所耳闻，也知道解法。此前死理性派也对这个问题也有所涉及。今天我们就来回顾一下这个有意思的问题，并且在把问题推广到大规模海盗团伙后，会得出一些非常有意思的结论。分金的规则有五个非常聪明的海盗，他们都是死理性派，编号分别是P1、P2、P3、P4、P5。他们一同抢夺了100个金币，现在需要想办法分配这些金币。海盗们有严格的等级制度：P1

现在，假如你是等级最高的P5，你会做何选择？直觉上，为了保住自己的生命，你可能会选择留给自己很少的金币，以便让大家同意自己的决策。然而，结果和此大相径庭。解决这个问题的关键在于换个思维方向。与其苦思冥想你要做什么决策，不如先想想最后剩下的人会做什么决策。假设现在只剩下P1和P2了，P2会做什么决策？很明显，他将把100金币留给自己，然后投自己一票。由于在票数相同的情况下提议人有决定权，无论P1同不同意，P2都能毫无危险地将所有金币收入囊中。现在再把P3考虑进来。P1知道，如果P3被扔下海，那么游戏就会出现上述的情况，自己终将一无所获。由于他们都很聪明，P3同样能看到这一点，所以他知道，只要给P1一点点利益，P1就会投票支持他的决策。所以P3最终的决策应该是：( P3,P2,P1 ) → ( 99,0,1 ) P4的策略也类似：由于他需要50%的支持率，所以他只需贿赂1个金币给P2就可以了。P2一定会支持他(否则轮到P3做决策，他就一无所获啦)。所以P4最终的决策是： ( P4,P3,P2,P1 ) → ( 99,0,1,0 ) P5的情况稍有不同：由于这次一共有5个人，他至少需要贿赂两个海盗才能使自己的决议通过。所以决策就是：( P5,P4,P3,P2,P1 ) → ( 98,0,1,0,1 ) 这个结果是不是很出乎意料？你不但可以保全自己，还能得到绝大部分的利益！其实这里面蕴含着递归的思想，它是解决许多问题(如汉诺塔问题，全排列问题，整数划分问题等)的有利手段。好了，看到这里，想必你一定在感慨：哎，还是做上司(等级高)好啊！且慢！问题还没有结束。如果有更多的海盗真实情况下海盗的数目肯定不止5个。继续按照这个逻辑推理，P6的决策将是： ( P6,P5,P4,P3,P2,P1 ) → ( 98,0,1,0,1,0 ) 一直到P200，它会给自己留1个金币，同时给剩下所有偶数编号的海盗1个金币。如果海盗数是201个，那么P201该怎么做呢？他好像没有足够的钱去贿赂别的海盗了。不过，为了保住自己的性命，他可以把自己手中的金币全分出去，即给每个奇数编号的海盗(P1~P199)一个金币。这样虽然空手而归，但不至于人财两空。如果海盗数是202个，P202也只能把这100个金币全部贿赂给其他100个海盗，而这100个海盗必须是在P201做决策时什么也得不到的海盗。由于符合这样条件的海盗有101个(所有偶数编号的海盗+P201)，P202的决策不再是唯一的！有101种方案供他选择。可怜的是P203，由于人数众多，他实在没有足够的钱去贿赂其他海盗以获得足够的支持(他至少还需要获得101个人的支持，但只有100个金币)。所以，不论P203做什么决策，他都难逃被扔出船外的厄运了。不过P203并没有我们想象中的那么悲剧，除非船上正好有且只有203个海盗。不妨再来看增加一个海盗P204的情况。P204明白，P203现在的唯一愿望就是活下来…不论他做什么决策，P203都会举双手支持他(当然举多少手都只能算一

海盗分金

海盗分金——博弈论的故事1 （一）海盗分金 5名海盗分100枚金币。规则是大家抽签分出1—5号，并按顺序提方案。1号首先提方案，5人表决，当超半数同意时有效；否则1号将被抛入大海。然后，2号提方案，4人表决，评判方式同上。以此类推。假定每个人都很聪明，1号提出什么方案，能使自己收益最大？答案是：（97、0、1、0、2 ）或（97、0、1、2、0）。推理：假定1—3号都抛入大海，那末4号也活不了，所以，4号必须保住3号。据此，3号可提方案（100、0、0）。2号推知3号方案，可提出（98、0、1、1）方案，来拉拢4号和5号。1号推知2号方案，可推出上述方案，拉拢住3号，以及4号或5号中的1人。（二）博弈论与博弈类型博弈（Game），本是游戏、竞赛的意思。所要解决的核心问题是：参与博弈的其他人员会怎么做？我应采取怎样的对策来取得最佳效果？博弈的例子到处可见：讨价还价、划拳、小孩猜拳、下棋、打牌，以及“三十六计”、“田忌赛马”等。博弈论作为一种理论，最先是由美国经济学家冯·诺伊曼在1937年提出来的，他与经济学家奥斯卡·摩根斯坦于1944年合著的《博弈论与经济行为》公认为博弈论诞生的标志。今天，博弈论已为数学的一个较为完善的分支，并在许多领域被运用。在经济学领域的影响被称为“现代经济学的一次大的革命”。博弈类型： 1.静态博弈与动态博弈。前者指参与者同时行动、同时出牌或亮招，如招标、考试等；后者指参与者的行动有先后次序，如下棋、战争、商业竞争等。 2.完全信息博弈与不完全信息博弈。前者指参与者互相都“知己知彼”，否则就是后者。 3.零和博弈与非零和博弈。前者指“你赢的就是我输的”，如打麻将、下棋等；后者指大家的得失总和不为零，如势均力敌的战争会使两败俱伤，而商业合作会使“双赢”。 4.合作博弈与非合作博弈。在非零和博弈中，分为这两种。前者指博弈双方可都获利，如价格联盟；后者指博弈结果会对双方都不利。（三）规则不同导致结果不同 1.公共选择中的悖论。在政府生产公共物品时，要通过公共选择进行决策，但此时会出现矛盾的推论。如有三个人选择三种方案a、b和c，他们的偏好如1参见麦栋：《强盗如何分金？》，海南省，《大科技》，2003.07 。

博弈论中的几个经典问题精编版

博弈论中的几个经典问题集团企业公司编码：（LL3698-KKI1269-TM2483-LUI12689-ITT289-

3、次序（orders）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。 4、博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。 5、纳什均衡(NashEquilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B 也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因

海盗分宝石问题

精心整理 5海盗分宝石问题 5个海盗抢到了100颗宝石，每一颗都一样的大小和价值。他们决定这么分： 1。抽签决定自己的号码（1，2，3，4，5） 2鱼。 34 第一个海盗提出怎样的分配方案才能够使自己的收益最大化? 标准答案： 1号海盗分给3号1颗宝石，4号或5号海盗2颗，独得97颗。分配方案为：97，0，1，2，0或97，0，1，0，2。

Charlesgao?发表于?2011-06-0917:39 海盗分金是一个非常古老的问题，在1999年《科学美国人》正式把它发表之前，已经至少流行10年了，相信很多人都有所耳闻，也知道解法。此前死理性派也对这个问题也有所?涉及?。今天我们就来 P2、P3、等级的海盗再提出新的分配方案。海盗们基于三个因素来做决定。首先，要能留在船上存活下来。其次，要使自己的利益最大化(即得到最多的金币)。最后，在所有其他条件相同的情况下，优先选择把别人扔出船外（这是因为每个海盗都想夺占这条船的控制权）。

现在，假如你是等级最高的P5，你会做何选择？直觉上，为了保住自己的生命，你可能会选择留给自己很少的金币，以便让大家同意自己的决策。然而，结果和此大相径庭。解决这个问题的关键在于换个思维方向。与其苦思冥想你要做什么 P1和P2 P1 同样P41个 P5的情况稍有不同：由于这次一共有5个人，他至少需要贿赂两个海盗才能使自己的决议通过。所以决策就是：(P5,P4,P3,P2,P1)→(98,0,1,0,1)

这个结果是不是很出乎意料？你不但可以保全自己，还能得到绝大部分的利益！其实这里面蕴含着递归的思想，它是解决许多问题(如汉诺塔问题，全排列问题，整数划分问题等)的有利手段。好了，看到这里，想必你一定在感慨：哎，还是做上司(等级高)好啊！且慢！问题还没有结束。 P6 海盗 100个海盗，而这100个海盗必须是在P201做决策时什么也得不到的海盗。由于符合这样条件的海盗有101个(所有偶数编号的海盗+P201)，P202的决策不再是唯一的！有101种方案供他选择。可怜的是P203，由于人数众多，他实在没有足够的钱去贿赂其他海盗以获得足够的支持(他至少还需要获得101个人的支持，但只有

博弈论浅谈

博弈论浅谈 2015年6月15日 ***学院

摘要通过半个学期对博弈论这门课的学习，我对博弈论有了自己初步的看法，并且能运用其简单的去分析一些事情。我觉得这是我学习博弈论所获得的最大收获。当今社会是一个激烈竞争的社会，是一个各方利益明争暗斗和各方势力此消彼长的社会。面对错综复杂的社会关系和日益功利的社会环境，如何在不对等情况和不公平背景下以弱制强，以少胜多是我们必须深思的问题。那么，如何在面对各种对自己不利的博弈中胜出呢？我想多少了解一点博弈论对自己是有好处的。博弈是智慧的较量，互为攻守却又相互制约。有人的地方就有竞争，有竞争的地方就有博弈。人生充满博弈，若想在现代社会做一个有成就，就必须懂得博弈的运用。在博弈论中，有以下几种博弈：囚徒困境（引申出来的有“旅行者困境”）、纳什均衡、智猪博弈、猎鹿博弈、酒吧博弈、枪手博弈、警察与小偷博弈、斗鸡博弈、协和博弈、海盗分金博弈、讨价还价博弈和路径依赖博弈等。如果我们可以将博弈论的原理和规则运用到自己的人生实践中，那么面对问题并可做出理性选择，一定程度上避免盲目行动。关键词：博弈论囚徒困境智猪博弈公路飙车博弈

目录摘要 .................................................................................................................................... II 目录 ................................................................................................................................... I II 一.对博弈论的理解 (1) 二．几个模型 (3) 1.囚徒困境 (3) 2. 智猪博弈 (4) 3.公路飙车博弈 (4) 三．总结 (6) 参考文献 (7)

博弈论之二：海盗分金

博弈论之二：海盗分金人跟人之间，国家跟国家之间，都要进行博弈，为了增加自己的利益，保护国家的安全，就要动脑经，捉摸对方的想法，“知己知彼，百战不殆”。博弈论是经济学的新工具，可以帮助我们在生活中识别对手，赢得先机。之所以说它是一种新的分析问题的工具，是因为过去的经济学，都是基于简单的环境：人与人之间、企业之间不存在相互的影响。我怎么做，对你不发生影响，你不必考虑我怎么做，同时，我也不用考虑你的反应，大家是“井水不犯河水”。这显然是有局限的，这个世界是一个整体，谁也离不开谁。人与人之间，国家之间是相互影响的。如果美元贬值，对其他国家肯定室友影响的，是否让美元贬值，美国要顾及其他国家的反映。下棋是博弈，你如何走下一步，要考虑到它对对手的影响，也要考虑到对手如何反击，以及这话总反击对你造成的影响；对手怎么下，也要看你如何走，并且考虑到他的反应对你的影响。影响是相互的，这是博弈论解决问题的环境。我们用著名的“海盗分金”的例子，继续讲述博弈论。故事是这样的:有五个海盗，在海上抢劫了100两金子，他们要分配抢来的金子，办法是“民主”的,盗亦有道。为了保证每个海盗的利益，分金规则如下。首先，抓阄，每个阄上有一个数字：1，2，3，4，5，表示的是

接下来的次序。然后，按照上面决定的次序，每个人有权提出一个分配方案，抓到1号阄的人先提议。然后是抓到2，3，4，5号阄的人提议，最后就是大家表决。任何一个人，如果他提出分配方案，得到一半以上人同意，就按照他的方案分配金子；如果不能获得一半以上人的同意，这个人就要被杀掉，由下一个人再提出方案，再表决。以此类推。我们的假设是，每个海盗都追求自己的利益极大化。两利相权取其重，两害相权取其轻。保命肯定是第一考虑，经量避免被杀掉；在此基础上，肯定是自己得到的金子越多越好。当然，我们也要假定，海盗们非常自觉，任何时候都会遵守规则，绝不会破坏规则。我们的问题是：如果你是抓到第1号阄的海盗，你的分金方案是什么？一定要仔细想，否则就没命了。有人说，全部要了，100两金子全归别人。这样的方案，不管能不能被通过，都不符合每个人追求利益最大化的假设，你还没想，就说不要了，作为海盗，你也不够资格，不够心黑。也有人说，平均分配，这也是很多人的想法。还有很多方法，大家都是自己少要点，被别人更多的想法，这些想法，都是要保命，凭直觉，捕捞绿自己的利益，匆忙作出的稀里糊涂的决策。这个问题应该怎么考虑呢？姚勇博弈论的方法，先考虑别的海盗是怎么想的，然后再决定自己怎么做。

文档之家

海盗分金 囚徒困境 丛林法则