囚徒困境
- 格式:docx
- 大小:16.54 KB
- 文档页数:5
囚徒困境一、定义囚徒困境(Prisoner'sDilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。
两个共谋犯罪的人被关入监狱,不能互相沟通情况。
如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确凿,二者都判刑八年。
由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。
最终导致纳什均衡仅落在非合作点上的博弈模型。
二、理论起源囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。
警察知道两人有罪,但缺乏足够的证据。
警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。
于是,每个囚徒都面临两种选择:坦白或抵赖。
然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。
结果,两个嫌疑犯都选择坦白,各判刑八年。
如果两人都抵赖,各判一年,显然这个结果好。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性-聪明的人类会因自己的聪明而作茧自缚,或者损害集体的利益。
三、主要内容单次多重单次和多次的囚徒困境,结果不会一样。
囚徒困境(英语:Prisoner's Dilemma)是一种应用广泛的数学博弈模型,用于描述两个囚犯因为共同犯罪而被分开审讯的情况。
在这个模型中,每个囚犯都有两个选择:坦白罪行或保持沉默。
然而,无论另一个囚犯如何选择,每个囚犯都有动机选择坦白,因为坦白可以获得更轻的刑罚。
然而,如果两个囚犯都选择坦白,他们都将获得比如果他们都保持沉默更重的刑罚。
这个困境的根源在于个体理性与集体理性的冲突,即每个囚犯都追求自身利益的最大化,但结果却不是最优的集体结果。
希望以上内容对你有帮助,可以查阅数学博弈论相关书籍获取更多信息。
囚徒困境经济学原理引言:囚徒困境是博弈论中一个经典的问题,也是经济学中的重要原理之一。
囚徒困境的情境是两个囚徒被捕后被分开审讯,检方没有足够的证据定罪,但却希望能定罪并判刑。
如果两个囚徒都保持沉默,则检方只能以轻罪定罪。
然而,如果其中一个囚徒选择合作并供出另一个囚徒,那么供出者将获得免罪的机会,而被供出者将面临重刑。
如果两个囚徒都选择供出对方,则两人都将面临有限的刑期。
囚徒困境问题展示了个人理性行为在博弈过程中可能导致的不利结果,对经济学有着重要的启示意义。
1.囚徒困境的基本情景囚徒困境的基本情景是两个囚徒在被捕后被审讯,他们面临着个人决策的困难。
在这个情境中,囚徒可以选择合作或背叛对方。
合作意味着保持沉默,而背叛意味着供出对方。
囚徒的决策将决定他们的命运,而他们并不知道对方的选择。
在这种情况下,囚徒需要权衡自己的利益和对方的选择来做出决策。
2.囚徒困境的策略和收益在囚徒困境中,每个囚徒都有两种策略可选择:合作或背叛。
合作的收益是较低的刑期,而背叛的收益是免罪。
然而,如果两个囚徒都选择背叛,那么他们都将面临较长的刑期。
因此,囚徒困境的最佳策略是背叛,因为无论对方选择什么,背叛都能获得更好的结果。
3.囚徒困境的启示意义囚徒困境问题揭示了个人理性行为可能导致不利结果的情况。
尽管合作对于整体利益是最好的选择,但个人追求自身利益往往会导致困境的产生。
囚徒困境的启示意义在于,个体之间的合作需要建立在互信和合作机制的基础上,才能避免困境的发生。
4.囚徒困境与经济学的关系囚徒困境经济学原理在经济学领域有着广泛的应用。
例如,在市场竞争中,企业可能面临类似的囚徒困境。
如果所有企业都选择合作并遵守竞争规则,市场将保持公平竞争的状态。
然而,如果有企业选择背叛并采取不正当手段获取竞争优势,其他企业也会被迫采取同样的策略,从而导致整个市场的恶性竞争。
囚徒困境经济学原理提醒我们,建立公平竞争的机制和规则对于市场的稳定和发展至关重要。
简述囚徒困境及其结论
囚徒困境是一个经典的博弈论案例,描述了两个囚犯被捕后被关进两个单独的牢房,无法通过通信相互帮助或寻求逃脱机会。
他们必须选择自己的行为,要么合作,要么互相背叛,以最大化自己的收益。
囚徒困境的假设是:两个人的行为都是理性的,不会考虑到道德或法律的因素;两个人的利益是一致的,他们背叛对方会导致自己受到更严厉的惩罚;他们无法找到第三方来帮助或合作。
在囚徒困境中,两个囚犯的最优策略是合作,这意味着他们应该将对方供出,从而各自获得一次逃脱的机会。
然而,如果他们选择合作,那么他们就必须同时供出对方,这将导致他们一起被判刑。
因此,两个囚犯都选择背叛,并各自获得了更高的收益,即逃脱了惩罚。
囚徒困境的结论是,在极端的情况下,两个人的行为取决于他们的理性和利益一致性,而不考虑道德或法律的因素。
在这种情况下,合作或背叛都是最优策略,但无法找到第三方来协助或合作。
囚徒困境的案例表明,在复杂的社会中,人们的行为往往受到理性和利益因素的影响,而不考虑道德和法律的因素。
这也提醒我们在决策时需要考虑多个因素,并做出理性的判断。
囚徒困境名词解释囚徒困境是博弈论中的一个经典问题,用于描述两个个体在没有沟通或合作的情况下所面临的困境。
在这个问题中,两个囚徒被同时关押在不同的牢房中,警方缺乏足够的证据定罪,只能以较轻的罪名判刑,但如果其中一个供认自己的罪行,而另一个保持沉默,则供认者可以得到更轻的刑期,而另一个将会受到较重的惩罚;如果两人都供认,则两人都将受到一定的惩罚。
在这种情况下,囚徒可能会因为不信任对方而都选择供认自己的罪行,导致两人都受到惩罚,这就构成了囚徒困境。
囚徒困境揭示了个体在面临利益冲突时的困境和悖论。
虽然对于两个囚徒来说,最优的结果是两人都保持沉默,使得两人都能够得到较轻的判罪,但由于彼此之间缺乏合作和沟通的机会,彼此不信任的情况下,个体往往会做出不合理的选择。
囚徒困境不仅在刑事案例中有应用,也存在于许多其他领域,如商业竞争、环境保护和国际关系等。
在商业竞争中,企业可能会陷入囚徒困境,各自选择采取激烈竞争、降低价格等策略,短期内可能会获得一定利益,但最终可能导致整个市场竞争趋于恶性循环。
在环境保护中,各个国家可能都面临着类似的困境,各国都在追求经济发展,但如果各国都不采取措施来减少环境污染,最终可能导致整个地球环境的破坏。
在国际关系中,大国之间的博弈也常常落入囚徒困境,彼此不信任,在不明确对方意图的情况下可能持有敌对态度,最终可能导致冲突的升级。
为了解决囚徒困境带来的问题,学者们提出了一系列的解决方案,如合作博弈、迭代博弈、契约博弈等。
合作博弈强调通过合作和沟通使得双方能够达成共赢的结果;迭代博弈则通过重复多次囚徒困境的游戏,让个体能够建立起彼此的信任和合作;契约博弈通过建立契约和规则来约束个体的行为,保证双方都能得到一定的利益。
囚徒困境作为博弈论中的一个经典问题,不仅在理论研究中产生了重要的影响,也在实际场景中得到了广泛的应用和启示。
它向我们揭示了在缺乏合作和沟通的情况下,个体常常会被自身利益所限制,从而导致最终结果并不是最优的。
囚徒困境名词解释
1、囚徒困境是指两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会频繁出现类似情况。
2、在这个博弈中,参与者必须反复地选择他们彼此相关的策略,并且记住他们以前的对抗。
阿克塞尔罗德邀请全世界的学术同行来设计计算机策略,并在一个重复囚徒困境竞赛中互相竞争。
参赛的程序的差异广泛地存在于这些方面,算法的复杂性、最初的对抗、宽恕的能力等等。
阿克塞尔罗德发现,当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后,从利己的角度来判断,最终“贪婪”策略趋向于减少,而比较“利他”策略更多地被采用。
他用这个博弈来说明,通过自然选择,一种利他行为的机制可能从最初纯粹的自私机制进化而来。
3、囚徒困境的条件:
①友善
最重要的条件是策略必须“友善”,这就是说,不要在对手背叛之前先背叛。
几乎所有的高分策略都是友善的。
因此,完全自私的策略仅仅出于自私的原因,也永远不会首先打击其对手。
②报复
但是,阿克斯洛德主张,成功的策略必须不是一个盲目乐观者。
要始终报复。
一个非报复策略的例子是始终合作。
这是一个非常糟糕的选择,因为“下流”策略将残酷地剥削这样的傻瓜。
③宽恕
成功策略的另一个品质是必须要宽恕。
虽然它们不报复,但是如果对手不继续背叛,它们会一再退却到合作。
这停止了报复和反报复的长期进行,最大化了得分点数。
总结囚徒困境什么是囚徒困境?囚徒困境(Prisoner’s Dilemma)是博弈论中的一个经典问题。
它描述了两个囚犯被困在同一个牢房,被指控共同犯下了一起罪行。
检察官分别与两名囚犯进行单独的审讯,并给出以下两个选择:1.合作:囚犯们不相互揭发,共同保持沉默。
2.背叛:囚犯们可以选择揭发对方,以换取自己的自由。
囚犯们无法沟通,也不知道对方选择了什么。
如果两人都选择合作,则每个人都会被判轻刑。
但如果其中一人选择背叛而另一人选择合作,则背叛者将会被判轻刑,而合作者将面临重刑。
如果两人都选择背叛,则每个人都会被判处较重的刑罚。
囚徒困境的特征囚徒困境有以下几个特征:1.互动性:囚犯的选择会相互影响,彼此的行为会对对方产生影响。
2.博弈论性质:囚徒困境可以用博弈论的方式进行分析,确定最佳策略。
3.利益最大化:每个囚犯都希望通过选择能够获得最大利益。
4.缺乏合作:由于囚犯无法沟通且不能相信对方,他们往往倾向于选择背叛。
囚徒困境的应用囚徒困境不仅仅是一个理论问题,它在现实生活中也有广泛的应用。
1.经济学:囚徒困境可以用来分析市场竞争中的合作与背叛的策略。
企业在价格战中的选择、合作与联盟等都与囚徒困境有关。
2.政治学:囚徒困境可以解释国际关系中的合作与冲突。
国家间的合作与背叛,如军备竞赛和防务合作等,都可以用囚徒困境来解释。
3.社会学:囚徒困境可以研究社会交往中的合作与背叛。
合作与背叛的选择在社会伦理、互助关系、信任建立等领域都有重要意义。
4.生态学:囚徒困境可以分析生态系统中的合作与竞争。
例如,在资源有限的情况下,个体的自利选择往往导致整体利益的损失。
解决囚徒困境的策略囚徒困境中,最理性的策略就是背叛对方,因为无论对方选择合作还是背叛,背叛者都能够获得更好的结果。
然而,背叛对方最终会导致双方都无法获得最优解。
为了克服囚徒困境,可以通过以下几种策略:1.长期合作:如果双方能够建立长期的合作关系,增加彼此之间的信任和依赖,就有可能避免囚徒困境的恶性循环。
第1篇一、引言囚徒困境是博弈论中一个著名的例子,它描述了两个理性个体在信息不完全的情况下,如何做出决策以最大化自己的利益。
在法律经济学领域,囚徒困境被广泛用来分析个体在法律规制下的行为选择。
本文将以一个具体的案例分析囚徒困境在法律经济学中的应用,探讨法律如何影响个体行为以及如何通过制度设计来优化社会资源配置。
二、案例分析1. 案例背景某市有两家相邻的工厂,分别生产有毒化学品。
由于环保法规的限制,两家工厂都必须采取措施减少污染物排放。
然而,由于信息不对称,两家工厂无法确切知道对方的具体排放情况。
在这种情况下,两家工厂面临着囚徒困境。
2. 个体决策(1)工厂A的决策工厂A考虑到如果工厂B遵守环保法规,而自己不遵守,将会面临高额的罚款。
因此,工厂A有动机选择不遵守法规。
但如果工厂B也不遵守法规,那么工厂A的罚款可能会降低。
在这种情况下,工厂A的理性选择是不遵守法规。
(2)工厂B的决策工厂B的决策过程与工厂A类似。
如果工厂A遵守环保法规,而工厂B不遵守,那么工厂B将面临高额罚款。
但如果工厂A也不遵守法规,那么工厂B的罚款可能会降低。
因此,工厂B的理性选择同样是不遵守法规。
3. 囚徒困境结果在囚徒困境中,两家工厂都选择了不遵守环保法规。
这种情况下,两家工厂都面临着罚款,但总体罚款金额比两家工厂都遵守法规时要低。
然而,这种结果并非最优,因为如果两家工厂都遵守法规,不仅罚款金额会降低,而且对环境的影响也会减少。
三、法律经济学分析1. 法律规制对囚徒困境的影响在法律经济学中,法律规制被视为一种外部干预,旨在影响个体的行为。
在本案例中,环保法规可以被视为一种法律规制。
通过分析囚徒困境,我们可以发现:(1)法律规制可以降低囚徒困境发生的概率。
在本案例中,如果环保法规更加严格,工厂A和工厂B选择遵守法规的可能性将增加。
(2)法律规制可以降低囚徒困境的结果。
在本案例中,如果环保法规对违反规定的罚款金额更高,那么两家工厂选择遵守法规的可能性将更大。
囚徒困境理论囚徒困境是博弈论中一种经典问题,其理论对于研究合作与竞争的冲突具有重要意义。
本文将介绍囚徒困境理论的背景、问题描述以及可能的解决方案。
一、背景介绍囚徒困境理论最早由美国数学家A·W·塔克在1950年提出,后来由加拿大数学家梅尔文·邓纳姆发展完善。
它从博弈论的角度探讨了个体与整体之间的合作与竞争的问题。
囚徒困境是指在某些情况下,个体追求自身利益最大化会导致整体利益的减小,而合作对于整体利益的最大化是有利的。
二、囚徒困境的问题描述囚徒困境的典型情景是这样的:两名嫌疑犯被警方抓获,被控犯有一起抢劫案。
警察将两人分开审讯,没有足够的证据定罪,但如果两人都认罪,警方将对两人定罪,每人判5年监禁。
如果只有一个人认罪,而另一个人不认罪,认罪的人将被判10年监禁,不认罪的人将被判1年监禁。
两人都不认罪,警方只能以非法拘禁的罪名对两人各判刑3年。
这个问题给了每个嫌疑犯两个选择:合作或背叛。
合作即都不认罪,背叛即只有一个人认罪。
根据每个人的利益最大化原则,认罪是一个利于个体的选择,因为无论对方合作与否,认罪都能使自己的刑期缩短。
三、囚徒困境的解决方案囚徒困境的解决方案中,最为经典的是“互相背叛”的结果。
因为无论对方如何,背叛都能使个体的利益最大化。
在现实生活中,这种结果带来了相互不信任及合作无序的后果。
然而,有许多研究者在囚徒困境的研究中寻求寻找其他的解决方案。
其中最有名的是“互相合作”的策略。
这种策略的核心是建立信任,通过共同合作来达到整体利益的最大化。
如果嫌疑犯们能够相互合作,拒绝认罪,那么他们都可以只被判3年监禁,从而使得整体利益得到最大化。
这需要在囚徒困境中,个体放弃短期利益,选择合作,以求获得更大的长期回报。
四、囚徒困境理论的应用囚徒困境理论被广泛应用于多个领域,例如经济学、国际关系、生物学等。
在经济学中,囚徒困境理论被用来解释市场中的合作与竞争。
在国际关系中,它被应用于研究不同国家之间的合作与冲突。
囚徒困境的破解方法囚徒困境是博弈论中的一个经典问题,描述了两个囚犯被捕后面临的选择。
如果两个囚犯都选择沉默,则他们都会被判处较轻的刑罚;如果其中一个人选择交待,而另一个人选择沉默,那么交待的人将获得豁免,而沉默的人将被判处重刑;如果两个人都选择交待,那么他们都将被判处较重的刑罚。
在这个困境中,个人的最佳选择是交待,但是如果两个人都这样选择,结果将是最糟糕的。
那么,面对这样的困境,我们应该如何破解呢?以下是一些方法:1. 合作是关键。
在囚徒困境中,最佳的结果是两个囚犯都选择沉默。
因此,合作是破解困境的关键。
在现实生活中,无论是在个人关系还是商业合作中,合作都是最有效的方式。
通过合作,双方可以共同谋求最大化的利益,避免陷入困境。
2. 建立信任。
建立信任是破解困境的基础。
在囚徒困境中,囚犯之间缺乏信任,导致了最糟糕的结果。
在现实生活中,建立信任可以减少误解和猜疑,促进双方的合作,从而避免陷入困境。
3. 寻求第三方的帮助。
在囚徒困境中,如果有第三方介入并提供合作的机会,那么囚犯们就有可能避免最糟糕的结果。
在现实生活中,当双方陷入困境时,可以寻求第三方的帮助,寻求解决问题的方法,避免陷入僵局。
4. 思考长远利益。
在囚徒困境中,囚犯们往往只考虑眼前的利益,而忽视了长远的影响。
在现实生活中,我们应该学会思考长远利益,考虑合作对双方的长期利益,而不是仅仅满足眼前的利益。
5. 寻求双赢的解决方案。
在囚徒困境中,最糟糕的结果是双方都选择交待,导致双方都受到伤害。
在现实生活中,我们应该寻求双赢的解决方案,通过合作和妥协,实现双方的利益最大化,避免陷入困境。
总之,囚徒困境是一个经典的博弈论问题,但在现实生活中,我们也经常面临类似的困境。
通过合作、建立信任、寻求第三方帮助、思考长远利益以及寻求双赢的解决方案,我们可以破解困境,避免陷入僵局,实现最大化的利益。
希望以上方法能够帮助您更好地应对困境,实现成功和发展。
囚徒困境的名词解释囚徒困境是一种经济学中的概念,源自于博弈论。
它描述了在特定条件下,两个个体或组织在缺少有效沟通和合作机制的情况下,往往会做出会对彼此双方都不利的决策,从而导致双方都无法达到最优的结果。
囚徒困境常常被用来分析各种社会和经济问题,帮助我们理解和解决与合作、决策和博弈相关的困难。
在囚徒困境中,通常有两个囚徒被控犯有同样的罪行,警方将他们分开审问,并提供了一定的证据来定罪。
如果两个囚徒都沉默不交代,根据证据,警方只能以较轻的罪名定罪并判处较短的刑期;如果一个囚徒交代,而另一个囚徒保持沉默,那么交代的囚徒将因合作而获得从刑期较短的好处,而保持沉默的囚徒将遭受更严厉的审判和长时间的刑期;如果两个囚徒都交代,警方将根据证据定罪并判处中等刑期。
囚徒困境的关键是,无论一个囚徒如何选择,他都无法控制另一个囚徒的决策,从而导致最终结果可能不利于双方。
囚徒困境是一个精彩的博弈图景,因为它揭示了自私行为的局限性。
在理性选择的前提下,每个囚徒都会认为如果对方选择交代,自己选择交代是最好的策略。
这基于囚徒的思考,即使对方选择沉默,自己选择交代可以获得较轻的刑期。
但是,如果两个囚徒都选择交代,结果将是最糟糕的,因为他们将一起承受更重的责任和惩罚。
由于缺乏沟通和合作机制,即使双方都知道合作是最优的选择,他们仍然可能因为互相的不信任而无法达成一致。
囚徒困境的研究有助于理解各种社会和经济问题,并提供了一些解决方案。
其中一个解决方案是建立信任和进行合作,即通过建立沟通渠道和制定共同的规则,使得参与者能够共同追求最优化的结果。
这需要各方愿意放弃短期个人利益,以实现长期整体利益的最大化。
例如,在商业领域,通过设立良好的监管机制和合同约束,企业可以减少不信任和欺诈行为,从而实现有效的合作。
在政府层面,通过建立法律和规章制度来约束行为,减少欺诈和不合作行为,促进社会的发展。
此外,囚徒困境的研究还指导了许多策略和行为的选择。
例如,透明度和信任的建立可以帮助各方更好地理解对方的意图和行为,在决策过程中更加理性和合作。
经济学囚徒困境名词解释经济学囚徒困境是一种经济学概念,用于描述当个体追求个人最佳利益时,最终导致整体利益的下降的现象。
它来源于博弈论的一个典型例子,两个囚犯面临合作和背叛的选择,他们的决策将决定自己的审判结果。
经济学囚徒困境的基本情景是这样的:假设有两个囚犯A和B,被怀疑共同参与了一起犯罪活动。
检察官将两人分别关押起来,并告诉他们能够提供证据以减轻刑罚。
然而,如果其中一个人选择坦白供认犯罪,而另一个人保持沉默,那个坦白供认的囚犯将获得减刑,另一个将面临重刑。
如果两人都选择坦白供认,则都将被判处一定刑期。
如果他们都选择保持沉默,则可能会因证据不足而被判获轻刑。
在这种情况下,每个囚犯的最佳选择是坦白供认犯罪。
因为无论对方选择怎样,坦白供认总能保证所面对的刑罚最小化。
然而,如果两人同时坦白供认,他们最终都将遭受相对较重的刑罚,而如果两人都选择保持沉默,则都可能因证据不足而受到轻刑。
这个例子清楚地展示了经济学囚徒困境的核心问题:即使每个个体追求自己的最佳利益,他们最终也无法达到整体最佳结果。
每个囚犯都希望对方保持沉默,以便自己选择坦白供认能获得减刑,但他们无法得到对方的明确承诺。
在缺乏互信的情况下,囚犯们更倾向于选择坦白供认,导致整体结果变得不利。
经济学囚徒困境也可以应用于现实生活中的各种情境,例如环境保护、竞争策略和国际关系。
在环境保护方面,个体可以选择过度开发资源,以争取个人经济利益。
然而,如果每个个体都这样选择,最终所有人都将受到环境恶化的影响。
在竞争策略中,公司可以通过采取破坏性竞争方式来获取市场份额,但如果每个公司都这样做,整个市场将变得不稳定。
在国际关系中,国家也可能面临类似的困境,当他们追求一种自私的政策时,可能会导致整体利益的下降。
为了解决经济学囚徒困境,合作和建立互信是关键。
如果囚犯A和B能够进行合作,并在互信的基础上达成协议,他们可能会决定都保持沉默,以保证双方都能获得较轻刑罚。
同样地,通过建立机制来促使个体在追求自身利益的同时也考虑到整体利益,可以缓解环境保护和竞争策略方面的困境。
囚徒困境囚徒困境(Prisoner's dilemma)--为什么甚至在合作对双方都有利时,保持合作也是困难的囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克(Albert tucker)1950年提出来的。
他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最着名的案例。
故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
经典的囚徒困境1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:甲沉默(合作) 甲认罪(背叛)乙沉默(合作) 二人同服刑半年甲即时获释;乙服刑10年乙认罪(背叛) 甲服刑10年;乙即时获释二人同服刑2年如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势策略”,理性的参与者绝不会选择。
另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。
以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。
但根据以上假设,二人均为理性的个人,且只追求自己个人利益。
均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。
这就是“困境”所在。
例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
竞争在我们生活中常见的不外乎三种结局:第一种:动态输——赢关系,即以牺牲一方的情感或者利益为代价换取了另一方的胜利。
强的爬出去,弱的在下面被垫底---所以很多都是清除叛徒因为对组织的伤害确实很大,重点是清除叛徒与动摇分子不坚定分子第二种:纳什均衡点输——输关系,即两败俱伤,很显然本故事中的螃蟹就是这种情况-----竹篓里的螃蟹:不管能不能爬出来,至少把别人踩在脚底下就行了,自然选择的结果同质化竞争其实就是自残独木桥就是谁也别爬出去大家一块儿死文革时候很多人是不是怕被批斗,才争着去斗别人唉,恶毒可怕的导向第三种:帕累托最优赢——赢关系,而要做到这一点,必须要彼此信任,学会合作,也就是只有合作才能共同爬出篓子,达到双赢。
(囚徒博弈)人为选择的结果抢夺规则权阳关道囚徒困境(Prisoner's dilemma)--为什么甚至在合作对双方都有利时,保持合作也是困难的囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克(Albert tucker)1950年提出来的。
他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最着名的案例。
故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
沈雅涵怪老头2014-4-8 10:08:20经典的囚徒困境1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:甲沉默(合作) 甲认罪(背叛)乙沉默(合作) 二人同服刑半年甲即时获释;乙服刑10年乙认罪(背叛) 甲服刑10年;乙即时获释二人同服刑2年如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势策略”,理性的参与者绝不会选择。
另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。
以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。
但根据以上假设,二人均为理性的个人,且只追求自己个人利益。
均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。
这就是“困境”所在。
例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
竞争在我们生活中常见的不外乎三种结局:第一种:动态输——赢关系,即以牺牲一方的情感或者利益为代价换取了另一方的胜利。
强的爬出去,弱的在下面被垫底---所以很多都是清除叛徒因为对组织的伤害确实很大,重点是清除叛徒与动摇分子不坚定分子第二种:纳什均衡点输——输关系,即两败俱伤,很显然本故事中的螃蟹就是这种情况-----竹篓里的螃蟹:不管能不能爬出来,至少把别人踩在脚底下就行了,自然选择的结果同质化竞争其实就是自残独木桥就是谁也别爬出去大家一块儿死文革时候很多人是不是怕被批斗,才争着去斗别人唉,恶毒可怕的导向第三种:帕累托最优赢——赢关系,而要做到这一点,必须要彼此信任,学会合作,也就是只有合作才能共同爬出篓子,达到双赢。
(囚徒博弈)人为选择的结果抢夺规则权阳关道普京说的真好!南京死三十万除了是鬼子太残暴,还有就是是国人太聪明要知道去杀三十万只猪或狗,一不小心还会弄个工伤事故、感染死亡什么的,难道三十万南京人真的是猪狗不如?一个台湾老兵、南京大屠杀的幸存者回忆那段历史时写道:我们可能永远不懂五个日本鬼子就可以押着两千人去屠杀!两千人,像猪一样任凭五个人屠杀,多么可怕的事情啊!虽然那五个日本兵有枪,也有刀,但是那两千人并没有被捆着,完全可以动手反抗。
可是他们没有,据某个幸存者口述,他曾经怂恿其他人一起冲上去,可惜回应他的除了沉默,还是沉默。
因为大家都是聪明人,他们明白虽然两千人肯拼命肯定能赢,但是第一个冲上去的肯定会死,所以他们聪明地独善其身,把希望寄托在有其他人第一个冲上去。
可惜的是,大家都是聪明人,没有蠢材,所以他们就只能像猪一样任凭屠杀。
虽然每一个人都是聪明人,但是聚在一起却只是一群聪明的猪而已!生物价值观要求人努力获取最大的利益以维持生存、延续基因,这是理性人假设得以成立的基础人与人之间的关系是经过多次博弈才能看出来的这个多次博弈就是检验品就是说你选择的合作对象首先你必须熟悉,对她的性格一目了然。
这个熟悉的过程就是经验品,比如我看了一下我周围的人,几乎没有可以合作的认。
唯一一个可以合作的他有一个外号傻子,人家直呼其名傻子很多的家庭模式在穷的时候是双赢模式一旦赚钱了就是双输或者是输赢模式穷的时候比较齐心啊一心赚钱有钱了有人想继续赚钱有人却感觉赚钱累。
举个例子我们两个人合作去抢劫然后抢来分。