囚徒困境博弈的行为博弈均衡分析
- 格式:doc
- 大小:42.50 KB
- 文档页数:2
囚徒困境和博弈论二十九、囚徒困境现代的博弈理论,最为人熟知要数纳什(John Nash)的经典故事"囚徒的困境"。
故事是这样的:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证指控对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,对方将判监十年。
若二人都沉默(相关术语称互相"合作"),则二人同样判监一年。
若二人都互相检举(互相"背叛"),则二人同样判监五年。
囚徒困境的故事有一个前提,就是假定每个参与者(即"囚徒")都是利己的,即都寻求最大的自身利益,而不关心另一参与者的利益。
那么,在本例中,囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够完全相信对方的决定。
从个人利益角度出发来选择,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默,背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的思考都会得出相同的结论--选择背叛。
背叛是双方经过理性思考得出的最佳选择。
因此,这场博弈中唯一的结果就是双方参与者都背叛对方,结果二人同样服刑五年。
这种策略就叫做纳什均衡。
1994年,纳什因这一理论获得了诺贝尔经济学奖。
这场博弈的纳什均衡,虽然是个体从各自利益最大化的角度经过仔细衡量得出的结果,然而以整体利益而言,却不是最好的选择。
如果两个参与者都合作保持沉默,两人都只会被判刑一年,无论是个体利益还是整体利益,都要高于基于自私前提下的理性选择。
个体出于自私的角度考虑,却得出并不是最有利于自己的结果,这就是"困境"所在。
浅析博弈中的囚徒困境班级:姓名:学号:摘要:囚徒困境是博弈论的非零和博弈中具代表性的例子,个人最佳选择并非团体最佳选择,个人理性有时会导致集体的非理性——机关算尽却因而作茧自缚,这就是囚徒困境所反映的问题。
一经典的囚徒困境“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
两个共谋犯罪的人被关入监狱,不能互相沟通情况。
如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人隐瞒,则揭发者因为立功而立即获释,隐瞒者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑三年。
从集体上看,他们应当互相合作,都隐瞒,这样总服刑时间最短(为2年)。
但他们会仔细考虑对方可能采取什么样的选择,并从自身利益出发做出选择。
他们会意识到,如果同伙隐瞒而自己背叛,就能使自身利益最大化(0年)。
但他也意识到,他的同伙也不傻,也会这样来设想,这样的话,他就更不可能让同伙得利(服刑0年)而自己受害(服刑5年)所以结论就是,唯一正确的选择就是背叛同伙,把一切都告诉警方,如果他的同伙保持隐瞒,那么他就会是那个获释出狱,服刑0年。
而如果他的同伙也向警方交代了,那么,他只需服刑3年而不是5年。
所以结果只能是两个囚犯都坐牢服刑3年,而不是都服刑1年。
所以对于他们个人来说都是理性的,然而对集体来说却是非理性的。
二重复多次如果囚徒困境的情况重复多次,会有什么新的变化?假设重复10次。
我们可以合理地设想,如果囚徒第一次被对方指控,第二次这个囚徒也会指控对方。
相反,如果第一次相反,如果第一次别人保持隐瞒,建立了互信的关系,你也会保持隐瞒,导致最优。
当然,两个囚徒都会有相似的想法,在第一局保持隐瞒,以期望建立互信关系,所以双方都会保持隐瞒。
盘点博弈论&纳什均衡&囚徒困境&零和博弈&智猪博弈1.博弈论是什么博弈论(game theory),又译为对策论,或者赛局理论,经济学的一个分支,1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》,标志着现代系统博弈理论的的初步形成,因此他被称为“博弈论之父”。
博弈论被认为是20世纪经济学最伟大的成果之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
主要研究公式化了的激励结构(游戏或者博弈)间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
具有竞争或对抗性质的行为称为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
比如日常生活中的下棋,打牌等。
博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
2.纳什均衡(Nash equilibrium)3.囚徒困境(Prisoner’s Dilemma)纳什平衡的经典例子就是囚徒困境。
囚徒困境(Prisoner’s Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
1950年,由就职于兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问艾伯特·塔克以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
囚徒困境的均衡辨析郭洪伟【摘要】传统的《博弈论》分析最终结果是两个囚徒均会坦白,但这并不是两个囚徒的最好结局,如何才能达到最好结局?本文从《博弈论》动中“理性人”的假设出发,对传统的(坦白,坦白)均衡提出质疑.本文指出理性人不会满足于传统的均衡,理性人会积极寻找双方利益最大化的均衡,并达到此均衡.本文给出了新的均衡:广义均衡,并给出广义均衡的求解过程.通过对引入公共支付函数的概念,公共支付函数表达了两个人的共同利益.通过公共支付函数的最大化,使两个囚徒公共利益最大化,以求得囚徒困境的新的均衡,让两个囚徒的结果达到最好——即两人均抵赖.本文还将公共支付函数运用于其他《博弈论》案例,并指出广义均衡比纳什均衡更具有社会意义,因为前者体现了公共利益.文中还对囚徒困境的机制设计问题做了分析,指出囚徒困境中机制的设计会诱导囚徒作出不正确的选择,从而没有达到双方利益的最大化.【期刊名称】《技术经济与管理研究》【年(卷),期】2011(000)002【总页数】4页(P22-25)【关键词】囚徒困境;公共支付;纳什均衡;广义均衡:支付函数【作者】郭洪伟【作者单位】首都经济贸易大学统计学院,北京100070【正文语种】中文【中图分类】F224博弈论研究的是存在相互影响关系下的个人选择问题。
这里的参与人都是理性人。
按照文献[1]的定义:理性人是在面临给定的约束条件下,能最大化自己偏好的那些人。
这里理性的人与自私的人不同。
理性人可能是利己主义者,也可能是利他主义者。
理性人假设是博弈论的分析前提。
基于这个前提,所有的参与人都尽量使自己的偏好(利益)最大化,如果存在某种行动会使参与人变的更好,参与人会积极努力达成更好的结果。
理性人在最大化偏好时,需要相互合作,而合作中又存在着冲突。
下面分析博弈论中经典的案例——囚徒困境,如表1所示。
假设有两名嫌疑人作案后被警察抓住,分别被关在不同的屋子里接受审讯(关在不同的屋子里是怕他们串供,这也是影响他们博弈的关键因素之一)。
对称均衡非对称均衡博弈论
对称均衡和非对称均衡是博弈论中的重要概念,用于描述博弈中各方的策略选择和结果。
在博弈论中,博弈是指一种决策情形,其中参与者的利益受到彼此的影响。
对称均衡和非对称均衡都是描述博弈中可能出现的情况的概念。
首先,让我们来看看对称均衡。
在博弈论中,对称均衡是指参与者采取相同的策略,并且没有动机去改变自己的策略,因为任何一方的单方面改变都不会使其获益。
对称均衡的一个经典例子是“囚徒困境”博弈,其中两名囚犯面临合作或者背叛的选择。
在对称均衡中,如果两名囚犯都选择背叛,那么他们都会受到最严厉的惩罚,而如果两名囚犯都选择合作,那么他们都会受益。
因此,对称均衡发生在他们都选择背叛或者都选择合作的情况下。
其次,非对称均衡是指参与者采取不同的策略,并且在当前策略下没有动机去改变自己的策略,因为任何一方的单方面改变都不会使其获益。
非对称均衡的一个例子是“买方市场”博弈,其中卖方和买方在价格谈判中采取不同的策略。
在非对称均衡中,如果卖方设定了一个最低价格,而买方愿意接受这个价格,那么双方都没有动机改变自己的策略。
总的来说,对称均衡和非对称均衡是博弈论中用于描述参与者策略选择和结果的重要概念。
通过研究对称均衡和非对称均衡,我们可以更好地理解博弈中参与者的决策行为,以及他们可能达到的结果。
这些概念对于经济学、政治学以及其他社会科学领域都具有重要意义。
希望这个回答能够帮助你更好地理解对称均衡、非对称均衡和博弈论的相关概念。
博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。
两个囚徒互相揭发,就是一种纳什均衡。
对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。
也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。
这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。
博弈策略稳定,博弈结果也稳定。
之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。
之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。
2、纳什均衡意义重大。
纳什均衡提出,震动整个经济学界。
诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。
”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。
”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。
”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。
纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。
读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。
但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。
这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。
从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。
更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。
Q2:怎样运用纳什均衡?1、分析囚徒困境。
博弈论的囚徒困境模型引言博弈论是研究决策制定者在多方面利益冲突下进行选择的一门学科。
而囚徒困境模型是博弈论中最经典的模型之一,用于描述两个合作者之间存在利益冲突时可能出现的情况。
本文将详细介绍囚徒困境模型的基本概念、策略和解决方法,并探讨其在现实生活中的应用。
1. 囚徒困境模型的基本概念囚徒困境模型最早由美国数学家Melvin Dresher和Merrill Flood于1950年提出。
它是一个非零和博弈模型,意味着合作者之间的利益不完全一致,他们可以选择合作或背叛对方,从而获得不同的收益。
在囚徒困境模型中,通常有两名犯人被关押在不同的牢房里,无法相互沟通。
检察官给每个犯人提供了一个选择:如果两个人都保持沉默(即合作),那么他们将分别被判处较轻的刑期;如果其中一个人背叛(即不合作),而另一个人保持沉默,那么背叛者将被释放,而保持沉默者将被判处重刑;如果两个人都背叛,那么他们将各自被判处较重的刑期。
2. 囚徒困境模型的策略在囚徒困境模型中,每个犯人都有两种基本策略:合作和背叛。
根据对方的选择和自己的选择,可以得出四种不同的结果:互相合作、互相背叛、自己合作对方背叛、自己背叛对方合作。
这些结果对应着不同的收益。
为了量化这些收益,通常使用一个称为支付矩阵的工具。
支付矩阵是一个2x2的矩阵,其中每个元素表示在不同情况下每个合作者获得的收益。
在标准囚徒困境模型中,支付矩阵可以表示为:合作背叛合作R,R S,T背叛T,S P,P其中R表示互相合作时的收益,T表示自己背叛对方合作时的收益,S表示自己合作对方背叛时的收益,P表示互相背叛时的收益。
通常,R > T > P > S。
3. 囚徒困境模型的解决方法在囚徒困境模型中,每个犯人都希望获得最大的个人利益。
然而,如果两个犯人都追求个人利益,那么最终的结果将是两败俱伤。
如何选择合适的策略成为了一个关键问题。
在博弈论中,有许多不同的解决方法可以用于囚徒困境模型。
聊聊四种经典的博弈论模型展开全文1、囚徒困境:为什么两个犯人都选择坐牢官差破获了一宗盗窃案,抓住了两名犯罪嫌疑人。
但在审讯过程中,被关在一处的二人始终矢口否认盗窃罪名,说东西不是我们偷的。
为了避免两人达成默契,结成攻守同盟,官差决定对他们进行单独审讯。
官差表示,如果两人中有一人坦白认罪,则可立即释放,另一个不认罪的人判5年徒刑;如果两人都坦白罪刑,则他们将各判2年徒刑。
但还有一种情况,那就是两个人都拒绝坦白,由于缺乏证据,他们只会以扰乱公共场合为名判处3个月拘役。
这就是两名罪犯面临的困境中,他们会做出怎样的选择呢?首先,他们互相之间都不清楚对方是否会坦白,其次,二人都希望将自己的刑期缩至最短。
如此考虑,最终,两名犯人都会选择坦白交代。
上面的案例就是博弈论所说的“囚徒困境”。
犯人们如果彼此合作,可为集体带来最佳利益(刑期最短);但当二人面对同样的情况且不知道对方如何选择时,在理性思考后,双方都会得出相同的结论(坦白交代),以便达到个人利益的最大化。
囚徒困境是博弈论的“非零和博弈”中具代表性的例子,反映的是个人的最佳选择并非是团体的最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
2、智猪博弈:赢的总是小猪猪圈里有大小两头猪,它们在同一个食槽里进食。
为了保持饲料的新鲜,在远离猪食槽的另一边有一个踏板,大猪或小猪跑过去,每按动一次踏板,投食口就会掉落10个单位的食物。
于是,在大猪和小猪每次进食前,就会形成这样一种局面:如果小猪跑去按踏板,大猪守在食槽边,则大猪小猪吃到的食物比是9:1;反之,如果大猪去按而小猪守在食槽边,则吃食比例是6:4。
如果二猪同时到食槽边,则吃食比是7:3。
这样一来,从纯收益的角度考虑,小猪就更愿意选择在食槽边等待食物落出,因为“等待优于行动”,而大猪只能被迫奔忙在踏板和食槽之间。
上述“智猪博弈”的案例是经济学家的假设论证模型,这个博弈的结果,用经济学视角看待,可以解释为:谁占有更多资源,谁就必须承担更多义务。
简述囚徒困境及其结论
囚徒困境是一个经典的博弈论案例,描述了两个囚犯被捕后被关进两个单独的牢房,无法通过通信相互帮助或寻求逃脱机会。
他们必须选择自己的行为,要么合作,要么互相背叛,以最大化自己的收益。
囚徒困境的假设是:两个人的行为都是理性的,不会考虑到道德或法律的因素;两个人的利益是一致的,他们背叛对方会导致自己受到更严厉的惩罚;他们无法找到第三方来帮助或合作。
在囚徒困境中,两个囚犯的最优策略是合作,这意味着他们应该将对方供出,从而各自获得一次逃脱的机会。
然而,如果他们选择合作,那么他们就必须同时供出对方,这将导致他们一起被判刑。
因此,两个囚犯都选择背叛,并各自获得了更高的收益,即逃脱了惩罚。
囚徒困境的结论是,在极端的情况下,两个人的行为取决于他们的理性和利益一致性,而不考虑道德或法律的因素。
在这种情况下,合作或背叛都是最优策略,但无法找到第三方来协助或合作。
囚徒困境的案例表明,在复杂的社会中,人们的行为往往受到理性和利益因素的影响,而不考虑道德和法律的因素。
这也提醒我们在决策时需要考虑多个因素,并做出理性的判断。
囚徒困境和纳什均衡当对手知道了你的决定之后,就能做出对自己最有利的决定------普林斯顿大学数学家约翰·纳什囚徒困境著名的“囚徒困境”,是纳什均衡理论的经典案例。
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供一下相同的选择:若有一人认罪并作证检控对方(背叛对方)而对方保持沉默,此人将立即获释,沉默者将判监禁十年。
若两人都保持沉默(互相合作)则两人同时被判监禁半年。
若两人都互相检举(互相背叛)则两人同时监禁两年。
如同博弈论的其他论证,囚徒困境假设每个囚徒都是利己的,激斗寻求自己的最大利益。
囚徒到底应该选择哪一项策略,才能将自己的刑期缩至最短?两名囚徒由于相互隔离监禁,并不知道对方的选择。
试想困境中两名理性的囚徒会如何选择:若对方沉默,背叛会让我获释,所以对方会选择背叛。
若对方背叛我,我也要指控对方才能得到较低的刑期,所以也是这样会选择背叛。
二人面对的情况一样,所以二人的理想思考会得到相同的答案----选择背叛。
背叛是两种策略之间的支配性策略。
因此这场博弈中唯一可能达到的纳什均衡就是两人选择同时背叛对方,结果两人同时服刑两年。
这场博弈的纳什均衡,显然不是最优的解决方案。
如果两人都选择沉默,两人都只会被判刑半年。
但根据以上假设,两人均为理性的个人,均衡状况回事两个囚徒都选择背叛。
这就是“困境”所在。
寻找“纳什均衡点”在现实生活中,纳什均衡理论影响着人们的行为。
比如,在有些国家,报亭既无管理人员也不上锁,买报纸的人在自行放下前后拿走报纸。
当然某些人可能取走报纸却不付钱(背叛)但由于大家意识到如果每个人都偷窃报纸(共同背叛)会造成以后不方便的有害结果,这种情形很少发生。
在商业活动中,也会出现各种各样的囚徒困境的例子。
两个公司相互竞争,他们的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。
但若二者同时期发出质量类似的广告,收入增加很少但成本增加。
纳什均衡与囚徒困境的关系纳什均衡和囚徒困境是博弈论中两个重要的概念。
纳什均衡是指在一个博弈中,每个玩家都选择了最优的策略,而其他玩家也选择了最优的策略,这种情况下,每个玩家都无法通过单方面改变策略来获得更大的收益。
囚徒困境则是指,在一个博弈中,每个玩家都会倾向于选择自己的最优策略,但是这种最优策略对于其他玩家来说并不是最优的,导致所有玩家都会得到较差的结果。
那么,纳什均衡和囚徒困境有什么关系呢?首先,纳什均衡可以被用来解决囚徒困境。
在囚徒困境中,每个囚徒都会选择背叛对方,因为这是他们自己的最优策略。
但是,如果两个囚徒都选择合作,那么他们都能获得比背叛更好的结果。
这种情况下,囚徒困境的纳什均衡就是合作。
如果两个囚徒都选择合作,那么他们都不会通过单方面改变策略来获得更大的收益。
其次,囚徒困境可以被用来解释为什么人们会选择不合作的策略。
在现实生活中,人们经常会面临类似于囚徒困境的情况。
例如,在商业谈判中,每个公司都希望获得更多的收益,但是如果所有公司都选择了竞争,那么他们都会得到比合作更差的结果。
这种情况下,每个公司都可能会选择竞争,因为这是他们自己的最优策略。
但是,如果所有公司都选择了合作,那么他们都能获得比竞争更好的结果。
这种情况下,囚徒困境的纳什均衡就是竞争。
最后,纳什均衡和囚徒困境的研究对于社会科学和经济学有着重要的意义。
在社会科学中,博弈论被广泛应用于研究人类行为和社会互动。
在经济学中,博弈论被用来研究市场竞争、拍卖和合同等问题。
纳什均衡和囚徒困境作为博弈论的核心概念,对于解决这些问题具有重要的理论和实践意义。
总之,纳什均衡和囚徒困境是博弈论中两个重要的概念,它们之间有着密切的关系。
纳什均衡可以被用来解决囚徒困境,囚徒困境可以被用来解释为什么人们会选择不合作的策略。
这些研究对于社会科学和经济学具有重要的意义,为我们深入理解人类行为和社会互动提供了重要的理论基础。
纳什均衡——⾮合作博弈,囚徒困境1、⾮合作博弈是指在策略环境下,⾮合作的框架把所有的⼈的⾏动都当成是个别⾏动。
它主要强调⼀个⼈进⾏⾃主的决策,⽽与这个策略环境中其他⼈⽆关。
博弈并⾮只包含了冲突的元素,往往在很多情况下,既包含了冲突元素,也包含了合作元素。
即冲突和合作是重叠的。
===》求个⼈利益最⼤化2、合作博弈是指⼀些参与者以同盟、合作的⽅式进⾏的博弈,博弈活动就是不同集团之间的对抗。
在合作博弈中,参与者未必会做出合作⾏为,然⽽会有⼀个来⾃外部的机构惩罚⾮合作者。
合作博弈亦称为正和博弈,是指博弈双⽅的利益都有所增加,或者⾄少是⼀⽅的利益增加,⽽另⼀⽅的利益不受损害,因⽽整个社会的利益有所增加的。
===》求集体利益最⼤化囚徒困境终于被破解了!⼩伙1句狠话轻松破解难题,豪取50万英镑==》本质上的解法是在将⾮合作博弈变成合作博弈发布时间: 05-1122:12教育领域创作者囚徒困境,据说是博弈论中最棘⼿的难题,⽆⼈可破!不过,这个世纪难题却被⼀个年轻的英国街头混混⽤1句话给轻松破解了,并且豪取50万英镑。
01、什么是囚徒困境?囚徒困境,是1950年美国兰德公司提出来的,并以故事的形式进⾏阐述:两⼈因合伙盗窃杀⼈被逮捕,警⽅将他们两⼈分开进⾏审讯,并给了他们3个选择:1、如果两个⼈都抵赖,各判刑1年;2、如果两个⼈都坦⽩,各判刑8年;3、如果其中⼀⼈坦⽩,坦⽩者会被释放,抵赖者则会判刑10年。
很明显,两个囚徒都⾯临着两种选择:坦⽩或者抵赖。
由于两⼈处于隔离状态,并不知道同伙会如何选择,那么,他们就只能基于⼈性的⾃私,⽽去断定同伙肯定会去对其来说最有利的⽅式:坦⽩!既然同伙坦⽩了,那么⾃⼰抵赖就会被判10年,太亏了。
于是,他⾃⼰也会选择坦⽩——最坏也是8年,如果运⽓好,还可能直接释放。
这样⼀来,每个⼈都这样猜想对⽅,那么他们最终的结果就是都坦⽩,同时被判刑8年。
02、英国⼩伙破解囚徒困境的神操作!囚徒困境充分利⽤了⼈性的⾃私,基本⽆法破解。
博弈论案例分析在经济学、政治学、社会学以及商业策略中,博弈论是一个重要的分析工具。
它研究在具有相互依赖关系的决策者之间如何做出最优决策。
以下是几个典型的博弈论案例分析:1. 囚徒困境囚徒困境是博弈论中最著名的例子之一。
它描述了两个被捕的罪犯面临的决策问题。
每个囚犯可以选择合作(保持沉默)或背叛(供出对方)。
如果两人都合作,他们都会被轻判;如果两人都背叛,他们都会被重判;如果一个合作而另一个背叛,背叛者将被释放,而合作者将受到最重的惩罚。
在这种情况下,尽管两人都合作是最优的集体结果,但个体理性导致他们最终选择背叛对方。
2. 纳什均衡纳什均衡是博弈论中的一个核心概念,由数学家约翰·纳什提出。
它指的是在一个非合作博弈中,每个参与者都选择了自己的最优策略,前提是其他参与者的策略是已知的。
在囚徒困境中,纳什均衡就是两人都选择背叛,因为无论对方如何选择,背叛都是每个囚犯的最优策略。
3. 公共物品的提供公共物品的提供是博弈论在现实世界中的一个应用。
公共物品具有非排他性和非竞争性,即一个人使用公共物品不会减少其他人的使用,且无法阻止未付费者使用。
这导致了一个“搭便车”的问题,即个体可能倾向于不支付公共物品的成本,而是依赖其他人的支付。
博弈论可以用来分析如何通过激励机制来解决这个问题,比如通过征税或罚款。
4. 拍卖理论拍卖理论是博弈论在经济活动中的一个应用。
它研究在不同拍卖规则下,买家和卖家如何制定策略以达到最优结果。
例如,在英式拍卖中,价格逐步上升,直到只剩下一个出价者;而在荷兰式拍卖中,价格从高到低下降,直到有人接受当前价格。
博弈论可以帮助分析在不同拍卖形式下,参与者如何制定出价策略以最大化自己的利益。
5. 冷战时期的核威慑冷战时期,美国和苏联之间的核威慑是一个典型的博弈论案例。
双方都拥有能够摧毁对方的核武器,但任何一方首先使用核武器都会导致灾难性的后果。
这种情况下,双方都有动机保持克制,以避免触发全面的核战争。
博弈论案例分析博弈论分析一、经济学中的“智猪博弈”(Pigs’payoffs)这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。
对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。
反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。
规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。
投食仅原来的一半分量。
结果是小猪大猪都不去踩踏板了。
小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。
谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。
投食为原来的一倍分量。
结果是小猪、大猪都会去踩踏板。
谁想吃,谁就会去踩踏板。
反正对方不会一次把食物吃完。
小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。
投食仅原来的一半分量,但同时将投食口移到踏板附近。
博弈论的经典案例:囚徒困境学习管理学或经济学的人一定都了解一些博弈论方面的知识。
在博弈论中有一个经典案例--囚徒困境,非常耐人回味。
----"囚徒困境"说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
----那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了。
但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
----当然,在现实世界里,信任与合作很少达到如此两难的境地。
谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。
博弈论囚徒困境博弈论经典案例“囚徒困境”及其实证分析最近三四十年,经济学经历了一场“博弈论革命”,就是引入博弈论的概念和方法改造经济学的思维,推进经济学的研究。
诺贝尔经济学奖授予包括美国普林斯顿大学的纳什博士在内的3位博弈论专家,可以看作是一个标志,这自然也激发了人们了解博弈论的热情。
博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。
博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。
一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。
“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。
讲的是两个嫌疑犯(,和,)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则判,,年;如果各判,年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的都不坦白则因证据不足各判,年。
在这个例子里,博弈的参加者就是两个嫌疑犯,和,,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:,和,均坦白或均不坦白、,坦白,不坦白或者,坦白,不坦白,是博弈的结果。
,和,均坦白是这个博弈的纳什均衡。
这是因为,假定,选择坦白的话,,最好是选择坦白,因为,坦白判,年而抵赖却要判十年;假定,选择抵赖的话,,最好还是选择坦白,因为,坦白判不被判刑而抵赖确要被判刑,年。
即是说,不管,坦白或抵赖,,的最佳选择都是坦白。
反过来,同样地,不管,是坦白还是抵赖,,的最佳选择也是坦白。
囚徒困境博弈的行为博弈均衡分析
Christopher Stephens: Modelling Reciprocal Altruism, The British Journal for the Philosophy of Science, vol.47, No.4, 1996, pp.533-551.
互动利他主义建模
1、利他主义困惑与标准模型
The altruism puzzle and the standard model
在一个囚徒困境博弈中,每个博弈者都有两种可能选择:背叛(Defect)或合作(Cooperate),可一般表示为:
囚徒困境博弈要求两个主要条件:(1)Y>W>Z>X(命令条件,The ordering condition);(2)(Y+X)<2W(反利用条件,The anti-exploitation condition)
尽管“背叛”策略是一次性博弈中每个博弈者的优超选择,但相互合作却比相互背叛要好。
2、利他主义的非正式条件
Informal condition for reciprocal altruism
3、对反利用条件的Axelrod证明的批评
Criticism of Axelrod’s justification of the anti-exploitation condition
4、相互利他主义的一组正式模型
A menu of formal models of reciprocal altruism
5、对于guppies、baboons和bats模型的互动利他主义建模
Modelling reciprocal altruism in guppies, baboons, and bats
(1)建模guppies的同时合作
(2)建模baboons的非同时合作(3)建模cook困境的互动利他主义
6、结论
Conclusions。