博弈论(一)“囚徒困境”
- 格式:ppt
- 大小:145.00 KB
- 文档页数:28
博弈论经典模型全解析(入门级)1。
囚徒困境这是博弈论中最最经典的案例了-—囚徒困境,非常耐人寻味。
“囚徒困境"说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作).这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪.但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金.而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了.但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
企业在信息化过程中需要与咨询企业、软件供应商打交道的。
在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作.在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。
1.囚徒困境:假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。
警察局将这两名嫌疑犯分别关押以防他们串供。
两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。
(1)请写出这两名嫌疑犯博弈的支付矩阵;(2)假设这两名嫌疑犯都是极其精明的会打小算盘的自私自利不讲“江湖义气”的人,同时被分别审查不能够进行沟通。
请给出每个嫌疑犯的最佳策略;(3)假设允许这两名嫌疑犯在审讯室一起单独呆上10分钟,然后再决定是否坦白。
他们能否建立一个攻守同盟,从而双方都只被判一年?(4)若其中一名囚徒不知道对手是否理性,则他的最佳策略是什么?(5)说明这两个囚徒的困境在哪里?从“囚徒困境”博弈中你得到了什么启示?(6)利用“囚徒困境”博弈从下面两个现象:①恋人们在恋爱中海誓山盟,最终还是分手;②美苏两国经常会晤,甚至签订核不扩散条约,但军费一年高过一年。
(7)请试举一例“囚徒困境”博弈。
(8)请指出一种走出“囚徒困境”的方法。
2. 商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。
请解释这个现象,并站在商家的立场上给出一些避免“价格大战”的方法。
3. 智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。
如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。
(1)给出这个博弈的支付矩阵;(2)找出这两头理性“智猪”的最佳策略;(3)该“智猪博弈”博弈给你的启发是什么?(4)有些广告具有“外部性”,如假设伊利宣传牛奶能强健国人的体质的广告就不仅仅增加了人们对伊利牛奶的需求,也增加了对其他品牌牛奶的需求。
囚徒困境,是博弈论中的一个概念,它解释了为什么尽管彼此
合作是对双
囚徒困境,是博弈论中的一个概念,它解释了为什么尽管彼此合作是对双方来说最好的选择,但对一方来说,先杀死对方的做法更合乎逻辑。
这是因为生存高于一切,虽然你不能确定你的对手是否会攻击你,但你可以确定,在你打败对手之前,对手会先打败你,因为这符合对方的利益。
正是出于这个原因,双方最好相互保证,不给对方造成生存危害,从而避免致命性的战争。
要想进一步降低发生冲突的风险,双方就需要交换利益,建立相互依赖的关系,使自身不能承受失去这种关系的后果。
是双赢关系还是双输关系,这取决于双方做出的选择。
个人和国家关系都是如此。
实际上,双方可以选择是盟友还是敌人,彼此的行动将决定其关系和结果。
只要一方不给另一方带来生存风险,竞争对手之间就可以存在双赢关系。
但双方必须明确并尊重对方的生存红(底)线。
在双赢关系中,双方可能会以相互尊重为基础进行谈判,就像集市上的商人和气地讨价还价。
拥有双赢关系显然比两败俱伤好,但有时也会存在不可调和的矛
盾,双方不得不为之而战,因为已经无法通过谈判来解决分歧了。
#春日生活打卡季#。
囚徒困境的启示与意义一、引言囚徒困境是博弈论中的一个经典问题,它描述了两个独立的参与者在缺乏沟通和合作的情况下做出决策的情形。
这个问题不仅仅存在于博弈论中,也广泛应用于社会学、政治学、经济学等领域。
本文将探讨囚徒困境的启示与意义。
二、囚徒困境的定义囚徒困境是指两个独立的参与者在缺乏沟通和合作的情况下做出决策,其结果会受到对方行为的影响。
具体来说,每个参与者都有两种选择:合作或背叛。
如果两个人都选择合作,则他们都会获得最好的结果;如果两个人都选择背叛,则他们都会获得最差的结果;如果一个人选择合作而另一个人选择背叛,则前者将获得最差的结果,而后者将获得最好的结果。
三、囚徒困境在社会学中的应用1. 社交心理学在社交心理学中,研究人员使用囚徒困境来探索人们如何做出互动和合作决策。
研究表明,人们更容易选择合作,特别是在长期互动的情况下。
此外,研究还发现,当人们认为对方可能会背叛时,他们更倾向于选择背叛。
2. 社会合作囚徒困境也可以应用于社会合作的研究中。
例如,在环保领域,囚徒困境可以描述一个社区中的人如何决定是否采取环保措施。
如果每个人都采取措施,则整个社区将获得好处;如果只有少数人采取措施,则其他人可以从中受益而不必自己付出代价;但是,如果所有人都不采取措施,则整个社区将遭受损失。
四、囚徒困境在政治学中的应用1. 国际关系在国际关系中,囚徒困境可以描述两个国家之间的互动。
例如,在贸易谈判中,两个国家可能面临着类似于囚徒困境的情况:如果两个国家都签署了协议,则他们都会获得好处;如果两个国家都没有签署协议,则他们都会遭受损失;但是,如果一个国家签署了协议而另一个国家没有签署,则前者将获得好处,而后者将遭受损失。
2. 政治合作囚徒困境也可以应用于政治合作的研究中。
例如,在政府间的合作中,囚徒困境可以描述两个政府之间的互动。
如果两个政府都采取措施,则他们都会获得好处;如果两个政府都不采取措施,则他们都会遭受损失;但是,如果一个政府采取措施而另一个政府没有采取措施,则前者将获得好处,而后者将遭受损失。
聊聊四种经典的博弈论模型展开全文1、囚徒困境:为什么两个犯人都选择坐牢官差破获了一宗盗窃案,抓住了两名犯罪嫌疑人。
但在审讯过程中,被关在一处的二人始终矢口否认盗窃罪名,说东西不是我们偷的。
为了避免两人达成默契,结成攻守同盟,官差决定对他们进行单独审讯。
官差表示,如果两人中有一人坦白认罪,则可立即释放,另一个不认罪的人判5年徒刑;如果两人都坦白罪刑,则他们将各判2年徒刑。
但还有一种情况,那就是两个人都拒绝坦白,由于缺乏证据,他们只会以扰乱公共场合为名判处3个月拘役。
这就是两名罪犯面临的困境中,他们会做出怎样的选择呢?首先,他们互相之间都不清楚对方是否会坦白,其次,二人都希望将自己的刑期缩至最短。
如此考虑,最终,两名犯人都会选择坦白交代。
上面的案例就是博弈论所说的“囚徒困境”。
犯人们如果彼此合作,可为集体带来最佳利益(刑期最短);但当二人面对同样的情况且不知道对方如何选择时,在理性思考后,双方都会得出相同的结论(坦白交代),以便达到个人利益的最大化。
囚徒困境是博弈论的“非零和博弈”中具代表性的例子,反映的是个人的最佳选择并非是团体的最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
2、智猪博弈:赢的总是小猪猪圈里有大小两头猪,它们在同一个食槽里进食。
为了保持饲料的新鲜,在远离猪食槽的另一边有一个踏板,大猪或小猪跑过去,每按动一次踏板,投食口就会掉落10个单位的食物。
于是,在大猪和小猪每次进食前,就会形成这样一种局面:如果小猪跑去按踏板,大猪守在食槽边,则大猪小猪吃到的食物比是9:1;反之,如果大猪去按而小猪守在食槽边,则吃食比例是6:4。
如果二猪同时到食槽边,则吃食比是7:3。
这样一来,从纯收益的角度考虑,小猪就更愿意选择在食槽边等待食物落出,因为“等待优于行动”,而大猪只能被迫奔忙在踏板和食槽之间。
上述“智猪博弈”的案例是经济学家的假设论证模型,这个博弈的结果,用经济学视角看待,可以解释为:谁占有更多资源,谁就必须承担更多义务。
囚徒困境的博弈论表述囚徒困境是博弈论中的经典问题之一,涉及到两位囚犯的选择,他们会面临到合作与背叛的选择,其结果会影响到他们之间的关系和各自的命运。
以下是囚徒困境的博弈论表述。
第一步,两位囚犯被抓并被关在了不同的牢房里,他们之间无法交流。
警察可以与每个囚犯进行单独的问讯,但对双方的答案会有所保密。
第二步,警察告诉囚犯们,如果他们两个都不承认犯罪,那么他们都会被判入狱1年。
但是,如果其中一个人承认犯罪而另一个人不承认,那么承认犯罪的囚犯将被判入狱3年,而不承认犯罪的囚犯将被判入狱10年。
如果两个人都承认犯罪,那么他们都将被判入狱5年。
第三步,两位囚犯需要作出自己的选择。
如果他们合作并且不承认犯罪,那么他们都可以被判入狱1年,这是对双方最好的结果。
但是,如果其中一个囚犯选择背叛另一个人,并承认犯罪,那么他将被判入狱3年,而另一名囚犯将被判入狱10年。
如果两个人都背叛,那么他们都将被判入狱5年,这是对双方最糟糕的结果。
在这种情况下,每一个囚犯都会寻求自己的最大利益,因为他们之前无法沟通,不可能达成共同合作的结果,因此囚徒困境是一种不稳定的策略。
当他们都选择自我保护而摆脱责任,结果却不如合作的结果好时,则产生了“囚徒困境”。
这个问题反映了在面临群体行动问题时,个体的行动往往与合作的利益是相反的。
因此,在实际生活中,面对这种情况,往往需要我们平衡自我利益与合作利益之间的权衡,才能取得更好的结果。
总之,囚徒困境通过一个简单的例子,提示了现实生活中相当普遍的博弈问题,一定程度上也预示了独裁和相互协作的不同结局。
在此基础上,对于此类博弈问题,我们需要不断探讨和学习,才有可能取得最佳的结果。
十大博弈论经典案例1.《囚徒困境》。
囚徒困境是博弈论中最著名的案例之一。
在这个案例中,两名囚犯被捕,但检察官没有足够的证据来判定他们犯罪。
如果两名囚犯都沉默,他们将被判处较轻的刑罚;如果其中一人选择交代,而另一人保持沉默,那么交代的囚犯将获得豁免,而另一人将被判处重刑;如果两人都交代,他们将被判处较重的刑罚。
在这种情况下,每个囚犯都面临着一个困境,无论对方选择什么,自己都会受到损失。
2.《合作博弈》。
合作博弈是指参与者之间可以进行合作的博弈。
在合作博弈中,参与者可以通过合作来获得更好的结果。
例如,两家公司可以通过合作来共同开发新产品,从而获得更大的利润。
合作博弈强调参与者之间的合作和协调,以实现共同的利益。
3.《竞争博弈》。
竞争博弈是指参与者之间存在竞争关系的博弈。
在竞争博弈中,参与者的利益往往是相互对立的。
例如,两家公司在市场上竞争销售同一种产品,它们的利润往往是相互竞争的。
竞争博弈强调参与者之间的竞争和对抗,以争取最大的利益。
4.《博弈的策略》。
在博弈中,参与者可以选择不同的策略来影响结果。
策略是参与者在博弈中可以采取的行动。
不同的策略选择会导致不同的结果,而博弈论就是研究参与者如何选择最优策略以达到最大利益的学科。
5.《信息不对称博弈》。
信息不对称博弈是指参与者在博弈中拥有不同的信息。
在这种情况下,有一方可能掌握更多的信息,从而在博弈中占据优势。
信息不对称博弈强调信息的重要性,以及如何在信息不对称的情况下做出最优决策。
6.《博弈的均衡》。
博弈的均衡是指在博弈中参与者达到一种稳定状态的结果。
在这种状态下,参与者不会再改变自己的策略,因为任何单方面的改变都不会给自己带来更好的结果。
博弈的均衡是博弈论中非常重要的概念,它可以帮助我们预测参与者的行为和结果。
7.《博弈的合作与对抗》。
在博弈中,合作和对抗是两种常见的行为方式。
合作可以带来共同的利益,而对抗则是为了争取最大的利益。
在实际的博弈中,参与者往往需要权衡合作和对抗之间的关系,以达到最优的结果。
博弈论——囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。
在重复的囚徒困境中,博弈被反复地进行。
因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。
1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:甲沉默(合作) 甲认罪(背叛)乙沉默(合作)二人同服刑半年 甲即时获释;乙服刑10年乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年解说如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
囚徒困境(Prisoner's dilemma)囚徒困境是博弈论中具有代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克(Albert tucker)1950年提出来的。
他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最著名的案例。
故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。
2.经典的囚徒困境1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:∙若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
∙若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
囚徒困境名词解释囚徒困境是博弈论中的一个经典问题,用于描述两个个体在没有沟通或合作的情况下所面临的困境。
在这个问题中,两个囚徒被同时关押在不同的牢房中,警方缺乏足够的证据定罪,只能以较轻的罪名判刑,但如果其中一个供认自己的罪行,而另一个保持沉默,则供认者可以得到更轻的刑期,而另一个将会受到较重的惩罚;如果两人都供认,则两人都将受到一定的惩罚。
在这种情况下,囚徒可能会因为不信任对方而都选择供认自己的罪行,导致两人都受到惩罚,这就构成了囚徒困境。
囚徒困境揭示了个体在面临利益冲突时的困境和悖论。
虽然对于两个囚徒来说,最优的结果是两人都保持沉默,使得两人都能够得到较轻的判罪,但由于彼此之间缺乏合作和沟通的机会,彼此不信任的情况下,个体往往会做出不合理的选择。
囚徒困境不仅在刑事案例中有应用,也存在于许多其他领域,如商业竞争、环境保护和国际关系等。
在商业竞争中,企业可能会陷入囚徒困境,各自选择采取激烈竞争、降低价格等策略,短期内可能会获得一定利益,但最终可能导致整个市场竞争趋于恶性循环。
在环境保护中,各个国家可能都面临着类似的困境,各国都在追求经济发展,但如果各国都不采取措施来减少环境污染,最终可能导致整个地球环境的破坏。
在国际关系中,大国之间的博弈也常常落入囚徒困境,彼此不信任,在不明确对方意图的情况下可能持有敌对态度,最终可能导致冲突的升级。
为了解决囚徒困境带来的问题,学者们提出了一系列的解决方案,如合作博弈、迭代博弈、契约博弈等。
合作博弈强调通过合作和沟通使得双方能够达成共赢的结果;迭代博弈则通过重复多次囚徒困境的游戏,让个体能够建立起彼此的信任和合作;契约博弈通过建立契约和规则来约束个体的行为,保证双方都能得到一定的利益。
囚徒困境作为博弈论中的一个经典问题,不仅在理论研究中产生了重要的影响,也在实际场景中得到了广泛的应用和启示。
它向我们揭示了在缺乏合作和沟通的情况下,个体常常会被自身利益所限制,从而导致最终结果并不是最优的。
博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。
其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。
本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。
关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。
它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。
为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。
当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。
用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。
容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。
二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。
而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。
下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。
首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。
博弈论之囚徒困境展开全文商业社会犹如丛林,生存就是一场肉弱强食的战争。
强敌环伺、资源有限,而你,是带枪的猎手?还是待宰的猎物?忍耐就是毁灭,强攻只会负伤。
聪明的做法,就是通过降维打击的方式,去到一个由我们说了算的丛林!大家好,我是雷彬。
今天给大家聊聊囚徒困境。
1950年,美国数学家阿尔伯特·塔克,为了向一群心理学家们解释博弈论,编了一个叫“囚徒困境”的故事:两名囚徒A和B被隔离审讯。
如果两人彼此背叛,都坦白罪行,会都被判刑8年;但如果一人坦白,一人不坦白,坦白的人直接释放,不坦白的重判15年。
如果两人合作,都不坦白呢?会因为证据不足,都只判1年。
囚徒应该怎么做?显然,“都不坦白”是最优策略,两人判得最轻。
知道“纳什均衡”你就会明白,“都不坦白”是经不起考验的最优策略:我如果单方选择背叛,将立即获释,诱惑太大;而且就算我守口如瓶,万一他背叛了呢?我会被判15年,风险太高。
在利益驱使下,“都不坦白”不是稳定的纳什均衡。
“都坦白”呢?那两人都获刑8年。
这时,如果一名囚徒单方决定守口如瓶,他的8年刑期将立刻变为15年,而另一人则被释放。
这一点好处都没有,两名囚徒如果是理性的,都不会这么干。
“都坦白”,是囚徒困境中唯一稳定的“纳什均衡”。
“好的不均衡,坏的却稳定”的囚徒困境,成了博弈论中最经典的案例。
但是,我今天的目的不是讲故事,而是深刻理解“囚徒困境”的博弈论原理,并找到破解方法。
到底什么是囚徒困境?一个典型的囚徒困境,用数学的语言表述,其实就是满足两个条件的博弈:第一,背叛诱惑> 合作报酬。
在这里,合作报酬是判刑1年,背叛诱惑却是立即释放。
这将导致“都不坦白”不构成稳定的纳什均衡;第二,受骗支付> 背叛惩罚。
在这个案例中,背叛惩罚是判刑8年,受骗支付却是判刑15年。
这将导致“都坦白”成为稳定的纳什均衡。
这就是“囚徒困境”的数学原理。
就这么简单?就这么简单。
理解了这两点,破解方法也就显而易见了:让“合作报酬> 背叛诱惑”;让“背叛惩罚 > 受骗支付”。
博弈论经典案例博弈论是研究决策者之间相互作用的数学理论,它涉及到策略的制定、收益的分配以及决策者之间的互动关系。
在现实生活中,博弈论可以被应用到各种各样的情境中,从商业竞争到国际政治。
下面我们将介绍一些博弈论的经典案例,帮助大家更好地理解这一理论。
1. 囚徒困境。
囚徒困境是博弈论中最经典的案例之一。
在这个案例中,两名犯罪嫌疑人被捕,然后被单独审讯。
如果两人都保持沉默,那么他们将会被判处较轻的刑罚;如果其中一人选择交代另一人,而另一人保持沉默,那么交代的人将会被免罪,而另一人将被判处重刑;如果两人都选择交代对方,那么他们将会被判处较重的刑罚。
在这种情况下,每个人都会选择最大化自己的利益,最终导致了一个对双方都不利的结果。
2. 霍夫丁格-普雷兹勒模型。
霍夫丁格-普雷兹勒模型是用来解释两个公司之间的价格竞争的经典案例。
在这个模型中,两家公司同时决定它们的价格,然后根据对方的价格来调整自己的价格。
最终,这种竞争会导致价格不断下降,最终使得两家公司的利润都减少。
这个案例表明,即使在追求自身利益的情况下,双方最终都会受到损害。
3. 博弈论在国际政治中的应用。
博弈论在国际政治中也有着广泛的应用。
例如,在两个国家之间的军备竞赛中,双方都会不断增加军备以保持自己的安全。
然而,这种竞赛最终会导致双方都陷入困境,因为军备竞赛会对双方的经济造成负担,最终对双方都不利。
4. 超市定价竞争。
在超市的定价竞争中,每家超市都会根据对手的价格来调整自己的价格。
这种竞争往往会导致价格战,最终使得双方都陷入亏损。
这个案例表明,即使在追求市场份额的情况下,双方最终都会受到损害。
5. 博弈论在合作与冲突中的应用。
博弈论不仅可以解释竞争的情况,也可以解释合作与冲突的情况。
例如,在合作博弈中,参与者可以通过制定合适的策略来最大化整体利益;而在冲突博弈中,参与者则会通过制定对抗性的策略来争夺有限的资源。
总结。
博弈论作为一种研究决策者之间相互作用的数学理论,可以被广泛应用到各种情境中。
“囚徒困境”是博弈论里最经典的例子之一。
讲的是两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判3年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判5年;如果都不坦白则因证据不足各判1年。
这就是二人博弈的支付矩阵也叫做双矩阵博弈三要素;1,谁参与这个博弈(甲乙)二人博弈局中人或参与人2可供参与人选择的行动或策略(坦白抵赖),3 博弈中各种对局下各参与人的盈利或得益(参与人的支付)支付不是付出而是得到(判刑年数)这种二人博弈是一种完全信息的静态博弈;博弈最基本的分类有两个一个是按照博弈各方是否同时决策分为静态博弈和动态博弈同时决策或者同时行动的博弈属于静态先后或序贯决策或行动的博弈属于动态即使决策或行动有先后但是只要参与者在决策时都还不知道对手的决策或行动是什么也算是静态博弈另一分类是按照大家是否清楚各种对局情况下每个参与人的得益分为完全信息博弈和不完全信息博弈两种分类组合起来一共就有四大类博弈-----下面就具体来讲一下这个囚徒困境博弈既然两个囚犯最好的结果是都不招供,两人都只被判1年,那么,两个囚犯都选择不招供就好然而,人算不如天算,“囚徒困境”之所以称为“困境”正是因为这个博弈的最终结局恰恰是最坏的结果,即两个囚犯统统招供,结果都被判有期徒刑5年。
为什么最后甲乙都会坦白呢?我们从博弈论来分析一下;对一个博弈来说,游戏规则非常地重要,适宜的规则才能够达到目的。
在我们的日常生活中莫不如此,规则制订者往往利用条件制定出有利于自身的规章制度。
不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判一年,不坦白的话判五年,坦白还是比不坦白好。
结果,两个嫌疑犯都选择坦白。
即是说,不管甲坦白或抵赖,乙的最佳选择都是坦白。
反过来,同样地,不管乙是坦白还是抵赖,甲的最佳选择也是坦白。