博弈论(一)“囚徒困境”
- 格式:ppt
- 大小:145.00 KB
- 文档页数:28
博弈论经典模型全解析(入门级)1。
囚徒困境这是博弈论中最最经典的案例了-—囚徒困境,非常耐人寻味。
“囚徒困境"说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作).这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪.但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金.而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了.但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
企业在信息化过程中需要与咨询企业、软件供应商打交道的。
在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作.在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。
1.囚徒困境:假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。
警察局将这两名嫌疑犯分别关押以防他们串供。
两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。
(1)请写出这两名嫌疑犯博弈的支付矩阵;(2)假设这两名嫌疑犯都是极其精明的会打小算盘的自私自利不讲“江湖义气”的人,同时被分别审查不能够进行沟通。
请给出每个嫌疑犯的最佳策略;(3)假设允许这两名嫌疑犯在审讯室一起单独呆上10分钟,然后再决定是否坦白。
他们能否建立一个攻守同盟,从而双方都只被判一年?(4)若其中一名囚徒不知道对手是否理性,则他的最佳策略是什么?(5)说明这两个囚徒的困境在哪里?从“囚徒困境”博弈中你得到了什么启示?(6)利用“囚徒困境”博弈从下面两个现象:①恋人们在恋爱中海誓山盟,最终还是分手;②美苏两国经常会晤,甚至签订核不扩散条约,但军费一年高过一年。
(7)请试举一例“囚徒困境”博弈。
(8)请指出一种走出“囚徒困境”的方法。
2. 商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。
请解释这个现象,并站在商家的立场上给出一些避免“价格大战”的方法。
3. 智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。
如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。
(1)给出这个博弈的支付矩阵;(2)找出这两头理性“智猪”的最佳策略;(3)该“智猪博弈”博弈给你的启发是什么?(4)有些广告具有“外部性”,如假设伊利宣传牛奶能强健国人的体质的广告就不仅仅增加了人们对伊利牛奶的需求,也增加了对其他品牌牛奶的需求。
囚徒困境,是博弈论中的一个概念,它解释了为什么尽管彼此
合作是对双
囚徒困境,是博弈论中的一个概念,它解释了为什么尽管彼此合作是对双方来说最好的选择,但对一方来说,先杀死对方的做法更合乎逻辑。
这是因为生存高于一切,虽然你不能确定你的对手是否会攻击你,但你可以确定,在你打败对手之前,对手会先打败你,因为这符合对方的利益。
正是出于这个原因,双方最好相互保证,不给对方造成生存危害,从而避免致命性的战争。
要想进一步降低发生冲突的风险,双方就需要交换利益,建立相互依赖的关系,使自身不能承受失去这种关系的后果。
是双赢关系还是双输关系,这取决于双方做出的选择。
个人和国家关系都是如此。
实际上,双方可以选择是盟友还是敌人,彼此的行动将决定其关系和结果。
只要一方不给另一方带来生存风险,竞争对手之间就可以存在双赢关系。
但双方必须明确并尊重对方的生存红(底)线。
在双赢关系中,双方可能会以相互尊重为基础进行谈判,就像集市上的商人和气地讨价还价。
拥有双赢关系显然比两败俱伤好,但有时也会存在不可调和的矛
盾,双方不得不为之而战,因为已经无法通过谈判来解决分歧了。
#春日生活打卡季#。
囚徒困境的启示与意义一、引言囚徒困境是博弈论中的一个经典问题,它描述了两个独立的参与者在缺乏沟通和合作的情况下做出决策的情形。
这个问题不仅仅存在于博弈论中,也广泛应用于社会学、政治学、经济学等领域。
本文将探讨囚徒困境的启示与意义。
二、囚徒困境的定义囚徒困境是指两个独立的参与者在缺乏沟通和合作的情况下做出决策,其结果会受到对方行为的影响。
具体来说,每个参与者都有两种选择:合作或背叛。
如果两个人都选择合作,则他们都会获得最好的结果;如果两个人都选择背叛,则他们都会获得最差的结果;如果一个人选择合作而另一个人选择背叛,则前者将获得最差的结果,而后者将获得最好的结果。
三、囚徒困境在社会学中的应用1. 社交心理学在社交心理学中,研究人员使用囚徒困境来探索人们如何做出互动和合作决策。
研究表明,人们更容易选择合作,特别是在长期互动的情况下。
此外,研究还发现,当人们认为对方可能会背叛时,他们更倾向于选择背叛。
2. 社会合作囚徒困境也可以应用于社会合作的研究中。
例如,在环保领域,囚徒困境可以描述一个社区中的人如何决定是否采取环保措施。
如果每个人都采取措施,则整个社区将获得好处;如果只有少数人采取措施,则其他人可以从中受益而不必自己付出代价;但是,如果所有人都不采取措施,则整个社区将遭受损失。
四、囚徒困境在政治学中的应用1. 国际关系在国际关系中,囚徒困境可以描述两个国家之间的互动。
例如,在贸易谈判中,两个国家可能面临着类似于囚徒困境的情况:如果两个国家都签署了协议,则他们都会获得好处;如果两个国家都没有签署协议,则他们都会遭受损失;但是,如果一个国家签署了协议而另一个国家没有签署,则前者将获得好处,而后者将遭受损失。
2. 政治合作囚徒困境也可以应用于政治合作的研究中。
例如,在政府间的合作中,囚徒困境可以描述两个政府之间的互动。
如果两个政府都采取措施,则他们都会获得好处;如果两个政府都不采取措施,则他们都会遭受损失;但是,如果一个政府采取措施而另一个政府没有采取措施,则前者将获得好处,而后者将遭受损失。
聊聊四种经典的博弈论模型展开全文1、囚徒困境:为什么两个犯人都选择坐牢官差破获了一宗盗窃案,抓住了两名犯罪嫌疑人。
但在审讯过程中,被关在一处的二人始终矢口否认盗窃罪名,说东西不是我们偷的。
为了避免两人达成默契,结成攻守同盟,官差决定对他们进行单独审讯。
官差表示,如果两人中有一人坦白认罪,则可立即释放,另一个不认罪的人判5年徒刑;如果两人都坦白罪刑,则他们将各判2年徒刑。
但还有一种情况,那就是两个人都拒绝坦白,由于缺乏证据,他们只会以扰乱公共场合为名判处3个月拘役。
这就是两名罪犯面临的困境中,他们会做出怎样的选择呢?首先,他们互相之间都不清楚对方是否会坦白,其次,二人都希望将自己的刑期缩至最短。
如此考虑,最终,两名犯人都会选择坦白交代。
上面的案例就是博弈论所说的“囚徒困境”。
犯人们如果彼此合作,可为集体带来最佳利益(刑期最短);但当二人面对同样的情况且不知道对方如何选择时,在理性思考后,双方都会得出相同的结论(坦白交代),以便达到个人利益的最大化。
囚徒困境是博弈论的“非零和博弈”中具代表性的例子,反映的是个人的最佳选择并非是团体的最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
2、智猪博弈:赢的总是小猪猪圈里有大小两头猪,它们在同一个食槽里进食。
为了保持饲料的新鲜,在远离猪食槽的另一边有一个踏板,大猪或小猪跑过去,每按动一次踏板,投食口就会掉落10个单位的食物。
于是,在大猪和小猪每次进食前,就会形成这样一种局面:如果小猪跑去按踏板,大猪守在食槽边,则大猪小猪吃到的食物比是9:1;反之,如果大猪去按而小猪守在食槽边,则吃食比例是6:4。
如果二猪同时到食槽边,则吃食比是7:3。
这样一来,从纯收益的角度考虑,小猪就更愿意选择在食槽边等待食物落出,因为“等待优于行动”,而大猪只能被迫奔忙在踏板和食槽之间。
上述“智猪博弈”的案例是经济学家的假设论证模型,这个博弈的结果,用经济学视角看待,可以解释为:谁占有更多资源,谁就必须承担更多义务。
囚徒困境的博弈论表述囚徒困境是博弈论中的经典问题之一,涉及到两位囚犯的选择,他们会面临到合作与背叛的选择,其结果会影响到他们之间的关系和各自的命运。
以下是囚徒困境的博弈论表述。
第一步,两位囚犯被抓并被关在了不同的牢房里,他们之间无法交流。
警察可以与每个囚犯进行单独的问讯,但对双方的答案会有所保密。
第二步,警察告诉囚犯们,如果他们两个都不承认犯罪,那么他们都会被判入狱1年。
但是,如果其中一个人承认犯罪而另一个人不承认,那么承认犯罪的囚犯将被判入狱3年,而不承认犯罪的囚犯将被判入狱10年。
如果两个人都承认犯罪,那么他们都将被判入狱5年。
第三步,两位囚犯需要作出自己的选择。
如果他们合作并且不承认犯罪,那么他们都可以被判入狱1年,这是对双方最好的结果。
但是,如果其中一个囚犯选择背叛另一个人,并承认犯罪,那么他将被判入狱3年,而另一名囚犯将被判入狱10年。
如果两个人都背叛,那么他们都将被判入狱5年,这是对双方最糟糕的结果。
在这种情况下,每一个囚犯都会寻求自己的最大利益,因为他们之前无法沟通,不可能达成共同合作的结果,因此囚徒困境是一种不稳定的策略。
当他们都选择自我保护而摆脱责任,结果却不如合作的结果好时,则产生了“囚徒困境”。
这个问题反映了在面临群体行动问题时,个体的行动往往与合作的利益是相反的。
因此,在实际生活中,面对这种情况,往往需要我们平衡自我利益与合作利益之间的权衡,才能取得更好的结果。
总之,囚徒困境通过一个简单的例子,提示了现实生活中相当普遍的博弈问题,一定程度上也预示了独裁和相互协作的不同结局。
在此基础上,对于此类博弈问题,我们需要不断探讨和学习,才有可能取得最佳的结果。
十大博弈论经典案例1.《囚徒困境》。
囚徒困境是博弈论中最著名的案例之一。
在这个案例中,两名囚犯被捕,但检察官没有足够的证据来判定他们犯罪。
如果两名囚犯都沉默,他们将被判处较轻的刑罚;如果其中一人选择交代,而另一人保持沉默,那么交代的囚犯将获得豁免,而另一人将被判处重刑;如果两人都交代,他们将被判处较重的刑罚。
在这种情况下,每个囚犯都面临着一个困境,无论对方选择什么,自己都会受到损失。
2.《合作博弈》。
合作博弈是指参与者之间可以进行合作的博弈。
在合作博弈中,参与者可以通过合作来获得更好的结果。
例如,两家公司可以通过合作来共同开发新产品,从而获得更大的利润。
合作博弈强调参与者之间的合作和协调,以实现共同的利益。
3.《竞争博弈》。
竞争博弈是指参与者之间存在竞争关系的博弈。
在竞争博弈中,参与者的利益往往是相互对立的。
例如,两家公司在市场上竞争销售同一种产品,它们的利润往往是相互竞争的。
竞争博弈强调参与者之间的竞争和对抗,以争取最大的利益。
4.《博弈的策略》。
在博弈中,参与者可以选择不同的策略来影响结果。
策略是参与者在博弈中可以采取的行动。
不同的策略选择会导致不同的结果,而博弈论就是研究参与者如何选择最优策略以达到最大利益的学科。
5.《信息不对称博弈》。
信息不对称博弈是指参与者在博弈中拥有不同的信息。
在这种情况下,有一方可能掌握更多的信息,从而在博弈中占据优势。
信息不对称博弈强调信息的重要性,以及如何在信息不对称的情况下做出最优决策。
6.《博弈的均衡》。
博弈的均衡是指在博弈中参与者达到一种稳定状态的结果。
在这种状态下,参与者不会再改变自己的策略,因为任何单方面的改变都不会给自己带来更好的结果。
博弈的均衡是博弈论中非常重要的概念,它可以帮助我们预测参与者的行为和结果。
7.《博弈的合作与对抗》。
在博弈中,合作和对抗是两种常见的行为方式。
合作可以带来共同的利益,而对抗则是为了争取最大的利益。
在实际的博弈中,参与者往往需要权衡合作和对抗之间的关系,以达到最优的结果。
博弈论——囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。
在重复的囚徒困境中,博弈被反复地进行。
因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。
1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:甲沉默(合作) 甲认罪(背叛)乙沉默(合作)二人同服刑半年 甲即时获释;乙服刑10年乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年解说如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
囚徒困境(Prisoner's dilemma)囚徒困境是博弈论中具有代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克(Albert tucker)1950年提出来的。
他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最著名的案例。
故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。
2.经典的囚徒困境1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:∙若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
∙若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。