博弈论案例分析
- 格式:docx
- 大小:19.39 KB
- 文档页数:4
博弈论的经典案例五篇博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。
本站为大家整理的相关的博弈论的经典案例供大家参考选择。
博弈论的经典案例篇一囚徒困境学习管理学或经济学的人一定都了解一些博弈论方面的知识。
在博弈论中有一个经典案例囚徒困境,非常耐人回味。
“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了。
但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
博弈论的实例分析一.“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。
讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。
A和B均坦白是这个博弈的纳什均衡。
这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。
即是说,不管A坦白或抵赖,B的最佳选择都是坦白。
反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。
结果,两个人都选择了坦白,各判刑8年。
在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。
二.电信价格竞争根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。
假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。
A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。
正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠,其中就有B的价格可以比P0低10%。
这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。
在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。
这时候,A该怎么做?不妨假定:A降价而B维持,则A获利15,B损失5,整体获利10;A维持且B也维持,则A获利5,B获利10,整体获利15;A维持而B降价,则A损失10,B获利15,整体获利5;A降价且B也降价,则A损失5,B损失5,整体损失10。
十大博弈论经典案例1.《囚徒困境》。
囚徒困境是博弈论中最著名的案例之一。
在这个案例中,两名囚犯被捕,但检察官没有足够的证据来判定他们犯罪。
如果两名囚犯都沉默,他们将被判处较轻的刑罚;如果其中一人选择交代,而另一人保持沉默,那么交代的囚犯将获得豁免,而另一人将被判处重刑;如果两人都交代,他们将被判处较重的刑罚。
在这种情况下,每个囚犯都面临着一个困境,无论对方选择什么,自己都会受到损失。
2.《合作博弈》。
合作博弈是指参与者之间可以进行合作的博弈。
在合作博弈中,参与者可以通过合作来获得更好的结果。
例如,两家公司可以通过合作来共同开发新产品,从而获得更大的利润。
合作博弈强调参与者之间的合作和协调,以实现共同的利益。
3.《竞争博弈》。
竞争博弈是指参与者之间存在竞争关系的博弈。
在竞争博弈中,参与者的利益往往是相互对立的。
例如,两家公司在市场上竞争销售同一种产品,它们的利润往往是相互竞争的。
竞争博弈强调参与者之间的竞争和对抗,以争取最大的利益。
4.《博弈的策略》。
在博弈中,参与者可以选择不同的策略来影响结果。
策略是参与者在博弈中可以采取的行动。
不同的策略选择会导致不同的结果,而博弈论就是研究参与者如何选择最优策略以达到最大利益的学科。
5.《信息不对称博弈》。
信息不对称博弈是指参与者在博弈中拥有不同的信息。
在这种情况下,有一方可能掌握更多的信息,从而在博弈中占据优势。
信息不对称博弈强调信息的重要性,以及如何在信息不对称的情况下做出最优决策。
6.《博弈的均衡》。
博弈的均衡是指在博弈中参与者达到一种稳定状态的结果。
在这种状态下,参与者不会再改变自己的策略,因为任何单方面的改变都不会给自己带来更好的结果。
博弈的均衡是博弈论中非常重要的概念,它可以帮助我们预测参与者的行为和结果。
7.《博弈的合作与对抗》。
在博弈中,合作和对抗是两种常见的行为方式。
合作可以带来共同的利益,而对抗则是为了争取最大的利益。
在实际的博弈中,参与者往往需要权衡合作和对抗之间的关系,以达到最优的结果。
第1篇一、背景随着科技的发展,知识产权在法律中的地位越来越重要。
专利作为知识产权的一种,对于企业的创新和发展具有重要意义。
然而,在专利领域,企业间的专利侵权纠纷也日益增多。
本文将以一起企业间的专利侵权纠纷为例,探讨博弈论在法律中的应用。
二、案例简介某科技有限公司(以下简称“甲公司”)拥有一项名为“智能手机电池管理系统”的发明专利,该专利技术能够有效提高手机电池的使用寿命和稳定性。
甲公司为保护自身合法权益,将乙公司(以下简称“乙公司”)诉至法院,指控乙公司生产的手机电池管理系统侵犯了其专利权。
三、博弈论分析1. 博弈论的基本概念博弈论是一种研究决策行为的数学工具,主要研究参与者在相互影响、相互制约的条件下如何做出最优决策。
博弈论的核心概念包括参与人、策略、支付函数和均衡。
2. 案例中的博弈分析(1)参与人在本案例中,参与人包括甲公司和乙公司。
甲公司作为专利权人,希望维护自身合法权益;乙公司作为侵权方,希望规避专利侵权风险。
(2)策略甲公司的策略包括:①积极维权,通过诉讼手段追究乙公司侵权责任;②与乙公司进行和解,要求赔偿损失;③放弃维权,不再追究乙公司侵权责任。
乙公司的策略包括:①承认侵权,主动与甲公司和解;②否认侵权,积极应诉;③与甲公司进行谈判,寻求折中方案。
(3)支付函数在本案例中,支付函数可以表示为:甲公司:维权成功(赔偿)+ 维权失败(损失)+ 和解(赔偿)+ 放弃维权(0)乙公司:承认侵权(赔偿)+ 否认侵权(诉讼成本)+ 谈判(赔偿)+ 拒绝谈判(侵权风险)(4)均衡根据博弈论,当甲公司和乙公司的策略组合使得双方都无法通过改变策略获得更高的收益时,该策略组合即为均衡。
在本案例中,甲公司和乙公司的均衡策略如下:甲公司:积极维权 + 乙公司承认侵权乙公司:承认侵权 + 甲公司维权成功四、案例分析1. 甲公司选择积极维权的理由甲公司作为专利权人,拥有明确的利益诉求。
在博弈过程中,甲公司通过积极维权,可以提高乙公司侵权成本,促使乙公司主动承认侵权,从而维护自身合法权益。
十大博弈论经典案例博弈论是研究冲突和合作行为的数学理论,主要研究各方在一定规则下作出决策的过程。
在现实生活中,博弈论可以帮助我们分析各种决策情境,揭示行为背后的逻辑。
下面介绍十大博弈论经典案例,展示不同情境下的决策策略及其结果。
1. 囚徒困境囚徒困境是博弈论中最著名的案例之一。
两名囚徒被单独关押,检察官给每人下达选择“合作”或“背叛”的指令。
如果两人都合作,各自判刑较轻;如果其中一人背叛而另一人合作,则背叛者判刑为0,而合作者将被重判;如果两人都背叛,两者皆受重刑。
在这种情况下,每名囚徒都会选择背叛,因为无论另一人选择什么,背叛都是最优选择。
2. 霍巴和鲍勃游戏霍巴和鲍勃游戏是研究博弈过程中的信任和合作的实例。
霍巴拥有100美元,可以选择分享给鲍勃一部分;鲍勃可以选择保留所有款项或回馈一部分给霍巴。
如果鲍勃选择合作并分享款项,那么霍巴会获得更多回报;反之,如果鲍勃保留所有款项,霍巴就会损失。
通过这一博弈,可以观察到信任和合作如何影响双方的回报。
3. 石头剪刀布石头剪刀布是一种简单的博弈,展示了不完全信息博弈的情形。
两名玩家同时出示石头、剪刀或布中的一种手势,胜利者根据规则确定。
在这个博弈中,玩家需要考虑对手可能的策略,选择最佳的手势进行应对。
4. 抢手织物抢手织物是关于资源分配的博弈。
多位玩家竞相争夺一种有限资源,但资源数量不足以满足所有玩家的需求。
玩家需要权衡合作和竞争的策略,以最大化自己的利益。
这个案例揭示了在资源有限的情况下,合作和竞争之间的平衡。
5. 拍卖博弈拍卖博弈是在资源分配中常见的情景。
卖家将物品提供给潜在买家,买家通过出价来竞争物品,最高出价者将得到物品。
在这种情况下,买家需要权衡自己对物品的价值以及出价策略,以获得最大的利益。
6. 鸿门宴鸿门宴是中国古代著名的博弈案例之一。
项羽与刘邦在鸿门相会,项羽有机会消灭刘邦,但最终刘邦却逆袭成功。
这个案例揭示了在战略选择上的巧妙和胜负的关键。
博弈论经典案例在我们的生活中,博弈论的身影无处不在。
从商业竞争到日常决策,从国际关系到体育赛事,博弈论为我们理解和预测人们的行为提供了有力的工具。
接下来,让我们一起探讨几个经典的博弈论案例。
“囚徒困境”是博弈论中最为著名的案例之一。
假设有两个嫌疑犯被警察抓住,但警方没有足够的证据指控他们。
于是,警察将两人分别审讯,并给出了以下的条件:如果两人都保持沉默(不坦白),那么他们都会被判刑 1 年;如果一人坦白而另一人沉默,坦白的人将被释放,沉默的人将被判刑 10 年;如果两人都坦白,那么他们都会被判刑8 年。
从个体的角度来看,每个嫌疑犯都有两个选择:坦白或沉默。
对于嫌疑犯 A 来说,如果嫌疑犯 B 选择沉默,那么 A 坦白会被释放,沉默则判刑 1 年,所以 A 会选择坦白;如果 B 选择坦白,那么 A 坦白判刑8 年,沉默判刑 10 年,A 还是会选择坦白。
同理,对于嫌疑犯 B 也是如此。
因此,最终的结果往往是两人都选择坦白,分别被判刑 8 年。
这个案例反映了个体理性与集体理性之间的冲突。
从个体的角度出发,选择坦白似乎是最优的,但从整体的角度来看,两人都沉默才是最优的结果。
另一个经典案例是“智猪博弈”。
在一个猪圈里,有一头大猪和一头小猪。
猪圈的一端有一个食槽,另一端有一个控制食物供应的按钮。
按一下按钮,会有 10 份食物进入食槽,但按按钮需要付出 2 份食物的体力成本。
如果大猪先去按按钮,小猪在食槽边等待,大猪回来时只能吃到 6 份食物,小猪能吃到 4 份;如果小猪先去按按钮,大猪在食槽边等待,小猪回来时只能吃到 1 份食物,大猪能吃到 9 份;如果两者同时去按按钮,回来后大猪能吃到 7 份食物,小猪能吃到 3 份。
对于小猪来说,无论大猪是否去按按钮,等待总是比去按按钮更有利。
而大猪知道小猪会选择等待,所以大猪只能去按按钮。
这个案例在商业中也有很多应用。
比如在市场竞争中,小企业往往会选择等待大企业开拓市场、承担风险,然后再跟进模仿。
博弈论经典案例分析博弈论作为一门独立的学科,研究的是决策者之间的相互作用和冲突。
在现实生活中,博弈论的应用非常广泛,涉及到经济、政治、军事等各个领域。
本文将通过分析几个经典的博弈案例,来深入了解博弈论的基本原理和应用。
首先,我们来看一个经典的零和博弈案例,囚徒困境。
在这个案例中,两名犯人被关押在不同的牢房,警察向他们提出交代对方的证词的选择。
如果两人都选择沉默,则会被判处较轻的刑罚;如果其中一人选择交代对方,而另一人选择沉默,则沉默的人将被判处重刑,而交代对方的人将获得自由;如果两人都选择交代对方,那么两人都将被判处较重的刑罚。
在这个案例中,每个人的最佳选择是交代对方,但如果两人都这样选择,结果将是最糟糕的。
这个案例展示了在零和博弈中,即使每个人都追求自己的最佳利益,最终的结果可能并不理想。
接下来,我们来看一个非零和博弈案例,围棋。
围棋是一种非零和博弈,即双方的利益并不完全对立。
在围棋中,双方玩家都追求自己的利益,但他们的行动会直接影响对手的利益。
围棋的策略非常复杂,需要考虑到整个棋局的局势和对手的反应。
在这种非零和博弈中,玩家需要不断调整自己的策略,以应对对手的变化。
围棋案例展示了在非零和博弈中,双方玩家需要考虑到对方的利益,寻求最优的策略。
最后,我们来看一个混合博弈案例,竞价拍卖。
竞价拍卖是一种混合博弈,既包括合作又包括对抗。
在竞价拍卖中,每个竞拍者都希望以最低的价格获得物品,但他们也需要考虑到其他竞拍者的行为。
竞价拍卖的策略涉及到出价的时间、出价的金额等多个因素,竞拍者需要综合考虑这些因素来制定自己的策略。
竞价拍卖案例展示了在混合博弈中,竞拍者需要在合作和对抗之间找到平衡,以获得最大的利益。
通过以上案例的分析,我们可以看到博弈论在不同情境下的应用。
无论是零和博弈、非零和博弈还是混合博弈,博弈论都能够为我们提供理论指导,帮助我们理解决策者之间的相互作用和冲突。
在现实生活中,我们也可以运用博弈论的原理来分析和制定策略,以达到最优的决策结果。
智猪博弈案例整理智猪博弈是博弈论中的一种博弈形式,特点是双方参与者在决策时具有局部信息,需要根据对手的动作做出自己的决策。
以下是几个经典智猪博弈案例的整理:1.博弈人数为2的智猪博弈假设有两个智猪A和B参与博弈,每个智猪可以选择合作或背叛对方。
如果两个智猪都合作,每个人得到3个单位的收益;如果两个智猪都背叛,每个人得到1个单位的收益;如果一个智猪背叛而另一个合作,则合作的智猪得到0个单位的收益,背叛的智猪得到5个单位的收益。
在这个案例中,智猪A和B的收益是相互影响的,每个智猪的最佳策略是根据对方的动作来决定自己的决策。
如果一个智猪认为另一个智猪会合作,那么最佳策略就是背叛对方,以获取更大的收益。
但是,如果两个智猪都采取这个策略,那么双方都会得到最小的收益。
2.博弈人数为多的智猪博弈假设有三个智猪A、B和C参与博弈,每个智猪可以选择合作或背叛其他两个智猪。
如果三个智猪都合作,每个人得到3个单位的收益;如果三个智猪都背叛,每个人得到1个单位的收益;如果一个智猪背叛而其他两个合作,则合作的两个智猪得到0个单位的收益,背叛的智猪得到5个单位的收益。
在这个案例中,每个智猪的收益同样是相互影响的,而且与决策涉及的智猪数量有关。
每个智猪的最佳策略是根据其他智猪的动作来决定自己的决策。
如果一个智猪认为其他两个智猪都会合作,那么最佳策略就是背叛其他两个智猪,以获取更大的收益。
但是,如果三个智猪都采取这个策略,那么双方都会得到最小的收益。
3.环形智猪博弈假设有n个智猪A1,A2,...,An参与环形博弈,每个智猪可以选择合作或背叛相邻的智猪。
每个智猪的收益取决于与其合作或背叛的智猪的决策。
在这个案例中,每个智猪面临的决策是基于它相邻的两个智猪的动作。
每个智猪的最佳策略是根据相邻智猪的动作来决定自己的决策,以最大化自己的收益。
这种智猪博弈模型可以用于研究多人博弈中的合作与背叛的变化。
总结起来,智猪博弈是博弈论中的一种重要模型,其特点是参与者在决策时具有局部信息,需要根据对手的动作做出自己的决策。
博弈论的经典案例6篇篇一:博弈论与经典案例赏析如何运用博弈的思想约会女孩如何和自己喜欢的女孩约会,对男孩来说是个很困难的事。
电影中,主人公纳什在酒吧碰见一位美丽的女孩,于是想要与之约会,却发现他的同伴也喜欢那位女孩,于是,他需要想到一种方法,让自己能够和那位女孩约会,当然,他做到了。
显然,在这样一个约会的空间里,有这样几方博弈者:女孩方,纳什,纳什的同伴。
如果纳什和他的同伴们同时去追求这样一位女孩,那么,女孩便处于优势方,她就具有更高的选择权,选择和谁约会。
而这,假使该女孩对纳什及其同伴的选择概率一样,均为q〔0篇二:周樾关于博弈论的一个精彩案例周樾:关于博弈论的一个精彩案例(海盗与金币)在读MBA时,数据模型与决策课堂上教师讲了一个博弈论的案例有点意思,我在推理之后感觉收获很多。
所以整理如下:有五个海盗分别是ABCDE,都非常理性、聪明。
他们找到了100个金币,需要想方法分配金币。
海盗有严格的等级制度,A>B>C>D>E。
海盗有分配原那么:等级最高的海盗提出一种分配方案。
所有的海盗投票决定是否承受分配,包括提议的这个海盗。
方案如果有≥1/2的人同意,那么通过。
假设没通过,那么提议者将被扔进海里,然后由下一个最高职位的海盗提出新的分配方案。
直到最后。
假设你是A,你如何分配?你首先是活命,其次是获得最多的金币。
课堂上很多同学给出了答案,但教师都摇头。
有的说平均分配原那么,每人20金币,但这显然不行,后面4个海盗会投反对票干掉你。
有的说自己少一点,给别人多一点。
这很好理解,A给自己分配的少,以防止被扔进海里,毕竟保命要紧。
但这也不行,一那么没有完成获得最多金币的任务,二那么后面的人都是“海盗〞,不会因为你的一点低调就放过你,仍然会被干掉。
还有的说自己说服另外其中两个海盗干掉另外两个然后平分金币,但这还是不行,因为有前提海盗都是理性的。
越是想不出答案,越有点意思了。
应该如何设计分配方案,保证自己既活命、又收获最多金币呢?教师继续引导我们,如果正向思维经过努力想不通,或者非常复杂,尝试逆向思维,相当于从未来的世界返回到现实的世界。
博弈论博弈论(Game Theory),亦名“对策论”、“游戏理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。
什么是博弈论?古语有云,世事如棋。
生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。
博弈论是研究棋手们“出棋” 招数中理性化、逻辑化的部分,并将其系统化为一门科学。
换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。
现在,我们就一些例子来讨论博弈论相关内容。
一、从“囚徒困境”开始在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’ dilemma)博弈模型。
该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。
如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可表囚徒困境博弈 [Prisoner's dilemma]我们来看看这个博弈可预测的均衡是什么。
对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。
显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。
但是,倘若他们都选择“抵赖”,每人只被判刑1年。
在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。
不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。
要了解纳什的贡献,首先要知道什么是非合作博弈问题。
现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。
话说有一天,一位富翁在家中被杀,财物被盗。
警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。
但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。
于是警方将两人隔离,分别关在不同的房间进行审讯。
由地方检察官分别和每个人单独谈话。
检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。
但是,我可以和你做个交易。
如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。
如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。
但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。
”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。
显然最好的策略是双方都抵赖,结果是大家都只被判一年。
但是由于两人处于隔离的情况下无法串供。
所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。
因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。
这种策略是损人利己的策略。
不仅如此,坦白还有更多的好处。
如果对方坦白了而自己抵赖了,那自己就得坐10年牢。
太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。
所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。
这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。
因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。
也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。
没有人会主动改变自己的策略以便使自己获得更大利益。
“囚徒的两难选择”有着广泛而深刻的意义。
个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。
只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。
“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。
按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。
从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。
我们将例举出许多类似于“囚徒的两难处境” 这样的例子。
如价格战博弈、军奋竞赛博弈、污染博弈等等。
一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。
其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。
所有的博弈问题都会遇到这三个要素。
二、经济学中的“智猪博弈”(Pig s’payoffs)这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。
对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。
反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。
规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。
投食仅原来的一半分量。
结果是小猪大猪都不去踩踏板了。
小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。
谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。
投食为原来的一倍分量。
结果是小猪、大猪都会去踩踏板。
谁想吃,谁就会去踩踏板。
反正对方不会一次把食物吃完。
小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。
投食仅原来的一半分量,但同时将投食口移到踏板附近。
结果呢,小猪和大猪都在拼命地抢着踩踏板。
等待者不得食,而多劳者多得。
每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。
成本不高,但收获最大。
原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。
但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。
为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。
而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。
比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。
这相当于“智猪博弈”增量方案所描述的情形。
但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。
最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。
许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。
股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。
因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。
三、生活中的“占座大战”大学生活中,生活也是比较的丰富,其中,吃饭也是很重要的部分,大家一般都是在学校食堂吃饭,由于大家吃饭的时间比较集中,所以吃饭的时候人数特别多,食堂座位有限,同学们也希望在食堂买完饭后不用再找座位,因此很多同学在买饭之前就用自己的私人物品占座位,为此,食堂也经常发生因为占座位而引起的纠纷。
在这里称为“占座大战”博弈,就这个博弈问题进行讨论;现在就这个问题来进行一个博弈论的分析,两个发生纠纷的人都有两个选择,分别是U(冲上去进行理论,争取座位),D(选择退让,找其他的座位),若两人都进行理论,争取座位的话,很有可能就是两败俱伤,两个人也可能因意见不合而进而出现打架的现象,而且在食堂这个公共场所,对大家的形象都有着很不好的影响;如果一方选择退让,而另外一方则选择理论,则结果可能就是一方另找座位,有些损失,一方占领了座位,取得了胜利;还有就是双方都选择了退让,将座位让给其他人;根据以上的分析,现在有如下的支付图:参与人2U DU -2,-2 1,-1参与人1D -1,1 0,0求解过程(箭头法):参与人2D参与人10,0Nash 均衡——(U,D)和(D,U)进行争论得到座位。
对于这个结果,我们可以这样认识:我们现在认为两个人都是理性的,在一个参与人预测到另一方将会进行理论时,明智的选择就是退让,避免更大的损失,而当预测到对方将会选择退让时,则进行理论,以求得最大的胜利;可以将Nash均衡作为此次“抢座大战”的一致性预测,而其它的结果(U,U)和(D,D)都将不会是一致性预测,就(U,U)来说,对双方而言都不是最好的结果,且受到的损失也会是最大的;再就是(D,D),双方都进行退让,也是不太可能的,当有一方有退让的迹象,另外一方就可能进行理论来求得利益的最大,因此这个结果也不会是一致性的预测,不会是一个均衡,必然会偏离的,向着Nash均衡的方向偏移。