从两个博弈论的例子浅谈理性问题
- 格式:pdf
- 大小:61.10 KB
- 文档页数:1
经典的博弈案例【篇一:经典的博弈案例】博弈论的几个经典例子散文吧>>博弈论的几个经典例子请点击上面“m龙的微观”欢迎订阅关注!一、囚徒困境故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。
警察知道两人有罪,但缺乏足够的证据。
警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。
于是,每个囚徒都面临两种选择:坦白或抵赖。
然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。
结果,两个嫌疑犯都选择坦白,各判刑八年。
如果两人都抵赖,各判一年,显然这个结果好。
但这个帕累托改进办不到,因为它不能满足人类的理性要求。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
二、旅行者困境两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。
提取行李的时候,发现花瓶被摔坏了,于是他们向航空公司索赔。
航空公司知道花瓶的价格大概在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。
于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。
如果两人写的一样,航空公司将认为他们讲真话,就按照他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,并且原则上按这个低的价格赔偿,同时,航空公司对讲真话的旅客奖励2元,对讲假话的旅客罚款2元。
为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。
可是不,甲很聪明,他想:如果我少写1元变成99元,而乙会写100元,这样我将得到101元。
何乐而不为?所以他准备写99元。
可是乙更聪明,他算计到甲要算计他写99元,于是他准备写98元。
“博弈论”中的经典案例“博弈论”中的经典案例“博弈论”中一些经典案例,不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然。
“博弈论”中有一些由点及面、发人深思的经典案例,这些案例不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然;不仅成为“博弈论”中的一道亮丽风景,也是整个经济学领域中的学术奇葩。
1、囚徒困境假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。
警察局将这两名嫌疑犯分别关押以防他们串供。
两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。
对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。
但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。
对于囚徒A而言,不管囚徒B采取何种策略,他的最佳策略都是交代。
对于囚徒B而言也是如此。
最后两人都会选择交代。
因此,囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。
囚徒困境现象在现实生活中比比皆是。
记得姜昆和唐杰忠过去说过一个公共楼道占用问题的相声。
住户在公共楼道里堆满了杂物,结果大家都极不方便,以致即将分娩的妇女都没法及时被送往医院。
但你如果不占用公共楼道,别人也会占用。
每一居住面积狭小的住户从自我利益最大化出发,都会选择占用。
但占用的结果却最终损害了大家的利益。
前几年,我国彩电市场上,生产厂家基于自我利益选择大幅降价,但由此引发的价格战使所有生产厂家都遭受重创,这也是一种囚徒困境。
2、斗鸡博弈两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。
在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。
博弈论的实例分析一.“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。
讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。
A和B均坦白是这个博弈的纳什均衡。
这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。
即是说,不管A坦白或抵赖,B的最佳选择都是坦白。
反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。
结果,两个人都选择了坦白,各判刑8年。
在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。
二.电信价格竞争根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。
假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。
A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。
正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠,其中就有B的价格可以比P0低10%。
这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。
在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。
这时候,A该怎么做?不妨假定:A降价而B维持,则A获利15,B损失5,整体获利10;A维持且B也维持,则A获利5,B获利10,整体获利15;A维持而B降价,则A损失10,B获利15,整体获利5;A降价且B也降价,则A损失5,B损失5,整体损失10。
经济学中的博弈论案例一、引言博弈论是经济学中的一个重要分支,它研究的是在决策者之间互相影响下的决策问题。
博弈论主要关注的是决策者之间的相互作用和相互影响,因此它在经济学中有着广泛的应用。
本文将通过一个具体案例来阐述博弈论在经济学中的应用。
二、案例背景假设有两家电视台A和B,它们同时播出新闻节目。
观众可以通过电视或网络收看这两个节目。
观众对于新闻节目的喜好程度不同,A电视台的观众喜欢看政治类新闻,而B电视台的观众则喜欢看娱乐类新闻。
三、博弈分析1. 单纯博弈单纯博弈是指只有一次决策机会,并且没有后续行动。
在这个案例中,A电视台和B电视台都只能选择播放政治类新闻或娱乐类新闻。
假设类新闻收视率为10,娱乐类新闻收视率为5。
如果A电视台选择播放娱乐类新闻,B电视台选择播放政治类新闻,则政治类新闻收视率为5,娱乐类新闻收视率为10。
如果两家电视台都选择播放政治类新闻或者都选择播放娱乐类新闻,则政治类和娱乐类的收视率均为7.5。
2. 重复博弈重复博弈是指决策者有多次决策机会,并且每次决策的结果会影响到下一次的决策。
在这个案例中,A电视台和B电视台每天都会播出节目,因此它们之间的竞争是一个重复博弈。
假设A电视台和B电视台在第一天都选择播放政治类新闻,则政治类和娱乐类的收视率均为7.5。
如果第二天A电视台继续播放政治类新闻,而B电视台改变了策略并开始播放娱乐类新闻,则政治类和娱乐类的收视率分别为5和10。
如果A电视台也改变了策略并开始播放娱乐类新闻,则政治类和娱乐类的收视率分别为5和5。
如果两家电视台都选择播放娱乐类新闻,则政治类和娱乐类的收视率均为7.5。
3. 博弈平衡博弈平衡是指在博弈中,每个决策者都采取最优策略,并且没有任何一方可以通过改变策略来获得更多的利益。
在这个案例中,如果A电新闻收视率为10,娱乐类新闻收视率为5。
如果A电视台选择播放娱乐类新闻,B电视台选择播放政治类新闻,则政治类新闻收视率为5,娱乐类新闻收视率为10。
理性与博弈论Joseph Malkevitch关键词:博弈论, 应用数学引言如果你得到一千元,不附带任何条件,你可能会拿钱,然后跑走?如果金额不是一千元,而是一万元,不附带任何条件,你可能会拿钱,而且跑得更快。
但是,如果你在大街上看到一张100元的钞票,而你最近背部已经疼痛难忍,虽然当时你的痛苦减轻了很多,但你可能不会弯腰把它捡起来。
当然,对一毛硬币更不值得弯腰。
经济学家和数学家在解释有关经济行为并提供建议时,会调用“理性”行为的论据来解释人们应该采取什么样的行动。
然而,正如上面的例子所显示的,如果决策者比观察者有更多的信息(比如背部状态),那么观察到的行为和可预期的行为可能不一样。
冯·诺伊曼摩根斯特恩由数学家约翰·冯·诺伊曼(1903-1957)和经济学家奥斯卡·摩根斯特恩(1902-1977)首创的博弈论,提供了许多发人深省的例子,其中逻辑上行得通的行为与实际上看到的行为之间的区别有着天壤之别。
因此,博弈论提供了数学家、心理学家、政治学家、哲学家、经济学家和其他学者一个令人兴奋的舞台,来探索位于他们各自学科核心处的迷人思想并获得探测各种各样的问题的工具。
如果以数学建模的角度来看博弈论,其中博弈论的部分用来提供“现实世界”中的行为表示,则涉及博弈的试验不仅提供了改善我们对人类行为洞察力的方式,而且对博弈论本身也开发出新的方法和思路。
那些熟悉博弈论的读者,可以只略读下一节,它是关于博弈论的一些比较出名的方面。
这个预备材料的目的是对某些博弈进行“标准”博弈理论和实际操作之间的对比。
博弈论的基础知识博弈论已经发展成为一个复杂而多分支的学科。
其基本思想是:有一群人(通常被称为玩家)相互交融,并存在他们希望解决的一些冲突。
为了简单起见,让我们考虑只有两个人(国家或企业)的玩家。
根据由玩家采取的行动或决策,对所涉及的两个人将产生不同的“回报”。
我们假设,该游戏是具有完美信息的博弈。
博弈论经典案例分析博弈论作为一门独立的学科,研究的是决策者之间的相互作用和冲突。
在现实生活中,博弈论的应用非常广泛,涉及到经济、政治、军事等各个领域。
本文将通过分析几个经典的博弈案例,来深入了解博弈论的基本原理和应用。
首先,我们来看一个经典的零和博弈案例,囚徒困境。
在这个案例中,两名犯人被关押在不同的牢房,警察向他们提出交代对方的证词的选择。
如果两人都选择沉默,则会被判处较轻的刑罚;如果其中一人选择交代对方,而另一人选择沉默,则沉默的人将被判处重刑,而交代对方的人将获得自由;如果两人都选择交代对方,那么两人都将被判处较重的刑罚。
在这个案例中,每个人的最佳选择是交代对方,但如果两人都这样选择,结果将是最糟糕的。
这个案例展示了在零和博弈中,即使每个人都追求自己的最佳利益,最终的结果可能并不理想。
接下来,我们来看一个非零和博弈案例,围棋。
围棋是一种非零和博弈,即双方的利益并不完全对立。
在围棋中,双方玩家都追求自己的利益,但他们的行动会直接影响对手的利益。
围棋的策略非常复杂,需要考虑到整个棋局的局势和对手的反应。
在这种非零和博弈中,玩家需要不断调整自己的策略,以应对对手的变化。
围棋案例展示了在非零和博弈中,双方玩家需要考虑到对方的利益,寻求最优的策略。
最后,我们来看一个混合博弈案例,竞价拍卖。
竞价拍卖是一种混合博弈,既包括合作又包括对抗。
在竞价拍卖中,每个竞拍者都希望以最低的价格获得物品,但他们也需要考虑到其他竞拍者的行为。
竞价拍卖的策略涉及到出价的时间、出价的金额等多个因素,竞拍者需要综合考虑这些因素来制定自己的策略。
竞价拍卖案例展示了在混合博弈中,竞拍者需要在合作和对抗之间找到平衡,以获得最大的利益。
通过以上案例的分析,我们可以看到博弈论在不同情境下的应用。
无论是零和博弈、非零和博弈还是混合博弈,博弈论都能够为我们提供理论指导,帮助我们理解决策者之间的相互作用和冲突。
在现实生活中,我们也可以运用博弈论的原理来分析和制定策略,以达到最优的决策结果。
博弈论66个经典例子篇一:《博弈论三大经典案例》经典的囚徒困境1950年,由就职于兰德公司的梅里尔•弗拉德(Merrill Flood)和梅尔文•德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特・塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:甲沉默(合作)乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑 10年乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。
另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论—-选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
从两个博弈论的例子浅谈理性问题
p蔡宏标 王 陈
摘 要:经济学是一门建立在完全理性假设基础之上的学科,有关
完全理性假设一直备受争议,文章引用两个博弈论的例子(拍卖、海滩占位),说明人们在做出决策时并不是建立在/完全理性0的基础上,更符合实际的是从有限理性出发做出满意而非最优的决策。关键词:理性 有限理性 决策中图分类号:F064.2 文献标识码:A文章编号:1004-4914(2006)09-273-01一、理性认识基础的演变理性人假设是经济学的基础,它的出现使得经济学成为一门相对独立、自成体系的科学。古典经济学提出人是自私的动物,人们从事经济活动的原初动机是在追求自我利益,不是为了公益,而且他在追求目标时,能选择实现其目标手段,并采取行动。新古典经济学把/经济人0置于完全竞争环境中,假定经济人掌握完全的信息,具有无限的计算能力,由此提出了最大化原则,即生产者利润最大化和消费者效用最大化。而且将对手的反应作为一种机械反应。西蒙的/有限理性0理论奠定了现代管理理论的基础,为此他获得1977年的诺贝尔经济学奖。二、是/完全理性0还是/有限理性0经济学所指的理性人是指人是完全理性的,为了探讨经济学中的/完全理性人0的假设,本文引用在经济学教科书出现的一个例子。假设有一个人在拍卖一张1元的美钞,游戏规则是出价最高者得之,出价第2和第3者将按所报价交拍卖人。如果不存在合谋因素,结果这张1元的美钞以3元的价格拍卖出去。咋一看,也许令我们惊讶!怎么会有人愿出3元买1元的美钞呢?这似乎很不/理性0。在这里要注意到这是一个动态的过程,当第一个人出价如0.5元,第二个人会出比他更高但低于1元的价格如0.6元,要是第一人此时不出价,他会损失0.5元,如出价0.7元则获利0.3元(1-0.7),所以他肯定会出价。如此下去,当其中一个人出价到1元时,他的收益是0,但出价次之的人损失的是其报价如0.9元。所以出价次之的人必须出比1元更高的价格,从而使得损失最小,如报价1.1元,这样他的损失只有0.1元小于之前的0.9元。如此反复下去就可能出现用3元买1元美钞的情况。这也就说明了人们在做出决策时总是根据目前的现状及经验做出决策。(至于为什么没人出更高的价格,这与在场的人的收入或预期等有关。)至此很多人会认为这是一个理性行为,至少在过程上是理性的。因为从理性人假说出发,每个人为使自己的效用最大化,必然会使自己损失最小或收益最大化。但是经济学所讲的理性是指人都是/理性经济人0,即理性人都掌握完全的信息,能考虑到各种备选方案,且拥有无限计算能力,那么当他出价低于1元时,他应考虑到会有人出比他更高且低于1元价格。由此,任何低于1元的出价行为都是非完全理性的行为。相反如果一个人出价高于1元,即使他得到此钞票也会损失。故最佳报价应是1元,此时的收益为零。可见,在完全理性的假设下,出现的结果只能是第一人出价1元,然后再没有第二人报出再高的价格,其结果是不可能出现用3元买1张1元的钞票。而在微观经济学中,该例子却被经常引用,这是相互矛盾的,那么为什么该例经常出现于经济学教科书中,唯一可以解释的是在本例中假设前提不是/完全理性0,而是/有限理性0。微观经济学是以完全理性的经济人为假设前提,完全理性的假设都在以下三种条件下做出:第一,可供选择的备选行为是已知且固定的;第二,各种选择的结果的概率分布是已知的(对主观概率而言);第三,目的是为了使一个给定的效用函数的期望值最大化。这种假设条件非常严格,与实际生活不相符,所以在运用方面受到很大限制。
如果在有限理性的假设下,情况就不一样了。有限理性是指决策
者无法找到全部的被选方案,也不可能知道各种状态下出现的客观概
率及不同状态下对自己的支付意义,在多数情况下并不能对环境的任
何变化做出最优的反应,且处理信息的能力有限。可见,在完全理性论
下,做出决策选择者必须满足一些严格的要求。首先,选择者必须要有
能力给每个可能的结果赋以明确的报酬值或至少一个明确的报酬范
围,也就是说决策者必须有能力进行这些计算。而实际上人类在做出
决策时,总是以过去的经验和有关的现状信息为依据,不可能考虑到所
有的备选方案,当他遇到能达到目的的第一个满意的方案,通常就是实
际选择的方案,所以结果不一定是最优的结果。因此,西蒙认为,有关
决策的合理性理论必须考虑人的基本生理限制以及由此引起的认识上
的限制。人类选择机制应该是有限理性的适应机制,而不是完全理性
的最优机制。
以下引用另外一个博弈论的例子(海滩占位)来进一步说明。该例
子讲的是在一个海滩上有两间小商店,假设商店出售同质的东西,顾客
在海滩上平均分布,顾客总是到距离他最近的商店买东西,经过一系列
选择过程,结果是两商店最终将位置都确定在海滩中央。这也是一个
动态博弈的过程。由于海滩上顾客是平均分布的,所以选址在中间能
达到最大收益。但在完全理性的假设下,由于决策者拥有全部信息及
无限信息处理能力,所以两商店在初次确定地址时就应该选择在中间,
而不是经过一系列的换址才最终确定在中央,这是有矛盾的。而为什
么会出现例子中的情况呢?完全理性论是无法解释的。其实,决策者
在处理这类问题时,由于知识和能力两方面的局限性,导致他们不能从
一开始就做出最优的决策,而只能根据自己的经验和现状做出满意的
判断,随着时间的推移,决策者逐渐增加对现状的了解,做出的决策也
越接近于最优。该例中如果决策者不知道海滩上顾客的分布状况或分
布是不均匀的,在有限理性的假设下,最终也会在同一位置上开店,而
在完全理性的假设下是无法确定起始开店的位置的。
三、结论
通过以上两个例子的分析,可知在博弈论中的某些常见例子所得
出的结果是与其假设前提相矛盾的。然而,这样的例子却在经济学的
教科书中屡次出现。如果对经济学的假设前提进行修改,那么问题就
迎刃而解。可见,完全理性由于其基本的假设不符合实际,只有在特定
的情况下才能解释一些现象,因此,西蒙把经济主体在认识方面的局限
性考虑在内)包括知识和能力两方面的局限性,从而使得西蒙的有限
理性论符合更多的实际情况,因此有必要对完全理性人假设作修改。
参考文献:
1.张良桥,冯冲文.理性与有限理性[J].世界经济,2001(8)
2.张义祯.西蒙的/有限理性0理论[J].中共福建省委党校学报,
2000(8)
3.赫伯特#西蒙.现代决策理论的基石[M].北京经济学院出版社,
1989
(作者单位:南华工商学院,广东工业大学华立学院 广东广州
510507)
(责编:郑钊)
)273)
5经济师62006年第9期
p新人新作