“囚徒困境”引发的思考经济学理论论文
- 格式:doc
- 大小:27.50 KB
- 文档页数:3
囚徒困境的启示和思考二、囚徒困境的解释如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。
另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。
以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。
但根据以上假设,二人均为理性的个人,且只追求自己个人利益。
均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。
这就是“困境”所在。
实际上囚徒困境在我们的实际生活中也有很多,下面举两个进行说明三、经济学例子:关税战两个国家,在关税上可以有以两个选择:提高关税,以保护自己的商品。
(背叛)与对方达成关税协定,降低关税以利各自商品流通。
(合作)当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。
然后二国又重新达成关税协定。
“囚徒困境”引发的思考经济学理论论文囚徒困境”博弈是图克(Tucker)1950年提出的一个著名的博弈模型,是完全信息静态博弈的典型例子。
一、基本模型囚徒困境博弈的基本情况如下:警察抓住了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们所犯的罪行。
如果其中至少有一人供认犯罪,就能确认罪名成立。
为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,并给他们同样的选择机会;如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑;如果两人中有一人坦白认罪,则坦白者从轻认罪,立即释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们将被各判5年监禁。
如果分别用-1、-5和-8 表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即释放的得益,则两囚徒的得益矩阵如下:囚徒2坦白不坦白囚徒1 坦白-5,-5 0,-8不坦白-8,0 -1,-1在上图中,“囚徒1”、“囚徒2”分别代表本博弈中的两个博弈方,也就是两个罪犯;他们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。
其中矩阵中第一个数字代表决策结果后囚徒1的得益,第二个数字代表决策结果后囚徒2的得益。
博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果(各判5年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境”。
[1]二、关于完全理性的思考囚徒困境博弈的一个假设是博弈方都是完全理性。
完全理性来源于经济学中的理性人假设,即博弈方都以个体利益最大化为目标,且有准确的判断选择能力,也不会“犯错误”。
以个体利益最大为目标被称为“个体理性”,有完美的分析判断能力和不会犯选择行为的错误称为“完全理性”。
囚徒困境背后的经济学原理1. 引言囚徒困境是博弈论中的一个经典问题,它涉及到个体在面对合作与背叛之间做出决策时所面临的权衡。
该问题可以通过经济学原理来解释,其中包括效用理论、合作与竞争、信息不对称等基本原理。
2. 效用理论效用理论是经济学中描述个体偏好和决策行为的基本原理。
在囚徒困境中,两个囚徒都希望获得最大化的利益,因此他们会根据自身的效用函数来进行决策。
效用函数可以描述个体对不同决策结果的偏好程度,从而帮助我们分析和预测他们的行为。
3. 合作与竞争囚徒困境涉及到个体之间的合作与竞争关系。
在该问题中,每个囚徒都面临着两种选择:合作或者背叛。
如果两个囚徒都选择合作,他们将获得较好的结果;但如果其中一个人选择背叛而另一个人选择合作,那么背叛者将获得更好的结果,而合作者将获得较差的结果。
这就形成了一个竞争的情景,每个囚徒都希望通过背叛来获得更大的利益。
4. 信息不对称在囚徒困境中,存在着信息不对称的问题。
每个囚徒只能观察到自己的选择和对方的选择,而无法准确了解对方的动机和行为意图。
这种信息不对称导致了决策过程中存在着风险和不确定性。
5. 纳什均衡纳什均衡是博弈论中一个重要的概念,用于描述在博弈过程中各参与者之间达成的一种稳定状态。
在囚徒困境中,如果两个囚徒都采取背叛策略,那么他们将陷入一个互相背叛、互相伤害的局面。
虽然他们可以通过合作来获得更好的结果,但由于彼此之间缺乏信任和信息共享,他们很可能会选择背叛策略。
因此,在囚徒困境中存在着纳什均衡点,即两个囚徒都选择背叛的策略。
6. 支付矩阵支付矩阵是用来描述博弈参与者在不同决策组合下获得的利益或效用。
在囚徒困境中,可以使用一个2x2的支付矩阵来表示两个囚徒的决策结果和相应的利益。
例如,如果两个囚徒都选择合作,他们将分别获得一个较好的结果;如果其中一个人选择背叛而另一个人选择合作,背叛者将获得最好的结果,而合作者将获得最差的结果。
囚徒B选择合作囚徒B选择背叛囚徒A选择合作较好结果最差结果囚徒A选择背叛最好结果较差结果根据支付矩阵可以看出,在囚徒困境中,每个囚徒都有动机去追求自己的最大利益,这导致了难以达成合作并产生了悲观的结果。
囚徒困境经济学原理引言:囚徒困境是博弈论中一个经典的问题,也是经济学中的重要原理之一。
囚徒困境的情境是两个囚徒被捕后被分开审讯,检方没有足够的证据定罪,但却希望能定罪并判刑。
如果两个囚徒都保持沉默,则检方只能以轻罪定罪。
然而,如果其中一个囚徒选择合作并供出另一个囚徒,那么供出者将获得免罪的机会,而被供出者将面临重刑。
如果两个囚徒都选择供出对方,则两人都将面临有限的刑期。
囚徒困境问题展示了个人理性行为在博弈过程中可能导致的不利结果,对经济学有着重要的启示意义。
1.囚徒困境的基本情景囚徒困境的基本情景是两个囚徒在被捕后被审讯,他们面临着个人决策的困难。
在这个情境中,囚徒可以选择合作或背叛对方。
合作意味着保持沉默,而背叛意味着供出对方。
囚徒的决策将决定他们的命运,而他们并不知道对方的选择。
在这种情况下,囚徒需要权衡自己的利益和对方的选择来做出决策。
2.囚徒困境的策略和收益在囚徒困境中,每个囚徒都有两种策略可选择:合作或背叛。
合作的收益是较低的刑期,而背叛的收益是免罪。
然而,如果两个囚徒都选择背叛,那么他们都将面临较长的刑期。
因此,囚徒困境的最佳策略是背叛,因为无论对方选择什么,背叛都能获得更好的结果。
3.囚徒困境的启示意义囚徒困境问题揭示了个人理性行为可能导致不利结果的情况。
尽管合作对于整体利益是最好的选择,但个人追求自身利益往往会导致困境的产生。
囚徒困境的启示意义在于,个体之间的合作需要建立在互信和合作机制的基础上,才能避免困境的发生。
4.囚徒困境与经济学的关系囚徒困境经济学原理在经济学领域有着广泛的应用。
例如,在市场竞争中,企业可能面临类似的囚徒困境。
如果所有企业都选择合作并遵守竞争规则,市场将保持公平竞争的状态。
然而,如果有企业选择背叛并采取不正当手段获取竞争优势,其他企业也会被迫采取同样的策略,从而导致整个市场的恶性竞争。
囚徒困境经济学原理提醒我们,建立公平竞争的机制和规则对于市场的稳定和发展至关重要。
基于“囚徒困境”模型的团队协同分析摘要:本文分析了当今社会团队协同工作的优势和不足,在此基础上,建立基于“囚徒困境”的团队协同影响因素模型,详细阐述了如个体认知差异、冲突处理方式、经验背景、团队沟通等因素对团队协同的影响,最后尝试性初步总结了针对这些问题的解决措施。
关键词:囚徒困境;团队协同;模型一引言当今社会,随着信息化的不断推进,知识经济的迅速发展,各种高科技的推陈出新,社会需求多样化,使得人们生活工作学习中面临的环境非常复杂。
而且,现代社会单靠个人能力已经很难完全处理或独立高效的完成各种复杂的问题。
在这种情况下,团队合作作为一种新的、不可替代的角色由此诞生。
人们开始团队合作,成员相互依赖、相互联系、相互影响、共同合作,共同发挥团队合作的力量,攻破一个个任务和难题。
二研究现状Mead(1976)[1]认为合作是指两个或两个以上的个体为达到共同目标而协同活动,以促使某种既有利于自己又有利于他人的结果得以实现的行为。
她强调参与者朝着一个共同目标工作的合作动机,而非从事项集体活动的显性行为模式。
在囚徒困境研究(Wu & Axelrod,1995)[2]和社会两难研究(Komorita & Parks,1995)[3]中,合作被定义为使另一方利益最大化的行为,与其对应的是最大化自身利益的背叛行为。
随着近年来团队生产方式的流行,有关团队合作的激励机制研究也受到人们的重视。
而在团队生产中,合理的报酬机制将对团队成员的行为起着重要影响。
Lazear(1989)[4]研究了晋升激励机制对于团队协作的作用,研究表明晋升激励只会阻碍团队成员间的相互协作。
Drago(1993)[5]认为如果监督者能够了解员工的帮助行为,就会降低晋升激励机制对于团队合作的消极作用。
同时,他还研究了员工工作差异程度对团队合作的影响作用。
丁荣贵在项目的整体框架下,综合分析完成项目任务所必需的全部能力并组成了不同的能力模块,设计了有效整合项目团队能力的能力整合流程[6]。
从“囚徒困境”角度分析全球变暖的气候问题对于生活中的我们来说,在各种社会经济活动中,我们往往会根据事情的发展变化或者对手的行为来进行预测和判断,同时选择对自己有利的策略。
其实这就是我们通常意义上的博弈行为,在我们的实际中也是随处可见的。
学习了博弈论之后,在老师的讲解和游戏中,我也懂得了这并不是一门精密复杂和充满公式的纯数学学科,而是一门来源于人们生活实践,同时又是用于人们的生活实践的科学。
在接下来的篇幅中,我会介绍博弈论中最常用且最典型的囚徒困境模型,并由此来对生活中的一些现象进行解读。
其实,“囚徒困境”最早是在1950年由美国兰德公司提出的,虽然很简单易懂,但是却反映了博弈问题最基本的特征,而且这个模型很好的解释了生活中许多经济和社会现象,是非常有效的基本博弈模型。
该模型的基本内容如下:两个共谋犯罪的人被关入监狱,不能互相沟通。
如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱八年;若互相揭发,则因证据确实,二者都判刑八年。
由于囚徒为了自身利益的最大化,因此倾向于互相揭发,而不是同守沉默,其博弈矩阵如下:这里可以看到,情境中的两个囚徒都选择了坦白这个看似并不是最合理的策略,但是从两个囚徒的角度来说,这对于他们来说却都是最明智的决定,因为他们都不知道对方的选择,不了解对方的心理,所以只能根据自身利益最大化来选择对于自己最适合的策略。
这也揭示一个关于个人理性的矛盾:从个人利益出发的行为,最终并不一定能给自己带来最大的利益,有时候甚至于适得其反。
其实这种例子在我们的生活中也是累见不鲜,比如我们学生的上课选座位问题。
对于我们大学生来说,每次上课或者听讲座的时候,你会发现超过90%的人在选择座位的时候总会选择一排中最靠边上的位置。
其原因莫过于以下:这个座位出去最方便,能给自己带来最大的便利。
我们来分析一下,假设每个人都考虑自己的利益最大化,那么第一个来的人首先就选择了最靠边上的位置,那么后续来的人则会依次选择次靠近边上的位置,而每来一个人,第一个人就需要起来一次,让他人进去。
囚徒困境的经济伦理学思考囚徒困境是博弈论中的一个经典案例。
大意是说,警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方,而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默,则二人同样判监1年。
若二人都互相检举,则二人同样判监8年。
按照“理性人假设”,他们都各自会选择对自己最有利的策略,即不合作抵赖而选择招供。
但是这样的选择对二人而言却导致了最差的结果。
这个案例对经典经济学中的“看不见的手”理论提出了严重的质疑,个人追逐自己最大化的利益并没有使社会的福利实现帕累托最优,相反却使博弈双方陷入了不合作的困境。
这个有点黑色幽默的现代寓言深刻揭示了个体理性与集体理性的矛盾,个人价值与社会价值的冲突。
虽然困境本身只属模型性质,但在现实中的关税战、广告战、军备竞赛、寡头垄断协议、大锅饭问题、环境保护问题等等,告诉我们这个诅咒般的困境已经渗透到人类生活的各个方面。
传统的经济学已经无法解释这个问题,想要走出囚徒困境,我们必须跳出狭隘的经济价值评论体系,我们必须认识到市场经济不仅是经济的,更是伦理的:它是以人为本的经济,是公平的经济,是多赢的经济。
亚当·斯密在他的两本著作《国富论》和《道德情操论》中分别揭示了经济价值与伦理价值对人们行为的导向作用,可惜更多的人把它们割裂开来,称之为“悖论”。
中外的先哲们也在很久以前就已经提出了经济伦理学的雏形,孔孟对于义与利的论述,亚里士多德关于如何对待财富、如何获得财富的思考。
这些将成为我们走出囚徒困境的密钥。
博弈论中,解决囚徒困境中自利心理导致的整体利益的破坏有几种方法,而这些方法的实质便是经济价值与伦理价值的辩证统一。
第一、惩罚措施。
假如在犯罪团伙、黑社会中,如果出卖“兄弟”,将永远无法在江湖立足,并且其家人也将受到黑社会的追杀。
这种惩罚机制的存在,使得囚徒间彼此合作,从而打破了“囚徒困境”的局面。
走出“囚徒困境”囚徒困境作为博弈论中的一个经典范例,其博弈理论逐渐被经济学、哲学、伦理学、管理学等诸多学科的研究所重视,辩证的看待这一研究现象,是促进人们深入研究相关社会现象的一种特殊的思维路劲和方法。
一、囚徒困境经典案例分析囚徒困境的内容是这样的:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。
博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果(各判2年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境”。
“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。
但是这样的分析是基于单次博弈的基础之上,而在重复的囚徒困境中,博弈会被反复的进行,因而没个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
二、类似囚徒困境的经典案例分析在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。
祖国2019.2上(下转第294页)试析囚徒困境改善方法的理论探讨———以区块链为例文/张怀成摘要:囚徒困境是主流经济学在理论方面的重要问题之一。
该困境如何在实践中有效规避,是本文关注的问题。
本文经过分析发现,囚徒困境是由于“合作”的不确定和“合作带来的额外收益如何分配”的不确定。
同时,注意到区块链作为一种已经获得市场认可且仍然在不断发展中的新兴技术,本文认为,区块链的去中心化、不可篡改的特性有潜力为囚徒困境在现实中改善提供理论上的思路。
关键词:囚徒困境区块链囚徒困境和区块链分别是经济学理论和过去数年间经济现实的前沿。
理论上,囚徒困境是主流微观经济学的研究前沿。
实践上,同一市场上的具有利益冲突的各方如何在合作和冲突中取舍。
客观上,是现实的经济问题。
此外,以比特币、以太坊为代表的区块链技术在最近十年间取得长足发展,其市值已达千亿人民币级别,并且被国家列为重点发展的前沿战略产业,在理论和实践上都是值得关注的热门话题。
一、文献综述Friedman.J [1]认为,重复博弈前提下,博弈双方可以均衡在合作点。
但是,重复博弈在现实中往往意味着重复的时间及物力投入,在合作的预期收益低于所需的成本,就不会合作了。
所以Friedman.J 这个忽略了重复的成本,和现实有所差距。
李玉燕[2]对我国私企劳资博弈的囚徒困境做了分析,认为要想解决囚徒困境就应该建立长期的合作关系。
韦倩[3]则通过无限次重复博弈模型来实现雇主与雇员之间的长期博弈效应。
可以看到,这些研究本质上都是通过重复博弈来达成合作点,也就是需要付出多次博弈的成本,而未能从理论上做出新的探讨及突破。
林小驰和胡叶倩雯[4]认为区块链技术的核心优势是其去中心化的分布结构,使其在应用过程中可以节省大量的成本,并且在节点无需互相信任的分布式系统中实现基于去中心化的点对点交易;不可篡改的时间戳特性解决了数据的真伪问题;灵活的可编程性有益于使市场秩序变得更加规范。
杨晓晨和张明[5]通过对比特币运行原理的阐述,剖析了比特币的典型特征。
囚徒困境背后的经济学原理囚徒困境是博弈论中重要的经典问题。
在这个问题中,两名罪犯被警方逮捕,但警方缺乏证据,因此只能依靠两人的口供来定罪。
由于两人之间的不信任和互相指责,如果两人都坦率地承认自己的罪行,他们将会被判处重刑。
如果两人都保持沉默,他们只能被判处轻罪。
如果一个人坦白,而另一个人坚持沉默,则坦白者可以获得从轻发落的待遇,而沉默者则可能会被判处重刑。
这种情况下,每个人最优的选择应该是沉默,因为这是不论其它人如何选择,对自己来说最优的选择。
博弈论的解说明了这种情况下的悖论:每个人都会选择坦白,因为坦白可以提供更好的结果,但最后的结果对每个人来说却是最糟糕的。
这个例子揭示了一些重要的经济学原理和决策理论的思想:1. 不合作的博弈可能会导致不太理想的结果。
由于沉默是一个合作的选择,缺乏协调和互信可能会导致不合作。
在这种情况下,没有一种策略能够保证结果最好,因为每个人的最优策略都取决于对方的策略选择。
3. 因果关系可能是相反的。
在囚徒困境中,每个人的最优策略都是坦白,但这个选择却导致了最糟糕的结果。
结果并不是因为这个选择本身是糟糕的,而是因为两个人的选择相互影响。
这个例子表明,博弈论分析中因果关系可能是相反的。
4. 某些限制可能有助于改善结果。
在囚徒困境中,不全面的逮捕和刑罚规则可能导致最糟糕的结果。
如果警方有足够的证据来确认每个人的罪犯身份,或者刑罚规则可以鼓励合作,可能会有更好的结果。
囚徒困境背后的经济学原理指出了协调和信任在决策过程中的重要性,同时也强调了不同策略的影响和结果可能出现的悖论。
在现实生活中,这些原则对于政治、商业和经济决策的制定都有重要的指导意义。
如何解决囚徒困境?通过政策制定:囚徒困境中最优的结果是两个人都沉默,因为这可以降低整体刑罚程度。
当两个人不能沟通的情况下,这种结果很难得到。
相应的,制定政策可以引导人们采取更合作的选择,以奖励为中心的刑罚制度可以促进合作和信任。
共同合作的文化可以通过教育和社区监管来建立,并创造更利于信任的环境。
“囚徒困境”引发的思考经济学理论论文囚徒困境”博弈是图克(Tucker)1950年提出的一个著名的博弈模型,是完全信息静态博弈的典型例子。
一、基本模型囚徒困境博弈的基本情况如下:警察抓住了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们所犯的罪行。
如果其中至少有一人供认犯罪,就能确认罪名成立。
为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,并给他们同样的选择机会;如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑;如果两人中有一人坦白认罪,则坦白者从轻认罪,立即释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们将被各判5年监禁。
如果分别用-1、-5和-8 表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即释放的得益,则两囚徒的得益矩阵如下:囚徒2坦白不坦白囚徒1 坦白-5,-5 0,-8不坦白-8,0 -1,-1在上图中,“囚徒1”、“囚徒2”分别代表本博弈中的两个博弈方,也就是两个罪犯;他们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。
其中矩阵中第一个数字代表决策结果后囚徒1的得益,第二个数字代表决策结果后囚徒2的得益。
博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果(各判5年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境”。
[1]二、关于完全理性的思考囚徒困境博弈的一个假设是博弈方都是完全理性。
完全理性来源于经济学中的理性人假设,即博弈方都以个体利益最大化为目标,且有准确的判断选择能力,也不会“犯错误”。
以个体利益最大为目标被称为“个体理性”,有完美的分析判断能力和不会犯选择行为的错误称为“完全理性”。
完全理性包括追求最大利益的理性意识、分析推理能力、识别判断能力、记忆能力和准确行为能力等多方面的完美性要求,其中任何一方面不完美就不属于完全理性。
[1]我们可以看出,这是一个要求非常严格的假设。
即便如此,完全理性仍在一个方面没有做出规定(至少是没有意识到或明确地规定出来),就是思维方式,也即是博弈方是以将问题分解的方式来思考问题呢,还是以系统的整体的方式来思考问题的。
我引用《第五项修炼》上的一段话来表达这两种思维方式的不同。
自幼我们就被教导把问题加以分解,把世界拆成片片段段来理解。
这显然能够使复杂的问题容易处理,但是无形中,我们却付出了巨大的代价——全然失掉对“整体”的连属感,也不了解自身行动所带来的一连串后果。
于是,当我们想一窥全貌时,便努力重整心中的片段,试图拼凑所有的碎片。
但是就如物理学家鲍姆(David Bohm)所说的,这只是白费力气;就像试着重新组合一面破镜子的碎片,想要看清镜中的真像。
经过一阵子努力,我们甚至干脆放弃一窥全貌的意图。
现在我们以系统的整体的思维方式来重新分析囚徒困境博弈。
警察的目的是获得证据,以使囚徒获得应有的惩罚,囚徒的目的是“获取”最少的惩罚。
双方的这种矛盾使得囚徒有串通的倾向,为了离间两个囚徒,警察确立了模型中的规则(且不论这些规则和设置合不合理)。
对每个囚徒来说,要想达到自身的目的,而不考虑整个模型设置的目的,很显然是不行的。
囚徒该如何选择呢?答案是不坦白。
如果囚徒看出了该模型的目的,若选择坦白,以自推人,对方也会选择坦白,必然落入警察的圈套,此所谓鹬蚌相争,渔翁得利。
当两博弈方都用系统思维来考虑这个问题时,相互配合1是其最好的选择,因为在完全理性假设前提下,自己选择坦白而另一方选择不坦白,这种机会是没有的,这种饶幸心理也是取不得的,剩余的只有要不都坦白,要不都不坦白,所以相互配合是其最好的选择,结果一定是不坦白。
此所谓兄弟阋于墙,外御其侮,这也是空城记能够唱成的原因。
如果任何博弈方不是采用系统的思维方式来思虑这个问题的,因为一方用分解的思维方式来思考囚徒困境,他会选择坦白,那么另一方不管用什么思维方式来思考这个问题,选择坦白都是最好的,因此其结果必然是都坦白。
三、关于概率的思考从概率上来说,都坦白的概率上是非常大的,可能很接近1或者等于1。
但概率没有表示出事件到底是怎么样发生的,它只表示了发生的可能。
概率等于1代表的是事件发生的可能性是100%,而不是事件发生了;同样,概率为0代表的是事件发生的可能性为0,但这不能就此说事件不会发生了。
例如,我们掷飞镖,从理论上讲,对于圆盘上每一点来说概率都为0,但只要我们把飞镖掷到了圆盘上,对于圆盘上的被掷到的(转载自中国教育文摘,请保留此标记。
)那一点来说,被掷到的概率为0,但它还是被掷到了,事件还是发生了。
这有点像红军的爬雪山过草地,在蒋介石看来,并且从当时的历史和实际来看,红军的爬过雪山走过草地的可能性为0,但正是这个0的概率,使中国的历史走到了今天。
反过来,我们也可以说概率等于1的事件不一定就发生。
在概率论中,随机变量分为离散型随机变量和连续型随机变量两种。
对于离散型随机变量,由于其对概率为0的可能值不会包括在内,这使我们习惯性地把概率为0的可能值视为不会发生。
也正是由于此,我们无法找到概率为0的离散型随机变量,也就无法证明它会发生。
对于任意的连续型随机变量,对于任何常数和(),。
对于随机变量的取值范围内的任何一点来说,其概率为,显然为0;对于某一事件来说,其发生的值假定为,那么,我们得出在概率为0的点事件发生了。
在大家都认为都坦白的概率等于1时,其实其前提是大家都是以分解的思维方式来考虑问题的。
现在我们假定在社会中用系统思维方式考虑问题的人占所有社会人的(),用分解思维方式考虑问题的为。
假定用系统思维方式考虑问题的人相遇时,囚徒困境的结果是都不坦白。
假定一方坦白,另一方不坦白的概率为0。
假定两种不同的思维方式相遇或都用分解思维方式时,结果都是坦白。
那么警察能够达到目的的概率为。
在双方都知道对方是什么样的思维方式的前提下,一方坦白另一方不坦白的博弈结果,因为其概率为0,所以不会对我们的概率(统计)结果有什么明显的影响。
然而就某一次博弈来说,我们无法确定最后的结果是什么,只能说一切皆有可能发生。
四、关于完全信息的思考关于完全信息,我的问题是完全信息是等于共同知识还是等于一致信念?共同知识指的是“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道……”的知识。
一致信念是指这种情况,即使所有参与人“共同”享有某种知识,每个参与人也许并不知道其他参与人知道这些知识,或者并不知道其他人知道自己拥有这些知识。
[2]张维迎在《博弈论与信息经济学》中关于完全信息的表述为:完全信息是指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性。
信息是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。
谢识予在《经济博弈论》在的表述为:各博弈方都完全了解其他博弈方各种情况下得益的博弈称为“完全信息(Complete Information)博弈”。
我们可以看出,张维迎认为完全信息即没有事前的不确定性,也就是说完全信息等于共同知识。
谢识予认为只要各博弈方都完全了解其他博弈方各种情况下得益就是完全信息,可以说他认为完全信息等于一致信念。
当完全信息等于共同知识时,就如上面的分析。
但当完全信息只等于一致信念时,情况就会变得比较复杂。
在完全信息等于一致信念的情况下,我们假定囚徒困境中的博弈方只知道各博弈方在各种情况下得益,任何一方都不知道另一方知道不知道自己知道这些得益以及以后的情况2。
如果我们假定双方都以对方不知道自己知道这些得益为前提来思考这个博弈,那么情况会怎么样呢?因为囚徒困境中的均衡是一个上策纳什均衡,在分解思维方式下,不管自己还是对方知道不知道这些信息,自己的上策都是坦白,所以在信息方面不用考虑那么多。
但在系统思维方式下,如果完全信息仅仅是一致信念,以后的信息就可以说是具有不确定性。
在面临不确定性时,我们的完全理性假设就不成立,因为不确定性是指决策者根本不知道某一变量有几个可能的取值,更不知道第一可能值发生的概率;Knight(1921)指出有限理性的根基是所谓的“根本的不确定性”。
可以和完全理性并存的是不完全信息或称风险,即决策者知道某一变量所有可能的取值,以及每一值发生的概率。
[3]因此,完全信息应该等于共同知识,否则我们无法分析囚徒困境。
通过以上的分析,本文认为,即便我们对囚徒困境的前提假设再增加上以分解思维方式思考和完全信息等于共同知识,在面临概率的问题时我们仍然不能确保囚徒困境一定发生,要不现实中对犯罪的审问也就非常简单了。
参考文献:[1]谢识予.经济博弈论[M].上海:复旦大学出版社,2002.[2]张维迎.博弈论与信息经济学[M].上海:上海三联书店上海人民出版,2002.[3]杨小凯.不完全信息与有限理性的差别[N].经济学信息报.2001-11-23.1. 此处的相互配合不是指串通或合作,是指各博弈方在得益驱动下各自自觉、独立采取的合作态度和行为。
2. 以后的情况是指任何一方都不知道任何一方都不知道另一方知道不知道自己知道这些得益,任何一方都不知道任何一方都不知道任何一方都不知道另一方知道不知道自己知道这些得益……本文《“囚徒困境”引发的思考经济学理论论文》来自中国教育文摘,查看更多与相关文章请到。