博弈论10 均衡概念比较与PBNE的再精炼
- 格式:ppt
- 大小:246.50 KB
- 文档页数:39
博弈论和纳什均衡Revised on July 13, 2021 at 16:25 pm关于博弈论和纳什均衡你应该知道这些美股腾讯财经微博2015-05-25 10:05我要分享139摘要纳什在与命运的博弈中找到均衡;纪念大师最好的方式就是尝试了解博弈论..腾讯财经综合报道风生奥斯卡获奖电影美丽心灵主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸;两人均不幸遇难..事发当时;这辆出租车失控撞向栏杆;两人均被抛出车外..约翰-纳什因发表两篇关于非合作博弈论的重要论文;彻底改变了人们对竞争和市场的看法..他证明了非合作博弈及其均衡解;并证明了均衡解的存在性;即着名的纳什均衡..不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生;曾在麻省理工学院任教;晚年为普林斯顿大学担任数学系教授;死前与82岁妻子艾丽西亚在普林斯顿居住..纳什以研究博弈论闻名;1994年获颁诺贝尔经济学奖..他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域..纳什在数学领域上取得多项突破;但他同时深受精神分裂症困扰;其生平故事在2001年被改编成电影美丽心灵;赢得包括最佳电影在内的4项奥斯卡奖项..尽管西维亚-纳萨斯Sylvia Nasars广为人知的小说美丽心灵A Beautiful Mind和改编自该书的、由拉塞尔-克罗Russell Crowe主演的同名奥斯卡电影探究了纳什错综复杂的生平;但都没有深入挖掘他的数学思想..他的数学成果依然不被大众所熟知..在当今科学界;人们普遍认为;与牛顿和爱因斯坦的数学理论相比;纳什的数学理论触及到的学科更多..牛顿和爱因斯坦的数学旨在处理物理问题;而纳什的数学却可以应用在生物学和社会学领域..如若不是精神疾病的困扰;纳什今天可能已与那些科学伟人齐名..尽管如此;他在几个数学领域的重要贡献大家有目共睹..他最大的成就来自于经济学方面..由于他在博弈论上的开创性成就;他与约翰海萨尼John Harsanyi和莱茵哈德-泽尔腾Reinhard Selten一起获得了1994年诺贝尔经济学奖..什么是博弈论与纳什均衡博弈论 :亦名“对策论”、“赛局理论”;属应用数学的一个分支;主要研究公式化了的激励结构间的相互作用..是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题;具有斗争或竞争性质现象的数学理论和方法..也是运筹学的一个重要学科..博弈论考虑游戏中的个体的预测行为和实际行为;并研究它们的优化策略..纳什均衡:又称为非合作博弈均衡;是博弈论的一个重要术语;以约翰-纳什命名..假设有n人局中人参与博弈;给定其他人策略的条件下;每个局中人选择自己的最优策略个人最优策略可能依赖于也可能不依赖于他人的战略;从而使自己利益最大化..所有局中人策略构成一个策略组合..纳什均衡指的是这样一种战略组合;这种策略组合由所有参与人最优策略组成..即在给定别人策略的情况下;没有人有足够理由打破这种均衡..纳什均衡;从实质上说;是一种非合作博弈状态..近代对于博弈论的研究;开始于策墨咯;波雷尔及冯-诺伊曼..1928年;冯-诺依曼证明了博弈论的基本原理;从而宣告了博弈论的正式诞生..1944年;冯-诺依曼和摩根斯坦共着的划时代巨着博弈论与经济行为将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域;从而奠定了这一学科的基础和理论体系..1950~1951年;约翰-福布斯-纳什利用不动点定理证明了均衡点的存在;为博弈论的一般化奠定了坚实的基础..纳什的开创性论文n人博弈的均衡点1950;非合作博弈1951等等;给出了纳什均衡的概念和均衡存在定理..此外;塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用..今天博弈论已发展成一门较完善的学科..博弈论起源于研究人们玩扑克poker、象棋chess等室内游戏时的行为决策;后来作为一种研究人类经济行为的数学工具得到了充分的发展..从根本上讲;博弈论涉及到从打网球到指挥战争的任何牵扯策略的情景..博弈论提供了一种计算各种可能决策所产生效益的数学方法;该理论为在各种竞赛性场合做出最佳决定建立了一套具体的数学公式..正如经济学家赫伯特-金迪斯Herbert Gintis所说;博弈论是我们“研究世界的一种工具”..但它不仅仅是一种工具;“它不仅研究人们如何合作;而且研究人们如何竞争”..同时;“博弈论还研究行为方式的产生、转变、散播和稳定..”博弈论与纳什均衡的发展和应用博弈论不是纳什发明的;但他扩大了该理论的范围;为之提供了解决实际问题的更有力工具..在一开始;他的研究成果并没有受到人们的重视..他的文章发表在20世纪50年代;在当时博弈论仅在冷战分析家之间流传;这些分析家认为国际侵略和利益最大化之间有一些相似之处..在经济学界;博弈论还被视为一种新奇事物..经济学家萨缪-鲍尔斯Samuel Bowles告诉我说:“在当时博弈论羽翼未丰;如同经济学中其它许多优秀的思想一样;它还没有受到人们的关注..”然而在20世纪70年代时情况发生了改变;进化论学派的生物学家开始采用博弈论研究动植物中的生存竞争现象..紧接着在20世纪80年代;经济学家终于开始以各种不同方式将博弈论应用于经济学中;尤其是将它用在设计真实试验以验证经济学理论方面..到80年代末博弈论在经济学领域已经充分显示了它的作用; 这最终促成了纳什等1994年诺贝尔经济学奖的获得..早在此之前;博弈论就已经出现在许多学科的课程中..数学系、经济学系、生物学系、还有政治科学系、心理学系和社会科学系的课程中都含有博弈论的内容..到了21世纪初;博弈论的应用更为广泛;涉及到从人类学到神经生物学等多个领域..现今;经济学家继续使用博弈论分析人们如何做出有关金钱的决策;生物学家用它来建立假说以解释适者生存原理和利他主义的起源;人类学家使用它来研究原始文化;从而说明人性的多样化;神经科学者也加入了博弈论研究的行列;通过研究博弈者的大脑;试图发现决策如何反映人们的动机和情感..简言之;纳什的数学理论连同在其在其基础上建立起来的现代博弈论已经成为科学家研究众多与人类行为相关课题时的首选方法..博弈论和纳什均衡的几个经典案例智猪博弈Pigs’payoffs猪圈里有两头猪;一头大猪;一头小猪..猪圈的一边有个踏板;每踩一下踏板;在远离踏板的猪圈的另一边的投食口就会落下少量的食物..如果有一只猪去踩踏板;另一只猪就有机会抢先吃到另一边落下的食物..当小猪踩动踏板时;大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板;则还有机会在小猪吃完落下的食物之前跑到食槽;争吃到另一半残羹..那么;两只猪各会采取什么策略答案是:小猪将选择“搭便车”策略;也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间..原因何在因为;小猪踩踏板将一无所获;不踩踏板反而能吃上食物..对小猪而言;无论大猪是否踩动踏板;不踩踏板总是好的选择..反观大猪;已明知小猪是不会去踩动踏板的;自己亲自去踩踏板总比不踩强吧;所以只好亲力亲为了..枪手博弈王者的悲哀..三人对枪自决;甲乙丙枪法优劣递减..最后无奈而神奇的结局;将不取决于同时开枪还是先后开枪;最优良的枪手;倒下的概率将最高;而最蹩脚的枪手;存活的希望却最大..因为没有人会把威胁最小的枪手列为一号清楚目标..在这里;后发制人的弱势者将胜出..以弱胜强;绝不是神话..囚徒困境假设有两个小偷A和B联合犯事、私入民宅被警察抓住..警方将两人分别置于不同的两个房间内进行审讯;对每一个犯罪嫌疑人;警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行;交出了赃物;于是证据确凿;两人都被判有罪..如果另一个犯罪嫌疑人也作了坦白;则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖;则以妨碍公务罪因已有证据表明其有罪再加刑2年;而坦白者有功被减刑8年;立即释放..如果两人都抵赖;则警方因证据不足不能判两人的偷窃罪;但可以私入民宅的罪名将两人各判入狱1年..关于这个案例;显然最好的策略是双方都抵赖;结果是大家都只被判1年..但是由于两人处于隔离的情况;首先应该是从心理学的角度来看;当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当-斯密的理论;假设每个人都是“理性的经济人”;都会从利己的目的出发进行选择..这两个人都会有这样一个盘算过程:假如A坦白;B抵赖;B得坐10年监狱;B坦白最多才8年;B要是抵赖;A就可以被释放;而B会坐10年牢..综合以上几种情况考虑;不管A坦白与否;对B而言都是坦白了划算..两个人都会动这样的脑筋;最终;两个人都选择了坦白;结果都被判8年刑期..博弈论和纳什均衡的重要影响博弈论所研究的是理性的决策者之间冲突及合作的理论;可以为实际决策提供理论基础和方向指导..其最终追求结果是使博弈方达到利益最大化的均衡..在生活中;博弈仍然无处不在..博弈论代表着一种全新的分析方法和全新的思想..诺贝尔经济学奖获得者保罗-萨缪尔逊如是说:要想在现代社会做个有价值的人;你就必须对博弈论有个大致的了解也可以这样说;要想赢得生意;不可不学博弈论;要想赢得生活;同样不可不学博弈论..纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础;正如克瑞普斯Kreps;1990在博弈论和经济建模一书的引言中所说;“在过去的一二十年内;经济学在方法论以及语言、概念等方面;经历了一场温和的革命;非合作博弈理论已经成为范式的中心;在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中;现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域..”腾讯财经综合。
博弈联均衡模型博弈论模型图示博弈可划分为合作博弈和非合作博弈,1人们一般讲到的都是指非合作博弈,它有四种不同类型的博弈,即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。
这四种均衡中最为基本的是纳什均衡。
2完全信息静态博弈——纳什均衡、完全信息动态博弈——子博弈精炼纳什均衡不完全信息静态博弈——贝叶斯纳什均衡、、不完全信息动态博弈——精炼贝叶斯纳什均衡,与上述相对应的是、、、。
这四种均衡中最为基本的是纳什均衡。
完全信息静态博弈(纳什均衡)债务人强硬妥协1这两者的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议:如能达成就是合作博弈;反之就是非合作博弈。
合作博弈强调团体理性,强调效率和公平,非合作博弈强调理性个人的最优决策,其结果是否有效率则是不确定的。
2所谓纳什均衡,指的是所有参与人最优选择的一种组合,在这种组合下,给定其他人的选择,没有任何人有积极性做出新的选择。
纳什均衡的哲学思想是:给定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。
换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。
当博弈中的所有参与人事先达成一项协议,给出每个人的行为规则。
在没有外在强制力约束时,当事人是否会自觉地遵守这个协议?或者说这个协议是否可以自动实施?如果当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡。
参见张维迎:“经济学家看法律、文化与历史”,载张维迎《产权、政府与信誉》,三联书店2001年版。
囚徒困境□ 文/柯华庆“囚徒困境”最早是由美国普林斯顿大学数学家曾克1950年提出来的。
他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论。
这个故事后来成为博弈论最经典的案例。
故事的内容如下:两个犯罪嫌疑人被捕并受到指控,但除非至少其中至少有一个人供认犯罪,警方缺乏足够的证据指证他们所犯的罪行,从而将他们按罪判刑。
第22卷哈尔滨师范大学自然科学学报Vol .22,No .42006第4期NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY博弈论与纳什均衡郭 鹏(中国矿业大学)杨晓琴(鸡西大学)【摘要】 纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础.关键词:博弈论;纳什均衡;非合作博弈收稿日期:2006-02-150 引言博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具.简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是效用(U tility ),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈.1 博弈论的主要思想一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失.博弈论模型可以用五个方面来描述:G ={P,A,S,I,U )P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标.A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.S:博弈的进程,也是博弈进行的次序.局中人同时行动的一次性决策的博弈,称为静态博弈;局中人行动有先后次序,称为动态博弈.I:博弈信息,能够影响最后博弈结局的所有局中人的情报.信息在博弈中占重要的地位,博弈的赢得很大程度上依赖于信息的准确度与多寡.得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈.反之为不完全信息博弈.在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动.如果完全了解则称之为“具有完美信息”的博弈.反之称为“不完美信息的动态博弈”.由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果.U:为局中人获得利益,也是博弈各方追求的最终目标.根据各方得益的不同情况,分为零和博弈与变和博弈.零和博弈中各方利益之间是完全对立的.变和博弈有可能存在合作关系,争取双赢的局面.博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论.前者主要强调的是团体理性;而后者主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,即策略选择问题,强调的是个人理性.两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议.倘若不能,则称非合作博弈,非合作博弈是现代博弈论的研究重点.博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识(信息)是否了解两个角度进行.把两个角度结合就得到了4种博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈.严格地讲,博弈论并不是经济学的一个分支,它只是一种方法,这也是为什么许多人将其看成数学的一个分支的缘故.博弈论已经在政治、经济、外交和社会学领域有了广泛的应用,它为解决不同实体的冲突和合作提供了一个宝贵的方法.目前谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡.在这一点上,博弈论和经济学家的研究模式是完全一样的.经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和相互作用,人与人之间利益和中突、竞争与合作,而这正是博弈论的研究对象.2 博弈论的代表人物博弈论主要是由冯・诺依曼(1903~1957)所创立的.他是一位出生于匈牙利的天才的数学家.他不仅创立了经济博弈论,而且发明了计算机.早在20世纪初,塞梅鲁(Zer mel o)、鲍罗(Borel)和冯・诺伊曼(Von Neumann)已经开始研究博弈的准确的数学表达,直到1939年,冯・诺依曼遇到经济学家奥斯卡・摩根斯坦思(O skar Morgenstern)并与其合作才使博弈论进入经济学的广阔领域.1944年他与奥斯卡・摩根斯坦恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的初步形成.书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础.合作型博弈在20世纪50年代达到了巅峰期.然而,诺依曼博弈论的局限性也日益暴露出来,它过于抽象,应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,影响力很有限.正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始.纳什是一位天才式的人物,上大学时就开始从事纯数学的博弈论研究,特别是在经济博弈论领域,他做出了划时代的贡献,是继冯・诺依曼之后最伟大的博弈论大师之一.他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用.后续的研究者对博弈论的贡献,都是建立在这一概念之上的.由于纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础.纳什博士1950年11月刊登在美国全国科学院每月公报上的两篇论文将冯・诺依曼的“最小最大原理”推广到非合作博弈领域,找到了普遍化的方法和均衡点,比冯・诺伊曼的合作博弈理论更能反映现实的情况.20世纪50年代以后,泽尔腾、海萨尼等人对博弈论作了进一步的完善,使之更为实用.近20年来,博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到广泛的应用.3 纳什均衡与博弈论的应用“囚徒困境”(Pris oner’s D ile mma)至今仍然是博弈研究的重要课题.两个嫌疑犯作案后被警察62哈尔滨师范大学自然科学学报 2006年逮捕,分别关在不同的屋子里审讯,警察告诉他们,如果两个人都坦白,那么每人判刑8年;如果两个人都抵赖,每人各判刑1年;如果其中一人坦白,另一人抵赖的话,坦白的人释放,抵赖的人判刑10年.这里每个囚徒都有两种战略:坦白或抵赖;在这个博弈中,纳什均衡是(坦白,坦白),尽管从总体上看,(抵赖、抵赖)是对两个人都有益的结果,但由于不构成纳什均衡,所以不是该博弈的解,给定B坦白的情况下,A的最优战略是坦白;同样,A坦白的前提下,B的最优战略是坦白, AU最优战略的组合却不是总体最优的选择,有没有可能其中一个选:择抵赖呢?按照人是理性的假设,没有人会积极地这么做,因为如果对方坦白的话,自己就可能判刑10年,理性的人是不会冒这种险的。
博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石,对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。
本文首先将博弈划分为不同的类型,并对主要的均衡概念进行了数学描述,最后对不同的均衡概念进行了比较。
【关键词】博弈论;纳什均衡;重复博弈博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。
但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。
在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。
因此,本文将主要的博弈均衡概念进行分类和表述,并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。
一、博弈的主要类型博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。
依据不同的分类标准,博弈可以被划分为不同的类型。
1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。
动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。
Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。
重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。
2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。
博弈中的均衡理论博弈中的均衡理论在《童区寄传》中,我们说,区寄与强盗的博弈最后形成的是一种纳什均衡。
为什么这样说呢?首先我们看看纳什均衡,纳什均衡就是在给定别人最优的情况下,自己最优选择达成的均衡。
通俗的讲,就是给定你的最优选择,我会选择能够使我最优的选择,或者说,我选择在给定你的选择的情况下我的最优选择,你选择了给定我选择情况下你的最优选择。
也就是说,纳什均衡是各自认为做出了对自己最有利的选择。
在区寄与强盗的博弈中,两个强盗他们的选择始终是贩卖区寄从而获取财物,区寄在确定对方选择的情况下,只能做出反抗和服从两种选择。
区寄选择了反抗,这对他来说是自己的最佳选择,尽管这对强盗来说不是最佳选择。
当第一位强盗死在区寄手中,而区寄又落到第二位强盗手中的时候,强盗开始对自己的选择产生怀疑,这时强盗存在杀死区寄还是继续出卖区寄的选择,区寄也存在“坐以待毙”和“起而拯之”两种选择,区寄又作出了“起而拯之”的选择。
在区寄的煽动下,强盗被金钱冲昏了头脑,坚持原来的选择,即出卖区寄,因为在他看来,杀死区寄得不到任何好处,但出卖区寄还可以独吞收入,因此,两相权衡,他接受了区寄的劝告,放弃了杀死区寄的念头。
在这种情况下,区寄仍然坚持了他的反抗选择,最后杀死第二名强盗,不仅维护了自己“自由人”的地位,还获得了“荣誉称号”——比战国时期13岁能杀人的秦舞阳还厉害。
区寄和强盗博弈的纳什均衡是两名强盗先后丧命,区寄重新获得人身自由,并蜚声乡里。
但是,如果我们撇开道德因素不谈,区寄和强盗相互间有没有更好大的选择呢?两名强盗绑架区寄,因为不知道这个小家伙的厉害而导致一位“仁兄”丧命,这时候另一位仁兄再次俘获区寄的时候,如果杀死区寄,肯定比丧命区寄之手要强,但肯定一分钱也得不到;如果他汲取自己伙伴的死亡教训,放了区寄,也比丧命区寄手中要强,但也拿不到一分钱。
因此,他还是选择了贩卖区寄,最终自己也死在区寄手上。
也许有人说,如果第二位强盗如果理智点,放了区寄,甚至与区寄“约法三章”,强盗不再侵犯区寄,区寄也不去官府告发,不就比被杀要好吗?但从强盗的角度来说,谁又能保证区寄不告发了,与其“约法三章”,还不如杀死区寄,与其杀死区寄,还不如卖了区寄,所以,强盗始终认为自己的选择是正确的,他也只能做出这样的选择,区寄也只能做出不择手段杀死强盗的选择。