蜈蚣博弈悖论的势分析
- 格式:doc
- 大小:59.00 KB
- 文档页数:4
1.实验指南蜈蚣博弈是罗森塞尔(Rosenthal,1981)提出的一个动态博弈问题。
由于博弈的扩展形式很像一条蜈蚣,因此被称为“蜈蚣博弈”。
实验表明,受到公平、信任、利他等因素的影响,人与人实际的博弈结果与理论的博弈均衡存在偏离。
蜈蚣博弈模型在公共政策领域有着极为广泛的应用,如区域政府间政策取向的博弈分析等。
实验包含若干轮,每轮包含若干阶段。
实验参与者每2人为一对,一人为角色A,一人为角色B。
参与者将两两配对进行,并交互先后进行决策。
参与者的收益将由双方的行为共同确定。
实验中,一方(A)首先根据当前阶段的收益进行决策,是继续进行还是终止本轮实验,若终止本轮实验,则将按照当前阶段收益为双方分配收益;若继续本轮实验,则进入到下一阶段,双方可获得的收益将发生变化,由另一方(B)进行决策,是继续进行还是终止本轮实验。
双方交替进行决策,直到有一方终止本轮实验,或者实验达到最大阶段数为止。
2.实验引导(1)指导语◇实验每2人为一对进行,一人为角色A,一人为角色B。
◇配对的两人在所有轮次中是否保持不变,取决于参数“匹配方式”的设置。
◇实验包含若干轮次,每个轮次包含若干阶段。
◇每个阶段中,A、B两人中将会有一人具备决策权。
决策时,参与者需要确定,是继续进入到下一阶段,还是在本阶段结束本轮实验。
AB轮流进行决策。
◇决策时,决策者可以看到若在本阶段结束,自己和对方能够获得的收益。
◇实验进行的总轮次、每轮次能够进行的最大阶段数,以及每个阶段A/B能够获得收益信息是否对参与者公开,取决于实验主持者对相关信息公布与否的设定。
(2)实验提示实验轮次:第I轮 ,共V1轮,角色:A/B本轮实验将在某一阶段结束,结束后双方获得的收益由收益表6.11确定。
表6.11 蜈蚣博弈的各阶段收益决策 阶段 A收益(你)B收益(对方)继续/结束-> 1 2 0.5继续/结束-> 2 1 4继续/结束-> 3 6 1.5继续/结束-> 4 2 8继续/结束-> 5 10 2.5继续/结束-> 6 3 12继续/结束-> 7 14 3.5继续/结束-> 8 4 16继续/结束-> 9 18 4.5继续/结束-> 10 5 20说明:若总轮数实验主持者设定参数值为“不公布”,则V2显示为“*”;若总阶段数实验主持者设定为“不预知”,在当前阶段结束前,后续阶段中的数据均显示为“*”。
蜈蚣博弈蜈蚣博弈(Centipede game)什么是蜈蚣博弈蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。
它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。
假定A先选,然后是B,接着是A,如此交替进行。
A、B 之间的博弈次数为有限次,比如100次。
假定这个博弈各自的支付给定如下:1合作合作合作合作...合作合作A B A B …… A B (100,100)合作合作合作合作...合作背叛A B A B …… A B (98,101)现在的问题是:A、B是如何进行策略选择的?这个博弈因形状像一只蜈蚣,而被命名成“蜈蚣博弈”。
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。
但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”——此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100-99。
1蜈蚣博弈的悖论1根据倒推法,结果是令人悲伤的。
从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。
直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。
当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。
直觉告诉我们采取合作策略是好的。
而从逻辑的角度看,一开始A应取不合作的策略。
我们不禁要问:是倒推法错了,还是直觉错了?这就是蜈蚣博弈的悖论。
什么是悖论?悖论(paradox)来源于希腊语,para意即“超越”,doxos的意思是“相信”。
蜈蚣博弈悖论-概述说明以及解释1.引言1.1 概述蜈蚣博弈悖论是一个有趣的概念,在博弈论和经济学领域引起了广泛的关注。
它揭示了在一些情况下,个体的理性选择可能会导致整体结果的恶化,从而违背了我们对于理性行为的常识理解。
蜈蚣博弈悖论的概念最早由约翰·内许·纳什提出,他是一位著名的博弈论学者,也是电影《美丽心灵》中的主角。
在蜈蚣博弈中,两个博弈者面对着一个简单的选择:继续合作还是背叛对方。
合作会带来一定的收益,但背叛会获得更大的收益。
然而,当双方都选择背叛时,他们获得的收益反而会比合作时更小,因为他们会陷入一个恶性循环,导致双方都无法取得最优结果。
这种现象的出现源于博弈过程中的信息不对称和不完全信息。
当一方选择背叛时,对方无法得知其真实意图,因此会做出相同的回应。
但如果双方都能够互相合作,他们将能够达到更优的结果。
然而,由于彼此之间的不信任,他们陷入了一个无法打破的困境。
蜈蚣博弈悖论的研究对我们理解社会行为和决策过程有着深远的意义。
它提醒我们,有时候人们的理性选择并不一定能够带来最好的结果,而可能导致整体的恶化。
在现实生活中,类似的悖论现象也存在于合作与竞争、公共利益与私人利益之间的权衡中。
了解蜈蚣博弈悖论可以帮助我们更好地理解人类行为,并寻找解决方案来避免潜在的困境。
接下来的文章将进一步探讨蜈蚣博弈悖论的影响因素、应用领域以及可能的解决方法。
我们将深入分析其中的数学模型和实证研究,以期对这一现象有一个更全面的认识。
通过增加对于合作与竞争的了解,我们可以在个人和社会层面上做出更明智的决策,从而实现真正的共赢局面。
1.2文章结构文章结构是指文章的组织框架和布局方式,它主要由引言、正文和结论三部分构成。
引言部分是文章的开头,用于引入主题并概述文章的内容和结构。
正文部分是文章的主体,包括详细而系统的论述和分析。
结论部分是文章的结束,总结主要观点并给出进一步展望。
在本篇文章中,引言部分将首先概述蜈蚣博弈悖论的基本情况和相关背景信息,引起读者的兴趣,并引出文章讨论的目的。
用“难得糊涂”来化解“蜈蚣博弈”的困境摘要:本文首先对两个不同领域的概念进行了介绍,主要针对“蜈蚣博弈”由逆向归纳法引发的困惑进行了分析,指出在现实的博弈中,非理性人的“难得糊涂”在特定的情况下,能够达到个人和集体利益的最大化,是我们追寻的一种境界。
关键词:蜈蚣博弈逆向归纳法博弈难得糊涂理性人一、名词介绍1.“蜈蚣博弈”“蜈蚣博弈”(centipede game)是博弈论中的一个概念,它是由罗森塞尔(Rosenthal)在1981年提出的有限次动态博弈问题中的一个经典模型。
由于这个博弈的扩展式很像一条蜈蚣,因此被称为“蜈蚣博弈”。
蜈蚣博弈是指这样一个博弈:两个博弈方A、B轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。
博弈规则是:A、B轮流决策一次为一轮;在第n轮决策中,第一次若A选择“不合作”,决策结束,A、B的收益均为n;第二次若B选择“不合作”,决策结束,A得n-1,而B得n+2;下一轮则从A、B都得n+1开始。
假定A先选,然后是B,接着是A,如此交替进行。
假设A、B之间的博弈为一有限次,为99轮,共198个决策结,A、B双方各有99个决策结。
博弈树如下图所示: 在上图中,所有收益数组中第一个数字是博弈方A的收益,第二个数字是博弈方B的收益。
在这个博弈中的博弈方A、B是如何进行策略选择的?2.“难得糊涂”“难得糊涂”是清代书画家、文学家郑板桥题过几副著名的匾额中的一句名言,二百年来妇孺皆知,被世人当作人生信条,一直流传至今。
按照现代人的理解,“难得糊涂”,就是指一个人在非原则问题上不计较,在细小问题上不纠缠;对一些可问可不问的事情,可以装作未看见;以理智的“糊涂”,去平息可能发生的矛盾,排解心中的烦恼之事。
从某种意义上说,这样做往往可以解除许多心理压力,化干戈为玉帛,达到共创和谐的目的。
二、“蜈蚣博弈”的困惑1.逆推归纳法求解“蜈蚣博弈”“蜈蚣博弈”是一个有限完美信息的动态博弈,求解其子博弈精炼纳什均衡的最简便的方法是逆向归纳法。
蜈蚣博弈悖论-回复什么是蜈蚣博弈悖论?蜈蚣博弈悖论是一种心理学和经济学的悖论,也被称为蜈蚣逆理论或蜈蚣效应。
该悖论的思想基于一个关于博弈理论的假设,假设蜈蚣每次步行时一侧的腿按照一定顺序向前移动,而剩下的腿则静止。
但经过简单的逻辑推理可以发现,从理论上来说,蜈蚣即使有无限多条腿,也无法前进。
在蜈蚣博弈悖论中,玩家的行动是连续而不是离散的,也就是说在某一时刻每个玩家可以进行的策略是连续的。
这样一来,每个玩家都面临一个困境,在他未来的策略和行为中,存在无穷多种选择。
然而,理性的假设下,玩家需要同时考虑到自己和对手的行为,即使存在无穷多的可能性。
遇到无穷多的可能性时,蜈蚣是否能做出一个选择来保证其前进的问题就成为一个普遍存在的难题。
根据传统的博弈理论,理性的玩家应该能够做出最佳选择,在某种程度上,这意味着玩家能够做出接近无穷次的选择。
然而,对于这个问题,蜈蚣却无法做出一个能够使其前进的选择。
蜈蚣博弈悖论揭示了人类对于连续决策的困扰以及理性决策的局限性。
在现实生活中,人们经常面临类似的问题,例如对于各种连续的投资机会的选择,或者是对于无穷可能性的考虑。
在解决蜈蚣博弈悖论时,需要考虑一系列因素,包括不确定性、个人风险偏好以及对即时收益和未来回报的权衡考虑。
另外,也需要了解到个体行为决策中的局限性,例如有限的认知能力和信息获取。
有人认为,蜈蚣博弈悖论说明了人类理性意识的有限性,因为理性决策并不是总能够解决所有问题。
根据蜈蚣博弈悖论,人们在面临连续决策时需要做出选择,然而,由于不确定性和局限性的存在,可能会导致最佳选择的失误。
然而,也有人持不同观点,认为蜈蚣博弈悖论可能只是一种思维陷阱,毕竟现实世界中并不存在真正的无穷连续。
这种观点认为,虽然连续性会给决策增加复杂性,但理性决策仍然是可能的,并且人类可以通过合理的模型和策略来处理连续的决策问题。
总而言之,蜈蚣博弈悖论是一个复杂而有趣的概念,引发了人们对于连续决策和理性行为的思考。
逆推归纳法是博弈论及博弈逻辑研究中的一种常用的方法,由策梅洛(E.Zermelo)在讨论象棋博弈问题时首先使用,后经泽尔腾(R.Selten)完善及推广。
逆推归纳法主要用于求解完全且完美信息动态博弈。
完全且完美信息动态博弈的特点是,两个或多个局中人轮流博弈,局中人完全了解全部局中人任何决策可能导致的收益情况,并且局中人在进行每一次决策时完全知道之前阶段中自己和对手的策略。
逆推归纳法从动态博弈的最后一个阶段开始分析,向后推理、逐步倒推,直到博弈开始阶段局中人的决策。
逆推归纳法是完全归纳推理,结论是必然的。
然而这种逻辑严密的推理方法得到的预测或结果与现实中的博弈行为往往不一致,这就是“逆推归纳法悖论”的基本内涵。
逆推归纳法悖论的典型案例有连锁店悖论,有限重复囚徒困境、蜈蚣博弈悖论等。
真正引起人们对逆推归纳法悖论极大关注的是罗森塔尔(R.Rosenthal)首先研究的蜈蚣博弈悖论[1]。
逆推归纳法悖论是一种合理行为悖论,体现的是博弈论推理与人们实际行动的矛盾,这种矛盾无疑对博弈理论的合理性提出了挑战。
一尧蜈蚣博弈的逆推归纳法分析及悖论蜈蚣博弈悖论属于典型的逆推归纳法悖论,运用逆推归纳法分析博弈所得到的结果与人们的直觉不一致,并且与实验及现实博弈结果均发生了偏离[2]。
图1蜈蚣博弈的原始模型罗森塔尔在1981年的文献[3]中给出了3个完美信息动态博弈的模型,其中之一便是蜈蚣博弈的原始模型,如图1所示;后来宾默(K.Binmore)进行基于信念变化的蜈蚣博弈悖论解悖探析张峰1,赵绪涛2(1.北京理工大学,北京100081;2.中国人民大学,北京100872)摘要:逆推归纳法是研究完美信息动态博弈的常用方法,通过完全归纳得到必然结论,但用于分析蜈蚣博弈时理论预测与人们的实际博弈行为发生偏离,导致悖论。
蜈蚣博弈的结构精致而复杂,局中人对博弈收益情况的权衡以及局中人试图在非合作的博弈机制中进行合作的主观倾向,影响了局中人决策时的信念变化。
蜈蚣博弈悖论-回复蜈蚣博弈悖论: 如何克服集体行动的困境引言:在现实生活中,我们经常会遇到一些困扰,集体行动的困境就是其中之一。
正是因为每个人都追求个人利益,而忽视了集体利益,造成了集体行动的失败。
然而,在与集体行动相关的问题中,一个有趣又引人深思的经验——“蜈蚣博弈悖论”展示了一个截然不同的结果。
究竟什么是蜈蚣博弈悖论?它为什么能够突破集体行动的困境?该如何克服集体行动的困境?在以下的文章中,我们一步步解答这些问题。
第一部分:蜈蚣博弈悖论蜈蚣博弈悖论是一种博弈模型,其名字来源于一种有毒的动物——蜈蚣。
虽然一般来说,蜈蚣具有强烈的威胁性,但在这个博弈模型中,蜈蚣的策略显得不同寻常。
假设有两只蜈蚣,每只蜈蚣在每一回合中都能够选择向前走或者停止。
蜈蚣的目标是尽可能多地走出一段距离。
然而,与我们的预期不同的是,在这个博弈模型中,两只蜈蚣在每一回合中都会选择停下来,因为它们害怕对方前进,而自己却停下来。
这种现象明显违背了我们对于个体理性行为的直觉认识。
第二部分:集体行动困境为了更好地理解蜈蚣博弈悖论,我们需要先了解集体行动困境。
集体行动困境是指当个体追求个人利益而忽视集体利益时,最终导致整个集体付出更大的代价的情况。
蜈蚣博弈悖论可以看作是集体行动困境的一个具体例子。
在这个博弈模型中,蜈蚣之所以会停下来,是因为它们害怕对方前进,而自己却停下来。
这种恐惧心理让它们无法接受个体的理性选择,而选择了停下来,导致整个集体都无法前进。
第三部分:克服集体行动困境的方法那么,如何克服集体行动困境呢?以下是一些方法和策略,可以帮助个体在集体行动中取得更好的结果。
1. 激励机制:为了促使个体更倾向于合作,可以设计一些激励机制,例如奖励制度或者惩罚制度。
通过设定合适的激励,个体就能够意识到自己的行为对整个集体的影响,并更愿意做出与集体利益一致的选择。
2. 沟通交流:通过沟通交流促进集体行动的协调也是重要的一步。
当个体能够充分理解彼此的利益并形成信任时,他们更有可能做出为集体利益最大化的行动。
蜈蚣博弈法作者:白诗诗来源:《领导文萃》2016年第11期少有人知,海盗是世界上最民主的团体。
平时,他们的一切事务均由投票解决。
船长的唯一特权只是拥有一套自己的餐具。
海盗船上的唯一惩罚,就是把人丢到海里去喂鱼。
现在我们知道,某一艘船上有若干个海盗,正准备瓜分抢来的100枚金币,这样的问题他们当然选择投票解决。
投票的规则如下:1.抽签确定各人的分配顺序号码(1、2、3、4、5);2.由抽到1号签的海盗提出分配方案,然后5人进行表决,如果方案得到超过半数的人同意,就按照他的方案进行分配,否则1号就要被扔进大海去喂鲨鱼;如果1号被扔进大海,则由2号提出分配方案,然后由剩余的人进行表决,同理当超过半数的人同意时,才会按照他的提案进行分配,否则他也将被扔入大海。
我们先要对海盗们做一些假设:第一,每个海盗的凶残性都不同,而且所有海盗都知道其他几人的凶残性。
第二,每个海盗当然都不愿意自己被丢到海里喂鱼。
第三,每个海盗都希望自己能得到尽可能多的金币。
第四,每个海盗都是功利主义者,他们相信二鸟在林,不如一鸟在手。
第五,每个海盗都很喜欢其他海盗被丢到海里喂鱼。
如果海盗和他们的分配原则都如我们上面假设的那样,那么我们运用倒推法,得出海盗会做出如下的理性分析:首先从5号海盗开始。
5号海盗是最安全的,没有被扔下大海的风险,只要他保证始终投否定票。
接下来看4号,他的生存机会完全取决于前面是否还有人存活着,因为如果1号、2号和3号海盗全都喂了鲨鱼,在只剩4号与5号的情况下,不管4号提出怎样的分配方案,5号一定都会投反对票来让4号喂鲨鱼,以独吞全部金币。
因此,他绝不能把存活的希望寄托在5号身上,而只能无条件地支持3号。
再来看3号,他经过推理,知道4号和5号的盘算,就会提出(100、0、0)这样的分配方案,因为他知道4号哪怕一无所获,为了保命也还是会无条件地支持自己,那么再加上自己的1票就可以使他得到这100枚金币了。
2号也经过上述的逻辑推理知道了3号的分配方案,如果他想让自己的方案通过,就必须获得除自己之外的两个人的赞成,经过思考,他会提出(98、0、1、1)的方案。
蜈蚣博弈悖论-回复什么是蜈蚣博弈悖论?蜈蚣博弈悖论,又称为蜈蚣状博弈,是博弈论中的一个经典悖论。
它描述的是一个由两个参与者进行的零和游戏,参与者轮流选择合作或背叛对方,而双方的利益与对方的选择相互关联。
尽管这个博弈看起来很简单,但其结果却会让人感到意外和困惑。
首先,让我们来具体描述一下蜈蚣博弈的规则。
假设有两个参与者A和B,他们需要在连续的若干轮中做出合作或者背叛的选择。
如果两个参与者都选择合作,那么每一轮的收益都会增加;如果其中一个参与者选择背叛而另一个选择合作,那么背叛的一方将获得更多的收益,而合作的一方将获得较少的收益;如果两个参与者都选择背叛,那么每一轮的收益都会变得更少。
参与者的目标是尽可能获得最大的收益。
在蜈蚣博弈中,一种常见的策略是所谓的“背叛第一”。
这意味着参与者会在游戏开始时就选择背叛对方,无论对手选择了什么。
理论上,这个策略似乎很合理,因为如果对手选择了合作,那么背叛的一方将获得更多的收益;如果对手选择了背叛,那么背叛的一方至少不会比对手利益减少得更多。
然而,令人惊讶的是,在蜈蚣博弈中,这个看似合理的策略并不是最优的。
在该博弈中,最优的策略是双方都选择合作,即使对手选择了背叛。
这是因为如果双方都选择合作,他们将可以在每一轮中获得较高的收益。
而一旦某一方选择了背叛,双方的收益都会减少,导致他们无法达到最优结果。
那么这个悖论的原因是什么呢?一种解释是参与者之前缺乏足够的沟通和信任。
如果两个参与者能够互相合作并达成协议,他们将能够互利共赢,获得更高的收益。
然而,在博弈过程中,双方只能看到对方的选择,而无法知道对方的真实意图。
这导致了彼此之间的不信任和担心,从而选择了保护自己利益的背叛行为。
另一种解释是参与者的理性决策。
根据博弈论的基础,参与者都是理性的,会根据自己的利益来做出选择。
从这个角度来看,选择背叛的策略似乎是合理的,因为它可以最大化个体利益。
然而,这种个体利益最终会导致整体利益的减少,从而让参与者无法达到他们的最优结果。
蜈蚣博弈的现实例子蜈蚣博弈是一种博弈论中的经典博弈模型,用来描述两个参与者在决策时的利益冲突与合作。
在这个模型中,两个参与者可以选择合作或背叛对方,从而产生不同的结果。
下面列举了一些现实生活中的例子,来说明蜈蚣博弈的应用和影响。
1. 战争与和平:在国际关系中,不同国家之间的合作与背叛决定着和平与战争的结果。
如果每个国家都选择合作,那么可以建立稳定的国际秩序,实现共同繁荣。
然而,如果有一个国家选择背叛,可能会导致冲突和战争的爆发。
2. 竞争与合作:在商业领域,企业之间的竞争与合作也体现了蜈蚣博弈的特点。
如果企业选择合作,可以通过合并、联盟等方式实现资源共享和互利共赢。
然而,如果企业选择背叛,可能会采取不正当手段竞争,导致市场失衡和消费者受损。
3. 婚姻关系:夫妻之间的合作与背叛也体现了蜈蚣博弈的模式。
如果夫妻双方都选择合作、信任和支持对方,他们的婚姻关系可能会更加稳定和幸福。
然而,如果有一方选择背叛,比如出轨或隐瞒重要信息,可能会导致婚姻破裂。
4. 政府与市民:政府与市民之间的关系也可以用蜈蚣博弈来描述。
如果政府能够提供公正、高效的公共服务,并保护市民的权益,市民则会愿意遵守法律、纳税并支持政府的决策。
然而,如果政府没有履行其职责,或者市民不信任政府,可能会导致社会秩序紊乱和公共利益受损。
5. 团队合作:在团队合作中,每个成员都可以选择合作或背叛。
如果团队成员都能够相互信任、合作和支持,团队的绩效和效率会得到提升。
然而,如果有个别成员选择背叛,比如不履行承诺或不尽职尽责,可能会破坏团队的凝聚力和合作精神。
6. 经济合作:国家之间的经济合作也是蜈蚣博弈的一个例子。
如果各国能够建立互利共赢的贸易体系,可以促进全球经济发展和资源的合理配置。
然而,如果有个别国家采取保护主义政策或操纵市场,可能会导致贸易战和经济动荡。
7. 友情与背叛:在人际关系中,友情也可以用蜈蚣博弈来解释。
如果朋友之间能够互相信任、关心和支持,他们的友谊将会持久和稳固。
博弈困境的两种解决方案分析纳什均衡(Nash Equilibrium)概念的提出和存在性证明奠定了博弈论这门学科的基础,为理解和预测人们在策略互动中的行为提供了强而有力的工具。
但是,随着博弈论的发展,人们普遍意识到,甚至通过实验研究也发现,在有些博弈中,纳什均衡所预测的博弈结果并不符合人们的直观和各种实验研究的结果。
人们把这些纳什均衡与直观或现实严重冲突的博弈称为博弈困境,著名的例子有囚徒困境(Prisoner s Dilemma)、旅行者困境(Traveler s Dilemma)、蜈蚣博弈(Centipede Game)、纳什讨价还价问题(Nash bargaining problem)、伯川德悖论(Bertrand competition)、公共物品供给博弈(Public Good Game)、最后通牒博弈(Ultimatum Game)和独裁者博弈(Dictator Game)等。
旅行者困境是由著名经济学家Kaushik Basu于1994年提出来的博弈中的一个新的困境。
正如他本人所说:旅行者困境是一个特殊的并且令人信服的悖论,在这里,无情的博弈论理性和直觉观念无法保持一致。
该困境融合了以往困境中具有代表性的一些主要特征,从而使博弈论中的根本问题更为集中地得到展现。
旅行者困境的发现和提出,立刻引起了学术界的广泛关注,国际上不少博弈论学家和逻辑学家从理论和实验两个方面分别展开研究。
与此相反,国内学者虽然对一般意义上的博弈困境及其产生原因已有所关注,但是对针对博弈困境的各种解决方案缺乏细致而深入的学理分析和研究。
对解决方案的深入研究可以加深我们对人类社会中各种博弈困境的理解的同时,有助于寻找新的理论和现实解决方案,还可以避免对博弈论泛泛而谈的批评和指责。
本文以旅行者困境为例,对Halpern Pass提出的重复后悔度极小化模型和Capraro提出的基于联盟与合作的概率推理模型两种方案进行分析比较,以窥它们是如何成功地解释和预测旅行者困境中选手实际博弈行为的,并分析这两种方案各自存在的问题。
蜈蚣博弈的生活案例蜈蚣博弈是博弈论中的一个经典问题,它描述了一个两个玩家之间的博弈情景。
玩家一和玩家二一起合作选择数字,玩家一同时选择1到n之间的一个数字,玩家二选择一个不同的数字。
两个玩家的目标是使得对方没有机会继续选择数字。
蜈蚣博弈的特点是,没有策略可以保证玩家一或玩家二能够赢得游戏。
这个问题在生活中有很多类似的情景,下面将从生活案例的角度来描述相关的参考内容。
1. 政治角逐:在政治选举中,候选人之间也存在类似的博弈情景。
每个候选人都在争夺选民的支持,他们需要制定策略来获取选民的支持。
然而,每个候选人都有限的资源和时间来争取选民的支持,而且每个选民也有自己的偏好和利益。
这就意味着没有一种策略可以保证一个候选人能够在竞选中获得绝对的优势。
2. 商业竞争:在商业竞争中,不同的公司之间也存在类似的博弈情景。
每家公司都在争夺市场份额和消费者的支持,它们需要制定自己的竞争策略。
然而,每家公司面临着同样的限制条件,如有限的资源和时间。
此外,消费者也有自己的偏好和利益,这意味着没有一种策略可以保证一家公司在商业竞争中获得绝对优势。
3. 人际关系:在人际关系中,个人之间的互动也可以看作是一种博弈情景。
每个人都有自己的需求、利益和偏好,他们需要在互动中达成平衡和满足对方的需求。
然而,每个人也有自己的限制条件和有限的资源,这就意味着对于每个人来说,没有一种策略可以在人际关系中获得绝对的优势。
4. 国际关系:在国际关系中,不同国家之间的互动也可以看作是一种博弈情景。
每个国家都有自己的国家利益和战略目标,他们需要在国际舞台上与其他国家进行博弈。
然而,每个国家也面临着有限的资源和战略选择,而且每个国家的利益和目标也不尽相同。
因此,没有一种策略可以保证一个国家能够在国际关系中取得绝对的优势。
综上所述,蜈蚣博弈在生活中存在着许多类似的情景,如政治角逐、商业竞争、人际关系和国际关系等。
在这些情景中,每个参与者都有自己的目标和限制条件,他们需要制定自己的策略来达到自己的目标。
蜈蚣博弈悖论的势分析(西北农林科技大学理学院李红波)摘要:逆推归纳法是博弈论求解的重要方法,但是1981 年罗森塞尔提出的蜈蚣博弈给逆推归纳法带来了严重的挑战,研究发现,在蜈蚣博弈中,人们的选择和我们通过逆推归纳法求解得到的结果不同,形成了悖论。
通过对逆推归纳法的适用范围进行分析,我们发现我们在最初的理性人假设时我们忽略了人们在另一方面的理性——势理性,文章通过对势的概念、性质等进行分析研究,得到势理性的概念,并对通过势理性和有限理性的结合,解决了蜈蚣博弈悖论的问题。
关键词:蜈蚣博弈逆推归纳法博弈的势势理性一、引言:蜈蚣博弈是指这样一个博弈(如下图):两个博弈方A、B 轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。
图一在上图中,所有得益数组中第一个数字是博弈方A 的得益,第二个数字是博弈方B 的得益。
利用逆推归纳法我们不难得到,在第一步A 将选择“不合作”,此时各自的收益为1 。
从逻辑推理来看,逆推归纳法是严密的,但结论是违反直觉的。
直觉告诉我们采取“合作”策略是好的。
而从逻辑的角度看,A 一开始应选择“不合作”的策略。
人们在博弈中的真实行动“偏离”了运用逆推归纳法关于博弈的理论预测,造成二者间的矛盾和不一致,这就是蜈蚣博弈的悖论。
蜈蚣博弈悖论给逆推归纳法提出里严重的挑战,这令许多博弈论学者感到困惑。
一些学者坚信逆推归纳法本身没有问题,是符合逻辑的,;也有一些学者则对逆推归纳法提出了质疑,否认了逆推归纳法的有效性;还有一些学者(如张峰)认为逆推归纳法悖论产生是源于逆推归纳法的适用范围问题,笔者同意最后一种观点。
文章通过对逆推归纳法的使用范围进行分析,认为逆推归纳法最大的问题就是对博弈方的理性人假设,首先,理性人的假设对博弈方的理性要求太高,这使得现实中很多人不满足逆推归纳法的假设,出现了求解错误的现象,其次,理性人假设中忽略了对理性人更深层次理性的考虑(文中成为势理性),由于理性人假设中缺少了势理性,使得逆推归纳法犯下以偏概全,只重眼前和近期利益而忽略长远利益的错误。
由于理性人假设的这两点致命的弱点,严格限制了逆推归纳法的适用范围和条件。
文章通过分析认为,像蜈蚣博弈这样比较多阶段的动态博弈不适合用逆推归纳法求解,只有当博弈进行到某一阶段后,剩余的子博弈满足逆推归纳法的假设条件时,才可以用逆推归纳法对该子博弈运用你退归纳法求解。
二、势的提出:“势”是中国传统战略思想的核心概念之一,但对其下一个明确的定义却非常的困难。
许多古代学者喜欢用比喻来谈“势”,如:李韩非认为,“夫有才而无势,虽贤不能制不肖。
故立尺材于高山之上,下临千仞之溪;材非长也,位高也。
桀为天子能制天下,非贤也,势重也。
尧为匹夫,不能正三家,非不肖也,位卑也。
千钧得船则浮,锱铢失船则沉,非千钧轻而锱铢重也,有势之于无势也。
”其实,“势”是指一种不以人的意志为转移的必然趋势,是事物发展的客观规律,也是事物存在的一种状态。
“势”具有隐蔽性、广泛性、动态性和较强的辐射力四个属性。
(1)“势”是无形的,具有隐蔽性的特点。
(2)“势”是广泛存在的,上至国家社会,下至企业个人,都有“势”的存在。
(3)“势”是不断变化的,是动态的。
随着时间的变化。
(4)以较强的辐射力实现系统功能的突现。
在棋盘上,强大的厚势常令对方望而却步。
在国际上,强国往往会给邻国造成巨大压力。
博弈中参与人的势:各种因素对参与人作用的合力,体现参与人对全局掌控的能力,它是由外部各因素共同作用并由参与人表现出来的一种状态。
势的作用:从整体而非局部把握事物的本质,以获得整体得益,我们可以通过对势的利用使得整体得益最大化。
三、 势对理性人的分类:在理性人假设中,人是理性的,但这个所谓的理性中却缺乏了势的概念,忽略了理性人更深层次的理性,即势理性。
势理性是与势相依的理性,指具有整体观念和全局眼光的理性,是在适当的时候,会选择保全整体利益而放弃某以时刻的利益的理性。
下面我们以贝叶斯博弈中的一个例子来说明:有限次囚徒困境中,假设囚徒1有两种类型:理性和非理性,这是囚徒1的私人类型。
两种类型的概率分布为两人的共同知识。
P(理性)=1-p,P(非理性)=p ,囚徒2是理性的,理性的囚徒可以选择任何策略,而非理性的囚徒仅选择“针锋相对”策略,即第一阶段选合作,而在t>1阶段选择与对手在t-1阶段想同的行动。
支付矩阵为(设贴现因子1=δ)2,0,1<+<>b a b a 。
支付矩阵为:⎪⎪⎭⎫ ⎝⎛)0,0(),(),()1,1(b a a b C D CD现在我们对三次重复博弈进行探讨,当p(1+a)+(1-p)b>pa ,1+p+(1-p)b+pa>a ,1+p+(1-p)b+pa>a+b+pa 时,我们会看到博弈的结果为t=1 t=2 t=3 非理性囚徒1D D D 理性囚徒1D C C 囚徒2 D D C在博弈的第一阶段,理性的囚徒1并没有选择他的在这阶段的更优策略C ,而是选择了D,故意犯下错误,而误导囚徒2,这样可以使自己在整个博弈的过程中的得益最多,这说明理性的囚徒1具有势理性,这使得他的整体收益得到提高。
由此可见,人们在动态博弈中可能选取一个并非次步的最佳策略而体现故意犯错的行为为未来获得更多的利益做准备,于是,势理性是有利于人们得益最大化的,所以是理性的重要的一部分,我们将势理性加入的理性人假设中去,用势理性对理性人进行分类,这可以是博弈论有更广泛的应用范围,也可以使博弈分析得到更精确的结果。
我们通过势理性把理性人分为两类:1、局部理性人:没有势观念或势观念较弱的人,这种人缺乏全局观念,只看重眼前利益,看不到整体利益,就如在下棋中的不善弈者,只思谋子,而不思谋势。
2、整体理性人:有较强的势观念,这种人在博弈中可以从整体把握局势,有时会为了整体利益放弃当前的一些利益,就如在下棋中的善弈者,谋其势而非只谋其子,这种人可以实现自身整体利益的最大化。
当然这种人也分为两类:绝对整体理性人和相对整体理性人。
五、悖论势分析:在现实中, 人的理性必然是有限的。
但理性人假设在经济学的许多领域具有成功的应用, 原因一, 在于这些领域需要的理性程度不高, 一般人都能达到;原因二, 在于这些领域问题的解具有稳定性, 在理性人假设具有微小偏差的情况下也能很好的说明问题。
而逆推归纳法解娱蛤博弈恰恰不能满足上述两点。
娱蛤博弈由于博弈阶段复杂, 对博弈者的理性要求高, 面对娱蛤博弈, 普通人不能达到理性人的标准。
逆推归纳法得到的娱蛤博弈的子博弈完美纳什均衡具有不稳定性。
逆推归纳法忽略整体观,以偏概全,只注重眼前和近期利益,忽略长远利益等严重错误,通过给理性人与势的区分,可以让理性人实现真正的理性,弥补了这一缺陷。
由于蜈蚣博弈并不满足理性人假设,所以我们要重新思考理性人的假设,我们可以考虑参与人有势观念,我们称之为整体理性人。
在蜈蚣博弈中,我们假设所有参与人具有整体理性,都是整体理性人,并且这是共同知识,但由于理性的有限(在博弈中只能向前看30步),参与人并不能看清全部198步的博弈过程,所以,参与人会将注意力放在蜈蚣博弈开始的几步和结束的几步,如图一中所示,省略号的部分经常会被“忽略”掉,参与人A在第一步选择不合作的得益是1,而如果博弈可以进行到最后的话,参与人A的得益为100或98,这均远远大于1,所以具有整体理性的参与人A没有选择不合作的动机,同样参与人B也没有选择不合作的动机,这个过程会一直持续下去,直到参与人可以看清以后所有的博弈过程。
在此以后的博弈中,由于整个子博弈都可以被参与人所了解,成了完全完美信心的博弈,这时参与人从整体把握局势,为了获得更过的利益,相对整体理性人会考虑合作,但这种合作存在着风险,即为了得到更多的利益有可能损失已经得到的1个利益,所以,相对整体理性的人也会根据自己的风险偏好在适当的时候结束该博弈,这时如果加入风险的概念,参与人便近似满足了理性人的假设,这时我们就可以用逆推归纳法去求解蜈蚣博弈模型了;而绝对整体理性的人会为了追逐最终的100或101的利益而坚持与对方合作。
通过上面的分析,我们分几种情况讨论蜈蚣博弈的求解问题:1、参与人A或B为局部理性者,则由于局部理性者只顾及眼前和近期利益,所以博弈会比较早的结束,这种情况下,参与人满足理性人假设,所以可以用逆推归纳法求解,但现实生活中,局部理性人比较少,所以这种情况在试验中很少出现。
2、参与人中无局部理性者,参与人A或B为相对整体理性者,参与人A和B为有限理性者(在博弈中只能向前看30步),这种情况下,开始时,参与人的行为受到势理性的影响会一直选择合作,而当博弈进行到168步后,由于博弈变成了完全且完美信息博弈,所以相对整体理性者会根据自己的风险偏好加入风险损失值,然后再根据逆推归纳法解出自己的策略集合,在适当的时候结束该博弈。
在现实中这种情况会出现的比较多,因为大多数人都是相对整体理性人,他们有较强的势理性,也有较强的风险观念,他们会在适当的时候结束博弈,以实现自身利益最大化。
例如:我们假设A、B的风险损失系数(即他们认为出现损失的概率)如下:169步170步171步172步173步174步……A 0.42 0.45 0.49B 0.46 0.49 0.51用逆推归纳法,经计算我们得知,当A或B的风险损失系数大于0.5时,博弈就会停止,从上表中我们可以看出在174步时参与人B的风险损失系数为0.51,大于0.5,所以此时他不会选择合作,他会在此时结束博弈,这时二人的得益分别为86和89。
3、参与人A和B均为绝对整体理性者:这种情况下,双方都会一直合作下去,直到博弈结束,双方拿到100,100的完美结果,但在实现中这种类型的很少,所以这种情况一般不会出现。
参考文献张峰.逆推归纳法悖论探析[J].福建论坛.人文科学社会版.2004年第12期张峰.博弈逻辑中理性人假设的困境与思考[J].学术论坛.2007年第9期谢识予.经济博弈论[M].上海:复旦大学出版社.2010年2月,第三版易宪容,赵春明.行为金融学[M].北京:社会科学文献出版社.2004年8月Drew Fudenberg,David K.Levine.THE THEORY OF LEARNING IN GAMES[M].The MIT bridge,Massachusetts.London,English.1995。