实验经济学-蜈蚣博弈
- 格式:pdf
- 大小:297.31 KB
- 文档页数:7
蜈蚣博弈蜈蚣博弈(Centipede game)什么是蜈蚣博弈蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。
它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。
假定A先选,然后是B,接着是A,如此交替进行。
A、B 之间的博弈次数为有限次,比如100次。
假定这个博弈各自的支付给定如下:1合作合作合作合作...合作合作A B A B …… A B (100,100)合作合作合作合作...合作背叛A B A B …… A B (98,101)现在的问题是:A、B是如何进行策略选择的?这个博弈因形状像一只蜈蚣,而被命名成“蜈蚣博弈”。
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。
但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”——此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100-99。
1蜈蚣博弈的悖论1根据倒推法,结果是令人悲伤的。
从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。
直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。
当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。
直觉告诉我们采取合作策略是好的。
而从逻辑的角度看,一开始A应取不合作的策略。
我们不禁要问:是倒推法错了,还是直觉错了?这就是蜈蚣博弈的悖论。
什么是悖论?悖论(paradox)来源于希腊语,para意即“超越”,doxos的意思是“相信”。
蜈蚣博弈悖论-概述说明以及解释1.引言1.1 概述蜈蚣博弈悖论是一个有趣的概念,在博弈论和经济学领域引起了广泛的关注。
它揭示了在一些情况下,个体的理性选择可能会导致整体结果的恶化,从而违背了我们对于理性行为的常识理解。
蜈蚣博弈悖论的概念最早由约翰·内许·纳什提出,他是一位著名的博弈论学者,也是电影《美丽心灵》中的主角。
在蜈蚣博弈中,两个博弈者面对着一个简单的选择:继续合作还是背叛对方。
合作会带来一定的收益,但背叛会获得更大的收益。
然而,当双方都选择背叛时,他们获得的收益反而会比合作时更小,因为他们会陷入一个恶性循环,导致双方都无法取得最优结果。
这种现象的出现源于博弈过程中的信息不对称和不完全信息。
当一方选择背叛时,对方无法得知其真实意图,因此会做出相同的回应。
但如果双方都能够互相合作,他们将能够达到更优的结果。
然而,由于彼此之间的不信任,他们陷入了一个无法打破的困境。
蜈蚣博弈悖论的研究对我们理解社会行为和决策过程有着深远的意义。
它提醒我们,有时候人们的理性选择并不一定能够带来最好的结果,而可能导致整体的恶化。
在现实生活中,类似的悖论现象也存在于合作与竞争、公共利益与私人利益之间的权衡中。
了解蜈蚣博弈悖论可以帮助我们更好地理解人类行为,并寻找解决方案来避免潜在的困境。
接下来的文章将进一步探讨蜈蚣博弈悖论的影响因素、应用领域以及可能的解决方法。
我们将深入分析其中的数学模型和实证研究,以期对这一现象有一个更全面的认识。
通过增加对于合作与竞争的了解,我们可以在个人和社会层面上做出更明智的决策,从而实现真正的共赢局面。
1.2文章结构文章结构是指文章的组织框架和布局方式,它主要由引言、正文和结论三部分构成。
引言部分是文章的开头,用于引入主题并概述文章的内容和结构。
正文部分是文章的主体,包括详细而系统的论述和分析。
结论部分是文章的结束,总结主要观点并给出进一步展望。
在本篇文章中,引言部分将首先概述蜈蚣博弈悖论的基本情况和相关背景信息,引起读者的兴趣,并引出文章讨论的目的。
蜈蚣博弈悖论-回复什么是蜈蚣博弈悖论?蜈蚣博弈悖论是一种心理学和经济学的悖论,也被称为蜈蚣逆理论或蜈蚣效应。
该悖论的思想基于一个关于博弈理论的假设,假设蜈蚣每次步行时一侧的腿按照一定顺序向前移动,而剩下的腿则静止。
但经过简单的逻辑推理可以发现,从理论上来说,蜈蚣即使有无限多条腿,也无法前进。
在蜈蚣博弈悖论中,玩家的行动是连续而不是离散的,也就是说在某一时刻每个玩家可以进行的策略是连续的。
这样一来,每个玩家都面临一个困境,在他未来的策略和行为中,存在无穷多种选择。
然而,理性的假设下,玩家需要同时考虑到自己和对手的行为,即使存在无穷多的可能性。
遇到无穷多的可能性时,蜈蚣是否能做出一个选择来保证其前进的问题就成为一个普遍存在的难题。
根据传统的博弈理论,理性的玩家应该能够做出最佳选择,在某种程度上,这意味着玩家能够做出接近无穷次的选择。
然而,对于这个问题,蜈蚣却无法做出一个能够使其前进的选择。
蜈蚣博弈悖论揭示了人类对于连续决策的困扰以及理性决策的局限性。
在现实生活中,人们经常面临类似的问题,例如对于各种连续的投资机会的选择,或者是对于无穷可能性的考虑。
在解决蜈蚣博弈悖论时,需要考虑一系列因素,包括不确定性、个人风险偏好以及对即时收益和未来回报的权衡考虑。
另外,也需要了解到个体行为决策中的局限性,例如有限的认知能力和信息获取。
有人认为,蜈蚣博弈悖论说明了人类理性意识的有限性,因为理性决策并不是总能够解决所有问题。
根据蜈蚣博弈悖论,人们在面临连续决策时需要做出选择,然而,由于不确定性和局限性的存在,可能会导致最佳选择的失误。
然而,也有人持不同观点,认为蜈蚣博弈悖论可能只是一种思维陷阱,毕竟现实世界中并不存在真正的无穷连续。
这种观点认为,虽然连续性会给决策增加复杂性,但理性决策仍然是可能的,并且人类可以通过合理的模型和策略来处理连续的决策问题。
总而言之,蜈蚣博弈悖论是一个复杂而有趣的概念,引发了人们对于连续决策和理性行为的思考。
蜈蚣博弈的哲理故事博弈,词语解释是局戏、围棋、赌博。
现代数学中有博弈论,亦名“对策论”、“赛局理论”。
今天小编就来分享蜈蚣博弈的哲理故事,希望读者喜欢。
蜈蚣博弈的哲理故事蜈蚣博弈很简单,我举个实际运用的例子即可。
历史上的三国鼎立和孙刘联盟就是最典型的蜈蚣博弈。
孙刘联盟的博弈背景如下:公元208年,刘备和孙权联盟对抗曹操。
联盟维持时间越长,对孙刘两家越有利。
但是孙刘联盟必不能长久,其中有个争议问题,就是荆州。
孙权和刘备都可以选择直接撕破脸皮强占了荆州,这样会让联盟立刻破裂;他们也可以选择搁置争议,让联盟维持下去。
但是如果刘备在荆州经营越久,孙权就越没机会要回荆州。
不妨假设如果双方一直合作,经过20年之后,孙权就永远要不回荆州了(这个时间换成30年,40年都不影响结论)。
这时博弈者孙权想了,我在20年之后要不回荆州了,太亏了,那我干脆在第19年的时候撕破脸皮,直接抢了荆州算了。
孙刘联盟维持19年足够打败魏国了。
另一位博弈者刘备也想了,我感觉孙权这货在第19年的时候肯定会撕破脸皮,那我何不先下手为强,在第18年的时候翻脸。
18年联盟时间足够打败魏国了。
孙权又想了,我感觉刘备会在18年的时候肯定会先下手为强,那我何不在第17年直接撕破脸皮。
17年联盟时间足够打败魏国了。
这样一直博弈下去。
直到孙权想了,我觉得孙刘联盟要解除曹操的威胁,需要最少维持11年。
至少在11年前,刘备不敢和我翻脸。
那11年一到,我立刻翻脸让吕蒙夺了荆州吧。
刘备因为是博弈中优势的一方(实际控制荆州),行动必然比孙权保守,觉得孙刘联盟最少需要维持十三四年,彻底拿下襄樊之后,才能解除老曹的威胁。
于是决定在第14年翻脸。
由于孙权比较激进,所以最终先下手为强,在公元219年直取荆州。
孙刘联盟破裂,两败俱伤。
让还未大损元气的'魏国捡了便宜。
实际上孙刘联盟最优决策是,两边一起先灭了最强的魏国,再一决雌雄。
但是孙权不能接受这个安排,因为等灭掉魏国,荆州就拿不回来了,这样和刘备争霸胜算就很小了。
蜈蚣博弈悖论-回复蜈蚣博弈悖论: 如何克服集体行动的困境引言:在现实生活中,我们经常会遇到一些困扰,集体行动的困境就是其中之一。
正是因为每个人都追求个人利益,而忽视了集体利益,造成了集体行动的失败。
然而,在与集体行动相关的问题中,一个有趣又引人深思的经验——“蜈蚣博弈悖论”展示了一个截然不同的结果。
究竟什么是蜈蚣博弈悖论?它为什么能够突破集体行动的困境?该如何克服集体行动的困境?在以下的文章中,我们一步步解答这些问题。
第一部分:蜈蚣博弈悖论蜈蚣博弈悖论是一种博弈模型,其名字来源于一种有毒的动物——蜈蚣。
虽然一般来说,蜈蚣具有强烈的威胁性,但在这个博弈模型中,蜈蚣的策略显得不同寻常。
假设有两只蜈蚣,每只蜈蚣在每一回合中都能够选择向前走或者停止。
蜈蚣的目标是尽可能多地走出一段距离。
然而,与我们的预期不同的是,在这个博弈模型中,两只蜈蚣在每一回合中都会选择停下来,因为它们害怕对方前进,而自己却停下来。
这种现象明显违背了我们对于个体理性行为的直觉认识。
第二部分:集体行动困境为了更好地理解蜈蚣博弈悖论,我们需要先了解集体行动困境。
集体行动困境是指当个体追求个人利益而忽视集体利益时,最终导致整个集体付出更大的代价的情况。
蜈蚣博弈悖论可以看作是集体行动困境的一个具体例子。
在这个博弈模型中,蜈蚣之所以会停下来,是因为它们害怕对方前进,而自己却停下来。
这种恐惧心理让它们无法接受个体的理性选择,而选择了停下来,导致整个集体都无法前进。
第三部分:克服集体行动困境的方法那么,如何克服集体行动困境呢?以下是一些方法和策略,可以帮助个体在集体行动中取得更好的结果。
1. 激励机制:为了促使个体更倾向于合作,可以设计一些激励机制,例如奖励制度或者惩罚制度。
通过设定合适的激励,个体就能够意识到自己的行为对整个集体的影响,并更愿意做出与集体利益一致的选择。
2. 沟通交流:通过沟通交流促进集体行动的协调也是重要的一步。
当个体能够充分理解彼此的利益并形成信任时,他们更有可能做出为集体利益最大化的行动。
蜈蚣博弈法作者:白诗诗来源:《领导文萃》2016年第11期少有人知,海盗是世界上最民主的团体。
平时,他们的一切事务均由投票解决。
船长的唯一特权只是拥有一套自己的餐具。
海盗船上的唯一惩罚,就是把人丢到海里去喂鱼。
现在我们知道,某一艘船上有若干个海盗,正准备瓜分抢来的100枚金币,这样的问题他们当然选择投票解决。
投票的规则如下:1.抽签确定各人的分配顺序号码(1、2、3、4、5);2.由抽到1号签的海盗提出分配方案,然后5人进行表决,如果方案得到超过半数的人同意,就按照他的方案进行分配,否则1号就要被扔进大海去喂鲨鱼;如果1号被扔进大海,则由2号提出分配方案,然后由剩余的人进行表决,同理当超过半数的人同意时,才会按照他的提案进行分配,否则他也将被扔入大海。
我们先要对海盗们做一些假设:第一,每个海盗的凶残性都不同,而且所有海盗都知道其他几人的凶残性。
第二,每个海盗当然都不愿意自己被丢到海里喂鱼。
第三,每个海盗都希望自己能得到尽可能多的金币。
第四,每个海盗都是功利主义者,他们相信二鸟在林,不如一鸟在手。
第五,每个海盗都很喜欢其他海盗被丢到海里喂鱼。
如果海盗和他们的分配原则都如我们上面假设的那样,那么我们运用倒推法,得出海盗会做出如下的理性分析:首先从5号海盗开始。
5号海盗是最安全的,没有被扔下大海的风险,只要他保证始终投否定票。
接下来看4号,他的生存机会完全取决于前面是否还有人存活着,因为如果1号、2号和3号海盗全都喂了鲨鱼,在只剩4号与5号的情况下,不管4号提出怎样的分配方案,5号一定都会投反对票来让4号喂鲨鱼,以独吞全部金币。
因此,他绝不能把存活的希望寄托在5号身上,而只能无条件地支持3号。
再来看3号,他经过推理,知道4号和5号的盘算,就会提出(100、0、0)这样的分配方案,因为他知道4号哪怕一无所获,为了保命也还是会无条件地支持自己,那么再加上自己的1票就可以使他得到这100枚金币了。
2号也经过上述的逻辑推理知道了3号的分配方案,如果他想让自己的方案通过,就必须获得除自己之外的两个人的赞成,经过思考,他会提出(98、0、1、1)的方案。
1.实验指南蜈蚣博弈是罗森塞尔(Rosenthal,1981)提出的一个动态博弈问题。
由于博弈的扩展形式很像一条蜈蚣,因此被称为“蜈蚣博弈”。
实验表明,受到公平、信任、利他等因素的影响,人与人实际的博弈结果与理论的博弈均衡存在偏离。
蜈蚣博弈模型在公共政策领域有着极为广泛的应用,如区域政府间政策取向的博弈分析等。
实验包含若干轮,每轮包含若干阶段。
实验参与者每2人为一对,一人为角色A,一人为角色B。
参与者将两两配对进行,并交互先后进行决策。
参与者的收益将由双方的行为共同确定。
实验中,一方(A)首先根据当前阶段的收益进行决策,是继续进行还是终止本轮实验,若终止本轮实验,则将按照当前阶段收益为双方分配收益;若继续本轮实验,则进入到下一阶段,双方可获得的收益将发生变化,由另一方(B)进行决策,是继续进行还是终止本轮实验。
双方交替进行决策,直到有一方终止本轮实验,或者实验达到最大阶段数为止。
2.实验引导(1)指导语◇实验每2人为一对进行,一人为角色A,一人为角色B。
◇配对的两人在所有轮次中是否保持不变,取决于参数“匹配方式”的设置。
◇实验包含若干轮次,每个轮次包含若干阶段。
◇每个阶段中,A、B两人中将会有一人具备决策权。
决策时,参与者需要确定,是继续进入到下一阶段,还是在本阶段结束本轮实验。
AB轮流进行决策。
◇决策时,决策者可以看到若在本阶段结束,自己和对方能够获得的收益。
◇实验进行的总轮次、每轮次能够进行的最大阶段数,以及每个阶段A/B能够获得收益信息是否对参与者公开,取决于实验主持者对相关信息公布与否的设定。
(2)实验提示实验轮次:第I轮 ,共V1轮,角色:A/B本轮实验将在某一阶段结束,结束后双方获得的收益由收益表6.11确定。
表6.11 蜈蚣博弈的各阶段收益决策 阶段 A收益(你)B收益(对方)继续/结束-> 1 2 0.5继续/结束-> 2 1 4继续/结束-> 3 6 1.5继续/结束-> 4 2 8继续/结束-> 5 10 2.5继续/结束-> 6 3 12继续/结束-> 7 14 3.5继续/结束-> 8 4 16继续/结束-> 9 18 4.5继续/结束-> 10 5 20说明:若总轮数实验主持者设定参数值为“不公布”,则V2显示为“*”;若总阶段数实验主持者设定为“不预知”,在当前阶段结束前,后续阶段中的数据均显示为“*”。
实验轮次、角色及各阶段收益,均由实验主持者设定。
3.参数说明与设置1.实验参数设置实验的参数设置如图6.6。
图6.6 蜈蚣博弈实验参数设置2.参数说明表6-3 蜈蚣博弈参数说明名称 默认值 说明参与人数 12 实验参与人数,必须是偶数。
轮数 5 实验进行总轮数。
当前轮次为第I轮。
公布 公布 参与者在进行实验时,是否知道当前实验将进行的总轮数。
可设置为“公布”或“不公布”每组人数 12 必须是偶数。
一人为角色A,一人为角色B匹配方式固定 固定/随机,若选择随机,则每轮重新随机匹配角色A和角色B。
每轮阶段数 6 允许设置的总阶段数<=10阶段收益 预知 参与者在做当前阶段的决策时,是否知道后期各个阶段的收益值。
在设定完成每轮阶段数后,还需要设置各个阶段参与者的不同收益,由阶段收益表给出,例如表6.12。
表6.12 蜈蚣博弈各阶段收益值设定阶段 A收益B收益1 2 0.52 1 43 6 1.54 2 85 10 2.56 3 127 14 3.58 4 169 18 4.510 5 204.实验主持与讨论1、实验主持实验主持者界面如图6.7。
图6.7 蜈蚣博弈的实验主持(1)信息区说明:◇在“组号”下拉列表中选择组号,显示指定组号实验信息。
◇在“轮次”下拉列表中选择轮次,显示指定轮次实验信息。
◇勾选“显示信息”,信息区显示实验信息;取消勾选,信息区不显示任何信息。
◇单击某列列名,信息按该列排序。
(2)信息列说明◇轮次。
实验信息产生的轮次。
◇组号。
实验参与者所在组。
◇用户名。
参与者登陆名称。
◇角色。
参与者扮演角色(A或者B)。
◇结束阶段。
本轮实验在第几阶段结束。
◇结束者。
结束本轮实验的参与者用户名。
◇回合收益。
参与者本轮获得的收益。
◇累计收益。
参与者累计获得的收益。
(2)实验设计◇实验设计1。
蜈蚣博弈的各阶段收益值,也可以采取另外一组数据进行实验(主持者根据自己的需要自行定义设计也可)。
这两组数据的收益设置,在Holt所进行的实验及教学中,都曾被采用过,也可用于进行对比实验,见表6.13。
表6.13 Holt蜈蚣博弈的各阶段收益设置第一组(系统默认值) 第二组阶段 A收益B收益 阶段 A收益 B收益1 2 0.5 1 2 0.52 1 4 2 1.5 63 6 1.5 3 10 2.54 2 8 4 3.5 145 10 2.5 5 18 4.56 3 12 6 5.5 227 14 3.5 7 26 6.58 4 16 8 7.5 309 18 4.5 9 34 8.510 5 20 10 9.5 38而如果想复现Mckelvey和Palfrey的实验,则可以采用理论背景中所给出的阶段收益值。
◇实验设计2。
将“阶段收益”设定为“不预知”,进行实验,看看参与者的决策有没有发生变化。
(3)实验讨论◇如果实验只有一轮,你会做出和现在不一样的选择吗?◇你结束实验的策略和原则是什么?◇如果你知道你的对手方具体是哪个熟悉的同学,你的选择会发生改变吗?5.图表解读实验结束后,可以查看实验的结果图,如图6.8。
图6.8 蜈蚣博弈的实验结果在下拉列表中选择组号、成员。
◇X轴。
轮次。
◇Y轴。
结束阶段。
◇选择所有组。
在该阶段结束的一对参与者将标识为一个点。
◇选择某个参与者。
点表示该对实验参与者结束的阶段。
6.理论背景蜈蚣博弈是对两阶段议价博弈的延伸。
在两阶段博弈中,参与者A需要考虑参与者B 将如何回应自己的决策,此时需要进行换位思考。
但是“通过别人的眼睛来看未来”的换位思考过程,并不容易也不自然,而且多于两个阶段时,难度会大大增加。
一个可以直接想到的办法是,从最后一个决策者开始,考虑这个人的理性选择,然后反向推导倒数第二个决策者,而后是倒数第三个、第四个。
但是在多阶段中,参与者的行为相对两阶段而言,更难以预测,而且会受到实验中其他因素的影响。
1982年,罗森塞尔(Rosenthal)提出了一个100阶段的序贯博弈,作为反向推导过程的极端的压力测试,100个阶段中,每个阶段都面临着选择,是继续当前的实验,还是就此终止,这样实验过程看起来像是有100条腿的昆虫,因而被命名为蜈蚣博弈。
图6.9给出了一个蜈蚣博弈的简化版本,来自于Mckelvey 和Palfrey (1992)的实验设计。
这条蜈蚣只有4条腿,在每个节点上,参与者(A 或者B )都可以选择向下移动终止博弈,或者选择向右移动,将决策权交给另一个参与者,一直到最后一个阶段。
博弈从最左边开始,A 必须决定是终止(选择向下移动)还是继续(选择向右移动)。
第一阶段选择向下,终止博弈,那么A 获得的收益为40,B 获得的收益为10;接下来由B 选择,他也可以选择向下或者继续,如果终止,对应的收益为(A-20,B-80),后面以此类推。
图6.9 McKelvey 和Palfrey 进行的蜈蚣博弈显然,对于B 而言,在最后一个阶段选择终止最好,这样可以获得320的收益,而不是160。
那么继续反向推导的话,如果预期到B 会在最后一个阶段选择终止,那么A 自己收益160的时候选择终止,而不是等到B 来选择。
如果继续往前反推的话,就得到了这样的结论:A 会在第一阶段就终止博弈,双方的收益都不高。
从逻辑推理来看,倒推法是严密的,但结论却是违反直觉的。
直觉告诉我们,一开始就采取不合作的策略获取的收益对双方都不利,采取合作策略是好的。
但是从逻辑的角度看,一开始A 采取不合作的策略是一个理性选择,那么,到底是反推出了问题,还是直觉存在误差?对于蜈蚣悖论,许多博弈专家都在寻求它的解答。
而采用实验方法进行的实际验证表明,并不是所有的参与者都选择了在第一阶段终止实验,Mckelvey 所进行的实验在各个阶段终止的比例在图6.9中进行了标注。
实验发现,常常的情况是,人们不会出现一开始选择“不合作”策略而双方获得最低收A B A B(640,160)2%(40,10)8% (20,80) 41%(160,40) 38%(80,320) 10%益。
双方会自动选择合作性策略,从而走向合作,但是这种合作也不会坚持到最后一步。
理性的人出于自身利益的考虑,肯定在某一步采取不合作策略,但其“终止”合作的时间和动机,难以确定。
有人认为,反向推导的无效可能是因为,即使在后面阶段中,其他参与者的决策的不可预测性非常小,也会使得在最初阶段中最优反应是继续下去,因为高收益集中在右边的节点,一部分“利他主义者”会考虑其他人获得的收益——即使他们不属于主流,但对于自私的个体而言,在早期阶段继续博弈也是最优的。
另外有人认为,反向推导的失败可能源于激励过低,在更大利益的实验中,人们的行为可能更为理性。
Parco(2002)等进行的实验中,潜在的收益被设定到了数千美元,但是实验结果表明,也并不是这样。
虽然高收益造成了人们更快地终止博弈,但是在第一阶段就终止的人数比例依然不占多数。
另外Nagel(1998)等研究考虑了实验中参与者在蜈蚣博弈中的学习和调整过程,而Zauner(1999)对博弈过程中的随机性影响进行了分析。