蜈蚣博弈
- 格式:ppt
- 大小:233.50 KB
- 文档页数:20
1.实验指南蜈蚣博弈是罗森塞尔(Rosenthal,1981)提出的一个动态博弈问题。
由于博弈的扩展形式很像一条蜈蚣,因此被称为“蜈蚣博弈”。
实验表明,受到公平、信任、利他等因素的影响,人与人实际的博弈结果与理论的博弈均衡存在偏离。
蜈蚣博弈模型在公共政策领域有着极为广泛的应用,如区域政府间政策取向的博弈分析等。
实验包含若干轮,每轮包含若干阶段。
实验参与者每2人为一对,一人为角色A,一人为角色B。
参与者将两两配对进行,并交互先后进行决策。
参与者的收益将由双方的行为共同确定。
实验中,一方(A)首先根据当前阶段的收益进行决策,是继续进行还是终止本轮实验,若终止本轮实验,则将按照当前阶段收益为双方分配收益;若继续本轮实验,则进入到下一阶段,双方可获得的收益将发生变化,由另一方(B)进行决策,是继续进行还是终止本轮实验。
双方交替进行决策,直到有一方终止本轮实验,或者实验达到最大阶段数为止。
2.实验引导(1)指导语◇实验每2人为一对进行,一人为角色A,一人为角色B。
◇配对的两人在所有轮次中是否保持不变,取决于参数“匹配方式”的设置。
◇实验包含若干轮次,每个轮次包含若干阶段。
◇每个阶段中,A、B两人中将会有一人具备决策权。
决策时,参与者需要确定,是继续进入到下一阶段,还是在本阶段结束本轮实验。
AB轮流进行决策。
◇决策时,决策者可以看到若在本阶段结束,自己和对方能够获得的收益。
◇实验进行的总轮次、每轮次能够进行的最大阶段数,以及每个阶段A/B能够获得收益信息是否对参与者公开,取决于实验主持者对相关信息公布与否的设定。
(2)实验提示实验轮次:第I轮 ,共V1轮,角色:A/B本轮实验将在某一阶段结束,结束后双方获得的收益由收益表6.11确定。
表6.11 蜈蚣博弈的各阶段收益决策 阶段 A收益(你)B收益(对方)继续/结束-> 1 2 0.5继续/结束-> 2 1 4继续/结束-> 3 6 1.5继续/结束-> 4 2 8继续/结束-> 5 10 2.5继续/结束-> 6 3 12继续/结束-> 7 14 3.5继续/结束-> 8 4 16继续/结束-> 9 18 4.5继续/结束-> 10 5 20说明:若总轮数实验主持者设定参数值为“不公布”,则V2显示为“*”;若总阶段数实验主持者设定为“不预知”,在当前阶段结束前,后续阶段中的数据均显示为“*”。
蜈蚣博弈蜈蚣博弈(Centipede game)什么是蜈蚣博弈蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。
它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。
假定A先选,然后是B,接着是A,如此交替进行。
A、B 之间的博弈次数为有限次,比如100次。
假定这个博弈各自的支付给定如下:1合作合作合作合作...合作合作A B A B …… A B (100,100)合作合作合作合作...合作背叛A B A B …… A B (98,101)现在的问题是:A、B是如何进行策略选择的?这个博弈因形状像一只蜈蚣,而被命名成“蜈蚣博弈”。
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。
但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”——此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100-99。
1蜈蚣博弈的悖论1根据倒推法,结果是令人悲伤的。
从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。
直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。
当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。
直觉告诉我们采取合作策略是好的。
而从逻辑的角度看,一开始A应取不合作的策略。
我们不禁要问:是倒推法错了,还是直觉错了?这就是蜈蚣博弈的悖论。
什么是悖论?悖论(paradox)来源于希腊语,para意即“超越”,doxos的意思是“相信”。
蜈蚣博弈悖论-概述说明以及解释1.引言1.1 概述蜈蚣博弈悖论是一个有趣的概念,在博弈论和经济学领域引起了广泛的关注。
它揭示了在一些情况下,个体的理性选择可能会导致整体结果的恶化,从而违背了我们对于理性行为的常识理解。
蜈蚣博弈悖论的概念最早由约翰·内许·纳什提出,他是一位著名的博弈论学者,也是电影《美丽心灵》中的主角。
在蜈蚣博弈中,两个博弈者面对着一个简单的选择:继续合作还是背叛对方。
合作会带来一定的收益,但背叛会获得更大的收益。
然而,当双方都选择背叛时,他们获得的收益反而会比合作时更小,因为他们会陷入一个恶性循环,导致双方都无法取得最优结果。
这种现象的出现源于博弈过程中的信息不对称和不完全信息。
当一方选择背叛时,对方无法得知其真实意图,因此会做出相同的回应。
但如果双方都能够互相合作,他们将能够达到更优的结果。
然而,由于彼此之间的不信任,他们陷入了一个无法打破的困境。
蜈蚣博弈悖论的研究对我们理解社会行为和决策过程有着深远的意义。
它提醒我们,有时候人们的理性选择并不一定能够带来最好的结果,而可能导致整体的恶化。
在现实生活中,类似的悖论现象也存在于合作与竞争、公共利益与私人利益之间的权衡中。
了解蜈蚣博弈悖论可以帮助我们更好地理解人类行为,并寻找解决方案来避免潜在的困境。
接下来的文章将进一步探讨蜈蚣博弈悖论的影响因素、应用领域以及可能的解决方法。
我们将深入分析其中的数学模型和实证研究,以期对这一现象有一个更全面的认识。
通过增加对于合作与竞争的了解,我们可以在个人和社会层面上做出更明智的决策,从而实现真正的共赢局面。
1.2文章结构文章结构是指文章的组织框架和布局方式,它主要由引言、正文和结论三部分构成。
引言部分是文章的开头,用于引入主题并概述文章的内容和结构。
正文部分是文章的主体,包括详细而系统的论述和分析。
结论部分是文章的结束,总结主要观点并给出进一步展望。
在本篇文章中,引言部分将首先概述蜈蚣博弈悖论的基本情况和相关背景信息,引起读者的兴趣,并引出文章讨论的目的。
用“难得糊涂”来化解“蜈蚣博弈”的困境摘要:本文首先对两个不同领域的概念进行了介绍,主要针对“蜈蚣博弈”由逆向归纳法引发的困惑进行了分析,指出在现实的博弈中,非理性人的“难得糊涂”在特定的情况下,能够达到个人和集体利益的最大化,是我们追寻的一种境界。
关键词:蜈蚣博弈逆向归纳法博弈难得糊涂理性人一、名词介绍1.“蜈蚣博弈”“蜈蚣博弈”(centipede game)是博弈论中的一个概念,它是由罗森塞尔(Rosenthal)在1981年提出的有限次动态博弈问题中的一个经典模型。
由于这个博弈的扩展式很像一条蜈蚣,因此被称为“蜈蚣博弈”。
蜈蚣博弈是指这样一个博弈:两个博弈方A、B轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。
博弈规则是:A、B轮流决策一次为一轮;在第n轮决策中,第一次若A选择“不合作”,决策结束,A、B的收益均为n;第二次若B选择“不合作”,决策结束,A得n-1,而B得n+2;下一轮则从A、B都得n+1开始。
假定A先选,然后是B,接着是A,如此交替进行。
假设A、B之间的博弈为一有限次,为99轮,共198个决策结,A、B双方各有99个决策结。
博弈树如下图所示: 在上图中,所有收益数组中第一个数字是博弈方A的收益,第二个数字是博弈方B的收益。
在这个博弈中的博弈方A、B是如何进行策略选择的?2.“难得糊涂”“难得糊涂”是清代书画家、文学家郑板桥题过几副著名的匾额中的一句名言,二百年来妇孺皆知,被世人当作人生信条,一直流传至今。
按照现代人的理解,“难得糊涂”,就是指一个人在非原则问题上不计较,在细小问题上不纠缠;对一些可问可不问的事情,可以装作未看见;以理智的“糊涂”,去平息可能发生的矛盾,排解心中的烦恼之事。
从某种意义上说,这样做往往可以解除许多心理压力,化干戈为玉帛,达到共创和谐的目的。
二、“蜈蚣博弈”的困惑1.逆推归纳法求解“蜈蚣博弈”“蜈蚣博弈”是一个有限完美信息的动态博弈,求解其子博弈精炼纳什均衡的最简便的方法是逆向归纳法。
蜈蚣博弈悖论-回复什么是蜈蚣博弈悖论?蜈蚣博弈悖论是一种心理学和经济学的悖论,也被称为蜈蚣逆理论或蜈蚣效应。
该悖论的思想基于一个关于博弈理论的假设,假设蜈蚣每次步行时一侧的腿按照一定顺序向前移动,而剩下的腿则静止。
但经过简单的逻辑推理可以发现,从理论上来说,蜈蚣即使有无限多条腿,也无法前进。
在蜈蚣博弈悖论中,玩家的行动是连续而不是离散的,也就是说在某一时刻每个玩家可以进行的策略是连续的。
这样一来,每个玩家都面临一个困境,在他未来的策略和行为中,存在无穷多种选择。
然而,理性的假设下,玩家需要同时考虑到自己和对手的行为,即使存在无穷多的可能性。
遇到无穷多的可能性时,蜈蚣是否能做出一个选择来保证其前进的问题就成为一个普遍存在的难题。
根据传统的博弈理论,理性的玩家应该能够做出最佳选择,在某种程度上,这意味着玩家能够做出接近无穷次的选择。
然而,对于这个问题,蜈蚣却无法做出一个能够使其前进的选择。
蜈蚣博弈悖论揭示了人类对于连续决策的困扰以及理性决策的局限性。
在现实生活中,人们经常面临类似的问题,例如对于各种连续的投资机会的选择,或者是对于无穷可能性的考虑。
在解决蜈蚣博弈悖论时,需要考虑一系列因素,包括不确定性、个人风险偏好以及对即时收益和未来回报的权衡考虑。
另外,也需要了解到个体行为决策中的局限性,例如有限的认知能力和信息获取。
有人认为,蜈蚣博弈悖论说明了人类理性意识的有限性,因为理性决策并不是总能够解决所有问题。
根据蜈蚣博弈悖论,人们在面临连续决策时需要做出选择,然而,由于不确定性和局限性的存在,可能会导致最佳选择的失误。
然而,也有人持不同观点,认为蜈蚣博弈悖论可能只是一种思维陷阱,毕竟现实世界中并不存在真正的无穷连续。
这种观点认为,虽然连续性会给决策增加复杂性,但理性决策仍然是可能的,并且人类可以通过合理的模型和策略来处理连续的决策问题。
总而言之,蜈蚣博弈悖论是一个复杂而有趣的概念,引发了人们对于连续决策和理性行为的思考。
以蜈蚣博弈研究烟草工业合作生产的发展思路烟草工业合作生产是指各烟草企业之间建立合作关系,共同参与生产、销售和经营活动。
蜈蚣博弈是一种博弈论中常用的策略,通过合作达到共同利益最大化。
建立互信合作关系是合作生产的基础。
烟草企业之间应该建立稳定、长期的合作关系,建立信任和理解,形成公平、公正、互利的合作模式。
只有在互信的基础上,才能共同合作、共同发展。
加强合作伙伴之间的沟通和交流。
烟草企业可以组织定期的合作会议,共同讨论合作事项,分享经验和信息。
通过沟通和交流,可以及时解决合作中出现的问题,推动合作生产的顺利进行。
优化产业链条和价值链。
烟草企业可以通过合作生产,共同协调和规划产业链上的各个环节,实现各个环节之间的优化和协同。
在产业链条上加入更多的附加值环节,提升产品品牌价值和市场竞争力。
要做好风险管理工作。
烟草工业合作生产中难免会面临各种风险,如市场风险、技术风险、政策风险等。
合作伙伴之间应该共同分担和管理风险,制定有效的风险管理措施。
建立健全的合作框架和协议,明确各方的权责,提高合作的稳定性和可持续性。
要注重创新和持续发展。
烟草工业合作生产应该积极引进新技术、新产品和新模式,不断创新,提升核心竞争力。
要关注产业发展的长远性,注重生态保护,推动绿色、可持续发展。
只有不断创新和持续发展,才能在激烈的市场竞争中取得优势。
烟草工业合作生产的发展思路应该是建立互信合作关系、加强沟通交流、优化产业链条和价值链、做好风险管理、注重创新和持续发展。
通过合作生产,烟草企业可以共同实现规模效应,提高市场竞争力,实现共赢发展。
逆推归纳法是博弈论及博弈逻辑研究中的一种常用的方法,由策梅洛(E.Zermelo)在讨论象棋博弈问题时首先使用,后经泽尔腾(R.Selten)完善及推广。
逆推归纳法主要用于求解完全且完美信息动态博弈。
完全且完美信息动态博弈的特点是,两个或多个局中人轮流博弈,局中人完全了解全部局中人任何决策可能导致的收益情况,并且局中人在进行每一次决策时完全知道之前阶段中自己和对手的策略。
逆推归纳法从动态博弈的最后一个阶段开始分析,向后推理、逐步倒推,直到博弈开始阶段局中人的决策。
逆推归纳法是完全归纳推理,结论是必然的。
然而这种逻辑严密的推理方法得到的预测或结果与现实中的博弈行为往往不一致,这就是“逆推归纳法悖论”的基本内涵。
逆推归纳法悖论的典型案例有连锁店悖论,有限重复囚徒困境、蜈蚣博弈悖论等。
真正引起人们对逆推归纳法悖论极大关注的是罗森塔尔(R.Rosenthal)首先研究的蜈蚣博弈悖论[1]。
逆推归纳法悖论是一种合理行为悖论,体现的是博弈论推理与人们实际行动的矛盾,这种矛盾无疑对博弈理论的合理性提出了挑战。
一尧蜈蚣博弈的逆推归纳法分析及悖论蜈蚣博弈悖论属于典型的逆推归纳法悖论,运用逆推归纳法分析博弈所得到的结果与人们的直觉不一致,并且与实验及现实博弈结果均发生了偏离[2]。
图1蜈蚣博弈的原始模型罗森塔尔在1981年的文献[3]中给出了3个完美信息动态博弈的模型,其中之一便是蜈蚣博弈的原始模型,如图1所示;后来宾默(K.Binmore)进行基于信念变化的蜈蚣博弈悖论解悖探析张峰1,赵绪涛2(1.北京理工大学,北京100081;2.中国人民大学,北京100872)摘要:逆推归纳法是研究完美信息动态博弈的常用方法,通过完全归纳得到必然结论,但用于分析蜈蚣博弈时理论预测与人们的实际博弈行为发生偏离,导致悖论。
蜈蚣博弈的结构精致而复杂,局中人对博弈收益情况的权衡以及局中人试图在非合作的博弈机制中进行合作的主观倾向,影响了局中人决策时的信念变化。