进化稳定策略在双重对称博弈中存在及证明
- 格式:pdf
- 大小:94.38 KB
- 文档页数:2
演化博弈均衡点和稳定性分析
演化博弈是一个可以持续发展和改进策略的个体对抗策略,是研究多人竞争行为的理论。
演化博弈主要分析的是在一个竞争中,玩家之间用他们的策略进行博弈的行为特点,
演化博弈的基本理论是玩家在定义好的投掷状态与其他玩家竞争的局面中做决定,其结果
可以用一个矩阵来表示。
演化博弈的理论是模型,其中包括稳定均衡点的分析以及稳定问
题的研究。
首先,演化博弈均衡点分析是指每个玩家在博弈中作出决定时,所留下的矩阵中所取
得的结果是一种状态。
若该状态使得双方都处于一个满足状态,即当双方选择某一种策略,且所有其他策略均无法改变双方利润情况,则该状态即为均衡点。
均衡点表达一种博弈双
方在特定投掷状态下,获得最大利润的策略。
比如说,双方都坚守原则,都会得到尽可能
的福利。
其次,游戏的稳定性分析是指双方在某一特定的投掷状态下,能否维持某一均衡点,
使得双方都获取最大的利润,即双方都坚守他们的策略。
在分析过程中,要思考一种博弈
模型的稳定性及其影响因素,以及博弈模型中哪些玩家削弱了双方之间的稳定性,以及改
善双方稳定关系的措施等等。
演化博弈均衡点与稳定分析博弈做此分析有助于深入理解该博弈模型,既能分析双方
的最优策略,又能研究双方的稳定性,从而明确双方的水平以及沟通渠道,为双方进行博
弈活动提供理论指导。
进化稳定均衡与纳什均衡经济专家论文报告:进化稳定均衡与纳什均衡1. 引言2. 进化稳定均衡的基本概念和理论分析3. 进化稳定均衡和纳什均衡的区别和联系4. 进化稳定均衡在实际问题中的应用5. 总结与展望1. 引言进化稳定均衡和纳什均衡是现代博弈论中的两个重要概念。
前者是指在演化过程中,一种策略能够保持自身的数量和适应性,成为一种稳定的演化策略;后者是指在博弈中,每个参与者采取最佳策略的状态。
本文将分析这两种均衡的概念、性质以及在经济学中的应用,并探讨它们之间的联系和区别。
2. 进化稳定均衡的基本概念和理论分析进化稳定均衡是指一个策略因为拥有适应性而繁衍下来,成为博弈中一种最具竞争力的策略。
在进化过程中,策略需要满足两个条件:稳定和可入侵。
如果一种策略对抗其他策略的成功率高于其他策略对抗该策略的成功率,那么该策略就是稳定的。
可入侵是指其他策略能够通过有限的数量优胜该策略。
进化稳定均衡是指满足进化过程、稳定和可入侵的状态。
在理论分析中,进化稳定均衡和纳什均衡经常被对比。
在一个有限的,重复的博弈中,如果每个参与者受到不完全信息或随机事件的影响,那么进化稳定均衡可能不存在。
但是在无限重复博弈中,可以通过相关策略维护一个进化稳定均衡。
进化稳定均衡的产生依赖于群体的数量和适应性,可以通过对群体动态的分析和博弈理论的结合进行研究。
3. 进化稳定均衡和纳什均衡的区别和联系尽管进化稳定均衡和纳什均衡都是均衡的概念,它们之间有一些显著的差别。
纳什均衡是指博弈中每个参与者采取最佳策略的状态;进化稳定均衡是指具有适应性的策略在演化过程中成为博弈中一种最具竞争力的策略状态。
因此,进化稳定均衡更适用于群体的经济学分析,而纳什均衡更适用于个体的分析。
此外,在某些情况下,进化稳定均衡可能不存在;而纳什均衡总是存在的。
因此,在实际应用中,我们需要谨慎选择使用哪种均衡概念。
4. 进化稳定均衡在实际问题中的应用进化稳定均衡的理论在经济学中得到了广泛应用,其中最突出的是在博弈论和演化经济学方面。
对称均衡非对称均衡博弈论
对称均衡和非对称均衡是博弈论中的重要概念,用于描述博弈中各方的策略选择和结果。
在博弈论中,博弈是指一种决策情形,其中参与者的利益受到彼此的影响。
对称均衡和非对称均衡都是描述博弈中可能出现的情况的概念。
首先,让我们来看看对称均衡。
在博弈论中,对称均衡是指参与者采取相同的策略,并且没有动机去改变自己的策略,因为任何一方的单方面改变都不会使其获益。
对称均衡的一个经典例子是“囚徒困境”博弈,其中两名囚犯面临合作或者背叛的选择。
在对称均衡中,如果两名囚犯都选择背叛,那么他们都会受到最严厉的惩罚,而如果两名囚犯都选择合作,那么他们都会受益。
因此,对称均衡发生在他们都选择背叛或者都选择合作的情况下。
其次,非对称均衡是指参与者采取不同的策略,并且在当前策略下没有动机去改变自己的策略,因为任何一方的单方面改变都不会使其获益。
非对称均衡的一个例子是“买方市场”博弈,其中卖方和买方在价格谈判中采取不同的策略。
在非对称均衡中,如果卖方设定了一个最低价格,而买方愿意接受这个价格,那么双方都没有动机改变自己的策略。
总的来说,对称均衡和非对称均衡是博弈论中用于描述参与者策略选择和结果的重要概念。
通过研究对称均衡和非对称均衡,我们可以更好地理解博弈中参与者的决策行为,以及他们可能达到的结果。
这些概念对于经济学、政治学以及其他社会科学领域都具有重要意义。
希望这个回答能够帮助你更好地理解对称均衡、非对称均衡和博弈论的相关概念。
一般两人对称博弈的复制动态和进化稳定策略例题一般两人对称博弈是指两个玩家在相同的游戏环境中进行博弈,每个玩家都会根据自己的利益选择不同的策略,从而导致不同的结果。
复制动态和进化稳定策略是指在这样的博弈中,玩家的策略会随着时间的推移而发生变化,最终达到一个稳定的状态。
在一个两人对称博弈中,有两种不同的策略可以选择,分别记作A和B。
假设在初始状态下,玩家A和玩家B各自采取了一种策略,分别记作a和b。
根据复制动态的原理,下一轮博弈中,玩家A和玩家B将继续采用他们上一轮博弈中的策略,如果其中一个玩家的策略获胜,那么他将成为下一轮博弈中的胜者,继续采用他的策略。
如果两个玩家的策略得分相等,那么两个玩家将随机选择一个策略进行下一轮博弈。
这个过程将持续下去,直到达到一个稳定状态。
进化稳定策略是指在一定时间内,玩家的策略会发生变化,而最终达到一个稳定的状态。
在一个两人对称博弈中,如果一个策略可以在当前环境中稳定存在,即如果所有玩家都采用这个策略,那么没有一个玩家会想要改变他们自己的策略,那么这个策略就是进化稳定策略。
举个例子,假设在一个两人对称博弈中,A和B分别可以选择合作(C)或背叛(D),并且根据不同的选择得到不同的收益。
如果两个玩家都选择合作(C,C),则他们每个人都会得到3分;如果两个玩家都选择背叛(D,D),则他们每个人都会得到1分;如果一个玩家选择合作而另一个选择背叛(C,D或D,C),则合作的玩家得到0分,而另一个玩家得到5分。
在这种情况下,合作是一个进化稳定策略,因为如果所有玩家都选择合作,那么没有一个玩家会想要改变他们的策略,因为这是他们能够获得最大收益的策略。
总之,复制动态和进化稳定策略是博弈论中的两个重要概念,通过它们可以更好地理解玩家在博弈中的策略选择,并预测最终稳定的结果。
演化博弈论简介丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。
他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。
传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。
正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。
我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。
先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。
我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。
从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。
我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。
我这里用演化,避免用演进,可以减少误解。
演化理论中有两条最重要的机制。
一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。
在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。
我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。
我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。
严复说物竞天择,就是这个意思。
另一种机制叫突变机制(mutant),这保证了种群的变化。
如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。
进化稳定策略名词解释博弈论
在博弈论中,进化稳定策略(Evolutionarily Stable Strategy,简称ESS)是一个用于描述自然选择过程中达到稳定状态的策略。
它是一种在种群中长期占据主导地位的策略,即使在其他策略发生微小变化或突变的情况下,它仍能保持稳定。
一个策略被认为是进化稳定的,当且仅当满足以下两个条件:
1. 在与其他具有相同策略的个体的对抗中,该策略具有至少与对手相等的平均适应度(fitness)。
也就是说,具有这一策略的个体在与其他相同策略个体竞争中不会处于劣势。
2. 如果一个微小的突变策略出现在种群中,那么具有进化稳定策略的个体在与突变策略个体竞争时,具有更高的平均适应度。
这意味着一旦达到进化稳定状态,任何试图改变策略的个体都会受到劣势,因此进化稳定策略能在长期内保持稳定。
这与纳什稳定的理念相关,但进化稳定策略更进一步地强调了种群内部的稳定性。
这一理论主要与博弈论、行为生态学和进化心理学有关,旨在阐述外部环境的变化如何带来新的选择性力量,而非通过有目的地处理外部环境可能发生的变化来引入新的种群进化选择力。
进化博弈论读书报告汪波1973年,梅拉德·史密斯和普瑞斯将博弈论的思想引入到生物演化的分析中,二人提出了进化稳定策略(ESS ),随着1978年, Taylor 和Jonker 发现了进化稳定策略和复制动力学之间的关系,标志着进化博弈理论的诞生,因为与复制动力学之间的关系,进化稳定策略也因此成为进化博弈理论最经典的概念。
1982年,梅拉德·史密斯出版了《演化与博弈论》,该书揭示动物群体的行为变化的动力学机制,也因此书他被称为进化博弈论之父,1995年,Weibull 著作了《Evolutionary Game Theory 》,2009年初,Sandholm 出版了《Population Game and Evolutionary Dynamics 》专著,这篇读书报告是在看了这三本著作的很少的一部分内容之下,理解其中一些浅显的内容后完成的。
一、进化稳定策略最初的模型进化博弈理论是将博弈论引入到生物学背景下产生的,当生物的特定表现型的适应度依赖于群体中的频率分布时,进化博弈论就是从这个角度来思考生物演化的问题的一种方法,古典博弈中,参与者根据自利的原则表现出理性行为,但在生物进化的背景下是不合适的,由此,理性原则被群体的动态性和稳定性取代,而自利原则则被达尔文的适应度所取代。
在一些重要的假设下,将会得到博弈的一个新形式解:进化稳定策略。
它是这样一个策略,如果整个群体的每个成员都采取这个策略,那么在自然选择的作用下,不存在一个具有突变特征的策略能够侵犯这个种群。
最初的简化的模型由梅拉德·史密斯和普瑞斯给出,他和普瑞斯也给出了进化稳定策略的数学式的描述定义,这一模型的本质特征是假设该群体有无限大的规模,繁衍以无性生殖的方式进行,竞争只在两个不存在任何差异的对手间展开即是成对的竞争。
生物学中价值是指两个动物为了争夺资源而增加的或者减少的达尔文适应度。
故我们用适应度作为最后个体的收益的衡量,假想在这个无限的种群中,有两个策略I 、J ,每一个成员都采取这两个策略之一,且策略的选择是随机的,在有竞争前个体的初始适应度为0w ,再假设整个群体中选择I 的概率为p ,()w I 、()w J 分别表示选择相应策略带来的适应度,而(,)E I J 表示个体选择策略I 而对手选择J 时的收益,其他(,)E I I 等表示类同的意义。
浅谈进化稳定策略摘要:本文主要介绍进化稳定策略的概念,进化博弈论在经济学中的发展。
为了便于理解,文中会举出进化稳定策略中的经典例子。
关键词:进化稳定策略鹰鸽博弈进化博弈进化稳定策略(Evolutionarily stable strategy,以下简称:ESS)作为进化博弈的一部分最早来自于达尔文的生物进化论。
本文要介绍的ESS是1974年,梅纳德〃史密斯(Maynard Smith)在博弈论的基础上提出的进化论和博弈论结合,在社会学、经济学和生态学领域获得了广泛的应用。
ESS被提出后,不同领域的学者对之进行了广泛的研究,使其体系日趋完善。
本文试图对进化稳定策略做出简要的介绍,介绍进化博弈论在经济学中的发展。
一、ESS的概念达尔文曾在《物种起源》一书中写到,“能存活下来的物种,并不是最强的,也不是最聪明的,而是看哪个物种最能适应环境的变迁。
”ESS正是这种达尔文进化理论的体现:它并不是一个绝对优势的策略。
ESS是指种群的大部分成员所采取某种策略,这种策略的好处为其他策略所不及。
动物个体之间常常为各种资源(包括食物、栖息地、配偶等)竞争或合作,但竞争或合作不是杂乱无章的,而是按一定行为方式(即策略)进行的。
对某个体而言,最好的策略取决于大多数成员在做什么。
由于种群的其他部分也是由个体组成,它们都力图最大限度地、更多更有效地繁殖自己的后代,因而能够持续存在的必然是这样一种策略:它一旦形成,任何举止异常个体的策略都不能与之比拟。
在环境的每次大变动之后,种群内可能出现一个短暂的不稳定期,但是一种ESS一旦确立,就会稳定下来,偏离ESS的行为就会被自然选择所淘汰。
简而言之,凡是种群的大部分成员采用某种策略,而这种策略的好处为其他策略所不及的,这种策略就是进化稳定策略(ESS)。
ESS策略是生物进化过程中的一个普遍现象,几乎所有的优化都涉及到这样的策略。
1二、鹰鸽博弈——ESS中的经典案例假设有一个特定的物种叫做“鹰和鸽子”,在这一物种中只有两种搏斗策略。