随机演化博弈的算法研究
- 格式:ppt
- 大小:1.44 MB
- 文档页数:50
演化博弈论我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。
先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。
我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。
从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。
我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。
我这里用演化,避免用演进,可以减少误解。
演化理论中有两条最重要的机制。
一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。
在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。
我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。
我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。
严复说物竞天择,就是这个意思。
另一种机制叫突变机制(mutant),这保证了种群的变化。
如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。
对于突变机制,我也要强调它是没有方向性的,可能会提高个体的适应性,但更有可能降低个体的适应性。
突变同样是上帝的选择,微观个体无能为力。
接下来,我们就可以回顾演化经济学的思想史了。
我在幻灯片里给出了一长串人的名字,他们都可以看作是具有演化思想的经济学家,都是演化经济学的先驱。
斯密,马克思,门格尔,马歇尔,凡勃仑,熊彼特,直到哈耶克。
我尤其要强调雄彼特的贡献,他研究经济发展和经济周期,提出了著名的"创新"思想。
演化博弈论演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。
在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。
演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。
但直到Smith andPrice(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。
生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。
模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。
编辑本段主要应用领域演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。
与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。
其开山之作《股市真面目》颠覆了股市运行机理的传统理论,可称为达尔文式的范式革命。
演化博弈理论综述班级:国贸112班姓名:***学号:**********第一部分概述演化博弈理论至少自Lewontin(1960)用于解释生态现象就已经产生了,并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。
进化博弈理论从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。
进化博弈理论强调系统达到均衡的动态调整过程,认为系统的均衡是达到均衡过程的函数,也就说均衡依赖于达到均衡的路径。
动态概念在进化博弈理论中占有相当重要的地位,许多博弈理论家对群体行为调整过程进行了广泛而深入的研究,根据他们考虑问题的角度不同而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型;Börgers and Sarin(1995,1997)等提出的强化动态1(Reinforcement Dynamics)模型等等。
但到目前为止,在进化博弈理论中应用最多的还是由Taylor and Jonke r(1978)提出的模仿者动态(Replicator Dynamics)模型。
模仿者动态是进化博弈理论的基本动态,它能较好地描绘出有限理性个体的群体行为变化趋势,由之得出的结论能够比较准确地预测个体的群体行为,因而倍受博弈论理论家们的重视。
本文集中介绍确定性模仿者动态概念、模型及其与经典博弈动态概念的区别。
在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。
在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。
与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。
复杂网络上的演化博弈与合作演化动力学研究复杂网络上的演化博弈与合作演化动力学研究随着社会网络和信息技术的迅速发展,人们之间的互动和合作呈现出新的特点,引起了学者们的极大关注。
复杂网络模型为研究人类社会行为提供了新的视角,其中的演化博弈与合作演化动力学成为一个重要研究领域。
本文将探讨复杂网络上的演化博弈与合作演化动力学的研究进展,并对其应用前景进行展望。
复杂网络的头脑复杂网络作为描述社会网络的数学工具,可以将现实世界中各种关系用图的形式表示。
在复杂网络中,每个节点代表一个个体或者单位,边表示它们之间的关联。
复杂网络可以是无标度网络、小世界网络或者随机网络等形式,不同的网络模型对应不同的现实情境。
演化博弈是研究人类社会行为的一种方法,它考察个体在特定环境下的决策和行动。
博弈论中的囚徒困境、合作博弈和纳什均衡等概念为我们理解合作与竞争的行为提供了基础。
而复杂网络上的演化博弈将个体的决策与网络结构相结合,以探究网络中的合作和演化动力学。
合作与策略的演化在复杂网络上进行演化博弈时,个体的策略选择是基于自身利益最大化的原则。
合作与竞争作为两种基本策略,相互影响并产生博弈结果。
例如,在囚徒困境中,个体可以选择合作(互相选择沉默)或背叛(互相选择出卖),各自的收益将会受到合作伙伴的策略选择影响。
合作的演化动力学通常会受到多个因素的影响,其中包括个体的决策策略、网络结构和博弈结果。
个体的决策策略可以是确定性的,也可以是基于某种概率的随机策略。
网络结构会影响个体之间的相互影响和信息传播,从而对合作演化产生影响。
博弈结果则会影响个体对合作的认同和行为选择。
复杂网络上的合作演化动力学模型可以通过演化方程、动态游戏和机制设计等方法进行研究。
其中,演化方程是描述演化博弈的数学工具,可以通过计算各种策略占比的变化来推断合作演化的情况。
动态游戏则可以描述演化参与者之间的策略变化和收益选择。
机制设计可以通过调整网络结构、激励机制和学习规则等方式来促进合作演化。