博弈论
- 格式:doc
- 大小:44.00 KB
- 文档页数:5
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
什么是博弈论?博弈论是一门研究策略决策的学科,它涉及到两个或多个参与者的博弈过程。
博弈论的研究对象可以是经济、政治、社会等领域,也可以是日常生活中的人际交往。
下面,我们来详细了解一下这门学科。
一、博弈论的起源博弈论起源于20世纪40年代,当时美国数学家冯·诺依曼(John von Neumann)和经济学家奥斯卡·莫根斯特恩(Oskar Morgenstern)合著了《博弈论与经济行为》一书。
这是一本奠定博弈论基础的重要著作,它将博弈论应用于经济学领域,从而成为博弈论的奠基之作。
二、博弈论的基本概念1.参与者博弈论的参与者指的是博弈过程中参与决策的个体或组织,例如一个独立的个人、两个公司或国家之间的竞争。
2.策略策略是指参与者在博弈中所采用的行为方式或决策方法。
不同的策略可能导致不同的博弈结果,因此博弈过程中策略的选择非常重要。
3.收益收益是博弈过程中参与者所能获取的利益,包括经济利益、社会地位、权力等。
收益对参与者而言是决策的目的和结果,因此其大小和分布会影响博弈的结果。
4.博弈形式博弈形式指的是博弈参与者、策略和收益之间的关系,是博弈过程的精神核心。
博弈形式一般分为合作博弈和非合作博弈两种,而在这两种博弈形式下,又分别有多种复杂的形式。
三、博弈论的应用1.经济学领域博弈论在经济学领域的应用最为广泛。
经济学研究的主题之一是市场竞争,而博弈论可以帮助我们透彻理解市场竞争的规律。
例如,博弈论可以用来研究企业之间的价格战、垄断行为、拍卖等问题。
2.政治学领域博弈论在政治学领域的应用也非常重要。
政治学研究的主题之一是国家之间的竞争和协作,而博弈论可以帮助我们研究国际关系、外交政策等问题。
例如,博弈论可以用来研究国际贸易谈判、军备竞赛等问题。
3.人际交往领域博弈论在人际交往领域的应用也相当重要。
通过博弈论,我们可以学习如何有效地沟通和合作,避免双方的冲突和误解。
例如,博弈论可以用来研究双方的协调、合作等问题。
博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的学科。
博弈的分类根据不同的基准也有所不同。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
博弈论研究的主题是:理性人的互动行为。
博弈论作为一种解释力非常强的理论有三个基本假定:1 、理性人假定;2 、利益相关性假定; 3 、每个人是理性的是所有参与者的公共知识。
博弈论是一门数学,这是博弈论的学科特点。
主要有三种博弈:零和博弈;变和博弈;常和博弈。
对于任何一个博弈来说,都有一个均衡点,也就是那什均衡,那什均衡是博弈的解。
博弈论中的典型例子:囚徒困境。
囚徒困境在博弈论中有一个经典案例--囚徒困境,非常耐人寻味。
“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了。
但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
什么是博弈论?它对我们的生活起到了什么作用?
一、什么是博弈论?
博弈论是研究决策者在不确定信息下作出决策的一种数学理论。
基本
模型是博弈,意思是一个包含一组演员、一组策略和一些收益的场景,演员根据选定的策略得到一定的收益。
博弈论的研究对象是决策者行
为和决策制度的理性分析,以及对他们行为的合理比较。
二、博弈论在社会生活中的应用
1.经济领域
博弈论在经济学中有着广泛的应用,它主要研究市场竞争、战略合作、激励机制等问题。
在竞争的市场中,企业之间需要采取合适的策略来
保持竞争优势,而博弈论可以帮助企业进行理性的决策。
例如在定价
问题上,企业可以采用策略博弈理论来制定最优策略,达到利润最大化。
2.政治领域
在政治中,博弈论主要研究的是多个政治力量之间的互动,以及政治
决策的成本和效果。
例如,在某些政治制度下,不同的政治力量会进
行策略博弈,来实现自己的目的。
3.社会学领域
博弈论在社会学领域主要研究集体行为,例如合作行为、冲突行为等。
例如,在家庭中,夫妻之间可能会面临各种策略博弈,例如互相表达
感情、处理矛盾问题等。
4.生物学领域
博弈论在生物学中也有着广泛的应用,例如在两个激素反馈环路中,
光线激活素可以促使二者同时发生变化。
这样的相互作用在生物学上
是基于博弈论的思想。
三、结语
博弈论已经广泛应用到各个领域。
它不仅有助于我们理解现实世界中
所发生的复杂现象,而且可以帮助我们制定最优策略,实现我们的目标。
它对我们的社会生活起到了重要的作用。
经典博弈论概述1 什么是博弈论博弈论是一种独特的处于各学科之间的研究人类行为的方法。
与博弈论有关的学科包括数学,经济学和其他社会科学和行为科学。
博弈论是由约翰•冯•诺依曼创立的,该领域第一本重要著作是诺依曼和另一个伟大的数理经济学家奥斯卡•摩根斯坦所著的。
博弈论是关于包含相互依存情况中理性行为的研究。
所谓相互依存,通常是指博弈中的任何一个参与者受到其他参与者行为的影响,反过来,他的行为也影响到其他参与者。
由于这种相互依存性,游戏或博弈的结果依赖于每一个参与者的决策,没有一个人能完全地控制所要发生的事情,也没有一个参与者处于孤独的状态。
相互依存常使博弈中的参与者之间产生竞争。
譬如两个人分蛋糕、每个参与者都希望自己的那块可以分得大一些。
然而,竞争仅仅是博弈论中相互依存的一个方面。
应该指出,通常地博弈并非纯粹是参与者之间的竞争,相互依存的另一个方面是参与者可以有某些共同的兴趣或利益所在。
仍以分蛋糕为例,作为参与者策略行动的结果,蛋糕的大小可以增加或者减少。
参与者的共同兴趣在于增加蛋糕的总量,他们互相“倾轧”之处在于如何分配。
从博弈论研究的角度,增大蛋糕应是博弈的第一步,而分配蛋糕则是博弈的第二步。
在博弈论中还需要对一个词“理性行为” 作一些说明。
博弈论中的所谓理性,一般不是指道德标准。
从参加博弈的参与者的眼光来看,他们试图去实施自己认为可能最好的行为,尽管这样的行为有可能损害了其他参与者。
由于参与者的相互依存性,博弈中一个理性的决策必定建立在预测其他参与者的反应之上。
一个参与者将自己置身于其他参与者的位置并为他着想从而预测其他参与者将选择的行动,在这个基础上该参与者决定自己最理想的行动,这就是博弈论方法的本质与精髓。
博弈论中每一个参与者做出理性决策的重要依据之一是他的可能收益有多少,这就是一个参与者需要认真计算的收益函数(payoff function) 。
对于每一个参与者、如果他们在可供自己选择的策略空间中任取一个策略作为自己的行动,既不会给自己带来盈利,又不会使他们必须付出,这种失去了激励机制的游戏本身也就失去了“博” 的意义,在社会经济领域中尤其不太可能出现这类现象。
博弈论的基本概念1.博弈论:博弈论,又称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论的定义可以这样理解:博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自可选择的行为或策略中进行选择并加以实施,并从中取得相应收益的过程。
2.参与人:参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。
3、行动:行动是参与人在博弈的某个时点的决策变量。
一般来讲,把第i个参与人的一个行动为ai,其可供i选择的行动集合表示为Action set: Ai ={ai}。
在一个n人博弈中,n个参与人的行动的有序集为a={a1,…,an},称为行动组合。
根据行动顺序,可以把博弈分为静态博弈、动态博弈。
静态博弈:一般来讲,如果行动时同时发生的或相当于同时发生的,则称之为静态博弈。
动态博弈:如果行动的发生有先后顺序,则称之为动态博弈。
4.信息:信息指的是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。
信息集是指参与人在特定时刻所拥有的有关变量的值的知识。
例如:囚徒困境甲不知乙的选择,则甲的信息集为{坦白或者抵赖}乙已经行动,甲观察到乙的选择,则甲的信息集为{坦白}或者是{抵赖}。
5.战略:战略是参与人在给定信息集的情况下的行动规则,是参与人完整的一套行动计划,它规定参与人在什么时候选择什么行动。
战略不同于行动,它是行动的规则,对于战略的表述应该是完备的。
例如:人不犯我,我不犯人;人若犯我,我必犯人”例如:田忌赛马,田忌所选的赛马计划就是一套完整的行动计划,也就是一个战略。
6.战略空间:参与者可以选择的战略的全体组成了战略空间。
田忌赛马,六种行动方案可供选择:上中下,上下中,中上下,中下上,下上中,下中上。
这些可选择的战略的全体组成了战略空间。
任何一人战略的改变都将使结果也随之改变。
7、收益:支付、报酬,指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。
一、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。
4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。
7、均衡:所有参与人的最优战略组合。
8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。
9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。
10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。
11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。
12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。
13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。
1.什么是博弈论?“博弈论”译自英文“Game Theory”,直译就是“游戏理论”。
博弈论是研究行为人在矛盾和对抗性关系中的行为决策中一般性规律规律的学科。
是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。
博弈:一些个人、组织,面对一定的环境条件,在一定的规律下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
包括:博弈的参加者,各博弈方的全部策略或行为集合,进行博弈的次序,博弈方的得益四方面。
纳什均衡:设存在一个策略组合Bx’和By’,且Bx’∈Bx(Bx1,Bx2,……,BxN),By’∈By(By1,By2,……,ByN) ,当x选择Bx’时,y的最优策略选择是By’,同时,当y选择By’时,x的最优选择是Bx’,因此,x和y选择了Bx’和By’时,谁都不会再改变策略。
这种局面称为Nash均衡,是Nash最早提出并证明了它的存在。
1951年Nash提出了Nash均衡的概念,并证明了Nash均衡的存在——真正奠定了博弈论作为一门学科的基础。
之前,虽然有很多人致力于研究博弈对策的规律,但总没有得出有意义的成果,直到Nash。
n人博弈纳什均衡定⏹设:G={A1,A2,A3,…….,AN;U1,U2, U3,…………,UN}⏹如果存在一个策略组合{a1*, a2*,……,aN*},其中a1*∈A1,a2*∈A2,…….,aN*∈AN,使Ui*=Ui{a1*, a2*,…,aN*} ≥Ui{a1*,…,ai-1*,aij*,ai+1*…,aN*}⏹对任意i ∈N都成立,则{a1*, a2*,……,aN*}为Nash均衡。
囚徒困境坦白B不坦白A 坦白A 不坦白两个被捕的囚徒之间的一种特殊博弈,双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。
2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。
博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。
简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。
1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。
20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。
在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。
1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。
博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。
它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。
正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。
正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。
”张维迎:《博弈论与信息经济学》,上海人民出版社2004 年版,第3 页。
②2001 年诺贝尔经济学奖授予了在不对称信息市场理论方面做出杰出贡献的三位博弈论专家,他们是美国加利福尼亚大学伯克利分校的阿克诺夫(GorgeAkerlof)教授、斯坦福大学的斯宾塞(A. M. Spence)教授和哥伦比亚大学的斯蒂格利茨(J. Stiglitz)教授。
在博弈论分析中,一定场合下的每个博弈者在决定采取何种行动时都策略地、有目的地行事,他既要考虑其他博弈者对自己决策行为的影响,又要考虑自己的决策对其他博弈者决策的可能影响,并在寻求自身效益最大化的前提下,来确定自己的决策。
一个博弈所包括的要素有:参与人、信息、策略、行动的次序、收益、结果。
1、参与人:参与人是博弈的决策主体,他们的目的是通过选择行动(或策略)以最大化自己的支付(效用)水平。
参与人可以是自然人,也可以是各种社会组织,如企业、政府、社团等。
2、信息:信息是参与人有关博弈的知识,特别是有关“自然①”的选择、其他参与人的特征和行动的知识。
信息对于博弈参与者的意义和作用至关重要,掌握信息的多少将直接影响到决策的准确性,从而关系到整个博弈的成败。
3、策略:策略是指在博弈的每一环上,参与者的行事规则,即按什么规则选择行动。
在不同的博弈中可供博弈方选择的策略或行动很不相同。
即使在同一博弈中,不同博弈方的可选策略或行为也常常不同,有时只有有限的几种,甚至只有一种,而有时又可能有许多种,甚至无限多种。
4、行动的次序:在现实的各种决策中,当多个独立博弈方进行决策时,有时候这些博弈方必须同时做出选择(这样能保证公平合理),但有时候各博弈方的决策又必须有先后之分。
并且,在一些博弈中每个博弈方还要不止一次地做出选择,这就免不了有一个次序问题。
因此,规定一个博弈就必须规定其中的次序,不同的次序必然是不同的博弈,即使其他方面都相同。
5、收益:在博弈论中,收益或者是指在一个特定的战略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用水平。
收益可以是正值,也可以是负值。
虽然各博弈方在各种情况下的收益是客观存在的,但这并不意味着各博弈方都充分了解各方的收益情况。
在许多博弈中,总存在某些博弈方对其他博弈方的收益无法肯定的情况。
6、结果:结果是指博弈中参与者的行动所产生的每一种可能性,包括策略的组合、行动组合以及支付组合等。
①这里所说的“自然”是指代表随机选择作用的博弈方。
2.2.2 纳什均衡纳什在他1950 年的经典论文中,首先提出了他自己称为“均衡点(Equilibrium Point)”的纳什均衡概念,并且同时证明了在相当广泛的博弈类型中,混合策略意义上的纳什均衡是普遍存在的。
纳什均衡可以描述为:如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。
纳什均衡揭示了博弈均衡与经济均衡的内在联系,它奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开。
纳什均衡的普遍存在性,意味着纳什均衡在分析大多数博弈问题中,都是一种基本的分析方法。
因此,在本文的分析中也把纳什均衡作为基本的分析工具之一。
一博弈理论概述经典博弈论概述博弈论又被称为对策论,它是研究决策者在决策主体各方相互作用情况下如何进行决策及有关这种决策的均衡问题的理论。
与其他理论不同,博弈论强调决策主体各方策略的相互依存性,即任何一个决策主体必须在考虑其他局中人可能的策略选择基础上来确定自己的最优行动策略。
其精髓在于博弈中的一个理性决策者必须考虑局中其他人反应的基础之上来选择自己最理想的行动方案。
所谓均衡即所有局中参与人的最优策略组合,各方博弈产生的结果是一个均衡结局,它可能不是局中各方及整体的利益最大化,但它是在已给定信息与知识条件下的一种必然结果,因为任何一方改变策略而导致均衡的变化都有可能使自己得到一个更差的结果。
博弈论研究人们的行为在直接相互作用时的决策以及决策的均衡问题。
经典博弈论预设人是完全理性的,即人人都会在给定的约束条件下最大化自身的利益,人们的行为互相影响且通常信息不对称。
博弈的结局往往是一种博弈策略组合所产生的均衡结果,我们称之为纳什均衡。
,即给定对手的策略,每个参与人选择自己的最优策略。
本文根据理性假设依据的不同,把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈论,它是依据完全理性的经济人出发来研究均衡问题的将经典博弈论与生态演化论相结合的博弈理论称之为演化博弈论,它是依据有限理性的社会人出发来研究均衡问题的。
演化博弈论概述演化博弈论概念。
演化博弈论又称进化博弈论,是经典博弈论与生态演化论相结合的研究成果,它从有限理性的社会人出发来分析参与人的资源配置行为,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。
演化博弈理论基本均衡概念一进化稳定策略。
进化稳定策略,,是由梅纳德·史密斯和普赖斯在年引入,并由史密斯在著作《演化与博弈论》中得到了进一步的发展。
其直观思想是如果一个群体原群体的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体更高的期望支付,随着时间的演化,突变者群体最终会从原群体中消失,原群体所选择的策略就是进化稳定策略。
如果用于分析人类的群体行为,那么进化的结果将是那些选择突变策略的群体最终会改变策略而选择进化稳定策略。
演化博弈论基本动态概念一模仿者动态。
进化博弈论用系统论的观点看待群体行为的调整过程,主要研究群体行为演化系统的变化,如何描述动态系统的状态变化是进化博弈论的关键,对此经济学家从不同的方面对演化系统的过程进行了描述,提出了不同的动态模型。
到目前为止,在进化博弈论中应用得最多的还是由在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态即。
所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。
经典博弈论与演化博弈论的区别理性假定不同。
经典博弈论从完全理性出发,把经济中参与人之间的行为关系看作为一种原子式的互动或者机械式的反应。
该理论认为在任何情况下,参与人都能对环境的任何变化做出最优反应,然而在多数情况下这个理性假定是难以满足的。
演化博弈论从有限理性出发,认为经济中参与人只能知道世界状态的一部分而不可能知道世界的所有状态,参与人也不可能知道各种状态出现的客观概率及不同状态对自己支付的意义,在多数情况下参与人并不能对环境的任何变化做出最优反应,其决策是基于某种常规而非理性的计算结果,这种常规一般来自于博弈的历史,因为历史已经包含了对手如何行动的相关信息,同时通过对历史的观察有助于参与人知道什么是成功策略什么是不成功策略。
研究对象及方法不同。
经典博弈论以参与者个人为研究对象,它虽然认为个人之间的行为是相互影响的,但却在假定其他参与人行为选择一定的情况下来考察个人最优化行为。
即假定每个参与人都能从对手的选择中正确地推断出博弈的支付结构进而预测到均衡结果,所以不需要考察达到均衡的动态过程。
演化博弈论以参与人群体为研究对象,假定各群体、个体之间的行为相互影响且不同群体的个体之间进行重复博弈,个体在给定信息下并不一定选择最优化行为,而是通过学习、模仿等动态调整过程做出决策,其均衡的结果依赖于博弈的历史及博弈所处的社会环境等。
达到均衡的过程影响均衡的结果,因而演化博弈论主要利用动态方法研究群体达到均衡的行为调整过程,这种方法可以把从个体行为到集体行为的形成机制、组织和制度等因素都纳入到模型中,因此能够更真实地反应经济主体行为的多样性和复杂性。
动态概念不同。
经典博弈论虽然也研究动态博弈,但与演化博弈论所研究的动态不同。
经典博弈论的动态博弈假定各参与人都有特定的对手,以参与人行为的时间顺序及信息的传递为依据。
在动态博弈中后行动者通过观察选择先行动者的选择而做出最优反应决策,先行动者也会预期到自己的行动会传递自己的信息,因而先行动者在给定预期后行动者的行为反应下选择自己的最优策略,后行动者在给定先行动者行为所传递的信息下做出自己的最优选择。
显然这种动态博弈并不涉及达到均衡的调整过程也不涉及外在因素对均衡的影响。
演化博弈论假定参与人并没有特定的博弈对手,它所强调的动态是相对于群体行为达到均衡的调整过程。