博弈论
- 格式:doc
- 大小:44.00 KB
- 文档页数:5
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
什么是博弈论?博弈论是一门研究策略决策的学科,它涉及到两个或多个参与者的博弈过程。
博弈论的研究对象可以是经济、政治、社会等领域,也可以是日常生活中的人际交往。
下面,我们来详细了解一下这门学科。
一、博弈论的起源博弈论起源于20世纪40年代,当时美国数学家冯·诺依曼(John von Neumann)和经济学家奥斯卡·莫根斯特恩(Oskar Morgenstern)合著了《博弈论与经济行为》一书。
这是一本奠定博弈论基础的重要著作,它将博弈论应用于经济学领域,从而成为博弈论的奠基之作。
二、博弈论的基本概念1.参与者博弈论的参与者指的是博弈过程中参与决策的个体或组织,例如一个独立的个人、两个公司或国家之间的竞争。
2.策略策略是指参与者在博弈中所采用的行为方式或决策方法。
不同的策略可能导致不同的博弈结果,因此博弈过程中策略的选择非常重要。
3.收益收益是博弈过程中参与者所能获取的利益,包括经济利益、社会地位、权力等。
收益对参与者而言是决策的目的和结果,因此其大小和分布会影响博弈的结果。
4.博弈形式博弈形式指的是博弈参与者、策略和收益之间的关系,是博弈过程的精神核心。
博弈形式一般分为合作博弈和非合作博弈两种,而在这两种博弈形式下,又分别有多种复杂的形式。
三、博弈论的应用1.经济学领域博弈论在经济学领域的应用最为广泛。
经济学研究的主题之一是市场竞争,而博弈论可以帮助我们透彻理解市场竞争的规律。
例如,博弈论可以用来研究企业之间的价格战、垄断行为、拍卖等问题。
2.政治学领域博弈论在政治学领域的应用也非常重要。
政治学研究的主题之一是国家之间的竞争和协作,而博弈论可以帮助我们研究国际关系、外交政策等问题。
例如,博弈论可以用来研究国际贸易谈判、军备竞赛等问题。
3.人际交往领域博弈论在人际交往领域的应用也相当重要。
通过博弈论,我们可以学习如何有效地沟通和合作,避免双方的冲突和误解。
例如,博弈论可以用来研究双方的协调、合作等问题。
博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的学科。
博弈的分类根据不同的基准也有所不同。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
博弈论研究的主题是:理性人的互动行为。
博弈论作为一种解释力非常强的理论有三个基本假定:1 、理性人假定;2 、利益相关性假定; 3 、每个人是理性的是所有参与者的公共知识。
博弈论是一门数学,这是博弈论的学科特点。
主要有三种博弈:零和博弈;变和博弈;常和博弈。
对于任何一个博弈来说,都有一个均衡点,也就是那什均衡,那什均衡是博弈的解。
博弈论中的典型例子:囚徒困境。
囚徒困境在博弈论中有一个经典案例--囚徒困境,非常耐人寻味。
“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了。
但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。
博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。
简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。
1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。
20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。
在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。
1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。
博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。
它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。
正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。
正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。
”张维迎:《博弈论与信息经济学》,上海人民出版社2004 年版,第3 页。
②2001 年诺贝尔经济学奖授予了在不对称信息市场理论方面做出杰出贡献的三位博弈论专家,他们是美国加利福尼亚大学伯克利分校的阿克诺夫(GorgeAkerlof)教授、斯坦福大学的斯宾塞(A. M. Spence)教授和哥伦比亚大学的斯蒂格利茨(J. Stiglitz)教授。
在博弈论分析中,一定场合下的每个博弈者在决定采取何种行动时都策略地、有目的地行事,他既要考虑其他博弈者对自己决策行为的影响,又要考虑自己的决策对其他博弈者决策的可能影响,并在寻求自身效益最大化的前提下,来确定自己的决策。
一个博弈所包括的要素有:参与人、信息、策略、行动的次序、收益、结果。
1、参与人:参与人是博弈的决策主体,他们的目的是通过选择行动(或策略)以最大化自己的支付(效用)水平。
参与人可以是自然人,也可以是各种社会组织,如企业、政府、社团等。
2、信息:信息是参与人有关博弈的知识,特别是有关“自然①”的选择、其他参与人的特征和行动的知识。
信息对于博弈参与者的意义和作用至关重要,掌握信息的多少将直接影响到决策的准确性,从而关系到整个博弈的成败。
3、策略:策略是指在博弈的每一环上,参与者的行事规则,即按什么规则选择行动。
在不同的博弈中可供博弈方选择的策略或行动很不相同。
即使在同一博弈中,不同博弈方的可选策略或行为也常常不同,有时只有有限的几种,甚至只有一种,而有时又可能有许多种,甚至无限多种。
4、行动的次序:在现实的各种决策中,当多个独立博弈方进行决策时,有时候这些博弈方必须同时做出选择(这样能保证公平合理),但有时候各博弈方的决策又必须有先后之分。
并且,在一些博弈中每个博弈方还要不止一次地做出选择,这就免不了有一个次序问题。
因此,规定一个博弈就必须规定其中的次序,不同的次序必然是不同的博弈,即使其他方面都相同。
5、收益:在博弈论中,收益或者是指在一个特定的战略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用水平。
收益可以是正值,也可以是负值。
虽然各博弈方在各种情况下的收益是客观存在的,但这并不意味着各博弈方都充分了解各方的收益情况。
在许多博弈中,总存在某些博弈方对其他博弈方的收益无法肯定的情况。
6、结果:结果是指博弈中参与者的行动所产生的每一种可能性,包括策略的组合、行动组合以及支付组合等。
①这里所说的“自然”是指代表随机选择作用的博弈方。
2.2.2 纳什均衡纳什在他1950 年的经典论文中,首先提出了他自己称为“均衡点(Equilibrium Point)”的纳什均衡概念,并且同时证明了在相当广泛的博弈类型中,混合策略意义上的纳什均衡是普遍存在的。
纳什均衡可以描述为:如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。
纳什均衡揭示了博弈均衡与经济均衡的内在联系,它奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开。
纳什均衡的普遍存在性,意味着纳什均衡在分析大多数博弈问题中,都是一种基本的分析方法。
因此,在本文的分析中也把纳什均衡作为基本的分析工具之一。
一博弈理论概述经典博弈论概述博弈论又被称为对策论,它是研究决策者在决策主体各方相互作用情况下如何进行决策及有关这种决策的均衡问题的理论。
与其他理论不同,博弈论强调决策主体各方策略的相互依存性,即任何一个决策主体必须在考虑其他局中人可能的策略选择基础上来确定自己的最优行动策略。
其精髓在于博弈中的一个理性决策者必须考虑局中其他人反应的基础之上来选择自己最理想的行动方案。
所谓均衡即所有局中参与人的最优策略组合,各方博弈产生的结果是一个均衡结局,它可能不是局中各方及整体的利益最大化,但它是在已给定信息与知识条件下的一种必然结果,因为任何一方改变策略而导致均衡的变化都有可能使自己得到一个更差的结果。
博弈论研究人们的行为在直接相互作用时的决策以及决策的均衡问题。
经典博弈论预设人是完全理性的,即人人都会在给定的约束条件下最大化自身的利益,人们的行为互相影响且通常信息不对称。
博弈的结局往往是一种博弈策略组合所产生的均衡结果,我们称之为纳什均衡。
,即给定对手的策略,每个参与人选择自己的最优策略。
本文根据理性假设依据的不同,把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈论,它是依据完全理性的经济人出发来研究均衡问题的将经典博弈论与生态演化论相结合的博弈理论称之为演化博弈论,它是依据有限理性的社会人出发来研究均衡问题的。
演化博弈论概述演化博弈论概念。
演化博弈论又称进化博弈论,是经典博弈论与生态演化论相结合的研究成果,它从有限理性的社会人出发来分析参与人的资源配置行为,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。
演化博弈理论基本均衡概念一进化稳定策略。
进化稳定策略,,是由梅纳德·史密斯和普赖斯在年引入,并由史密斯在著作《演化与博弈论》中得到了进一步的发展。
其直观思想是如果一个群体原群体的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体更高的期望支付,随着时间的演化,突变者群体最终会从原群体中消失,原群体所选择的策略就是进化稳定策略。
如果用于分析人类的群体行为,那么进化的结果将是那些选择突变策略的群体最终会改变策略而选择进化稳定策略。
演化博弈论基本动态概念一模仿者动态。
进化博弈论用系统论的观点看待群体行为的调整过程,主要研究群体行为演化系统的变化,如何描述动态系统的状态变化是进化博弈论的关键,对此经济学家从不同的方面对演化系统的过程进行了描述,提出了不同的动态模型。
到目前为止,在进化博弈论中应用得最多的还是由在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态即。
所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。
经典博弈论与演化博弈论的区别理性假定不同。
经典博弈论从完全理性出发,把经济中参与人之间的行为关系看作为一种原子式的互动或者机械式的反应。
该理论认为在任何情况下,参与人都能对环境的任何变化做出最优反应,然而在多数情况下这个理性假定是难以满足的。
演化博弈论从有限理性出发,认为经济中参与人只能知道世界状态的一部分而不可能知道世界的所有状态,参与人也不可能知道各种状态出现的客观概率及不同状态对自己支付的意义,在多数情况下参与人并不能对环境的任何变化做出最优反应,其决策是基于某种常规而非理性的计算结果,这种常规一般来自于博弈的历史,因为历史已经包含了对手如何行动的相关信息,同时通过对历史的观察有助于参与人知道什么是成功策略什么是不成功策略。
研究对象及方法不同。
经典博弈论以参与者个人为研究对象,它虽然认为个人之间的行为是相互影响的,但却在假定其他参与人行为选择一定的情况下来考察个人最优化行为。
即假定每个参与人都能从对手的选择中正确地推断出博弈的支付结构进而预测到均衡结果,所以不需要考察达到均衡的动态过程。
演化博弈论以参与人群体为研究对象,假定各群体、个体之间的行为相互影响且不同群体的个体之间进行重复博弈,个体在给定信息下并不一定选择最优化行为,而是通过学习、模仿等动态调整过程做出决策,其均衡的结果依赖于博弈的历史及博弈所处的社会环境等。
达到均衡的过程影响均衡的结果,因而演化博弈论主要利用动态方法研究群体达到均衡的行为调整过程,这种方法可以把从个体行为到集体行为的形成机制、组织和制度等因素都纳入到模型中,因此能够更真实地反应经济主体行为的多样性和复杂性。
动态概念不同。
经典博弈论虽然也研究动态博弈,但与演化博弈论所研究的动态不同。
经典博弈论的动态博弈假定各参与人都有特定的对手,以参与人行为的时间顺序及信息的传递为依据。
在动态博弈中后行动者通过观察选择先行动者的选择而做出最优反应决策,先行动者也会预期到自己的行动会传递自己的信息,因而先行动者在给定预期后行动者的行为反应下选择自己的最优策略,后行动者在给定先行动者行为所传递的信息下做出自己的最优选择。
显然这种动态博弈并不涉及达到均衡的调整过程也不涉及外在因素对均衡的影响。
演化博弈论假定参与人并没有特定的博弈对手,它所强调的动态是相对于群体行为达到均衡的调整过程。