博弈论
- 格式:pdf
- 大小:100.02 KB
- 文档页数:11
博弈论是什么博弈论是一门研究决策和策略的数学理论,它研究决策者在互动中作出最佳选择的数学模型。
博弈论的研究对象是决策者之间的相互作用,无论是个体、组织还是国家之间的相互作用。
在博弈论中,个体决策者通常被称为“球员”(players),决策者们的决策被称为“策略”(strategies)。
博弈论分析的目标是找到在各种不同策略组合中,球员可以通过分析其他球员的行动,作出最佳决策的方法。
博弈论通过建模和分析不同策略的结果,以及不同决策者之间的冲突和合作,来解决决策问题。
博弈论的起源可以追溯至20世纪的数学家、经济学家和游戏理论家。
它被广泛应用于经济学、政治学、社会科学和计算机科学等领域,以解决各种决策和策略问题。
博弈论有两个重要的分支,一是非合作博弈论,二是合作博弈论。
非合作博弈论研究的是在决策者之间缺乏合作的情况下的决策问题。
非合作博弈论分析的是每个决策者如何在互动中作出最佳决策,而不考虑其他决策者的影响。
其中最著名的非合作博弈论模型是“囚徒困境”。
囚徒困境是一种经典的非合作博弈论问题,描述了两个同时被捕的囚犯面临的决策问题。
如果两个囚犯都保持沉默,则他们将因不够证据而被判轻刑;如果一个人选择坦白,而另一个保持沉默,则坦白的囚犯将获得从刑期的豁免,而另一个将被判重刑;如果两个人都选择坦白,则他们将受到较重的刑期。
在这个例子中,每个囚犯的最佳策略是选择坦白,然而,当两个囚犯都选择坦白时,他们都会陷入囚徒困境,因为他们的总体利益会受到损害。
合作博弈论研究的是在决策者之间存在合作的情况下的决策问题。
合作博弈论分析的是决策者通过协商和合作来达成一致,并在互动中作出最佳决策。
其中最著名的合作博弈论模型是“合作对策”(cooperative games)。
合作对策是一种多人博弈论问题,在这种情况下,参与者通过协调策略,共同提高整体收益。
合作对策的目标是通过合作和协商,找到一种合理的分配方式,使得每个参与者都能获得相对公平和最大化的收益。
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
博弈论名词解释博弈论是一种研究冲突和合作决策的数学理论。
在博弈论中,玩家通过制定决策来实现自己的利益,同时也要考虑其他玩家的决策对自己利益的影响。
博弈论的研究对象是在有限的资源和信息条件下,决策制定者之间的相互作用。
以下是一些常见的博弈论名词解释:1. 纳什均衡(Nash equilibrium):是指在博弈过程中,每个玩家依据其他玩家的行为选择自己的最佳策略,而没有动机单方面改变策略。
纳什均衡是一种稳定状态,即每个玩家的策略都是最优的。
2. 零和博弈(zero-sum game):是指一个玩家的收益与另一个玩家的损失完全相等,总收益为零。
在零和博弈中,一个玩家的利益的增加必然导致另一个玩家的利益的减少,双方利益存在完全的对立关系。
3. 非零和博弈(non-zero-sum game):是指一个玩家的利益的增加不一定导致另一个玩家的利益减少。
在非零和博弈中,玩家之间的利益可以相互协调、互利互惠。
4. 博弈树(game tree):是博弈论中常用的一种图形表示方式,用于展示博弈过程中的决策步骤和可能的结果。
博弈树由顶点和边组成,顶点表示玩家的决策点,边表示不同的行动选择。
5. 最优策略(optimal strategy):在博弈论中,最优策略是指玩家的最佳选择,使得在对手的任何策略下,自身获得最大利益。
最优策略可能根据玩家的目标和信息不同而变化。
6. 合作与背叛(cooperation and defection):博弈论中常涉及到的两个关键概念。
合作指玩家之间通过协调行动来获得共同利益,背叛指玩家为了自身利益而选择对方不合作。
7. 博弈矩阵(game matrix):是一种表示博弈参与者和策略选择关系的表格。
博弈矩阵以参与者为行,以策略选择为列,用数字表示参与者在不同策略下的收益情况。
8. 支配策略(dominant strategy):在博弈论中,一种策略如果在所有可能的对手策略下都能带来最佳结果,则被称为支配策略。
2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。
博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。
简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。
1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。
20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。
在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。
1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。
博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。
它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。
正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。
正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。
博弈论百度百科博弈论是一门研究决策制定和决策结果的学科,它是应用数学的一个分支,通过运用数学和逻辑工具,探讨参与者在互动决策中的最佳策略选择。
在博弈论中,参与者被称为玩家,他们根据自身利益和目标来做出决策。
博弈论适用于各种不同领域的情境,包括经济学、政治学、生物学等。
一、概述博弈论的研究对象是策略性互动。
在一个博弈中,每个玩家都会依据一定的策略选择进行行动,而这个选择可能会受到其他玩家的影响。
博弈论试图理解和分析在这种互动中,参与者如何做出决策,并找到最优的解决方案。
博弈论的核心概念是博弈,一个博弈可以用一个四元组表示:(N, A, U, F),其中:- N表示参与博弈的玩家集合;- A表示每个玩家可选的行动集合;- U表示每个玩家的效用函数,用于衡量不同结果对该玩家的好坏程度;- F表示每个玩家的信息集合。
信息集合是指每个玩家在博弈过程中所了解的信息。
二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一,指的是在一个博弈中,所有玩家选择的策略组合,使得任何玩家都没有动机单方面改变自己的策略。
纳什均衡是一个稳定状态,玩家之间不再有改变策略的动机。
2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。
零和博弈是指参与博弈的玩家的收益之和为零,即一方获利必然导致另一方的损失。
非零和博弈是指参与博弈的玩家的收益之和不为零,即可以存在多方共同受益的情况。
3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动,关注的是个体决策的结果。
宏观博弈是指研究整体群体之间的策略性互动,关注的是全局结果。
三、应用领域博弈论的研究在众多领域中都具有广泛的应用。
以下是博弈论在一些领域的应用举例:1. 经济学博弈论在经济学领域中有着广泛的应用。
它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。
例如,博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。
2. 政治学博弈论在政治学领域中也有着重要的应用。
什么是博弈论?博弈论是一门研究策略决策的学科,它涉及到两个或多个参与者的博弈过程。
博弈论的研究对象可以是经济、政治、社会等领域,也可以是日常生活中的人际交往。
下面,我们来详细了解一下这门学科。
一、博弈论的起源博弈论起源于20世纪40年代,当时美国数学家冯·诺依曼(John von Neumann)和经济学家奥斯卡·莫根斯特恩(Oskar Morgenstern)合著了《博弈论与经济行为》一书。
这是一本奠定博弈论基础的重要著作,它将博弈论应用于经济学领域,从而成为博弈论的奠基之作。
二、博弈论的基本概念1.参与者博弈论的参与者指的是博弈过程中参与决策的个体或组织,例如一个独立的个人、两个公司或国家之间的竞争。
2.策略策略是指参与者在博弈中所采用的行为方式或决策方法。
不同的策略可能导致不同的博弈结果,因此博弈过程中策略的选择非常重要。
3.收益收益是博弈过程中参与者所能获取的利益,包括经济利益、社会地位、权力等。
收益对参与者而言是决策的目的和结果,因此其大小和分布会影响博弈的结果。
4.博弈形式博弈形式指的是博弈参与者、策略和收益之间的关系,是博弈过程的精神核心。
博弈形式一般分为合作博弈和非合作博弈两种,而在这两种博弈形式下,又分别有多种复杂的形式。
三、博弈论的应用1.经济学领域博弈论在经济学领域的应用最为广泛。
经济学研究的主题之一是市场竞争,而博弈论可以帮助我们透彻理解市场竞争的规律。
例如,博弈论可以用来研究企业之间的价格战、垄断行为、拍卖等问题。
2.政治学领域博弈论在政治学领域的应用也非常重要。
政治学研究的主题之一是国家之间的竞争和协作,而博弈论可以帮助我们研究国际关系、外交政策等问题。
例如,博弈论可以用来研究国际贸易谈判、军备竞赛等问题。
3.人际交往领域博弈论在人际交往领域的应用也相当重要。
通过博弈论,我们可以学习如何有效地沟通和合作,避免双方的冲突和误解。
例如,博弈论可以用来研究双方的协调、合作等问题。
博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的学科。
博弈的分类根据不同的基准也有所不同。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
博弈论总结第1篇最大化自己最坏情况下的收益。
着眼于自己的收益,保证自己收益,防止风险使得自己的收益变小。
以性别之战为例子:首先你得先得到一个关于妻子和丈夫的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育 xxx子期望收益(着眼于自己的期望收益): Uw(q,p)=2PQ + 0×P(1-Q) + 0×Q(1-P) +1×(1-P)(1-Q) = 3PQ - P -Q +1 前面的系数参考收益表(妻子收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,妻子的收益可能为0;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看体育,收益同样最小)这里只是在讨论妻子收益最小的可能性4.妻子的最坏收益为:minUw(p,q) = min(1-P,2P)5.最大化最坏收益: max(min(1-P,2P))解的:P=1/3则妻子的maxmin策略为:1/3概率选择韩剧,2/3概率选择体育。
同理得丈夫的maxmin策略为:1/3概率选择体育,2/3概率选择韩剧。
minmax策略 1.最小化对手最好情况下的收益。
是着眼于对手的收益。
还是这样的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育2.丈夫期望收益(着眼于对方的期望收益):(与maxmin不同要注意!!)Uw(q,p)=PQ + 0×P(1-Q) + 0×Q(1-P) +2×(1-P)(1-Q) = 3PQ - 2P -2Q +2前面的系数参考收益表(丈夫收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,如果这时妻子也想看体育,丈夫收益到2;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看韩剧,收益同最大1)这里只是在讨论妻子收益最小的可能性xxx夫的最大收益为:maxUw(p,q) = max(2-2P,P) 5.最小化最好收益: min(max(1-P,2P))妻子的minmax策略:2/3概率选择韩剧,1/3概率选择体育同里丈夫为的minmax为…在零和博弈中,maxmin策略和minmax策略是等价的。
完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。
该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。
博弈中涉及到的变量包括:参与人、行动、战略和信息。
完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。
不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。
博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。
博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。
与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。
扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。
战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。
博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。
根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。
根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。
根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。
不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。
Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。
相对应。
占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。
博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
在博弈论中,通常包括以下基本概念:
局中人:在一场竞赛或博弈中,具有决策权的参与者被称为“局中人”。
在一个博弈中,每个局中人都要做出选择。
行动:局中人在博弈中的每一个决策或选择被称为“行动”。
信息:局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。
策略:局中人基于可获得的信息,制定的决策方案或规则称为“策略”。
收益:局中人在博弈中的得失或输赢称为“收益”。
均衡:当所有局中人都认为自己的策略选择最优,并且其他局中人也认为该策略选择是最优时,这种状态被称为“均衡”。
结果:在一场博弈结束后,所有局中人的收益总和被称为“结果”。
博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。
其中,局中人、策略和收益是最基本要素。
发展过程方面,博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论的基本概念1.博弈论:博弈论,又称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论的定义可以这样理解:博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自可选择的行为或策略中进行选择并加以实施,并从中取得相应收益的过程。
2.参与人:参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。
3、行动:行动是参与人在博弈的某个时点的决策变量。
一般来讲,把第i个参与人的一个行动为ai,其可供i选择的行动集合表示为Action set: Ai ={ai}。
在一个n人博弈中,n个参与人的行动的有序集为a={a1,…,an},称为行动组合。
根据行动顺序,可以把博弈分为静态博弈、动态博弈。
静态博弈:一般来讲,如果行动时同时发生的或相当于同时发生的,则称之为静态博弈。
动态博弈:如果行动的发生有先后顺序,则称之为动态博弈。
4.信息:信息指的是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。
信息集是指参与人在特定时刻所拥有的有关变量的值的知识。
例如:囚徒困境甲不知乙的选择,则甲的信息集为{坦白或者抵赖}乙已经行动,甲观察到乙的选择,则甲的信息集为{坦白}或者是{抵赖}。
5.战略:战略是参与人在给定信息集的情况下的行动规则,是参与人完整的一套行动计划,它规定参与人在什么时候选择什么行动。
战略不同于行动,它是行动的规则,对于战略的表述应该是完备的。
例如:人不犯我,我不犯人;人若犯我,我必犯人”例如:田忌赛马,田忌所选的赛马计划就是一套完整的行动计划,也就是一个战略。
6.战略空间:参与者可以选择的战略的全体组成了战略空间。
田忌赛马,六种行动方案可供选择:上中下,上下中,中上下,中下上,下上中,下中上。
这些可选择的战略的全体组成了战略空间。
任何一人战略的改变都将使结果也随之改变。
7、收益:支付、报酬,指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。