博弈论百度百科
- 格式:doc
- 大小:100.00 KB
- 文档页数:17
博弈论是什么博弈论是一门研究决策和策略的数学理论,它研究决策者在互动中作出最佳选择的数学模型。
博弈论的研究对象是决策者之间的相互作用,无论是个体、组织还是国家之间的相互作用。
在博弈论中,个体决策者通常被称为“球员”(players),决策者们的决策被称为“策略”(strategies)。
博弈论分析的目标是找到在各种不同策略组合中,球员可以通过分析其他球员的行动,作出最佳决策的方法。
博弈论通过建模和分析不同策略的结果,以及不同决策者之间的冲突和合作,来解决决策问题。
博弈论的起源可以追溯至20世纪的数学家、经济学家和游戏理论家。
它被广泛应用于经济学、政治学、社会科学和计算机科学等领域,以解决各种决策和策略问题。
博弈论有两个重要的分支,一是非合作博弈论,二是合作博弈论。
非合作博弈论研究的是在决策者之间缺乏合作的情况下的决策问题。
非合作博弈论分析的是每个决策者如何在互动中作出最佳决策,而不考虑其他决策者的影响。
其中最著名的非合作博弈论模型是“囚徒困境”。
囚徒困境是一种经典的非合作博弈论问题,描述了两个同时被捕的囚犯面临的决策问题。
如果两个囚犯都保持沉默,则他们将因不够证据而被判轻刑;如果一个人选择坦白,而另一个保持沉默,则坦白的囚犯将获得从刑期的豁免,而另一个将被判重刑;如果两个人都选择坦白,则他们将受到较重的刑期。
在这个例子中,每个囚犯的最佳策略是选择坦白,然而,当两个囚犯都选择坦白时,他们都会陷入囚徒困境,因为他们的总体利益会受到损害。
合作博弈论研究的是在决策者之间存在合作的情况下的决策问题。
合作博弈论分析的是决策者通过协商和合作来达成一致,并在互动中作出最佳决策。
其中最著名的合作博弈论模型是“合作对策”(cooperative games)。
合作对策是一种多人博弈论问题,在这种情况下,参与者通过协调策略,共同提高整体收益。
合作对策的目标是通过合作和协商,找到一种合理的分配方式,使得每个参与者都能获得相对公平和最大化的收益。
博弈论百度百科博弈论是一门研究决策制定和决策结果的学科,它是应用数学的一个分支,通过运用数学和逻辑工具,探讨参与者在互动决策中的最佳策略选择。
在博弈论中,参与者被称为玩家,他们根据自身利益和目标来做出决策。
博弈论适用于各种不同领域的情境,包括经济学、政治学、生物学等。
一、概述博弈论的研究对象是策略性互动。
在一个博弈中,每个玩家都会依据一定的策略选择进行行动,而这个选择可能会受到其他玩家的影响。
博弈论试图理解和分析在这种互动中,参与者如何做出决策,并找到最优的解决方案。
博弈论的核心概念是博弈,一个博弈可以用一个四元组表示:(N, A, U, F),其中:- N表示参与博弈的玩家集合;- A表示每个玩家可选的行动集合;- U表示每个玩家的效用函数,用于衡量不同结果对该玩家的好坏程度;- F表示每个玩家的信息集合。
信息集合是指每个玩家在博弈过程中所了解的信息。
二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一,指的是在一个博弈中,所有玩家选择的策略组合,使得任何玩家都没有动机单方面改变自己的策略。
纳什均衡是一个稳定状态,玩家之间不再有改变策略的动机。
2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。
零和博弈是指参与博弈的玩家的收益之和为零,即一方获利必然导致另一方的损失。
非零和博弈是指参与博弈的玩家的收益之和不为零,即可以存在多方共同受益的情况。
3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动,关注的是个体决策的结果。
宏观博弈是指研究整体群体之间的策略性互动,关注的是全局结果。
三、应用领域博弈论的研究在众多领域中都具有广泛的应用。
以下是博弈论在一些领域的应用举例:1. 经济学博弈论在经济学领域中有着广泛的应用。
它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。
例如,博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。
2. 政治学博弈论在政治学领域中也有着重要的应用。
盘点博弈论&纳什均衡&囚徒困境&零和博弈&智猪博弈1.博弈论是什么博弈论(game theory),又译为对策论,或者赛局理论,经济学的一个分支,1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》,标志着现代系统博弈理论的的初步形成,因此他被称为“博弈论之父”。
博弈论被认为是20世纪经济学最伟大的成果之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
主要研究公式化了的激励结构(游戏或者博弈)间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
具有竞争或对抗性质的行为称为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
比如日常生活中的下棋,打牌等。
博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
2.纳什均衡(Nash equilibrium)3.囚徒困境(Prisoner’s Dilemma)纳什平衡的经典例子就是囚徒困境。
囚徒困境(Prisoner’s Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
1950年,由就职于兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问艾伯特·塔克以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的学科。
博弈的分类根据不同的基准也有所不同。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
博弈论介绍博弈论是一门研究决策者如何在不确定环境中做出决策的数学理论。
它是经济学、政治学、社会学以及其它社会科学中重要的工具之一,也被广泛应用于计算机科学、生物学等领域。
博弈论通过分析不同参与者的策略选择和结果预测,揭示了人类行为背后的数学原理和心理动机。
在博弈论中,参与者被称为玩家,他们的目标是最大化自己的效用。
博弈论的研究对象是博弈,即一种决策过程,其中多个决策者在有限资源环境中选择不同策略,以达到自己的目标。
博弈分为合作博弈和非合作博弈。
在合作博弈中,玩家可以通过合作来实现最优结果;而在非合作博弈中,玩家没有合作的选择,只能依靠自己的策略来最大化效用。
博弈论的基本元素包括玩家、策略和支付。
玩家是参与博弈的个体或组织,他们在决策过程中根据自己的目标和信息选择策略。
策略是指玩家在博弈中可选的行动,可以是单一的动作,也可以是一系列行动的组合。
支付是玩家在博弈结束时得到的结果,通常用于衡量玩家在博弈中的成功程度。
在博弈论中,最常用的分析工具是博弈矩阵。
博弈矩阵是一个二维表格,其中每个单元格表示不同玩家在不同策略组合下的支付。
通过分析博弈矩阵,我们可以推断玩家的最佳策略选择以及最终结果。
博弈论的核心概念之一是纳什均衡。
纳什均衡是指在一个博弈中,每个玩家的策略选择都是最佳的,给定其他玩家的策略选择不变。
换句话说,不存在玩家可以通过改变自己的策略来获得更好的结果。
纳什均衡并不一定是最优策略,只是所有玩家选择的最稳定状态。
除了纳什均衡,博弈论还涉及许多其他的解概念,如部分均衡、极大极小解等。
这些解概念提供了不同的策略选择和结果预测方法,使得博弈论在实际应用中更加有价值。
博弈论的应用范围非常广泛。
在经济学中,博弈论被用于分析市场竞争、价格战略以及拍卖等问题。
在政治学中,博弈论可以帮助我们理解选举、国际关系以及公共政策制定等方面的决策过程。
在社会学中,博弈论可以揭示社会规范、合作问题以及社会团体之间的关系。
在计算机科学中,博弈论被广泛应用于人工智能、机器学习和多智能体系统等领域。
博弈论博弈就是较量?是合作?/hansbj/archive/2006/12/22/1452784.aspx博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代(反复循环)考虑情形进行决策,选择最有利于自己的战略(strategy)。
有合作博弈(共赢)和非合作博弈(我赢)博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
囚徒困境博弈论中有一个著名的囚徒困境,最早是由美国普林休斯敦大学的数学家塔克在1950年提出的:某日,一位富翁在家中被杀,财务产被盗.警方在此案的侦破过程中,抓到了两个犯罪嫌疑人--甲和乙,并从他们的住处搜出了被害人家中丢失的财物.但两人都否认杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点东西。
于是警方将两人隔离审讯,由地方检察官分别与甲和乙单独谈判.检察官说:"由于你们的偷窃罪已有确凿证据,所以可以判你们1年徒刑。
但是,根据控辩交易制度,如果你坦白并揭发同伙杀人的罪行,我将判你半年徒刑,但你的同伙被判10年徒刑,如果你拒不坦白,而被你同伙检举,你将被判10年徒刑,他只判半年徒刑,但是,如果你们两个都坦白交待,那么,你们都要判5年徒刑。
"甲和乙该怎么办?两人都面临两难选择-坦白或者抵赖.显然,最好的策略是双方都抵赖,结果大家都只被判1年。
博弈理论与寡头垄断博弈理论与寡头垄断博弈(game):是指个人或组织在一定的环境条件下,以一定的规则进行决策并从中取得相应结果的过程。
博弈论(Game Theory):研究博弈参与者在利益冲突条件下进行决策的理论。
博弈论与寡头企业竞争博弈论与寡头企业竞争博弈论并不是经济学的一个分支,它是一种方法,应用范围除经济学外,还包括政治学、军事学、外交学、国际关系学、犯罪学等。
博弈论在经济学尤其在寡头市场理论中得到最广泛、最成功的应用。
博弈论的许多成果借助于经济学的例子发展。
当寡头竞争者改变其产品或定价时, 企业必须要做出反应或调整,能够预见到对方行动的事前行为最佳。
参与人(Player) 策略(Strategies) 收益(支付)(Payoffs)收益矩阵(Payoff matrix)博弈理论的基本概念博弈理论的基本概念博弈的种类博弈的种类1. 合作博弈与非合作博弈(cooperative gameand uncooperative game)企业之间的经济博弈可以是合作的,也可以是非合作的。
区别(differences):是否存在一个有约束力的协议。
合作博弈强调团体理性,即效率、公平和公正;非合作博弈强调个人理性和个人最优决策。
2. 同时博弈与顺序博弈(coincide game and sequence game)同时博弈:博弈各方在不了解对方情况下制定决策;顺序博弈:一方看到另一方的行动之后再采取行动。
博弈的主要类型博弈的主要类型博弈的主要类型博弈的主要类型3. 一次博弈与重复博弈(single game andrepeated game)4.纯粹博弈和混合博弈(pure game andmingle game)纯策略(pure strategy):参与人只选择一个策略混合策略(minglestrategy):参与人可能选择多种策略(以一定的概率)博弈的主要类型博弈的主要类型5. 双人博弈与n 人博弈(double game andn person’game)6.零和博弈与非零和博弈(drawn gameand remaindergame):零和博弈:各方收益之和为零非零和博弈:双方的得失取决于各自选择采取的行动和不为零支配策略与纳什均衡的区别支配策略(dominant strategy):不管对方做什么,对博弈方都是最优策略。
博弈论介绍博弈论(Game Theory)是一门研究决策制定和策略选择的数学分支学科。
它最初由数学家约翰·冯·诺伊曼(John von Neumann)和经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)于20世纪40年代共同发展起来,用于研究各种竞争、协作和冲突情境下的决策问题。
博弈论的应用领域涵盖了经济学、政治学、社会学、生物学、计算机科学等多个领域。
以下是博弈论的详细介绍:基本概念:博弈(Game):博弈是一种决策情境,涉及多个决策者(玩家)之间的相互影响和策略选择。
每个玩家可以采取不同的策略,而策略的选择会影响每个玩家的收益或效用。
玩家(Player):博弈中的参与者被称为玩家,每个玩家都追求最大化其自身的收益或效用。
策略(Strategy):策略是玩家的行动方案或选择,玩家根据自己的目标和信息来选择策略。
收益(Payoff):每个玩家根据博弈的结果获得一定的收益或效用,这些收益可以是正数、负数或零,反映了玩家的利益。
博弈类型:合作博弈(Cooperative Games):在这种类型的博弈中,玩家可以合作以实现共同的目标,并分配获得的利益。
著名的合作博弈包括合作博弈理论和核心。
非合作博弈(Non-Cooperative Games):在非合作博弈中,玩家之间缺乏明确的合作机制,每个玩家根据自己的利益做出决策。
著名的非合作博弈包括纳什均衡等。
重要概念:纳什均衡(Nash Equilibrium):纳什均衡是非合作博弈中的一个重要概念,指的是在博弈中,每个玩家根据其他玩家的策略选择,不能通过改变自己的策略来提高自己的收益。
纳什均衡是博弈中可能的结果之一。
博弈矩阵(Game Matrix):博弈矩阵是一种表示博弈的方式,它列出了每个玩家在每个可能策略组合下的收益。
通常用于描述双人零和博弈。
博弈树(Game Tree):博弈树是一种表示多人博弈的方式,它展示了博弈中玩家的策略选择和博弈结果的演化过程。
博弈论综述引言博弈论是一门研究决策制定和行为模式的学科,它涉及到多个参与者之间的相互作用和冲突。
在博弈论中,参与者的利益和策略选择是关键因素。
博弈论的研究对象可以是个体、企业、国家甚至整个社会。
本文将综述博弈论的基本概念、理论模型和应用领域。
基本概念博弈论的基本概念包括参与者、策略、收益和博弈形式。
参与者是指博弈中的个体或群体,策略是参与者在决策过程中可以选择的行动方式,收益是参与者在特定策略下获得的利益或成本,博弈形式描述了参与者之间的相互关系和行为规则。
理论模型博弈论的理论模型有多种,其中最经典的是博弈矩阵和博弈树。
博弈矩阵是一种二维表格,用于描述参与者在不同策略下的收益。
博弈树是一种图形化表示方式,用于展示参与者之间的决策过程和可能的结果。
博弈论的经典模型包括囚徒困境、合作博弈和非合作博弈。
囚徒困境模型描述了两名囚犯面临的决策问题,他们可以选择合作或背叛对方。
合作博弈模型着重于参与者之间的合作和联盟形成,非合作博弈模型则关注参与者之间的竞争和利益最大化。
应用领域博弈论在生活和社会中有广泛的应用。
在经济学领域,博弈论被应用于市场竞争、定价策略和战略决策等方面。
在政治学领域,博弈论被用于分析国际关系、选举和谈判等议题。
在生物学领域,博弈论被应用于研究动物行为、进化和生态系统稳定性等方面。
博弈论的局限性尽管博弈论在许多领域有着广泛的应用,但它也存在一些局限性。
首先,博弈论的理论模型建立在理性决策者的假设上,而现实世界中的决策往往受到情感、认知和信息不对称等因素的影响。
其次,博弈论的模型通常是简化和抽象的,无法完全反映复杂的现实情况。
此外,博弈论的应用也需要考虑参与者的目标和价值观等因素,以及外部环境的变化和不确定性。
结论博弈论是一门重要的学科,它对于理解和解决决策制定和行为模式的问题具有重要的意义。
通过研究博弈论的基本概念、理论模型和应用领域,我们可以更好地理解参与者之间的相互作用和冲突,并找到有效的解决方案。
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n 人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的的学科。
博弈论的基本概念博弈要素:1.决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。
(博弈圣经)2.对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。
他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。
(博弈圣经)3.生物亲序:所有生物在恶劣、未知的环境中都有寻找规律和有序的本能。
在博弈中指参与者有从混乱的环境中等待、寻找有序的亲近行为。
(博弈圣经)4.局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
5.策略(strategiges):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
6.得失(payoffs):一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。
7.次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。
8.博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。
在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。
所谓纳什均衡,它是一稳定的博弈结果。
纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。
这一结果对局中人B亦是如此。
这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。
对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a, b*)≤偶对(a*,b*);对局中人B的偶对(a *,b)≤偶对(a*,b*)。
有了上述定义,就立即得到纳什定理:任何具有有限纯策略的二人博弈至少有一个均衡偶。
这一均衡偶就称为纳什均衡点。
纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。
通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。
纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。
但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。
塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。
博弈的类型(1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收益分配问题。
(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。
(3)完全信息不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。
(4)静态博弈和动态博弈静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。
动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。
财产分配问题和夏普里值(Shapley value)考虑这样一个合作博弈:a、b、c、投票决定如何分配100万,他们分别拥有5 0%、40%、10%的权力,规则规定,当超过50%的票认可了某种方案时才能通过。
那么如何分配才是合理的呢?按票力分配,a50万、b40万、c10万c向a提出:a70万、b0、c30万b向a提出:a80万、b20万、c0……权力指数:每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数,这个“关键加入者”的个数就被称为权利指数。
夏普里值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。
次序abc acb bac bca cab cba关键加入者 a c a c a b由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6所以a,b,c应分别获得100万的2/3,1/6,1/6。
博弈论的意义弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。
基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。
因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博弈论是个非常重要的理论概念。
什么是博弈论?古语有云,世事如棋。
生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。
博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。
换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。
事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。
数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。
这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。
对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。
在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解” 或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略?怎样才是“合理” ?应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“最小最大解” 。