解释现实中的纳什均衡现象
- 格式:ppt
- 大小:1.33 MB
- 文档页数:36
纳什均衡简介纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。
实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。
然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。
阿尔伯特·塔克(Alberttucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。
它发展了本身很有意义的n人有限非合作博弈的概念和性质。
并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。
在概念和方法两方面,该论文都是作者的独立创造。
”纳什均衡例子博弈论中一个著名的例子就是囚徒困境。
囚徒困境是一个非零和博弈,说的是两个嫌疑犯甲和乙私人民宅联手作案,被警方逮住但未获证据。
警方于是将两个嫌疑犯分开审讯。
警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。
浅析古诺模型的纳什均衡及应用【摘要】古诺模型是博弈论中的经典模型之一,通过分析双方角色和策略的选择,可以得出纳什均衡的解。
纳什均衡是指在博弈中每个参与者采取最佳应对策略的状态,使得没有一个参与者可以通过改变自身策略来获得更高的收益。
通过计算纳什均衡,可以确定在古诺模型中各方的最优策略选择。
古诺模型在博弈论中有着广泛的应用,能够描述各种决策情形,并帮助分析各方的利益冲突。
古诺模型也存在局限性,例如假设信息完全对称等问题。
纳什均衡的意义和应用前景则在于帮助理解博弈中的策略选择规律,为实际决策提供理论指导。
通过深入研究古诺模型和纳什均衡的概念与应用,可以更好地理解博弈论在现实中的应用。
【关键词】关键词:古诺模型、纳什均衡、博弈论、角色与策略、计算方法、局限性、意义和应用前景。
1. 引言1.1 古诺模型的基本概念古诺模型的基本概念是现代博弈论的基础之一。
古诺模型是由约翰·冯·诺依曼和奥斯卡·摩根斯特恩在20世纪40年代提出的博弈论模型,被广泛应用于经济学、政治学、生物学等领域。
古诺模型主要研究多方参与的博弈中的决策问题,其基本假设是参与者都具有理性并追求最大化自身利益。
在古诺模型中,参与者被称为玩家,每个玩家有自己的策略空间和支付函数。
策略空间是玩家可以选择的所有可能行动,支付函数则是描述了每个玩家在不同策略组合下所获得的收益。
古诺模型中的策略可以是纯策略,即玩家直接选择一个确定的行动,也可以是混合策略,即以一定概率选择不同的纯策略。
通过分析古诺模型中各个玩家的策略选择和收益情况,可以得到博弈的纳什均衡。
纳什均衡即在一个博弈中,每个玩家选择的策略都是最优的,给定其他玩家的策略时,自己没有动机单方面改变策略。
纳什均衡是古诺模型中的一个重要概念,也是博弈论中的核心内容之一。
1.2 纳什均衡的概念纳什均衡是博弈论中一个重要的概念,它由约翰·纳什于1950年提出。
在一个博弈中,如果每个参与者都选择了最优的策略,且已知其他人的选择情况下仍然坚持自己的选择,那么这种情况就被称为纳什均衡。
纳什均衡点纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。
如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。
[编辑本段]例子经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。
于是,两人同时陷入招供还是不招供的两难处境。
如果两人均不招供,将最有利,只被判刑三年。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年;乙判刑一年不招供甲判刑一年;乙判刑十年甲判刑三年基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
[编辑本段]学术争议和批评第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。
这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下达不到并不能解决问题。
[来源请求]在数学意义上,纳什并没有超越角谷静夫不动点定理。
不会令人后悔的均衡在纳什均衡中,你不一定满意其他的策略,但你的策略是回馈对手招数的最佳策略。
从囚徒困境中我们会发现,作为博弈各方的行动就是针对对方行动而确定的最佳对策,而一旦知道对方在做什么,就没人愿意改变自己的做法。
博弈论学把这么一个结果称为均衡。
这个概念是有普林斯顿大学数学家约翰·纳什提出的,因此被称为纳什均衡。
诺贝尔经济学奖获得者萨缪尔森有句名言,你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词,供给与需求。
博弈论专家坎多瑞引申说:“要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是纳什均衡”。
1950年,还是一名研究生的纳什写了一篇论文,题为《n人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。
纳什的贡献是,他证明了在这一类的竞争中,在很广泛的条件下是有稳定解存在的,只要是别人的行为确定下来,竞争者就可以有最佳的策略。
那么,什么纳什均衡呢?简单说,就是一策略组合中,所有的参与者面临这样的一种情况:给定你的策略,我的策略是我最好的策略。
给定我的策略,你的策略也是你最好的策略,即双方在对方给定的策略下不愿意调整自己的策略。
纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具,所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展,甚至说是一场革命。
纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战,按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果,从纳什均衡引出一个悖论:从利己的目的触发,结果损人不利己。
“囚徒困境”就是如此,从这个意义说,纳什均衡提出的悖论实际上动摇了西方经济学的基石。
纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。
这个法则如下:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。
所谓博弈均衡,它是一稳定的博弈结果。
均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。
博弈论中的纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。
其研究成果见于题为《非合作博弈》(1950)的博士论文。
该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。
纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。
该解概念后来被称为纳什均衡。
定义:纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。
这一结果对局中人B亦是如此。
纳什均衡的经典范例就是囚徒博弈,但是研究博弈论常常会使人陷入一种只追求个人利益的误区,事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设,并不总能说明事实。
只是假定他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。
也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。
没有人会主动改变自己的策略以便使自己获得更大利益。
“囚徒的两难选择”有着广泛而深刻的意义。
个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。