博弈论-纳什均衡(非合作博弈均衡)
- 格式:docx
- 大小:20.20 KB
- 文档页数:3
纳什均衡简介纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。
实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。
然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。
阿尔伯特·塔克(Alberttucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。
它发展了本身很有意义的n人有限非合作博弈的概念和性质。
并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。
在概念和方法两方面,该论文都是作者的独立创造。
”纳什均衡例子博弈论中一个著名的例子就是囚徒困境。
囚徒困境是一个非零和博弈,说的是两个嫌疑犯甲和乙私人民宅联手作案,被警方逮住但未获证据。
警方于是将两个嫌疑犯分开审讯。
警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。
纳什均衡点纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。
如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。
[编辑本段]例子经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。
于是,两人同时陷入招供还是不招供的两难处境。
如果两人均不招供,将最有利,只被判刑三年。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年;乙判刑一年不招供甲判刑一年;乙判刑十年甲判刑三年基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
[编辑本段]学术争议和批评第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。
这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下达不到并不能解决问题。
[来源请求]在数学意义上,纳什并没有超越角谷静夫不动点定理。
大学博弈论试题及答案一、选择题(每题2分,共20分)1. 在博弈论中,非合作博弈是指:A. 参与者之间可以达成协议B. 参与者之间不能达成协议C. 参与者之间必须达成协议D. 参与者之间只能通过合作达到目标答案:B2. 纳什均衡是博弈论中的一个概念,它描述了一种情况,即:A. 所有参与者都处于最优策略B. 至少有一个参与者处于非最优策略C. 所有参与者都处于非最优策略D. 至少有一个参与者可以单方面改变策略以获得更好的结果答案:A3. 囚徒困境中,如果两个参与者都选择合作,那么:A. 他们都将获得最大收益B. 他们都将获得最小收益C. 他们都将获得中等收益D. 他们中的一个将获得最大收益,另一个获得最小收益答案:C4. 零和博弈是指:A. 一个参与者的收益等于另一个参与者的损失B. 参与者的总收益为零C. 参与者的总损失为零D. 参与者的总收益和总损失相等答案:B5. 在博弈论中,策略是指:A. 参与者的行动计划B. 参与者的收益C. 参与者的损失D. 参与者的支付结构答案:A6. 博弈论中的“混合策略”是指:A. 参与者随机选择策略B. 参与者总是选择相同的策略C. 参与者的策略是固定的D. 参与者的策略是预先确定的答案:A7. 博弈论中的“支配策略”是指:A. 无论对手选择什么策略,都是最优的策略B. 只有在特定情况下才是最优的策略C. 只有在对手选择特定策略时才是最优的策略D. 参与者总是选择的策略答案:A8. 博弈论中的“重复博弈”是指:A. 博弈只进行一次B. 博弈进行多次,但每次都是独立的C. 博弈进行多次,且参与者的记忆会影响后续决策D. 博弈进行多次,但参与者不能记住之前的决策答案:C9. 在博弈论中,如果一个策略在任何情况下都不是最优的,那么这个策略被称为:A. 支配策略B. 支配策略的反面C. 支配策略的替代D. 非支配策略答案:B10. 博弈论中的“共同知识”是指:A. 所有参与者都知道的信息B. 只有部分参与者知道的信息C. 参与者之间的秘密D. 参与者之间共享的信念答案:A二、填空题(每题2分,共20分)1. 在博弈论中,如果一个策略在任何情况下都不是最优的,那么这个策略被称为________。
博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。
两个囚徒互相揭发,就是一种纳什均衡。
对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。
也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。
这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。
博弈策略稳定,博弈结果也稳定。
之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。
之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。
2、纳什均衡意义重大。
纳什均衡提出,震动整个经济学界。
诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。
”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。
”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。
”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。
纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。
读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。
但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。
这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。
从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。
更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。
Q2:怎样运用纳什均衡?1、分析囚徒困境。
纳什均衡的概念纳什均衡是博弈论中的重要概念,指的是在一个博弈中,所有参与者都选择了自己的最佳策略,不存在更好的选择,即达到了一种均衡状态。
纳什均衡是在参与者之间相互博弈的情况下,每个参与者都选择了自己的最佳策略,并且其他参与者也同时选择了最佳策略,从而实现了一种平衡状态。
纳什均衡最早由约翰·纳什提出,他于1950年发表了研究博弈论的著名论文《非合作博弈》。
在该论文中,纳什定义了纳什均衡,并利用数学方法证明了简单博弈的纳什均衡存在性。
由于纳什均衡的提出和研究,他获得了1994年的诺贝尔经济学奖。
纳什均衡的理论适用范围非常广泛,涵盖了众多社会科学领域,如经济学、政治学、社会学等。
在经济学领域,纳什均衡被广泛运用于市场竞争、价格确定、产出决策等方面的分析。
在政治学领域,纳什均衡被应用于国际关系、选举竞争等问题的研究。
在社会学领域,纳什均衡被用于解析社会合作、集体行动的机制等等。
为了更好地理解纳什均衡的概念,我们可以通过一个具体的博弈案例来说明。
假设有两个企业A和B在某个市场上销售相同的产品,它们可以选择两种不同的定价策略:高价策略和低价策略。
企业A和B都知道,如果它们选择相同的策略,市场将会处于均衡状态;如果它们选择不同的策略,市场将会出现不稳定的情况。
在这个博弈中,我们可以使用一个博弈表来表示两个企业的策略和回报。
假设高价策略带来的利润分别为5和2,低价策略带来的利润分别为3和4。
根据这个博弈表,我们可以得到以下结论:如果企业A选择高价策略,那么企业B选择高价策略可以带来较高的利润,所以企业B将会选择高价策略。
如果企业A选择低价策略,那么企业B选择低价策略可以带来较高的利润,所以企业B同样会选择低价策略。
综上所述,无论企业A选择高价策略还是低价策略,企业B都会选择低价策略,从而形成了一个纳什均衡。
在这种均衡状态下,企业A的最佳策略是低价策略,而企业B的最佳策略也是低价策略,两个企业都无法通过改变自己的策略来获得更高的利润。
非合作博弈纳什均衡及其关系非合作博弈是博弈论的重要分支之一,它研究的是在缺乏沟通和协调的情况下,个体之间的决策和行为。
而纳什均衡则是非合作博弈中的一个重要概念,指的是一种策略组合,使得在这种组合下,任何一个个体都没有动力单独改变自己的策略。
本文将介绍非合作博弈的基本概念,并探讨纳什均衡与博弈者行为之间的关系。
我们来了解一下非合作博弈的基本概念。
非合作博弈是指每个博弈者在做出决策时,只考虑自己的利益,而不关心其他博弈者的利益。
在非合作博弈中,博弈者之间彼此独立,没有任何形式的合作和沟通。
博弈者通过选择不同的策略来追求自己的利益,并根据其他博弈者的选择来调整自己的策略。
在非合作博弈中,博弈者的目标是尽可能地使自己获得最大的利益。
而纳什均衡是非合作博弈中的一个重要概念,它指的是一种策略组合,使得在这种组合下,任何一个博弈者都没有动力单独改变自己的策略。
换句话说,纳什均衡是一种稳定的策略组合,使得每个博弈者都认为在其他博弈者的策略给定的情况下,自己没有更好的选择。
在纳什均衡下,所有博弈者都做出了最优策略的选择,不存在任何一个博弈者可以通过改变自己的策略来获得更大的利益。
非合作博弈的纳什均衡与博弈者的行为密切相关。
在非合作博弈中,每个博弈者根据其他博弈者的选择来做出自己的决策。
当博弈者选择的策略达到纳什均衡时,他们就没有动力再改变自己的策略。
这意味着博弈者的行为是一种理性行为,他们根据自己的利益来做出决策,而不会被其他博弈者的选择所左右。
然而,在非合作博弈中,并不是所有的博弈都存在纳什均衡。
有些博弈可能存在多个纳什均衡,而有些博弈则可能不存在纳什均衡。
对于存在多个纳什均衡的博弈,博弈者可以根据自己的目标和利益来选择不同的策略。
而对于不存在纳什均衡的博弈,博弈者的行为将变得复杂和不确定。
非合作博弈纳什均衡的研究对于理解人类行为和社会决策具有重要意义。
在现实生活中,人们常常面临着各种博弈情境,需要根据自己的利益和目标做出决策。
博弈论吉本斯
吉本斯(John Nash)是著名的美国数学家和经济学家,他对博弈论的贡献被广泛认可。
以下是关于吉本斯在博弈论方面的主要贡献:
1. 吉本斯均衡:吉本斯提出了著名的吉本斯均衡概念,也称为纳什均衡。
吉本斯均衡是指在博弈中,当每个参与者都选择了最优策略后,没有参与者有动机单独改变自己的策略。
这个概念对于理解博弈中的平衡点和策略选择具有重要意义。
2. 非合作博弈理论:吉本斯发展了非合作博弈理论,该理论研究了在博弈中参与者之间缺乏合作的情况。
他提出了一种数学模型,描述了参与者在决策中寻求自己最佳利益的过程,以及在这种情况下可能出现的均衡点。
3. 吉本斯博弈:吉本斯还提出了吉本斯博弈,这是一类特殊的博弈模型,其中每个参与者的最佳策略取决于其他参与者的选择。
吉本斯博弈的研究为博弈论提供了更深入的理解,揭示了博弈中可能存在的多个均衡点和策略选择的复杂性。
吉本斯的贡献对于博弈论的发展具有重要影响,他的研究为理解经济、社会和政治中的决策行为和策略选择提供了理论基础,对于经济学、管理学和其他社会科学领域的研究都具有重要意义。
博弈论中的均衡一、博弈论的定义博弈论是研究决策者之间相互影响的一种数学工具。
它主要关注的是在决策者之间存在相互作用和相互依存的情况下,如何做出最优决策。
二、博弈论中的均衡概念均衡是博弈论中一个重要的概念。
它指的是在一个博弈中,每个参与者都采取了最优策略,并且没有任何一个参与者能够通过改变自己的策略来获得更多的收益。
三、纳什均衡纳什均衡是博弈论中最为常见和重要的均衡概念之一。
它指的是在一个非合作博弈中,每个参与者都采取了最优策略,并且这些最优策略构成了一个稳定状态,即没有任何一个参与者能够通过改变自己的策略来获得更多的收益。
四、纳什均衡存在定理纳什均衡存在定理指出,在任何一个有限制性条件(例如有限次迭代)下满足某些基本条件(例如紧致性)的非合作博弈中,至少存在一个纳什均衡。
五、纳什均衡的计算方法在一些简单的博弈中,可以通过列出参与者的收益矩阵来计算纳什均衡。
具体方法是找到每个参与者的最优策略,并检查这些最优策略是否构成了一个稳定状态。
在一些复杂的博弈中,计算纳什均衡可能非常困难甚至不可能。
此时,可以采用数值方法(例如迭代法)或者近似方法(例如线性规划)来求解。
六、纳什均衡的应用纳什均衡在经济学、政治学、生物学等领域都有广泛应用。
在市场竞争中,企业可以通过分析竞争对手的行为和策略来制定自己的最优策略;在国际关系中,各国可以通过分析其他国家的行为和策略来制定自己的外交政策。
七、纳什均衡存在局限性尽管纳什均衡是博弈论中最为常见和重要的均衡概念之一,但它也存在一些局限性。
在一些博弈中,存在多个纳什均衡,而且这些纳什均衡可能会导致非常不同的结果;在一些博弈中,参与者的收益函数可能并不是凸函数,因此纳什均衡可能不存在或者不唯一。
八、总结博弈论中的均衡是一个重要的概念,其中纳什均衡是最为常见和重要的一种。
通过计算纳什均衡,参与者可以找到自己的最优策略,并且预测其他参与者的行为和策略。
然而,纳什均衡也存在局限性,在实际应用中需要注意。
非合作博弈论博弈论也叫对策论,是现代微观经济学的基础领域之一,主要研究在彼此互动的情形下个人是如何做决策的。
近年来它已经被广泛地应用于商业、政治、社会学等其他社会科学的分析中。
博弈的分类根据不同的基准也有不同的分类。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。
他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。
从而揭示了博弈均衡与经济均衡的内在联系。
纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。
1944年冯·诺依曼与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。
尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。
例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。
冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。
合作型博弈在20世纪50年代达到了巅峰期。
然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。
正是在这个时候,非合作博弈—“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。
《博弈论与纳什均衡理论》姓名张贺祺学号 2010010404 专业政治经济学指导老师张秉云摘要博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。
即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡,从实质上说,是一种非合作博弈状态。
关键字:博弈论;纳什均衡;合作博弈;非合作博弈目录摘要 (2)关键字 (2)一、引言 (4)二、博弈论与纳什均衡的主要内容 (4)(一)博弈论的主要思想 (4)(二)博弈论的分类 (5)三、经典案例 (7)(一)博弈论的经典案例 (7)(二)纳什均衡经典案例 (7)四、博弈论和纳什均衡的重要影响 (8)(一)博弈论的重要影响 (8)(二)纳什均衡的重要影响 (8)参考文献 (9)博弈论与纳什均衡理论一、引言近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的学科。
非合作博弈纳什均衡及其关系非合作博弈理论是现代博弈论的核心内容之一,而纳什均衡则是非合作博弈理论的重要概念。
本文将介绍非合作博弈纳什均衡的概念、性质及其与其他概念的关系,以帮助读者更好地理解和应用非合作博弈理论。
非合作博弈是指参与者在博弈过程中不进行合作,而是根据自身利益做出决策的一种博弈模式。
在非合作博弈中,每个参与者都追求自身的最大利益,而不考虑其他参与者的利益。
这种博弈模式下,每个参与者的决策会直接影响其他参与者的利益,形成了相互依存的关系。
纳什均衡是非合作博弈中的一种重要解概念。
它是指在博弈中每个参与者选择的策略组合下,没有参与者有动机改变自己的策略,即每个参与者都认为自己的策略是最佳选择。
换句话说,纳什均衡是一种稳定的策略组合,其中没有参与者愿意单独改变自己的策略。
非合作博弈纳什均衡具有以下几个特点:1. 博弈参与者的理性:在非合作博弈中,每个参与者都是理性的,追求自身的最大利益。
他们会根据自己的判断和利益选择最优策略,而不会受到其他参与者的影响。
2. 互相依存的关系:在非合作博弈中,每个参与者的决策会直接影响其他参与者的利益。
因此,参与者之间形成了相互依存的关系,他们的利益会相互影响。
3. 稳定性:纳什均衡是一种稳定的策略组合,其中没有参与者愿意单独改变自己的策略。
在纳什均衡下,每个参与者都认为自己的策略是最佳选择,没有动机去改变。
非合作博弈纳什均衡与其他概念之间存在密切的关系。
首先,非合作博弈纳什均衡与合作博弈纳什解是相对应的概念。
在合作博弈中,参与者可以进行合作,达成协议并共同追求最大化利益。
而在非合作博弈中,参与者之间没有合作的可能,只能根据自身利益做出决策。
因此,非合作博弈纳什均衡更加符合现实情况。
非合作博弈纳什均衡与博弈树、博弈矩阵等概念密切相关。
博弈树是用于描述博弈过程中各方决策与结果之间关系的工具,而博弈矩阵则是用于表示参与者之间策略选择与利益关系的表格。
非合作博弈纳什均衡可以通过分析博弈树或博弈矩阵得出,帮助参与者理解和选择最优策略。
非合作博弈纳什均衡及其关系在博弈论中,非合作博弈是指参与者在决策过程中相互独立,没有合作或协商的情况下进行的决策过程。
每个参与者根据自身利益和目标来选择行动策略,以最大化自己的收益。
非合作博弈的重点在于分析每个参与者的最佳策略选择,并推断出可能的结果。
纳什均衡是非合作博弈中的一种解决概念。
它描述了在一个博弈中,每个参与者选择的策略互不冲突,没有任何参与者可以通过改变自己的策略来获得更高的收益。
换句话说,纳什均衡是一种状态,其中每个参与者的策略选择是最佳响应其他参与者策略选择的结果。
为了更好地理解非合作博弈和纳什均衡的关系,我们可以通过一个经典的例子来说明。
假设有两个公司,A公司和B公司,它们同时决定定价策略。
每个公司都有两个选项:高价和低价。
他们的收益取决于对方公司的定价策略。
假设A公司选择高价,B公司选择低价,那么B公司将获得更高的收益,因为它的产品价格更低,吸引了更多的消费者。
同样地,如果B公司选择高价,A公司选择低价,那么A公司将获得更高的收益。
在这种情况下,每个公司都有动力选择低价,以获得更高的收益。
通过分析这个例子,我们可以看到纳什均衡的出现。
在这个例子中,纳什均衡是A公司和B公司都选择低价的策略。
在这个均衡状态下,任何一家公司改变自己的定价策略都不会获得更高的收益。
这是因为如果A公司选择高价,B公司选择低价,A公司将失去市场份额;同样地,如果B公司选择高价,A公司选择低价,B公司也将失去市场份额。
非合作博弈和纳什均衡的关系是密切相关的。
在非合作博弈中,参与者根据自身利益选择最佳策略,而纳什均衡则是在所有参与者的策略选择下达到的一种状态。
纳什均衡可以视为非合作博弈的解决方案,它描述了每个参与者的最佳决策策略。
然而,需要指出的是,纳什均衡并不一定代表最优解。
它只是在给定参与者策略选择的情况下达到的一种稳定状态。
在某些情况下,纳什均衡可能导致一种较差的结果,而非纳什均衡的策略可能会带来更好的结果。
纳什均衡——⾮合作博弈,囚徒困境1、⾮合作博弈是指在策略环境下,⾮合作的框架把所有的⼈的⾏动都当成是个别⾏动。
它主要强调⼀个⼈进⾏⾃主的决策,⽽与这个策略环境中其他⼈⽆关。
博弈并⾮只包含了冲突的元素,往往在很多情况下,既包含了冲突元素,也包含了合作元素。
即冲突和合作是重叠的。
===》求个⼈利益最⼤化2、合作博弈是指⼀些参与者以同盟、合作的⽅式进⾏的博弈,博弈活动就是不同集团之间的对抗。
在合作博弈中,参与者未必会做出合作⾏为,然⽽会有⼀个来⾃外部的机构惩罚⾮合作者。
合作博弈亦称为正和博弈,是指博弈双⽅的利益都有所增加,或者⾄少是⼀⽅的利益增加,⽽另⼀⽅的利益不受损害,因⽽整个社会的利益有所增加的。
===》求集体利益最⼤化囚徒困境终于被破解了!⼩伙1句狠话轻松破解难题,豪取50万英镑==》本质上的解法是在将⾮合作博弈变成合作博弈发布时间: 05-1122:12教育领域创作者囚徒困境,据说是博弈论中最棘⼿的难题,⽆⼈可破!不过,这个世纪难题却被⼀个年轻的英国街头混混⽤1句话给轻松破解了,并且豪取50万英镑。
01、什么是囚徒困境?囚徒困境,是1950年美国兰德公司提出来的,并以故事的形式进⾏阐述:两⼈因合伙盗窃杀⼈被逮捕,警⽅将他们两⼈分开进⾏审讯,并给了他们3个选择:1、如果两个⼈都抵赖,各判刑1年;2、如果两个⼈都坦⽩,各判刑8年;3、如果其中⼀⼈坦⽩,坦⽩者会被释放,抵赖者则会判刑10年。
很明显,两个囚徒都⾯临着两种选择:坦⽩或者抵赖。
由于两⼈处于隔离状态,并不知道同伙会如何选择,那么,他们就只能基于⼈性的⾃私,⽽去断定同伙肯定会去对其来说最有利的⽅式:坦⽩!既然同伙坦⽩了,那么⾃⼰抵赖就会被判10年,太亏了。
于是,他⾃⼰也会选择坦⽩——最坏也是8年,如果运⽓好,还可能直接释放。
这样⼀来,每个⼈都这样猜想对⽅,那么他们最终的结果就是都坦⽩,同时被判刑8年。
02、英国⼩伙破解囚徒困境的神操作!囚徒困境充分利⽤了⼈性的⾃私,基本⽆法破解。
博弈论中的纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。
其研究成果见于题为《非合作博弈》(1950)的博士论文。
该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。
纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。
该解概念后来被称为纳什均衡。
定义:纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。
这一结果对局中人B亦是如此。
纳什均衡的经典范例就是囚徒博弈,但是研究博弈论常常会使人陷入一种只追求个人利益的误区,事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设,并不总能说明事实。
只是假定他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。
也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。
没有人会主动改变自己的策略以便使自己获得更大利益。
“囚徒的两难选择”有着广泛而深刻的意义。
个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
完全理性:
理性指一种行为方式,它适合实现指定目标,而且在给定条件和约束的限度之内。
在不同的学科领域,理性所涵盖的内容存在着差异
完全理性的内涵
具有完全理性的行为人是个无所不知的超人,他具有纵向和横向方面完备的知识。
在纵向方面,他可以预测未来;在横向方面,他通晓资源、交易伙伴和环境等情况。
具体而言,行为人的完全理性包括以下隐含内容。
(1)不存在不确定性,即使存在不确定性,也可以预知不确定性的概率分布。
也就是说,对于具有完全理性的行为人来说,一切信息都是确定的。
(2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数),同时行为人具有同质性以及一致性的偏好体系。
(3)选择结果具有描述不变性、程序不变性和前后关系独立性。
描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项,也就是说如果行为人经过再三思考,将两种描述视为同一问题的同义表达,那么它们必定导致相同的选择——即这种思考不存在异处;程序不变性要求不同方式的等价学说揭露相同的偏好次序;前后关系独立性指一项选择与其他替代方案互为独立的原则,它要求在给定Z而不提供有关X或Y 的新的信息的情况下,X 与Y的优先权顺序不应该依赖于Z是否有效。
(4)行为人具备完备的计算和推理能力,可以像计算机一样在数秒内从事无穷尽的计算步骤,同时也不存在感性因素对选择的干扰。
(5)选择意味着在各种方案或选择集中进行比较和挑选,因此完全理性的行为人可以设计出所有的被选方案,以及各项方案所产生的全部后果。
(6)一个确定的报酬函数,即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。
(7)确定性的结果,也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。
在上述条件下,建立在完全理性假设的基础上的主流经济学的方法论,即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。
行为人在选择过程中,可以遵循确定性原则、极大极小法则、边际原理以及概率法则(也就是主观期望原则)。
主流经济学的选择理论建立得如此简洁和完美,使得诸多该领域的学者为之倾倒。
并且,这种理论可以使我们不用站起身来实际观察人类行为,便能坐在椅子里预测它们(正确或错误的预见)。
正如主流经济学的典型代表弗里德曼的著名论断所述“彻底的‘现实主义’显然无法实现;看一个理论是否‘足够’现实,只能看它就眼下意图而言,是否能做出充分好的预见,或做出比其他理论更好的预见”。
主流经济学的完全理性假设致使其形成令人称赞的完美体系和预测能力,但是这种完美只是抽象上的理想模式和方法,不仅经不起经济学内部的逻辑推敲,也经不起实践和现实的考验。
完全信息(Complete Information)
完全信息(Complete Information),是指市场参与者拥有的对于某种经济环境状态的全部知识。
在现实经济中,没有人能够拥有各个方面经济环境状态的全部知识,
完全信息博弈
完全信息博弈是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。
关于完全信息博弈的最早结果出现在1950年代,但确切出自何人之手却无从得知,这就是所谓的“佚名定理”(the Folk Theorem)。
该定理认为,重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致,这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。
或者可以说,只要行为人有足够的耐心,任何满足个体理性的可行支付都可以通过一个特定的子博弈精炼均衡达到。
然而,虽然所有可行的个体理性结局确实代表了合作博弈的解观点,但是它不能够提供相关信息,并且是相当模糊的。
奥曼认为该理论本身没有多少新东西,他指出,完全信息的重复博弈论与人们之间相互作用的基本形式的演化是相关的。
演化博弈理论(Evolutionary Game Theory)
演化博弈理论的概述:在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。
在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。
与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。
有限理性这一概念最早是由西蒙(Simon.H.A.)在研究决策问题时提出的,它是指人的行为只能是“意欲合理,但只能有限达到”。
完全理性的人根本就不可能存在。
演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论。
在方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一种动态的均衡。
演化博弈理论源于生物进化论,它曾相当成功地解释了生物进化过程中的某些现象。
如今,经济学家们运用演化博弈论分析社会习惯、规范、制度或体制形成的影响因素以及解释其形成过程,也取得了令人瞩目的成绩。
演化博弈论目前成为演化经济学的一个重要分析手段,并逐渐发展成一个经济学的新领域。
演化博弈理论的特征: 一般的演化博弈理论具有如下特征:它的研究对象是随着时间变化的某一群体,理论探索的目的是为了理解群体演化的动态过程,并解释说明为何群体将达到目前的这一状态以及如何达到。
影响群体变化的因素既具有一定的随机性和扰动现象(突变),又有通过演化过程中的选择机制而呈现出来的规律性。
大部分演化博弈理论的预测或解释能力在于群体的选择过程,通常群体的选择过程具有一定的惯性,同时这个过程也潜伏着突变的动力,从而不断地产生新变种或新特征。
一般的演化博弈模型的建立主要基于两个方面:选择(Selection)和突变(Mutation)。
选择是指能够获得较高支付的策略在以后将被更多的参与者采用;突变是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的策略,也可能是获得较低支付的策略)。
突变其实也是一种选择,但只有好的策略才能生存下来。
突变是一种不断试错的过程,也是一种学习与模仿的过程,这个过程是适应性且是不断改进的。
不具备这两个方面的模型不能称为演化博弈模型。
比如,艾格则等(Agiza,Hegazi&Elsadany,2001)提出了一个动态演化的博弈模型,它在有限理性的企业都采取一定的行为规则(产量调整机制)下研究企业重复博弈是否可以达到纳什均衡。
这个模型虽然研究的是有限理性个体和动态演化过程,但不属于演化博弈模型,因为没有包含选择和突变的过程。
如果把这个模型作如下修改,便可以看作演化博弈模型:假设企业有许多不同的行为规则,而采用某些行为规则的企业比那些不采用这些行为规则的企业获益更大;随着时间的推移,采用这些行为规则的企业生存下来,而不采用这些行为规则的企业被淘汰。
这样修改后的模型既有选择过程又有突变过程,便成为一个演化博弈模型。
总之,演化博弈模型有如下几个特征:第一,以参与人群体为研究对象,分析动态的演化过程,解释群体为何达到以及如何达到目前的这一状态;第二,群体的演化既有选择过程也有突变过程;第三,经群体选择下来的行为具有一定的惯性。
博弈论、纳什均衡(Nash equilibrium)
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。
即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
博弈论或称为赛局理论,数学的一个分支, 目前在生物学,经济学,计算机科学和其他很多学科都有广泛的应用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论的创始人是冯·诺伊曼。
具有竞争或对抗性质的行为成为对策行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
比如日常生活中的下棋,打牌等。
对策论就是研究对策行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
一个著名的例子就是囚徒困境,囚徒困境是一个非零和博弈。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果两人均不招供,将被判刑1年;如果你招供,而对方不招供,则你将被判刑3个月,而对方将被判刑10年;如果两人均招供,将均被判刑5年。
于是,两人同时陷入招供还是不招供的两难处境。
两个囚犯合理的选择是招供,原本对双方都有利的策略不招供和结局被判刑1年就不会出现。
这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。