纳什均衡两难选择
- 格式:doc
- 大小:70.00 KB
- 文档页数:5
纳什均衡简介纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。
实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。
然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。
阿尔伯特·塔克(Alberttucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。
它发展了本身很有意义的n人有限非合作博弈的概念和性质。
并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。
在概念和方法两方面,该论文都是作者的独立创造。
”纳什均衡例子博弈论中一个著名的例子就是囚徒困境。
囚徒困境是一个非零和博弈,说的是两个嫌疑犯甲和乙私人民宅联手作案,被警方逮住但未获证据。
警方于是将两个嫌疑犯分开审讯。
警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。
纳什均衡点纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。
如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。
[编辑本段]例子经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。
于是,两人同时陷入招供还是不招供的两难处境。
如果两人均不招供,将最有利,只被判刑三年。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年;乙判刑一年不招供甲判刑一年;乙判刑十年甲判刑三年基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
[编辑本段]学术争议和批评第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。
这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下达不到并不能解决问题。
[来源请求]在数学意义上,纳什并没有超越角谷静夫不动点定理。
纳什均衡概念名词解释纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,这个选择不会被单方面的改变,否则对于另一方来说,选择其他策略反而更劣。
1. 概念解释纳什均衡的概念可以从两个方面进行解释。
从个人角度看,纳什均衡是指当每一个人都实施最优策略时,其它人不能从自己的策略中获得进一步的盈利收益;从社会角度看,纳什均衡则是指,当所有人都做出了最优策略时,整个社会得到了最大的总收益。
2. 纳什均衡的前提条件在博弈论中,纳什均衡并不是所有博弈都存在的。
对于一个博弈,存在纳什均衡需要满足以下条件:(1)所有博弈者都采取了最优策略,即无法通过改变策略来提高自己的收益;(2)每个博弈者的策略是对其他博弈者实施的策略的最佳反应;(3)每个博弈者都清楚地了解其他博弈者的策略。
3. 纳什均衡的类型在实际的博弈中,纳什均衡可以分为三种类型:(1)纯策略均衡:指每位参与者都只选定一个策略,并根据它的期望收益来进行决策,不存在概率因素。
(2)混合策略均衡:指每位参与者按一定的概率选定多个策略,并根据它的期望收益来进行决策,存在概率因素。
(3)多重纳什均衡:指博弈中存在多个均衡策略组合,每个均衡策略组合都符合博弈的前提条件。
4. 纳什均衡的意义和应用纳什均衡是博弈论的一个核心概念,其意义和应用非常广泛。
首先,纳什均衡可以用来预测和解释现实生活中的决策行为,如市场竞争、政府政策制定等。
其次,纳什均衡也可以用来指导协商和谈判的过程。
最后,纳什均衡还可以用来研究其他领域的决策行为,如军事战略、生态环境等。
综上所述,纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,是一种使得所有参与者都满意的稳定状态。
纳什均衡的应用领域非常广泛,其理论和方法也在不断地发展和完善。
多重纳什均衡的选择问题在博弈论和信息经济学中,我们常常面临一个问题:在存在多种纳什均衡的情况下,如何选择最优的均衡点。
这种选择问题涉及到市场竞争、政府决策、引入新技术等多个领域,在选择最优的策略时需要考虑众多的因素和权衡。
本文将从纳什均衡的定义出发,介绍多重纳什均衡的产生原因及其影响因素,并探讨选择最优均衡点的方法。
1. 纳什均衡的定义纳什均衡是博弈论中的一个重要概念,指的是在博弈中,每个参与者选择最优策略的状态。
具体地说,如果对于每个参与者的策略选择,其他参与者的策略都是最优的,那么这种状态就是纳什均衡。
例如,在一个两人博弈中,A和B的策略分别为合作和背叛,如果A选择合作,B 也选择合作,那么这种状态就是一个纳什均衡。
因为在这种情况下,A不会改变他的策略,因为他没有更好的选择了,B也不会改变,因为他的策略也是最优的。
2. 多重纳什均衡的产生原因在现实生活中,很多博弈存在多种纳什均衡的情况。
这种现象主要是因为以下两个原因所致。
2.1 非对称性在博弈中,参与者的利益和策略选择可能存在非对称性。
例如,在一个拍卖中,卖家和买家的目的可能是不同的。
卖家想要卖出商品,而买家则想以最低的价格买到这个商品。
因此,在这种情况下,可能存在多种纳什均衡。
2.2 多站点竞争在多站点竞争中,参与者的收益和策略选择可能会受到其它站点的影响。
例如,在一个城市中,如果只有一家咖啡店,那么这家咖啡店就可以定价较高,因为消费者没有其他选择。
但是,如果有多家咖啡店,则它们之间的定价策略和市场份额就会相互影响,可能存在多种纳什均衡。
3. 选择最优均衡点的方法在存在多重纳什均衡的情况下,如何选择最优的均衡点是一个复杂的问题。
以下是一些常用的方法:3.1 政策干预政府可以通过政策干预来引导市场选择最优的均衡点。
例如,在城市中建造公共场所,例如咖啡厅、购物中心等,以增加市场竞争和选择产品的范围。
3.2 引入新技术引入新技术也可以改变市场竞争的格局,在这个过程中可能会产生新的纳什均衡状态。
博弈论-纳什均衡(非合作博弈均衡)完全理性:理性指一种行为方式,它适合实现指定目标,而且在给定条件和约束的限度之内。
在不同的学科领域,理性所涵盖的内容存在着差异完全理性的内涵具有完全理性的行为人是个无所不知的超人,他具有纵向和横向方面完备的知识。
在纵向方面,他可以预测未来;在横向方面,他通晓资源、交易伙伴和环境等情况。
具体而言,行为人的完全理性包括以下隐含内容。
(1)不存在不确定性,即使存在不确定性,也可以预知不确定性的概率分布。
也就是说,对于具有完全理性的行为人来说,一切信息都是确定的。
(2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数),同时行为人具有同质性以及一致性的偏好体系。
(3)选择结果具有描述不变性、程序不变性和前后关系独立性。
描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项,也就是说如果行为人经过再三思考,将两种描述视为同一问题的同义表达,那么它们必定导致相同的选择——即这种思考不存在异处;程序不变性要求不同方式的等价学说揭露相同的偏好次序;前后关系独立性指一项选择与其他替代方案互为独立的原则,它要求在给定Z而不提供有关X或Y 的新的信息的情况下,X 与Y的优先权顺序不应该依赖于Z是否有效。
(4)行为人具备完备的计算和推理能力,可以像计算机一样在数秒内从事无穷尽的计算步骤,同时也不存在感性因素对选择的干扰。
(5)选择意味着在各种方案或选择集中进行比较和挑选,因此完全理性的行为人可以设计出所有的被选方案,以及各项方案所产生的全部后果。
(6)一个确定的报酬函数,即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。
(7)确定性的结果,也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。
在上述条件下,建立在完全理性假设的基础上的主流经济学的方法论,即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。
纳什均衡名词解释在博弈论中,对于一个最优化问题,如果对方选择最优策略的概率与自己选择该策略的概率相等,这就是纳什均衡( Nash equilibrium)。
其中,如果双方所选择的最优策略是不相同的,那么也可以叫非纳什均衡。
如果两个人的最优策略分别为A和B,则我们称之为合作博弈和非合作博弈,记作: A和B。
在博弈中,当某一方不考虑对方的策略情况下,另一方必须满足的策略称为纳什均衡。
如果博弈各方的策略彼此独立,则他们的行为是均衡的。
若其中一方受到了来自另一方的威胁或吸引时,便有可能改变自己的策略。
纳什均衡的存在,使得策略互换具有可能性。
因为纳什均衡不是某一个人或某一集团所能达成的,而是通过各方的相互作用达到的。
任何纳什均衡都不能单独实现,它必定是一个特定的合作博弈中的某种组合。
要想获得纳什均衡,策略互换必须发生在重复博弈的各博弈方身上。
当然,纳什均衡并非处处存在,因为每一个博弈方都会有自己的最优策略,且他可能将其改变,但只要博弈方多次选择这一策略,那么经过足够长的时间,就一定能达到纳什均衡。
另外,即使博弈各方采取了完全相同的策略,也不一定能达到纳什均衡。
如纳什均衡产生的前提是信息完全,但在现实中,却往往不是这样的。
总之,纳什均衡的实现需要一定的条件,纳什均衡不是固定不变的。
在纳什均衡的基础上,经济学家又研究出了新的均衡模型,通常我们把纳什均衡看成是“静态”的均衡,而新的均衡模型则被称为“动态”均衡。
【纳什均衡的概念】。
纳什均衡作为一种策略选择机制,已经被广泛地应用到许多经济学、管理学及社会科学领域,如均衡理论、激励理论、经济博弈论、非合作博弈论、群体行为学、演化经济学、信息经济学、公共经济学、组织理论、拍卖理论等。
纳什均衡的意义,不仅仅限于这些纯经济学范畴。
纳什均衡被广泛运用到经济学、管理学的许多领域。
例如,均衡价格和平均收益,作为经济学的一个重要结论,与此类似,也是纳什均衡的一个核心概念。
【纳什均衡的特征】。
两个纳什均衡解纳什均衡(Nash equilibrium)是博弈论中的一个重要概念,描述了多方参与者在无法单方面改变策略时所达到的最佳决策状态。
简单来说,如果每个参与者都已经选择了最佳策略,而且没有人有动机单独改变自己的策略,那么这种状态就被称为纳什均衡。
以下将介绍两个不同情境下的纳什均衡解。
情境一:囚徒困境囚徒困境是一种典型的博弈论情景,在这种情况下,两名犯罪嫌疑人被警方逮捕,在不互相沟通的情况下,警方给予了他们一定的定罪量刑选择。
假设两名嫌疑人分别有两种选择:合作(cooperate)和背叛(defect)。
如果两人都合作,他们会获得较轻的定罪和刑罚。
然而,如果其中一人选择了背叛,而另一人选择了合作,背叛方将获得较轻的定罪和刑罚,而合作方将面临较重的定罪和刑罚。
如果双方都选择了背叛,那么他们将分别获得相对较重的定罪和刑罚。
在这种情境下,纳什均衡解是双方选择背叛。
理由如下:- 如果A选择合作,那么B选择背叛可以得到相对较轻的定罪和刑罚。
因此,A会更倾向于选择背叛以避免较重的定罪和刑罚。
同样地,如果B选择合作,A选择背叛可以获得相对较轻的定罪和刑罚。
所以,B也会选择背叛。
- 如果A选择背叛,那么无论B选择何种策略,A都能获得相对较轻的定罪和刑罚。
同样地,如果B选择背叛,无论A选择何种策略,B都能获得相对较轻的定罪和刑罚。
情境二:价格竞争在价格竞争情境下,假设有两家公司A和B都在销售同一种产品。
他们可以独立地选择产品的价格。
两家公司的目标是最大化利润。
假设每家公司的利润函数都取决于自身价格和对方的价格。
公司A的利润函数为πA(PA,PB),公司B的利润函数为πB(PA,PB)。
其中,PA和PB分别表示A和B的价格。
理由如下:- 如果公司A选择了某个价格PA,并且公司B决定维持原先的价格PB,那么公司A的最佳策略是选择自己的价格来最大化利润。
因此,公司A的利润函数中的PA变量将达到最大值。
- 同理,如果公司B选择了某个价格PB,并且公司A决定维持原先的价格PA,那么公司B的最佳策略是选择自己的价格来最大化利润。
论日常生活中的“纳什均衡”“囚徒困境”是非合作博弈的均衡即“纳什均衡”的最经典的例子。
从这个例子,我们能知道“纳什均衡”的精要所在。
本文从“囚徒困境”案例出发,总结出“纳什均衡”的原理,并由此去探寻日常生活中的非合作博弈。
1950年和 1951年纳什的两篇关于非合作博弈的重要论文,彻底改变了人们对竞争和市场的看法。
他证明了非合作博弈极其均衡解,并证明了均衡解的存在性,即著名的“纳什均衡”,从而揭示了博弈均衡与经济均衡的内在联系奠定了现代非合作博弈论的基石。
要了解纳什均衡,首先要知道什么是非合作博弈问题。
“囚徒困境”是该问题最经典的例子,我们也从该例为切入点进行探讨:首先,一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。
“囚徒困境”:两个嫌疑犯(A和 B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判 1O年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯 A和 B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:A和 B均坦白或均不坦白、A坦白 B不坦白或者 B 坦白A不坦白,是博弈的结果。
在此,两个嫌疑犯 A和 B面临着两难的选择——坦白或抵赖。
显然最好的策略是双方都抵赖,结果是大家都只被判 1年。
但由于两人处于隔离情况下无法串供。
所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。
因为坦白交代可以期望得到最好的解决办法——释放,但前提是同伙抵赖,显然要比自己抵赖要坐 1O年牢好得多。
完全理性:理性指一种行为方式,它适合实现指定目标,而且在给定条件和约束的限度之内。
在不同的学科领域,理性所涵盖的内容存在着差异完全理性的内涵具有完全理性的行为人是个无所不知的超人,他具有纵向和横向方面完备的知识。
在纵向方面,他可以预测未来;在横向方面,他通晓资源、交易伙伴和环境等情况。
具体而言,行为人的完全理性包括以下隐含内容。
(1)不存在不确定性,即使存在不确定性,也可以预知不确定性的概率分布。
也就是说,对于具有完全理性的行为人来说,一切信息都是确定的。
(2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数),同时行为人具有同质性以及一致性的偏好体系。
(3)选择结果具有描述不变性、程序不变性和前后关系独立性。
描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项,也就是说如果行为人经过再三思考,将两种描述视为同一问题的同义表达,那么它们必定导致相同的选择——即这种思考不存在异处;程序不变性要求不同方式的等价学说揭露相同的偏好次序;前后关系独立性指一项选择与其他替代方案互为独立的原则,它要求在给定Z而不提供有关X或Y 的新的信息的情况下,X与Y的优先权顺序不应该依赖于Z是否有效。
(4)行为人具备完备的计算和推理能力,可以像计算机一样在数秒内从事无穷尽的计算步骤,同时也不存在感性因素对选择的干扰。
(5)选择意味着在各种方案或选择集中进行比较和挑选,因此完全理性的行为人可以设计出所有的被选方案,以及各项方案所产生的全部后果。
(6)一个确定的报酬函数,即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。
(7)确定性的结果,也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。
在上述条件下,建立在完全理性假设的基础上的主流经济学的方法论,即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。
行为人在选择过程中,可以遵循确定性原则、极大极小法则、边际原理以及概率法则(也就是主观期望原则)。
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。
他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。
从而揭示了博弈均衡与经济均衡的内在联系。
纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。
然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。
但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。
要不是30多年的严重精神病折磨,恐怕他早已站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。
纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。
然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。
1948年纳什到普林斯顿大学读数学系的博士。
那一年他还不到20岁。
当时普林斯顿可谓人杰地灵,大师如云。
爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。
博弈论主要是由冯·诺依曼(1903—1957)创所立的。
他是一位出生于匈牙利的天才的数学家。
他不仅创立了经济博弈论,而且发明了计算机。
早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。
1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。
尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。
例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。
纳什均衡囚徒困境帕雷托最优-最通俗的解答在知乎的纳什均衡回答里看到这么一个观点:1. 三个火枪手中那句名言:All for one,one for all (人人为我,我为人人),我的理解是,贵族武士之间,通过自利和利他的行为实现共同目的2. 亚当斯密提出invisible hand理论时候的基本前提:当市场中每个人都进行自利行为的时候,在客观上说,市场(或社会)整体的福利会被提升而纳什均衡恰好否定了前面的观点,我认为这也是这一理论如此著名的原因:当市场中每个人都进行自利行为的时候,在客观上说,市场(或社会)整体的福利是无法达到最优的。
纳什均衡(Nash equilibrium),无一参与者可以通过独自行动而增加收益的策略组合。
其经典的例子就是囚徒困境(Prisoner's Dilemma)。
囚徒困境是一个非零和博弈,反映个人最佳选择并非团体最佳选择。
或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。
如果两人均不招供,将最有利,只被判刑半年。
于是,两人同时陷入招供还是不招供的两难处境。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳什均衡。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯的博弈矩阵囚犯甲招供不招供囚犯乙招供各判刑两年甲判刑十年,乙立即释放不招供甲立即释放,乙判刑十年各判刑半年基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
游戏理论中的纳什均衡解析游戏理论是一门研究决策制定和策略选择的学科,它在解决各种冲突和竞争中发挥着重要的作用。
纳什均衡是游戏理论中的一个重要概念,它描述了一种策略组合,在该组合下,每个参与者都无法通过单方面改变自己的策略来获得更好的结果。
本文将对纳什均衡进行深入解析,并探讨其在游戏理论中的应用。
一、纳什均衡的概念纳什均衡是由诺贝尔经济学奖得主约翰·纳什提出的,他在1950年代提出了这一概念,并于1994年获得诺贝尔奖。
纳什均衡是指在一个博弈中,每个参与者都采取了最佳的策略后,无法通过单方面改变策略来获得更好的结果。
简而言之,纳什均衡是一种稳定的策略组合,没有参与者能够通过改变自己的策略而获得更好的收益。
二、纳什均衡的条件要达到纳什均衡,需要满足以下两个条件:1. 互相最佳反应:每个参与者都选择了对自己最有利的策略,假设其他参与者的策略不变。
2. 无悔策略:每个参与者都不会后悔自己的策略选择,即在已知其他参与者的策略后,仍然坚持自己的选择。
三、纳什均衡的应用纳什均衡在游戏理论中有广泛的应用,下面将介绍两个典型的例子。
1. 雷诺公司与雷克萨斯公司的定价决策假设雷诺公司和雷克萨斯公司是两家竞争的豪华汽车制造商,它们需要决定各自的定价策略。
假设雷诺公司选择高价策略,而雷克萨斯公司选择低价策略,那么雷诺公司将会获得更高的利润。
同样地,如果雷诺公司选择低价策略,而雷克萨斯公司选择高价策略,雷克萨斯公司将会获得更高的利润。
在这种情况下,两家公司都不会改变自己的策略,因为任何一方的策略改变都无法带来更好的结果。
因此,这种情况下存在一个纳什均衡,即雷诺公司选择高价策略,雷克萨斯公司选择低价策略。
2. 囚徒困境囚徒困境是游戏理论中经典的例子之一。
假设有两个囚徒被关押在不同的牢房中,检察官给每个囚徒提供了一个选择:合作还是背叛。
如果两个囚徒都选择合作,他们将会获得较轻的刑期;如果一个囚徒选择合作,而另一个选择背叛,背叛者将会获得较轻的刑期,而合作者将会获得较重的刑期;如果两个囚徒都选择背叛,他们将会获得较重的刑期。
博弈:纳什均衡的安全生产版博弈论,又称计策论、竞赛论,用于分析竞争的形势。
在存在利益冲突的竞争及斗争中,竞争的结果不仅依靠于某个参与者的抉择、决策与机会,而且也依靠于竞争对手或者其他参与者的抉择。
由于竞争结果依靠于所有局中人的抉择,每个局中人都企图预测其他人的可能抉择,以确定自己的最佳计策。
你与竞争对手们构成一个博弈。
现来讲一个故事:博奕论中流传最广的是一个叫做“囚徒逆境”的故事。
说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都能够做出自己的选择:或者者供出他的同伙(即与警察合作,从而背叛他的同伙),或者者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
假如他们中的一个人背叛,即告发他的同伙,那么他就能够被无罪释放。
而他的同伙就会被判10年。
假如双方都与警方合作共同招认,则各被判5年。
假如双方均不承认有罪,因警察找不到其他证据来证明他们往常的违法证据,则各判3个月。
这两个小偷将如何选择。
他们两人都是在坦白与抵赖策略上首先想到自己,实际上只有当他们都首先替对方着想时,或者者相互合谋(串供)时,才能够得到最短时间的监禁的结果。
但是由于两人处于隔离的情况下无法串供。
这样两人都选择坦白的策略与因此被判5年的结局就被称之“纳什均衡”,也叫非合作均衡。
没有人会主动改变自己的策略以便使自己获得更大利益。
“囚徒的两难选择”有着广泛而深刻的意义。
个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
从“纳什均衡”中我们还能够悟出一条真理:合作是有利的“利己策略”。
但它务必符合下列规律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。
从“纳什均衡”的普遍意义中我们能够深刻领会司空见惯的经济、社会、政治、国防、管理与日常生活中的博弈现象。
在“纳什均衡”理论中有三个必不可少的因素所构成:即“局中人集合”又称当事人、参与者、策略等等的集合,“策略集合”与每一对局中人所做的“选择与赢得集合”。
纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。
其研究成果见于题为《非合作博弈》(1950)的博士论文。
该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。
纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。
该解概念后来被称为纳什均衡。
纳什的主要学术贡献体现在1950年和1951年的两篇论文,1950年他才把自己的研究成果写成题为“非合作博弈”的文章刊登在美国全国科学院
每月公报上,立即引起轰动。
说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低,嘲笑几天之后,他遇到盖尔,像说梦话似的告诉他自己已经将冯·诺依曼的“最小最大原理找到了普遍化的方法和均衡点。
纳什这个初出茅庐的小子,根本不知道竞争的险恶,从没想到学术欺骗的后果。
结果还是戴维·盖尔充当了他的“经纪人”,起草致科学院的短信,系主任列夫谢茨则利用方便的人脉关系亲自将文稿递交给科学院。
纳什写的文章不多,他辩解说:少了才是精品。
中国国内提一个教授,要求在“核心的刊物”上发表多少篇文章。
按照这个标准可能纳什还不一定够资格。
1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表
过什么文章,特殊的人才,必须有特殊的选拔办法。
Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。
Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。
以两家公司的价格大战为例,Nash平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。
于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。
类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。
编辑本段定义
假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的
纳什均衡
最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。
所有局中人策略构成一个策略组合(Strategy Profile)。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。
即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡,从实质上说,是一种非合作博弈状态。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。
纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。
编辑本段标准定义
纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i 的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui
(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。
编辑本段纳什均衡的分类
纳什均衡可以分成两类:”纯战略纳什均衡“和”混合战略纳什均衡“。
要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。
特别地是,纯战略决定在任何一种情况下要做的移动。
战略集合是由玩家能够施行的纯战略所组成的集合。
而混合战略是对每个纯战略分配一个机率而形成的战略。
混合战略允许玩家随机选择一个纯战略。
混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。
因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。
故“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。
并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题"就只有混合战略纳什均衡,而没有纯战略纳什均衡。
不过,还是有许多赛局有纯战略纳什均衡(如协调赛局,囚徒困境和猎鹿赛局)。
甚至,有些赛局能同时有纯战略和混合战略均衡。
编辑本段纳什均衡经典案例:囚徒困境
(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。
)
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证
纳什均衡
据确凿,两人都被判有罪。
如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈
1.改变了经济学的体系和结构。
非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
2.扩展了经济学研究经济问题的范围。
原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。
纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
3.加强了经济学研究的深度。
纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
4.形成了基于经典博弈的研究范式体系。
即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
5.扩大和加强了经济学与其他社会科学、自然科学的联系。
纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。
纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。
纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
6.改变了经济学的语言和表达方法。
在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。