博弈论纳什均衡存在定理_的两种证明方法的分析及设想_张莉
- 格式:pdf
- 大小:83.40 KB
- 文档页数:2
博弈论和纳什均衡Revised on July 13, 2021 at 16:25 pm关于博弈论和纳什均衡你应该知道这些美股腾讯财经微博2015-05-25 10:05我要分享139摘要纳什在与命运的博弈中找到均衡;纪念大师最好的方式就是尝试了解博弈论..腾讯财经综合报道风生奥斯卡获奖电影美丽心灵主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸;两人均不幸遇难..事发当时;这辆出租车失控撞向栏杆;两人均被抛出车外..约翰-纳什因发表两篇关于非合作博弈论的重要论文;彻底改变了人们对竞争和市场的看法..他证明了非合作博弈及其均衡解;并证明了均衡解的存在性;即着名的纳什均衡..不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生;曾在麻省理工学院任教;晚年为普林斯顿大学担任数学系教授;死前与82岁妻子艾丽西亚在普林斯顿居住..纳什以研究博弈论闻名;1994年获颁诺贝尔经济学奖..他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域..纳什在数学领域上取得多项突破;但他同时深受精神分裂症困扰;其生平故事在2001年被改编成电影美丽心灵;赢得包括最佳电影在内的4项奥斯卡奖项..尽管西维亚-纳萨斯Sylvia Nasars广为人知的小说美丽心灵A Beautiful Mind和改编自该书的、由拉塞尔-克罗Russell Crowe主演的同名奥斯卡电影探究了纳什错综复杂的生平;但都没有深入挖掘他的数学思想..他的数学成果依然不被大众所熟知..在当今科学界;人们普遍认为;与牛顿和爱因斯坦的数学理论相比;纳什的数学理论触及到的学科更多..牛顿和爱因斯坦的数学旨在处理物理问题;而纳什的数学却可以应用在生物学和社会学领域..如若不是精神疾病的困扰;纳什今天可能已与那些科学伟人齐名..尽管如此;他在几个数学领域的重要贡献大家有目共睹..他最大的成就来自于经济学方面..由于他在博弈论上的开创性成就;他与约翰海萨尼John Harsanyi和莱茵哈德-泽尔腾Reinhard Selten一起获得了1994年诺贝尔经济学奖..什么是博弈论与纳什均衡博弈论 :亦名“对策论”、“赛局理论”;属应用数学的一个分支;主要研究公式化了的激励结构间的相互作用..是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题;具有斗争或竞争性质现象的数学理论和方法..也是运筹学的一个重要学科..博弈论考虑游戏中的个体的预测行为和实际行为;并研究它们的优化策略..纳什均衡:又称为非合作博弈均衡;是博弈论的一个重要术语;以约翰-纳什命名..假设有n人局中人参与博弈;给定其他人策略的条件下;每个局中人选择自己的最优策略个人最优策略可能依赖于也可能不依赖于他人的战略;从而使自己利益最大化..所有局中人策略构成一个策略组合..纳什均衡指的是这样一种战略组合;这种策略组合由所有参与人最优策略组成..即在给定别人策略的情况下;没有人有足够理由打破这种均衡..纳什均衡;从实质上说;是一种非合作博弈状态..近代对于博弈论的研究;开始于策墨咯;波雷尔及冯-诺伊曼..1928年;冯-诺依曼证明了博弈论的基本原理;从而宣告了博弈论的正式诞生..1944年;冯-诺依曼和摩根斯坦共着的划时代巨着博弈论与经济行为将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域;从而奠定了这一学科的基础和理论体系..1950~1951年;约翰-福布斯-纳什利用不动点定理证明了均衡点的存在;为博弈论的一般化奠定了坚实的基础..纳什的开创性论文n人博弈的均衡点1950;非合作博弈1951等等;给出了纳什均衡的概念和均衡存在定理..此外;塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用..今天博弈论已发展成一门较完善的学科..博弈论起源于研究人们玩扑克poker、象棋chess等室内游戏时的行为决策;后来作为一种研究人类经济行为的数学工具得到了充分的发展..从根本上讲;博弈论涉及到从打网球到指挥战争的任何牵扯策略的情景..博弈论提供了一种计算各种可能决策所产生效益的数学方法;该理论为在各种竞赛性场合做出最佳决定建立了一套具体的数学公式..正如经济学家赫伯特-金迪斯Herbert Gintis所说;博弈论是我们“研究世界的一种工具”..但它不仅仅是一种工具;“它不仅研究人们如何合作;而且研究人们如何竞争”..同时;“博弈论还研究行为方式的产生、转变、散播和稳定..”博弈论与纳什均衡的发展和应用博弈论不是纳什发明的;但他扩大了该理论的范围;为之提供了解决实际问题的更有力工具..在一开始;他的研究成果并没有受到人们的重视..他的文章发表在20世纪50年代;在当时博弈论仅在冷战分析家之间流传;这些分析家认为国际侵略和利益最大化之间有一些相似之处..在经济学界;博弈论还被视为一种新奇事物..经济学家萨缪-鲍尔斯Samuel Bowles告诉我说:“在当时博弈论羽翼未丰;如同经济学中其它许多优秀的思想一样;它还没有受到人们的关注..”然而在20世纪70年代时情况发生了改变;进化论学派的生物学家开始采用博弈论研究动植物中的生存竞争现象..紧接着在20世纪80年代;经济学家终于开始以各种不同方式将博弈论应用于经济学中;尤其是将它用在设计真实试验以验证经济学理论方面..到80年代末博弈论在经济学领域已经充分显示了它的作用; 这最终促成了纳什等1994年诺贝尔经济学奖的获得..早在此之前;博弈论就已经出现在许多学科的课程中..数学系、经济学系、生物学系、还有政治科学系、心理学系和社会科学系的课程中都含有博弈论的内容..到了21世纪初;博弈论的应用更为广泛;涉及到从人类学到神经生物学等多个领域..现今;经济学家继续使用博弈论分析人们如何做出有关金钱的决策;生物学家用它来建立假说以解释适者生存原理和利他主义的起源;人类学家使用它来研究原始文化;从而说明人性的多样化;神经科学者也加入了博弈论研究的行列;通过研究博弈者的大脑;试图发现决策如何反映人们的动机和情感..简言之;纳什的数学理论连同在其在其基础上建立起来的现代博弈论已经成为科学家研究众多与人类行为相关课题时的首选方法..博弈论和纳什均衡的几个经典案例智猪博弈Pigs’payoffs猪圈里有两头猪;一头大猪;一头小猪..猪圈的一边有个踏板;每踩一下踏板;在远离踏板的猪圈的另一边的投食口就会落下少量的食物..如果有一只猪去踩踏板;另一只猪就有机会抢先吃到另一边落下的食物..当小猪踩动踏板时;大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板;则还有机会在小猪吃完落下的食物之前跑到食槽;争吃到另一半残羹..那么;两只猪各会采取什么策略答案是:小猪将选择“搭便车”策略;也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间..原因何在因为;小猪踩踏板将一无所获;不踩踏板反而能吃上食物..对小猪而言;无论大猪是否踩动踏板;不踩踏板总是好的选择..反观大猪;已明知小猪是不会去踩动踏板的;自己亲自去踩踏板总比不踩强吧;所以只好亲力亲为了..枪手博弈王者的悲哀..三人对枪自决;甲乙丙枪法优劣递减..最后无奈而神奇的结局;将不取决于同时开枪还是先后开枪;最优良的枪手;倒下的概率将最高;而最蹩脚的枪手;存活的希望却最大..因为没有人会把威胁最小的枪手列为一号清楚目标..在这里;后发制人的弱势者将胜出..以弱胜强;绝不是神话..囚徒困境假设有两个小偷A和B联合犯事、私入民宅被警察抓住..警方将两人分别置于不同的两个房间内进行审讯;对每一个犯罪嫌疑人;警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行;交出了赃物;于是证据确凿;两人都被判有罪..如果另一个犯罪嫌疑人也作了坦白;则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖;则以妨碍公务罪因已有证据表明其有罪再加刑2年;而坦白者有功被减刑8年;立即释放..如果两人都抵赖;则警方因证据不足不能判两人的偷窃罪;但可以私入民宅的罪名将两人各判入狱1年..关于这个案例;显然最好的策略是双方都抵赖;结果是大家都只被判1年..但是由于两人处于隔离的情况;首先应该是从心理学的角度来看;当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当-斯密的理论;假设每个人都是“理性的经济人”;都会从利己的目的出发进行选择..这两个人都会有这样一个盘算过程:假如A坦白;B抵赖;B得坐10年监狱;B坦白最多才8年;B要是抵赖;A就可以被释放;而B会坐10年牢..综合以上几种情况考虑;不管A坦白与否;对B而言都是坦白了划算..两个人都会动这样的脑筋;最终;两个人都选择了坦白;结果都被判8年刑期..博弈论和纳什均衡的重要影响博弈论所研究的是理性的决策者之间冲突及合作的理论;可以为实际决策提供理论基础和方向指导..其最终追求结果是使博弈方达到利益最大化的均衡..在生活中;博弈仍然无处不在..博弈论代表着一种全新的分析方法和全新的思想..诺贝尔经济学奖获得者保罗-萨缪尔逊如是说:要想在现代社会做个有价值的人;你就必须对博弈论有个大致的了解也可以这样说;要想赢得生意;不可不学博弈论;要想赢得生活;同样不可不学博弈论..纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础;正如克瑞普斯Kreps;1990在博弈论和经济建模一书的引言中所说;“在过去的一二十年内;经济学在方法论以及语言、概念等方面;经历了一场温和的革命;非合作博弈理论已经成为范式的中心;在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中;现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域..”腾讯财经综合。
博弈均衡和机制设计概述解释及说明1. 引言1.1 概述博弈均衡和机制设计是博弈论和经济学中的两个重要概念,它们在分析和解决各种经济、社会和政治问题中起着关键作用。
博弈均衡是指在多方参与者之间进行策略选择时达到一种相对稳定状态的理论概念,而机制设计则是为了实现特定目标而设计出合适的规则和激励机制。
本文将对博弈均衡和机制设计进行总结、解释和说明。
1.2 文章结构本文将分为六个部分进行讨论。
首先,在引言部分对博弈均衡和机制设计进行介绍,并说明它们的关系。
接着,我们将详细探讨不同类型的博弈均衡及其特点,包括完全信息博弈和不完全信息博弈,以及纳什均衡与其他类型的博弈均衡之间的比较。
然后,我们将深入研究机制设计的原理与方法,包括契约理论在机制设计中的应用、声明式机制设计与计算式机制设计的对比分析,以及公共品和外部性问题中的机制设计策略。
接下来,我们将探讨博弈论在经济领域中的应用实例以及社会公共资源配置中的机制设计案例,并讨论机制设计在社会政策决策中的意义和作用。
最后,我们将给出结论部分对全文进行总结。
1.3 目的本文的目的是介绍和解释博弈均衡和机制设计的概念,并探讨它们之间的关系。
通过对不同类型博弈均衡及其特点、机制设计的原理与方法以及应用案例进行分析,我们希望读者能够更好地理解博弈论和机制设计,并认识到它们在经济、社会和政治问题中起到的重要作用。
同时,本文还旨在提供一些思考和启发,为相关领域研究者提供理论依据和实践指导。
2. 博弈均衡和机制设计2.1 博弈均衡的概念博弈均衡是博弈论中一个重要的概念,指的是在一个博弈过程中,各参与者通过采取最佳策略而达到的一种稳定状态。
在博弈均衡中,不存在任何一个参与者可以通过改变自己的策略来获取更好的结果,即没有人单方面改变策略可以获得更高效益。
博弈均衡可以分为纯策略均衡和混合策略均衡两种形式。
2.2 机制设计的概念机制设计是经济学中研究如何设计合适机制以实现某种特定目标或解决某个问题的理论框架。
纳什博弈论的原理与应用PDF1. 引言纳什博弈论是现代博弈论的重要分支,是由约翰·纳什提出的一种博弈理论。
其原理从博弈参与者的个体理性行为出发,研究在相互交互中如何做出最优的决策。
本文将介绍纳什博弈论的基本原理,并探讨其在实际应用中的价值。
2. 纳什均衡理论纳什均衡是纳什博弈论的核心概念,指在一个博弈中,各参与者通过做出最优的个体决策,形成了一个状态,使得任何参与者无法通过改变自身策略来获得更好的收益。
在纳什均衡下,每个参与者都做出了最优的选择,而且无人愿意改变策略。
3. 纳什博弈模型纳什博弈论通过建立博弈模型来研究博弈参与者的策略选择和收益情况。
通常,博弈模型可以用一个矩阵来表示。
例如,在一个二人零和博弈中,可以使用2x2的矩阵表示两个参与者的策略和收益。
下面是一个简单的纳什博弈模型示例:策略A 策略B策略A 2, 2 0, 3策略B 3, 0 1, 1在这个模型中,第一个数字代表玩家1的收益,第二个数字代表玩家2的收益。
例如,当两位玩家选择策略A时,玩家1会获得2的收益,玩家2也会获得2的收益。
4. 纳什均衡的寻找方式为了找到纳什均衡,需要确定博弈模型中的纳什均衡点。
常见的寻找方式有以下几种: - 支配策略法:通过比较每个参与者某个策略与其他策略的收益情况,找出支配策略,然后排除其他支配策略,最终确定均衡点。
- 线性规划法:将纳什博弈转化为线性规划问题,通过求解最优解来确定均衡点。
- 最大最小法:计算每个参与者的最大最小收益,并找出最大最小收益的策略组合。
5. 纳什博弈论的应用纳什博弈论在经济学、政治学、计算机科学等领域具有广泛的应用。
以下是一些纳什博弈论的应用实例:5.1 经济学•市场竞争:纳什博弈论可以用于研究市场竞争中不同参与者的策略选择和收益情况,从而预测市场行为和市场均衡。
•价格比较:纳什博弈论可以用于分析价格比较网站上不同卖家的策略选择,帮助消费者和卖家做出最优的决策。
纳什均衡定理:描述博弈论中的策略平衡状态第一章:引言1.1 研究背景博弈论是一门研究决策者之间互动的数学分析方法。
在博弈中,每个参与者都会制定自己的策略,希望能够最大化自己的利益。
然而,在一个复杂的博弈过程中,各个参与者之间的策略选择会相互影响,导致可能存在多种策略的组合,称为均衡状态。
纳什均衡定理正是描述了这种策略平衡状态的存在和性质。
1.2 研究目的本文旨在介绍纳什均衡定理的基本概念和原理,探讨其在博弈论中的重要性和应用。
通过深入理解纳什均衡定理,我们可以更好地分析和预测各个参与者在博弈中的行为,为决策者提供合理的策略选择。
第二章:纳什均衡定理的基本概念2.1 纳什均衡的定义纳什均衡是指在一个博弈中,每个参与者采取的策略都是最优的,即在其他参与者的策略已知的情况下,不会有任何一个参与者单方面改变自己的策略能够获得更高的收益。
换句话说,每个参与者的策略选择都是相互依赖的,不存在单独改变策略能够获得更好结果的可能。
2.2 纳什均衡的存在性纳什均衡并不总是存在于每个博弈中,它的存在性取决于博弈的性质和玩家的策略空间。
但是,在一大类博弈中,纳什均衡定理确保了至少存在一个纳什均衡。
这个定理的证明基于数学方法和最优化理论。
第三章:纳什均衡定理的重要性和应用3.1 理论研究纳什均衡定理为博弈论提供了一个重要的理论基础。
通过研究纳什均衡,我们可以深入理解博弈过程中的策略选择和决策行为。
许多经典的博弈问题,如囚徒困境、合作博弈、零和博弈等,都可以通过纳什均衡定理来分析和解决。
3.2 实际应用纳什均衡定理在经济学、政治学、社会学等领域都有广泛的应用。
在经济学中,纳什均衡被用来研究市场竞争、价格博弈等问题。
在政治学中,纳什均衡可以解释政府和个人之间的博弈和权力分配。
在社会学中,纳什均衡可以用来分析人类行为和社会规范的形成。
第四章:纳什均衡定理的扩展和改进4.1 非完全信息博弈纳什均衡定理最初是在完全信息博弈中提出的,即每个参与者都完全了解其他玩家的策略和收益函数。
纳什均衡理论与博弈论的经济解释导语:在经济学领域中,纳什均衡理论与博弈论是两个非常重要的概念,它们为我们解决各种经济问题提供了有力的工具。
本文将通过对纳什均衡理论和博弈论的解释,探讨它们在经济学中的应用和影响。
第一部分:纳什均衡理论的基本原理纳什均衡理论最早由约翰·福布斯·纳什提出,他通过对全局性决策和局部性决策的研究,提出了纳什均衡理论。
纳什均衡理论认为,在博弈过程中,当每个参与者都选择了最佳策略时,整个博弈系统将达到一个相对稳定的平衡点,即纳什均衡。
纳什均衡的基本原理可以通过一个简单的例子进行说明。
假设有两个参与者(甲和乙)参与一场博弈,分别有两种策略可供选择(策略A和策略B)。
如果甲选择策略A,乙选择策略A,它们的收益分别是10和10;如果甲选择策略A,乙选择策略B,它们的收益分别是5和20;如果甲选择策略B,乙选择策略A,它们的收益分别是20和5;如果甲选择策略B,乙选择策略B,它们的收益分别是0和0。
在这种情况下,甲乙双方最佳的选择是选择策略A,因为此时它们的收益最高。
所以,在这个例子中,策略A和策略A就是纳什均衡。
第二部分:博弈论的经济解释博弈论是研究决策者如何在相互竞争或合作的环境中做出最合理决策的一门学科。
在博弈论中,决策者被称为“玩家”,他们的选择被称为“策略”。
博弈论通过分析玩家的策略选择和相互作用的结果,揭示了决策者之间的相互影响和决策结果。
博弈论在经济学中的应用非常广泛。
它可以帮助我们分析市场竞争、资源分配、价格形成等一系列经济现象。
例如,在市场竞争中,博弈论可以帮助我们理解企业之间的策略选择和竞争结果。
在资源分配中,博弈论可以帮助我们分析个体如何在资源有限的情况下做出最优决策。
在价格形成中,博弈论可以帮助我们解释价格的形成规律和机制。
博弈论的经济解释不仅适用于市场经济,也适用于其他社会领域。
比如,在国际关系中,博弈论被广泛应用于分析国家间的决策和冲突。
两个纳什均衡解纳什均衡(Nash equilibrium)是博弈论中的一个重要概念,描述了多方参与者在无法单方面改变策略时所达到的最佳决策状态。
简单来说,如果每个参与者都已经选择了最佳策略,而且没有人有动机单独改变自己的策略,那么这种状态就被称为纳什均衡。
以下将介绍两个不同情境下的纳什均衡解。
情境一:囚徒困境囚徒困境是一种典型的博弈论情景,在这种情况下,两名犯罪嫌疑人被警方逮捕,在不互相沟通的情况下,警方给予了他们一定的定罪量刑选择。
假设两名嫌疑人分别有两种选择:合作(cooperate)和背叛(defect)。
如果两人都合作,他们会获得较轻的定罪和刑罚。
然而,如果其中一人选择了背叛,而另一人选择了合作,背叛方将获得较轻的定罪和刑罚,而合作方将面临较重的定罪和刑罚。
如果双方都选择了背叛,那么他们将分别获得相对较重的定罪和刑罚。
在这种情境下,纳什均衡解是双方选择背叛。
理由如下:- 如果A选择合作,那么B选择背叛可以得到相对较轻的定罪和刑罚。
因此,A会更倾向于选择背叛以避免较重的定罪和刑罚。
同样地,如果B选择合作,A选择背叛可以获得相对较轻的定罪和刑罚。
所以,B也会选择背叛。
- 如果A选择背叛,那么无论B选择何种策略,A都能获得相对较轻的定罪和刑罚。
同样地,如果B选择背叛,无论A选择何种策略,B都能获得相对较轻的定罪和刑罚。
情境二:价格竞争在价格竞争情境下,假设有两家公司A和B都在销售同一种产品。
他们可以独立地选择产品的价格。
两家公司的目标是最大化利润。
假设每家公司的利润函数都取决于自身价格和对方的价格。
公司A的利润函数为πA(PA,PB),公司B的利润函数为πB(PA,PB)。
其中,PA和PB分别表示A和B的价格。
理由如下:- 如果公司A选择了某个价格PA,并且公司B决定维持原先的价格PB,那么公司A的最佳策略是选择自己的价格来最大化利润。
因此,公司A的利润函数中的PA变量将达到最大值。
- 同理,如果公司B选择了某个价格PB,并且公司A决定维持原先的价格PA,那么公司B的最佳策略是选择自己的价格来最大化利润。
这不仅仅是一篇有关《纳什均衡与博弈论》的读书报告,同时也是有关《美丽心灵》的一篇观后感和对约翰纳什的无限礼赞。
在中国经济学界有一句名言:棍棒打不垮经济理论。
现代经济学从亚当•斯密(按照今天的翻译应该是亚当•史密斯,但是斯密这个翻译已经深入人心,所以不做修改)奠定基础以来,更多的时候给人的感觉应该是较为抽象的规律,而不是数学知识——虽然当代诺贝尔经济学奖大部分都给数学家得了去,也算是弥补了诺贝尔奖没有数学奖项的空缺吧。
但是却又不得不承认经济学似乎和精确不容有误的数学关系依然不大,至少相对于物理这样的学科。
在博弈论成熟以前,经济学理论还是普遍规律,但是始终不能像数学那样精确。
《纳什均衡与博弈论》开篇曾提到过,很多人,包括一些学者都认为经济学是一门很愚蠢的学科,因为在它长篇累牍的理论中始终缺乏应有的精确和公理——现在也没人能预测明天哪一支股票会暴涨。
即使如此,它的规律依旧不能有误,也无法违反,这一点明朝和清朝失败的经济政策就足以说明问题,所以说棍棒打不垮经济理论。
根据约翰纳什的个人传记片、2001年奥斯卡最佳电影《美丽心灵》中的叙述,亚当斯密的经济理论足足维持了150年之久,而打破它的正是纳什建立的博弈论模型——纳什均衡。
《纳什均衡与博弈论》中提到,斯密相信政府对商业的干预——不管是支持还是限制——都会损害正常的自由企业的利益,通过消除优待和限制,明了简单的天赋自由系统会自主地建立起来。
这也正是亚当斯密的“看不见的手”(又称为无形之手)理论。
在斯密看来,只要政府不对经济进行干涉,经济社会自然而然会自发地向着一个好的方向发展。
我曾经咨询过我的两位高中时读文科的室友,在高中政治对经济学的表述中,始终坚持“经济是政治的基础,政治是经济的集中表现”,这一点和斯密的观点是背道而驰的——事实上,中国一直缺少真正意义上的经济学人才或许也是因此。
亚当斯密在他那本传世巨著《国富论》中表明了他的态度:推崇自由资本主义和强调个人利益。