博弈论纳什均衡存在定理_的两种证明方法的分析及设想_张莉
- 格式:pdf
- 大小:83.40 KB
- 文档页数:2
博弈论和纳什均衡Revised on July 13, 2021 at 16:25 pm关于博弈论和纳什均衡你应该知道这些美股腾讯财经微博2015-05-25 10:05我要分享139摘要纳什在与命运的博弈中找到均衡;纪念大师最好的方式就是尝试了解博弈论..腾讯财经综合报道风生奥斯卡获奖电影美丽心灵主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸;两人均不幸遇难..事发当时;这辆出租车失控撞向栏杆;两人均被抛出车外..约翰-纳什因发表两篇关于非合作博弈论的重要论文;彻底改变了人们对竞争和市场的看法..他证明了非合作博弈及其均衡解;并证明了均衡解的存在性;即着名的纳什均衡..不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生;曾在麻省理工学院任教;晚年为普林斯顿大学担任数学系教授;死前与82岁妻子艾丽西亚在普林斯顿居住..纳什以研究博弈论闻名;1994年获颁诺贝尔经济学奖..他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域..纳什在数学领域上取得多项突破;但他同时深受精神分裂症困扰;其生平故事在2001年被改编成电影美丽心灵;赢得包括最佳电影在内的4项奥斯卡奖项..尽管西维亚-纳萨斯Sylvia Nasars广为人知的小说美丽心灵A Beautiful Mind和改编自该书的、由拉塞尔-克罗Russell Crowe主演的同名奥斯卡电影探究了纳什错综复杂的生平;但都没有深入挖掘他的数学思想..他的数学成果依然不被大众所熟知..在当今科学界;人们普遍认为;与牛顿和爱因斯坦的数学理论相比;纳什的数学理论触及到的学科更多..牛顿和爱因斯坦的数学旨在处理物理问题;而纳什的数学却可以应用在生物学和社会学领域..如若不是精神疾病的困扰;纳什今天可能已与那些科学伟人齐名..尽管如此;他在几个数学领域的重要贡献大家有目共睹..他最大的成就来自于经济学方面..由于他在博弈论上的开创性成就;他与约翰海萨尼John Harsanyi和莱茵哈德-泽尔腾Reinhard Selten一起获得了1994年诺贝尔经济学奖..什么是博弈论与纳什均衡博弈论 :亦名“对策论”、“赛局理论”;属应用数学的一个分支;主要研究公式化了的激励结构间的相互作用..是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题;具有斗争或竞争性质现象的数学理论和方法..也是运筹学的一个重要学科..博弈论考虑游戏中的个体的预测行为和实际行为;并研究它们的优化策略..纳什均衡:又称为非合作博弈均衡;是博弈论的一个重要术语;以约翰-纳什命名..假设有n人局中人参与博弈;给定其他人策略的条件下;每个局中人选择自己的最优策略个人最优策略可能依赖于也可能不依赖于他人的战略;从而使自己利益最大化..所有局中人策略构成一个策略组合..纳什均衡指的是这样一种战略组合;这种策略组合由所有参与人最优策略组成..即在给定别人策略的情况下;没有人有足够理由打破这种均衡..纳什均衡;从实质上说;是一种非合作博弈状态..近代对于博弈论的研究;开始于策墨咯;波雷尔及冯-诺伊曼..1928年;冯-诺依曼证明了博弈论的基本原理;从而宣告了博弈论的正式诞生..1944年;冯-诺依曼和摩根斯坦共着的划时代巨着博弈论与经济行为将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域;从而奠定了这一学科的基础和理论体系..1950~1951年;约翰-福布斯-纳什利用不动点定理证明了均衡点的存在;为博弈论的一般化奠定了坚实的基础..纳什的开创性论文n人博弈的均衡点1950;非合作博弈1951等等;给出了纳什均衡的概念和均衡存在定理..此外;塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用..今天博弈论已发展成一门较完善的学科..博弈论起源于研究人们玩扑克poker、象棋chess等室内游戏时的行为决策;后来作为一种研究人类经济行为的数学工具得到了充分的发展..从根本上讲;博弈论涉及到从打网球到指挥战争的任何牵扯策略的情景..博弈论提供了一种计算各种可能决策所产生效益的数学方法;该理论为在各种竞赛性场合做出最佳决定建立了一套具体的数学公式..正如经济学家赫伯特-金迪斯Herbert Gintis所说;博弈论是我们“研究世界的一种工具”..但它不仅仅是一种工具;“它不仅研究人们如何合作;而且研究人们如何竞争”..同时;“博弈论还研究行为方式的产生、转变、散播和稳定..”博弈论与纳什均衡的发展和应用博弈论不是纳什发明的;但他扩大了该理论的范围;为之提供了解决实际问题的更有力工具..在一开始;他的研究成果并没有受到人们的重视..他的文章发表在20世纪50年代;在当时博弈论仅在冷战分析家之间流传;这些分析家认为国际侵略和利益最大化之间有一些相似之处..在经济学界;博弈论还被视为一种新奇事物..经济学家萨缪-鲍尔斯Samuel Bowles告诉我说:“在当时博弈论羽翼未丰;如同经济学中其它许多优秀的思想一样;它还没有受到人们的关注..”然而在20世纪70年代时情况发生了改变;进化论学派的生物学家开始采用博弈论研究动植物中的生存竞争现象..紧接着在20世纪80年代;经济学家终于开始以各种不同方式将博弈论应用于经济学中;尤其是将它用在设计真实试验以验证经济学理论方面..到80年代末博弈论在经济学领域已经充分显示了它的作用; 这最终促成了纳什等1994年诺贝尔经济学奖的获得..早在此之前;博弈论就已经出现在许多学科的课程中..数学系、经济学系、生物学系、还有政治科学系、心理学系和社会科学系的课程中都含有博弈论的内容..到了21世纪初;博弈论的应用更为广泛;涉及到从人类学到神经生物学等多个领域..现今;经济学家继续使用博弈论分析人们如何做出有关金钱的决策;生物学家用它来建立假说以解释适者生存原理和利他主义的起源;人类学家使用它来研究原始文化;从而说明人性的多样化;神经科学者也加入了博弈论研究的行列;通过研究博弈者的大脑;试图发现决策如何反映人们的动机和情感..简言之;纳什的数学理论连同在其在其基础上建立起来的现代博弈论已经成为科学家研究众多与人类行为相关课题时的首选方法..博弈论和纳什均衡的几个经典案例智猪博弈Pigs’payoffs猪圈里有两头猪;一头大猪;一头小猪..猪圈的一边有个踏板;每踩一下踏板;在远离踏板的猪圈的另一边的投食口就会落下少量的食物..如果有一只猪去踩踏板;另一只猪就有机会抢先吃到另一边落下的食物..当小猪踩动踏板时;大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板;则还有机会在小猪吃完落下的食物之前跑到食槽;争吃到另一半残羹..那么;两只猪各会采取什么策略答案是:小猪将选择“搭便车”策略;也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间..原因何在因为;小猪踩踏板将一无所获;不踩踏板反而能吃上食物..对小猪而言;无论大猪是否踩动踏板;不踩踏板总是好的选择..反观大猪;已明知小猪是不会去踩动踏板的;自己亲自去踩踏板总比不踩强吧;所以只好亲力亲为了..枪手博弈王者的悲哀..三人对枪自决;甲乙丙枪法优劣递减..最后无奈而神奇的结局;将不取决于同时开枪还是先后开枪;最优良的枪手;倒下的概率将最高;而最蹩脚的枪手;存活的希望却最大..因为没有人会把威胁最小的枪手列为一号清楚目标..在这里;后发制人的弱势者将胜出..以弱胜强;绝不是神话..囚徒困境假设有两个小偷A和B联合犯事、私入民宅被警察抓住..警方将两人分别置于不同的两个房间内进行审讯;对每一个犯罪嫌疑人;警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行;交出了赃物;于是证据确凿;两人都被判有罪..如果另一个犯罪嫌疑人也作了坦白;则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖;则以妨碍公务罪因已有证据表明其有罪再加刑2年;而坦白者有功被减刑8年;立即释放..如果两人都抵赖;则警方因证据不足不能判两人的偷窃罪;但可以私入民宅的罪名将两人各判入狱1年..关于这个案例;显然最好的策略是双方都抵赖;结果是大家都只被判1年..但是由于两人处于隔离的情况;首先应该是从心理学的角度来看;当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当-斯密的理论;假设每个人都是“理性的经济人”;都会从利己的目的出发进行选择..这两个人都会有这样一个盘算过程:假如A坦白;B抵赖;B得坐10年监狱;B坦白最多才8年;B要是抵赖;A就可以被释放;而B会坐10年牢..综合以上几种情况考虑;不管A坦白与否;对B而言都是坦白了划算..两个人都会动这样的脑筋;最终;两个人都选择了坦白;结果都被判8年刑期..博弈论和纳什均衡的重要影响博弈论所研究的是理性的决策者之间冲突及合作的理论;可以为实际决策提供理论基础和方向指导..其最终追求结果是使博弈方达到利益最大化的均衡..在生活中;博弈仍然无处不在..博弈论代表着一种全新的分析方法和全新的思想..诺贝尔经济学奖获得者保罗-萨缪尔逊如是说:要想在现代社会做个有价值的人;你就必须对博弈论有个大致的了解也可以这样说;要想赢得生意;不可不学博弈论;要想赢得生活;同样不可不学博弈论..纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础;正如克瑞普斯Kreps;1990在博弈论和经济建模一书的引言中所说;“在过去的一二十年内;经济学在方法论以及语言、概念等方面;经历了一场温和的革命;非合作博弈理论已经成为范式的中心;在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中;现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域..”腾讯财经综合。
博弈均衡和机制设计概述解释及说明1. 引言1.1 概述博弈均衡和机制设计是博弈论和经济学中的两个重要概念,它们在分析和解决各种经济、社会和政治问题中起着关键作用。
博弈均衡是指在多方参与者之间进行策略选择时达到一种相对稳定状态的理论概念,而机制设计则是为了实现特定目标而设计出合适的规则和激励机制。
本文将对博弈均衡和机制设计进行总结、解释和说明。
1.2 文章结构本文将分为六个部分进行讨论。
首先,在引言部分对博弈均衡和机制设计进行介绍,并说明它们的关系。
接着,我们将详细探讨不同类型的博弈均衡及其特点,包括完全信息博弈和不完全信息博弈,以及纳什均衡与其他类型的博弈均衡之间的比较。
然后,我们将深入研究机制设计的原理与方法,包括契约理论在机制设计中的应用、声明式机制设计与计算式机制设计的对比分析,以及公共品和外部性问题中的机制设计策略。
接下来,我们将探讨博弈论在经济领域中的应用实例以及社会公共资源配置中的机制设计案例,并讨论机制设计在社会政策决策中的意义和作用。
最后,我们将给出结论部分对全文进行总结。
1.3 目的本文的目的是介绍和解释博弈均衡和机制设计的概念,并探讨它们之间的关系。
通过对不同类型博弈均衡及其特点、机制设计的原理与方法以及应用案例进行分析,我们希望读者能够更好地理解博弈论和机制设计,并认识到它们在经济、社会和政治问题中起到的重要作用。
同时,本文还旨在提供一些思考和启发,为相关领域研究者提供理论依据和实践指导。
2. 博弈均衡和机制设计2.1 博弈均衡的概念博弈均衡是博弈论中一个重要的概念,指的是在一个博弈过程中,各参与者通过采取最佳策略而达到的一种稳定状态。
在博弈均衡中,不存在任何一个参与者可以通过改变自己的策略来获取更好的结果,即没有人单方面改变策略可以获得更高效益。
博弈均衡可以分为纯策略均衡和混合策略均衡两种形式。
2.2 机制设计的概念机制设计是经济学中研究如何设计合适机制以实现某种特定目标或解决某个问题的理论框架。
纳什博弈论的原理与应用PDF1. 引言纳什博弈论是现代博弈论的重要分支,是由约翰·纳什提出的一种博弈理论。
其原理从博弈参与者的个体理性行为出发,研究在相互交互中如何做出最优的决策。
本文将介绍纳什博弈论的基本原理,并探讨其在实际应用中的价值。
2. 纳什均衡理论纳什均衡是纳什博弈论的核心概念,指在一个博弈中,各参与者通过做出最优的个体决策,形成了一个状态,使得任何参与者无法通过改变自身策略来获得更好的收益。
在纳什均衡下,每个参与者都做出了最优的选择,而且无人愿意改变策略。
3. 纳什博弈模型纳什博弈论通过建立博弈模型来研究博弈参与者的策略选择和收益情况。
通常,博弈模型可以用一个矩阵来表示。
例如,在一个二人零和博弈中,可以使用2x2的矩阵表示两个参与者的策略和收益。
下面是一个简单的纳什博弈模型示例:策略A 策略B策略A 2, 2 0, 3策略B 3, 0 1, 1在这个模型中,第一个数字代表玩家1的收益,第二个数字代表玩家2的收益。
例如,当两位玩家选择策略A时,玩家1会获得2的收益,玩家2也会获得2的收益。
4. 纳什均衡的寻找方式为了找到纳什均衡,需要确定博弈模型中的纳什均衡点。
常见的寻找方式有以下几种: - 支配策略法:通过比较每个参与者某个策略与其他策略的收益情况,找出支配策略,然后排除其他支配策略,最终确定均衡点。
- 线性规划法:将纳什博弈转化为线性规划问题,通过求解最优解来确定均衡点。
- 最大最小法:计算每个参与者的最大最小收益,并找出最大最小收益的策略组合。
5. 纳什博弈论的应用纳什博弈论在经济学、政治学、计算机科学等领域具有广泛的应用。
以下是一些纳什博弈论的应用实例:5.1 经济学•市场竞争:纳什博弈论可以用于研究市场竞争中不同参与者的策略选择和收益情况,从而预测市场行为和市场均衡。
•价格比较:纳什博弈论可以用于分析价格比较网站上不同卖家的策略选择,帮助消费者和卖家做出最优的决策。
纳什均衡定理:描述博弈论中的策略平衡状态第一章:引言1.1 研究背景博弈论是一门研究决策者之间互动的数学分析方法。
在博弈中,每个参与者都会制定自己的策略,希望能够最大化自己的利益。
然而,在一个复杂的博弈过程中,各个参与者之间的策略选择会相互影响,导致可能存在多种策略的组合,称为均衡状态。
纳什均衡定理正是描述了这种策略平衡状态的存在和性质。
1.2 研究目的本文旨在介绍纳什均衡定理的基本概念和原理,探讨其在博弈论中的重要性和应用。
通过深入理解纳什均衡定理,我们可以更好地分析和预测各个参与者在博弈中的行为,为决策者提供合理的策略选择。
第二章:纳什均衡定理的基本概念2.1 纳什均衡的定义纳什均衡是指在一个博弈中,每个参与者采取的策略都是最优的,即在其他参与者的策略已知的情况下,不会有任何一个参与者单方面改变自己的策略能够获得更高的收益。
换句话说,每个参与者的策略选择都是相互依赖的,不存在单独改变策略能够获得更好结果的可能。
2.2 纳什均衡的存在性纳什均衡并不总是存在于每个博弈中,它的存在性取决于博弈的性质和玩家的策略空间。
但是,在一大类博弈中,纳什均衡定理确保了至少存在一个纳什均衡。
这个定理的证明基于数学方法和最优化理论。
第三章:纳什均衡定理的重要性和应用3.1 理论研究纳什均衡定理为博弈论提供了一个重要的理论基础。
通过研究纳什均衡,我们可以深入理解博弈过程中的策略选择和决策行为。
许多经典的博弈问题,如囚徒困境、合作博弈、零和博弈等,都可以通过纳什均衡定理来分析和解决。
3.2 实际应用纳什均衡定理在经济学、政治学、社会学等领域都有广泛的应用。
在经济学中,纳什均衡被用来研究市场竞争、价格博弈等问题。
在政治学中,纳什均衡可以解释政府和个人之间的博弈和权力分配。
在社会学中,纳什均衡可以用来分析人类行为和社会规范的形成。
第四章:纳什均衡定理的扩展和改进4.1 非完全信息博弈纳什均衡定理最初是在完全信息博弈中提出的,即每个参与者都完全了解其他玩家的策略和收益函数。
纳什均衡理论与博弈论的经济解释导语:在经济学领域中,纳什均衡理论与博弈论是两个非常重要的概念,它们为我们解决各种经济问题提供了有力的工具。
本文将通过对纳什均衡理论和博弈论的解释,探讨它们在经济学中的应用和影响。
第一部分:纳什均衡理论的基本原理纳什均衡理论最早由约翰·福布斯·纳什提出,他通过对全局性决策和局部性决策的研究,提出了纳什均衡理论。
纳什均衡理论认为,在博弈过程中,当每个参与者都选择了最佳策略时,整个博弈系统将达到一个相对稳定的平衡点,即纳什均衡。
纳什均衡的基本原理可以通过一个简单的例子进行说明。
假设有两个参与者(甲和乙)参与一场博弈,分别有两种策略可供选择(策略A和策略B)。
如果甲选择策略A,乙选择策略A,它们的收益分别是10和10;如果甲选择策略A,乙选择策略B,它们的收益分别是5和20;如果甲选择策略B,乙选择策略A,它们的收益分别是20和5;如果甲选择策略B,乙选择策略B,它们的收益分别是0和0。
在这种情况下,甲乙双方最佳的选择是选择策略A,因为此时它们的收益最高。
所以,在这个例子中,策略A和策略A就是纳什均衡。
第二部分:博弈论的经济解释博弈论是研究决策者如何在相互竞争或合作的环境中做出最合理决策的一门学科。
在博弈论中,决策者被称为“玩家”,他们的选择被称为“策略”。
博弈论通过分析玩家的策略选择和相互作用的结果,揭示了决策者之间的相互影响和决策结果。
博弈论在经济学中的应用非常广泛。
它可以帮助我们分析市场竞争、资源分配、价格形成等一系列经济现象。
例如,在市场竞争中,博弈论可以帮助我们理解企业之间的策略选择和竞争结果。
在资源分配中,博弈论可以帮助我们分析个体如何在资源有限的情况下做出最优决策。
在价格形成中,博弈论可以帮助我们解释价格的形成规律和机制。
博弈论的经济解释不仅适用于市场经济,也适用于其他社会领域。
比如,在国际关系中,博弈论被广泛应用于分析国家间的决策和冲突。
两个纳什均衡解纳什均衡(Nash equilibrium)是博弈论中的一个重要概念,描述了多方参与者在无法单方面改变策略时所达到的最佳决策状态。
简单来说,如果每个参与者都已经选择了最佳策略,而且没有人有动机单独改变自己的策略,那么这种状态就被称为纳什均衡。
以下将介绍两个不同情境下的纳什均衡解。
情境一:囚徒困境囚徒困境是一种典型的博弈论情景,在这种情况下,两名犯罪嫌疑人被警方逮捕,在不互相沟通的情况下,警方给予了他们一定的定罪量刑选择。
假设两名嫌疑人分别有两种选择:合作(cooperate)和背叛(defect)。
如果两人都合作,他们会获得较轻的定罪和刑罚。
然而,如果其中一人选择了背叛,而另一人选择了合作,背叛方将获得较轻的定罪和刑罚,而合作方将面临较重的定罪和刑罚。
如果双方都选择了背叛,那么他们将分别获得相对较重的定罪和刑罚。
在这种情境下,纳什均衡解是双方选择背叛。
理由如下:- 如果A选择合作,那么B选择背叛可以得到相对较轻的定罪和刑罚。
因此,A会更倾向于选择背叛以避免较重的定罪和刑罚。
同样地,如果B选择合作,A选择背叛可以获得相对较轻的定罪和刑罚。
所以,B也会选择背叛。
- 如果A选择背叛,那么无论B选择何种策略,A都能获得相对较轻的定罪和刑罚。
同样地,如果B选择背叛,无论A选择何种策略,B都能获得相对较轻的定罪和刑罚。
情境二:价格竞争在价格竞争情境下,假设有两家公司A和B都在销售同一种产品。
他们可以独立地选择产品的价格。
两家公司的目标是最大化利润。
假设每家公司的利润函数都取决于自身价格和对方的价格。
公司A的利润函数为πA(PA,PB),公司B的利润函数为πB(PA,PB)。
其中,PA和PB分别表示A和B的价格。
理由如下:- 如果公司A选择了某个价格PA,并且公司B决定维持原先的价格PB,那么公司A的最佳策略是选择自己的价格来最大化利润。
因此,公司A的利润函数中的PA变量将达到最大值。
- 同理,如果公司B选择了某个价格PB,并且公司A决定维持原先的价格PA,那么公司B的最佳策略是选择自己的价格来最大化利润。
这不仅仅是一篇有关《纳什均衡与博弈论》的读书报告,同时也是有关《美丽心灵》的一篇观后感和对约翰纳什的无限礼赞。
在中国经济学界有一句名言:棍棒打不垮经济理论。
现代经济学从亚当•斯密(按照今天的翻译应该是亚当•史密斯,但是斯密这个翻译已经深入人心,所以不做修改)奠定基础以来,更多的时候给人的感觉应该是较为抽象的规律,而不是数学知识——虽然当代诺贝尔经济学奖大部分都给数学家得了去,也算是弥补了诺贝尔奖没有数学奖项的空缺吧。
但是却又不得不承认经济学似乎和精确不容有误的数学关系依然不大,至少相对于物理这样的学科。
在博弈论成熟以前,经济学理论还是普遍规律,但是始终不能像数学那样精确。
《纳什均衡与博弈论》开篇曾提到过,很多人,包括一些学者都认为经济学是一门很愚蠢的学科,因为在它长篇累牍的理论中始终缺乏应有的精确和公理——现在也没人能预测明天哪一支股票会暴涨。
即使如此,它的规律依旧不能有误,也无法违反,这一点明朝和清朝失败的经济政策就足以说明问题,所以说棍棒打不垮经济理论。
根据约翰纳什的个人传记片、2001年奥斯卡最佳电影《美丽心灵》中的叙述,亚当斯密的经济理论足足维持了150年之久,而打破它的正是纳什建立的博弈论模型——纳什均衡。
《纳什均衡与博弈论》中提到,斯密相信政府对商业的干预——不管是支持还是限制——都会损害正常的自由企业的利益,通过消除优待和限制,明了简单的天赋自由系统会自主地建立起来。
这也正是亚当斯密的“看不见的手”(又称为无形之手)理论。
在斯密看来,只要政府不对经济进行干涉,经济社会自然而然会自发地向着一个好的方向发展。
我曾经咨询过我的两位高中时读文科的室友,在高中政治对经济学的表述中,始终坚持“经济是政治的基础,政治是经济的集中表现”,这一点和斯密的观点是背道而驰的——事实上,中国一直缺少真正意义上的经济学人才或许也是因此。
亚当斯密在他那本传世巨著《国富论》中表明了他的态度:推崇自由资本主义和强调个人利益。
纯策略纳什均衡纯策略纳什均衡(Pure Strategy Nash Equilibrium)[编辑]什么是纯策略纳什均衡纯策略纳什均衡是指在一个纯策略组合中,如果给定其他的策略不变,该节点不会单方面改变自己的策略,否则不会使节点访问代价变小。
[编辑]存在纯策略纳什均衡的有限次重复博弈[1]如果重复博弈中有惟一纯策略纳什均衡,那么我们怎么找出它的纯策略纳什均衡呢?首先看下面囚徒的困境的博弈的例子:我们现在考虑该博弈重复两次的重复博弈,这可以理解成给囚徒两次坦白机会,最后的得益是两个阶段博弈中各自得益之和.在两次博弈过程中,双方知道第一次博弈的结果再进行二次博弈.用逆推归纳法来分析,先分析第二阶段,也就是第二次重复时两博弈方的选择.很明显,这个第二阶段仍然是两囚徒之间的一个囚徒的困境博弈,此时前一阶段的结果已成为既成事实,此后又不再有任何的后续阶段,因此实现自身当前的最大利益是两博弈方在该阶段决策中的惟一原则.因此我们不难得出结论,不管前一次的博弈得到的结果如何,第二阶段的惟一结果就是原博弈惟一的纳什均衡(坦白,坦白),双方得益(-5,-5).现在再回到第一阶段,即第一次博弈.理性的博弈方在第一阶段就对后一阶段的结局非常清楚,知道第二阶段的结果必然是(坦白,坦白),因此不管第一阶段的博弈结果是什么,双方在整个重复博弈中的最终得益,都将是第一阶段的基础上各加-5.因此从第一阶段的选择来看,这个重复博弈与图l中得益矩阵表示的一次性博弈实际上是完全等价的.于是我们可以得出惟一纯策略均衡的有限次重复博弈的结果就是重复原博弈惟一的纯策略纳什均衡,这就是这种重复博弈惟一的子博弈完美纳什均衡路径.如果重复博弈中有多个纯策略纳什均衡,设某一市场有两个生产同样质量产品的厂商,他们对产品的定价同有高(H)、中(M)、低(L)三种可能.设高价时市场总利润为10个单位,中价时市场总利润为6个单位,低价时市场总利润为2个单位.再假设两厂商同时决定价格,价格不等时低价格者独享利润,价格相等时双方平分利润.这时候两厂商对价格的选择就构成了一个静态博弈问题.我们看一个三价博弈的重复博弈的例子:显然,这个得益矩阵有两个纯策略纳什均衡(M,M)和(L,L),我们也可以看出实际上两博弈方最大的得益是策略组合(H,H),但是它并不是纳什均衡.现在考虑重复两次该博弈,我们采用一种触发策略(Trigger Strategy):博弈双方首先试图合作,一旦发觉对方不合作也用不合作相报复的策略.使得在第一阶段采用(H,H)成为子博弈完美纳什均衡,其双方的策略是这样的:博弈方1:第一次选H;如果第一次结果为(H,H),则第二次选M,如果第一次结果为任何其他策略组合,则第二次选择L.博弈方2:同博弈方1.在上述双方策略组合下,两次重复博弈的路径一定为第一阶段(H,H),第二阶段(M,M),这是一个子博弈完美纳什均衡路径.因为第二阶段是一个原博弈的纳什均衡,因此不可能有哪一方愿意单独偏离;其次,第一阶段的(H,H)虽然不是原来的博弈纳什均衡,但是如果一方单独偏离,采用M能增加1单位得益,这样的后果却是第二阶段至少要损失2单位的得益,因为双方采用的是触发策略,即有报复机制的策略,因此合理的选择是坚持H.这就说明了上述策略组合是这个两次重复博弈的子博弈完美纳什均衡.从上述的例子我们可以看出,有多个纯策略纳什均衡的博弈重复两次的子博弈完美纳什均衡路径是,第一阶段采用(H,H),第二阶段采用原博弈的纳什均衡(M,M).如果这个重复博弈重复三次,或者更多次,结论也是相似的,仍然用触发策略,它的子博弈完美纳什均衡路径为除了最后一次以外,每次都采用(H,H),最后一次采用原博弈的纳什均衡(M,M).[编辑]存在纯策略纳什均衡的无限次重复博弈[1]与有限次重复博弈一样,无限次重复博弈也是基本博弈的简单重复,但是无限次重复博弈没有最后一次重复,因此无限次重复博弈与有限次有一些不同.任何博弈中博弈方策略选择的依据都是得益的大小,这在重复博弈中仍然是成立的.但是重复博弈又与一次性博弈有所不同,因为在重复博弈中,每一阶段都是一个博弈,并且各博弈方都有得益,因此对于重复博弈,我们要计算的就是博弈结束时的一个总的得益.由于前一次博弈和后一次博弈之间会有损失,因此我们采用一种方法,就是将后一阶段的得益折算成当前阶段得益的(现在值)的贴现系数δ.有了贴现系数δ,那么在无限次重复博弈中,某博弈方各阶段得益为π1,π2,...,则该博弈方总得益的现在值为:对于存在惟一纯策略纳什均衡博弈的无限次重复博弈,我们从下面的例子来看:其中博弈方1和博弈方2分别表示两个厂商,H 和L分别表示高价和低价.显然,该博弈的一次性博弈有惟一的纯策略纳什均衡(L,L),但是这个纳什均衡并不是最佳策略组合,因为策略组合(H,H)的得益(4,4)比(1,1)要高的多.但是由于(H,H)不是该博弈的纳什均衡,所以在一次性博弈中不会被采用.根据上面的分析,此博弈在有限次重复博弈并不能实现潜在的合作利益,两博弈方在每次重复中都不会采用效率较高的(H,H).为了实现效率较高的合作利益(H,H),假设两博弈方都采用触发策略,也即报复性策略:第一阶段采用H,在第t阶段,如果前t-l阶段的结果都是(H,H),则继续采用L.假设博弈方1已经采用了这种策略,现在我们来确定博弈方2在第一阶段的最优选择.如果博弈方2采用L,那么在第一阶段能得到5,但这样会引起博弈方1一直采用L的报复,自己也只能一直采用L,得益将永远为1,总得益的现在值为如果博弈方2采用H,则在第一阶段他将得4,下一阶段又面临同样的选择.若记V为博弈方2在该重复博弈中每阶段都采用最佳选择的总得益现在值,那么从第二阶段开始的无限次重复博弈因为与从第一阶段开始的只差一阶段,因而在无限次重复时可看作相同的,其总得益的现在值折算成第一阶段的得益为,因此当第一阶段的最佳选择是H时,整个无限次重复博弈总得益的现在值为或者因此,当解得时,博弈方2会采用H策略,否则会采用L策略.也就是说当时,博弈方2对博弈方1触发策略的最佳反应是第一阶段采用H.这时我们就说双方采用上述触发策略是一个纳什均衡.于是我们得出,在有限次重复博弈中,惟一纯策略纳什均衡不能实现最大得益(H,H),而在无限次重复博弈中,通过触发策略却可以实现(H,H)。
纳什博弈论的原理与应用纳什博弈论的原理与应用1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争 和市场的看法。
他证明了非合作博弈及其均衡解,并证明了均衡解的存在性, 即著名的纳什 均衡。
从而揭示了博弈均衡与经济均衡的内在联系。
纳什的研究奠定了现代非合作博弈论的 基石,后来的博弈论研究基本上都沿着这条主线展开的。
然而,纳什天才的发现却遭到冯 诺 依曼的断然否 定,在此之前他还受到爱因斯坦的冷遇。
但是骨子里挑战权威、藐视权威的 本性,使纳什坚持了自己的观点,终成一代大师。
要不是 30多年的严重精神病折磨,恐怕他早已站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。
纳什是一个非常天才的数学家, 他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。
然而,他的天才发现---非合作博弈的均衡,即”纳什均衡"并不是一帆风顺的。
1948年纳 什到普林斯顿大学读数学系的博士。
那一年他还不到 20岁。
当时普林斯顿可谓人杰地灵,大师如云。
爱因斯坦、冯 诺依曼、列夫谢茨(数学系主任)、阿尔伯特 塔克、阿伦佐 切奇、 哈罗德 库恩、诺尔曼 斯蒂恩罗德、埃尔夫 福克斯……等全都在这里。
博弈论主要是由冯 诺 依曼(1903-1957)创所立的。
他是一位出生于匈牙利的天才的数学家。
他不仅创立了经济博弈 论,而且发明了计算机。
早在 20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯诺伊曼已经开 始研究博弈的准确的数学表达,直到 1939年,冯 诺依曼遇到经济学家奥斯卡 摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。
1944年他与奥斯 卡 摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步 形成。
尽管对具有博弈性质的问题的研究可以追溯到 19世纪甚至更早。
例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量 与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取 胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性, 很不 系统。
博弈困境的两种解决方案分析纳什均衡(Nash Equilibrium)概念的提出和存在性证明奠定了博弈论这门学科的基础,为理解和预测人们在策略互动中的行为提供了强而有力的工具。
但是,随着博弈论的发展,人们普遍意识到,甚至通过实验研究也发现,在有些博弈中,纳什均衡所预测的博弈结果并不符合人们的直观和各种实验研究的结果。
人们把这些纳什均衡与直观或现实严重冲突的博弈称为博弈困境,著名的例子有囚徒困境(Prisoner s Dilemma)、旅行者困境(Traveler s Dilemma)、蜈蚣博弈(Centipede Game)、纳什讨价还价问题(Nash bargaining problem)、伯川德悖论(Bertrand competition)、公共物品供给博弈(Public Good Game)、最后通牒博弈(Ultimatum Game)和独裁者博弈(Dictator Game)等。
旅行者困境是由著名经济学家Kaushik Basu于1994年提出来的博弈中的一个新的困境。
正如他本人所说:旅行者困境是一个特殊的并且令人信服的悖论,在这里,无情的博弈论理性和直觉观念无法保持一致。
该困境融合了以往困境中具有代表性的一些主要特征,从而使博弈论中的根本问题更为集中地得到展现。
旅行者困境的发现和提出,立刻引起了学术界的广泛关注,国际上不少博弈论学家和逻辑学家从理论和实验两个方面分别展开研究。
与此相反,国内学者虽然对一般意义上的博弈困境及其产生原因已有所关注,但是对针对博弈困境的各种解决方案缺乏细致而深入的学理分析和研究。
对解决方案的深入研究可以加深我们对人类社会中各种博弈困境的理解的同时,有助于寻找新的理论和现实解决方案,还可以避免对博弈论泛泛而谈的批评和指责。
本文以旅行者困境为例,对Halpern Pass提出的重复后悔度极小化模型和Capraro提出的基于联盟与合作的概率推理模型两种方案进行分析比较,以窥它们是如何成功地解释和预测旅行者困境中选手实际博弈行为的,并分析这两种方案各自存在的问题。
纳什均衡求解方法纳什均衡是博弈论中的一个重要概念,用于描述多方参与的博弈中的一种均衡状态。
纳什均衡是指在每个参与者都选择了最优策略的情况下,无法通过改变单个参与者的策略来获得更好结果的状态。
为了求解纳什均衡,我们需要用到不同的方法,其中较为常用的有策略消去法、支配消去法和极小化极大值法。
接下来,我将详细介绍这些方法。
首先是策略消去法。
该方法适用于有限个数的参与者的纳什均衡求解。
具体步骤如下:1. 首先,根据博弈的规则和参与者可选择的策略,列出博弈矩阵。
2. 对于每个参与者,分别找出其在其他参与者选择各种策略时的最优策略。
这意味着参与者会考虑其他参与者的策略,并选择对自己最有利的策略。
3. 通过逐步消去各个参与者的非最优策略,最终得到仅剩最优策略的结果。
这就是纳什均衡点。
接下来是支配消去法。
该方法同样适用于有限个数的参与者的纳什均衡求解。
具体步骤如下:1. 根据博弈的规则和参与者可选择的策略,列出博弈矩阵。
2. 找出矩阵中的支配策略。
支配策略是指某个参与者在某种策略下的支付结果总是大于其他所有策略。
3. 将支配策略剔除,并将博弈矩阵缩小。
4. 重复步骤2和3,直到无法找到支配策略为止。
5. 最终剩下的策略组合就是纳什均衡点。
最后是极小化极大值法。
该方法适用于含有两个参与者的博弈求解。
具体步骤如下:1. 根据博弈的规则和参与者可选择的策略,列出博弈矩阵。
2. 将一个参与者的策略固定,求另一个参与者对应策略下的最大值。
3. 在最大值中选择最小值,并记录该最小值对应的策略。
4. 交换参与者的角色,重复步骤2和3。
5. 返回交换策略后的最小值和对应的策略,这就是纳什均衡点。
需要注意的是,有时博弈可能存在多个纳什均衡点,也可能不存在纳什均衡点。
此外,纳什均衡点不一定是全局最优解,而是在每个参与者选择了最优策略的情况下无法获得更好结果的一种均衡状态。
除了上述方法,还有其他一些求解纳什均衡的方法,如线性规划、拉格朗日乘子法等。
第四章纳什均衡的存在性与多重性对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。
这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。
所以,倘若某个概念所对应的事物并不存在。
那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。
因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。
所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。
有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。
譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。
除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。
从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。
我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。
按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。
因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。
再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。
博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。
均衡点如何求解题技巧和方法均衡点是博弈论中一个重要的概念,用来描述博弈中各方达到一种平衡状态的情况。
在不同类型的博弈中,找到均衡点对于分析问题和制定策略非常重要。
本文将介绍一些求解均衡点的常用技巧和方法。
一、纳什均衡纳什均衡是博弈论中最常用的均衡概念,它指的是在博弈中各方无法通过改变自己的策略来获得更好的回报。
下面介绍一些求解纳什均衡的技巧和方法。
1. 确定博弈的标准形式首先,要将具体的博弈问题转化为标准形式,即确定博弈参与者、策略空间、报酬函数等。
2. 构建对手的最优反应函数在纳什均衡中,每个参与者的策略应该是对手的最优反应。
因此,可以通过构建对手的最优反应函数来求解纳什均衡。
最优反应函数描述了在对手采取某个策略时,该参与者应该采取的最佳策略。
3. 解方程找到平衡点通过求解最优反应函数的方程,可以找到所有参与者的最佳策略组合。
当这个组合满足所有参与者的最佳策略时,就得到了纳什均衡。
二、迭代删除劣势策略迭代删除劣势策略是一种常用的求解均衡点的方法,适用于有限次重复博弈。
具体的步骤如下:1. 确定博弈的标准形式2. 备注所有的劣势策略对于每个参与者的每个策略,如果其存在被其他策略严格支配的情况,则把这个策略标记为劣势策略。
重复这个过程,直到所有的劣势策略都被备注。
3. 删除所有被备注的劣势策略将所有被备注的劣势策略从策略空间中删除。
4. 重复步骤2和3,直到无法找到更多的劣势策略为止5. 剩下的策略组合即为均衡点三、逆向工程逆向工程是一种通过观察均衡点找出博弈形式的方法。
具体的步骤如下:1. 观察博弈的实际情况通过观察博弈参与者的行为和结果,尝试找出可能的均衡点。
2. 假设参与者的策略在观察的基础上,假设参与者的策略,并计算得出各参与者的回报。
3. 检验假设的均衡点检验假设的策略组合是否满足纳什均衡的定义。
如果满足,即找到了均衡点;如果不满足,需要调整假设的策略并重新计算。
4. 重复步骤2和3,直到找到真正的均衡点。
纳什均衡证明方法嘿,朋友们!今天咱来唠唠纳什均衡证明方法。
你说这纳什均衡啊,就像是一场微妙的游戏。
咱就拿下棋来打个比方吧,双方都在琢磨着怎么下才能让自己最有利,同时还得考虑对方会怎么应对。
这可不就是纳什均衡嘛!每个人都在根据对方的行动来调整自己的策略,力求达到一种平衡状态。
比如说在商业竞争中,两家公司都在想着怎么定价、怎么推广产品。
如果一家公司大幅降价,那另一家就得好好想想是不是也得跟着降,不然客户不都跑了嘛。
这时候他们就在寻找那个纳什均衡点,找到一个双方都能接受的策略组合。
再想想班级里选班干部,大家都想当,那怎么投票呢?每个人都得考虑别人会投给谁,然后再决定自己的选择。
这也是一种纳什均衡的体现呀!大家都在相互影响、相互制约。
纳什均衡证明方法呢,其实就是帮助我们找到这种平衡的工具。
它让我们能看清在各种复杂的情况下,人们会怎么做出决策,怎么达到一种相对稳定的状态。
咱举个具体例子哈,想象一下有两个商家在竞争市场份额。
如果一个商家加大广告投入,另一个商家可能也得跟着加大,不然市场份额就被抢走了。
但如果都拼命加大广告投入,成本又太高了。
那他们就得好好研究,怎么在投入和收益之间找到那个最佳平衡点,这就是纳什均衡呀!那怎么证明这个纳什均衡呢?这可得好好研究各种因素,像双方的利益、策略选择的范围等等。
就好像解方程一样,要把各种条件都考虑进去,找到那个能让大家都稳定下来的解。
你说这是不是很有意思?在生活中处处都有纳什均衡的影子,从买菜砍价到国际谈判,都离不开它。
你再想想,要是没有纳什均衡,那这个世界得乱成啥样?大家都盲目行动,没有一个相对稳定的策略,那不是乱套了嘛!所以说呀,纳什均衡证明方法真的很重要,它能帮我们更好地理解和应对各种复杂的情况。
总之,纳什均衡证明方法就像是一把钥匙,能打开我们对各种社会现象和经济行为的理解之门。
让我们能更清楚地看到人们是怎么相互作用、怎么达到平衡的。
这可真是个神奇的东西啊,难道不是吗?大家可得好好琢磨琢磨,说不定哪天就能用上呢!。