经典博弈论概述
- 格式:doc
- 大小:35.50 KB
- 文档页数:4
博弈论讲的是什么
博弈论是研究决策制定者之间相互关系的一门数学分支,主要关注在冲突和合作的情境下,个体或群体的最佳决策和策略选择问题。
博弈论的研究对象可以包括个体、团体、国家、公司等各种决策制定者。
以下是博弈论的一些核心概念和主要内容:
1.博弈的定义:博弈是指多方参与者在特定环境下做出决策,彼此之间的决策会相互影响。
每个参与者的目标是通过制定最佳策略来最大化其利益。
2.参与者:博弈论中的参与者被称为“玩家”,可以是个体、群体、国家等。
每个玩家都有自己的目标和利益,但他们的决策会影响其他玩家的结果。
3.策略:策略是玩家在博弈中可选的行动或决策。
博弈论研究玩家如何选择最优策略以最大化他们的利益。
4.支付:支付是指每个玩家根据博弈的结果获得的收益或损失。
博弈论分析玩家如何在不同策略下分配支付,以及如何最大化其期望收益。
5.博弈的分类:博弈可以分为零和博弈和非零和博弈。
零和博弈中,一个玩家的利益损失就是其他玩家的利益增益,总和为零。
非零和博弈中,各玩家的利益不一定互相抵消,可以共赢或共输。
6.博弈的解:博弈论研究如何找到博弈中的均衡点或解决方案。
最著名的解决概念之一是纳什均衡,它描述了一种情况,在该情况下,每个玩家的策略是对方玩家策略的最佳响应。
7.博弈的应用:博弈论在经济学、政治学、生物学、计算机科学
等领域有广泛的应用。
例如,在商业谈判、拍卖、国际关系、网络安全等方面,博弈论都可以提供洞察和指导。
总体而言,博弈论通过数学建模和分析,帮助我们理解在决策制定者之间互动的情境中,各方如何做出最佳的决策以达到其个体或集体的目标。
《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。
本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。
关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。
博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。
本文将对博弈论的相关知识进行详细的总结和归纳。
一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。
博弈的基本要素包括:参与者、策略、收益和信息。
1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。
参与者的目标是实现自身利益的最大化。
1.3 策略策略是指参与者在博弈中所能采取的行动或选择。
通常分为纯策略和混合策略。
1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。
收益可以用来衡量参与者的利益大小。
1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。
信息可以分为对称信息和非对称信息。
二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。
常见的均衡概念有纳什均衡、帕累托最优和博弈解。
2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。
2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。
帕累托最优是一种资源分配的有效方式。
2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。
博弈解往往是均衡的特殊情况。
三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。
博弈论及经典案例简介前言博弈论是运筹学中的一个重要分支,研究决策者在不确定性条件下做出决策时所采用的策略,及其战略互动的一种数学理论。
本文将从博弈论的定义、基本概念、博弈模型及解答方法、博弈论的应用领域和经典案例五个方面对博弈论进行简介。
一、博弈论的定义博弈论是一种数学工具,它以数学方法来研究自然界和人类社会的竞争、协作和任意随机行为的问题。
从高层次上来说,它是一种研究互动决策的数学方法,它的核心问题是,如何通过策略选择与博弈对手产生协同或竞争效应,达到最大的利益和最小的代价,并从中得到最佳的结果。
二、博弈论的基本概念1. 纯策略和混合策略在博弈中,一个参与者所采用的一项动作或策略叫做纯策略。
比如,打石头剪刀布游戏中,选择石头、剪刀和布就是三种纯策略。
对于一个参与者某项策略的选择和实施,可能不仅仅是一种确定的策略,还可能是按照不同的概率随机地选择多种策略,这就是混合策略。
2. 双人零和博弈双人零和博弈是指,参与者只有两个,并且每位参与者在特定的胜利条件下都追求自己的最大利益,而且参与者的盈亏是互相抵消的。
3. 堆叠式博弈和延迟式博弈考虑到博弈论用于的领域比较广泛,基本上它是由两个基本方面组成的:动态和静态。
动态博弈的基本特点是在某个时刻存储参与者做出决策的结果。
它是由两种基本类型组成的:堆叠式和延迟式。
延迟式博弈在每一时刻都会有一个奖励,而堆叠式博弈只有当所有决策都结束之后,奖励才会到来。
4. 常用解答方法(1)支配策略法:如果博弈中一个参与者的一个策略对于另一个参与者来说都是更优的,那么那一策略就成了支配策略,这个被支配策略就可以被消去。
(2)纳什均衡:参与者的策略都是正好达到收益最大化使博弈结果稳定的状态,如果所有参与者都是这样博弈,则称之为纳什均衡。
(3)均衡水平:指一个博弈里所有参与者的动作或策略共同导致的结果,不能通过单个参与者的行动得到更好的结果。
三、博弈论的模型及解答方法1. 线性规划模型线性规划模型是一种建模方法,旨在通过最大化达到获得最大利润来解决博弈问题。
博弈论究竟讲什么?一文读懂11种经典博弈论模型先说一个小故事:美国第34任总统艾森豪威尔,在他年轻的时候,有一次吃过晚饭后他跟家人一起玩纸牌,一连六盘,他拿到的都是最坏的牌。
于是他变得不高兴起来,嘴里开始不停地埋怨。
他的母亲停了下来,对他说道:“如果你要继续玩下去,就不要埋怨手中的牌怎么样。
不管怎样的牌发到手中,你都得拿着。
你唯一能做的就是尽你所能,打好手里的每一张牌,求得最好的结果。
”在城主的上一篇文章中,谈到了德鲁克在《创新与企业家精神》中提到的几种竞争战略,制定战略的过程是决策的过程,推进战略落地则是执行的过程。
无论是决策还是执行,其本质都是一次次博弈的组合。
那么,究竟什么是博弈?大到国与国之间的制衡,小到一个人的一生,博弈都是无处不在,无论是商业竞争中,还是日常工作中,生活中,甚至子女教育,两性爱情。
因为每个人都在时时刻刻想着与他人竞争,每时每刻都把自己放在局中人的位置上。
这就是俗话说的“人生如戏,戏如人生”,充分运用游戏规则,做好自己人生的演员,就是博弈思维能力的体现。
专门研究相互依赖、相互影响的人群,其理性决策行为及这些决策的均衡结果的理论,就是博弈论。
博弈是有技巧的,博弈论的主体则是规定的若干博弈模型,通俗的说就是人们常说的“套路”。
但博弈论是严肃的科学,如果有人非要像剥洋葱一样地剥开博弈思维,看看各种博弈技巧的核心是什么,那么他将会看到两个字——理性。
从博弈论衍生出来的博弈思维,体现了人的理性思维,也就是说我们的任何结果均是采取某种决策和行动的结果。
这体现了博弈思维奉行的“因果论”,正所谓“种瓜得瓜,种豆得豆”。
想要得到理想的结果,除了依靠我们的理性分析,采取正确的决策,并付诸行动外,别无他法。
正因为博弈思维是一种理性思维,所以冲动是魔鬼,更是博弈思维的大敌。
这里,我们要认清“理性”的几个误区。
1.理性的人一定是自利的,但世界上又有多少纯粹的“大公无私”呢?2.理性和道德不是一回事,在追求的自利的同时,产生出来的利他才有可能持久。
十大经典博弈论模型博弈论是一门研究决策者之间互动的学科,其应用范围广泛,涉及到经济、政治、生物学等领域。
在博弈论中,经典博弈论模型是基础和核心,以下是介绍十大经典博弈论模型:1. 囚徒困境博弈模型囚徒困境博弈模型是博弈论中最为著名的模型之一,也是最为典型的非合作博弈模型。
该模型主要讲述的是两个囚犯被抓后面临的选择问题,如果两个人都招供,那么都将受到较重的惩罚;如果两个人都不招供,那么都将受到轻微的惩罚;如果一个人招供而另一个人不招供,那么招供的人将受到宽大处理,而另一个人将受到较重的惩罚。
2. 零和博弈模型零和博弈模型是博弈论中最为简单的模型之一,其特点是参与者之间的利益完全相反,即一方获得利益就意味着另一方的利益受到损失。
在这种情况下,参与者之间的互动往往是竞争和对抗的。
3. 博弈树模型博弈树模型是一种用于描述博弈过程的图形模型,它可以清晰地展示出参与者在不同阶段的选择和决策,以及每个选择所带来的收益和风险。
4. 纳什均衡模型纳什均衡模型是博弈论中最为重要的概念之一,它指的是一个博弈中所有参与者都采取了最优策略的状态。
换句话说,如果所有参与者都遵循纳什均衡,那么任何一个人单方面改变策略都将无法获得更多的利益。
5. 最小最大化模型最小最大化模型是一种解决零和博弈问题的方法,其思想是在所有可能的情况中,选择让对手收益最小的情况,从而实现自己的最大化收益。
6. 帕累托最优解模型帕累托最优解模型是一种解决多人博弈问题的方法,其核心思想是通过合作和协商,使得所有参与者都能获得最大的收益,而不是只有某个人获得了最大的收益。
7. 博弈矩阵模型博弈矩阵模型是一种常用的博弈论分析工具,它可以清晰地展示出参与者在不同策略下的收益和风险,从而帮助参与者做出最优决策。
8. 拍卖模型拍卖模型是博弈论中的一个重要应用领域,其目的是通过竞价的方式,让参与者以最低的价格获得所需的商品或服务。
9. 逆向选择模型逆向选择模型是一种解决信息不对称问题的方法,其核心思想是通过知道对方的信息,来预测对方的行为和决策,从而做出最优策略。
博弈论概述由于现代经济活动的规模越来越大,对抗性、竞争性越来越强,特别是寡头垄断或垄断竞争市场,竞争和决策较量更是厂商经营活动的核心内容,这些都使得人们越来越重视经济活动的环境条件及其变化,越来越重视竞争者或合作者的反应,因此经济决策的“博弈性”越来越强。
而且,博弈论在许多情况下所得出的结论更加符合经济现实和更加具有应用性,对参与经济互动的各方或国家政府的决策互动有更强的指导作用。
所以,研究博弈论是很必要的。
一.基本概念博弈:即一些个人,队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各允许选择的行为或策略中进行选择并加以实施,各自取得相应的结果的过程。
从上述定义可以看出,规定或定义一个博弈需要设定下列四个方面。
(1)、博弈的参加者(Players)。
即在所定义的博弈中究竟有哪几个独立决策、独立承担结果的个人或组织.对我们来说,只要在一个博弈中统一决策,统一行动、统一承担结果,不管一个组织有多大,哪怕是一个国家,甚至是由许多国有组成的联合国,都可以作为博弈中的一个参加方。
并且,在博弈的规则确定之后,各参加方都是平等的,大家都必须严格按照规则办事。
(2)、各博弈方各自可选择的全部策略(Strategies)或行为(Actions)的集合。
即规定每个博弈方在进行决策时,可以选择的方法,做法或经济活动的水平,量值等。
在不同博弈中可供博弈方选择的策略或行为的数量很不相同,在同一个博弈中,不同博弈方的可选策略或行为的内容或数量也常不同,有时只有有限的几种,甚至只有一种,而有时又可能有许多种,甚至无限多种可选策略或行为。
(3)、进行博弈的次序(Order)。
在现实的各种决策活动中,当存在多个独立决策方进行决策时,有时候需要这些博弈方的决策又有先后之分,并且有时一个博弈方还要作不止一次的决策选择。
这就免不了有一个次序问题。
因此规定一个博弈必须规定其中的次序,次序不同一般就是不同的博弈,即使博弈的其他方面都相同。
博弈论知识总结博弈论概述:1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、 决策主体是理性的,最大化自己的收益。
2、 完全理性是共同知识3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别:1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。
2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
十大博弈论经典案例博弈论是研究冲突和合作行为的数学理论,主要研究各方在一定规则下作出决策的过程。
在现实生活中,博弈论可以帮助我们分析各种决策情境,揭示行为背后的逻辑。
下面介绍十大博弈论经典案例,展示不同情境下的决策策略及其结果。
1. 囚徒困境囚徒困境是博弈论中最著名的案例之一。
两名囚徒被单独关押,检察官给每人下达选择“合作”或“背叛”的指令。
如果两人都合作,各自判刑较轻;如果其中一人背叛而另一人合作,则背叛者判刑为0,而合作者将被重判;如果两人都背叛,两者皆受重刑。
在这种情况下,每名囚徒都会选择背叛,因为无论另一人选择什么,背叛都是最优选择。
2. 霍巴和鲍勃游戏霍巴和鲍勃游戏是研究博弈过程中的信任和合作的实例。
霍巴拥有100美元,可以选择分享给鲍勃一部分;鲍勃可以选择保留所有款项或回馈一部分给霍巴。
如果鲍勃选择合作并分享款项,那么霍巴会获得更多回报;反之,如果鲍勃保留所有款项,霍巴就会损失。
通过这一博弈,可以观察到信任和合作如何影响双方的回报。
3. 石头剪刀布石头剪刀布是一种简单的博弈,展示了不完全信息博弈的情形。
两名玩家同时出示石头、剪刀或布中的一种手势,胜利者根据规则确定。
在这个博弈中,玩家需要考虑对手可能的策略,选择最佳的手势进行应对。
4. 抢手织物抢手织物是关于资源分配的博弈。
多位玩家竞相争夺一种有限资源,但资源数量不足以满足所有玩家的需求。
玩家需要权衡合作和竞争的策略,以最大化自己的利益。
这个案例揭示了在资源有限的情况下,合作和竞争之间的平衡。
5. 拍卖博弈拍卖博弈是在资源分配中常见的情景。
卖家将物品提供给潜在买家,买家通过出价来竞争物品,最高出价者将得到物品。
在这种情况下,买家需要权衡自己对物品的价值以及出价策略,以获得最大的利益。
6. 鸿门宴鸿门宴是中国古代著名的博弈案例之一。
项羽与刘邦在鸿门相会,项羽有机会消灭刘邦,但最终刘邦却逆袭成功。
这个案例揭示了在战略选择上的巧妙和胜负的关键。
1博弈论概述范文
博弈论是一种研究人们在竞争中行为的社会科学,它可以被用来研究
决策者之间的行为,同时也强调了人们之间的竞争。
它的主要目的是研究
一组或多组参与者如何通过各自推进自己的利益,以便最终实现一种受欢
迎的结果或者可被全体参与者所接受的结果。
因此,博弈论给行动者们提
供了一种衡量行为的方法,以确定一种受欢迎的、更有利的决策方案。
博弈论由瑞士数学家和哲学家约翰·博弈(John von Neumann)于1928年提出,并在1944年《帝国数学手册》(Theory of Games and Economic Behavior)中阐述,它按照数学原理来分析参与者之间的博弈
行为。
基本的博弈论模型由两个参与者组成,通常被称为双方对弈,并且
主要由两个步骤组成:双方先同时做出决定,然后双方根据两者的决定一
起计算自己的利益或损失。
这种模型中,每一个参与者都会考虑自己和对
手的可能决策,并试图决定他们最有利的策略,以便从中获得最大的利益。
由于博弈论涉及到双方的野心与阴谋,因此它在多个学术领域颇受关注,比如经济学、政治学、社会心理学和战略学。
它可以被用来解决一些
复杂的政治、经济和军事决策问题,从而为各方提供线索,以确定最佳策略。
经典博弈论概述1什么是博弈论博弈论是一种独特的处于各学科之间的研究人类行为的方法。
与博弈论有关的学科包括数学,经济学和其他社会科学和行为科学。
博弈论是由约翰·冯·诺依曼创立的,该领域第一本重要著作是诺依曼和另一个伟大的数理经济学家奥斯卡·摩根斯坦所著的。
博弈论是关于包含相互依存情况中理性行为的研究。
所谓相互依存,通常是指博弈中的任何一个参与者受到其他参与者行为的影响,反过来,他的行为也影响到其他参与者。
由于这种相互依存性,游戏或博弈的结果依赖于每一个参与者的决策,没有一个人能完全地控制所要发生的事情,也没有一个参与者处于孤独的状态。
相互依存常使博弈中的参与者之间产生竞争。
譬如两个人分蛋糕、每个参与者都希望自己的那块可以分得大一些。
然而,竞争仅仅是博弈论中相互依存的一个方面。
应该指出,通常地博弈并非纯粹是参与者之间的竞争,相互依存的另一个方面是参与者可以有某些共同的兴趣或利益所在。
仍以分蛋糕为例,作为参与者策略行动的结果,蛋糕的大小可以增加或者减少。
参与者的共同兴趣在于增加蛋糕的总量,他们互相“倾轧”之处在于如何分配。
从博弈论研究的角度,增大蛋糕应是博弈的第一步,而分配蛋糕则是博弈的第二步。
在博弈论中还需要对一个词“理性行为”作一些说明。
博弈论中的所谓理性,一般不是指道德标准。
从参加博弈的参与者的眼光来看,他们试图去实施自己认为可能最好的行为,尽管这样的行为有可能损害了其他参与者。
由于参与者的相互依存性,博弈中一个理性的决策必定建立在预测其他参与者的反应之上。
一个参与者将自己置身于其他参与者的位置并为他着想从而预测其他参与者将选择的行动,在这个基础上该参与者决定自己最理想的行动,这就是博弈论方法的本质与精髓。
博弈论中每一个参与者做出理性决策的重要依据之一是他的可能收益有多少,这就是一个参与者需要认真计算的收益函数(payoff function)。
对于每一个参与者、如果他们在可供自己选择的策略空间中任取一个策略作为自己的行动,既不会给自己带来盈利,又不会使他们必须付出,这种失去了激励机制的游戏本身也就失去了“博”的意义,在社会经济领域中尤其不太可能出现这类现象。
收益函数的结构与取值无疑将会影响到参与者的行为,因而也影响到博弈的最终结局。
由此,收益函数的确定在博弈论研究中是件非常重要的事情。
从对博弈的不同角度考虑。
从参与者不同的观点出发可以有形形色色的收益函数。
博弈所涉及的内容:(1)参与者。
以i=1、2,…表示。
(2)每个参与者一般有若干个策略(strategies)可供选择,它们构成了该参与者的纯策略空间。
参与者i的纯策略空间用si表示,倘若si由。
i个纯策略构成,则有si =(si1,si2.…si)。
纯策略空间有时也可以是连续的。
(3)每个参与者的盈利函数。
我们记参与者i的盈利函数为ui(s),其中s=(s1…sr),而sj表示参与者J所取策略,s表示r个参与者的策略向量。
显然,盈利函数ui(s)与s有密切关系。
它是每个参与者真正关心的东西。
2 博弈的分类策略空间、盈利函数以及参与者的与博弈有关的特征等知识构成博弈的信息,从信息的角度,博弈可以分为完全信息与不完全信息两类,信息是博弈论中的重要内容。
完全信息博弈是指参与者对所有参与者的策略空间及策略组合下的收益有完全的了解,否则是不完全信息博弈。
对于不完全信息的博弈,至少有一个参与者不能确切知道其他参与者的收益函数,在这种情况下,参与者所做的是努力使自己的期望收益或期望效用最大化。
从博弈的均衡结果来看,博弈分为合作性博弈和非合作性博弈。
所谓合作性博弈是指参与者从自己的利益出发选择行动,但所选择的行动其结果对双方均有利;而非合作性博弈是指参与者的行动选择对双方均不利。
人们分工与交换的经济活动就是合作性的博弈,而“囚徒困境”便是典型的非合作性博弈。
博弈又分静态博弈和动态博弈。
静态博弈是指参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。
动态博弈指双方的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人所采取的行动。
3 纳什均衡纳什均衡是博弈分析中的重要概念。
1950 年,还是一名研究生的纳什撰写了一篇论文,题为《N人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。
在这篇论文中,纳什给出了博弈均衡的定义,即纳什均衡。
纳什均衡一般可以这样定义:如果决策组合处于这样的状态,即给定别人的选择,没有任何人有积极性改变自己的决策,那么这个决策组合就是纳什均衡。
纳什是普林斯顿大学的教授,因为在非合作博弈理论方面的开创性贡献而获得1994 年诺贝尔经济学奖。
他是一个了不起的数学天才,早在1951 年,当他还只有20 多岁的时候就提出了日后奠定非合作博弈分析基础的均衡概念,也即今天在社会科学教科书中广泛传播的“纳什均衡”概念;另外,他在纯数学领域也有重要的贡献。
这个问题可以换一个角度理解:假如当事人之间签订了一个合同或协议,在给定其他人遵守协议、没有外在强制力的情况下,每个人是不是有积极性遵守协议?如果所有的人都有积极性遵守协议,这个协议就是一个纳什均衡。
例如10 个人签订一个协议,假定另外9 个人都遵守协议时,最后1 个人是不是有积极性遵守协议?从纳什均衡的概念可以得知,在某些给定条件下,如果治理结构或者一个公司合同不是一个纳什均衡的话,那么它将不会自动得到遵守,合同或协议签了也无用。
因此纳什均衡简单说就是一个策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略,他的收益将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
如下述“夫妻博弈”(或称性别之战)中有两个纳什均衡点。
丈夫和妻子商量晚上的5活动,丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。
但两人都希望在一起度过夜晚。
在这个"夫妻博弈"中有两个纳什均衡点:(歌剧,歌剧),(拳击,拳击)。
在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。
在“夫妻博弈”中,我们无法知道,最后结果是一同欣赏歌剧还是一起去看拳击。
纳什均衡是博弈论中的重要概念,同时也是经济学的重要概念。
诺贝尔经济学奖获得者萨缪尔森有一句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。
博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。
由此可见纳什均衡在现代经济学中的重要性。
纳什均衡不仅对经济学意义重大,对其他社会科学意义也同样重大。
4 囚徒困境及其解析囚徒困境是纳什的导师图克(Tucker)构造的重要的博弈模型,它是典型的困境,可说明许多现象。
在这个模型中有两个囚徒,这两个囚徒一起做坏事,结果被警察抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以独立做出自己的选择。
他们被告知:(1)如果他们之中有一人坦白,而另一人不坦白,则坦白者可获得自由,而拒不坦白者要被判十年监禁。
(2)如果两人都坦白,则两人都被判五年监禁。
(3)如果两人都不坦白,则两人都被判一年监禁。
囚徒困境有两个前提预设:一是甲乙二人都是自利理性的个人,即只要给出两种可选的策略,每一方将总是选择其中对他更有利的那种策略。
二是两人无法互通信息,要在不知道对方选择结果的情况下,自己进行选择。
在这种条件下,从甲立场来看,共有两种可能情况:第一种可能是乙采取坦白的策略,这时如果甲也坦白,则要入狱五年,如果不坦白,则要入狱十年,两相比较,结论是应该坦白。
第二种可能是乙采取沉默的态度,这时若甲也沉默,要入狱一年,如果甲坦白,则可获得自由,两相比较结论是应该坦白。
因此,无论乙是坦白还是沉默,甲采取坦白的策略对自己更为有利。
同样以上推理对于乙也适用。
结果两个囚徒都坦白了,都被判刑五年。
囚徒困境的“困境”在于如果甲乙二人都保持沉默,则都只被判刑一年,显然比两人都坦白的结果要好。
可是两人经过一番理性计算后,却选择了一个使自己陷入不利的结局。
囚徒困境是对传统经济学基础的重大挑战。
因为传统经济学认为,人的经济行为的根本动机是自利,因此经济学不必担心每一个经济行为主体参与竞争的动力,只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。
只要市场机制公正,自然会增进社会福利。
但是囚徒困境的结果,恰恰表明个人理性不能通过市场导致社会福利的最优。
只从自己的角度出发,考虑自己利益的最大化,这种基于个人理性选择的结果往往适得其反,导致整体利益的最小化。
有人可能会认为:囚徒困境只是“象牙之塔”中的理论家虚构的一种“思想游戏”,或是一种难得一见的特例。
这实在是一种错觉。
应该承认:囚徒困境最初的确是“象牙之塔”中的“抽象理论思维”的“产物”。
如同其他的许多“象牙之塔”中的产物一样,人们愈来愈深刻地感觉到它同“现实世界”实际上是存在着密切联系的。
已经发现,在经济学、政治学、社会学及现实生活中类似囚徒困境的事例是大量存在的。
对于囚徒困境的原因、条件、性质、意义等问题,博弈论专家、经济学家、政治学家、社会学家、哲学家、伦理学家、社会心理学家已从许多方面进行了大量的研究。
有人注意到在囚徒困境的“案例”中两个参与者不能互相通信是一个限制性条件,因此他们设想这就是造成囚徒困境的“原因”。
例如,有人说:“囚徒的苦恼在于他们不能商量沟通。
”于是,有人便提出了如下的解决问题的途径:两个参与者可以“进行通信,然后合作”。
反对者认为这是于事无补、不解决问题的。
“显然,一个囚徒要保持沉默的意图不可能引起另一个囚徒有同样的意图——如果另一方忽视这个意图的话。
不准通信的假定对于囚徒困境来说不是关键性的。
可以增加一个通信条件,但这仍然不能造成什么不同,只要假定每个人对可能结果的偏爱顺序与以前相同并且每个人可以自由地选择与另一个人的意图相反的策略。
每个囚徒都可以对另一个囚徒说:‘如果你将保持沉默,那么我也将保持沉默’;可是,只要每个囚徒可自由地说一套而做另一套,那么困境就没有什么变化”。
有人也许会假定可能存在着强迫性协议条款,比方说对违反协议进行特定的处罚,这就会改变囚徒的偏好顺序。
这样的假定会改变原有的决策问题的结构。
而我们一直假定每一方只对造成他有可能获得的最有利的结果有兴趣,并且他的偏好顺序是严格给定的。
在这个假定之下似乎没有任何合作“协议”能造成什么不同。
”从上述分析中可以看出,囚徒困境的“要害”不是通信问题。
有人可能会认为囚徒困境的“要害”在于:每个参与者只关心自己的利益而对他人的利益漠不关心,为了自利的目的他甚至不惜违背“协议”。
这就是囚徒困境的“要害”。