当前位置：文档之家› 博弈论

博弈论

博弈论（经济学学科分支）

博弈论又被称为对策论（Game Theory）既是现代数学的一个新分支，也是运筹学的一个重要学科。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈论已经成为经济学的标准分析工具之一。在生物学、经济学[1]、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。博弈论[2]是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。博弈论思想古已有之，中国古代的《孙子兵法》等著作就不仅是一部军事著作，而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。近代对于博弈论的研究，开始于策梅洛（Zermelo），波莱尔（Borel）及冯·诺依曼（von Neumann）。1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域，从而奠定了这一学科的基础和理论体系。950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。类型：(1)合作博弈——研究人们达成合作时如何分配合作得到的收益，即收益分配问题。 (2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。 (3)完全信息/不完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息；反之，则称为不完全信息。 (4)静态博弈和动态博弈静态博弈：指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。动态博弈：指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。从1994年诺贝尔经济学奖授予3位博弈论专家开始，共有7届的诺贝尔经济学奖与博弈论的研究有关[3]，分别为：1994年，授予加利福尼亚大学伯克利分校的约翰·海萨尼（J.Harsanyi）、普林斯顿大学约翰·纳什（J.Nash）和德国波恩大学的赖因哈德·泽尔滕（Reinhard Selten）。以表彰这三位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和经济学产生了的重大影响。1996年，授予英国剑桥大学的詹姆斯·莫里斯（James A. Mirrlees）与美国哥伦比亚大学的威廉·维

克瑞（William Vickrey）。前者在信息经济学理论领域做出了重大贡献，尤其是不对称信息条件下的经济激励理论，后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。2001年，授予加利福尼亚大学伯克利分校的乔治·阿克尔洛夫（George A. Akerlof ）、美国斯坦福大学的迈克尔·斯宾塞（A. Michael Spence ）和美国哥伦比亚大学的约瑟夫·斯蒂格利茨（Joseph E. Stiglitz）。他们的研究为不对称信息市场的一般理论奠定了基石，他们的理论迅速得到了应用，从传统的农业市场到现代的金融市场，他们的贡献来自于现代信息经济学的核心部分。2005年，授予美国马里兰大学的托马斯·克罗姆比·谢林(Thomas Crombie Schelling)和耶路撒冷希伯来大学的罗伯特·约翰·奥曼(Robert John Aumann）。二者的研究通过博弈论分析促进了对冲突与合作的理解。2007年，授予美国明尼苏达大学的里奥尼德·赫维茨（Leonid Hurwicz）、美国普林斯顿大学的埃里克·马斯金(Eric S. Maskin）以及美国芝加哥大学的罗杰·迈尔森(Roger B. Myerson）。三者的研究为机制设计理论奠定了基础。2012年，授予美国经济学家埃尔文·罗斯（Alvin E. Roth）与罗伊德·沙普利（Lloyd S. Shapley）。他们创建“稳定分配”的理论，并进行“市场设计”的实践[4]。作为一门工具学科能够在经济学中如此广泛运用并得到学界垂青实为罕见。2014年，授予法国经济学家梯若尔。他在产业组织理论以及串谋问题上，采用了博弈论的思想，让理论和问题得以解决。在规制理论上也有创新。要素：(1)局中人：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

(2)策略：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。

(3)得失：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。（4)对于博弈参与者来说，存在着一博弈结果。(5)博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。所谓纳什均衡，它是一稳定的博弈结果。博弈类型：博弈的分类根据不同的基准也有不同的分类。一般认为，博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。从行为的时间序列性，博弈论进一步分为静态博弈、动态博弈两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的

行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。通俗的理解："囚徒困境"就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。经济学家们所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。与上述四种博弈相对应的均衡概念为：纳什均衡(Nash equilibrium），子博弈精炼纳什均衡（subgame perfect Nash equilibrium），贝叶斯纳什均衡(Bayesian Nash equilibrium），精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium）。博弈论还有很多分类，比如：以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（战略型）或者展开型；以博弈的逻辑基础不同又可以分为传统博弈和演化博弈。纳

什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*，局中人B也采取其最优策略b*,如果局中人仍采取b*，而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。这样，“均衡偶”的明确定义为：一对策略a*(属于策略集A)和策略b*（属于策略集B）称之为均衡偶，对任一策略a(属于策略集A)和策略b（属于策略集B），总有：偶对(a, b*) ≤ 偶对(a*,b*) ≥偶对(a*,b)。对于非零和博弈也有如下定义：一对策略a*（属于策略集A）和策略b*（属于策略集B）称为非零和博弈的均衡偶，对任一策略a(属于策略集A）和策略b（属于策略集B），总有：对局中人A的偶对（a, b*）≤偶对(a*,b*);对局中人B的偶对（a*，b）≤偶对(a*,b*)。有了上述定义，就立即得到纳什定理：任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。纳什定理的严格证明要用到不动点理论，不动点理论是经济均衡研究的主要工具。通俗地说，寻找均衡点的存在性等价于找到博弈的不动点。纳什均衡点概念提供了一种非常重要的分析手段，使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。但纳什均衡点定义只局限于任何局中人不想单方面变换策略，而忽视了其他局中人改变策略的可能性，因此，在很多情况下，纳什均衡点的结论缺乏说服力，研究者们形象地称之为“天真可爱的纳什均衡点”。塞尔顿（R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点，从而形成了两个均衡的精炼概念：子博弈完全均衡和颤抖的手完美均衡。

案例一：“囚徒困境”在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”（prisoner's dilemma）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果两个犯罪嫌疑人都坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪，各被判刑8年；如果只有一个犯罪嫌疑人坦白，另一个人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。

囚徒困境博弈[Prisoner's dilemma]

A╲B 坦白抵赖

坦白8，8 0，10

抵赖10，0 1，1

对A来说，尽管他不知道B作何选择，但他知道无论B选择什么，他选择“坦白”总是最优的。显然，根据对称性，B也会选择“坦白”，结果是两人都被判刑8年。但是，倘若他们都选择“抵赖”，每人只被判刑1年。在表2.2中的四种行动选择组合中，（抵赖、抵赖）是帕累托最优，因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。但是，“坦白”是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占优战略均衡，即纳什均衡。不难看出，此处纳什均衡与帕累托存在冲突。

单从数学角度讲，这个理论是合理的，也就是选择都坦白。但在这样多维信息共同作用的社会学领域显然是不合适的。正如中国古代将官员之间的行贿受贿称为“陋规”而不是想方设法清查，这是因为社会体系给人行为的束缚作用迫使人的策发生改变。比如，从心理学角度讲，选择坦白的成本会更大，一方坦白害得另一方加罪，那么事后的报复行为以及从而不会轻易在周围知情人当中的“出卖”角色将会使他损失更多。而8年到10年间的增加比例会被淡化，人的尊严会使人产生复仇情绪，略打破“行规”。我们正处于大数据时代，向更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析，人的活动动影像动因复杂，所以囚徒困境只能作为简化模型参考，具体决策还得具体分析。案例二“智猪博弈”

一、经济学中的“智猪博弈”（Pigs’payoffs）这个例子讲的是：假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽（两猪均在食槽端），另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是在去往食槽的路上会有两个单位猪食的体能消耗，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时行动（去按按钮），收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。"智猪博弈"由纳什于1950年提出。实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪选择等待的话，小猪可得到4个单位的纯收益，而小猪行动的话，则仅仅可以获得大猪吃剩的1个单

位的纯收益，所以等待优于行动；在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。

用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择：

小猪

行动等待

大猪行动5,1 4,4

等待9,-1 0,0

从矩阵中可以看出，当大猪选择行动的时候，小猪如果行动，其收益是1，而小猪等待的话，收益是4，所以小猪选择等待；当大猪选择等待的时候，小猪如果行动的话，其收益是-1，而小猪等待的话，收益是0,所以小猪也选择等待。综合来看，无论大猪是选择行动还是等待，小猪的选择都将是等待，即等待是小猪的占优策略。

在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择。这时候有所不为才能有所为！高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。在智猪博弈中，虽然小猪的“捡现成”的行为从道义上来讲令人不齿，但是博弈策略的主要目的不正是使用谋略最大化自己的利益吗？案例三“美女的硬币”一位陌生美女主动过来和你搭讪，并要求和你一起玩个游戏。美女提议：“让我们各自亮出硬币的一面，或正或反。如果我们都是正面，那么我给你3元，如果我们都是反面，我给你1元，剩下的情况你给我2元就可以了。”听起来不错的提议。如果我是男性，无论如何我是要玩的，不过经济学考虑就是另外一回事了，这个游戏真的够公平吗？

绅士/美女女正面女反面

正面3，－3 -2，+2

反面-2，+2 1，－1

假设我们出正面的概率是x，反面的概率是1-x。为了使利益最大化，应该在对手出正面或反面的时候我们的收益都相等，不然对手总是可以改变正反面出现的概率让我们的总收入减少，由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)

这个方程通俗的说就是在对手一直出正面你得到的利益，和你对手一直出反面得到利益是一样的且最大。解方程得x=3/8,也就是说平均每八次出示3次正面，5次反面是我们的最优策略。而将x=3/8代入到收益表达式3*x+(-2)*(1-x)中就可得到每次的期望收入，计算结果是-1/8元。

同样，设美女出正面的概率是y，反面的概率是1-y，列方程-3y+2(1-y)=2y+(-1)*(1-y)解得y也等于3/8，而美女每次的期望收益则是2(1-y)-3y=1/8元。这告诉我们，在双方都采取最优策略的情况下，平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案，不论你再采用什么方案，都是不能改变局面的。如果全部出正面，每次的期望收益是

(3+3+3-2-2-2-2-2)/8=-1/8元如果全部出反面，每次的期望收益也是

(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合，所以期望还是-1/8元。但是当你也采用最佳策略时，至少可以保证自己输得最少。否则，你肯定就会被美女采用的策略针对，从而赔掉更多。看起来这个博弈模型似乎没有什么用处，但是其实这可能牵涉了金融市场定价中最重要的一个模型：定价权重模型了。总的来说“博弈论”其本质是将日常生活中的竞争矛盾以游戏的形式表现出来，并使用数学和逻辑学的方法来分析事物的运作规律。既然有游戏的参与者那么也必然存在游戏规则的制定者。深入的了解竞争行为的本质，有助于我们分析和掌握竞争中事物之间的关系，更方便我们对规则进行制定和调整，使其最终按照我们所预期的目的进行运作。中国应用《孙子兵法》是我国乃至世界最早的一部经典博弈论著作，近几年由于博弈论在全球的大范围流行，出现了多部收集整理博弈论知识的书籍，如《博弈论的诡计》、《最神奇的博弈论定律》等。中国经纬智库是最早研究新型博弈理论的民间智库之一，由理事宋雪峰牵头研究以公布的《多腿凳定律》《定量无穷大》《十字弓博弈基础》已经被引用到社会经济发展的方方面面。

“博弈论”与传统咨询工具相结合，可以帮助企业开启解决战略定位、股权分配、股权融资、价值塑造、商业模式等疑难杂症的新视角。(该论述源自经邦)

博弈论经典例子

博弈论经典例子篇一:《博弈论三大经典案例》经典的囚徒困境 1950年，由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论，后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述，并命名为"囚徒困境"。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方(相关术语称"背叛"对方)，而对方保持沉默，此人将即时获释，沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作")，则二人同样判监半年。若二人都互相检举(互相"背叛")，则二人同样判监2年。用表格概述如下：甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者(即"囚徒")都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为"严格劣势"，理性的参与者绝不会选择。另外，没有任何

其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁，并不知道对方选择;而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工;前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人

博弈论经典案例分析

博弈论经典案例分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

博弈论的基本概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者：参与者是指一个博弈中的决策主体，通常又称为参与人或局中人。参与人的目的是通过合理悬着自己的行动，以便取得最大化的收益。参与者可以是自然人，也可以是团体。 ?信息：信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要，每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略：策略是参与者如何对其他参与者的行动作出反应的行动规则，它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略，用S i表示参与者i的所有可选择的策略的集合（又成为而i的策略空间）。如果n个参与者没人选择一个策略，那么s=（s1，s2，…，s n）称为一个策略组合。 ?收益：收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益，它是策略组合的函数。 ?均衡：均衡是所有参与者的最优策略组合，记为s*。几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕，并受到指控。除非至少一人认罪，否则警方无充分证据将他们按最论刑。警方把他们隔离审讯，并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度，因警方证据不足，两人将均被判为轻度犯罪入狱一个月；如果双方都坦白，根据案情两人将被判入狱六个月；如果一个招认而另一个拒不坦白，招认者因由主动认罪立功的表现将立即释放，而另一人将被判入狱九个月。

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述： 1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设： 1、决策主体是理性的，最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别： 3、博弈论与传统决策的区别： 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P,I)，其中P为市场价格，I为消

费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 2、参与人的行动顺序，即每个参与人在何时行动； 3、序列结构：每个参与人行动时面临的决策问题，包括参与人行动时可供选择的行动方案、所了解的信息； 4、参与人的支付函数。比较： 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论论文

本科毕业论文（设计）论文（设计）题目：用博弈论思想分析经济学现象，分析生活中一个经济现象学院：计算机技术与科学学院专业：软件工程年级：软件123 学号： 1208060324 学生姓名：廖杰指导教师：刘涛 2014年 5月 23日

目录摘要 (2) ABSTRACT (3) 正文 (4) 一、完全信息讨价还价 (4) 二、不完全信息下的讨价还价 (6) 三、总结 (7) 参考文献 (7) 附录一 (8)

从讨价还价看经济、市场摘要本文阐述了博弈论在讨价还价方面的应用理论。主要在完全信息与不完全信息下，进一步针对不同的情况，综合地介绍讨价还价理论模型以及应用。讨价还价作为市场经济中最常见、普通的事情，也是博弈论中最经典的动态博弈问题。现实经济中充满了“讨价还价”的情形，大到国与国之间的贸易协定，小到个体消费者与零售商的价格商定，还有厂商与工会之间的工资协议、房产商与买者之间关于房价的确定、各种类型的谈判等等。这实际上是两个行为主体之间的博弈问题，也可以把讨价还价看作为一个策略选择问题，即如何分配两个对弈者之间的相互关联的收益问题。关键词：博弈论，讨价还价，博弈树

Viewing from the bargaining, market economy Abstract This paper expounds the bargaining game theory in the application of theory. Main under complete information and incomplete information, further according to different situation, comprehensive introduction to bargaining model in theory and application. Bargaining as the most common, ordinary things in market economy, as well as the most classical game theory of dynamic game problems. Is full of "bargain" in real economic situations, big to trade agreements between countries and agreed on the price of small to individual consumers and retailers, and manufacturers and the unions wage agreement between, between property developers and buyers about the determination of prices, various types of negotiation, and so on. This is actually a game between two agents, can also read the bargain as a strategy choice problem, namely how to divide the two players of the correlation between income problem. Key words:Game theory Argy-bargy, Game tree

博弈论经典案例与分析

案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。价格战案例：假设市场中仅有A 、B 两家企业，每家企业可采取的定价策略都是10元或15元，我们可以得出得益矩阵如下：分析：无论对企业A 还是企业B 来说，低价都是他们的占优战略。从表可见，企业A 的占优战略是10元，因为无论B 采取什么战略，企业A 都能获取比定价15元更多的利润。如果企业B 定价10元，企业A 定价10元能够获利80万元，而定价15元只能获得30万元；如果企业B 定价15元，企业A 定价10元可获利170万元，而定价15元却只能获利120万元。同样地，企业B 的占优战略也是定价10元的策略。企业B 男

博弈论与社会科学方法论(潘天群)

通识课课程中文名称：博弈论与社会科学方法论课程英文名称：Game Theory and Methodology of Social Sciences 课程代号：开课学期：第一学期（秋学期）主讲教师：潘天群职称：教授、博导研究专长：博弈论、逻辑学、科学方法论所在院系：哲学联系电邮：tqpan@https://www.doczj.com/doc/a05689330.html, 授课对象：全校二、三年级本科生（不限专业）一、主讲教师简介：潘天群，哲学博士，现为南京大学哲学系、南京大学现代逻辑与逻辑应用研究所教授、博士生导师。兼任中国逻辑学会常务理事、中国逻辑学会经济逻辑专业委员会副主任委员。教育部新世纪人才（2006）。曾于2001年9月-2002年2月在美国纽约大学政治学系从事“博弈论中的方法论问题”的访问研究。主要研究领域为：逻辑学、哲学、博弈论。在《哲学研究》等国内外学术杂志发表学术论文约70余篇。独立出版著作5部：《行动科学方法论》，《博弈生存——社会现象的博弈论解读》、《博弈思维——逻辑使你决策制胜》、《社会决策的逻辑结构》与《合作之道——博弈中共赢方法论》。其中《博弈生存——社会现象的博弈论解读》，自2002年出版以来深受读者欢迎，为畅销书与长销书，已出版第三版。主持国家社会科学基金项目“博弈论的哲学基础与应用功能研究”（2009）。二、课程简介由于“他人”与“我”是既合作又竞争的关系，研究冲突与合作的博弈论自上一世纪由冯?诺依曼等人创立与发展以来，对社会现象表现出强大的解释力，已经成为社会科学的一个通用工具。迄今至少有五位博弈论专家获得诺贝尔经济学奖，许多诺贝尔经济学奖获得者其研究与博弈论相关。博弈论也也渐渐渗透到自然科学（如生物学、人工智能）之中。本课程突破数理博弈论的框架，结合主讲教师十年来的研究工作，构建适合

博弈论案例分析

(1)失火了，你往哪个门跑失火了，你往哪个门跑——这就是博弈论一天晚上，你参加一个派对，屋里有很多人，你玩得很开心。这时候，屋里突然失火，火势很大，无法扑灭。此时你想逃生。你的面前有两个门，左门和右门，你必须在它们之间选择。但问题是，其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的，那么你将因人多拥挤、冲不出去而烧死；相反，如果你选择的是较少人选择的，那么你将逃生。这里我们不考虑道德因素，你将如何选择？这就是博弈论！你的选择必须考虑其他人的选择，而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付，不仅取决于你的行动选择——博弈论称之为策略选择，同时取决于他人的策略选择。你和这群人构成一个博弈（game）。上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型，被称之为少数者博弈或少数派博弈（Minority Game）。当然，原来的博弈形式不是这么简单，这里我把它简化了，我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。生活中博弈的案例很多，你会见到很多例子。只要涉及到人群的互动，就有博弈。什么叫博弈？博弈的英文为game，我们一般将它翻译成“游戏”。而在西方，game的意义不同于汉语中的游戏。在英语中，game即是

人们遵循一定规则下的活动，进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中，game有竞赛的意思，进行game的人是很认真的，不同于汉语中游戏的概念。在汉语中，游戏有儿戏的味道。因此将关于game的理论，即game theory翻译成博弈论或者对策论，是恰当的。本书下面统称game theory为博弈论。博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦，他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家，他同时对计算机的发明作出了巨大贡献，他去世时博弈论还未对经济学产生广泛影响，否则经济学的诺贝尔奖肯定有他的名字，因为诺贝尔奖有规定，只颁发给在世的学者。谈到博弈论，不能忽略博弈论天才纳什（John Nash）。纳什的开创性论文《n人博弈的均衡点》（1950）、《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。博弈论对于社会科学有着重要的意义，它正成为社会科学研究范式中的一种核心工具，以至于我们可称博弈论是“社会科学的数学”，或者说是关于社会的数学。从理论上讲，博弈论是研究理性的行动者（agents）相互作用的形式理论，而实际上它正深入到经济学、政治学、社会学等等，被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家：纳什、塞尔屯、哈桑尼（），而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南，1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论经典模型全解析

博弈论经典模型全解析（入门级） 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不

会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是

博弈论的经典案例与分析

博弈论的经典案例与分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征： 1. 研究对象的普遍性和应用范围的广泛性人们的行为之间存在相互作用与相互依赖，不同的行为主体及其不同的行为方式所形成的利益冲突与合作，已成为一种普遍现象，这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实，使博弈论的研究内容和应用范围十分广泛，涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域，在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性一是运用数学模型来描述所研究的问题，使博弈论的分析更为精确。二是研究方法具有抽象化的特征，由于博弈论分析大量使用了现代数学，使它所描述和分析的过程及所揭示的结论都带有抽象、一般化的特点。三是博弈论分析方法所体现的模式化特征，博弈论为人们提供了一个统一的分析框架或基本范式，从而使博弈论能够分析和处理其它数学工具难以处理的复杂行为，成为对行为主体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中，不仅要应用现代数学的大量知识，还涉及到经济学、管理学、心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性博弈论中的最佳策略是经济学意义上的最优化，它只回答是什么导致博弈均衡，均衡的结果是什么，所遵循的基本原则是科学结论的客观性和普遍性。从实践上看，博弈论突破了传统的完全竞争、完全信息假定，更加强调决策者的个人理性，强调不完全信息、不完全竞争条件下的经济分析，强调决策个体之间的相互影响和相互作用等外部性，强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致，等等。作为一门方法论科学，除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外，还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说，博弈论方法具有实证的特征，使研究结果更具有真实性。

读博弈论有感

读博弈论有感博弈论的目的是在于巧妙的策略，而不是揭发，我们学习博弈论的目的不是享受博弈论的分析过程，而在于赢得更好的结局。博弈论的思想既然来自于现实生活，它就可以高度抽象化的用数学工具来表述，也可以用日常事例来说明，并运用到生活中去。没有高深的数学知识，我们同样通过博弈论的学习成为生活中的策略高手。有一个脑筋急转弯问题是这样的：在什么情况下零大于二，二大于五，五又大于零？答案是：在玩石头剪刀布游戏的时候。博弈，就是用这种游戏思维来突破看似无法改变的局面，解决现实的严肃问题的策略。在博弈中，每个参与者都在特定条件下争取其最大利益，强者未必胜券在握，弱者也未必永无出头之日，因为在博弈中，特别是多个参与者的博弈中，结果不仅取决于参与者的实力与策略，而且还取决于其它参与者的制约和策略。事实上，博弈过程本来就不过是一种日常现象。我们在日常生活中经常需要先分析他人的意图从而做出合理的行为选择，而所谓博弈就是行为者在一定环境条件和规则下，选择一定的行为或策略加以实施并取得相应结果的过程。博弈论用途很广。但正如上文所讲，博弈论原是数学运筹中的一个支系，其研究运用了种种的数学工具，一般读者如何能掌握呢? 这里在在着一个矛盾。一方面，正如马克思所说：一种科学只有在成功地运用了数学时，才算是达到了真正完善的地步。另一方面，数学似乎成了博弈论和我们普通人的生活之间的一条难以逾越的鸿沟。面对这条鸿沟，很多人的反应要么是耸耸肩膀走开，少数人会企图通过学习数学来渡过。但是这两种反应都忽略了一个很浅显的道理：一个不会编程的人照样可以成为电脑应用高手一样，没有高深的数学知识，我们同样通过博弈论的学习成为生活中的策略高手。孙膑没有学过高等数学，但是这并不影响他通过运用策略来帮助田忌赢得赛马。博弈论首先是我们思索现实世界的一套逻辑，其次才是把这套逻辑严密化的数学形式。博弈论的目的在于巧妙的策略，而不是解法。我们学习博弈论的目的，不是为了享受博弈分析的过程，而在于赢得更好的结局。说到底毕竟只是把博弈论当作一个分析问题的工具，用这个工具来简化问题，使问题的分析清晰明了也就够了。另一方面，博弈的思想既然来自现实生活，它就既可以高度抽象化地用数学工具来表述，也可以用日常事例来说明，并运用到生活中去。本书作者所做的一切努力，正是试图通过日常生活中常见的例子，来介绍博弈论的基本思想及运用，并且寻求把这种智慧来指导生活决策的方法。阅读本书，我们除了了解到令人震撼的社会真实轨迹之外，还可以学到最合适的待人处世方法。你还记得上次找上司要求提薪未果，自己也不知道是为什么吗?可惜，那时你还没有学习一点博弈的策略知识，这些知识本来可以帮助你提工资，而且提的幅度你比预料的还多。你还记得上次因为迁就女友而倍感委曲吗?如果应用博弈论的知识，保证你能够和她相处得更为?。你不知应该如何对付一个总是借钱不还的朋友?或者如何与生意对手讨价

博弈论经典案例《智猪博弈》

在经济学中，在经济学中，智猪博弈”(PigS ' PayoffS(BoXed PigS) 是一个著名博弈论例子。这个例子讲的是：猪圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。那么，两只猪各会采取什么策略？答案是：小猪将选择搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标，猪圈里还会出现同样的小猪躺着大猪跑”的景象吗？试试看。改变方案一：减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡

献食物，所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。改变方案二：增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的共产主义”社会，所以竞争意识却不会很强。对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让猪们去多踩踏板的效果并不好。改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小猪和大猪都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费宀完。对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。原版的智猪博弈”故事给了竞争中的弱者（小猪）以等待为最佳策略的启发。但是对于社会而言，因为小猪未能参与竞争，小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。而能否完全杜绝搭便车”现象，就要看游戏规则的核心指标设置是否合适了。

历史的制度分析：博弈论分析方法

历史的制度分析：博弈论分析方法把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究，目前主要有两种方法。一种是“进化博弈论方法”（evolutionary game approach）。经济学中的进化博弈论是在生物学的进化博弈论的基础上产生、发展起来的。它将人类的经济活动和竞争性经济行为同生物的进化相类比，研究人类经济行为中的策略和行为方式的均衡，以及向均衡状态调整、收敛的过程与性质。采用这一方法的研究者认为，社会制度并不是由什么人有意设计出来的，而是在那些适应环境和社会变化的新的制度结构不断被发现、更为理想的制度结构不断被保存的过程中产生的。这就是所谓的“适应性进化”过程。进化博弈论的引入，就是为了分析和说明社会制度的这一适应性进化过程。进化博弈论之所以在制度变迁理论中受到重视，主要是因为它是在不严重依赖决策者计算能力的前提下来说明均衡选择过程，从而在纳什均衡的理性主义解释遇到理论困难时，显示出了通过进化机制实现纳什均衡的可能性。应用博弈论研究制度变迁的另一种新方法是“重复博弈论方法”（repeated game approach），它运用更精细的均衡概念，如“子博弈精炼均衡”（subgame perfect equilibrium）来分析历史与现实中的制度选择与变迁过程。其中最具代表性的，就是格瑞夫进行的“历史的比较制度分析”。所谓的重复博弈，实际上是指同样结构的博弈重复地进行多次。与一次性博弈不同，它是由若干个阶段博弈（stage game）构成的一个完整的和相对长期的博弈过程。因此，在重复博弈中，各博弈方的着眼点就不是其在某一阶段上的局部利益或短期利益，而是他们在整个博弈过程中的总体利益和长期利益。当各博弈方面对不同的策略选择时，他必须考察到其在当前阶段的博弈中所采取的策略，不致在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。也就是说，他不能像在一次性博弈中那样，毫不顾及其他博弈方的利益。有时，一方若作出一种合作姿态，可能会使其他博弈方在随后的阶段中也采取合作态度，从而实现共同的长远利益。这样，在重复博弈中就存在着比一次性博弈更大的合作的可能性，也有可能实现比一次性博弈更有效率的均衡。重复博弈论的这一特征，为它说明人类之间的合作行为，特别是说明历史与现实社会中体制与制度的演变过程，提供了强有力的支持。在历史的比较制度分析那里，制度被定义为本身是“自我实施的对行为的非技术决定的约束” ，即所谓的自我实施制度（self-enforcing institution ）。自我实施制度的一个最基本的特征，就是它的自发产生和自我实施的性质。与那些由国家和法律强制实施的制度不同，自我实施制度必须是参与人各方经过协商、谈判、讨价还价后自愿达成一致的结果。因此，历史的比较制度分析将自我实施制度视为特定历史条件下制度博弈的一种均衡状态或均衡结果。自我实施制度产生的过程，也就是制度博弈各方在特定的战略局势中，根据自己不同的目标自主地选择各自的最优策略与对手进行博弈，最后求得制度均衡的过程。而所谓的“子博弈精炼均衡”，恰恰是指在构成动态博弈的所有子博弈阶段上都实现了纳什均衡。这就是说，一个子博弈精炼均衡，必须是各博弈方在整个博弈的每个阶段（子博弈）都选择了不愿单独改变的策略（纳什均衡）的最终结果。如果我们从博弈论的角度来观察自我实施制度，就会发现自我实施制度与子博弈精炼均衡之间的内在联系。简单地说，自我实施制度所具有的自发产生和自我实施的基本属性，说明了它必定是制度博弈各方在每个子博弈中都选择了不愿单独改变的最优策略的结果，也即实现子博弈精炼均衡的结果。更直接地说，自我实施制度的产生，必定是一个制度博弈实现了子博弈精炼均衡的结果。反过来说，如果一个制度博弈实现了子博弈精炼均衡的结果，那它也应该是自我实施的。

博弈论知识点总结完整版

博弈论（一）：基本知识 1.1定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。 1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。 1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。倘若不能，则称非合作博弈（Non-cooperative game）。合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。把两个角度结合就得到了4种博弈： a、完全信息静态博弈，纳什均衡，Nash(1950) b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965） c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968） d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975）Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式：策略式表述(Strategic form), 扩展式表述（Extensive form） 1.6占优均衡： a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。对于所有的s-i，si*称为参与人 i的严格占优战略，如果满足： ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡：一个博弈的某个策略组合中，如果对应的所有策略都是各参与人的占优策略，则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡： a、“严劣”和“弱劣”的含义：设s i’和s i’’是参与人i可选择的两个策略，若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。上面式子中，若将“<”改为“≤”，则说策略s i’弱劣于策略s i’’。 b、定义：重复剔除严格策略就是各参与人在其各自策略集中，不断剔除严劣策略…如果最终各参与人仅剩下一个策略，则该策略组合就被称为重复剔除严劣策略均衡。（二）：纳什均衡（Nash Equilibrium） 2.1纳什均衡定义：对于一个策略式表述的博弈G={N,S i, u i,i∈N}，称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡，如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i 的最优策略（经济理性策略），即：u i(s i*, s-i*)

博弈论三大经典案例

经典的囚徒困境 1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择： ?若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。 ?若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。 ?若二人都互相检举（互相“背叛”），则二人同样判监2年。用表格概述如下：甲沉默（合作）甲认罪（背叛）乙沉默（合作）二人同服刑半年甲即时获释；乙服刑10年乙认罪（背叛）甲服刑10年；乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择： ?若对方沉默、背叛会让我获释，所以会选择背叛。 ?若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工; 前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人都超负荷工作如果某人不听从吩咐，其他人听从吩咐，则此人下岗。其他人继续工作如果所有人都不听从经理吩咐，则经理下岗但是，由于员工之间信息是不透明的，而且，都担心别人听话自己不听话而下岗，所以，大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。