当前位置：文档之家› 静态博弈模型1

静态博弈模型1

博弈论经典模型全解析

博弈论经典模型全解析（入门级） 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不

会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是

博弈模型

有趣味的博弈论模型按语：本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页；在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”；2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”（请看最后附录），这篇科普文章名列首位，我们还有一篇文章名列第七。如果读者有兴趣可以去看看，或等我有时间找出来。我觉得，把新兴科学应用通俗易懂的语言写出来，有利于科学知识普及。这也应该是一个科学工作者的责任。在自然界和人类社会经济等领域中广泛存在合作与竞争，而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论（Game Theory），也称对策论，它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论，研究个体之间行为的相互影响和相互作用规律，它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是，有三次诺贝尔获奖者是博弈论的杰出科学家，他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南，1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家，1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末，随着复杂网络科学的一些新的发现，博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。博弈论对人有一个最基本假定：人是理性的，人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的，因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究，并获得了丰富多彩的结果，利用博弈论可以解读人类的社会行动或集体行动，更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响，人们已经提出和研究了许多博弈模型，比较著名的有三个模型：囚徒困境、“雪堆”博弈和“少数者”博弈，下面笔者通过对这三个模型进行简单而通俗的介绍，让大家了解博弈论及其应用概况。 “囚徒困境”模型囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕，分别关在不同的屋子里，如果双方都拒绝承认同伴的罪行，则由于证据不足两人都会被轻判（收益为）；为此，警方设计了一个机制：如果一方出卖同伴，而另一方保持忠诚，则背叛者将无罪释放（收益为T ）；坚持忠诚的一方将被重判（收益为）；如果双方都背叛了对方，则双方都会被判刑（收益为R S P ）。这里假设上述收益参数满足下面的条件：。对每个参与者来说，如果对手坚持忠诚，则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ；如果对手选择背叛，则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 S P 可见，无论对手采取哪种策略，自己的最佳策略就是背叛，双方都选择背叛称为囚徒困境的唯一“纳什均衡”（纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖）；同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下，理性参与者面临着两难的困境。自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

博弈均衡模型及其举例

博弈联均衡模型博弈论模型图示博弈可划分为合作博弈和非合作博弈，1人们一般讲到的都是指非合作博弈，它有四种不同类型的博弈，即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈，与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。这四种均衡中最为基本的是纳什均衡。2 完全信息静态博弈——纳什均衡、完全信息动态博弈——子博弈精炼纳什均衡不完全信息静态博弈——贝叶斯纳什均衡、、不完全信息动态博弈——精炼贝叶斯纳什均衡，与上述相对应的是、、、。这四种均衡中最为基本的是纳什均衡。完全信息静态博弈（纳什均衡）债务人强硬妥协 1这两者的区别主要在于人们的行为相互作用时，当事人能否达成一个有约束力的协议：如能达成就是合作博弈；反之就是非合作博弈。合作博弈强调团体理性，强调效率和公平，非合作博弈强调理性个人的最优决策，其结果是否有效率则是不确定的。 2所谓纳什均衡，指的是所有参与人最优选择的一种组合，在这种组合下，给定其他人的选择，没有任何人有积极性做出新的选择。纳什均衡的哲学思想是：给定别人遵守协议的情况下，没有人有积极性偏离协议规定的自己的行为规则。换言之，如果一个协议不构成纳什均衡，它就不可能自动实施，因为至少有一个参与人会违背这个协议，不满足纳什均衡要求的协议是没有意义的。当博弈中的所有参与人事先达成一项协议，给出每个人的行为规则。在没有外在强制力约束时，当事人是否会自觉地遵守这个协议？或者说这个协议是否可以自动实施？如果当事人会自觉遵守这个协议，等于说这个协议构成一个纳什均衡。参见张维迎：“经济学家看法律、文化与历史”，载张维迎《产权、政府与信誉》，三联书店2001年版。

基于动态博弈的土地供给量最优化模型

ＴＪＹＪＣ２００７年第９期（总第２４５期）一、房地产最优供给量决策模型（一）模型假设对博弈模型作如下假设：该博弈有两个博弈参与人，地方房地产开发商全体为参与人１，该地区的房地产消费者全体为参与人２。整个博弈周期分为一、二两个决策阶段。房地产开发商全体面对倒转的房地产逆需求函数：Ｂ（ｑｔ）＝ａ－ｂｑｔ。房地产消费者和房地产开发商的贴现因子为ｔ，且ｔ∈（０，１）。开发的固定成本和边际成本为零。房地产的价格调控通过税收工具。博弈参与人１的策略是在博弈的两阶段分别选择房地产的供给量ｑ/ １和ｑ/ ２，以期达到参与人１的整个周期的利益最大化，参与人２的策略是选择在各时期的购买价格ｑ/ １和ｑ/ ２，以期达到消费者的效用最大化。由于房地产是耐用品，因此在第一阶段，参与人１在边际上消费的房地产是第ｑ１单位的商品。在第二阶段消费者在边际上消费的房地产是第ｑ１＋ｑ２单位的商品。由模型假设，如果房地产的供给量为ｑｔ，房地产逆需求函数为：Ｂ（ｑｔ）＝ａ－ｂｑｔ（１）如果在第二阶段房地产的供给量为ｑ２，消费者愿意支付价格为：ｐ２＝ａ－ｂ（ｑ１＋ｑ２）（２）参与人１的收益函数为：π１＝ｐ１ｑ１＋ｐ２ｑ２，参与人２的收益为房地产消费者在两阶段中的消费者剩余。对于这个两阶段动态博弈，我们用逆向归纳法求解该博弈的一个完美子博弈均衡。（二）参与人１在博弈第二阶段的最优房地产供给量在第二阶段参与人１的目标函数：ｍａｘｑ２ｑ２（ａ－ｂ（ｑ１＋ｑ２））由此得出一阶条件为：ａ－ｂｑ１－２ｂｑ２＝０解得：ｑ/ ２＝ａ－ｂｑ１２ｂ（３）（３）代入（２）可得：ｑ/２＝ａ－ｂｑ１２ｂ（４）结论１：面对线性的需求函数Ｂ（ｑｔ）＝ａ－ｂｑｔ，在博弈的第二阶段，参与人１的房地产最优供给量ｑ/ ２和房地产的最优价格ｐ/ ２分别是参与人１在第一阶段的供给量ｑ/ １的函数，且ｑ/ ２＝ａ－ｂｑ１２ｂ，ｐ/ ２＝ａ－ｂｑ１２ｂ。（三）参与人１在博弈第一阶段的最优房地产供给量在博弈的第一阶段，对耐用商品房地产消费者愿意支付的价格为：ｐ１（ｑ１）＝Ｂ（ｑ１）＋ｔｐ２＝ａ－ｂｑ１＋ｔａ－ｂｑ１２ｂ＝（１＋ｔ２）（ａ－ｂｑ１）（５）参与人１在整个周期的总收益目标为：ｍａｘｑ１ｐ１ｑ１＋ｐ２ｑ２＝ｍａｘｑ１（１＋ｔ２）（ａ－ｂｑ１）＋ａ－ｂｑ１２ｂ（ａ－ｂｑ１２）由此得出一阶条件为：（１＋ｔ２）（ａ－ｂｑ１）－ａ－ｂｑ１２ｂ＝０解得：ｑ/ １＝（１＋ｔ）ａ３ｂ＋２ｂｔ（６）（６）代入（５）（３）（４）得到：ｐ/ １＝（２＋ｔ）２２（３＋２ｔ）ａ（７）ｑ/ ２＝２＋ｔ６ｂ＋４ｂｔａ（８）ｐ/ ２＝２＋ｔ６＋４ｔａ（９）且π/ １＝ｐ１ｑ１＋ｐ２ｑ２＝（２＋ｔ）２４（３＋２ｔ）ａ２ｂ（１０）从上面的分析我们可以得到下面的结论：结论２：各地区的房地产在两阶段的最优供给量ｑ/ １和ｑ/ ２及其最优定价ｐ/ １和ｐ/ ２是贴现因子ｔ的函数，在给定贴现因子ｔ的情况下，其数值由（６）（７）（８）和（９）式确定。且参与人１总利润为：π/ １＝（２＋ｔ）２４（３＋２ｔ）ａ２ｂ．二、房地产供给量的比较静态分析由结论２可知贴现因子的任何变化都将影响两个阶段中的房地产最优供给量ｑ/ １和ｑ/ ２的变化。下面对其进行比较静态分析。为此分别对ｑ/ １和ｑ/ ２求导：由（６）式得：ｄｑ/ １／ｄｔ＝ａ／ｂ（３＋２ｔ）２＞０由（８）式得：ｄｑ/ ２／ｄｔ＝－ａ／２ｂ（３＋２ｔ）２＜０由（７）式得：ｄｐ/ １／ｄｔ＝ａ（２＋ｔ）（１＋ｔ）／（３＋２ｔ）２＞０由（９）式得：ｄｐ/ ２／ｄｔ＝－ａ２（３＋２ｔ）２＜０由上面的比较静态分析可以得到如下结论：结论３：贴现因子的增加，将会使得第一阶段的最优房地产供应量ｑ/ １增加，而第二阶段的最优房地产供应量ｑ/ ２减少。结论４：贴现因子的增加，将会使得第一阶段的最优房地产定价ｐ/ １增加，而第二阶段的最优房地产定价ｐ/ ２减少。结论５：房地产在两阶段的最优供给量ｑ/ １和ｑ/ ２，最优定价ｐ/ １和ｐ/ ２都随着参数ａ的增加而增加。都随着参数ｂ的增加而减少。三、地方政府对房地产的最优土地供给量及税收政策确定对房地产土地供给的调控在整个房地产调控中占有重要地位。如果土地供给过多，房地产开发商则大量囤土地导致的存量土地过多，它的经济风险、政策风险、违规风险也与日俱增。如果土地供给过少，由供需规律，这导致房地产价格上涨。模型（６）（７）（８）（９）为各级城市人民政府要科学地编制年度用地计划，科学确定房地产开发土地供应规模，从而对房地产市场进行有效调控提供了相关的决策依据。基于动态博弈的土地供给量最优化模型 ■吕绪华刘京娟栗勤农ＪＵＥＣＥＣＡＮＫＡＯ决策参考

博弈论模型

1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。 “囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是 9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1

博弈论的应用-浅析博弈论经典模型

浅析博弈论经典模型 --囚徒困境模型及其启示一、博弈论概述博弈论又名“对策论”、“赛局理论”，属应用数学的一个分支，表示在多决策主体之间行为具有相互作用时，各主体根据所掌握信息及对自身能力的认知，做出有利于自己的决策的一种行为理论。简单说来就是一些个人或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。由于冲突、合作、竞争等行为是现实世界中常见的现象，因此很多领域都能应用博弈论，例如军事领域、经济领域、政治外交，解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。二、博弈论的基本原理从上述定义中可以看出，一个完整的博弈一般由以下几个要素组成：博弈的参加者，各博弈方各自选择的全部策略或行为的集合、博弈方的得益、结果、均衡等。 1、参与者指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。

5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的事情。 6、均衡是所有参与人的最优策略或行动的组合；均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合，如在各参与人的均衡策略作用下，各参与人最终的行动或效用集合。上述要素中，参与人、行动和结果统称为博弈规则，博弈分析的目的是使用博弈规则来决定均衡。三、博弈的分类博弈的分类根据不同的标准也有不同的分类。根据参与人的多少，博弈可以分为二人博弈和多人博弈。根据参与人是否合作，博弈可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。根据各方得益的不同情况，博弈可以分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系，争取双赢的局面。根据行为的时间序列性，博弈可以分为静态博弈、动态博弈。静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。根据参与人对其他参与人的了解程度，博弈可以分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解

从博弈论角度看古诺模型

博弈论的观点看古诺模型罗思蕴（华中师大学数学与应用数学系，430079）摘要：运用博弈论的研究方法，对古诺模型的几种变式进行分析，给出模型解法的代数表达式，并对结果进行适当的对比分析，最后总结出不同模型对结论的改变情况。关键词：古诺模型纳什均衡完全信息不完全信息静态博弈动态博弈古诺模型（Cournot model）是博弈论中最具有代表性的模型之一，也是是纳什均衡最早的版本。它是法国经济学家古诺(Augustin Cournot)在1938年出版的《财富理论的数学原理研究》一书中最先提出的。而古诺的定义比纳什的定义早了一百多年，足以体现博弈论这样一个学科是深深扎根于经济学的土壤中的。从经济学的角度，它的研究价值在于古诺模型是介于两种极端状况完全竞争和垄断之间。在古诺生活的时代，大多数市场都只有少数的厂商经营，所以这个模型在当时是极具现实意义的。随着时间的推移，古诺模型也演变出了各种不同的版本。如果从博弈论的角度分析，有四种情况极具代表性：完全信息静态博弈的古诺模型、不完全信息静态博弈的古诺模型、完全且完美信息动态博弈的古诺模型、无限次重复博弈的古诺模型。 1 经典古诺模型古诺模型最初的形态是来自于经济学的。在经济学中，寡头的概念是指那种在某一产业只有少数几个卖者的市场组织形式。古诺模型对寡头具有如下的基本假设。一，假定一个产业只有两个寡头，每个寡头生产同质产品，并追求利润最大化。二，两个寡头之间进行的是产量的竞争而不是价格竞争，且产品的价格依赖于两者生产的产品总量。三，寡头之间无勾结行为。四，每个生产者都把对方的产出水平视为定值。五，边际成本为常数。在经典的古诺模型中，每个企业具有相同的不变单位成本： (),1,2 == C q cq i i i i