当前位置：文档之家› 博弈论初步(6)

博弈论初步(6)

【例题１．２．１】“大锅饭”博弈

两个人（参与者＝１，２）编在同一组里干活，每个人可以选择的战略（行动）是“工作”或“偷懒”。如果两个人都选择“工作”，这时总产出是８；如果只有一个人选择“工作”，而另一个人选择“偷懒”，这时产出是４；如果两个人都选择“偷懒”，这时产出是０。总产出在两个人中平均分配。假设每个人“工作”时必须付出私人成本为３，而“偷懒”时私人成本为０。

（１）试写出博弈的双变量收益矩阵；

（２）验证战略＝“偷懒”是参与者＝１，２的严格占优战略；

（３）写出博弈的严格占优战略均衡。

解：

（１）试写出博弈的双变量收益矩阵

（２）验证战略＝“偷懒”是参与者＝１，２的严格占优战略；

（３）写出博弈的严格占优战略均衡。

该博弈的严格占优战略均衡＝（偷懒，偷懒）

第六章博弈论

第六章博弈论主要内容：本章共分四节：第一节，简单博弈与博弈均衡；第二节，重复博弈与序列博弈；第三节，威胁与承诺；第四节，几种相关的策略。在第一、二节中将介绍博弈论的一些基本概念，在第三、四节中运用博弈论来分析寡占市场中厂商的一些竞争策略，包括厂商的定价策略、产品选择策略、阻止进入策略等。教学重点：了解关于博弈论的基本概念，掌握上策均衡与纳什均衡的区别；学会运用重复博弈和序列博弈分析案例，并能够运用博弈论的基本知识分析厂商的基本竞争策略。关键概念：博弈均衡上策上策均衡纳什均衡重复博弈序列博弈威胁承诺第三节威胁与承诺一、阻止市场进入的威胁威胁与承诺是博弈论中的一个重要论题，它可以用来分析竞争中的一种重要现象。“小镇上的折扣店”是市场进入中的一种较为特殊的现象，在更一般的情况中，一个市场不一定只能容纳一家厂商。此时市场进入的博弈也有所不同。例证 7 ：阻止市场进入的威胁博弈已有一个垄断经营者，现在有另一家厂商作为潜在的竞争者试图进入这个市场。对垄断者来说，如果要想保住自己的垄断地位，就会设法阻止潜在竞争者的进入。在这个博弈中，潜在竞争者有两种策略可以选择，即进入或不进入；垄断者也有两种策略，或者与进入者打一场商战，或者默许他的进入。这个博弈的报酬矩阵如表 6.6 所示。表 6.6 阻止市场进入的博弈垄断者商战默许潜在进入者进入－ 200 ， 600 900 ， 1 100 不进入0 ， 3 000 0 ， 3 000 在这个博弈中，策略选择是有着确定的顺序的：潜在进入者做出选择（进入或不进入）→垄断者决定（默许进入或进行商战）。当然，潜在进入者在做出决策的时候必须要考虑垄断者的反应。假定潜在进入者进入市场需要花费进入成本 200 万元。对于进入者来说，如果其选择了进入市场的策略，当垄断者默许的时候，他可获利 900 万元；但如果垄断者决定与他进行一场商战时，垄断者依然可以获利 600 万元，而进入者将亏损 200 万元。市场进入的扩展形式见图6.2 。

博弈论(课一)

课程内容和时间安排第一讲：概述（第一、二章）第二讲：术语解读和基本假设（第三、四章）第三讲：囚犯困境和破解之道（第五、六、七章）第四讲：万元陷阱和智猪博弈（第八、九章）第五讲：懦夫博弈和性别战（第十、十一章）

博弈学 -----博览全局对弈棋局课一博弈在中国的理解--略观围棋，法于用兵，怯者无功，贪者先亡。西方国家的理解--Game fair play。（中国人在博弈中关注的是获胜，西方人在博弈中关注的是怎么玩的开心。）博弈可以在工作领域，可以在社交往来，可以在家庭相处，无处不在，博大精深。知人者智，自知者明; 胜人者力，自胜者强; 小胜者术，大胜者德。

推荐书刊 1、蒋文华：《用博弈的思维看世界》，浙江大学出版社，2014年。 2、张维迎：《博弈论与信息经济学》，上海三联书店，上海人民出版社，1996年。 3、詹姆斯·米勒：《活学活用博弈论－如何利用博弈论在竞争中取胜》，中国财政经济出版社，2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫：《策略思维》，中国人民大学出版社，2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫：《妙趣横生博弈论》，机械工业出版社，2009年。博弈指在一定的游戏规则约束下，基于直接相互作用的环境条件，各参与人依据所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。故事1，两人同行打猎，忽遇一猛狮。一人卸下身上物品狂奔，同伴不解，问道：“汝能胜狮？”答曰：“非需胜狮，只需胜汝！” （博弈既可以是竞争，也可以是合作！）游戏1，每位同学写1个介于1与100之间的自然数（整数，包括1与100在内），然后求出所有数字的平均数，如果你所写的数字最接近该平均数的二分之一，那么你将在游戏中胜出。（博弈，必须学会换位思考！）

博弈论经典模型全解析

博弈论经典模型全解析（入门级） 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不

会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是

博弈论第六章习题

第六章习题一、判断下列表述是否正确，并作简单分析（1）完全但不完美信息动态博弈中各博弈方都不清楚博弈的进程，但清楚博弈的得益。答：不一定，不是所有博弈方都不清楚博弈的进程，只要有一个博弈方都不完全清楚博弈的进程。（2）不完美信息动态博弈中的信息不完美性都是客观因素造成的，而非主观因素造成。答：错。信息不完美很多是人为因素所造成的，因为出于各自的动机和目的，人们在市场竞争或合作中常常会故意隐瞒自己的行为。（3）在完全但不完美信息动态博弈中，若不存在混合策略，并且各博弈方都是主动选择且行为理性的，则不完美信息从本质上说是“假的”。答：正确。因为只包含理性博弈方的主动选择行为，利益结构明确，而且不同路径有严格优劣之分，从不需要用混合策略的动态博弈来说，所有博弈方选择的路径都可以通过分析加以确定和预测，根本无须观察。从这个意义上说，这种博弈的不完美信息实际上都是假的。（4）子博弈可以从一个多节点信息集开始。答：不能从多节点信息集开始，因为多节点必然分割信息集。（5）不完美信息是指至少某个博弈方在一个阶段完全没有博弈进程的信息。答：不是完全没有博弈进程的信息，而是没有完美的信息，只有以概率判断形式给出的信息。二、用柠檬原理和逆向选择的思想解释老年人投保困难的原因。

答：“柠檬原理”是在信息不完美且消费者缺乏识别能力的市场中，劣质品赶走优质品，最后搞垮整个市场机制。“逆向选择”是在同样不完美市场和消费者缺乏识别能力的市场中，当价格可变时，价格和质量循环下降，市场不断向低端发展的机制。老年人投保的分析：大致思路是由于信息不对称，费用越来越高，投保人的健康状况好的比例越来越小，最终发展成为只有身体不好的人才参加投保。如果允许调整费率，保险公司为了避免亏损降低风险，上调保费率，健康状况相对好一些的退出市场，整个市场状况恶化。…… 这就是逆向选择机制在老年保险市场上作用的结果。三、用完全但不完美信息动态博弈的思想，讨论我国治理假冒伪劣现象很困难的原因。答：商品交易中的质量问题可以用完全但不完美信息动态博弈来描述。商品交易中的假冒伪劣现象正是这种市场低效率均衡的表现形式。主要因素包括：（1）信息不完美程度比较严重。信誉的建立有差距，信息不对称现象严重等；（2）消费者识别能力低下而且麻木。不法商贩的造假成本低，消费者识别能力低下，而且容忍麻木，知假买假，很难治理（如盗版等）；（3）暴力空间的存在。价格水平不合理，定价过高，垄断暴利，造价者利润空间大。（4）对造价者打击不力。执法部门、政府管理部门打击力度不够，而且保护甚至纵容（“激励的悖论”）；（5）我国社会经济环境的变化太大，稳定性比较差。

高鸿业《西方经济学(微观部分)》(第6版)课后习题详解(博弈论初步)【圣才出品】

第10章博弈论初步 1．什么是纳什均衡？纳什均衡一定是最优的吗？答：（1）纳什均衡指的是参与人的这样一种策略组合，在该策略组合上，任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中，当所有其他人都不改变策略时，没有人会改变自己的策略，则该策略组合就是一个纳什均衡。（2）纳什均衡不一定是最优的。因为每个人从自己理性出发所做出的选择在社会看来可能就不是最优的，存在如“囚徒困境”之类的情况。 2．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡最多可有几个？为什么？答：在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡最多可以有四个。分析如下：在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纳什均衡仅仅要求每个人在对方不改变策略的前提下自己也不改变策略，即参与人是消极应对的。所以，可能存在四个纯策略的纳什均衡，一个一般的例子如表10-1所示。表10-1 参与人A、B的支付矩阵

表10-4中，若满足1121a a =、1222a a =、1112b b =和2122b b =，则该博弈矩阵存在四个纯策略纳什均衡（1111,a b ）、（2222,a b ）、（1212,a b ）和（2121,a b ）。 3．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡可能有三个。试举一例说明。答：一个一般的例子如表10-2所示。表10-2中，若满足1121a a =、1222a a =、1112b b =、 2122b b >，则该博弈矩阵存在三个纯策略纳什均衡（11a ，11b ）、（21a ，21b ）和（12a ，12b ）。表10-2 参与人A 、B 的支付矩阵 4．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，如何找到所有的纯策略纳什均衡？答：在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，可以用“条件策略下划线法”找到所有的纯策略纳什均衡。分析如下：例如，对于甲乙两个厂商，对于是否合作的选择。首先，是用下划线来表示甲厂商的条件策略。例如，当乙厂商选择合作时，甲厂商的条件策略得出方法如下，比较甲选择合作和非合作时甲的利益的大小，哪个数字大就在该数字下画一条横线；同理，当乙厂商选择不合作时，甲比较选择合作和非合作时甲的利益的大小，哪个数字大就在该数字下画一条横线。其次，用下划线来表示乙厂商的条件策略。道理是一样的，只不过是乙比较合作与非合作的收益，在收益大的数字下划横线。

高鸿业,微观经济学,第七版,课后答案,西方经济学18第十章博弈论初步

第十章博弈论初步第一部分教材配套习题本习题详解一、简答题１．什么是纳什均衡？纳什均衡一定是最优的吗？解答：（１）所谓纳什均衡，是参与人的一种策略组合，在该策略组合上，任何参与人单独改变策略都不会得到好处。（２）不一定。如果纳什均衡存在，纳什均衡可能是最优的，也可能不是最优的。例如，在存在多个纳什均衡的情况下，其中有一些纳什均衡就不是最优的；即使在纳什均衡是唯一时，它也可能不是最优的，因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如：囚徒困境。２．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡最多可有几个？为什么？解答：在只有两个参与人（如Ａ和Ｂ）且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡最多可有四个。例如，当Ａ与Ｂ的支付矩阵可分别表示如下时，总的支付矩阵中所有四个单元格的两个数字均有下划线，从而，总共有四个纳什均衡。 A 的支付矩阵＝??????22211211a a a a B 的支付矩阵＝??? ???2221 1211b b b b 例如：a 11=a 12=a 21=a 22，b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。具体事例为： 73737373?? ?? ??

３．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡可能有三个。试举一例说明。解答：在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡可能有４个、３个、２个、１个和0个五种情况，所以可能有３个。例如，当参与人Ａ与Ｂ的支付矩阵可分别表示如下时，总的支付矩阵中恰好有三个单元格的两个数字均有下划线，从而，总共有三个纳什均衡。 A 的支付矩阵＝ ??? ???22211211a a a a B 的支付矩阵＝11122122b b b b ???????? A 、 B 共同的支付矩阵＝1111121222222121a b a b a b a b ?? ?????? 具体事例为： 76157323?? ?? ?? ４．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，如何找到所有的纯策略纳什均衡？解答：可使用条件策略下划线法。具体步骤如下：首先，把整个博弈的支付矩阵分解为两个参与人的支付矩阵；其次，在第一个（即位于整个博弈矩阵左方的）参与人的支付矩阵中，找出每一列的最大者，并在其下画线；再次，在第二个（在位于整个博弈矩阵上方的）参与人的支付矩阵中，找出每一行的最大者，并在其下画线；然后，将已经画好线的两个参与人的支付矩阵再合并起来，得到带有下划线的整个博弈的支付矩阵；最后，在带有下划线的整个的支付矩阵中，找到两个数字之下均画有线的支付组合。由该支付组合代表的策略组合就是博弈的纳什均衡。５．设有Ａ、Ｂ两个参与人。对于参与人Ａ的每一个策略，参与人Ｂ的条件策略有无可能不止一个？试举一例说明。解答：例如，在如表１０—１的二人同时博弈中，当参与人Ａ选择上策略时，参与人Ｂ既可以选择左策略，也可以选择右策略，因为他此时选择这两个策略的支付是完全一样的。因此，对于参与人Ａ的上策略，参与人Ｂ的条件策略有两个，即左策略和右策略。表１０—１

耶鲁大学博弈论_精简版

第一讲导论-五个入门结论 1.通过成绩博弈模型可以知道，不选择严格劣势策略，因为每次博弈会得到更好的收益。 2.通过囚徒的困境博弈模型可以知道，理性选择导致次优的结果（协商难以达成目的的原因不是因为缺少沟通，而是没有强制力）。 3.通过愤怒天使博弈模型可以知道，汝欲得之，必先知之；永远选择优势策略，选择非劣势策略，损失小，如果对手有优势策略则应以此作为选择策略的指导。 4.如果想要赢，就应该站在别人的立场去分析他们会怎么做。第二讲学会换位思考 1.构成博弈要素包括，参与人，参与人的策略以及收益。 2.所谓严格优势策略，就是指不论对方采取什么策略，采取的这个策略总比采取其他任何策略都好的策略。 3.在博弈中剔出某些选择时需要站在别人的角度去思考结果，因为对手不会选择劣势策略；同时要考虑到对手也是一个理性的参与人。 4.在博弈中剔除某些选择是一种直接思考，同时也是作为一个理性参与人的选择。第三讲迭代剔除和中位选民定理 1.在选民投票博弈模型中，通过不断地迭代以及剔除来决定策略，由此，我们得到了一种新的选择策略的方法：迭代剔除法。 2.选民投票博弈模型的结果与现实存在偏差，主要是因为：①现实中选民并不是均匀分布的；②选民通常根据候选人的性格而非政治立场来进行投票，而政治立场只是单一维度；③只适用于只有两个候选人的情况；④同时存在弃权票；⑤选民未必相信候选人所声明的立场。 3.建立模型，是为了更好的描述事实以激发灵感，模型是有重要的事是抽象而来，逐步增加约束条件完善模型观察结果，比较分析结果的变化。第四节足球比赛与商业合作之最佳对策 1.点球博弈模型告诉我们，不要选择一个在任何情况或信念下都不是最佳对策的策略。 2.最佳对策：①参与人针对对手策略的定义：参与人i的策略s^i（简写成BR）是对手策略S-i的最佳对策，如果参与人i在对手的策略S-i下选S^i的收益弱优于其它对策Si`，这对参与人i的所有Si`都适用，则策略S^i是其它参与人策略S-i的最佳对策。S^i最大化了对手选S-i时我的收益；②最佳对策广义定义：参与人i的策略S^i是最佳策略（你对其他参与人可能采取的策略持信念P时的最佳策略），在参与人i仍持信念P的情况下选S^i 的获得预期收益比在同样的信念P下选其它的策略获得的预期收益都要高（对于所有可选的Si`均成立）即Eu（S^i，P）≥Eu（Si`，P） Si` in Si 我从Si选择可选策略时S^i而非S-i最大化了我的预期收益。第五讲坏风气与银行挤兑 1.纳什均衡，即对任意一个此博弈内的参与者A，他所选择的策略是其他参与人所选策略的最佳策略。

高鸿业《西方经济学(微观部分)》(第6版)笔记(第10章博弈论初步)

高鸿业《西方经济学（微观部分）》（第6版）第10章博弈论初步复习笔记跨考网独家整理最全经济学考研真题，经济学考研课后习题解析资料库，您可以在这里查阅历年经济学考研真题，经济学考研课后习题，经济学考研参考书等内容，更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验，从前辈中获得的经验对初学者来说是宝贵的财富，这或许能帮你少走弯路，躲开一些陷阱。以下内容为跨考网独家整理，如您还需更多考研资料，可选择经济学一对一在线咨询进行咨询。博弈论在20世纪50年代由数学家约翰·冯·诺依曼和经济学家奥斯卡·摩根斯坦引入经济学，目前已经成为主流经济分析的主要工具，对寡头理论、信息经济学等经济理论的发展作出了重要贡献。一、博弈论的几个基本概念博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。在策略性环境中，每一个人进行的决策和采取的行动都会对其他人产生影响。因此，每个人在进行策略性决策和采取策略性行动时，要根据其他人的可能反应来决定自己的决策和行动。 1．博弈参与人参与人或称局中人，是指博弈中的决策主体，即在博弈中进行决策的个体。参与人既可以是个人，也可以是团体（企业或国家）。 2．策略策略是指参与人选择行为的规则，也就是指参与人应该在什么条件下选择什么样的行动，以保证自身利益最大化。 3．支付函数支付函数也称为效用函数，表明了博弈的参与人采取的每种策略组合的结果或收益，它是所有参与人策略或行动的函数，是每个参与人真正关心的东西。 4．支付矩阵参与博弈的多个参与人的收益可以用一个矩阵或框图表示，这样的矩阵或框图称之为支付矩阵，也称之为博弈矩阵或收益矩阵。其中，博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。二、完全信息静态博弈：纯策略均衡 1．条件策略和条件策略组合在同时博弈中，在给定其他参与人的策略时，某个参与人的最优策略称之为该参与人的条件优势策略（简称条件策略），而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件优势策略组合（简称条件策略组合）。 2．纳什均衡如表10-1所示，（不合作，不合作）既是甲厂商的条件策略组合，也是乙厂商的条件策略组合，在该策略组合上，甲厂商和乙厂商都没有单独改变策略的倾向。表10-1 寡头博弈：合作与不合作

生活中的博弈论感悟(优.选)

《生活中的博弈论》学习感悟第一讲初试博弈论生活中的资源是有限和稀缺的，于是就产生了竞争，这种竞争就需要一种形式把大家聚在一起，这种形式就是博弈。博弈论是在力图在最简单的假设下得到最大范围的推广和应用，其伟大在于对后世的引导和激发作用。博弈论不仅从古代就散发着智慧，还体现在我们生活中的种种小事中，如双方互拨打电话，放弃球赛陪女友逛街等。博弈论是建立在博弈双方或者多方都属于理性人的基础上，通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素，博弈者做出对自己最有利最保险的决策和行动，从而使得自己能达到获利或者获胜的目的。每个人都可以成为博弈高手，但人的决策又具有有限理性，因此博弈论也不是万能的。第二讲纳什均衡在某一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲，勿施于我。

囚徒困境博弈反映个人最佳选择并非团体最佳选择。用囚徒困境博弈对两个势均力敌的竞争对手进行分析，可以发现合作是可以实现双赢的。如：两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。此二公司可以有二选择：互相达成协议，减少广告的开支。（合作）增加广告开支，设法提升广告的质量，压倒对方。（背叛）若二公司不信任对方，无法合作，背叛成为支配性策略时，二公司将陷入广告战，而广告成本的增加损害了二公司的收益，这就是陷入囚徒困境。在现实中，要二互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。第四讲斗鸡博弈所谓“斗鸡博弈”就是两只公鸡面对面斗争，继续斗下去，两败俱伤；一方退却便意味着认输。在这样的博弈中，要想取胜，就要在气势上压倒对方，至少要显示出破釜沉舟、被谁一站的决心来，以迫使对方退却。但到最后的关键时刻，必有一方要退下来，除非真正抱定鱼死网破的决心。学习了知识，就要善于联想，善于联系生活。在很多的时候我们都可能是在不知不觉中就使用了或者是接触到了博弈论，就像是平常我们和其他人之间的争执问题，每次都可能弄得脸红脖子粗的，双方都不服气，最终的结果是有一个人妥协，然后彼此达成一致；冷战期间的美苏两大军事集团的争斗也是一种“斗鸡博弈”。

博弈论与策略行为

博弈论与策略行为 G a m e T h e o r y a n d S t r a t e g y B e h a v i o r 蔡继明教授/主任清华大学政治经济学研究中心 Center for Political Economy at Tsinghua University CPET

目录第一讲：导论一、博弈论的研究对象第二讲：占优战略与社会两难第三讲：纳什均衡和双人博弈第四讲：三人博弈与n人博弈第五讲：纯战略和混合战略第六讲：博弈的合作解第七讲：序贯博弈与子博弈完美均衡第八讲：重复博弈第九讲：企业经营决策的博弈分析第十讲：企业内部组织分析第十一讲：政府行为分析第一讲导论博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略（给自己带来最大收益的策略）。二、博弈论的产生和发展博弈又称博戏，是一门古老的游戏。 1. 博弈在中国《学弈》（《孟子 ?告子》）：弈秋，通国之善弈也。使弈秋侮二人弈，其一人专心致志，惟弈秋之为听；一人虽听之，一心以为有鸿鹄将至，思援弓缴而射之。虽与之俱学，弗若之矣。为是其智弗若与？吾曰：非然也。《世本》说，“乌曹作博”，乌曹乃是夏代著名之能工巧匠。千百年来，博弈更是与人们的生活紧紧相连，从博棋到牌戏，从斗戏到彩票，中华民族的历史长河中就这样形成了别具风情的博弈文化从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战

博弈论理论经典讲解

博弈论经典案例冰晶淩（杂物区）2010-04-09 22:31:28 阅读258 评论0 字号：大中小订阅引用光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家：纳什，泽尔腾和海萨尼．而博弈论可以划分为合作博弈和非合作博弈．那三位博弈论专家的贡献主要是在非合作博弈方面，而且现在经济学家谈到博弈论，一般指的是非合作博弈，很少指合作博弈．合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时，当事人能否达成一个具有约束力的协议，如果有，就是合作博弈；反之，就是非合作博弈．非合作博弈强调的是个人理性，个人最优决策，其结果可能是有效率的，也可能是无效率的．而合作博弈强调的是团体理性．下面是我收集的张维迎教授的几个有关博弈论的经典案例．＜案例一：囚徒困境＞囚徒困境讲的是两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里审讯．警察告诉他们：如果两人都坦白，各判刑8年；如果两个都抵赖，各判1年(或许因证据不足)；如果其中一人坦白一人抵赖，坦白的放出去，不坦白的判刑10年(这有点＇坦白从宽，抗拒从严＇的味道)．这里，每个囚徒都有两种战略：坦白或抵赖．表中每一格的两个数字代表对应战略组合下两个囚徒的支付（效用），其中第一个数字是第一个囚徒的支付，第二个数字为第二个囚徒的支付．战略形式又称标准形式，是博弈的两种表述形式之一，它特别方便于静态博弈分析．在这个例子里，纳什均衡就是（坦白，坦白）：给定B坦白的情况下，Ａ的最优战略是坦白；同样，给定Ａ坦白的情况下，Ｂ的最优战略也是坦白．事实上，这里，（坦白，坦白）不仅是纳什均衡，而且是一个占优战略均衡．就是说，不论对方如何选择，个人的最优选择是坦白．比如说，如果Ｂ不坦白，Ａ坦白的话被放出来，不坦白的话判１年，所以坦白比不坦白好；如果Ｂ坦白，Ａ坦白的话判８年，不坦白的话判１０年，所以，坦白还是比不坦白好。这样，坦白就是Ａ占优战略；同样，坦白也是Ｂ的占优战略．结果是，每个人都选择坦白，各判刑８年．＜案例二：智猪博弈＞这个例子讲的是，猪圈里有两头猪，一大一小．猪圈的一头有一个猪食槽，另一头安装一个按钮，控制着猪食的供应。按一下按钮会有１０个单位的猪食进槽，但谁按按钮需要付２个单位的成本．若大猪先到，大猪吃到９个单位，小猪只能吃１个单位；若同时到，大猪吃７个单位，小猪吃３个单位；若小猪先到，大猪吃６个单位，小猪吃４个单位。表中第一格表示两猪同时按按钮，因而同时走到猪食槽，大猪吃７个，小猪吃３个，扣除２个单位的成本，支付水平分别为５和１．其他情形可以类推．在这个例子中，什么是纳什均衡？首先我们注意到，无论大猪选择＂按＂还是＂等待＂，小猪的最优选择均是＂等待＂．比如说给定大猪按，小猪也按时得到１个单位，等待则得到４个单位；给定大猪等待，小猪按得到－１单位，等待则得０单位，所以，＂等待＂是小猪的占优战略．给定小猪总是选择＂等待＂，大猪的最优选择只能是＂按＂．所以，纳什均衡就是：大猪按，小猪等待，各得４个单位．多劳者不多得！＜案例三：性别战＞

博弈论复习大纲下

博弈论第六讲--第九讲复习大纲第六讲声誉和对称信息重复博弈 1、重复博弈（Repeated Game）：是动态博弈的一种特殊情况。在重复博弈里，完全相同的环境一次次重复出现，参与人在重复出现的相同环境中做出决策。重复博弈是一类很重要的动态博弈。 2、有限次重复博弈例子：连锁店悖论：现象---博弈的重复进行对进入威慑博弈和囚徒困境的结果基本上没有影响；结论---在位者在包括第1个市场的所有市场上都将选择合谋。这个结论称为连锁店悖论。通过对连锁店悖论的分析，得出结论：如果当事人完全理性，有限次重复博弈的均衡解和一次博弈没有区别。把这个结论推广到囚徒困境博弈中，就是说，尽管两个人都选择不坦白是集体最优的，但如果同样的博弈重复有限次，这个重复博弈的均衡仍然是（坦白，坦白）。重复博弈比不重复进行的一次性博弈要复杂得多。在现实中，如果当事人不那么理性，或者看起来不那么理性，那么有限次重复博弈的结果有可能和一次博弈不同。那么在有限次博弈的囚徒困境中，就有可能实现（抵赖、抵赖）的结果。 3、无名氏定理：重复博弈中最重要也是最有名的结果是“无名氏定理”，该定理认为，只要局中人有足够的耐心，那么任何理性的可行盈利都可以在均衡中得以实施。换句话说，只要局中人的耐心足够地大，一次博弈中可行的理性结局总是可以与重复博弈中某均衡结局相一致。无名氏定理告诉我们：在无限次重复博弈中声称完美均衡导致了某一特定的行为是没有意义的。 4、声誉：在重复进行的囚徒困境博弈里，只有博弈将重复进行无限次时，参与人才会选择合作。这是声誉的一个大问题。因为每个人都知道一个参与人将在最后一期选择坦白，那么为什么他们还要假设这个参与人会在目前建立起自己的声誉呢？声誉应用： 5、折现率的概念以及无限次重复博弈中合作条件的推导，以产量卡特尔为例。 6、价格竞争对制造商的影响 7、进化与囚徒困境，鸽鹰博弈

博弈论的基本概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者：参与者是指一个博弈中的决策主体，通常又称为参与人或局中人。参与人的目的是通过合理悬着自己的行动，以便取得最大化的收益。参与者可以是自然人，也可以是团体。 ?信息：信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要，每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略：策略是参与者如何对其他参与者的行动作出反应的行动规则，它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略，用S i表示参与者i的所有可选择的策略的集合（又成为而i的策略空间）。如果n个参与者没人选择一个策略，那么s=（s1，s2，…，s n）称为一个策略组合。 ?收益：收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益，它是策略组合的函数。 ?均衡：均衡是所有参与者的最优策略组合，记为s*。几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕，并受到指控。除非至少一人认罪，否则警方无充分证据将他们按最论刑。警方把他们隔离审讯，并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度，因警方证据不足，两人将均被判为轻度犯罪入狱一个月；如果双方都坦白，根据案情两人将被判入狱六个月；如果一个招认而另一个拒不坦白，招认者因由主动认罪立功的表现将立即释放，而另一人将被判入狱九个月。

黄亚钧《微观经济学》(第3版)习题详解(第6章博弈论)

黄亚钧《微观经济学》（第3版）第六章博弈论课后习题详解跨考网独家整理最全经济学考研真题，经济学考研课后习题解析资料库，您可以在这里查阅历年经济学考研真题，经济学考研课后习题，经济学考研参考书等内容，更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验，从前辈中获得的经验对初学者来说是宝贵的财富，这或许能帮你少走弯路，躲开一些陷阱。以下内容为跨考网独家整理，如您还需更多考研资料，可选择经济学一对一在线咨询进行咨询。 1．解释下列概念上策上策均衡纳什均衡混合博弈重复博弈序列博弈威胁承诺答：（1）上策上策是指无论对方如何选择都使自己利益极大化的策略。（2）上策均衡在一些特殊的博弈中，一个参与人的最优策略可能并不依赖于其他人的选择。也就是说，无论其他参与人采取什么策略，该参与人的最优策略是唯一的，这样的策略称之为上策均衡。如表6-5所示，通过对支付矩阵的分析可以看出，如果A、B两厂商都是理性的，则这个博弈的结果是两厂商都做广告，即不管一个厂商如何决定，另外一个厂商都会选择做广告。这种策略均衡称之为上策均衡。表6-5 广告博弈的支付矩阵（3）纳什均衡纳什均衡又称为非合作均衡，是博弈论的一个重要术语，以提出者约翰·纳什的名字命名。纳什均衡是指这样一种策略集，在这一策略集中，每一个博弈者都确信，在给定竞争对手策略的情况下，他选择了最好的策略。纳什均衡是由所有参与人的最优战略所组成的一个战略组合，也就是说，给定其他人的战略，任何个人都没有积极性去选择其他战略，从而没有人有积极性去打破这个均衡。（4）混合博弈不是单一的策略或者纯策略，而是把不同的策略混合在一起使用，这种博弈称为“混合策略”博弈。混合策略博弈中，对局者必须遵循的原则：①不能让对方事先知道自己可能采取的策略； ②必须采取随机选择的原则；③选择策略的概率一定要使对方无机可乘。也就是说，一方选择的概率要使对方无法通过选择某一策略而占有优势。（5）重复博弈

耶鲁大学——博弈论

中文片名: 耶鲁大学开放课程：博弈论英文片名: Open Yale course：Game Theory 剧集分类: 悬疑影片类型: 教学资源格式: RMVB 上影时间: 2010 导演: 主演: 对白语言: 英语字幕语种: 中英介绍: 中文名: 耶鲁大学开放课程：博弈论英文名: Open Yale course：Game Theory 版本: 更新完毕[MOV] 发行时间: 2009年地区: 美国对白语言: 英语字语言: 英文简介: 课程类型：经济课程介绍：这门课程是系统介绍有关博弈论和战略思想。比如支配思想、落后的感应、纳什均衡、进化稳定性、承诺，信誉，信息不对称，逆向选择等。并在课堂上提供了各种游戏以及经济、政治，电影和其他方面的案例来讨论。关于课程主讲人： Ben Polak教授任职于耶鲁大学管理学院经济系。他在剑桥大学Trinity College获得学士学位，在西北大学获得硕士学位，在哈佛大学获得博士学位。他是微观经济理论和经济史方面的专家。他的论文在Economic Letters、Journal of Economic Theory、Journal of Economic History、Journal of Legal Studies、Journal of Theoretical and Institutional Economics、Econometrica等学术期刊多次发表。他最近的研究是“广义功利主义和海萨尼的公正观察员定理”和“平均分散的偏好” 课程结构：本耶鲁大学课程每周在学校上两次课，每次75分钟，2007年秋季拍摄作为耶鲁大学开放课程之一。课程安排： 1. Introduction: five first lessons

《运筹学》_第六章排队论习题及_答案

《运筹学》第六章排队论习题转载请注明 1. 思考题（1）排队论主要研究的问题是什么；（2）试述排队模型的种类及各部分的特征；（3）Kendall 符号C B A Z Y X /////中各字母的分别代表什么意义；（4）理解平均到达率、平均服务率、平均服务时间和顾客到达间隔时间等概念；（5）分别写出普阿松分布、负指数分布、爱尔朗分布的密度函数，说明这些分布的主要性质；（6）试述队长和排队长；等待时间和逗留时间；忙期和闲期等概念及他们之间的联系与区别。 2．判断下列说法是否正确（1）若到达排队系统的顾客为普阿松流，则依次到达的两名顾客之间的间隔时间服从负指数分布；（2）假如到达排队系统的顾客来自两个方面，分别服从普阿松分布，则这两部分顾客合起来的顾客流仍为普阿松分布；（3）若两两顾客依次到达的间隔时间服从负指数分布，又将顾客按到达先后排序，则第1、3、5、7，┉名顾客到达的间隔时间也服从负指数分布；（4）对1//M M 或C M M //的排队系统，服务完毕离开系统的顾客流也为普阿松流；（5）在排队系统中，一般假定对顾客服务时间的分布为负指数分布，这是因为通过对大量实际系统的统计研究，这样的假定比较合理；（6）一个排队系统中，不管顾客到达和服务时间的情况如何，只要运行足够长的时间后，系统将进入稳定状态；（7）排队系统中，顾客等待时间的分布不受排队服务规则的影响；（8）在顾客到达及机构服务时间的分布相同的情况下，对容量有限的排队系统，顾客的平均等待时间少于允许队长无限的系统；（9）在顾客到达分布相同的情况下，顾客的平均等待时间同服务时间分布的方差大小有关，当服务时间分布的方差越大时，顾客的平均等待时间就越长；（10）在机器发生故障的概率及工人修复一台机器的时间分布不变的条件下，由1名工人看管5台机器，或由3名工人联合看管15台机器时，机器因故障等待工人维修的平均时间不变。 3．某店有一个修理工人，顾客到达过程为Poisson 流，平均每小时3人，修理时间服从负指数分布，平均需19分钟，求：（1）店内空闲的时间；（2）有4个顾客的概率；（3）至少有一个顾客的概率；（4）店内顾客的平均数；（5）等待服务的顾客数；（6）平均等待修理的时间；（7）一个顾客在店内逗留时间超过15分钟的概率。 4．设有一个医院门诊，只有一个值班医生。病人的到达过程为Poisson 流，平均到达时间间隔为20分钟，诊断时间服从负指数分布，平均需12分钟，求：（1）病人到来不用等待的概率；（2）门诊部内顾客的平均数；（3）病人在门诊部的平均逗留时间；（4）若病人在门诊部内的平均逗留时间超过1小时，则医院方将考虑增加值班医生。问病人平均到达率为多少时，医院才会增加医生？ 5．某排队系统只有1名服务员，平均每小时有4名顾客到达，到达过程为Poisson 流，，服务时间服从负指数分布，平均需6分钟，由于场地限制，系统内最多不超过3名顾客，求：

高鸿业《西方经济学(微观部分)》(第6版)名校考研真题详解(第十章博弈论初步)【圣才出品】

第十章博弈论初步一、名词解释 1．占优策略均衡（中央财经大学2011研；兰州大学2014研）答：在一些特殊的博弈中，一个参与人的最优策略可能并不依赖于其他人的选择。也就是说，无论其他参与人采取什么策略，该参与人的最优策略是唯一的，这样的策略称之为占优策略。如表10-1所示，通过对支付矩阵的分析可以看出，如果A、B两厂商都是理性的，则这个博弈的结果是两厂商都做广告，即不管一个厂商如何决定，另外一个厂商都会选择做广告。这种策略均衡称之为占优策略均衡。表10-1 广告博弈的支付矩阵 2．纳什均衡（华中科技大学2002研；中国海洋大学2002研；东北大学2003研；武汉大学2003、2007研；北京大学2004研；北京师范大学2005、2014研；中南大学2005研；东华大学2006研；东北财经大学2007研；中南财经政法大学2007、2009、2015研；中央财经大学2007、2015研；财政部财政科学研究所2008研；华南师范大学2011研；北京理工大学2013研；厦门大学2013研；中南大学2016研）答：纳什均衡又称为非合作均衡，是博弈论的一个重要术语，以提出者约翰·纳什的名字命名。

纳什均衡是指这样一种策略集，在这一策略集中，每一个博弈者都确信，在给定竞争对手策略的情况下，他选择了最好的策略。纳什均衡是由所有参与人的最优战略所组成的一个战略组合，也就是说，给定其他人的战略，任何个人都没有积极性去选择其他战略，从而没有人有积极性去打破这个均衡。 3．混合策略（东北大学2007研；华中科技大学2008研）答：混合策略是指在博弈中，博弈方的决策内容不是确定性的具体的策略，而是在一些策略中随机选择的概率分别的策略。混合策略情况下的决策原则有以下两个：（1）博弈参与者互相不让对方知道或猜到自己的选择，因而必须在决策时利用随机性来选择策略，避免任何有规律性的选择。（2）博弈参与者选择每种策略的概率一定要恰好使对方无机可乘，即让对方无法通过有针对性倾向的某一种策略而在博弈中占上风。 4．以牙还牙策略（东北财经大学2012研）答：以牙还牙策略的内容是：所有的成员一开始是合作的。对于每一个成员来说，只要其他成员是合作的，则他就把合作继续下去。但只要有一个成员一旦背弃合作协议采取不合作的策略，则其他成员便会采取“以牙还牙”的惩罚和报复策略，即其他成员都采取相同的不合作策略，并将这种不合作的策略在重复博弈中一直进行下去，以示对首先破坏协议者的惩罚和报复。博弈论分析中，寡头厂商的合作是不稳定的，易陷入“囚徒困境”。在具有“以牙还牙”策略的无限次重复博弈中，所有的寡头厂商则都会遵守协议，采取合作的策略。

用博弈论分析大国间的政治博弈

大国间的政治博弈二十年前，世界由美苏主导，对于其他国家而言，只有唯唯诺诺的份儿，因为美苏无论在军事还是经济，对别国都有绝对优势。苏联解体后，超级大国美国也难独霸天下。事实也已证明，不会再有哪一个国家有能力让全世界都对其言听计从（至少今天没有，明天不会）。分析二十年前，世界几乎是处在一种零和状态中，尤其是大国对小国。小国不听话了，大国可以随便经济制裁你，武力威胁你，甚至揍你，小国基本上只能处于被动状态。虽然，苏联解体后，美国凭其遥遥领先的经济实力，绝对强大的军事实力，仍然可以成为超级大国，但还可以号令天下吗？那只是美国人的一厢情愿罢了！从1991年，美国人的确打了几次漂亮的仗，但打出了美国人一统天下的局面吗？没有。美国人想再次以武力恫吓世界，已经不大可能。眼下的世界，需要的是共赢。没有国家能代表全世界，却又各自想着如何让自己的利益最大化，自然而然的，世界将进入一种非零和博弈状态。（博弈论简介：The theory of relative balance about the mobile addicts and soul of animals in the nature and in the expectation of decision makers is called the game theory. (quoted from the article “The Blue Files Unknown to Humankind”in Bible of Game Theory。博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的；或者指动物利用大自然移动的瘾魂，在决策人期待的空间里，形成相对均衡的语文学理论。其应用有著名的纳什

文档之家