当前位置：文档之家› 博弈论第四章习题

博弈论第四章习题

第四章习题

一、如果T次重复齐威王田忌赛马，双方在该重复博弈中的策略是什么？博弈结果如何？

答：因为这是零和博弈，结论比较具体。重复Nash 均衡，均以1/6的概率选择各个策略，期望收益分别为1和-1。

因为这是竞争性的零和博弈，无论是有限次重复博弈还是无限次的重复博弈，均不能达成合作的条件。

二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。

答：火车站和机场餐饮业的服务的顾客往往是一次性的，回头客和常客也比较少，价格高，质量差，一次性博弈。效率也比较低。

商业区和居民区的餐饮业和商业服务业，回头客和常客比较多，比较注重信誉，质优、价廉，重复博弈。效率也比较高。

三、有限次重复博弈和无限次重复博弈有什么区别？这些区别对我们有什么启发？

答：动态博弈的逆向归纳法可以用于有限次重复博弈，但不能用于无限次重复博弈，主要用逆向归纳法。

无限次重复博弈的效率往往高于有限次重复博弈。当重复次数较少不一定考虑贴现问题，但无限次重复博弈必须考虑贴现问题。

启发：重视有限次与无限次的区别，区分和研究这两类博弈，在实践方面重要启发是促进和保持经济的长期稳定和可持续发展，提高社会经济效率是非常有意义的。

四、判断下列表述是否正确，并作简单讨论：

（1）有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。

答：不一定。对于有两个以上纯策略纳什均衡的条件下就不一定。如“触发策略”就不是。

（2）有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。

答：是，根据子博弈完美纳什均衡的要求，最后一次必须是原博弈的一个纳什均衡。

（3）无限次重复博弈均衡解的得益一定优于原博

弈均衡解的得益。

答：错。如严格竞争的零和博弈就不优于。

（4）无限次重复古诺产量博弈不一定会出现合谋生产垄断产量的现象。

答：正确。合谋生产垄断产量是有条件的，由贴现率来反映，当不满足条件时，就不能构成激励。

（5）如果博弈重复无限次或者每次结束的概率足够小，而得益的时间贴现率充分接近1，那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。

答：这就是无限次重复博弈的民间定理。

（6）触发策略所构成的均衡都是子博弈完美纳什均衡。

答：错误。触发策略本身并不能排除重复博弈中不可信的威胁和承诺，因此由触发策略构成的不一定是子博弈完美纳什均衡。

五、为什么消费者偏好去大商店买东西而不太信赖走街穿巷的小商贩？

答：去大商店买东西，重复博弈——合作诚信问题；走街穿巷的小商贩，一次性博弈——没有合作的必要，存在不诚信和欺诈。

建立信用制度和诚信档案的必要性。

六、寡头的古诺产量博弈中，如果市场需求130P Q =-，边际成本30C =且没有固定成本，贴现因子0.9δ=。如果该市场有长期稳定性，问两个厂商能否维持垄断产量？

解：???---=

---=222121121130)13030)130q q q q q q q q （（ππ，古诺产量 3100*2

1==q q ，利润为：910000*2*1==ππ 垄断产量q q q 30)130--=（π，

250050==?m m q π，市场长期稳定的，

12502=m π 1250011250112502=-=+++δ

δδ）（，9.0=δ 如果一厂商偏离：111130)25130q q q ---=

（π，5.371=?q ，25.1406**1=π 那么：）

（）（δδδδ-+=+++191000025.140691000025.14062 1250025.114061000025.1406《=+=

因此，坚持垄断产量是明智的。

博弈论案例分析

博弈论博弈论（Game Theory），亦名―对策论‖、―游戏理论‖，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自选择的行为或是策略进行选择并加以实施，并从各自取得相应结果或收益的过程，在经济学上博奕论是个非常重要的理论概念。什么是博弈论？古语有云，世事如棋。生活中每个人如同棋手，其每一个行为如同在一张看不见的棋盘上布一个子，精明慎重的棋手们相互揣摩、相互牵制，人人争赢，下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们―出棋‖ 招数中理性化、逻辑化的部分，并将其系统化为一门科学。换句话说，就是研究个体如何在错综复杂的相互影响中得出最合理的策略。现在，我们就一些例子来讨论博弈论相关内容。一、从“囚徒困境”开始在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的―囚徒困境‖（prisoners’ dilemma）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。表囚徒困境博弈 [Prisoner's dilemma] 我们来看看这个博弈可预测的均衡是什么。对A来说，尽管他不知道B作何选择，但他知道无论B选择什么，他选择―坦白‖总是最优的。显然，根据对称性，B也会选择―坦白‖，结果是两人都被判刑8年。但是，倘若他们都选择―抵赖‖，每人只被判刑1年。在表2.2中的四种行动选择组合中，（抵赖、抵赖）是帕累托最优的，因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出，―坦白‖是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占优战略均衡。要了解纳什的贡献，首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲―囚犯的两难处境‖的例子，每本书上的例子都大同小异。话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人，斯卡尔菲丝和那库尔斯，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

基于博弈论的夫妻冲突分析

一个女人能有多美，通常是由与她相伴的男人来决定；一个男人能走多远，往往是由与他相随的女人来决定。夫妻之间的物质生活水平，通常是由收入较高的一方来决定；夫妇之间的精神生活水平，往往是由素质较低的一方来决定。囚徒困境在囚徒困境这个例子中，两个囚犯的上策都是坦白，因此最容易出现的结局也就是两人都被判5年。这个结局构成了一种博弈均衡状态，当对局者选择的都是上策的时候，这种均衡叫做上策均衡。在博弈论中，所谓均衡是指一种稳定的结局，当这种结局出现的时候，所有对局者都不想再改变他们所选择的策略。二．情侣冷战对峙现将囚徒困境的报酬矩阵分析引入到一对情侣的冷战对峙中，见下图： H表示主动的一方感觉自己付出更多从而受到伤害，生出不平衡感；E代表不主动的一方有种优越成就感谈过恋爱的人都会对此有深刻的体会吧。闹矛盾有别扭之后，有时也可能两人都想主动了，但谁也不先迈出这一步，在不知道对方策略和想法的情况下，一权衡一算计就总害怕自己亏了，又或者碍于情面拉不下面子，不肯服个软。于是乎，秋水望穿了，花瓣也掰完了，最后是怎样呢？在这个矩阵中我们需要考虑的是，或者说我们的假设前提是，双方都是完全理性的，是完全以利己目的和最大化利益为原则行事的人。上策均衡显然并非最好的结局，但却是博弈双方经过反复权衡后所采取的认为对自己最有利的选择。但我们知道，所谓的爱情是没有理性可言的，它是一种激情，一旦斤斤计较反复权衡利弊得失，那就不叫爱。所以非常有意思的是，这个矩阵中出现的上策均衡（O,O——OVER），即双方都不主动从而导致感情破裂爱情失败的结局，正说明了爱情只要一权衡一算计，俩人都矜持和自私的话，那么最终铁定玩完。三、夫妻关系的博弈分析感情，爱情，亲情夫妻关系尴尬的了现实的活动中，夫妻关系既有和谐、融洽的一面，也存在冲突、矛盾的一面。每5对佳侣新婚燕尔之时，就有一对夫妻分道扬镳。无论是丈夫还是妻子，双方都有自己的利益追求和价值取向，而家庭生活成为他们博弈的载体和工具。

博弈论期末习题

《博弈论》期末习题专业：经济学学号：2 ；姓名：王兆丽一、试写出掷硬币博弈的局中人及其策略与得益函数，并写出双变量得益矩阵。答：局中人：盖硬币者和猜硬币者。策略：有正面和反面两种可选择策略，若猜对，猜者得１盖者－１.否则猜者－１盖者１.由于每一方都不会让对方在选择之前知道自己的决策，所以可以看做是同时做决策的。双变量得益矩阵；猜硬币方二、试举生活中的一例，说明囚徒困境是如何产生的？并试分析可能走出囚徒困境的途径。答：例子：中国移动和中国联通之间的价格战。产生原因：囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整体、个体利益共同的最优。简单的说，囚徒困境问题都是个体理性与集体理性的矛盾引起的。可能走出的囚徒困境途径：(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚，那么就会制止这种现象发生。（2）忠诚文化。有时候，建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中，团体产生所面临的囚徒困境问题的轻重程度是不同的，这种差异的根本来源就是各个组织有自己的文化。（3）长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复，如果这个“多次”足够长，那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财，合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。答：1、该博弈共包括四个子博弈：（1）从博弈方1选择R 以后博弈方2的第二阶段选择开始的三阶段动态博弈；（2）从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈；（3）第三阶段博弈方1选择A 以后博弈方2 的单人博弈；（4）第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中任何一个的得益都相同，因此在这阶段随意选择一个都可以。倒退回第三阶段，博弈方1选择ＡＢ中任何一个都可以。再推回第二阶段，博弈方２选择Ｌ将得到３选择Ｒ得到２，因此选择Ｌ；最后回到第一阶段，博弈方１选择Ｌ得到２选择Ｒ得到３,。所以该博弈的子博弈完美纳什均衡为：博弈方１第一阶段选择Ｒ，博弈方２第二阶段选择Ｌ，即（３,１）是该博弈的完美纳什均衡。四、两个寡头企业进行价格竞争博弈，企业1的利润函数是 q c aq p ++--=21)(π，企业2的利润函数是p b q +--=22)(π，其中p 是企业1 的价格，q 是企业2的价格。求： 1．两个企业同时决策的纯战略纳什均衡；两个企业同时定价。根据两个企业的得益函数，很容易导出它们各自的反应函数：απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

基于博弈论的恋爱模型

《数学建模》课程考核论文姓名：王湘衡齐久坤张程勇学号：08100225 08100217 08100232 班级：08信息2班 2011年5 月10日

基于博弈论的恋爱数学模型摘要本文用数学建模的方法研究博弈论中的问题，从不完全信息静态博弈建立模型建立模型，并利用纳什均衡原理程序来确定纳什均衡点，对不同均衡点进行分析，从而来确定最佳策略。然后通过海萨尼转换将不完全信息静态博弈转换成不完全信息动态博弈，来模拟现实社会中的恋爱，再利用恋爱者不同类型的分布概率，求出恋爱者的期望，最终来决策恋爱者自己下一步的策略。关键词：恋爱模型博弈论贝叶斯纳什均衡

1、问题重述随着社会的进步和发展，现在恋爱问题越来越成为生们关注的热门话题，那么如何利用数学知识来确定恋爱中双方能找到适合自己的恋人，成为现在数学建模中研究的一个重要领域。恋爱模型可以用博弈论来确定双方的合适恋人，这其中将恋爱双方都理想化，这样将给我们研究恋爱问题和建立数学模型带来方便，使我们能将恋爱模型数学化，从而确定恋爱者的进一步决定。 2.模型假设及符号说明模型假设： 1、恋爱双方都有自己明确的恋爱目标 2、恋爱双方从始至终都保持着自己的理性 3、恋爱双方都有自己喜欢类型的人，并且不会随时间变化 4、恋爱的男女通过对方的行为能够明确的判断出对方为哪种类型的人 5、恋爱的参与生都选择的是均衡战略符号说明： 3. 问题分析与模型建立 3.1 问题分析谈恋爱作为一个日常生活中最常见的现象要模型化却也并不简单。我们不妨

这样来看，谈恋爱的男女双方，各有不同类型，我们简单将其分为为了寻找真正爱情的人和为了骗财骗色的人。虽然这样不免有所武断,但我们分析的是一般现象，寻求的是一般解释。有了这样的分类便有了不同的组合，有了我们这个世界的爱恨情仇。我们的分析中有现代版的陈世美，却不会让他得逞，原因是理性经济人的假设。有人说这一点说不通，我不这样认为，经济学说所有人都是理性的并不影响不理性家伙们的存在，能解释一切的理论只能是没有内容的套套逻辑。一个理论的解释力只不过是它一般化的程度罢了。简单的博弈理论己深入人心，显然上面的问题是不完全信息博弈，无论是男追女还是女追男，信息的不完全或是不对称是显而易见的，用博弈论的话说是对对方的了解不够精确。因此，我们依据博弈论理论可以将其分为静态博弈和动态博弈。静态分析是找出其静态均衡，动态分析是揭示现实中生的行为。 3.2 模型的建立 3.2.1不完全信息静态博弈模型所谓静态是指所有参与生都同时行动，不会以别人行动的信息来更改自己的行动。我们以最常见的男追女为例，一个男生追求一个女生，在此情况下女生最苦恼的是不知男生是A类型的人还是B类型的人，虽然自己可以从各种渠道了解男生，但知生知面不知心，风险还是存在的。在这种情况下女生所遇到的就是不确定性条件下的选择问题，因为女生不仅不知道男生的类型(A还是B)，而且还不知道不同类型的分布概率，但她对自己所属的类型是清楚的，这是她的私人信息。同理男生也是这样。下面来设定支付函数的权值，以便求出纳什均衡点，设男A类追求者，只要他追求A类女生就得到10，他不追求A类女生就得到-10，A类女生接受得到10，拒绝得到-10；男B类追求者，他追求A类女生得到10，不追求得到-10，A类女生接受得到-10，拒绝得到10；男A类追求者，他追求B类女生得到-10，不追求得到10，B类女生接受得到10，拒绝得到-10；男B类追求者，他追求B类女生得到10，不追求得到0，B类女生接受得到10，拒绝得到0；他们的支付函数的权值依赖追求者的类型。这里用下面四张表说明：

博弈论经典案例分析

博弈论经典案例分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

博弈论第七章习题

第七章习题一、判断下列表述是否正确，并作简单分析（1）海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈，说明有了海萨尼转换，不完全信息静态博弈和一般的不完美信息动态博弈是等同的，不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。答：错误。即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈，也是一种特殊的有两个阶段同时选择的不完美信息动态博弈，对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。（2）完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。答：正确。完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。（3）证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。答：正确。我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。与一般双方报价拍卖的区别只是交易对象，标的不是一件而是有许多件。（4）静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型，都设定行为选择，而不是只针对实际类型设定行为选择，是因为能够迷惑其他博弈方，从而可以获得对自己更有利的均衡。

答：错误。不是因为能够迷惑其他博弈方，而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略，从而也就无法找出自己的最优策略。其实，在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选择，其他博弈方也会替他考虑。因为设定自己所有类型下的行为，实际上是要弄清楚其他博弈方对自己策略的判断。（5）“鼓励—响应”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。答：错误。“鼓励—响应”机制也就是说真话的直接机制，实际上只保证博弈方揭示，也就是说出自己的真实类型。博弈方不直接选择行为，也不保证根据真实类型行为，更谈不上一定能实现最理想的结果。因为直接机制的结果常常是带有随机选择机制的，并不一定理想。实际上对所有博弈方都理想的结果在静态贝叶斯博弈中本身不一定存在。二、双寡头古诺模型，倒转的需求函数为 ()P Q a Q =-，其中12Q q q =+为市场总需求，但a 有h a 和l a 两种可能的情况，并且厂商1知道a 究竟是h a 还是l a ，而厂商2只知道h a a =的概率是θ， l a a =的概率是1θ-，这种信息不对称情况双方都是了解的。双方的总成本仍然是i i i c q cq =。如果两厂商同时选择产量，问双方的策略空间是什么？本博弈的贝叶斯纳什均衡是什么？解：设厂商1已知h a a =时的产量为11()h q a q =，已知l a a =时的产量是11()l q a q =；再假设厂商2的产量是 2q ，这两个函数关系就是两个厂商的策略空间。 11211()h h h h h a q q q cq π=---

博弈论论文-共谋与防共谋案例

农村土地流转市场中三大主体博弈关系分析摘要：以农村土地流转市场中相关利主体之间的博弈关系, 构建两人或多人博弈模型，基于博弈关系进行理论分析,分析农村土地流转市场中的社会行为，为改进农村土地流转提出对应的建议,完善农村土地流转市场。关键词：农村土地流转、博弈、共谋与防共谋一、农村土地流转伴随我国工业化、信息化、城镇化和农业现代化进程，农村劳动力大量转移，农业物质技术装备水平不断提高，农户承包土地的经营权流转明显加快，发展适度规模经营已成为必然趋势。中共中央办公厅、国务院办公厅2014年11月印发《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》,《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》。实践证明，土地流转和适度规模经营是发展现代农业的必由之路，有利于优化土地资源配置和提高劳动生产率，有利于保障粮食安全和主要农产品供给，有利于促进农业技术推广应用和农业增效、农民增收，应从我国人多地少、农村情况千差万别的实际出发，积极稳妥地推进。为引导农村土地（指承包耕地）经营权有序流转、发展农业适度规模经营，现提出如下意见。当前农村土地流转的主要类型为土地互换、出租、入股、合作等方式。流转土地要坚持农户自愿的原则，并经过乡级土地管理部门备案，签订流转合同。二、集体土地流转市场中的利益主体城乡统筹一体化进程中，在集体土地流转市场制度创新的完整过程中起着重要作用的利益主体有：乡镇政府、农村集体经济组织、农地转出方和农地转人方。集体土地流转市场能否顺利进行是由国家（乡镇政府作为国家的代理人）、集体经济组织（包括村、组）、农地转出方与农地转入方四方相关利益主体进行博弈的结果，博弈过程是主观意愿根据其了解的情况逐步认识，最终做出结果作为理性的“经济人”,他们根据各自的利益目标,会作出不同的判断和选择,相应的得到各自的报酬。当某一方做出某项决策时,事先会受到他人决策的影响,同时反过来也会影响其他几方的行为。集体土地流转市场制度变迁在很大程度上是相关利益主体共同博弈的结果,利益主体之间的博弈结果,提出了对制度变迁的需求,需求导致了新制度的产生。根据集体土地流转市场相关利益主体之间表现出的博弈关系,进行博弈分析,有助于全面了解利益主体的策略选择,解释现行集体土地流转市场制度存在的不足,为相关管理部门和利益主体进行制度创新供决策参考。

博弈论复习题及标准答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（ ) 博弈中知道越多的一方越有利。( ×）纳什均衡一定是上策均衡。(×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×) 在一个博弈中博弈方可以有很多个。(√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。 (×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×) 在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如:在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√ ) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√ ) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√) 如果阶段博弈G={Ａ1, A2,…,An; u1, ｕ2,…,un)具有多重Nash均衡，那么可能(但不必)存在重复博弈Ｇ(T)的子博弈完美均衡结局，其中对于任意的t

博弈论案例分析

(1)失火了，你往哪个门跑失火了，你往哪个门跑——这就是博弈论一天晚上，你参加一个派对，屋里有很多人，你玩得很开心。这时候，屋里突然失火，火势很大，无法扑灭。此时你想逃生。你的面前有两个门，左门和右门，你必须在它们之间选择。但问题是，其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的，那么你将因人多拥挤、冲不出去而烧死；相反，如果你选择的是较少人选择的，那么你将逃生。这里我们不考虑道德因素，你将如何选择？这就是博弈论！你的选择必须考虑其他人的选择，而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付，不仅取决于你的行动选择——博弈论称之为策略选择，同时取决于他人的策略选择。你和这群人构成一个博弈（game）。上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型，被称之为少数者博弈或少数派博弈（Minority Game）。当然，原来的博弈形式不是这么简单，这里我把它简化了，我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。生活中博弈的案例很多，你会见到很多例子。只要涉及到人群的互动，就有博弈。什么叫博弈？博弈的英文为game，我们一般将它翻译成“游戏”。而在西方，game的意义不同于汉语中的游戏。在英语中，game即是

人们遵循一定规则下的活动，进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中，game有竞赛的意思，进行game的人是很认真的，不同于汉语中游戏的概念。在汉语中，游戏有儿戏的味道。因此将关于game的理论，即game theory翻译成博弈论或者对策论，是恰当的。本书下面统称game theory为博弈论。博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦，他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家，他同时对计算机的发明作出了巨大贡献，他去世时博弈论还未对经济学产生广泛影响，否则经济学的诺贝尔奖肯定有他的名字，因为诺贝尔奖有规定，只颁发给在世的学者。谈到博弈论，不能忽略博弈论天才纳什（John Nash）。纳什的开创性论文《n人博弈的均衡点》（1950）、《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。博弈论对于社会科学有着重要的意义，它正成为社会科学研究范式中的一种核心工具，以至于我们可称博弈论是“社会科学的数学”，或者说是关于社会的数学。从理论上讲，博弈论是研究理性的行动者（agents）相互作用的形式理论，而实际上它正深入到经济学、政治学、社会学等等，被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家：纳什、塞尔屯、哈桑尼（），而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南，1995年获得诺贝尔奖的理性主义学派的领袖卢

基于博弈论的爱情浅析

基于经济学的爱情攻略浅析摘要随着市场经济的发展，人们对事物认知态度的变化，经济学的应用范围进一步扩大，人们的行事原则越来越趋向于经济学上的“理性”。就现状而言，经济学的分析不仅局限于某些领域，只要存在人类的社会活动，就存在经济，就存在资源合理配置问题，也就有经济分析的必要。谈恋爱是校园中的一个普遍现象，本文从经济学的视野中透视，爱情中的微观经济学问题，包括从预算线角度分析择偶以及爱情中的博弈关系，并试图以经济学的理论提出缓解和解决有关爱情现象问题的建议。关键词：微观经济学；爱情；预算线；博弈论

Analysis based on the economics of love Raiders 【Abstract】:With the development of market economy, people's attitudes change perception of things, to further expand the scope of application of economics. More and more people tend to act on the principle of "rational" economics. On the current situation, the analysis is not limited to certain areas of economics. As long as the existence of human social activities, there is the economy. There is a reasonable allocation of resources, there is need for economic analysis. Love is a common phenomenon in the campus. This paper is from the perspective of economy. The love of microeconomics issues, including the budget line from the perspective of the relationship between mate and love the game, and tried to ease the economic theory proposed and recommendations to address issues related to the phenomenon of love. 【Key words】:Game theory; microeconomics; love; budget line

博弈论谢识予第四五章参考标准答案

博弈论谢识予第四五章参考答案

————————————————————————————————作者：————————————————————————————————日期： 2

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的，回头客、常客比较少，这些经济交易具有一次性博弈的特征，它们的价格总是较高而质量又会差一些，顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多，有明显的重复博弈特征，在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格，还能得到较好的服务，甚至有些还可以信用消费（赊账），因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看，有限次重复博弈研究的主要是有明确结束时间的（合作、竞争等）关系，无限次重复博弈研究的主要是没有明确结果时间，或者较长期的关系。从分析方法的角度，动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用，因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法，即根据特定效率意义等构造了博弈完美纳什均衡。此外，也可以运用某些技巧解决问题，如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。从博弈的结果看，无限次重复博弈的效率往往高于有限次重复博弈，有些在有限次重复博弈中无法实现的效率较高的结果，在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。最后，在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题，在我限次重复博弈问题中这是必须考虑的。上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别，区分研究这两类博弈问题是非常重要的，在实践方面的主要启发是促进和保持经济关系的长期稳定性，对于提高社会经济效率等常常有非常重要的意义。6、用画线法容易找出该博弈的两个纯策略纳什均衡（T，L）和（M，R）。这两个纳什均衡的得益都帕累托劣于（B，S）。一次性博弈中效率较高的（B，S）不可能实现。但该博弈的结构表明存在双方合作的利益，在两次重复博弈中也有构造惩罚机制的条件，因此我会考虑运用试探合作的触发策略争取部分实现（B，S），提高博弈的效率。我作为博弈方1会采用这样的触发策略：第一次重复采用B；第二次重复时，如果前一次的结果是（B，S），则采用M，如果前一次的结果是其他，则采用T。如果另一个博弈方有同样的分析能力，或者比较有经验，那么他（或她）也会采用相似的触发策略：在第一次重复时采用S；第二次重复时，如果前一次的结果是（B，S），则采用R，否则采用L。双方采用上述触发策略构成一个子博弈完美纳什均衡，因此是稳定的。这时候前一次重复实现了（B，S），提高了博弈的效率。当然，上述触发策略也是有风险的，因为当另一个博弈方不理解和没有采用上述策略时，我的得益会较低。当然如果考虑到人们具有学习进步的能力，而且缺乏分析和学习能力，采用效率较低策略的博弈方长期中会逐步被淘汰掉，那么采用上述触发策略的合理性就得到了进一步的支持。

博弈论经典案例与分析

案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。价格战案例：假设市场中仅有A 、B 两家企业，每家企业可采取的定价策略都是10元或15元，我们可以得出得益矩阵如下：分析：无论对企业A 还是企业B 来说，低价都是他们的占优战略。从表可见，企业A 的占优战略是10元，因为无论B 采取什么战略，企业A 都能获取比定价15元更多的利润。如果企业B 定价10元，企业A 定价10元能够获利80万元，而定价15元只能获得30万元；如果企业B 定价15元，企业A 定价10元可获利170万元，而定价15元却只能获利120万元。同样地，企业B 的占优战略也是定价10元的策略。企业B 男

博弈论经典模型全解析

博弈论经典模型全解析（入门级） 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不

会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是

博弈论的读书笔记

博弈论的读书笔记【篇一：博弈论读书笔记】博弈论读书笔博弈论 :亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。博弈论的目的在于巧妙的策略，而不是解法。我们学习博弈论的目的，不是为了享受博弈分析的过程，而在于赢得更好的结局。博弈的思想既然来自现实生活，它就可以高度抽象化地用数学工具来表述，也可以用日常事例来说明，并运用到生活中去。没有高深的数学知识，我们同样通过博弈论的学习成为生活中的策略高手。孙膑没有学过高等数学，但是这并不影响他通过运行策略来帮助田忌赢得赛马。博弈时时存在，它就在你的身边。本书就是试图通过日常生活中常见的例子，来介绍博弈论的基本思想及运用，并且寻求用种智慧来指导生活决策的方法。在李凌、王翔的《论博弈论中的策略思维》中，作者从博弈论的起源谈起，回顾了博弈论在诺贝尔经济学奖上所取得的成就，把博弈论中的经典案例同生活中的实际例子联系起来进行分析，从合作、模仿、创新、拍卖、战争和群居等实例表明博弈论中的策略思维是如何影响人们的行为的, 又是如何使得博弈达到均衡的。最后，围绕演进博弈论的基础理论与实例案例来分析对传统博弈论的冲击，及其使博弈论的发展上升到了一个新的阶段和深度。

! 以下是对这篇文章中的囚徒困境、智猪博弈和演进博弈论的简述和分析：一、囚徒困境—合作还是不合作在这个模型中，合作还是不合作问题得到了很好的解释，纳什均衡解就是都选择坦白，也就是跟对方囚徒不合作，但这个解对两个囚徒来说并不是帕累托最优解，囚徒困境反映了集体理性和个人理性的矛盾。联系到实际生活中的例子政府提供公共物品，如果让使用资源者自愿承担费用，则会由于搭便车现象的出现，而无法实现共同提供公共物品的目标，所以需要政府通过纳税的方式来提供，以实现帕累托最优，达到资源的有效配置。囚徒困境有限次重复博弈中，当一次性违约的收益大于失信所必须付出的代价时, 企业就存在偏离合同规定行事的激励，这种内生的激励表明,“损人利己”也是行为人的理性选择。在无限次重复博弈中，如果企业之间致力于长期合作, 就应当设法改变合作机制, 降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外, 一种行之有效的方法便是提高失信成本。然而在实际生活中的局中人可能受各种外部环境因素或者市场地位的影响，并非是完全理性的，所以在合作方面还存在着一定的风险，这就需要订立合作契约，将这种风险最小化，从现实经济利益的角度提高失信成本，使失约威胁实现真正的可置信。二、智猪博弈—创新还是模仿在智猪博弈中，在理性人的假设下，大猪和小猪的支付矩阵决定了大猪选择按，小猪选择等待。类似的，在股票市场中，大户是大猪, 他们进行技术分析, 收集信息、预测股价走势, 所付出的成本高，而相应得到的收益也比较高，而大量散户就是小猪, 他们几乎不花成本去进行技术分析, 而是跟着大户的投资策略进行股票买卖, 这就是股票市场上著名的“散户跟大户”现象。在股份公司中, 大股东是大猪, 他们收集信息、监督经理, 拥有决定经理任免的投票权,

博弈论的经典案例与分析

博弈论的经典案例与分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

博弈论习题及解答

※第一章绪论 §1.2 1. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?（见教材） 2. 分别用规范式和扩展式表示下面的博弈。两个相互竞争的企业考虑同时推出一种相似的产品。如果两家企业都推出这种产品，那么他们每家将获得利润400万元；如果只有一家企业推出新产品，那么它将获得利润700万元,没有推出新产品的企业亏损600万元；如果两家企业都不推出该产品，则每家企业获得200万元的利润。 3. 什么是特征函数? （见教材） 4. 产生“囚犯困境”的原因是什么？你能否举出现实经济活动中囚徒困境的例子？原因：个体理性与集体理性的矛盾。例子：厂商之间的价格战，广告竞争等。

※第二章完全信息的静态博弈和纳什均衡 1. 什么是纳什均衡? （见教材） 2. 剔除以下规范式博弈中的严格劣策略，再求出纯策略纳什均衡。先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。然后用划线法求出该矩阵博弈的纯策略Nash均衡。 3. 求出下面博弈的纳什均衡。由划线法易知，该矩阵博弈没有纯策略Nash均衡。由表达式(2.3.13)~(2.3.16)可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1 将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。解：设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)} 令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x) 作出三条直线，如下图，图中粗的折线，就是F(x)的图象