当前位置：文档之家› 博弈论(第八、九章)

博弈论(第八、九章)

基于博弈论的夫妻冲突分析

一个女人能有多美，通常是由与她相伴的男人来决定；一个男人能走多远，往往是由与他相随的女人来决定。夫妻之间的物质生活水平，通常是由收入较高的一方来决定；夫妇之间的精神生活水平，往往是由素质较低的一方来决定。囚徒困境在囚徒困境这个例子中，两个囚犯的上策都是坦白，因此最容易出现的结局也就是两人都被判5年。这个结局构成了一种博弈均衡状态，当对局者选择的都是上策的时候，这种均衡叫做上策均衡。在博弈论中，所谓均衡是指一种稳定的结局，当这种结局出现的时候，所有对局者都不想再改变他们所选择的策略。二．情侣冷战对峙现将囚徒困境的报酬矩阵分析引入到一对情侣的冷战对峙中，见下图： H表示主动的一方感觉自己付出更多从而受到伤害，生出不平衡感；E代表不主动的一方有种优越成就感谈过恋爱的人都会对此有深刻的体会吧。闹矛盾有别扭之后，有时也可能两人都想主动了，但谁也不先迈出这一步，在不知道对方策略和想法的情况下，一权衡一算计就总害怕自己亏了，又或者碍于情面拉不下面子，不肯服个软。于是乎，秋水望穿了，花瓣也掰完了，最后是怎样呢？在这个矩阵中我们需要考虑的是，或者说我们的假设前提是，双方都是完全理性的，是完全以利己目的和最大化利益为原则行事的人。上策均衡显然并非最好的结局，但却是博弈双方经过反复权衡后所采取的认为对自己最有利的选择。但我们知道，所谓的爱情是没有理性可言的，它是一种激情，一旦斤斤计较反复权衡利弊得失，那就不叫爱。所以非常有意思的是，这个矩阵中出现的上策均衡（O,O——OVER），即双方都不主动从而导致感情破裂爱情失败的结局，正说明了爱情只要一权衡一算计，俩人都矜持和自私的话，那么最终铁定玩完。三、夫妻关系的博弈分析感情，爱情，亲情夫妻关系尴尬的了现实的活动中，夫妻关系既有和谐、融洽的一面，也存在冲突、矛盾的一面。每5对佳侣新婚燕尔之时，就有一对夫妻分道扬镳。无论是丈夫还是妻子，双方都有自己的利益追求和价值取向，而家庭生活成为他们博弈的载体和工具。

基于博弈论的恋爱模型

《数学建模》课程考核论文姓名：王湘衡齐久坤张程勇学号：08100225 08100217 08100232 班级：08信息2班 2011年5 月10日

基于博弈论的恋爱数学模型摘要本文用数学建模的方法研究博弈论中的问题，从不完全信息静态博弈建立模型建立模型，并利用纳什均衡原理程序来确定纳什均衡点，对不同均衡点进行分析，从而来确定最佳策略。然后通过海萨尼转换将不完全信息静态博弈转换成不完全信息动态博弈，来模拟现实社会中的恋爱，再利用恋爱者不同类型的分布概率，求出恋爱者的期望，最终来决策恋爱者自己下一步的策略。关键词：恋爱模型博弈论贝叶斯纳什均衡

1、问题重述随着社会的进步和发展，现在恋爱问题越来越成为生们关注的热门话题，那么如何利用数学知识来确定恋爱中双方能找到适合自己的恋人，成为现在数学建模中研究的一个重要领域。恋爱模型可以用博弈论来确定双方的合适恋人，这其中将恋爱双方都理想化，这样将给我们研究恋爱问题和建立数学模型带来方便，使我们能将恋爱模型数学化，从而确定恋爱者的进一步决定。 2.模型假设及符号说明模型假设： 1、恋爱双方都有自己明确的恋爱目标 2、恋爱双方从始至终都保持着自己的理性 3、恋爱双方都有自己喜欢类型的人，并且不会随时间变化 4、恋爱的男女通过对方的行为能够明确的判断出对方为哪种类型的人 5、恋爱的参与生都选择的是均衡战略符号说明： 3. 问题分析与模型建立 3.1 问题分析谈恋爱作为一个日常生活中最常见的现象要模型化却也并不简单。我们不妨

这样来看，谈恋爱的男女双方，各有不同类型，我们简单将其分为为了寻找真正爱情的人和为了骗财骗色的人。虽然这样不免有所武断,但我们分析的是一般现象，寻求的是一般解释。有了这样的分类便有了不同的组合，有了我们这个世界的爱恨情仇。我们的分析中有现代版的陈世美，却不会让他得逞，原因是理性经济人的假设。有人说这一点说不通，我不这样认为，经济学说所有人都是理性的并不影响不理性家伙们的存在，能解释一切的理论只能是没有内容的套套逻辑。一个理论的解释力只不过是它一般化的程度罢了。简单的博弈理论己深入人心，显然上面的问题是不完全信息博弈，无论是男追女还是女追男，信息的不完全或是不对称是显而易见的，用博弈论的话说是对对方的了解不够精确。因此，我们依据博弈论理论可以将其分为静态博弈和动态博弈。静态分析是找出其静态均衡，动态分析是揭示现实中生的行为。 3.2 模型的建立 3.2.1不完全信息静态博弈模型所谓静态是指所有参与生都同时行动，不会以别人行动的信息来更改自己的行动。我们以最常见的男追女为例，一个男生追求一个女生，在此情况下女生最苦恼的是不知男生是A类型的人还是B类型的人，虽然自己可以从各种渠道了解男生，但知生知面不知心，风险还是存在的。在这种情况下女生所遇到的就是不确定性条件下的选择问题，因为女生不仅不知道男生的类型(A还是B)，而且还不知道不同类型的分布概率，但她对自己所属的类型是清楚的，这是她的私人信息。同理男生也是这样。下面来设定支付函数的权值，以便求出纳什均衡点，设男A类追求者，只要他追求A类女生就得到10，他不追求A类女生就得到-10，A类女生接受得到10，拒绝得到-10；男B类追求者，他追求A类女生得到10，不追求得到-10，A类女生接受得到-10，拒绝得到10；男A类追求者，他追求B类女生得到-10，不追求得到10，B类女生接受得到10，拒绝得到-10；男B类追求者，他追求B类女生得到10，不追求得到0，B类女生接受得到10，拒绝得到0；他们的支付函数的权值依赖追求者的类型。这里用下面四张表说明：

运筹学Ⅱ理解练习知识题(付答案解析)

练习题（博弈论部分）： 1、化简下面的矩阵对策问题： ??? ???? ? ????????=250436343242362 2415332412 A 2、列出下列矩阵对策的线性规划表达式 ?? ?? ? ?????------=334133313A 3、用线性方程组解 “齐王赛马”的纳什均衡。解：已知齐王的赢得矩阵为 A =????????? ? ??????????------311111131111113111111311111131111113 4、已知对策400008060A ?? ??=?????? 的最优解为：)133,134,136(),134,133,136(* *==Y X ，对策值1324*=V ，求以下矩阵对策的最优解和对策值 ?? ?? ??????=203820442020202032'A 5、设矩阵对策的支付矩阵为：353432323A ?? ??=-?????? ，求其策略和策略的值。 6、求解下列矩阵对策的解：

123312231A ?? ??=?? ???? 练习题（多属性决策部分）： 1、拟在6所学校中扩建一所，经过调研和分析，得到目标属性值如下表（费用和学生就读距离越小越好）试用加权和法分析应扩建那所学校？讨论权重的选择对决策的影响！ 2、拟选择一款洗衣机，其性能参数（在洗5Kg 衣物的消耗）如下表，设各目标的重要性相同，采用折中法选择合适的洗衣机 3、六方案四目标决策问题的决策矩阵如下表,各目标的属性值越大越好，{ 0.3,0.2,0.4,0.1}T W =

请用ELECTRE法求解，折中法，加权法求解

对策论_运筹学

习题解答 1. 已知矩阵博弈局中人I 的赢得矩阵如下，求最优纯策略及博弈值。（1） ?? ??????? ???83 54 66756544 3494 （2） ????? ? ??? ???------------21221405126331222 210 解: (1) () 8 695 354 38354667565443494? ???????? ??? 所以),(13βα,V=5 (2) 2 - 3 2- 2 2 2562)2(1)2(214051263312)2(2)2(10----??? ?????????------------ 所以 ),(31βα,),(51βα,),(33βα,),(53βα,V=-2 2．甲乙两国进行乒乓球团体赛，每国由三个人组成一个队参加比赛。甲国的人员根据不同的组合可组成4个队，乙国的人员可组成3个队，根据以往的比赛记解: 6 282 8276128184)2(3715---??? ?????????------ 所以),(22βα,V=2 答: 双方应均派第2队出场 3. 对任意一个m 行n 列的实数矩阵A=（a ij ）,试证有下式成立

ij m i n j ij n j m i a a ≤≤≤≤≤≤≤≤≤1111max min min max 证: ij m i n j ij n j m i ij m i ij n j m i ij ij n j a a a a j a a n j m i j i ≤≤≤≤≤≤≤≤≤≤≤≤≤≤≤≤≤∴≤?∴≤≤≤≤≤?11111111max min min max max min max ,min : 1,1,,有有 4. 某城区有A 、B 、C 三个居民小区，分别居住着40％，30%，30%的居民，有两个公司甲和乙都计划在区内建造超市，公司甲计划建两个，公司乙计划建一个，每个公司都知道，如果在某个小区内设有两个超市，那么这两个超市将平分该区的消费，如果在某个小区只有一个超市，则该超市将独揽这个小区的消费。如果在一个小区没有超市，则该小区的消费将平分给三个超市。每个公司都想使自己的营业额尽可能地多．试把这个问题表示成一个矩阵博弈，写出公司甲的赢得矩阵，井求两个公司的最优策略以及各占有多大的市场份额。解: 甲公司的策略集为{(A,B), (A,C), (B,C)} 乙公司的策略集为{A,B,C} 甲的赢得矩阵为: 75 .075.07.06 .07.07 .0717.0717.06.075.07.0)7.0(7.075.0)7.0(),(),(),(?? ????????C B C A B A C B A 所以甲选(A,B)或(A,C),占70%份额。乙选A,占30%份额. 5．一个病人的症状说明他可能患a ，b ，c 三种病中的一种，有两种药C ，D 可解: 8.04.07.01.04 .08.01.07.06.0)4.0(5.0?????? 最优策略为),(21βα 答:应开C 药较为稳妥. 6．设矩阵博弈局中人I 的赢得为 A=?? ?? ? ?????--203233

第八章╲t博弈论

第八章博弈论一、重点和难点（一）重点 1.博弈论及其基本概念 2.纳什均衡 3.占优策略均衡 4.囚徒困境博弈（二）难点 1.最小最大值（或最大最小值）策略 2.子博弈精炼纳什均衡 3.动态博弈战略行动 4.不完全信息静态博弈 5.不完全信息动态博弈二、关键概念博弈零和博弈非常和博弈囚徒困境纳什均衡支付子博弈精炼纳什均衡完全信息静态博弈占优策略均衡重复博弈战略移动可信威胁豪尔绍尼转换三、习题（一）单项选择题 1.博弈论中，局中人从一个博弈中得到的结果常被称为（）。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容，除了（）。 A.规则 B.占优战略均衡 C.策略 D.结局 3.在具有占优战略均衡的囚徒困境博弈中（）。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中，每一个博弈者努力（）。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中，直接决定局中人支付的因素是（）。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言，无论对手作何选择，其总是拥有惟一最佳行为，此时的博弈具有（）。 A.囚徒困境式的均衡

B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作，博弈者就在现期合作；但如果另一个博弈者在前一期违约，博弈者在现期也违约的战略称为（）。 A.一报还一报的战略 B.激发战略 C.双头战略 D.主导企业战略 8.在囚徒困境的博弈中，合作策略会导致（）。 A.博弈双方都获胜 B.博弈双方都失败 C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在双寡头中存在联合协议可以实现整个行业的利润最大化，则（）。 A.每个企业的产量必须相等 B.该行业的产出水平是有效的 C.该行业的边际收益必须等于总产出水平的边际成本 D.如果没有联合协议，总产量会更大 10.在什么时候，囚徒困境式博弈均衡最可能实现（）。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 11.一个企业采取的行为与另一个企业在前一阶段采取的行为一致，这种战略是一种（）。 A.主导战略 B.激发战略 C.一报还一报战略 D.无用战略 12.关于策略式博弈，正确的说法是（）。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 13.下面关于共同知识的说法，正确的是（）。 A. 每一个局中人都知道的事，就是共同知识 B. 一般地，假定支付为共同知识 C. 共同知识的假定要求局中人的计算能力不是很强 D. 纳什均衡不需要共同知识的假定 14、导致价格战爆发的原因是（）

基于博弈论的爱情浅析

基于经济学的爱情攻略浅析摘要随着市场经济的发展，人们对事物认知态度的变化，经济学的应用范围进一步扩大，人们的行事原则越来越趋向于经济学上的“理性”。就现状而言，经济学的分析不仅局限于某些领域，只要存在人类的社会活动，就存在经济，就存在资源合理配置问题，也就有经济分析的必要。谈恋爱是校园中的一个普遍现象，本文从经济学的视野中透视，爱情中的微观经济学问题，包括从预算线角度分析择偶以及爱情中的博弈关系，并试图以经济学的理论提出缓解和解决有关爱情现象问题的建议。关键词：微观经济学；爱情；预算线；博弈论

Analysis based on the economics of love Raiders 【Abstract】:With the development of market economy, people's attitudes change perception of things, to further expand the scope of application of economics. More and more people tend to act on the principle of "rational" economics. On the current situation, the analysis is not limited to certain areas of economics. As long as the existence of human social activities, there is the economy. There is a reasonable allocation of resources, there is need for economic analysis. Love is a common phenomenon in the campus. This paper is from the perspective of economy. The love of microeconomics issues, including the budget line from the perspective of the relationship between mate and love the game, and tried to ease the economic theory proposed and recommendations to address issues related to the phenomenon of love. 【Key words】:Game theory; microeconomics; love; budget line

博弈论谢识予第四五章参考标准答案

博弈论谢识予第四五章参考答案

————————————————————————————————作者：————————————————————————————————日期： 2

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的，回头客、常客比较少，这些经济交易具有一次性博弈的特征，它们的价格总是较高而质量又会差一些，顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多，有明显的重复博弈特征，在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格，还能得到较好的服务，甚至有些还可以信用消费（赊账），因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看，有限次重复博弈研究的主要是有明确结束时间的（合作、竞争等）关系，无限次重复博弈研究的主要是没有明确结果时间，或者较长期的关系。从分析方法的角度，动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用，因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法，即根据特定效率意义等构造了博弈完美纳什均衡。此外，也可以运用某些技巧解决问题，如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。从博弈的结果看，无限次重复博弈的效率往往高于有限次重复博弈，有些在有限次重复博弈中无法实现的效率较高的结果，在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。最后，在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题，在我限次重复博弈问题中这是必须考虑的。上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别，区分研究这两类博弈问题是非常重要的，在实践方面的主要启发是促进和保持经济关系的长期稳定性，对于提高社会经济效率等常常有非常重要的意义。6、用画线法容易找出该博弈的两个纯策略纳什均衡（T，L）和（M，R）。这两个纳什均衡的得益都帕累托劣于（B，S）。一次性博弈中效率较高的（B，S）不可能实现。但该博弈的结构表明存在双方合作的利益，在两次重复博弈中也有构造惩罚机制的条件，因此我会考虑运用试探合作的触发策略争取部分实现（B，S），提高博弈的效率。我作为博弈方1会采用这样的触发策略：第一次重复采用B；第二次重复时，如果前一次的结果是（B，S），则采用M，如果前一次的结果是其他，则采用T。如果另一个博弈方有同样的分析能力，或者比较有经验，那么他（或她）也会采用相似的触发策略：在第一次重复时采用S；第二次重复时，如果前一次的结果是（B，S），则采用R，否则采用L。双方采用上述触发策略构成一个子博弈完美纳什均衡，因此是稳定的。这时候前一次重复实现了（B，S），提高了博弈的效率。当然，上述触发策略也是有风险的，因为当另一个博弈方不理解和没有采用上述策略时，我的得益会较低。当然如果考虑到人们具有学习进步的能力，而且缺乏分析和学习能力，采用效率较低策略的博弈方长期中会逐步被淘汰掉，那么采用上述触发策略的合理性就得到了进一步的支持。

博弈论教学大纲

【博弈论】课程教学大纲【课程代码】0410955 【学分】2 【参考学时】32 【讲授学时】32 【实验学时】0 【实习学时】0 【课程性质】专业选修【参考教材】《经济博弈论》（复旦大学出版社）【课程基础】具备一定的高等数学基础，包括微积分、线性代数与概率统计。具备微观经济学与宏观经济学的学生将会发现本门课程分析问题的崭新角度，因而特别推荐经济学专业的学生选修此门课程。【适应对象】尽管本门课程的大多数例子是经济学的，但也不乏其他学科的，如法律、政治学、社会学等。这样不仅可以使经济类专业的学生开阔视野，同时也可以为其他学科有兴趣的同学提供接触经济学，了解经济学的机会，但这里强烈建议那些非经济类预选本门课程的同学，先掌握一些基本的经济学常识及一定的数学基础。【教学目的】著名经济学家Jean Tirole说过“正如理性预期使宏观经济学发生革命一样，博弈论广泛而深远地改变了经济学家的思维方式”。现实情况也确实如此，新古典经济学的前提假设与现实相距甚远，非完全竞争市场和不完全信息时的价格制度常常不是实现合作和解决冲突的最有效安排。而非价格制度的最显著特征是参与人之间行为的相互作用，此种情况下发展起来的通用方法便是博弈论。通过本科的学习使学生能够基本了解博弈论的基本思想与方法，具备一定的运用博弈论分析现实经济与社会问题的能力。【内容提要】博弈论是近年来现代经济学中发展最迅速的分支学科。博弈论研究多人决策问题，在社会经济的各个层面都有许多可用博弈论分析或解决的决策问题，因此博弈论在经济学理论和应用学科有着广泛的应用，是掌握现代经济学的关键。第一章导论一、什么是博弈论

博弈论的读书笔记

博弈论的读书笔记【篇一：博弈论读书笔记】博弈论读书笔博弈论 :亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。博弈论的目的在于巧妙的策略，而不是解法。我们学习博弈论的目的，不是为了享受博弈分析的过程，而在于赢得更好的结局。博弈的思想既然来自现实生活，它就可以高度抽象化地用数学工具来表述，也可以用日常事例来说明，并运用到生活中去。没有高深的数学知识，我们同样通过博弈论的学习成为生活中的策略高手。孙膑没有学过高等数学，但是这并不影响他通过运行策略来帮助田忌赢得赛马。博弈时时存在，它就在你的身边。本书就是试图通过日常生活中常见的例子，来介绍博弈论的基本思想及运用，并且寻求用种智慧来指导生活决策的方法。在李凌、王翔的《论博弈论中的策略思维》中，作者从博弈论的起源谈起，回顾了博弈论在诺贝尔经济学奖上所取得的成就，把博弈论中的经典案例同生活中的实际例子联系起来进行分析，从合作、模仿、创新、拍卖、战争和群居等实例表明博弈论中的策略思维是如何影响人们的行为的, 又是如何使得博弈达到均衡的。最后，围绕演进博弈论的基础理论与实例案例来分析对传统博弈论的冲击，及其使博弈论的发展上升到了一个新的阶段和深度。

! 以下是对这篇文章中的囚徒困境、智猪博弈和演进博弈论的简述和分析：一、囚徒困境—合作还是不合作在这个模型中，合作还是不合作问题得到了很好的解释，纳什均衡解就是都选择坦白，也就是跟对方囚徒不合作，但这个解对两个囚徒来说并不是帕累托最优解，囚徒困境反映了集体理性和个人理性的矛盾。联系到实际生活中的例子政府提供公共物品，如果让使用资源者自愿承担费用，则会由于搭便车现象的出现，而无法实现共同提供公共物品的目标，所以需要政府通过纳税的方式来提供，以实现帕累托最优，达到资源的有效配置。囚徒困境有限次重复博弈中，当一次性违约的收益大于失信所必须付出的代价时, 企业就存在偏离合同规定行事的激励，这种内生的激励表明,“损人利己”也是行为人的理性选择。在无限次重复博弈中，如果企业之间致力于长期合作, 就应当设法改变合作机制, 降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外, 一种行之有效的方法便是提高失信成本。然而在实际生活中的局中人可能受各种外部环境因素或者市场地位的影响，并非是完全理性的，所以在合作方面还存在着一定的风险，这就需要订立合作契约，将这种风险最小化，从现实经济利益的角度提高失信成本，使失约威胁实现真正的可置信。二、智猪博弈—创新还是模仿在智猪博弈中，在理性人的假设下，大猪和小猪的支付矩阵决定了大猪选择按，小猪选择等待。类似的，在股票市场中，大户是大猪, 他们进行技术分析, 收集信息、预测股价走势, 所付出的成本高，而相应得到的收益也比较高，而大量散户就是小猪, 他们几乎不花成本去进行技术分析, 而是跟着大户的投资策略进行股票买卖, 这就是股票市场上著名的“散户跟大户”现象。在股份公司中, 大股东是大猪, 他们收集信息、监督经理, 拥有决定经理任免的投票权,

博弈论

第八章博弈论教学目的：明确博弈产生与发展的有关基本理论；各种博弈种类的比较。教学要求：阐明博弈理论与传统微观经济学理论的关系。教学重点：完全信息静态博弈；不完全信息动态博弈；不完全信息静态与动态博弈。教学难点：纳什均衡；最大化最小化原理；不完全信息博弈。第一节博弈问题概述一、博弈论及其基本概念博弈也叫作对策，译自英文的Game，字面意义可理解为游戏。博弈论“是关于策略相互作用的理论”，研究两个或两个以上参加者在对抗性或竞争性局势下如何采取行动，如何作出有利于己方的决策及其均衡问题。在前面几章的分析中，除了寡头市场外，消费者和企业的最优决策是在简单环境下进行的，没有考虑各经济主体之间决策的相互影响。而博弈论研究人与人之间相互“斗智”的形式和后果。当人们的利益存在冲突时，每个人所获得的利益不仅取决于自己所采取的行动，也取决于其他人采取的行动或者对自己行动的反应，即某一经济主体的决策既受到其它经济主体决策的影响，而且该经济主体的相应决策又反过来影响到其它经济主体的决策。博弈论描述在这种形势下各方理性地选择自己的行动所实现的结果，分析决策各决策主体的行为发生相互作用时的决策以及这种决策的均衡问题。博弈论的基本概念包括：参与人、策略、支付。（1）参与人（player）也称为局中人，是指博弈中选择行动以最大化自身利益（效用、利润等）的决策主体，局中人可以是自然人，也可以是各种社会组织，如：企业、政府、社团等等。（2）策略(strategy)是指参与人选择行动的计划或规则，它规定参与人如何对其他人的行动作出反应，即在每种情况下应该如何行动，因而代表着参与者的相机行动方案。而行动是指参与人的决策变量。策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。（3）信息(information)是指参与人在博弈中的知识，特别是有关其他参与人（对手）的特征和行动的知识。（4）在博弈论中，可以用数值表示各局中人从博弈中各自获益多少或相应的效用水平，这个数值称为支付(payoff)；支付函数是所有参与人策略或行动的函数，是每个参与人真正关心的东西。博弈均衡是所有参与人的最优策略或行动的组合。

博弈论谢识予第四五章参考答案

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的，回头客、常客比较少，这些经济交易具有一次性博弈的特征，它们的价格总是较高而质量又会差一些，顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多，有明显的重复博弈特征，在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格，还能得到较好的服务，甚至有些还可以信用消费（赊账），因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看，有限次重复博弈研究的主要是有明确结束时间的（合作、竞争等）关系，无限次重复博弈研究的主要是没有明确结果时间，或者较长期的关系。从分析方法的角度，动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用，因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法，即根据特定效率意义等构造了博弈完美纳什均衡。此外，也可以运用某些技巧解决问题，如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。从博弈的结果看，无限次重复博弈的效率往往高于有限次重复博弈，有些在有限次重复博弈中无法实现的效率较高的结果，在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。最后，在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题，在我限次重复博弈问题中这是必须考虑的。上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别，区分研究这两类博弈问题是非常重要的，在实践方面的主要启发是促进和保持经济关系的长期稳定性，对于提高社会经济效率等常常有非常重要的意义。 6、用画线法容易找出该博弈的两个纯策略纳什均衡（T，L）和（M，R）。这两个纳什均衡的得益都帕累托劣于（B，S）。一次性博弈中效率较高的（B，S）不可能实现。但该博弈的结构表明存在双方合作的利益，在两次重复博弈中也有构造惩罚机制的条件，因此我会考虑运用试探合作的触发策略争取部分实现（B，S），提高博弈的效率。我作为博弈方1会采用这样的触发策略：第一次重复采用B；第二次重复时，如果前一次的结果是（B，S），则采用M，如果前一次的结果是其他，则采用T。如果另一个博弈方有同样的分析能力，或者比较有经验，那么他（或她）也会采用相似的触发策略：在第一次重复时采用S；第二次重复时，如果前一次的结果是（B，S），则采用R，否则采用L。双方采用上述触发策略构成一个子博弈完美纳什均衡，因此是稳定的。这时候前一次重复实现了（B，S），提高了博弈的效率。当然，上述触发策略也是有风险的，因为当另一个博弈方不理解和没有采用上述策略时，我的得益会较低。当然如果考虑到人们具有学习进步的能力，而且缺乏分析和学习能力，采用效率较低策略的博弈方长期中会逐步被淘汰掉，那么采用上述触发策略的合理性就得到了进一步的支持。

博弈论第四章习题

第四章习题一、如果T次重复齐威王田忌赛马，双方在该重复博弈中的策略是什么？博弈结果如何？答：因为这是零和博弈，结论比较具体。重复Nash 均衡，均以1/6的概率选择各个策略，期望收益分别为1和-1。因为这是竞争性的零和博弈，无论是有限次重复博弈还是无限次的重复博弈，均不能达成合作的条件。二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。答：火车站和机场餐饮业的服务的顾客往往是一次性的，回头客和常客也比较少，价格高，质量差，一次性博弈。效率也比较低。商业区和居民区的餐饮业和商业服务业，回头客和常客比较多，比较注重信誉，质优、价廉，重复博弈。效率也比较高。三、有限次重复博弈和无限次重复博弈有什么区别？这些区别对我们有什么启发？

答：动态博弈的逆向归纳法可以用于有限次重复博弈，但不能用于无限次重复博弈，主要用逆向归纳法。无限次重复博弈的效率往往高于有限次重复博弈。当重复次数较少不一定考虑贴现问题，但无限次重复博弈必须考虑贴现问题。启发：重视有限次与无限次的区别，区分和研究这两类博弈，在实践方面重要启发是促进和保持经济的长期稳定和可持续发展，提高社会经济效率是非常有意义的。四、判断下列表述是否正确，并作简单讨论：（1）有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。答：不一定。对于有两个以上纯策略纳什均衡的条件下就不一定。如“触发策略”就不是。（2）有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。答：是，根据子博弈完美纳什均衡的要求，最后一次必须是原博弈的一个纳什均衡。（3）无限次重复博弈均衡解的得益一定优于原博

基于博弈论的夫妻冲突分析

基于博弈论的夫妻冲突分析摘要：夫妻关系是社会生活中最重要的一种社会关系，小家庭的和谐稳定是构成大社会和谐稳定的基础。夫妻两人在家庭活动中往往会因为多种因素发生意见不合，进而产生冲突并伴随着心理博弈。夫妻博弈可分为夫妻关系和谐的合作博弈与夫妻冲突的非合作博弈，从这个意义上讲，夫妻冲突的本质是非合作博弈的结果与表现。构建和谐的夫妻关系，有效消解夫妻冲突，关键在于重建均衡的夫妻博弈模型，增进夫妻之间的情感沟通，达成夫妻之间的价值共识，促进家庭的和谐稳定。关键词：夫妻博弈夫妻关系夫妻冲突家庭关系博弈论也叫对策论，其含义可以表述为：一些个人、团队或其他组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，并从中各自取得相应结果或收益的过程。[1]一个完整的博弈包括博弈的参加者、博弈信息、行为或策略、博弈的次序和博弈各方的收益五项内容。博弈的定义隐含了这样一个基本假设：在冲突或竞争的情况下，每一个参加者具有充分的理性，都力图谋自身利益最大化或损失最小化。博弈的根源在于利益驱动，博弈主体都是依据自己的偏好和掌握的信息与规则来追求确定的外部目标。然而，博弈参与人不是孤立地作出决策，一方的决定会受对方影响以及影响对方。换言之，一方的选择有可能加惠于也有可能加害于另一方。有鉴于此，博弈分析的目的是使用博弈规则测均衡[2]，即通过对各参与人行动与决策结果的分析来预测他们的最优策略组合也称为均衡状态。在这种状态下，所有参与人均得到最好的结果，所以，任何一方都不会主动偏离均衡状态，即使偏离了也会想方设法回到均衡的轨道上来。就此而言，博弈论是深刻理解人们各种互动行为的基础，它已经成为人们分析与解决事物矛盾、冲突与合作等因素的一种有效工具。 [1] 张振华.博弈论视野中的素质教育[J].辽宁大学学报（哲学社会科学版），2007，（9）. [2] 张维迎. 博弈论与信息经济学[M].上海：上海人民出版社，2004：46.

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是：每一个局中人选择一个策略，由所有局中人的策略构成了一个策略组合；在其它局中人选定策略不变的情况下，若某一个局中人单独地违背自己已选的策略，那么他的收益只会下降（或收益不会增加）。这样的策略组合构成一个均衡局势，并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时，就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈中，若均为G 的其纳什均衡，若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?，0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡； (2)至少有两个纳什均衡，并且其中之一是帕累托占优均衡。（1 ）不存在纯策略的纳什均衡：该博弈不存在纯策略的纳什均衡（2）该博弈有三个纳什均衡：（战争，战争）、（和平，和平）和一个混合策略纳什均衡。很显然，（和平，和平）是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业，它们的成本函数分别为： TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品，其市场需求函数为：Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。解：由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争和平国家 1战争-5，-58，-10和平-10，810，10

博弈论第四章

4 非完全信息动态博弈 4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。参与人2 不知道t，但知道t的概率分布。博弈的时序：（1）参与人1选择行动a1∈A1; （2）参与人2观察a1，选择a2∈A2 博弈的收益：u1 (a1, a2, t ), u2 (a1, a2, t ) u1u1u1u1 u1u1u1u1 u2u2u2u2 u2u2u2u2例: 1 R L M 1 3 p 2 1- p L'R'L'R' 2 0 0 0 1 0 1 2

标准式表示参与人2 L'R' L2，10，0 参与人1 M0, 20， 1 R1, 31, 3 纯战略纳什均衡: (L，L'), (R，R') 均为子博弈精炼纳什均衡(无子博弈)。但是(R, R')不可信。排除不可信的纳什均衡：要求1 参与人必须有一个推断(belief). 要求2 参与者的战略必须满足序贯理性(sequentially rational). 定义处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下，博弈以正的概率到达该集. 处于均衡路径之外(off the equilibrium path)的信息集: 在均衡战略下，博弈不会到达此集. 要求 3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。例要求3的说明参与人1的类型空间：{ t1，t2，t3，t4 } 行动空间：A= { L，R}

推断p i : 观察到L 后，参与人1的类型是t i 的概率。推断q i : 观察到R 后，参与人1的类型是t i 的概率。 p 1 + p 2 + p 3 + p 4 = 1 q 1 + q 2 + q 3 + q 4= 1 如果参与人1的战略： t 1选 L ，t 2选 L ， t 3选R ，t 4 选R 。参与人2对p i 与 q i 的推断： p 1 = 3.02.02.0+= 0.4, p 2 = 3 .02.03 .0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3 .02.03 .0+= 0.6, 要求 4 在处于均衡路径之外的信息集上, 可能情况下，推断由贝叶斯法则和参与人的均衡战略决定。原文：At information sets off the equilibrium path, beliefs are determined by Bayes ’ rule and the players ’ equilibrium strategies where possible.

博弈论课后习题

第一章导论 1、什么是博弈？博弈论的主要研究内容是什么？ 2、设定一个博弈模型必须确定哪几个方面？ 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么？举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法，有哪些主要的类型？ 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的：你决定开，则的概率你讲收益300万元（包括投资），而的概率你将全部亏损；如果你不开，则你能保住本钱但也不会有利润，请你（a）用得益矩阵和扩展形式表示该博弈；（b）如果你是风险中性的，你会怎样选择？（c）如果你是风险规避的，且期望得益的折扣系数为，你的策略选择是什么？(d)如果你是风险偏好的，期望得益折算系数为，你的选择又是什么？ 7、一逃犯从关押他的监狱中逃走，一看守奉命追捕。如果逃犯逃跑有两条可选择的路线，看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢，但一旦被抓住则要加刑10年；看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈，并作简单分析。第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么？ 2、为什么说纳什均衡是博弈分析中最重要的概念？ 3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质，对博弈分析有什么不利影响？ 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡？博弈的结果是什么？ 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分10 000元进行讨价还价。假设确定了以下规则：双方同时提出自己要求的数额S1和S2，0≤s1,s2≤10 000,如果s1+s2≤10 000，则两博弈方的要求都得到满足，即分别得到s1和s2，但如果是s1+s2＞10 000,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么？如果你是其中一个博弈方，你会要求什么数额，为什么？ 8、设古诺模型中有n家厂商、qi 为厂商i的产量，Q=q1+…+qn 为市场总产量、P为市场出清价格，且已知P=P(Q)=a-Q(当Q＜a时，否则P=0)。假设厂商i生产qi产量的总成本为Ci=Ci（qi）=cqi,也就是说没有固定成本且各厂商的边际成本都相同，为常数c(c＜a).假设各厂商同时选择产量，该模型的纳什均衡是什么？当n趋向于无穷大时博弈分析是否仍然有效？ 9、两寡头古诺模型，P(Q)=a-Q等与上题相同，但量厂商的边际成本不同，分别为c1和c2。如果0＜ci ＜a/2,问纳什均衡产量各为多少？如果c1＜c2＜a,但2c2＞a+c1,则纳什均衡产量又为多少？ 10、甲乙两公司分属两个国家，在开发某种新产品方面有下面得益矩阵表示的博弈关系（单位：百万美元）。该博弈的纳什均衡有哪些？如果乙公司所在国政府想保护本国公司利益，有什么好的办法？ 11、设一个地区选民的观点标准分布于【0,1】上，竞选一个公职的每个候选人同时宣布他们的竞选立场，即选择0到1之间的一个点。选民将观察候选人们的立场，然后将选票投给立场与自己的观点最接近的候选人。例如有两个候选人，宣布的立场分别为x1=和x2=，那么观点在x=左边的所有选民都会投候选人1的票，而观点在x=右边的选民都会投候选人2的票，候选人1将以60%的选票获胜。再设如果又候选人的立场相同，那么立场相同的候选人将平分该立场所获得的选票，得票领先的候选人票数相同时则用抛硬币决定哪个候选人当选。我们假设候选人唯一关心的知识当选（即不考虑自己对观点的真正偏好），如果又两个候选人，问纯策略纳什均衡是什么？如果又三个候选人，也请作出一个纳什均衡。 12、运用本章的均衡概念和思想讨论下列得益矩阵表示的静态博弈。

博弈论第4章答案

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4，1 0，0 3，0 0，1 2，2 2，2 纯战略纳什均衡：( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡：( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡：( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡：( R, M ’ ) 子博弈精炼纳什均衡：( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2，2 2，2 3，0 0，1 0，1 3，0 六种纯战略组合，每种组合中都至少有一方存在偏离的动机，因此不存在纯战略纳什均衡，因此也就不存在纯战略精炼贝叶斯均衡。求混合战略精炼贝叶斯均衡：设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下，参与者2选择L ’和R ’的收益无差异，则： 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略，参与者1选择L 、M 、R 的收益无差异，则： 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又联立得所以 L L M L L M L R L

4.3答案（见4.5） 4.4 表示方法第一个括号，逗号左边为type 1发送者信号，逗号右边为type 1发送者信号；第二个括号，逗号左边为接收到L 信号的反应，逗号右边为接收到R 信号的反应； P 为信号接收者对type 1发送L 的推断，q 为信号接收者对type 1发送R 的推断（a ） [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== （b ） [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案（a ） [(,),(,),1/3,1/2]R R u d p q >= （b ） 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=