当前位置：文档之家› 博弈论-第五章

博弈论-第五章

第五章重复博弈

在这一章中，我们将围绕着人类的合作为什么产生这一命题来展开。人与人之间合作生产的一个原因（从经济学的角度来看）是这种做法对于参与者双方而言是一个有利可图的事，为什么说明这一点我们将用到重复博弈。另一个解释合作生产的方法就是引入信息不对称，在这种情况下，一个人装作是好人是有利可图的（因为好名声能够给他带来收益），这在信息不对称中会加以介绍。

第一节重复博弈的定义及扩展式给出重复博弈定义之前，需要做若干准备，一个准备就是由于重复博弈有可能会进行一个很长的时期，甚至是无穷期，因而必须考虑收益的时间价值。相应的表达偏好的收益函数也需要给出一定的限制。

一、贴现因子与偏好

明天的一元钱和今天的一元钱价值是不一样的，最简单的理由是今天的一元钱如果存入银行那么在明天会变成1+ r ，所以明天的一元钱只相当于今天的1/(1+ r )元钱，1/(1+ r )实际上就是经济学中的贴现率。如果假设未来没有不确定性，定义1

1r δ=+，未来存在收益流R 1，

R 2，R 3，…，那么这个未来收益流的贴现值之和就为

V =211231t t t R R R R δδδ∞-=+++=∑L

(5-1)

其中(0,1)

δ∈称为贴现因子(Discount factor)。严格讲，贴现因子并不等于贴现率，但贴现因子与贴现率一定是同方向变动的。例如，我们考虑一个特殊的重复博弈，其结束之前重复进行的次数是随机的，即在博弈的每一阶段完成之后，都要通过抛若干枚（加权的）硬币的方式来决定博弈是否结束，如果硬币朝上那么博弈结束（即概率为p），如果是其他情况，那么博弈继续（即概率为1 –p）。如果下一阶段能得到的收益为R1，那么在当前阶段硬币未抛之前的价值（即贴现后的期望值）为(1 –p)R1/(1+ r)；如果下两阶段能得到的收益为R2，在当前阶段硬币未抛之前的价值为(1 –p)2R2/(1+ r)2；下三阶段、四阶段等等的收益，照此类推。令(1)/(1)

δ=-+，则贴现因子既包含了货币的时

p r

间价值（贴现率1/(1+r)），又包含了博弈结束的可能性(1 –p)。

有了贴现因子的概念，我们就可以非常方便地比较无穷重复博弈

中的不同收益值，从而对不同的策略进行优劣判断。

考虑一个无穷期的情况，如果t 期的收益为R t ，贴现因子为10δ>>，那么收益流的贴现值为

11231t t t R R R R δδδ∞-=+++=∑L <2max max lim (1)1n n R R δδδδ→∞++++=-L ，

其中R max = max{R 1, R 2, R 3, …}，即R max 为收益流中的最大值。同理，

11231t t t R R R R δδδ∞-=+++=∑L >2min min lim (1)1n n R R δδδδ→∞++++=-L ，

其中R min ={{R 1, R 2, R 3, …}，即R min 为收益流中的最小值。就这意味着，存在一个R 使得

11231t t t R R R R δδδ∞-=+++=∑L =2lim (1)1n n R R δδδδ→∞++++=-L 。

R 就被称为收益流(R 1, R 2, R 3, …)的贴现平均收益值。

对于不同的策略，显然对应着不同的贴现平均收益值，通过比较平均收益值就能非常方便地知道什么是最优策略。

定义5.1 设贴现因子为δ，收益流(R 1, R 2, R 3, …)的贴现平均收益值为

11(1)t t

t R R δδ∞-==-∑。

由于平均收益值等于贴现值之和V 的(1)δ-倍，使贴现平均收益值最大化就等同于使贴现值之和最大化。使用平均收益的另一个优点，就是我们可以利用它直接和阶段博弈中的收益进行比较,从而更容易知道哪一个策略要优。

对于重复博弈中参与者的偏好，同学们可能认为只要照搬前面的收益函数就可以了，而这实际上是不对的。为什么呢？我们知道在确定性下，表达相同偏好的收益函数并不唯一，而是满足单调变换性，

即只要f 是一个单调递增函数，那么(())f u g 与()u g 就表示同一个偏好。但在（无穷）重复博弈中，整个博弈的收益函数为

v = 1223

11()()()()t t t u s u s u s u s δδδ∞-=+++=∑L (5-2)

它实际上为阶段博弈G 的收益函数u (s )的一个贴现和，我们把u (s )也称为伯努利收益函数，因为它也像v-N-M 偏好一样，要求u (s )必须满足线形变换，即只有当f = a + bu (s )，b >0时，f 和u 才表示相同的重复博弈偏好。因为这时的v 实际上是预期收益函数。容易证明，

011t t Z δδ∞===-∑，t t p Z δ=，那么0,1t t p and p ≥=∑，即公式(5-2)中的系数（两

边同时除以1δ-）实际上是一个概率分布。因而，重复博弈与普通完全信息动态博弈的第二个不同点，就是收益函数()u g 为伯努利收益函数，而不是普通的收益函数。

二、重复博弈的定义及扩展式

定义5.2对于策略式博弈G = {N , S , u }，其中N ={1, 2,…, n }为参与者集合，S ={S 1 ,…, S n }为所有参与者的策略空间（策略实际上就是行动），u ={u 1, …, u n }为所有参与者的收益函数。如果G 在时间中（或程序上）不断重复，并且在下一次博弈G 开始前，所有以前博弈的历史都被观察到，那么它构成的动态博弈就称之为重复博弈，G 就为重复博弈中的阶段博弈。如果G 重复进行T 次，那么G(T)就表示重复进行T 次的有限重复博弈。如果T = ∞，那么G(T)就表示无限重复博弈。重复博弈G(T)中参与者i 的偏好用收益函数v i 表示，即

12T-1T ()()()1i

i i i i R v u s u s u s δδδ=+++=-L (5-3)

其中u (s t )为伯努利收益函数，s t 为重复博弈t 阶段的行动组合(T > t >1)，δ为贴现因子，R i 为参与者i 的贴现平均收益值，等于

11(1)()t t i t u s δδ-=-∑。实际上对于重复博弈中的阶段博弈G ，其不仅可以为完全信息静态博弈，也可以是完全信息动态博弈；不仅可以为完全信息博弈，也可以为非完全信息博弈。相应的重复博弈G(T)的扩展式定义如下：

定义5.3重复博弈的扩展式为(T)Γ={N , H , P , v }，其中N 表示参与者集合；H 为全历史集合，即G 中的行动组合序列的集合{(s 1, s 2, …, s T )}，有时也把一个全历史称为一个结果路径；P 为每一个子历史h 下的参与者函数；v 则为参与者的v-N-M 收益函数，它满足(5-3)式。

为了叙述简便，G(T)与Γ(T)通常互换使用，都表示重复博弈。

第二节合作产生的原因

为了更为形象，我们引入一个重复信用困境博弈，其阶段博弈G 的博弈矩阵如图5-1所示。

商人2

诚信欺骗

诚信

商人1

欺骗

图5-1 信用困境

一、问题的提出

在什么样的情况下，（诚信，诚信）这样的结果有可能在信用困境中出现？如果是你，你会如何思考呢？

实际上，运用逆推法，很容易证明，只要重复博弈进行的次数是有限的，那么（欺骗，欺骗）这样的结果会在每一个阶段博弈中出现。上述的直观认识具有普遍意义。如果阶段博弈G存在唯一纳什均衡，那么G(T)的子博弈完美均衡不过是纳什均衡重复T次，根本的原因是，如果最后一个子博弈G(1)存在唯一的纳什均衡，那么无论前面的历史如何都不会改变最后一个子博弈的均衡结果（反正过去的已经成为过去），因而G(T)的完美均衡不过是G的纳什均衡重复T次，这就有了命题5.1。

命题5.1如果阶段博弈G有唯一的纳什均衡，则对任意有限的T，重复博弈G(T)有唯一的子博弈完美均衡：即G的纳什均衡结果在每一个阶段重复进行。

利用命题5.1可知，无论信用困境重复多少次，只要不是无穷的，

那么唯一的均衡结果只能是每一阶段都为（欺骗，欺骗），因而人类社会所谓的合作根本就不可能产生，人与人之间的诚信只能是一种奢望。然而，现实并非如此，虽然人与人之间存在着利益冲突，但也确实存在着合作的行动和结果。那么如何破解囚徒困境的诅咒呢？

二、多重均衡的有限重复博弈

为了在理论上容纳合作解，一个重要的方法就是在重复博弈中引入多重均衡。现在，我们不妨考虑两阶段信用博弈，但对信用博弈做出修改，即阶段博弈G存在多个纳什均衡的情况，如图5-3所示，不妨称为信用困境1。信用困境1与原信用困境不同的地方是人为构造了一个新的纳什均衡——（中，中），因而这个阶段博弈存在两个纳什均衡——（欺骗，欺骗）和（中，中）。

商人2

诚信欺骗中

商人1 诚信

欺骗

中

图5-3 信用困境1

与原信用困境一个重要的不同是合作解有可能成为子博弈完美均衡解在重复博弈中出现。

在证明之前，请同学们想一想（逆推法）。

我们首先从信用困境1的第二阶段开始。在第二阶段，（欺骗，欺骗）和（中，中）都是阶段博弈G的纳什均衡，因而“策略组合”[(如果对手诚信，选择中；如果非诚信，选择欺骗)，(如果对手诚信，

选择中；如果非诚信，选择欺骗)]是子博弈G(1)的一个纳什均衡。把这一均衡策略下对应的收益代入第一阶段，就得到图5-4。

商人2

诚信欺骗中

商人1 诚信

欺骗

中

图5-4 信用困境1

在图5-4中显然存在着3个纯纳什均衡：（欺骗，欺骗）、（中，中）和（诚信，诚信）。根据逆推法，这3个纯纳什均衡都是信用困境1重复博弈的子博弈完美均衡解。前两个完美均衡都简单地由两个阶段博弈的纳什均衡组成，但第三个纳什均衡结果却由一个非纳什均衡

（第一阶段）和一个纳什均衡（第二阶段）组成。它对应着的子博弈完美均衡结果为[(诚信，诚信)，(中，中)]，与前两个完美均衡本质不同的地方是合作解（诚信，诚信）在第一阶段中出现了。实际上，如果G是一个有着多重纳什均衡的完全信息静态博弈，则重复博弈G(T)就可能存在子博弈完美均衡解，其中对每一个t

但是这种多重纳什均衡的处理仍然存在着令人不满意的地方，因

为多重均衡意味着合作解并不一定产生，它的出现需要太多的条件，而且合作解对于干扰过于敏感（合作双方很容易产生不信任），相当不稳定，这表明子博弈完美均衡对可信性的要求并不严格。例如，在推导子博弈完美均衡{[诚信，（中，欺骗）]；[诚信，（中，欺骗）]}时，我们假定如果第1阶段的结果是（诚信，诚信），则参与者双方都预期（中，中）将是第2阶段的解，如果第1阶段出现了任何其他8种结果之一，第2阶段的结果就会是（欺骗，欺骗）。但是，在第2阶段，（中，中）是一个具有优势的纳什均衡，3的收益显然要大于选择（欺骗，欺骗）时只能得1的收益。因而无论第1阶段情况如何，第2阶段选择中是理性的。一个很自然的想法是，参与双方可能会重新谈判。每一个参与者可能会理性地认为过去的反正已经过去了，在余下的阶段博弈中就会选择双方都偏好的均衡行动（中，中）。但如果最后一个

阶段的结果都是（中，中）的话，那又有什么理由去保证有人在第一阶段去选择（诚信，诚信）呢？{[诚信，（中，欺骗）]；[诚信，（中，欺骗）]}就不再是一个“合理的”子博弈完美均衡。

商人2

诚信欺骗中左右

商人1 诚信

欺骗

中

左

右

图5-5 信用困境2

为了克服上述问题，一个思路就是拒绝谈判，为什么拒绝谈判，

因为拒绝谈判比接受谈判有更好的利益。我们不妨再考虑如图5-5所示的信用困境2博弈。信用困境2在图5-3的基础上加上了策略左和右，从而阶段博弈G有了四个纯策略纳什均衡：（欺骗，欺骗），（中，中），（左，左）和（右，右）。设想信用困境2博弈重复进行两次，且在第二阶段开始前可以观测到第一阶段的结果。进一步假设商人1（或2）的策略为：第一阶段选择诚信；在第二阶段，如果对方在第1阶段选择诚信，那么选择中；如果对方在第一阶段没有选择诚信，那么第二阶段选择左（或右）。那么（（诚信，诚信），（中，中））就是重复信用博弈2的子博弈完美均衡结果，因为先选诚信，接着选中，每个参与者都可得到4+3的收益，但在第一阶段偏离这一选择而选欺骗，却只能得5+1/2（选择其他行动收益更低）。更为重要的是，前一例子中遇到的困难在这里并没有出现。对于信用困境1而言，对一个参与者

在第一阶段不守信用的惩罚，只能通过第二阶段选择一个较劣的纳什均衡来对欺骗者进行惩罚，但在惩罚欺骗者的同时，也惩罚了诚信者，因而在信用困境1中就存在着重新进行谈判的动机。而在信用困境2中，这一点得到了克服，在惩罚欺骗者的同时，对诚信者进行奖励，欺骗者得1/2，而诚信者得4>3，因而诚信者没有动机去进行重新谈判。因而，对于商人1（或2）而言，（第一阶段选择诚信，第二阶段如果对方也诚信，那么选择中；如果对方欺骗，那么选择左（或右））就是子博弈完美均衡，（诚信，诚信）就有可能作为均衡结果出现。

从上述分析可以看出，信用困境1和信用困境2人为设计的痕迹过于明显，毕竟现实生活不是随意设计的游戏。另外一个冲突的地方是，在现实生活中有些博弈只有唯一的纳什均衡，甚至没有纳什均衡，但合作解同样出现，而且具有相当的稳定性。这就引出了无限重复博

弈。

三、无限重复信用博弈

合作解要在有限重复博弈中出现要求阶段博弈G必须存在多重纳什均衡，但在无限重复博弈中这一条件并不是必需的：即使阶段博弈G只存在唯一纳什均衡（甚至不存在纯纳什均衡），无限重复博弈中也存在子博弈完美均衡解，其中没有任何一个阶段结果是G的纳什均衡。根本的原因就在于如果博弈是无限重复的，当充分接近1，即人们有足够的耐心，那么考虑长远利益就要好于短视。

为了说明上述观点，我们仍然考虑信用困境博弈，但它无限次地进行下去。

每一阶段都重复纳什均衡（欺骗，欺骗）显然是无限重复信用困境的子博弈完美均衡，问题是还存在着其他“更好”的子博弈完美均

衡吗？这里我们考虑三个常见的策略：触发策略(Trigger strategy)，有限惩罚策略(Limited punishment stategy)和一报还一报策略(Tit for tat strategy)。

（一）触发策略

参与者的触发策略的正式表述为：

在第1阶段选择诚信，且在第t >1阶段，如果所有前面t – 1阶段的结果都是(诚信，诚信)，则选择诚信，否则选择欺骗。

如果参与双方都采取这种触发策略，则无限重复信用博弈的均衡结果就将是每一阶段都选择(诚信，诚信)。我们首先论证如果

充分接

发生欺骗图5-6 触发策略

博弈论-教学大纲

博弈论（英语）》教学大纲 Game Theory Syllabus 课程编号：Course Code：150133B 课程类型：专业选修课总学时：Hours：48 讲课学时：Lecture Hours: 48 实验（上机）学时：0 学分：Credits: 3 适用对象：金融学（金融经济实验班） Applied Majors: Finance 先修课程：经济学原理，中级微观经济学 Prerequisites: Principles in Economics 一、课程的教学目标（Purposes）博弈论作为经济金融类专业本科生的专业选修课程，包括非合作博弈理论和信息经济学初步两部分内容。该课程的讲授对于培养和训练学生的经济学思维，提高学生的专业素质和综合能力。本课程教学的主要目标是培养学生掌握在信息不对称和非合作条件下微观经济理论，并能够较好地应用博弈论的方法思考并解决实际问题，为学生们后续高级微观经济学及相关课程的学习打下坚实的基础。 Game Theory is a course specific for undergraduate students in Finance and Economics, and includes basics in Game Theory and some preliminaries in Information Economics. This course will teach students to think as economists, and improve their expertise in economics and finance. The target of this course is to help students to analyze and solve some problems in real life using Game Theory, and let students understand the economics theories in the context of information asymmetric, and thus shed the light for their studies and professions in the future. 二、教学基本要求（Requirement）本课程的主要内容是阐述博弈论和信息经济学的基础知识。目的在于帮助学生理解并掌握在非合作条件下经济主体的决策过程，和博弈论的基本原理，以及

博弈论教学大纲

《博弈论》课程教学大纲一、课程基本信息二、课程目标（一）总体目标：帮助学生获得必要的博弈论科学基本知识，了解学科发展前沿，掌握探索博弈论科学基本规律的一般方法；使学生学会应用博弈论的基本原理和方法分析政治、经济、军事、管理和社会生活等领域的博弈问题。（二）课程目标：课程目标1：让学生掌握博弈的定义、概念、分析方法，了解经典的博弈案例，掌握博弈的表述方法，能够找到博弈的均衡点，了解不确定博弈非合作博弈均衡。 1．1掌握博弈论的基本概念和分类、掌握博弈论的基本分析思路和方法、掌握博弈的表述方法，能够找到博弈的均衡点。 1．2了解经典的博弈案例，掌握委托人-代理人理论，能够理解和分析案例中的博弈均衡及其内涵。 1．3 了解不确定博弈非合作博弈均衡，理解不完美和不完全信息对博弈均衡的影响。 1．4 了解有限理性、进化博弈与合作博弈 1．5 了解博弈论历史和发展课程目标2：用博弈论解释经济、社会现象，掌握机制设计和规则制定的内涵，理解个体的预测行为和实际行为，并可以研究它们的优化策略。 2．1用博弈论解释经济、社会现象，掌握机制设计和规则制定的内涵， 2．2理解个体的预测行为和实际行为，并可以研究它们的优化策略。（三）课程目标与毕业要求、课程内容的对应关系

表1：课程目标与课程内容、毕业要求的对应关系表三、教学内容第一章导论 1.教学目标：了解博弈论的定义，理解和掌握完全信息静态博弈/完全信息动态博弈/不完全信息静态博弈/不完全信息动态博弈之间的区别与联系 2.教学重难点：重点：完全信息静态博弈/完全信息动态博弈/不完全信息静态博弈/不完全信息动态博弈之间的区别与联系；难点：完全信息静态博弈/完全信息动态博弈/不完全信息静态博弈/不完全信息动态博弈之间的区别与联系 3.教学内容 1.1从游戏理论到决策理论 1.2一些例子 1.3博弈的特征和博弈的分类 4.教学方法（1）讲授法。围绕课程的核心概念和基本理论进行讲解。（2）讨论法。围绕课程中涉及到的专题组织学生进行讨论。（3）案例模拟法。在教学中，选择相应的博弈案例，让学生理解博弈的条件、过程和均衡结果。 5.教学评价（1）什么是博弈？博弈论的主要内容是什么？

活学活用博弈成功智慧_第五章智猪博弈：多劳不多得的悖论情境

聪明猪与笨和尚博弈论里面有个十分卡通的博弈模型，叫做“智猪博弈”。假设猪圈里有两头猪同在一个食槽里进食，一头大猪，一头小猪（假设它们都是有着认识和实现自身目标的充分理性的“智猪”）。猪圈两头距离很远，一头安装了一只控制饲料供应的踏板，另一头是饲料的出口和食槽。猪每踩一下踏板，另一头就会有相当于10份的饲料进槽，而踩踏板以及跑到食槽所需要付出的“劳动”，加起来要消耗相当于2份的饲料。这两头猪各有两个选择：自己去踩踏板或等待另一头猪踩踏板。其中选择自己踩踏板的猪，不仅要付出劳动，消耗掉2份饲料，而且由于踏板远离饲料，它将比另一头猪后到食槽，从而减少吃到饲料的数量。下面假定：若两头猪都选择等待，那就都吃不到饲料，即双方得益均为0；若小猪踩踏板，大猪将吃到9份的饲料，小猪只能吃到l份的饲料，最后双方得益为[9，一1]（小猪付出劳动之后消耗掉2份饲料）；若大猪踩踏板，大猪和小猪将分别吃到6份和4份的饲料，最后双方得益为[4，4]；若两头猪同时踩踏板，同时跑向食槽，大猪吃到7份的饲料，小猪吃到3份的饲料，即双方得益为[5，1]。由上面的分析可以看出：小猪踩踏板只能得到l份甚至有可能损失1份饲料，不踩踏板反而有可能得到4份饲料。对小猪而言，无论大猪是否踩动踏板，小猪都不去踩踏板，而舒舒服服地等在食槽边，都是最好的选择。小猪选定了“等待”之后，大猪便只剩下了两个选择：等待就吃不到；踩踏板得到4份饲料。所以踩踏板就变成了大猪的优势策略，当大猪知道小猪是不会去踩动踏板时，自己亲自去踩踏板总比不踩强，只好为自己的4份饲料不知疲倦地奔忙于踏板和食槽之间。如果采用重复剔除劣势策略的方法，那么首先，无论大猪选择什么策略，选择踩踏板对小猪都是一个严格劣势策略，应该首先加以剔除。在剔除小猪踩踏板这一选择后的新博弈中，小猪只有等待一个选择，而大猪则有两个可供选择的策略。在大猪这两个可供选择的策略中，选择等待是一个严格劣势策略，我们再剔除薪博弈中大猪的严格劣势策略——等待。剩下的新博弈中只有小猪等待、大猪踩踏板这一个可供选择的策略，这就是智猪博弈的理陛解。智猪博弈与囚徒困境的不同之处在于：囚徒困境中的犯罪嫌疑人都有自己的严格优势策略（也就是坦白）；智猪博弈中，只有小猪有严格优势策略（等待），而大猪没有。这样就出现了一个多劳不多得的悖论情境：小猪躺着大猪跑。智猪博弈存在的基础，就是双方都无法摆脱共存局面，而且必有一方要付出代价换取双方的利益。而一旦有一方的力量足够打破这种平衡，共存的局面便不复存在，期望将重新被设定，智猪博弈的局面也随之被破解。中国有个美术片叫做《三个和尚》，里面说“一个和尚挑水吃，两个和尚抬水吃，三个和尚没水吃”，看上去，他们都想做那只“智猪”，但是却因为无人愿意承担起义务而导致每个人都无法获得利益。用我们日常的话来讲，智猪博弈，就是一个不同期望值之间的博弈，如果所有各方的期望值

《博弈论》教学大纲

《博弈论》教学大纲一、课程性质、教学目的和要求（一）性质和目的博弈论是研究多人决策问题的理论，这类问题在经济学研究中又经常会遇到。例如，大家都已经十分熟悉的寡头垄断市场就是典型的多人决策——期中的每一厂商必须考虑其它厂商的行为。但博弈论在经济领域的应用远不限于产业组织理论。在微观研究领域，交易机制的模型就涉及博弈论；在中观经济研究中，劳动力经济学和金融理论都有关于企业要素投入品市场的博弈论模型，即使在一个企业内部也存在博弈论问题：如许多工人可能会为同一升迁机会勾心斗角，不同部门间也会为争取公司的资本金投入相互竞争。最后，从宏观的角度看，国际经济学中关于国家间的相互竞争，选择关税或其它贸易政策的模型；宏观经济学中也有货币当局和工资、价格制定者间的战略相互影响，最终决定了货币政策效果的模型。学习本课程的目的在于使金融学专业的硕士研究生掌握博弈论的基本概念、基本方法和基本理论，并学会用博弈论的思想方法分析理论与实践中出现的新问题。（二）教学方法主要采用课堂教学的方式，其间有针对性地指导研究生阅读相关文献、著作，开展课堂讨论，以开拓思维。（三）教学安排

本课程中，我们将讨论四类博弈：完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈（如果其中一个参与人不知道另外参与人的收益函数，该博弈就是不完全信息的，如在拍卖中，每一个竞买者都不知道另外竞买者愿为拍卖品出多高的价格）。与上述四类型博弈相对应的是四个均衡概念：纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡和精炼贝叶斯纳什均衡。本课程32总学时，2个学分。二、基本教学内容与学时安排第一章博弈论基本概念（4学时） 1.1博弈论典型案例介绍 1.2博弈论的基本概念及战略式描述第二章完全信息静态博弈（6学时） 2.1可理性化和反复剔除劣行动 2.2纳什均衡 2.3 纳什均衡的存在性与多重性讨论 2.5 混合战略的纳什均衡及其存在性第三章纳什均衡应用举例（4学时） 3.1 Cournot寡头垄断模型 3.2 Hotelling寡头垄断模型 3.3 监督博弈 3.4 公地的悲剧 3.5市民责任博弈

博弈论知识点总结完整版

博弈论（一）：基本知识 1.1定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。 1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。 1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。倘若不能，则称非合作博弈（Non-cooperative game）。合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。把两个角度结合就得到了4种博弈： a、完全信息静态博弈，纳什均衡，Nash(1950) b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965） c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968） d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975）Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式：策略式表述(Strategic form), 扩展式表述（Extensive form） 1.6占优均衡： a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。对于所有的s-i，si*称为参与人i的严格占优战略，如果满足： ui(si*,s-i)>ui(si',s-i) "s-i, " si' ¹si* b、占优均衡：一个博弈的某个策略组合中，如果对应的所有策略都是各参与人的占优策略，则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡： a、“严劣”和“弱劣”的含义：设s i’和s i’是参与人i可选择的两个策略，若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’, s-i), 则说策略s i’严劣于策略s i’。上面式子中，若将“<”改为“≤”，则说策略s i’弱劣于策略s i’。 b、定义：重复剔除严格策略就是各参与人在其各自策略集中，

第五章-博弈论与竞争策略

第五章博弈论与竞争策略第一节第二节第三节博弈论的基本概念完全信息静态博弈重复博弈和序列博弈在现实经济社会，完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力，又面临很大的竞争压力。厂商之间具有相关性和依存性。因此，可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家：纳什（Nash）、泽尔腾（Selten）和海萨尼（Harsanyi），他们都对博弈论在经济学中的应用作出了贡献。 70年代以来，博弈论已经发展成为现代经济学的基础重要基础之一，改变了传统经济学的结构，这主要有两个方面的原因： 1．传统经济学着重研究市场机制和价格制度，分析完全竞争市场中的最优决策，不考虑决策者之间的相互影响。但是，现实经济运行中市场是不完全竞争的，行为主体之间的决策具有相互影响。 2．完全竞争市场是以完全信息为条件的，这在现实经济运行中也难以保证。在信息不对称条件下，考虑行为主体相互影响的非价格制度可以用博弈论分析。当然，应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外，关键是正确估计各参与者的策略空间和收益函数。第一节博弈论的基本概念一．博弈论及其特点 1．博弈和博弈论博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。博弈论（Game Theory）也称对策论，它是一种分析博弈过程和结果的数学方法，研究具有理性的多个行为主体的决策和行动直接相互作用和影响时，事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。 2．特点：（1）参与者具有各自的目标：（2）参与者都是理性行为者；（3）参与者之间具有相关性；（4）事态发展的结果取决于全部参与者的共同行为；（5）参与者要根据对其他参与者的判断决定自己的行动，因而是对策。可见，博弈论是与优化论不同的决策理论。优化论是一种单人决策理论；博弈论所揭示的规律是一种多人决策理论。二．博弈论的基本概念在博弈论中，博弈的基本要素被概括为以下概念： 1）参与者Players （玩家）：即参加博弈过程的行为和决策主体，也是利益主体。在一个博弈中，最少要有两个参与者。 2）策略Strategies （战略或策略行为）：即参与者在某个博弈时点，根据其掌握的有关博弈信息而选择的决策变量和行动计划，一个参与者的全部可行策略称为他的策略空间。接上页 3）收益Payoff（支付、得益）和收益函数：收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略，称为收益函数。 4）结局 outcome（结果）：指博弈的结果，指既定策略组合条件下全部参与者所得收益的集合。 5）均衡 Equilibrium （均势）：指达到稳定的策略组合或结局。 6）博弈规则：指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。例：可口可乐与百事可乐（参与者）的价格决策：双方都可以保持价格不变或者提高价格（策略）博弈的目标和得失情况体现为利润的多少（收益）利润的大小取决于双方的策略组合（收益函数）博弈有四种策略组合，其结局是：（1）如果双方都不涨价，各得利润10单位；（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；

博弈论-第五章

第五章重复博弈在这一章中，我们将围绕着人类的合作为什么产生这一命题来展开。人与人之间合作生产的一个原因（从经济学的角度来看）是这种做法对于参与者双方而言是一个有利可图的事，为什么说明这一点我们将用到重复博弈。另一个解释合作生产的方法就是引入信息不对称，在这种情况下，一个人装作是好人是有利可图的（因为好名声能够给他带来收益），这在信息不对称中会加以介绍。

第一节重复博弈的定义及扩展式给出重复博弈定义之前，需要做若干准备，一个准备就是由于重复博弈有可能会进行一个很长的时期，甚至是无穷期，因而必须考虑收益的时间价值。相应的表达偏好的收益函数也需要给出一定的限制。一、贴现因子与偏好明天的一元钱和今天的一元钱价值是不一样的，最简单的理由是今天的一元钱如果存入银行那么在明天会变成1+ r ，所以明天的一元钱只相当于今天的1/(1+ r )元钱，1/(1+ r )实际上就是经济学中的贴现率。如果假设未来没有不确定性，定义1 1r δ=+，未来存在收益流R 1， R 2，R 3，…，那么这个未来收益流的贴现值之和就为 V =211231t t t R R R R δδδ∞-=+++=∑L (5-1)

其中(0,1) δ∈称为贴现因子(Discount factor)。严格讲，贴现因子并不等于贴现率，但贴现因子与贴现率一定是同方向变动的。例如，我们考虑一个特殊的重复博弈，其结束之前重复进行的次数是随机的，即在博弈的每一阶段完成之后，都要通过抛若干枚（加权的）硬币的方式来决定博弈是否结束，如果硬币朝上那么博弈结束（即概率为p），如果是其他情况，那么博弈继续（即概率为1 –p）。如果下一阶段能得到的收益为R1，那么在当前阶段硬币未抛之前的价值（即贴现后的期望值）为(1 –p)R1/(1+ r)；如果下两阶段能得到的收益为R2，在当前阶段硬币未抛之前的价值为(1 –p)2R2/(1+ r)2；下三阶段、四阶段等等的收益，照此类推。令(1)/(1) δ=-+，则贴现因子既包含了货币的时 p r 间价值（贴现率1/(1+r)），又包含了博弈结束的可能性(1 –p)。有了贴现因子的概念，我们就可以非常方便地比较无穷重复博弈

博弈论提纲

博弈论提纲第一章主要内容：第一节博弈论学科的产生、发展和演变过程 1 博弈论(Game Theory)学科的研究对象； 2 博弈论(Game Theory)学科的产生和发展； 3 90年代以来博弈论的3个发展动向；第二节博弈论与“理性”概念 1 人类对理性认识的历史发展过程； 2 理性与有限理性、非理性的概念； 3 博弈论中理性概念的内涵（重点）第二章预备知识（2）本章主要内容：第一节博弈论的一些重要概念：经验主义,均衡,合作,信息第二节博弈的基本要素；第三节博弈模型的三种正规表述。总结：博弈论各个分支的构成；形成博弈均衡的两种解释——理性主义和演化主义；博弈的基本要素——参与者,行动,策略,支付,规则,环境；三种博弈表述模型适用范围——策略式；扩展式；联盟式; 几个重要的概念：（1）选择与精炼；（2）同时行动博弈和序贯行动博弈；（3）完美回忆和完美信息；（4）参与者决策不确定的来源；（5）合作博弈的特征函数；第三章《传统博弈理论的简介》主要内容：第一节传统博弈理论的研究范式；第二节纳什均衡的定义和几种实现途径；第三节纳什均衡的无效率问题：重复博弈和无名氏定理；第四节纳什均衡的无效率问题：相关均衡和信号装置；第五节纳什均衡的多重性问题：静态博弈和焦点均衡；第六节纳什均衡的多重性问题：动态博弈和子博弈完美均衡；第七节不完全不完美信息下的纳什均衡存在性：贝叶斯均衡；传统博弈理论的研究内容：纳什均衡的存在性（Nash，1950）和几种实现途径；纳什均衡的无效率及解决：无名氏定理，Friedman,1971 ；相关均衡，Aumann1974；纳什均衡的多重性及解决：焦点均衡，Schelling，1960；子博弈完美均衡，Selten, 1965；在不完全（或不完美）信息下，纳什均衡的存在性；贝叶斯纳什均衡，Harsanyi，1967 第四章主要内容：信息经济学的概述；道德风险与激励理论；逆向选择和信息甄别；机制设计理论和显示原理本章主要内容：第一节信息经济学的概述；第二节道德风险问题的几个实例；第三节委托—代理模型；第四节几种激励方案分析；第五节委托人的最优激励方案第六节进一步的讨论（选讲）第七节一般的委托－代理模型（选讲）第八节我国医疗改革问题的应用第五章不完全信息博弈和信息经济学（2）：逆向选择和信息甄别本章主要内容：第一节旧车市场的逆向选择问题（Akerlof，1970）；第二节劳动力市场的逆向选择问题；第三节信贷市场的逆向选择问题（Stiglitz，1987）；第四节逆向选择问题的解决途径；第五节劳动力市场的信号发送（Spence，1973）；第六节劳动力市场的信息甄别。第六章（3）：机制设计理论与显示原理第一节机制设计理论的范式、行为基础及方法；第二节显示原理；第三节市场交易问题中的机制设计第四节劳动力市场中的机制设计；第五节机制设计理论的应用；第六节机制设计理论与经济改革实践总结第一节机制设计理论的范式、行为基础及方法；在分散化决策的前提下，如何设计一个机制，在一系列环境（技术、偏好和资源禀赋）下使得经济主体的个人利益和设计者的预定目标是激励兼容的。第二节显示原理；任何一个说谎话机制（non-truth-telling）下的潜在交易达到的均衡结果，都可以被一个说真话的机制所取代；第三节市场交易问题中的机制设计第四节劳动力市场中的机制设计； (1) 建立一个保证所有参与者都愿意参与并说真话的约束条

《博弈论》-课程教学大纲

《经济博弈论》课程教学大纲一、课程基本信息课程代码：16046305 课程名称：经济博弈论英文名称：Economy Game 课程类型：专业基础课总学时：32 学分：2 适用对象：经管类专业大二、大三年级学生先修课程：微观经济学、微积分。二、课程简介中文简介：本课程是经济学的标准分析工具之一，着重研究个体之间的相互依存性，是日常生活中一种极重要的思维方式，在经济学课程建设中占有核心地位。产业组织理论中的新产业组织学派，信息经济学中的海萨尼转化，宏观经济学中的博弈方法，区域经济学中的空间博弈问题，制度变迁理论中的演化博弈分析、公共经济学中的委托代理问题和公共选择问题等都与本课程有关。英文简介：This course is one of the standard analysis tools of economics. It focuses on the interdependence of individuals. It is an extremely important way of thinking in daily life and occupies a core position in the construction of economics courses. The new industrial organization school in the theory of industrial organization, the Hesanian transfo rmation in information economics, the game method in macroeconomics, the spatial game problem in regional economics, the evolutionary game analysis in the theory of institutional change, and the public economics The principal-agent issues and public choice issues are all related to this course. 三、课程性质与目的在掌握微、宏观经济学的基础上，同学通过本课程的学习，掌握经济博弈论的主要理论知识，培养学生正确分析问题做出决策的能力，并能从博弈的角度

《博弈论》课程教学大纲

博弈论 GameTheory 一、课程基本信息学时：32 学分：2 考核方式：考试(闭卷)，平时成绩占总成绩的30% 中文简介：博弈论是应用经济学的一个分支，其研究对象是以市场竞争中的主体，企业或个体之间的相互影响以及它们之间的对抗、依赖与制约作为前提与出发点来研究主体之间的行为策略，以科学决策为依据，指导主体合理地组织生产、配置资源与开展竞争等微观经济活动，将现代经济学原理和数学分析工具相结合，应用于现代金融企业的经营决策中。它是一门现代经济学和决策管理学的交叉学科。学习本课程的目的在于使金融管理类学生掌握博弈基础原理、管理决策的基本方法和基本技能，为毕业后从事企业、事业等单位的金融管理工作奠定良好的素质基础。本课程作为统计学专业的专业选修课，要求学生具备一定的概率论基础与逻辑思考能力。二、教学目的与要求本课程的教学目的是使学生掌握几种经典的博弈模型及将博弈模型应用于实际案例之中。课程基本要求如下： (1)了解博弈论中的基本元素，多种博弈模型的定义 (2)在现实案例中套用博弈模型，解释一些常见的社会现象当中的博弈意义。 (3)了解博弈模型的优缺点，正确使用博弈。 (4)利用博弈模型解决现实问题。 (5)认识博弈论在经济学中的地位，了解博弈模型与数学模型的结合。三、教学方法与手段 1、教学方法在课程的教学过程中，根据教学内容的不同，综合采用多种的教学方法，以提高教学质量,更好地完成教学任务。(1)课堂讲授：在课堂讲授中，紧密联系现实与书本知识，让学生学会举一反三，做到活学活用。（2）案例教学：教师在教学过程中选择恰当的案例作为课程内容，并采用案例分析、案例讨论等教学环节，促进学生对课程内容的理解和与

博弈论基础

博弈论博弈论（Game Theory），亦名“对策论”、“赛局理论”，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。参见：行为生态学（behavioral ecology）。约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。博弈论思想古已有之，中国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。近代对于博弈论的研究，开始于策墨洛（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。 1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。 1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的策墨洛（Zermelo) 基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出

博弈论习题及解答

※第一章绪论 §1.2 1. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?（见教材） 2. 分别用规范式和扩展式表示下面的博弈。两个相互竞争的企业考虑同时推出一种相似的产品。如果两家企业都推出这种产品，那么他们每家将获得利润400万元；如果只有一家企业推出新产品，那么它将获得利润700万元,没有推出新产品的企业亏损600万元；如果两家企业都不推出该产品，则每家企业获得200万元的利润。企业B 推出不推出企业A 推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500) 3. 什么是特征函数? （见教材） 4. 产生“囚犯困境”的原因是什么？你能否举出现实经济活动中囚徒困境的例子？原因：个体理性与集体理性的矛盾。例子：厂商之间的价格战，广告竞争等。

※第二章完全信息的静态博弈和纳什均衡 1. 什么是纳什均衡? （见教材） 2. 剔除以下规范式博弈中的严格劣策略，再求出纯策略纳什均衡。先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。然后用划线法求出该矩阵博弈的纯策略Nash均衡。乙甲 1 3 1 2,0 4,2 2 3,4 2,3 3. 求出下面博弈的纳什均衡。乙 L R 甲U 5,0 0,8 D 2,6 4,5 由划线法易知，该矩阵博弈没有纯策略Nash均衡。由表达式(2.3.13)~(2.3.16)可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1 将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。解：设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)} 令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x) 作出三条直线，如下图，图中粗的折线，就是F(x)的图象

博弈论知识点总结完整版

博弈论（一）：基本知识定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。倘若不能，则称非合作博弈（Non-cooperative game）。合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。把两个角度结合就得到了4种博弈： a、完全信息静态博弈，纳什均衡，Nash(1950) b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965） c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968） d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975）Kreps, Wilson(1982) Fudenberg, Tirole(1991) 课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈博弈模型的两种表示形式：策略式表述(Strategic form), 扩展式表述（Extensive form）占优均衡： a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。对于所有的s-i， si*称为参与人i的严格占优战略，如果满足： ui(si*,s-i)>ui(si',s-i) ? s-i, ? si' ?si* b、占优均衡：一个博弈的某个策略组合中，如果对应的所有策略都是各参与人的占优策略，则称该策略组合为该博弈的一个占优均衡。重复剔除严劣策略均衡： a、“严劣”和“弱劣”的含义：设 s i’和s i’’是参与人i可选择的两个策略，若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。上面式子中，若将“<”改为“≤”，则说策略s i’弱劣于策略s i’’。 b、定义：重复剔除严格策略就是各参与人在其各自策略集中，不断剔除严劣策略…如果最终各参与人仅剩下一个策略，则该策略组合就被称为重复剔除严劣策略均衡。（二）：纳什均衡（Nash Equilibrium）纳什均衡定义：对于一个策略式表述的博弈G= {N,S i, u i, i∈N}，称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡，如

产业经济学教材(第三版) 王俊豪复习题答案- (5)

第五章博弈论与企业策略性行为 1．简述博弈的构成要素及其含义。答：博弈的构成要素有参与人、行动、信息、策略、支付或收益、结果和均衡。参与人是博弈中的决策主体，参与人的目的是选择行动，实现自身收益最大化。行动是参与人的决策变量或招式。信息是参与人在博弈前和博弈中所能了解和观察到的知识，包括博弈规则和参与人的特征、行动。策略是参与人选择行动的规则（何时，选择何行动）; 是完整的相机行动方案。当参与人同时行动时，没有任何人能够获得他人行动的信息，那么，策略选,就变成简单的行动选择。此时，策略与行动相同,无需区分。如果行动有先后顺序，那么参与人的策略与行动将不同。支付或收益是一个特定策略组合下，参与人所得之效用。结果是博弈分析者所要揭示的东西，是分析者从行动、支付和其它变量的取值中所挑选出来的---他所感兴趣的---要素的集合。均衡是参与人互为最优的策略组合。 2．简述新产业组织理论。答：在20世纪70年代以后，由于新的研究方法引入而出现新产业组织理论(NIO)，它的研究焦点是策略性行为。新产业组织理论的兴起和发展对传统产业组织理论的分析方法和分析范式提出了重要挑战。一方面，新产业组织理论超越了传统哈佛学派的SCP分析范式。另一方面，新产业组织理论也对芝加哥学派的静态的“价格-产出”框架提出了质疑。以博弈论和信息经济学为方法论基础的新产业组织理论则明确了策略性行为在产业组织理论中的核心地位。正如泰勒尔所言，博弈论和信息经济学提供的理论基础，“使得越来越多的经济学家摒弃了芝加哥学派建立在完全信息上的简单世界观”。 3．策略性行为的含义，其研究的市场基础与方法分别是什么？答：策略性行为是指寡占或垄断企业为了提高利润所采取的、旨在影响市场环境的行为的总称。如策略性定价、企业边界调整、研发等。市场环境包括顾客、竞争对手的信念，现存和潜在竞争对手的数目,竞争对手的技术和成本等因素。它包含但比市场结构范畴更宽泛。寡占或垄断市场结构是策略性行为研究的市场

博弈论扼制模型

博弈论扼制模型第一章：引言博弈论是一门研究决策和策略的学科，它涉及多方利益冲突情景下的决策制定。博弈论的研究对象包括个体、组织以及国家等。本文将聚焦于博弈论中的扼制模型，探讨其策略和局限。第二章：扼制模型的基本概念 1. 扼制模型的定义：扼制模型是一种在多方利益冲突下，通过采取相互制约的策略以达到最优结果的决策模型。 2. 扼制模型的基本要素：参与者、策略集合、收益函数、信息集合等。 3. 扼制模型的核心概念：纳什均衡、最优策略、博弈树等。第三章：扼制模型的策略 1. 策略的制定：参与者在面对利益冲突时，根据自身情况和对其他参与者的判断，制定出最优策略。 2. 合作与对抗：在扼制模型中，合作和对抗是两种常见的策略选择。合作可以实现互利共赢，但需要建立信任；对抗则追求自身利益最大化，但可能导致长期损失。 3. 政府干预：政府在扼制模型中扮演着重要角色，通过法律和政策来干预博弈过程，达到社会效益最大化。第四章：扼制模型的局限

1. 信息不对称：参与者之间信息不对称可能导致扼制模型失效，因为缺乏准确的信息，无法制定最优策略。 2. 计算复杂性：扼制模型中的博弈树可能非常庞大，计算复杂性成为限制模型应用的一个主要因素。 3. 心理因素：人类决策行为受到情感、认知偏差等因素的影响，可能导致理性决策的偏离。第五章：案例分析通过具体案例分析，探讨扼制模型在不同领域的应用，如企业竞争、国际关系等，揭示模型的优势和局限性，并提出改进建议。第六章：结论总结全文内容，强调扼制模型在决策制定中的重要性和局限性，提出未来研究方向，如考虑心理因素、改进计算方法等，以进一步完善扼制模型的应用。

博弈论平话智慧解读人生

博弈论平话智慧解读人生人生是一场无法回避的博弈，无论我们是意识到还是不自觉地参与其中。博弈论作为一门研究决策和策略的学科，为我们提供了一种全新的视角来解读和理解人生。在这篇文章中，我们将探讨博弈论在平话智慧中的应用，以及它对人生的意义和启示。第一章：博弈论的基本概念博弈论是一门研究多方决策问题的学科，它涵盖了决策制定者之间的相互影响和控制力。在博弈论中，每个参与者都被视为一个理性的决策者，他们根据自己的利益和预期来制定策略。第二章：博弈论在人际关系中的应用人际关系是一个充满博弈的领域。博弈论为我们提供了一些有用的策略和解决方案，帮助我们更好地处理人际关系的挑战。例如，在合作与竞争的关系中，博弈论告诉我们如何平衡个人利益和集体利益，以达到最佳解决方案。第三章：博弈论与理性决策理性决策是博弈论研究的核心概念之一。在人生中，我们经常需要做出各种决策，博弈论提醒我们要基于充分的信息和分析来做出决策，以最大化自己的利益。然而，博弈论也提醒我们，有时候不完全理性的决策可能会带来更好的结果。第四章：博弈论与风险管理

风险是人生中不可避免的一部分。博弈论教会我们如何评估和管理风险，以最大限度地减少损失并获得最佳回报。从个人角度来看，博弈论告诉我们在面对风险时要坚持自己的底线，并尽可能通过合作和谈判来实现双赢的局面。第五章：博弈论的思维模式博弈论注重逻辑思维和策略规划，培养了我们的决策能力和问题解决能力。它教会我们关注整体利益而不仅仅是个体的利益，锻炼了我们的团队合作和合作能力。通过运用博弈论的思维模式，我们可以在人生的道路上更加自信和明智地前行。结语：博弈论是一门智慧的学科，它帮助我们更深入地理解和解读人生的种种困境和选择。通过运用博弈论的原理和策略，我们可以更好地处理人际关系、提高决策能力、管理风险，并以更加理性和智慧的方式生活。在博弈论的指导下，我们可以更加从容地面对人生的挑战，收获更多的成功与幸福。

第五章-不完全竞争市场

第五章不完全竞争市场一、垄断市场 1、垄断市场定义与特征* ①定义：只有一个厂商控制生产和销售的市场组织。 ②特征：一家厂商生产和销售一种商品，厂商控制价格；无替代品；进出困难；信息不完全。 ③原因：控制了原料；拥有专利权；政府授权；生产规模和市场需求只允许一家企业生产的自然垄断。 2、垄断市场的需求曲线和收益曲线* ①垄断厂商控制销量和价格，导致负斜率的需求曲线。 ②AR曲线与MR曲线分离，MR曲线在AR曲线的下方，斜率是AR曲线斜率的两倍：，得到最大TR。 AR与MR有相同的纵轴截距a；MR=0时，价格或为1/2.任何一个需求方程的价格为中点价格时其收益最大，此时需求价格弹性为1。 ③MR与P和需求价格弹性的关系已知p，MR与e有同向关系： ④整理得到检验垄断或竞争水平的勒那指数：还可得到价格是边际成本的增函数、与需求价格弹性呈反向关系的方程： 3、垄断市场短期均衡* ①垄断厂商的短期均衡的手段和条件：K不变条件下厂商通过调整产量和价格实现利润最大化。条件： ▲是利润最大化条件的原因：时，厂商增加产量能够增加利润，同时，直至两者相等；时，厂商增加产量则增加亏损，减少产量，直至两者相等，亏损为零。在时，利润或亏损有多少，取决于。 ▲垄断厂商短期亏损的原因有三：生产成本过高导致SAC曲线位置过高；市场需求过小导致曲线下移；厂商制定低价阻止其他厂商进入。 ②垄断厂商的供给曲线 ▲垄断厂商由于能够控制价格和产量，故它可对不同的销量规定相同p，也可对相同的销量规定不同的p，或随产量增加降低p，从而形成水平、垂直或负斜率的供给曲线。 ▲原因。厂商通过调整Q、p实现；p>MR；随厂商调整p和Q，AR和MR会上下移动，MC不变，从而不会出现一个p对应一个Q的曲线。这显示了垄断厂商的市场势力。 4、垄断厂商的长期均衡*：前提是长期内其他条件不变和市场封闭条件下，厂商调整规模降低成本、调整价格和产量实现更大的利润。条件： 5、垄断市场。由于只有一个厂商，垄断厂商的需求曲线和垄断厂商的供给曲线，分别就是垄断市场的需求曲线和垄断市场的供给曲线。 6、垄断厂商的价格歧视*

博弈论：策略的艺术智慧树知到网课章节测试答案

1、选择题:关于博弈论，著名的经济学家诺贝尔奖获得者保罗·萨缪尔森说了如下哪句话？答案: 【要想在现代社会做一个有文化的人，你必须对博弈论有一个大致的了解。】 2、选择题:在下列关于理性人假设的描述中，那句话是错误的？答案: 【理性人假设是完全符合客观实际的。】 3、选择题:理性和道德的关系错误描述是？答案: 【理性的人一定是道德的人。】 4、选择题:下列那句描述是错误的？答案: 【在博弈中，强者恒胜，弱者恒败。】 5、选择题:下列四人谁不是博弈论大师？答案: 【罗曼·罗兰。】 1、选择题:在A、B、C和D博弈中是囚徒困境博弈的是答案: 【乙甲坏心好心坏心 10,12 110,0好心 0,50 100,39】 2、选择题:关于囚徒困境博弈的错误描述是答案: 【囚徒困境这个名词是美国著名博弈论专家约翰·纳什提出的。】3、选择题:下列社会现象中不符合囚徒困境博弈模型的是答案: 【科技发展】

4、选择题:不能打破囚徒困境的办法是答案: 【互相揭发】 1、选择题:在A、B、C和D博弈中是智猪博弈博弈的是答案: 【乙甲行动不动行动 3,30 12,60 不动 7,20 15,18】 2、选择题:关于智猪博弈的错误描述是答案: 【智猪博弈这个名词是美国著名博弈论专家冯·诺伊曼提出的。】3、选择题:下列社会现象中不符合智猪博弈模型的是答案: 【素质教育和应试教育。】 4、选择题:从博弈论的角度看，不明智的企业竞争策略是答案: 【投资研发新产品，抢占市场先机。】 5、选择题:避免搭便车，让偷懒的员工积极主动地去工作的博弈策略是答案: 【减量加移位方案，即将投食减少到原来的一半，同时将投食口移到踏板附近。】 1、选择题:在A、B、C和D博弈中是懦夫博弈的是答案: 【乙甲行动不动行动 0,0 8,4不动 4,8 2,2】 2、选择题:关于懦夫博弈的错误描述是答案: 【发动懦夫博弈的一方往往是竞争中的强者。】 3、选择题:夫妻双方在“去谁家过春节”这个博弈中的错误策略是答案: 【各回各家，各找各妈。】

文档之家

博弈论-第五章

博弈论-教学大纲

博弈论 教学大纲

活学活用博弈成功智慧_第五章 智猪博弈：多劳不多得的悖论情境

《博弈论》教学大纲

博弈论知识点总结完整版

第五章-博弈论与竞争策略

博弈论-第五章

博弈论提纲

《博弈论》-课程教学大纲

《博弈论》课程教学大纲

博弈论基础

博弈论习题及解答

博弈论知识点总结完整版

产业经济学教材(第三版) 王俊豪复习题答案- (5)

博弈论扼制模型

博弈论平话智慧解读人生

第五章-不完全竞争市场

博弈论：策略的艺术 智慧树知到网课章节测试答案

博弈论教学大纲

活学活用博弈成功智慧_第五章智猪博弈：多劳不多得的悖论情境

博弈论：策略的艺术智慧树知到网课章节测试答案