经济博弈论重复博弈

格式：ppt
大小：167.00 KB
文档页数：21

下载文档原格式

/ 21

重复博弈的经典例子

重复博弈的经典例子重复博弈的经典例子在经济学和游戏理论中，博弈论是一种非常重要的分析工具。

它通过对智力游戏、竞争和合作等情境的描述，来研究参与者的行为和决策方式，以及他们的利益。

其中，重复博弈是一种经典的博弈类型，透露了很多有趣的现象和策略。

本文就将介绍其中的两个典型例子。

例子一：囚徒困境囚徒困境是博弈论史上最著名的例子之一。

它描述了两名罪犯在审讯时的选择。

如果他们都保持沉默，那么他们各被判三年徒刑；如果其中一个人背叛了另一个人并供出了他的罪行，那么背叛者将被判无期徒刑而另一个人将被无罪释放；如果两个人都背叛了对方，那么都将被判十年徒刑。

显然，各自为政并不能得到最好的结果，但是如果双方都不信任彼此，那么无法避免地会被卷入恶性循环，陷入坏的局面。

所以，如何打破僵局，达到合作互惠的结果呢？答案是，在重复博弈的前提下，让双方建立起稳定的信任关系，并通过稳健的策略来激励对方合作。

比如，如果一方合作另一方背叛，那么背叛者的惩罚应该比另一方少，这样可以让背叛者看到合作的好处；如果另一方也背叛了，那么惩罚应该更大，从而降低背叛的动机。

这种实验表明，人们在重复博弈中往往会采取长远最大化利益的策略，而不是只考虑眼前的利益。

例子二：公共产品的提供公共产品是指对所有人都有益处，但是没有私人市场提供或者通过个人机会成本无法享受的产品，比如环保、文化教育等。

由于公共产品的自由乘坐，导致许多人往往倾向于“裹着麻袋过河”，即只享受公共产品的好处而不出任何力气来投资。

这样，公共产品会出现供给不足的情况，逐渐凋零。

那么，如何解决公共产品的提供问题呢？重复博弈可以给出一些帮助。

假设每个人都可以选择投资或不投资，而且每个人都可以看到其他人的决策；如果有足够多的人投资了，那么所有人都可以获得好处；如果投资的人太少了，那么所有人都得不到好处。

那么，如何让更多的人参与投资呢？答案是，通过适当设定利益偏好，比如对投资者给予优惠，以鼓励更多的人来投资。

博弈论(第四章)

谢富纪 2009年3月 11
2.有限次重复博弈
有唯一纯策略纳什均衡博弈的有限次重复博弈
有限次重复博弈的囚徒困境博弈，可以理解成警察给两人两次交代的机会。
囚徒2 坦白不坦白
囚徒 1
坦白
不坦白
-5， -5
-8， 0
0， -8
-1， -1
谢富纪 2009年3月
12
2.有限次重复博弈
因为重复博弈全过程是一种动态博弈过程，从第二阶段开始。此前的博弈已是既成的事实，而在此后又没有任何的后继阶段，因此实现本阶段最大利益是两博弈方在该阶段的唯一原则。结果是（坦白，坦白），
谢富纪 2009年3月
29
2.有限次重复博弈
本博弈中之所以不能或不能部分实现最佳结果
（A，A），是因为在两次重复博弈中博弈方没
有运用触发策略的条件或者说机会。后面的选择并不取决于第一次博弈的结果。
谢富纪 2009年3月
30
2.有限次重复博弈
厂商2 得益
（1，4）（1.5，3）（3，3）
谢富纪 2009年3月
17
2.有限次重复博弈
削价竞争博弈
高价寡高价头 1 低价
寡头2
低价
100，100 20，150 150，20 70，70
由于两个寡头在同一市场的竞争可以看作维持很长时间，因此可以看作是重复博弈。然而结果是令人遗憾的。
谢富纪 2009年3月 18
2.有限次重复博弈
两个悖论
谢富纪 2009年3月
27
2.有限次重复博弈
两市场博弈的重复博弈
厂商 2 A 厂A 商 1 B B
3，3
1，4
4，1
0，0

4经济博弈论-重复博弈

8、第一阶段混合策略，第二阶段(A,B) (3,6)
9、第一阶段混合策略，第二阶段(B,A) (6,3)
5
结论：
轮换策略是该重复博弈的最佳子博弈完美纳什均衡
三次重复博弈的情形?
厂商1和厂商2可以分别采用如下触发策略：
厂商1：第一阶段选A；如果第一阶段结果是（A，A），则第二阶段选A，如果第一阶段结果是（A，B），则第二阶段选B；第三阶段无条件选B。厂商2：第一阶段选A；第二阶段无条件选B；如果第一阶段结果是（A，A），则第三阶段选A，如果第一阶段结果是（B， A），则第三阶段选B。
寡高价头 1 低价
寡头2 高价低价
１００，１００
２０，１５０
１５０，２０
７０，７０
削价竞争博弈
根据前面得到的一般结论，以它为原博弈的有限次重复博弈的唯一的子博弈完美纳什均衡，就是两博弈方重复5次原博弈的纳什均衡策略，也就是削价，两寡头还是会不断打价格战。
4.2 有限次重复博弈
结果为(A,A)、(A,B)、(B,A)，得益为（8，8）
证明：
1、第三阶段（B,A）是原博弈的纳什均衡，不会有哪一方愿单独偏离。
厂A 商
1B
厂商2 A B
3，3
1，4
4, 1
0，0
两市场博弈
证明：
2、第二阶段（A,B）是原博弈的纳什均衡，不会有哪一方愿单独偏离。
厂A 商
1B
厂商2 A B
总得益
如果一个无限次重复博弈的某博弈方某一均衡下各阶段得益分别为 p1,p 2 ,L L ，则考虑时间价值的重复博弈总得益现在值为
¥
å p = p 1 + dp 2 + d 2p 3 + L = d t-1p t

聊聊四种经典的博弈论模型

聊聊四种经典的博弈论模型展开全文1、囚徒困境：为什么两个犯人都选择坐牢官差破获了一宗盗窃案，抓住了两名犯罪嫌疑人。

但在审讯过程中，被关在一处的二人始终矢口否认盗窃罪名，说东西不是我们偷的。

为了避免两人达成默契，结成攻守同盟，官差决定对他们进行单独审讯。

官差表示，如果两人中有一人坦白认罪，则可立即释放，另一个不认罪的人判5年徒刑；如果两人都坦白罪刑，则他们将各判2年徒刑。

但还有一种情况，那就是两个人都拒绝坦白，由于缺乏证据，他们只会以扰乱公共场合为名判处3个月拘役。

这就是两名罪犯面临的困境中，他们会做出怎样的选择呢？首先，他们互相之间都不清楚对方是否会坦白，其次，二人都希望将自己的刑期缩至最短。

如此考虑，最终，两名犯人都会选择坦白交代。

上面的案例就是博弈论所说的“囚徒困境”。

犯人们如果彼此合作，可为集体带来最佳利益（刑期最短）；但当二人面对同样的情况且不知道对方如何选择时，在理性思考后，双方都会得出相同的结论（坦白交代），以便达到个人利益的最大化。

囚徒困境是博弈论的“非零和博弈”中具代表性的例子，反映的是个人的最佳选择并非是团体的最佳选择。

虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

2、智猪博弈：赢的总是小猪猪圈里有大小两头猪，它们在同一个食槽里进食。

为了保持饲料的新鲜，在远离猪食槽的另一边有一个踏板，大猪或小猪跑过去，每按动一次踏板，投食口就会掉落10个单位的食物。

于是，在大猪和小猪每次进食前，就会形成这样一种局面:如果小猪跑去按踏板，大猪守在食槽边，则大猪小猪吃到的食物比是9:1；反之，如果大猪去按而小猪守在食槽边，则吃食比例是6:4。

如果二猪同时到食槽边，则吃食比是7:3。

这样一来，从纯收益的角度考虑，小猪就更愿意选择在食槽边等待食物落出，因为“等待优于行动”，而大猪只能被迫奔忙在踏板和食槽之间。

上述“智猪博弈”的案例是经济学家的假设论证模型，这个博弈的结果，用经济学视角看待，可以解释为：谁占有更多资源，谁就必须承担更多义务。

博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理

博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理博弈论与信息经济学第6章完全且完美信息动态博弈——重复/超级博弈-连锁店悖论-无名氏定理经济学院丁言强内容提要重复博弈与战略空间有限次重复博弈：连锁店悖论无限次重复博弈冷酷战略与针锋相对战略无名氏定理阿伯罗定理: 两期战略序贯博弈与重复博弈序贯博弈的特征是，参与人在前一个阶段的行动选择决定随后的子博弈的结构，因此，从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈，或者说，同样结构的子博弈只出现一次。

动态博弈的另一种特殊但是非常重要的类型是所谓的“重复博弈”，就是同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”。

在每个阶段博弈，参与人可能同时行动，也可能不同时行动，在后一种情况下，每个阶段博弈本身就是一个动态博弈。

重复博弈的3个基本特征重复博弈可能是不完美信息博弈，也可能是完美信息博弈，但在博弈论中一般指的是前一种情况。

(1)阶段博弈之间没有“物质上”的联系，即前一阶段的博弈不改变后一阶段博弈的结构；(2)所有参与人都观测到博弈过去的历史；(3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。

重复博弈的战略空间战略是一套完备的相机行动规则，它必须说明在每一种可能的状态下参与人的行动选择，即使参与人并不预期这种状态真的会出现。

因为可以观察到其他参与人过去行动的历史，一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史。

所以，参与人在重复博弈中的战略是定义在博弈历史上的每个阶段博弈中的行动选择规则，即从博弈历史到行动空间的映射。

重复博弈的战略空间参与人在重复博弈中的战略空间远远大于且复杂于在每一个阶段博弈中的战略空间。

比如说，即使囚徒困境博弈只重复5次，每个囚徒的纯战略数量大于20亿个，战略组合的数量更多。

所以，重复博弈可能带来一些“额外的”均衡结果，这些均衡结果在一次博弈中是从来不会出现的。

经济博弈论之重复博弈

9
三、重复博弈的得益
重复博弈的得益，必须兼顾其他阶段的得益，或者考虑整个重复博弈过程得益的总体情况。
1.计算重复博弈的“总得益”，即博弈方各次重复得益的总和 2.计算各阶段的“平均得益”，即总得益除以重复次数
10
三、重复博弈的得益
考虑到重复博弈额次数和时间的先后次数，不同时间获得的利益对人们的价值是有差别的，考虑到这个因素，引进将后一段的得益折算成当前阶段得益（现在值）的贴现系数δ 。
连锁店悖论
是指一个在n个市场都开设连锁店的企业，对于各个市场的竞争者是否打击排斥的策略选择。
“先来后到”博弈，竞争者选择进入，先占领市场的连锁店不打击， A 打进 B 不进（1,10）是原博弈的唯一的子博弈完美纳什均衡，是两个理性的博弈方之间博弈的唯一结果。根据上诉的定理和一般结论，以这个博弈为原博弈的有限次重复博弈，唯一的子博弈完美纳什均衡就是原博弈的纳什均衡，也就是每个竞争者可以进入，连锁店不打击。（-2,3）（5,5）现实中类似问题的直觉经验与该理论结论明显不符。
三价博弈
厂商2 H H 厂商1 M
M
L
5,5 6,0 2,0
0,6 3,3
0,6 0,2
L
2,0
1,1
两个纯纳什均衡（M,M），（L,L）；符合博弈方总利益最大（H,H)
26
4.2.3多个纯策略纳什均衡博弈的有限次重复博弈
一、三价博弈的重复博弈
三价博弈
厂商2 H H 厂商1 M
M
L
5,5 6,0 2,0
31
4.2.3多个纯策略纳什均衡博弈的有限次重复博弈
三、两市场博弈的重复博弈厂商2 A 3，3 4，1 B 1，4 0，0 三次重复博弈的均衡路径是（A,A），（A,B）,(B,A)，得益是（3+1+4）/3=2.67.

经济博弈论判断题

判断下列表述是否正确，并作简单讨论：（1）如果一博弈有两个纯策略纳什均衡，则一定还存在一个混合策略纳什均衡。

（2）上策均衡一定是帕累托最优的均衡。

（3）有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。

（4）完全但不完美信息动态博弈中各博弈方都不清楚博弈的进程，但清楚博弈的得益。

（5）囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。

（6）帕累托上策均衡一定是上策均衡。

（7）风险上策均衡一定是上策均衡。

（8）上策均衡一定是纳什均衡。

（9）纳什均衡的一致预测性质是指不同博弈方的预测相同、无差异。

（10）静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型都设定行为选择，而不是只针对实际类型设定行为选择，是因为能够迷惑其他博弈方，从而可以获得对自己更有利的均衡。

（11）严格下策反复消去法不会消去任何上策均衡，但却可以简化博弈。

（12）严格下策反复消去法把严格下策消去时，不会消去纳什均衡。

（13）多重纳什均衡不会影响纳什均衡的一致预测性质。

（14）纯策略纳什均衡和混合策略纳什均衡都不一定存在。

（15）在动态博弈中后行为博弈方有更多信息，可减少决策的盲目性，并作有针对性的选择，因此总处于较有利的地位。

（16）在动态博弈中先行为博弈方可以抢先采取有利于自己的行为，因此一定有行动优势。

（17）子博弈完美纳什均衡能够排除均衡策略中不可信的行为（威胁或承诺）因此具有真正的稳定性。

（18）子博弈完美纳什均衡和逆推归纳法并不能解决动态博弈分析的所有问题。

（19）子博弈完美纳什均衡和逆推归纳法能解决动态博弈分析的所有问题。

（20）重复博弈能否促进博弈方更合作和提高博弈效率，取决于原博弈的结构和重复博弈次数。

重复博弈的名词解释

重复博弈的名词解释重复博弈（Repeated Games）是博弈论中的一个重要分支，指的是在一定时间内重复进行相同博弈过程的一类博弈模型。

在重复博弈中，参与者的行为不再是仅基于当前回合的局部最优策略选择，而是考虑到未来回合的长期利益。

通过持续进行博弈，参与者可以互相观察对方过去的行为，并以此来调整自己的决策策略，进而达到一种稳定的合作或竞争姿态。

1. 重复博弈的基本特征重复博弈具有以下基本特征：1.1 时间维度：与一次性博弈（One-shot Games）相比，重复博弈将博弈过程拉长至多个时间回合，并通过观察对方的历史行为来调整策略选择。

1.2 互动性：重复博弈需要有多个参与者之间的相互作用，参与者的决策会受到对方决策的影响，并进一步影响对方的决策。

1.3 不完全信息：在重复博弈中，参与者对于对方的信息不完全，无法准确了解对方的策略选择和收益函数。

因此，参与者需要通过观察对方的历史行为来推测对方的潜在策略和潜在目标。

2. 重复博弈的策略选择在重复博弈中，参与者的策略选择通常可以分为两种基本类型：协作（Cooperation）和背叛（Defection）。

2.1 协作策略：协作策略指的是参与者在每一轮博弈中均选择对双方都有利的行动，追求长期合作和互利利益最大化。

协作策略的核心是建立合作的声誉和信任，通过长期合作获得稳定收益。

2.2 背叛策略：背叛策略指的是参与者在某些轮次中选择对自己有利但对对方不利的行动，追求个体利益最大化。

背叛策略的核心是以牺牲他人利益为代价，获得短期利益。

3. 重复博弈的平衡在重复博弈中，参与者通过观察对方过去的行为和收益来判断对方的策略选择，并以此为依据来调整自己的行动策略。

由于参与者之间的相互影响和信息不对称，重复博弈中存在多种平衡。

3.1 历史依赖平衡：指的是参与者根据对方过去的行为来决定自己的最优策略选择，并以此为依据来推测对方的未来行为。

通过建立声誉机制和信誉积累，在博弈的不同时间段实现稳定合作关系。

经济博弈论课程教学大纲

经济博弈论课程教学大纲经济博弈论课程教学大纲随着经济全球化和市场竞争的加剧，经济博弈论作为一门重要的经济学分支学科，逐渐受到人们的重视。

经济博弈论研究的是个体或群体在决策过程中面临的各种策略选择和博弈行为，以及这些行为对个体或群体利益的影响。

本文将探讨经济博弈论课程教学的大纲设计。

一、引言经济博弈论的基本概念和研究对象。

介绍经济博弈论的起源、发展和应用领域，以及为什么学习经济博弈论对于理解和解决现实经济问题的重要性。

二、博弈基本概念2.1 策略与策略组合解释策略和策略组合的概念，以及它们在博弈过程中的作用。

介绍纳什均衡和博弈树等基本工具，以及它们在博弈分析中的应用。

2.2 支配策略与支配策略组合讲解支配策略和支配策略组合的概念，以及如何通过排除支配策略来简化博弈分析。

举例说明支配策略的应用和意义。

2.3 均衡概念介绍纳什均衡、帕累托最优和互利最优等均衡概念。

解释各种均衡概念的定义和特点，以及它们在不同博弈模型中的应用。

三、静态博弈3.1 纳什均衡详细讲解纳什均衡的概念和计算方法。

通过案例分析，演示如何找到博弈中的纳什均衡，并讨论纳什均衡的稳定性和存在性。

3.2 博弈分类与解介绍博弈的分类方法，如合作博弈和非合作博弈。

解释不完全信息博弈和完全信息博弈的区别，并探讨如何解决不完全信息博弈中的不确定性问题。

四、动态博弈4.1 重复博弈讲解重复博弈的概念和特点。

介绍如何通过反复博弈来解决非合作博弈中的合作问题，以及如何应对策略的变化和学习。

4.2 演化博弈介绍演化博弈的基本原理和方法。

讨论演化博弈在生物学和社会科学中的应用，并探讨演化稳定策略的形成和演化路径。

五、应用案例分析通过实际案例，分析和讨论经济博弈论在市场竞争、企业决策、政府政策制定等领域的应用。

重点关注博弈分析在解决现实经济问题中的局限性和挑战。

六、总结与展望总结经济博弈论课程的主要内容和学习收获。

展望经济博弈论在未来的发展方向和应用前景，并鼓励学生在实际问题中运用所学知识进行创新和研究。

经济博弈论第四章重复博弈

4.2.4 民间定理
策略分析：与图4－4例子相比较，由于博弈的特殊结构，这个触发策略的设计对偏离行为和合作行为分别进行惩罚和奖励，因此策略具有很强的可信性。而在图4-4例子中，针对对方的偏离行为采取了（L,L）策略进行惩罚，但是惩罚对方的同时，自身的利益也受到了损害，因此可信性不强。
第三节无限次重复博弈
4.2.2 有限次重复的囚徒困境博弈
坦白不坦白
坦白
不坦白
－5，－5
0，－8
－8， 0 －1，－1
图4－1 囚徒困境
求解思路：对于有限次重复囚徒困境博弈，根据动态博弈的逆推归纳法可以求解。
4.2.2 有限次重复的囚徒困境博弈
以两阶段（以该博弈作为原博弈G重复两次）为
例：分析最后一阶段，子博弈即为原博弈，唯一的
包含以后所有阶段的原重复博弈的一部分。 2 策略：博弈方在每个阶段针对每种情况如何行
动的计划（注：在每一阶段之前，博弈方是可以观察到以前博弈的结果的）。
4.1.2 有限次重复博弈的概念
3 路径：是每个阶段博弈结果（原博弈的一个策略组合）连接而成。对于具有n个策略组合的原博弈，重复T次的路径数为nT，重复博弈的求解即找出具有稳定性的均衡路径。
4.2.4 民间定理
触发策略：博弈方1在第一阶段采取M策略，如果对方合作，则第二阶段采取R策略作为奖励；否则第二阶段采取L策略进行惩罚（注意 (L,L)也是纳什均衡，因此具有稳定性）。博弈方2也采取同样策略。
策略分析：如果任何一方在第一阶段偏离，仅仅多获得5－4＝1单位得益，而在第二阶段的得益（L,L）仅仅为1；如果在第一阶段合作，第二阶段的得益为3。因此双方不存在偏离该策略的动机。
第三节无限次重复博弈

管理经济学讲义(新)管理经济学第七章博弈论与竞争策略

四．博弈的分类
• （1）合作博弈与非合作博弈根据参与者之间能否通过谈判达成
具有约束力的协议或合同来划分。
• 可以达成协议的为合作博弈cooperative game，合作博弈强调集体理性和整体最优。如买卖双方讨价还价后成交。
• 不能达成协议的为非合作博弈non-cooperative game，非合作博弈强调个体理性和局部最优。如寡头之间的竞争博弈，双方的利益和目标有冲突，难以达成可以实施的协议，双方都有欺骗和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领域。
• 在有些情况下，为了避免陷入被动，采取最大最小策略十分必要。在下图的博弈中，乙方采取“右”是一个支配性策略。
因为不管甲方选什么，乙方采取右的策略都比左的策略好，
可以得到1的收益。在期望乙方采取右的情况下，甲方应该采
取“下”，并得到2的收益。这样，支配性策略均衡为（下，
右）。
• 如果甲方比较慎重，考虑到乙方可能不一定理性，或者可能故意捉弄甲方，则应该采取最大最小策略，形成（上，右）的博弈结果。
甜 20，10 -8，-8
2．对社会有害的合作，设法制止
• 在囚徒的困境博弈中，如果两个囚徒可以互相协商，并形成攻守同盟，则罪犯得到好处，对社会不利。例如在寡头厂商的定价博弈中，勾结定高价对双方都有好处，但对社会不利，因此受到反垄断法的严密监控。
• 寡头厂商的价格博弈收益矩阵如下：
厂商2
高价
二．支配性策略dominant strategy均衡
• 支配性策略均衡也称上策均衡或优势策略均衡。在博弈中，对有些参与者来说，不管对手采取什么策略，他的策略都保持不变。这种不取决于对手选择的最优策略称为支配性策略（上策或优势策略）。

经济学博弈论

经济学博弈论
经济学中的博弈论是一个重要的分支领域，它研究的是在多个参与者之间互动决策的情境下，他们可能采取的不同策略以及相应的结果。

博弈论在经济学中有广泛的应用。

下面是一些博弈论的基本概念和常见的博弈类型：
1. 策略（Strategies）：参与者在博弈中可选择的行动或决策。

2. 支配策略（Dominant Strategies）：一种策略在所有情况下都会产生更好的结果，无论其他参与者选择什么策略。

3. 纳什均衡（Nash Equilibrium）：在博弈中，当每个参与者都选择了对自己最有利的策略，并且没有动机单独改变策略时，达到的状态就是纳什均衡。

4. 合作与背叛（Cooperation and Betrayal）：博弈中参与者可以选择合作或背叛其他参与者，涉及到合作博弈和非合作博弈的概念。

5. 零和博弈（Zero-sum Game）：参与者的利益总和为零，一个人的收益增加意味着其他人的收益减少。

6. 非零和博弈（Non-zero-sum Game）：参与者的利益总和不一定为零，可以存在合作使得所有参与者都获益的可能性。

7. 重复博弈（Repeated Games）：博弈过程会重复进行多次，参与者的策略可能受到之前行动的影响。

这些只是博弈论的基本概念，实际应用中还有更多复杂的情况和模型。

博弈论在经济学中可以用来分析市场竞争、企业战略、拍卖、资源分配等众多领域。

它对于理解和预测人类行为决策的影响具有重要意义。

博弈论名词简答论述

博弈论名词简答论述名词解释：01、参与⼈：指的是博弈中选择⾏动以最⼤化⾃⼰效⽤(收益)的决策主体，参与⼈有时也称局中⼈，可以是个⼈，也可以是企业、国家等团体。

02、策略：是参与⼈选择⾏动的规则，如“以⽛还⽛”是⼀种策略。

03、结果：是指博弈分析者感兴趣的要素的集合，常⽤⽀付矩阵或收益矩阵来表⽰。

04、均衡：是所有参与⼈的最优策略或⾏动的组合。

05、博弈：⼀些个⼈、队组或其他组织，⾯对⼀定的环境条件,在⼀定的规则下，同时或者先后，⼀次或者多次,从各⾃允许选择的⾏为或战略进⾏选择并加以实施，各⾃取得相应结果或收益的过程。

06、静态博弈：指参与⼈同时选择⾏动或虽⾮同时但后⾏动者并不知道先⾏动者采取什么样的⾏动。

07、动态博弈：指参与⼈的⾏动有先后顺序，且后⾏动者能够观察到先⾏动者所选择的⾏动。

08、零和博弈：是指在博弈中，⼀⽅的得益就是另⼀⽅的损失，所有博弈⽅的得益总和为零。

09、上策均衡：如果⼀个博弈的某个策略组合中的所有策略都是各个博弈⽅各⾃的上策，那么这个策略组合肯定是所有博弈⽅都愿意选择的，必然是该博弈⽐较稳定的结果，我们称这样的策略组合为该博弈的⼀个上策均衡。

10、重复博弈：指同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”。

11、纳什均衡：纳什均衡是指这样⼀种策略组合，这种策略组合由所有参与⼈的最优策略组成，即给定别⼈策略的情况下，没有任何单个参与⼈有积极性选择其他策略，从⽽没有任何参与⼈有积极性打破这种均衡。

12、⼦博弈：由⼀个动态博弈第⼀阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集合和进⾏博弈所需要的全部信息，能够⾃成⼀个博弈的原博弈的部分，称为原动态博弈的⼀个⼦博弈。

13、有限理性博弈：存在有限理性博弈⽅的博弈可称为有限理性博弈。

14、完美信息的动态博弈：动态博弈中在轮到⾏为时对博弈的进程完全了解的博弈⽅，称为具有完美信息的博弈⽅，如果动态博弈的所有博弈⽅都有完没信息，则称为完美信息的动态博弈。

博弈论四种博弈类型

华为在阿根廷电信设备市场上的竞争博弈华为技术有限公司是一家总部位于中国广东省深圳市的生产销售电信设备的员工持股的民营科技公司，经过数十年的发展，成为全球最大的电信网络解决方案提供商，全球第二大电信基站设备供应商，同时也是全球第六大手机厂商，其海外市场的利润占到其总利润的75%。

在华为进入阿根廷电信设备市场之前，阿根廷的电信设备市场由爱立信、阿尔卡特-朗讯以及阿根廷本土设备供应商三家共同分享市场份额，接下来，我们将分析其不同条件下的博弈结果：1、完全信息情况下的静态博弈A 、纳什均衡：我们将上述三家公司统称为原有垄断者，华为称为虎视眈眈的潜在进入者，原有垄断者想要保住自己现有的垄断地位，就会想要阻止潜在进入者进入，在这个博弈中，原有垄断者有两种选择：一是进行斗争，打价格战；二是不斗争，默许其进入从而共同竞争，具体的支付矩阵结果表示如下：原有垄断者潜在进入者进入不进入根据纳什均衡的定义：各个参与者所做的是在给定其他参与者的策略是所能够做出的最好的一组策略。

当潜在进入者选择进入时，原有垄断者的最优选择是不斗争，获得70单位的利润；同样的，原有垄断者选择不斗争的情况下，潜在进入者的最优选择是进入，获得20单位的利润，从而获得一个要求纳什均衡的均衡（进入，不斗争），同理可以得出另一个纳什均衡（不进入，斗争）。

B 、占优策略：现假设华为公司已经获得了阿根廷电信集团的经营许可证，在严格管制情况下二者都不能以低于成本的价格进行价格战，同时禁止出现单一寡头垄断的情形，（各自均有正的利润）在这两种情况下考虑两者是否进行价格战的情况，具体支付矩阵如下所示：原有垄断者低价高价潜在进入者低价高价对于潜在进入者而言，不论原有垄断者是否进行价格战，潜在进入者的占优策略都是进行价格战，因为在原有垄断者定低价时，潜在进入者定低价可以获得额外的20单位利润，在原有垄断者定高价时，潜在进入者定低价可以获得额外的10单位利润，从而确定华为必将进行价格战，在完全信息情况下，原有垄断者会将自己置于潜在进入者的位置进行决策，从而决定自己也要进行价格战，否则会失去更多的利润。

经济博弈论之重复博弈共37页文档

经济博弈论之重复博弈
56、死去何所道，托体同山阿。 57、春秋多佳日，登高赋新诗。 58、种豆南山下，草盛豆苗稀。晨兴理荒秽，带月荷锄归。道狭草木长，夕露沾我衣。衣沾不足惜，但使愿无违。 59、相见无杂言，但道桑麻长。 60、迢迢新秋夕，亭亭月将圆。
61、奢侈是舒适的，否则就不是奢侈。——CocoCha nel 62、少而好学，如日出之阳；壮而好学，如日中之光；志而好学，如炳烛之光。 ——刘向 63、三军可夺帅也，匹夫不可夺志也。 ——孔丘 64、人生就是学校。在那里，与其说好的教师是幸福 ห้องสมุดไป่ตู้不如说好的教师是不幸。 ——海贝尔 65、接受挑战，就可以享受胜利的喜悦。——杰纳勒尔·乔治·S·巴顿
谢谢！

重复博弈的例子

重复博弈的例子重复博弈的例子【篇一：重复博弈的例子】1有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?2两次重复下面的得益矩阵表示的静态博弈。

如果你是博弈方1，你会采用怎样的策略。

3两次重复下面这个得益矩阵表示的两人静态博弈。

问能否有一个子博弈完美纳什均衡策略组合，实现第一阶段的得益是(4，4)?如能，给出双方的策略，如不能，证明为什么不能。

如果策略组合(下，左)的得益改为(1，5)会发生什么变化，至少能在部分阶段实现得益(4，4)的条件是什么?4求出下列得益矩阵表示的静态博弈的纳什均衡，并说明有限次和无限次重复该博弈时两博弈方的均衡策略。

【篇二：重复博弈的例子】[] 什么是重复博弈顾名思义，重复博弈是指同样结构的博弈重复许多次，其中的每次博弈称为“阶段博弈”（stage games）。

重复博弈是中的重要内容，它可以是的重复博弈，也可以是。

在重复博弈中，每次博弈的条件、规则和内容都是相同的, 但由于有一个长期利益的存在, 因此各博弈方在当前阶段的博弈中要考虑到不能引起其它博弈方在后面阶段的对抗、报复或, 即不能象在一次性中那样毫不顾及其它博弈方的利益。

有时, 一方做出一种合作的姿态, 可能使其它博弈方在今后阶段采取合作的态度, 从而实现共同的长期利益。

下面给出两个重要定义：定义1：可信性是指动态博弈中先行动的博弈方是否该相信后行动的博弈方会采取对自己有利或不利的行为。

定义2：如果动态博弈中各博弈方的策略在动态博弈本身和所有中都构成均衡, 则称该策略组合具有子博弈完美性。

在重复博弈中, 可信性同样是非常重要的, 也即子博弈完美性仍是判断均衡是否稳定可靠的重要依据, 又由于长期利益对短期行为的制约作用, 因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的, 从而使博弈的均衡结果出现更多的可能性。

[] 重复博弈的特征1、阶段博弈之间没有物质上的联系，也就是说，前一阶段的博弈不改变后一阶段的结构。

二元博弈论

二元博弈论引言二元博弈论是博弈论的一个重要分支，它研究的是只有两个参与者的博弈模型。

在这种模型中，每个参与者只有两种可能的行动选择。

通过分析参与者的策略和支付矩阵，可以得出博弈的稳定状态和最优策略。

本文将从博弈的基本概念、纳什均衡、重复博弈和应用领域等方面介绍二元博弈论。

基本概念博弈论是研究决策者在相互影响的环境中做出决策的数学工具。

在二元博弈论中，有两个参与者，分别称为玩家1和玩家2。

每个玩家都有两种可能的行动选择，分别称为策略1和策略2。

博弈的结果由支付矩阵表示，其中每个元素代表了玩家1和玩家2在不同策略组合下的收益或损失。

纳什均衡纳什均衡是二元博弈论中的一个重要概念，指的是在博弈中玩家选择的策略组合，使得玩家无法通过单方面改变策略来获得更大的收益。

也就是说，如果玩家1选择策略1，玩家2选择策略2，而且两个玩家都没有动机改变自己的策略，那么这个策略组合就是纳什均衡。

纳什均衡可以用数学方法求解，从而找到博弈的最优策略。

重复博弈重复博弈是指博弈过程进行多次的情况。

在重复博弈中，玩家的选择不仅会受到当前一轮的策略选择的影响，还会受到之前各轮策略选择的影响。

这种情况下，玩家可以通过制定长期最优策略来获得更大的收益。

重复博弈的分析方法和单次博弈有所不同，需要考虑到时间序列上的效用和策略的动态调整。

应用领域二元博弈论在许多领域都有广泛的应用。

在经济学中，二元博弈论可以用来研究企业之间的竞争和合作关系。

在政治学中，二元博弈论可以用来分析国家之间的战略互动和外交政策的制定。

在生物学中，二元博弈论可以用来研究动物之间的捕食与逃避策略。

此外，二元博弈论还可以应用于社会科学、计算机科学等领域。

结论二元博弈论是研究只有两个参与者的博弈模型的数学工具。

通过分析玩家的策略和支付矩阵，可以找到博弈的纳什均衡和最优策略。

重复博弈的分析方法和单次博弈有所不同，需要考虑到时间序列上的效用和策略的动态调整。

二元博弈论在经济学、政治学、生物学等领域都有广泛的应用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

因为后续两阶段的结局（A,B）和（B,A）为纳什均衡，而第一阶段的合作结局（A,A)是由于触发策略针对对方偏离合作的行为设计了后续两阶段都不合作的惩罚措施，其单方面偏离的路径（B,A）（B,B）（B,B）收益并不增加，因此不存在偏离的动机。
18
17.06.2020
4.2.4 民间定理
问题的提出：由于具有多个纳什均衡的重复博弈可以设计多种策略，在双方缺乏沟通的情况下，结局具有不确定性。因此，这里讨论具有多个纳什均衡的重复博弈可以实现的收益范围。
12
17.06.2020
4.2.2 有限次重复的囚徒困境博弈
定理设原博弈G有唯一的纯策略纳什均衡，则对任意正整数T，重复博弈G（T）有唯一的子博弈完美的解，即各博弈方每个阶段都采用G 的纳什均衡策略。各博弈方在G（T）中的总得益为在G中得益的T倍，平均每阶段得益等于原博弈G中的得益。
13
（2）如果对方在第一阶段中采取了合作行为，在后续阶段的策略设计中要保证博弈结局具有稳健性。因此，针对第一阶段的合作行为，后续阶段的策略设计是为了实现双方的行动协调，以保证实现纳什均衡（B,A）或（A,B）。
17
17.06.2020
4.2.3 有两个纳什均衡的重复博弈
结果分析：
子博弈路径（A,A)，（A,B），（B,A）为子博弈纳什均衡。
实际上，所有以零和博弈为原博弈所构成的重复博弈与猜硬币博弈构成的重复博弈一样，各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。
8
17.06.2020
4.2.2 有限次重复的囚徒困境博弈
坦白不坦白
坦白
不坦白
－5，－5
0，－8
－8， 0 －1，－1
图4－1 囚徒困境
求解思路：对于有限次重复囚徒困境博弈，根据动态博弈的逆推归纳法可以求解。
最大化”导致的囚徒困境，实现长期合作的结局。
1
17.06.2020
第一节几个概念
重复博弈的概念有限次重复博弈的概念
2
17.06.2020
4.1.1 重复博弈的概念
1 由简单的静态博弈（或动态博弈）的有限次（或无限次）重复进行构成的。 2 每一阶段博弈方、策略集合、规则和得益都相同。 3 包括：有限次重复博弈和无限次重复博弈 4 例子：多场决胜负的体育比赛（有限次）两寡头市场上两个厂商之间的竞争（无限次）商场与顾客交易
策略有多个纳什均衡重复博弈的得益范围——民间定
理
7
17.06.2020
4.2.1 有限次重复的猜硬币博弈
在零和博弈中，双方不存在合作的可能性，因此在长期进行的重复博弈中，子博弈完美纳什均衡由各个阶段原博弈的纳什均衡构成（例，在猜硬币博弈中以0.5的概率选择正面或者反面，即采取混合策略）。
一个触发策略来实现这个得益。
24
17.06.2020
4.2.4 民间定理
触发策略：博弈方1在第一阶段采取M策略，如果对方合作，则第二阶段采取R策略作为奖励；否则第二阶段采取L策略进行惩罚（注意 (L,L)也是纳什均衡，因此具有稳定性）。博弈方2也采取同样策略。
策略分析：如果任何一方在第一阶段偏离，仅仅多获得5－4＝1单位得益，而在第二阶段的得益（L,L）仅仅为1；如果在第一阶段合作，第二阶段的得益为3。因此双方不存在偏离该策略的动机。
此时，博弈的纳什均衡仍是（坦白，坦白）。
10
17.06.2020
4.2.2 有限次重复的囚徒困境博弈
结论：在有限次重复博弈G(T)中，如果原博弈G存在唯一的纯策略纳什均衡组合，则重复博弈的唯一的子博弈完美纳什均衡解为各博弈方在每阶段都采取的原博弈纳什均衡策略。
含义：在原博弈具有唯一均衡的有限次重复博弈中，由于完全理性的博弈方具有“共同知识” 的分析推理能力，因此在从最后阶段开始的逆推过程中，仍然无法摆脱囚徒困境。
29
17.06.2020
第三节无限次重复博弈
图4－5双方各五种可选策略重复博弈
26
17.06.2020
4.2.4 民间定理
该博弈具有4个纯策略纳什均衡，在二次重复博弈中，触发策略设计：第一阶段双方采取 (M,M)策略，如果博弈方1偏离此策略，那么第二阶段采取(Q,Q)策略对博弈方1进行惩罚，对博弈方2进行奖励；同理，如果博弈方2偏离了此策略，那么采取(P,P)策略对博弈方2进行惩罚，对博弈方1进行奖励。如果双方都没有偏离，那么第二阶段采取具有较高收益的纳什均衡(R,R)策略。如果双方都偏离了此策略，第二阶段同样采取纳什均衡的(R,R)策略。
11
17.06.2020
4.2.2 有限次重复的囚徒困境博弈
如果原博弈存在唯一的纯策略纳什均衡组合，则有限次重复博弈的唯一的均衡解即各博弈方在每阶段（即每次重复）中都采用原博弈的纳什均衡策略。由于在这样的双方策略下，均衡路径中的每个阶段都不存在不可信的威胁或许诺，因此这种均衡是子博弈完美纳什均衡。
25
17.06.2020
4.2.4 民间定理
例（双方各五种可选策略重复博弈）：
L
MRP
Q
L 1,1 5,0 0,0 0,0 0,0
M 0,5 4,4 0,0 0,0 0,0
R 0,0 0,0 3,3 0,0 0,0
P 0,0 0,0 0,0 4,1/2 0,0
Q 0,0 0,0 0,0 0,0 1/2,4
定理：将一次性博弈中最差的均衡得益数组记为w,如果原博弈G的一次性博弈有均衡得益数组优于w，那么在有限次重复博弈G(T)中，所有个体理性得益和可实现得益都至少有一个子博弈完美纳什均衡来实现。
20
17.06.2020
4.2.4 民间定理
在图4-2一次性博弈中，博弈方均衡得益分别为纯策略的得益（1，4），（4，1）和混合策略的得益（2，2）,最差的均衡得益数组为w=(1,1)。
（2）博弈方2的策略是第一阶段合作A，如果发现对方采取B不合作，则后续两个阶段一直采取不合作的 B策略；如果发现对方采取合作A，则第二阶段采取不合作B，第三阶段采取合作A。
16
17.06.2020
4.2.3 有两个纳什均衡的重复博弈
策略设计分析：
（1）在博弈方1和2中，在第一阶段都采取了合作行为A，并针对对方的不合作行为B，都设计了在后续2个阶段采取不合作B的相应惩罚措施；
9
17.06.2020
4.2.2 有限次重复的囚徒困境博弈
以两阶段（以该博弈作为原博弈G重复两次）为
例：分析最后一阶段，子博弈即为原博弈，唯一的
均衡为（－5，－5）；分析第一阶段，将最后阶段
的收益（－5）添加到第一阶段的矩阵中，即：
坦白不坦白
坦白
－10，－10 －13，－5
不坦白
－5，－13 －6，－6
4 得益：不同于一般的动态博弈，重复博弈的得益为各个阶段得益的加总。考虑到时间的价值，需要引进“贴现系数”将未来的得益折算成当期得益的价值。
6
17.06.2020
第二节有限次重复博弈
有限次重复的猜硬币博弈——原博弈为零和博弈有限次重复的囚徒困境博弈——原博弈有唯一的
纯策略纳什均衡有多个纳什均衡
4.2.4 民间定理
策略分析：与图4－4例子相比较，由于博弈的特殊结构，这个触发策略的设计对偏离行为和合作行为分别进行惩罚和奖励，因此策略具有很强的可信性。而在图4-4例子中，针对对方的偏离行为采取了（L,L）策略进行惩罚，但是惩罚对方的同时，自身的利益也受到了损害，因此可信性不强。
第四章重复博弈
本章主要内容：
1 重复博弈的概念；
2 作为一种特殊的动态博弈，有限次和无限次重复
博弈的子博弈完美纳什均衡的求解方法；
3 无限次重复博弈古诺模型和效率工资模型。
本章主要结论（民间定理）：
由于参与者在重复博弈中具有了长期利益，
可以通过在后面阶段中采取的报复策略使得威胁
变得可信，从而摆脱静态博弈中“追求自身利益
23
17.06.2020
4.2.4 民间定理
例（两人各三种可选策略）：
L
M
R
L 1，1
M 0，5 R 0，0
5，0 4，4 0，0
0，0 0，0 3，3
图4－4多种策略博弈的重复博弈
该博弈具有两个纯策略纳什均衡和一个混合
策略纳什均衡，但是双方存在一个更好的得益（4，
4）。对于二次重复博弈，根据民间定理可以设计
17.06.2020
4.2.3 有两个纳什均衡的重复博弈
例两个厂商1和2，同时
A
B
面临两个市场机会A和B。假 A 3，3 1， 4
设每个厂商都只有能力选择 B 4，1 0，0
一市场发展，即他们的可选图4－2 两厂商差别市场博弈
择策略都是A或B，其得益矩
阵如图所示。
此博弈具有2个纯策略纳什均衡（1，4）、
个体理性得益：不管对方采取何种行动，只要自己的行为合理就可以保证实现的收益。
可实现得益：各纯策略组合得益的加权平均数组。注意：并非一定是均衡策略的组合得益，因此在图4－2中，（3，3）也是可实现得益。
19
17.06.2020
4.2.4 民间定理
用wi记博弈方i在一次性博弈中最差的均衡得益，用w记各博弈方的wi构成的得益数组。结合 “个体理性得益”和“可实现得益”，则有限但次数很多的重复博弈有如下民间定理：
（4，1）和混合策略纳什均衡概率（0.5，0.5）。
14
17.06.2020
4.2.3 有两个纳什均衡的重复博弈
考虑三次重复博弈各策略组合子博弈纳什均衡路径：
1.由原博弈的纳什均衡组合而成的路径，如采取轮换策略（在上述的协调博弈中，双方轮换采取纯纳什均衡策略，路径为(A,B)，(B,A)，(A,B)….. 不考虑时间的价值（贴现系数），每阶段的平均得益为（4＋1）/2 ＝2.5，高于混合策略的得益2。

经济博弈论重复博弈

合集下载

重复博弈的经典例子

博弈论(第四章)

4经济博弈论-重复博弈

聊聊四种经典的博弈论模型

博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理

经济博弈论之重复博弈

经济博弈论判断题

重复博弈的名词解释

经济博弈论课程教学大纲

经济博弈论第四章重复博弈

管理经济学讲义(新)管理经济学第七章博弈论与竞争策略

经济学博弈论

博弈论名词简答论述

博弈论四种博弈类型

经济博弈论之重复博弈共37页文档

重复博弈的例子

二元博弈论

文档推荐

最新文档

经济博弈论重复博弈

合集下载

重复博弈的经典例子

博弈论(第四章)

4经济博弈论-重复博弈

聊聊四种经典的博弈论模型

博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理

经济博弈论之重复博弈

经济博弈论判断题

重复博弈的名词解释

经济博弈论课程教学大纲

经济博弈论第四章 重复博弈

管理经济学讲义(新)管理经济学第七章博弈论与竞争策略

经济学 博弈论

博弈论名词简答论述

博弈论四种博弈类型

经济博弈论之重复博弈共37页文档

重复博弈的例子

二元博弈论

文档推荐

最新文档

经济博弈论第四章重复博弈

经济学博弈论