四章重复博弈

格式：doc
大小：476.50 KB
文档页数：18

第四章节重复博弈何为“重复博弈”？重复博弈是指基本博弈重复进行构成的博弈过程。

–重复博弈中每个阶段中的博弈方、可选策略、规则和得益都是相同的----是特殊的动态博弈；–形式上是基本博弈的重复进行，但博弈方的行为和博弈结果不一定是基本博弈的简单重复，因为博弈方对于博弈会重复进行的意识，会使他们对利益的判断发送变化，从而使他们在重复博弈过程不同阶段的行为选择受到影响。

–可信度：子博弈完美性仍是判断均衡是否稳定可靠的重要判断依据4.1 引论4.1.1 为什么研究重复博弈4.1.2 基本概念分类：有限次重复博弈，无限次重复博弈给定一个基本博弈G（可以静态，也可以动态），重复进行了T次G，并且在每次重复G之前，各博弈方都能观察到以前博弈的结果，这样的博弈过程称为“G的T次重复博弈”，记为()G T的“原G T。

而G称为()博弈”。

()G T的一个“阶段”。

G T中的每次重复称为()理论上，重复博弈可以无限制进行下去，不一定经过一定次数重复以后就必须结束。

如果一个基本博弈G一直重复下去，这样的重复博弈就是“无限次重复博弈”，记为()G 。

无限次重复博弈的基本博弈也称为“原博弈”。

无限次重复博弈是有无限个阶段的动态博弈。

重复博弈的次数虽然有限，但重复的次数或博弈结束的时间不确定，这种重复博弈中博弈方的行为选择与确定结束时间的有限次重复博弈很不同，与无限次重复博弈很相似，甚至可以通过某种方式与无限次重复博弈统一起来。

这种重复博弈可以称为“随机结束的重复博弈”。

策略、子博弈和均衡路径●策略：–博弈方的一个策略就是在每个阶段（即每次重复），针对每种情况（以前阶段的结果）如何行动的计划。

●子博弈：–重复博弈的子博弈就是从某个阶段（不包括第一阶段）开始，包括此后所有阶段的重复博弈部分。

●路径：-–子博弈完美纳什均衡，以逆推归纳法（逆向归纳法）为核心的子博弈完美纳什均衡分析及相关结论，可以推广到重复博弈中。

-–重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。

因为对应前一阶段的每种结果，下一阶段都有原博弈全部策略组合数那么多种可能的结果。

原博弈有m 种策略组合，那么重复两次就有2m 条博弈路径，重复T 次就有T m 条博弈路径。

重复博弈的得益（支付）任何博弈中博弈方策略选择的依据都是得益的大小。

计算重复博弈的“总得益”。

计算各阶段的“平均得益”。

时间有先后，引入贴现系数δ2111231...TT t T t t ππδπδπδπδπ--==++++=∑无限次重复博弈：2111231...T t T t t ππδπδπδπδπ∞--==++++=∑无限次重复博弈有时也写作(,)G δ∞在考虑贴现因素的情况下，重复博弈的平均得益与不考虑贴现因素时的平均得益，必然也有所不同。

通常可以用下列方式定义平均得益。

如果一常数π作为重复博弈（有限次重复或无限次重复）各个阶段的得益，能产生与得益序列1π，2π，…相同的现值，则称π为1π，2π，…的“平均得益”。

有限次重复博弈不一定考虑贴现问题。

无限次重复博弈必然要考虑贴现问题。

由于无限次重复博弈每阶段得益都是π时，现值为1πδ-，而每阶段得益为1π，2π，…时，无限次重复博弈的得益现值是11t t t δπ∞-=∑，因此令1πδ-＝11t t t δπ∞-=∑ 11(1) t t t πδδπ∞-==-∑这就是计算无限次重复博弈平均得益的公式。

随机停止和贴现率典型的随机结束重复博弈可以理解为在进行一个重复博弈时，每次都通过抽签来决定是否停止重复，如果抽到停止重复的概率为p ，则抽到重复下去的概率为1p -。

设某博弈方在此博弈中的阶段得益为t π，利率为γ，因为在每一次博弈以后能继续下一次重复的可能性是1p -，因此第二阶段的期望得益为2(1)/(1)p πγ-+，进一步，第三阶段的期望得益为223(1)/(1)p πγ-+，… 故该博弈方在重复博弈中期望得益的现值为：221231111111(1)/(1)(1)/(1)...(1)(1)1()1t tt t t t t t tt p p p p πππγπγπγπγδπ-∞-=∞-=∞-==+-++-++-=+-=+=∑∑∑其中最后一个等式是通过令(1)/(1)p γδ-+=得到的。

把这个δ与前面纯粹考虑时间价值的贴现率统一起来，我们就把已知概率的随机停止重复博弈与无限次重复博弈统一起来了。

随机停止重复博弈问题可以当作无限次重复博弈来进行分析。

4.2 有限次重复博弈4.2.1 两人零和博弈的有限次重复博弈重复零和博弈不会创造出新的利益。

合作的可能性根本不存在。

即使双方都知道还要重复进行许多次基本博弈，也不会改变它们在当前阶段博弈中的行动方式，不可能变得（哪怕是暂时的）合作和顾及对方的利益。

所有以零和博弈为原博弈的有限次重复博弈，博弈方的正确策略都是重复一次性博弈中的纳什均衡策略。

推广：非零和或多个博弈方，博弈方的利益严格对立，没有纯策略纳什均衡的其他严格竞争博弈中。

在以这些博弈作为原博弈构成的有限次重复博弈中，惟一的子博弈完美纳什均衡就是所有博弈方都始终采用原博弈的混合策略纳什均衡策略。

例：有限次重复猜硬币博弈各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。

4.2.2 惟一纯策略纳什均衡博弈的有限次重复博弈在有惟一纯策略纳什均衡的博弈中，博弈方之间的利益关系不再是始终对立的，而是有很大一致性甚至完全一致。

在以这样的博弈为原博弈的有限次重复博弈中，博弈方的行动和博弈结果会不会发生质的变化？如果原博弈惟一的纯策略纳什均衡本身就是帕累托意义上的最佳策略组合，那么因为符合所有博弈方的利益，因此，有限次重复显然不会改变博弈方的行动方式。

分析：原博弈惟一的纳什均衡没有达到帕累托效率，因此存在通过合作进一步提高效率的潜在可能性的囚徒困境式的博弈，在有限次重复博弈中能不能实现合作和提高效率呢？有限次重复博弈的囚徒困境两次坦白不坦白坦白不坦白囚徒2囚徒1图4.1 囚徒的困境博弈重复博弈等价于图4.2坦白不坦白坦白不坦白囚徒2囚徒1图4.2 逆推归纳法和等价博弈一般结论（1）在有限次重复博弈中，如果原博弈存在唯一的纯策略纳什均衡策略组合，则有限次重复博弈的唯一的均衡解即各博弈方在每阶段中都采用原博弈的纳什均衡；（2）由于在这样的双方策略下，均衡路径中的每个阶段都不存在任何不可信的威胁或许诺，因此这种均衡是子博弈完美纳什均衡。

（3）在一个博弈中的每个博弈方的所有得益上各自加上相同的数值不会改变博弈原来的均衡定理设原博弈G 有惟一的纯策略纳什均衡，则对任意正整数T ，重复博弈G(T)有惟一的子博弈完美纳什均衡，即各博弈方每个阶段都采用G 的纳什均衡策略。

各博弈方在G(T)中的总得益为在G 中得益的T 倍，平均得益等于原博弈G 中的得益。

定理设原博弈G 有惟一的纯策略纳什均衡，则对任意正整数T ，重复博弈()G T 有惟一的子博弈完美纳什均衡，即各博弈方每个阶段都采用G 的纳什均衡策略。

各博弈方在()G T 中的总得益为在G 中得益的T 倍，平均得益等于原博弈G 中的得益。

有限次重复削价竞争博弈高价低价高价低价寡头2寡头1图4.3 削价竞争博弈例：石油输出国组织的困境●（1）某些成员国的石油资源已趋枯竭；●（2）不少非石油输出国组织成员国加入石油市场； ●（3）石油输出国组织成员之间地位的不平衡；●（4）有些国家由于政治、经济、军事等方面的原因造成资金、财政紧张；重复囚徒困境悖论和连锁店悖论（1）与直觉的差异（2）连锁店悖论（Selten，1978）泽尔腾一个在n个市场都开设有连锁店的企业，对于各个市场的竞争者是否应该加以打击排斥？由于n个市场的竞争者一般不会同时进入竞争，如果忽略各个市场环境、竞争者不同等方面的微小差异，这个问题对上述连锁企业来说相当于一个n次重复的重复博弈。

较多阶段的动态博弈总结：●第一类是由零和博弈构成的，不存在纯策略NE；第二类是唯一的纯策略纳什么均衡的静态博弈构成的。

●共性：重复博弈本质上只不过是原博弈的简单重复，重复博弈每个阶段采取的策略就是原博弈中所采取的策略，在零和博弈的情况下是同样的混合策略NE，在后一种情况下则是纯策略NE;●重复博弈并不能给博弈方带来比一次博弈更好的结果，每阶段的平均得益与一次性博弈的得益相同。

例：如果T次重复齐威王田忌赛马，双方在该重复博弈中的策略是什么？博弈结果如何？●特点：此博弈是混合博弈NE的严格竞争零和博弈，对一方有利的策略组合总是对另一方不利，没有一个策略组合双方同时愿意接受。

4.2.3 多个纯策略纳什均衡博弈的有限次重复博弈三价博弈的重复博弈MLHH M L厂商2产商1图4.4 三价博弈MLHH M L厂商2产商1图4.5 两次重复三价博弈的等价博弈触发策略trigger strategy ：首先试探合作，一旦发觉对方不合作，则也用不合作相报复的策略。

冷酷策略grim strategy触发策略的进一步讨论不计前嫌担心报复MLHH M L厂商2产商1图4.6 重复三价博弈的等价博弈：不可信报复HMLPQHM L PQ博弈方2博弈方2图4.7 重复博弈时触发策略可信性较强的博弈两市场博弈的重复博弈轮换策略：双方轮流去两个不同市场的策略。

ABA B厂商2产商1图4.8 两市场博弈厂商2得益厂商1得益图4.9 两市场博弈及重复博弈各均衡的平均得益博弈论走向了“语言时代”？经济学与语言4.2.4 有限次重复博弈的无名氏定理（folk theorem）民间定理，民歌定理首先，记w为博弈方i在一次性博弈中最差的均衡得益（支付），用wi表示各博弈方的w构成的得益数组。

i其次，不管其他博弈方的行为如何，一博弈方在某个博弈中只要自己采取某种特定的策略，最低限度保证能获得的得益称为“个体理性得益”（individual rationality payoff）或“保留得益”（reservation payoff）。

第三，博弈中所有纯策略组合得益的加权平均（权数非负且总和为1）数组称为“可实现得益”（feasible payoff）。

有限重复博弈的无名氏定理设原博弈的一次性博弈有均衡得益数组优于w，那么在该博弈的多次重复中，所有不小于个人理性得益的可实现得益，都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。

厂商2得益厂商1得益图4.10 两市场博弈有限次重复的民间定理无名氏定理的关键意义：保证这些得益有一定次数重复博弈的子博弈完美纳什均衡的平均得益可以实现或逼近它们。

有助于在重复博弈中更好地把握机会，设计和运用高效率的策略，建立相互的默契和信任，从而争取实现更好的博弈结果。

重复博弈往往也很难确定博弈结果究竟是哪一个子博弈完美纳什均衡。

《经济博弈论》期末考试复习资料

《经济博弈论》期末考试复习资料第一章导论1.博弈的概念：博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，并从中各自取得相应结果的过程。

它包括四个要素：参与者，策略，次序和得益。

2.一个博弈的构成要素：博弈模型有下列要素：(1)博弈方。

即博弈中决策并承但结果的参与者．包括个人或组织等：(2)策略。

即博弈方决策、选择的内容，包括行为取舍、经济活动水平或多种行为的特定组合等。

各博弈方的策略选择范围称策略空间。

每个博弈方各选一个策略构成一个策略组合。

(3)进行博弈的次序：次序不同一般就是不同的博弈，即使博弈的其他方面都相同。

(4)得益。

各策略组合对应的各博弈方获得的数值结果，可以是经济利益，也可以是非经济利益折算的效用等。

3.合作博弈和非合作博弈的区别：合作博弈：允许存在有约束力协议的博弈；非合作博弈：不允许存在有约束力协议的博弈。

主要区别:人们的行为互相作用时，当事人能否达成一个具有约束力的协议。

假设博弈方是两个寡头企业，如果他们之间达成一个协议，联合最大化垄断利润，并且各自按这个协议生产，就是合作博弈。

如果达不成协议，或不遵守协议，每个企业都只选择自己的最优产品（价格），则是非合作博弈。

合作博弈：团体理性（效率高，公正，公平）非合作博弈：个人理性，个人最优决策（可能有效率，可能无效率）4.完全理性和有限理性:完全理性：有完美的分析判断能力和不会犯选择行为的错误。

有限理性：博弈方的判断选择能力有缺陷。

区分两者的重要性在于如果决策者是有限理性的，那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距，以完全理性为基础的博弈分析可能会失效。

所以不能简单地假设各博弈方都完全理性。

5.个体理性和集体理性：个体理性：以个体利益最大为目标；集体理性：追求集体利益最大化。

第一章课后题：2、4、52.设定一个博弈模型必须确定哪几个方面?设定一个博弈必须确定的方面包括:(1)博弈方，即博弈中进行决策并承担结果的参与者;(2)策略(空间)，即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等;(3)得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量;(4)博弈次序，即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构，即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度，即博弈方是依据个体理性还是集体理性行为，以及理性的程度等。

博弈论(第四章)

谢富纪 2009年3月 11
2.有限次重复博弈
有唯一纯策略纳什均衡博弈的有限次重复博弈
有限次重复博弈的囚徒困境博弈，可以理解成警察给两人两次交代的机会。
囚徒2 坦白不坦白
囚徒 1
坦白
不坦白
-5， -5
-8， 0
0， -8
-1， -1
谢富纪 2009年3月
12
2.有限次重复博弈
因为重复博弈全过程是一种动态博弈过程，从第二阶段开始。此前的博弈已是既成的事实，而在此后又没有任何的后继阶段，因此实现本阶段最大利益是两博弈方在该阶段的唯一原则。结果是（坦白，坦白），
谢富纪 2009年3月
29
2.有限次重复博弈
本博弈中之所以不能或不能部分实现最佳结果
（A，A），是因为在两次重复博弈中博弈方没
有运用触发策略的条件或者说机会。后面的选择并不取决于第一次博弈的结果。
谢富纪 2009年3月
30
2.有限次重复博弈
厂商2 得益
（1，4）（1.5，3）（3，3）
谢富纪 2009年3月
17
2.有限次重复博弈
削价竞争博弈
高价寡高价头 1 低价
寡头2
低价
100，100 20，150 150，20 70，70
由于两个寡头在同一市场的竞争可以看作维持很长时间，因此可以看作是重复博弈。然而结果是令人遗憾的。
谢富纪 2009年3月 18
2.有限次重复博弈
两个悖论
谢富纪 2009年3月
27
2.有限次重复博弈
两市场博弈的重复博弈
厂商 2 A 厂A 商 1 B B
3，3
1，4
4，1
0，0

博弈论课后习题

Document serial number [UU89WT-UU98YT-UU8CB-UUUT-UUT108]第一章导论1、什么是博弈博弈论的主要研究内容是什么2、设定一个博弈模型必须确定哪儿个方面3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

4、"囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。

5、博弈有哪些分类方法，有哪些主要的类型6、你正在考虑是否投资100万元开设一家饭店。

假设情况是这样的：你决定开，则的概率你讲收益300万元（包括投资），而的概率你将全部亏损；如果你不开，则你能保住本钱但也不会有利润，请你（a）用得益矩阵和扩展形式表示该博弈；（b）如果你是风险中性的，你会怎样选择（c）如果你是风险规避的，且期望得益的折扣系数为，你的策略选择是什么（d）如果你是风险偏好的，期望得益折算系数为，你的选择又是什么7、一逃犯从关押他的监狱中逃走，一看守奉命追捕。

如果逃犯逃跑有两条可选择的路线，看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可以少坐10年牢，但一旦被抓住则要加刑10年；看守抓住逃犯能得到1000元奖金。

请分别用得益矩阵和扩展形式表示该博弈，并作简单分析。

第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么2、为什么说纳什均衡是博弈分析中最重要的概念3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。

4、多重纳什均衡是否会影响纳什均衡的一致预测性质，对博弈分析有什么不利影响5、下面的得益矩阵表示两博弈方之间的一个静态博弈。

该博弈有没有纯策略纳什均衡t専弈的结果是什么6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

7、博弈方1和2就如何分10 000元进行讨价还价。

假设确定了以下规则:双方同时提出自己要求的数额S1和S2, 0< sl,s2< 10 000,如果sl+s2W10 000,则两博弈方的要求都得到满足，即分别得到si和s2, 但如果是sl+s2>10 000,则该笔钱就被没收。

博弈论课件4-重复博弈

4.1.1 为什么研究重复博弈 4.1.2 基本概念

生活中的重复博弈
——你到菜场去买菜，当你担心上当受骗而犹豫不决时，
卖菜的摊主便会对你说:“你放心好了，我天天在这里卖菜，不会骗你的，如果菜不好你回来找我！‛他强调自己‚天天‛ 在这里卖菜，你通常便会放下心来，与之成交。因为他的这句话翻译成经济学的语言就是‚我跟你是‘重复博弈’‛! ———而一次性的买卖往往发生在双方以后不再有买卖机会的时候，特点是尽量谋取暴利并且带欺骗性，比如车站、码头、旅游景点的东西往往质次价高，其原因就在于买卖双方很少有‚重复博弈‛的机会。

两人零和博弈的有限次重复博弈惟一纯策略纳什均衡的有限次重复博弈多个纯策略纳什均衡的有限次重复博弈有限次重复博弈的无名氏定理
4.2.1 两人零和博弈的有限次重复博弈

猜硬币博弈
正面盖硬币方正面反面 -1， 1 1， -1
猜硬币方反面 1， -1 -1， 1

零和博弈是严格竞争的，重复博弈并不改变这一点。重复零和博弈不会创造出新的利益。
4.2.1 两人零和博弈的有限次重复博弈

以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样，博弈方的正确策略是重复一次性博弈中的纳什均衡策略。可用逆推归纳法来证明可以推广到非零和或多个博弈方，但博弈方的利益严格对立，没有纯策略纳什均衡的其他严格竞争博弈中产生原因：利益关系严格对立，矛盾不可调和

有限次重复博弈民间定理
设原博弈的一次性博弈有均衡得益数组优于w，那么在该博弈的多次重复中，所有不小于个体理性得益的可实现得益，都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。

下载提示

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

四章重复博弈

合集下载

《经济博弈论》期末考试复习资料

博弈论(第四章)

博弈论课后习题

博弈论课件4-重复博弈

文档推荐

最新文档