第四章(重复博弈)
- 格式:ppt
- 大小:316.00 KB
- 文档页数:65
“善有善报”不是因果迷信在囚徒困境中,选择招供,也就是背叛是理性的,这一论断与我们的传统观念并不相符。
如果人人都这样想问题,那么诚信又从何而来呢?出现这一问题的原因是:现实中的情况和囚徒困境并不一样,困境中的两个囚徒互不相识,被判出狱后可能老死不相往来。
现实中并非如此,人们都在进行着重复的博弈,就是同样结构的博弈要重复多次,人们可能在次数不定的博弈中与其他人重复交手。
正因为如此,人们才要有诚信,诚信只是为让自己在以后的博弈中继续获得利益,这是一种长远的打算。
诚信的人一般都是聪明人,他们懂得细水长流的道理,对于“善有善报”这样的言语充满敬畏。
其实,“善有善报”的观念并不是一种迷信思想,从另一个角度看,它是有科学依据的。
如果有一个人总是出卖朋友,那么他可能会从第一次、第二次、第三次出卖中获得利益,但是长此以往,人们就会认清他的真面目,并互相传播他的劣迹。
这样,到了最后,他就会变得没有朋友可以出卖,因为他一直靠出卖朋友生存,当他没有朋友的时候,就是他穷途末路的时候,最终他只能落得众叛亲离的下场。
现在,我们明白了,诚信并不是什么了不起的美德,它也是实现利益最大化的一种手段,如果最终真的无利可图,人们便不会有诚信之举。
也许你会举出英雄人物的例子来反驳,但是英雄人物最终得到了人们的敬仰和爱戴,他们流芳百世、永垂不朽,如果他们合己为人的结果是被人指责、唾骂,遗臭万年,那么他们绝不会选择当英雄。
“一报还一报”的伟大胜利如果囚徒困境是简单的一次性博弈,使坏对于双方来说,当然都是最理性的选择。
但是,在重复性的博弈中,参与者应该怎样面对合作与背叛的问题?应该选择什么样的策略呢?著名学者爱克斯罗德所做的一个实验回答了这一问题。
实验的过程是这样的:所有参加这个实验的人都扮演“重复型”囚徒困境案例中一个区犯的角色,把自己的策略编成计算机程序,与其他程序进行一对一的博弈,在合作与背叛之间做出选择。
他们要将这个游戏以单循环赛的方式玩上200次。
四章重复博弈第四章节重复博弈何为“重复博弈”?重复博弈是指基本博弈重复进⾏构成的博弈过程。
–重复博弈中每个阶段中的博弈⽅、可选策略、规则和得益都是相同的----是特殊的动态博弈;–形式上是基本博弈的重复进⾏,但博弈⽅的⾏为和博弈结果不⼀定是基本博弈的简单重复,因为博弈⽅对于博弈会重复进⾏的意识,会使他们对利益的判断发送变化,从⽽使他们在重复博弈过程不同阶段的⾏为选择受到影响。
–可信度:⼦博弈完美性仍是判断均衡是否稳定可靠的重要判断依据4.1 引论4.1.1 为什么研究重复博弈4.1.2 基本概念分类:有限次重复博弈,⽆限次重复博弈给定⼀个基本博弈G(可以静态,也可以动态),重复进⾏了T次G,并且在每次重复G之前,各博弈⽅都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为()G T的“原G T。
⽽G称为()博弈”。
()G T的⼀个“阶段”。
G T中的每次重复称为()理论上,重复博弈可以⽆限制进⾏下去,不⼀定经过⼀定次数重复以后就必须结束。
如果⼀个基本博弈G⼀直重复下去,这样的重复博弈就是“⽆限次重复博弈”,记为()G 。
⽆限次重复博弈的基本博弈也称为“原博弈”。
⽆限次重复博弈是有⽆限个阶段的动态博弈。
重复博弈的次数虽然有限,但重复的次数或博弈结束的时间不确定,这种重复博弈中博弈⽅的⾏为选择与确定结束时间的有限次重复博弈很不同,与⽆限次重复博弈很相似,甚⾄可以通过某种⽅式与⽆限次重复博弈统⼀起来。
这种重复博弈可以称为“随机结束的重复博弈”。
策略、⼦博弈和均衡路径●策略:–博弈⽅的⼀个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段的结果)如何⾏动的计划。
●⼦博弈:–重复博弈的⼦博弈就是从某个阶段(不包括第⼀阶段)开始,包括此后所有阶段的重复博弈部分。
●路径:-–⼦博弈完美纳什均衡,以逆推归纳法(逆向归纳法)为核⼼的⼦博弈完美纳什均衡分析及相关结论,可以推⼴到重复博弈中。
-–重复博弈的路径是由每个阶段博弈⽅的⾏动组合串联⽽成的。