第六章:重复博弈与合作行为
- 格式:ppt
- 大小:544.00 KB
- 文档页数:48
第6章重复博弈与合作行为张维迎教授北京大学光华管理学院序惯博弈与重复博弈•序惯博弈(sequential game):参与人在前一个决策点的选择决定随后的子博弈的结构,因此,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次;•重复博弈(repeated game):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈”(stage game).重复博弈的三个特征•阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构;•所有参与人观察到博弈过去的历史;•参与人的总支付(报酬)是所有阶段博弈支付的贴现值之和;重复博弈和信誉问题•如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。
•重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。
但如果博弈无限重复,合作就可能出现。
囚徒困境博弈合作不合作合作不合作3,3-1,4 4,-10,0A B重复博弈与战略空间的扩展•假定上属博弈重复多次或无限次;那么,每个参与人有多个可以选择的战略:仅举几例:•All-D: 不论过去什么发生,总是选择不合作;•All-C: 不论过去什么发生,总是选择合作;•合作-不合作交替进行;•tit-for-tat: 从合作开始,之后每次选择对方前一阶段的行动;•trigger strategies: 从合作开始,一直到有一方不合作,然后永远选择不合作。
“囚徒困境”的一般表示合作不合作合作不合作T ,T S ,RR ,SP ,P满足:R>T>P>S; (S+R)<T+T支付函数•双方都不合作:•对的解释:–贴现率;–博弈继续的概率;–二者的结合;–一般化:未来收益的重要程度δδδδ−=++++=11...d)-all d,-all (32PP P P P V δ无名氏定理(Folk Theorem)•在无限次重复博弈中,如果参与人对未来足够重视(足够大),那么,任何程度的合作都可以通过一个特定的子博弈精炼纳什均衡得到。
博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理博弈论与信息经济学第6章完全且完美信息动态博弈——重复/超级博弈-连锁店悖论-无名氏定理经济学院丁言强内容提要重复博弈与战略空间有限次重复博弈:连锁店悖论无限次重复博弈冷酷战略与针锋相对战略无名氏定理阿伯罗定理: 两期战略序贯博弈与重复博弈序贯博弈的特征是,参与人在前一个阶段的行动选择决定随后的子博弈的结构,因此,从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈,或者说,同样结构的子博弈只出现一次。
动态博弈的另一种特殊但是非常重要的类型是所谓的“重复博弈”,就是同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。
在每个阶段博弈,参与人可能同时行动,也可能不同时行动,在后一种情况下,每个阶段博弈本身就是一个动态博弈。
重复博弈的3个基本特征重复博弈可能是不完美信息博弈,也可能是完美信息博弈,但在博弈论中一般指的是前一种情况。
(1)阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段博弈的结构;(2)所有参与人都观测到博弈过去的历史;(3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。
重复博弈的战略空间战略是一套完备的相机行动规则,它必须说明在每一种可能的状态下参与人的行动选择,即使参与人并不预期这种状态真的会出现。
因为可以观察到其他参与人过去行动的历史,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史。
所以,参与人在重复博弈中的战略是定义在博弈历史上的每个阶段博弈中的行动选择规则,即从博弈历史到行动空间的映射。
重复博弈的战略空间参与人在重复博弈中的战略空间远远大于且复杂于在每一个阶段博弈中的战略空间。
比如说,即使囚徒困境博弈只重复5次,每个囚徒的纯战略数量大于20亿个,战略组合的数量更多。
所以,重复博弈可能带来一些“额外的”均衡结果,这些均衡结果在一次博弈中是从来不会出现的。
重复博弈战略是博弈论中的一个重要概念,它指的是在一个博弈过程中,双方参与者不仅仅有一次的决策,而是需要多次反复进行决策。
在这种情况下,双方的策略选择不仅受到对方当前行为的影响,还受到对方未来可能的回应的影响。
在这种情况下,参与者的决策可能会考虑自己的长期利益,而不仅仅是眼前的利益。
而以德报德、以直报怨则是在重复博弈中的一种普遍策略。
以德报德这一策略强调的是合作、信任和责任。
在重复的博弈中,如果双方能够建立起互相信任的关系,相互协作,相互帮助,就能够达成双赢的局面。
在这种情况下,双方都有动力去遵守之前达成的协议,因为他们知道良好的合作关系对双方都是有利的。
这种策略在实际生活中也得到了广泛的应用,比如商业合作中的长期合作伙伴关系、国际关系中的互惠互利原则等等。
以直报怨这一策略则是强调对于对方行为的实时回应。
在重复博弈中,如果一方采取了不公平或者对自己不利的行为,另一方可以通过采取类似的回应来进行反制。
这种策略可以有效地制衡对方的不良行为,保护自己的利益。
另外,以直报怨也可以通过对方的正当行为进行回报来增进双方的合作和信任。
这种策略在博弈论中被广泛研究,并得到了丰富的实例证明。
在现实生活中,以德报德、以直报怨这两种策略都具有重要的指导意义。
比如在企业管理中,建立合作、信任和责任的企业文化能够提高员工之间的协作效率,激励员工为企业的长期利益而努力工作。
在国际关系中,秉持互惠互利原则,遵守国际法规和公平贸易原则,能够更好地维护世界和平与稳定。
以德报德、以直报怨是在重复博弈中能够取得最优结果的普遍策略。
在实际生活中,我们也可以借鉴这些策略,促进合作、信任和责任,维护自身利益的同时也考虑对他人的尊重和回报。
只有在这样的基础上,我们才能够真正实现和谐共赢,推动社会和国际关系朝着更加美好的方向发展。
在现实生活中,我们可以看到许多成功的案例,这些案例都充分体现了以德报德和以直报怨这两种重复博弈策略的重要性。
有些企业在面对市场竞争时,选择与供应商建立长期稳定的合作关系,这样不仅能够获得更好的供应和服务,还能够建立供应商信任,形成良好的合作生态。
重复博弈刘峰 1105060144 司法1101班重复博弈是一种特殊的博弈,在博弈中,相同结构的博弈重复多次,甚至无限次。
本文通过运用博弈论对企业合作行为的形成机理和实施条件进行了简要的剖析,最终认为重复博弈激励企业合作,同时企业合作是合作企业集体理性的结果。
“囚徒困境”在经济生活中具有很大的普遍性,在资源利用和环境保护,以及政治、军事和法律等各种领域的问题中,都存在类似的“囚徒困境”的现象。
“囚徒困境”中的参与人基于个体理性所作的选择,均衡解都是非合作的。
那么,经济理性的前提下,是否存在合作的博弈均衡呢?考虑博弈对局反复进行多次的情况,结局可能会有所不同。
因为博弈如果只进行一次,参与人就只关心一次博弈的支付;但如果博弈将重复多次,短期机会主义行为的所得可能是微不足道的,参与人可能会为长期利益暂时牺牲眼前利益从而选择不同的策略。
在“囚徒困境”例子中,如果两人是一对经常合谋犯罪的惯犯,他们有一个长期的攻守同盟,被抓捕受审时就会考虑,这次我被判了,他下次他一定会报复我,共同抵赖的合作均衡就可能出现。
美国密执安大学的艾克赛罗教授曾邀请博弈论专家就“囚徒困境”提交计算机程序,以竞赛的方式决出最优程序,结果是一种被称作“针锋相对”的最简单的程序胜出。
这一程序以合作的策略开始,以后每一次选择都模仿对方上一次的选择,即如果对方合作,自己也选择合作,如果对方不合作,自己也立即选择不合作进行报复,如果对方“改过自新”重新采取合作的态度,自己也不计前嫌,继续与对方合作。
值得注意的是,从理论上说,“针锋相对”策略的胜出有一个十分重要的条件,即博弈是无限次重复的,也就是说,对局双方都预期这一博弈将永远持续下去,如果对局是有限次的话,上述结论将不再有效。
本文认为战略联盟是企业间在重复博弈的理性选择。
自从战略联盟的概念被提出以来,就受到了管理学界和企业界的广泛关注。
战略联盟一般是由具有共同利益关系的单位之间组成的合作共同体,他们可能是供应商、生产商、分销商之间形成的合作联盟,甚至是竞争者之间形成的合作联盟,战略联盟是企业间相互博弈,形成集体理性,进行合作的结果。
第五章重复博弈与合作行为第五章重复博弈与合作行为目录5.1 重复博弈的特征5.2 有限博弈5.3 无穷博弈与合作重复博弈的特征重复博弈同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈”。
三个特征:阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构;所有参与人观察到博弈过去的历史;参与人的总得益是所有阶段博弈得益的贴现值之和。
重复博弈和信誉问题如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的策略可以选择,均衡结果可能与一次博弈大不相同。
重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中一次博弈的唯一均衡是不合作(即坦白)。
但如果博弈重复进行会怎样呢?-14不合作4-133合作不合作合作AB囚徒困境的一般形式(R>T>P>S;(S+R)<T+T) PPSRRSTT合作不合作合作AB有限次博弈连锁店悖论无穷博弈与合作假定上述博弈重复多次或者无穷次,那么每个参与人有多个可以选择的策略:ALL-D:不论过去发生什么,总是选择不合作;ALL-C:不论过去发生什么,总是选择合作;合作与不合作交替进行;TIT-FOR-TAT:从合作开始,之后每次选择对方前一阶段的行动;TRIGGER STRATEGIES:从合作开始,一直到有一方不合作,然后永远不合作。
V( ALL-D; ALL-D)=P+??P+??2P+ ??3P+……=P/(1- ??)对?? 的解释:贴现率(DISCOUNT RATE):用来比较未来收到的一元和今天收到的一元之间的价值的一个利率。
博弈继续进行的概率二者的结合一般化:未来收益的重要程度无名氏定理FOLK THEOREM在无限次重复博弈中,如果参与人对未来足够重视( ??2 足够大),那么,任何程度的合作都可以通过一个特定的子博弈完美纳什均衡得到。