当前位置：文档之家› 重复博弈

重复博弈

刘峰 1105060144 司法1101班

重复博弈是一种特殊的博弈，在博弈中，相同结构的博弈重复多次，甚至无限次。本文通过运用博弈论对企业合作行为的形成机理和实施条件进行了简要的剖析，最终认为重复博弈激励企业合作，同时企业合作是合作企业集体理性的结果。

“囚徒困境”在经济生活中具有很大的普遍性，在资源利用和环境保护，以及政治、军事和法律等各种领域的问题中，都存在类似的“囚徒困境”的现象。“囚徒困境”中的参与人基于个体理性所作的选择，均衡解都是非合作的。那么，经济理性的前提下，是否存在合作的博弈均衡呢？

考虑博弈对局反复进行多次的情况，结局可能会有所不同。因为博弈如果只进行一次，参与人就只关心一次博弈的支付；但如果博弈将重复多次，短期机会主义行为的所得可能是微不足道的，参与人可能会为长期利益暂时牺牲眼前利益从而选择不同的策略。在“囚徒困境”例子中，如果两人是一对经常合谋犯罪的惯犯，他们有一个长期的攻守同盟，被抓捕受审时就会考虑，这次我被判了，他下次他一定会报复我，共同抵赖的合作均衡就可能出现。美国密执安大学的艾克赛罗教授曾邀请博弈论专家就“囚徒困境”提交计算机程序，以竞赛的方式决出最优程序，结果是一种被称作“针锋相对”的最简单的程序胜出。这一程序以合作的策略开始，以后每一次选择都模仿对方上一次的选择，即如果对方合作，自己也选择合作，如果对方不合作，自己也立即选择不合作进行报复，如果对方“改过自新”重新采取合作的态度，自己也不计前嫌，继续与对方合作。值得注意的是，从理论上说，“针锋相对”策略的胜出有一个十分重要的条件，即博弈是无限次重复的，也就是说，对局双方都预期这一博弈将永远持续下去，如果对局是有限次的话，上述结论将不再有效。

本文认为战略联盟是企业间在重复博弈的理性选择。自从战略联盟的概念被提出以来，就受到了管理学界和企业界的广泛关注。战略联盟一般是由具有共同利益关系的单位之间组成的合作共同体，他们可能是供应商、生产商、分销商之间形成的合作联盟，甚至是竞争者之间形成的合作联盟，战略联盟是企业间相互

博弈，形成集体理性，进行合作的结果。

假定有两个企业A和B每家企业有合作和竞争两种策略，支付矩阵如下图。

这个博弈也是一个囚徒困境。如果两家都采取不合作的竞争策略，它们的利润都低于共同实施合作策略的结局，虽然合作能够产生更高的收益，但只要任何一方采取不合作的态度，主动合作的一方都会蒙受更大的损失，因此一次博弈的均衡结果只能是双方共同的占有优均衡：（竞争，竞争）。如果这两个企业将长期垄断这一市场，博弈将重复进行下去，结局会有何不同呢？先来分析有限次博弈的情况。假定对局的次数是N，我们从第N次即最后一次对局开始分析。此时对企业A来讲，如果它是理性的，它会作如下推理：企业B采取的是“针锋相对”的策略，但现在是最后一次对局，即使我采取不合作竞争的策略，它也没有机会报复我了，而且我还可以从不合作竞争中获取更大的利润。因此，企业A将在最后一次对局中采取不合作的竞争策略。同样，企业B也是理性的，它也会做同样的分析和选择，而且理性的它还会进一步推理：既然企业A在第N次肯定不会与我合作，那么我在N-1次选择合作又有什么意义呢？我的合作态度是不会得到回报的。因此企业B在N-1次对局中就会选择不合作竞争的策略。反过来，企业A 也会做同样的推理，类似的推理还会发生在第N-2次、N-3次、……，直到第一次。显然，在这种情况下，企业A和企业B都从一开始就选择不合作策略，因此，有限次博弈和一次性的博弈在本质上不会有什么区别，结局都是不合作的。但是如果博弈是无限次重复的，具有经济理性的双方都清楚的知道，合作是对双方都有利的，如果自己不选择合作策略，对方一定也会选择不合作，结果是两败俱伤；如果自己选择合作策略而对方不合作，自己也有机会在下一次惩罚对方，因此，在无限次的重复博弈中，双方理性选择的结果完全可能产生合作均衡。

由于联盟企业有共同的战略目标和具有高度的战略价值认同感，因此能相互协调行动，形成协作动力，激励自己努力实现联盟目标。另外在社会化大生产分工越来越细的现代经济社会，企业之间互相协作相互依赖的程度越来越大，资源

的匮乏和不合作的低效率促使企业间必须进行合作，在战略联盟内，虽然还存在着一定程度的竞争，但以合作取代竞争成为企业之间关系的主流，通过合作最大限度提高企业价值创造能力，达到双赢的效果。如果仅为一次交易利益的最大化而过多损害交易双方的利益必然妨碍其长期利益的最大化，会使合作陷入困境，这是得不偿失的事。因此尽管双方都有利己主义的动机，但在长期的博弈中，双方都采取合作的策略相互协调，不仅有利而且是有十分重要的现实意义。

重复博弈

影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。再重复博弈中，参与人存在着短期利益和长远利益的均衡，有可能为了长远利益牺牲短期利益而选择不同的均衡策略。有限次重复博弈和无限次重复博弈。什么是有限次重复博弈有限次重复博弈是指相同结构的博弈有限次重复进行无限次重复博弈与有限次重复博弈的共同点：试图“合作”和惩罚“不合作”是实现理想均衡的关键所谓重复博弈，是指将一个博弈重复进行下去。我们知道，在单个的囚徒困境博弈中，双方采取对抗的策略可使个人收益最大化如果就一次性博弈来看，(对抗，对抗)是必然的结果恋人们之间的博弈。重复博弈同样可以用来解释商业行为。 ■诚信来自重复博弈：“诚信奇迹无人卖报摊三年口袋里从没少过钱”。，吴师傅的关于“不敢拿”的判断，似乎更为符合博弈学原理。我们可以把这个“诚信报摊”看作摊主与买报人之间的博弈，而从博弈过程来看，“诚信报摊”成立第一天那种“每个博弈者都只关心一次性支付的简单博弈”已经转变成了“重复的、连续进行的博弈” “有仇就报，马上就报”如果用博弈论的观点来解释，则可以简单地描述为“针锋相对策略”。。这个如此简单的策略之所以反复赢得竞赛，是因为它奉行了针锋相对的法则，说白了就是一报还一报，即“人不犯我，我不犯人；人若犯我，我必犯人”，但它坚持“有理、有利、有节”的尺度，并且用以下有规律可供遵循的行为将对手纳入长期合作的轨道上来：第一，善良的，即从不首先背叛；第二，可激怒的，对于对方的背叛行为一定要报复，不能总是合作；

第三，宽容的，不能人家一次背叛，你就没完没了地报复，以后人家只要改为合作，你也要合作；第四，易于察觉的，即逻辑清晰，使对手能够很轻易地发现你采取策略的规律，并且领会你的意图。 “针锋相对策略”在实际生活中可以被广泛地应用：重复博弈：冲突与合作方能共存一、军队的群体目标下的多人重复博弈高度统一的一致行动的能力，这就是我们通常所说的战斗力，这是军队能遂行各种任务的前提。为了实现这一群体目标，军队对于其成员关系、交往方式、群体意识都作了严格的要求，对于分工和群体内规范也都作了细致的安排。除了这些以外，军队还必须把搞好内部团结，维护整体利益的原则作为管理的一般标准。二、权威型的管理方式下的管理策略要求

博弈论分析报告：重复博弈现象分析

博弈论分析报告重复博弈现象分析现代经济学里，博弈论（ＧａｍｅＴｈｅｏｒｙ，又名对策论）已经成为十分标准的分析工具。而完全信息静态博弈是一种最简单的博弈，重复博弈则是完全信息静态博弈论的一种进化。重复博弈有下列三项基本特征：阶段博弈之间没有“物质上”的联系，即前阶段的博弈不改变后一阶段的结构;所有参与人都观测到博弈过去的历史;参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。在博弈论课堂所做的两人重复博弈作业，属于多轮次的典型囚徒困境博弈。根据囚徒困境的说法，个人最佳选择为不合作（招供）时可以达到纳什均衡，然而却达不到都合作（不招供）时的个人利益最大化。因此，如何获得全部的信息在重复博弈的环境中显得至关重要。这一点，从课堂同学们的决策中可以明显的看出来。正是由于每一轮博弈后可以根据其结果来修正下一轮的选择，在经过几轮的信息交换后，大家基本可以明确博弈双方的态度，在一方释放合作意愿的情况下，采取合作态度（不招供）的人数会大幅度上升，带来双方收益的上升。相反，在发现博弈对手采取不合作的情况下，自己往往会采取“以牙还牙，以眼还眼”的跟随策略，双方最终陷入多轮的囚徒困境，收益也会大为减少。从同学们提交的数据中可以明显看出这一情况。另一方面，在10轮的博弈过程中，随着轮次的增加，双方的信息越来越清楚，采取合作态度的博弈者就越多，在后几轮可以稳定的达到70%以上，说明重复博弈的情况下，单次博弈经常出现囚徒困境现象会得到明显改善。在现实生活中，单次的囚徒博弈情况其实比较少见，而重复博弈的情况则比较普遍，因此研究重复博弈对于我们的工作生活有着更加明显的指导意义。其中，一个比较常见的重复博弈现象就是电商和网购。网购双方形成了与囚徒博弈类似的博弈情况：买方和卖方都可以选择诚信和不诚信，对于单次博弈的情况，选择

重复博弈

重复博弈刘峰 1105060144 司法1101班重复博弈是一种特殊的博弈，在博弈中，相同结构的博弈重复多次，甚至无限次。本文通过运用博弈论对企业合作行为的形成机理和实施条件进行了简要的剖析，最终认为重复博弈激励企业合作，同时企业合作是合作企业集体理性的结果。 “囚徒困境”在经济生活中具有很大的普遍性，在资源利用和环境保护，以及政治、军事和法律等各种领域的问题中，都存在类似的“囚徒困境”的现象。“囚徒困境”中的参与人基于个体理性所作的选择，均衡解都是非合作的。那么，经济理性的前提下，是否存在合作的博弈均衡呢？考虑博弈对局反复进行多次的情况，结局可能会有所不同。因为博弈如果只进行一次，参与人就只关心一次博弈的支付；但如果博弈将重复多次，短期机会主义行为的所得可能是微不足道的，参与人可能会为长期利益暂时牺牲眼前利益从而选择不同的策略。在“囚徒困境”例子中，如果两人是一对经常合谋犯罪的惯犯，他们有一个长期的攻守同盟，被抓捕受审时就会考虑，这次我被判了，他下次他一定会报复我，共同抵赖的合作均衡就可能出现。美国密执安大学的艾克赛罗教授曾邀请博弈论专家就“囚徒困境”提交计算机程序，以竞赛的方式决出最优程序，结果是一种被称作“针锋相对”的最简单的程序胜出。这一程序以合作的策略开始，以后每一次选择都模仿对方上一次的选择，即如果对方合作，自己也选择合作，如果对方不合作，自己也立即选择不合作进行报复，如果对方“改过自新”重新采取合作的态度，自己也不计前嫌，继续与对方合作。值得注意的是，从理论上说，“针锋相对”策略的胜出有一个十分重要的条件，即博弈是无限次重复的，也就是说，对局双方都预期这一博弈将永远持续下去，如果对局是有限次的话，上述结论将不再有效。本文认为战略联盟是企业间在重复博弈的理性选择。自从战略联盟的概念被提出以来，就受到了管理学界和企业界的广泛关注。战略联盟一般是由具有共同利益关系的单位之间组成的合作共同体，他们可能是供应商、生产商、分销商之间形成的合作联盟，甚至是竞争者之间形成的合作联盟，战略联盟是企业间相互