博弈论基础及应用
- 格式:doc
- 大小:49.00 KB
- 文档页数:4
博弈论(对策论、游戏论)博弈论又名对策论、游戏论,是一门研究互动关系“游戏”的参与者各自选择策略的科学,博弈论把这些复杂关系理论化,以便分析其中的逻辑和规律,并对实际决策提供指导和借鉴。
游戏三要素(博弈的规则、结构):1、博弈、游戏参加者。
博弈论分析,假定参与者都是机智而理性的。
2、行为和策略空间。
博弈参与者必须知道他自己及其对手伙伴的策略选择范围,并了解各种策略之间的因果关系。
3、有可评价优劣高下的决策行为结果。
博弈论用数字表示这类结果,并称之为支付。
支付矩阵可以用支付矩阵(得益矩阵、收益矩阵、赢得矩阵)来描述一个博弈结构。
厂商B厂商A支配策略:由于游戏参与者试图实现自身利益最大化并具有理性的决策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具有一个简单而确定的结果。
从厂商A角度来说,它采取策略“下”而得到的支付总是好于“上”(2,1分别对1,0)。
同样,对于厂商B来说,选择策略“左”得到的利益总是优于“右”(1,2分别对0,1)。
因此,我们可以确定预期均衡选择策略是A选择“下”而B选择“左”的策略。
囚徒困境:下面支付矩阵表示著名的“囚徒困境”游戏,从博弈论角度看,这是一个存在支配均衡的博弈;因为对囚犯A、B来说,无论对方如何选择,“坦白”都是各自的最优选择。
虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处(3个月刑期)等竞争性动机阻碍了他们达到更好的互利选择,他们面临“囚徒困境”。
我们将看到,寡头垄断厂商经常面临类似的困境。
囚犯B囚犯A纳什均衡:支配均衡是一个特例,并非每个博弈都存在支配均衡。
下面修改的支配均衡表示博弈中,厂商A、B在选择做广告问题上存在的策略关系。
其中厂商A没有支配策略,因为A的最佳决策取决于B的选择。
例如,当B选择做广告时,A应当选择做广告,由此得到10而不是6的支付得益,然而,当B选择不做广告时,A应当选择不做广告,从而得到20而不是15的支付得益。
《博弈论》知识点总结博弈论作为一门交叉学科,涵盖了数学、经济学、政治学、心理学等多个学科领域。
其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。
博弈论的应用领域也非常广泛,包括经济学、政治学、社会学、管理学等。
博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。
博弈论的主要内容包括:1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。
在博弈中,每个参与者都要做出一个选择,其结果受到其他参与者的选择的影响。
博弈的结果取决于所有参与者的选择。
2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。
参与者是进行决策的主体,策略是参与者可以选择的行为方式,结果是参与者选择策略后所得到的收益或损失。
3.博弈的分类根据参与者的利益关系和决策方式,博弈可以分为零和博弈和非零和博弈。
零和博弈指参与者的利益完全相反,一方获利即意味着另一方损失,而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。
4.博弈的解博弈的解是指在博弈参与者做出决策选择之后,通过某种机制确定最终的结果。
常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。
5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。
在经济学中,博弈论可以用来解释市场行为、预测价格变动等。
在政治学中,博弈论可以用来分析政治决策、议事程序等。
在社会学中,博弈论可以用来解释群体行为、合作问题等。
博弈论是一门具有重要理论意义和广泛应用价值的学科,它不仅可以帮助人们更好地理解决策制定的规律和机制,还可以为人们提供更科学的决策指导。
在日常生活中,我们可以通过学习和应用博弈论的知识,更加理性地做出决策,并更好地理解他人的选择和行为。
希望未来博弈论能够继续在各个领域发挥作用,为人类社会的进步和发展做出更大的贡献。
博弈论在经济学中的应用博弈论是现代数学与经济学交叉的重要分支。
它的主要研究对象是决策者在相互交互的情境下如何制定决策,并且由于博弈过程涉及到多个决策者,所以博弈论具有独特的分析手段和模型。
在经济学研究中,博弈论经常被用来研究市场、企业竞争、政策制定等问题。
一、博弈理论的基本概念博弈论研究的基本概念包括博弈、策略、收益。
博弈就是指多个决策者进行决策的过程,每个决策者根据自己的利益和对其他决策者的预期来选择策略,以获取最大化的收益。
策略就是指决策者在博弈过程中可供选择的行动方式。
收益就是最终的结果,它受到所有参与者的决策和相互作用的影响。
在博弈论中,有两种基本类型的博弈:合作博弈和非合作博弈。
合作博弈是指参与者可以协商并且可以制定联合策略,以获得更好的结果。
非合作博弈是指参与者之间不能协商或达成一致,并且每个参与者都制定自己的策略以获取最大化的收益。
二、博弈论在市场研究中的应用在市场研究中,博弈论广泛应用于研究企业之间的角色、竞争和定价策略。
在市场竞争中,企业面临的主要问题是自己的价格战略和对手的反应。
通过博弈论的分析,我们可以计算出不同价格策略的最终收益。
例如,假设一家公司制定了一个新的低价策略来获取更多的市场份额,但同时其竞争对手也具有相同的策略,那么在博弈过程中,双方的最终利润都将减少。
在此基础上,博弈论可以为企业提供有益的建议。
例如,当企业面临激烈的市场竞争时,博弈论可以建议企业采用合作策略来避免价格战,或者采取不同的市场定位或增加产品差异化来避免直接竞争。
三、博弈论在政策制定中的应用在政策制定中,博弈论通常用于衡量不同政策的潜在结果并推测各方的反应,以便政府能够制定更有效的政策。
例如,当政府面临犯罪率上升的问题时,博弈论可以帮助政府确定政策制定的方向。
政府可以运用博弈论的方法,建立不同的策略间的收益矩阵,计算出不同的策略对策两方的收益和惩罚。
从而,制定更加有效的犯罪预防措施,以降低社会治安风险。
博弈论在市场策略中的应用博弈论是一种研究决策者在特定条件下如何选择行为策略的数学理论,在市场策略中,博弈论提供了一个理解竞争与合作的框架。
企业在市场中面临着各种竞争对手、客户、供应商等利益相关者的决策影响,博弈论能帮助企业理清这些复杂关系与互动,因此,明确博弈论的基本概念与其在市场策略中的应用尤为重要。
一、博弈论的基本概念博弈论,作为理论经济学的重要分支,主要研究多个参与者之间的决策过程及其相互影响。
博弈论的基本元素包括:参与者:博弈中的决策者,可以是个人、公司或国家等。
策略:每位参与者可以选择的一系列行动方案。
每种选择可能产生不同的结果。
支付:每种策略组合所带来的收益或损失。
信息:参与者在做决策时所掌握的信息量。
如果信息不对称,某些参与者可能会比其他参与者具备优势。
博弈可以分为静态博弈与动态博弈。
静态博弈是指所有参与者同时做出决策,而动态博弈则强调了决策的时间顺序及其对其他参与者选择的影响。
二、博弈论在市场中的应用领域有效地运用博弈论,可以帮助企业在多个领域中制定更为科学和合理的市场策略。
以下几个领域是博弈论应用尤为突出的:1. 垄断与竞争策略在市场中,企业常常需面对竞争对手的定价策略。
在一个完全竞争的市场中,几乎所有企业都是价格接受者,没有能力单独影响价格。
而在垄断市场中,由于只有单一卖方,垄断者可以根据需求情况调整价格。
从这一点出发,理解竞争对手的定价意图成为制定自身价格策略的重要一环。
通过建立“反应函数”,企业可以模拟识别不同价格策略可能导致的市场反应,从而优化自身定价策略。
例如,一家智能手机厂商可能需要考虑其主要竞争对手(如苹果与三星)的产品定价,以决定是否降低自身产品的售价。
2. 广告投放与市场宣传广告支出往往是企业资源投入的重要组成部分。
然而,广告效果并非简单线性。
不同公司之间在广告投放上相互影响,这是一个典型的博弈问题。
当一家企业加大广告宣传时,其竞争对手也可能通过增加广告投入来维护自身市占率。
博弈论的理论和实践应用博弈论是一种数学工具,研究人类或者其他智能体之间的决策行为。
在游戏、竞争、博弈等各种领域中具有广泛的应用。
本文将介绍博弈论的基本概念和应用,以及它的历史背景和发展现状。
1.博弈论的基本概念博弈论是一种研究行为决策的数学理论,它主要关注游戏中的策略选择、博弈中的双方互动和结果分配等方面。
博弈论的研究对象可以是单个人或多个人同时参与的情况。
在博弈论中,常用的基本概念有参与者、策略、收益、纳什均衡等。
(1)参与者:博弈中所涉及的所有人或团体。
(2)策略:参与者所选择的一种行动方式,博弈论中通常采用策略矩阵或者游戏树来表示各方的策略选择。
(3)收益:参与者选择某个策略后所获得的利益或损失,通常用数字表示。
(4)纳什均衡:指各方在一定策略情况下达到的一个无法再改变的稳定状态,也就是最优策略的一种平衡状态。
2.博弈论的应用博弈论的应用非常广泛,涉及游戏、经济、政治、社会和生物等各个领域。
(1)投标竞争:在招标项目中,供应商们通过博弈论计算出最优的报价,从而获得项目合同。
(2)股票市场:在股票市场中,投资者们可以通过博弈论的方法来预测股票价格走势和风险收益,从而做出更明智的投资决策。
(3)经济决策:博弈论在经济学中的应用非常广泛,例如博弈论可以用来研究价格竞争、寡头垄断、集中交易、卡特尔等经济问题。
(4)电子竞技:在电子竞技中,选手们通过应用博弈论的方法进行战术操作和赛前分析,从而提高比赛的胜率和稳定性。
(5)生物学:在生物学中,博弈论可以被用来研究动物或者群体之间的行为,例如动物的食物选择、交配竞争、同敌的斗争等。
3.博弈论的历史和发展博弈论最早可追溯到19世纪末。
法国数学家普安卡雷发表了关于两人零和博弈的论文,用该论文奠定了博弈论在数学中的地位。
20世纪50年代,博弈论逐渐成为一种重要的研究领域,并逐渐渗透到人文科学中来。
1970年代后期,随着计算机技术和数学方法的快速发展,博弈论得到了更广泛的应用。
博弈论的基本原理与应用博弈论,是指研究人类决策过程的数学理论。
它吸收了数学、经济学、心理学等多个学科的成果,成为最具代表性的交叉学科之一。
博弈论的研究对象是决策者之间的互动,因此在各种社会、经济、商业甚至军事场合都有广泛应用。
博弈论的基本原理和应用,就是我们今天这篇文章所要探讨的主题。
一、博弈论的基本原理博弈论的核心原理是“博弈”。
简单说,博弈就是一种策略性互动过程,通俗来讲就是人与人之间的“斗智斗勇”游戏。
在博弈中,每个人的决策都会影响到其他人的利益,因此每个人都需要考虑其他人的决策并做出最优决策,从而达到自己的最大利益。
博弈论的研究对象可以分为两类:完全信息博弈和不完全信息博弈。
完全信息博弈是指,每个参与者都清楚地知道自己和其他人的策略和利益,没有任何信息隐瞒。
而不完全信息博弈则是指,参与者之间存在着信息不对称的情况,每个参与者都只能知道一部分信息,需要通过各种手段来获得更多的信息。
在不完全信息博弈中,战略的制定与信息的获取是十分重要的。
博弈论的核心是研究博弈中的博弈策略。
博弈策略是指在博弈中所采取的行动或决策,是每个参与者为了达到自己的利益而采取的最优选择。
博弈中的策略有很多种,例如纳什均衡策略、最小报复策略、收益最大化策略等等。
不同的策略会影响到博弈的结果,因此在博弈中选取最优策略是十分重要的。
二、博弈论的应用博弈论的应用范围十分广泛。
下面我们将介绍几个博弈论在实际生活中的应用。
1. 经济学领域博弈论在经济学中有广泛的应用。
例如,在竞争市场中,每个厂商为了达到最大利润都会考虑竞争对手的行动,从而制定出最优的定价策略。
又例如,在国际贸易谈判中,各个国家的谈判代表也需要运用博弈论的知识,通过制定最优的策略来达成共同的目标。
2. 战争军事领域博弈论在军事战争中也有广泛应用。
军方需要根据敌方的行动和自己的利益来制定军事战略和决策。
例如在战争中,双方军队都会考虑对方的行动和自己的利益,从而采取最优的战术和策略来获得战争的胜利。
博弈论在经济学中的运用博弈论是一种用于研究决策过程的数学理论,它可以帮助我们理解人们在面对不确定情况时的决策机制,以及这些决策如何影响整个系统的运行。
在经济学中,博弈论的应用非常广泛,它不仅可以帮助我们更好地理解市场行为,还可以为政策制定提供有价值的参考。
一、博弈论的基本概念博弈论是一种研究决策过程的数学理论。
在博弈论中,参与者被视为“玩家”,每个玩家都有自己的选择策略。
这些选择策略可能包括行动、决策顺序、信息、威胁和承诺等。
每个玩家的决策过程都是在给定其他玩家的策略时,自身利益最大化的最优选择。
博弈论的核心概念是“囚徒困境”,它描述了当两个囚犯被警察抓住并被单独关押时,他们如何选择自己的最佳策略以最大化自己的利益,但最终的结果却是他们都被判了重刑。
二、博弈论在经济学中的应用1.寡头博弈与市场结构在经济学中,寡头是指少数几个公司占市场销售份额相当大的部分。
由于这些公司了解彼此的行动,因此它们之间的博弈被称为寡头博弈。
市场结构分析是经济学中非常重要的一部分,通过使用博弈论的分析方法,可以对市场结构进行更深入的研究。
例如,两个寡头企业之间的动态博弈可以揭示市场的竞争与合作情况,以及市场价格与非价格竞争的效应。
此外,寡头博弈还能够帮助我们理解垄断和竞争之间的区别,以及垄断威胁对市场结构的影响。
2.公共政策分析公共政策是经济学的另一个重要领域,它涉及到政府如何管理公共资源以实现公共利益。
使用博弈论分析公共政策可以更准确地评估政策的有效性和可持续性。
例如,公共物品的提供就是一个典型的博弈问题。
如果政府独自提供公共物品,那么每个人都可以获得最大利益;但如果每个人都这样做,公共物品的成本就会过高。
通过使用博弈论,我们可以分析各种公共政策选项的效果,并确定哪种方案最符合公共利益。
3.风险与不确定性博弈论还能够帮助我们更好地理解风险和不确定性。
在面对不确定性的情况下,人们通常会做出保守或冒险的选择,这取决于他们对风险和收益的评估。
博弈论在经济学中的应用博弈论是一种重要的数学工具,广泛应用于经济学领域。
它研究个体在决策过程中的相互作用以及其对个体行为和社会结果的影响。
本文将介绍博弈论在经济学中的基本原理和应用。
一、博弈论的基本原理博弈论研究的是决策者之间的相互关系和相互作用。
在博弈论中,决策者被称为"玩家",他们面临不同的策略选择,并根据其他玩家的策略选择来进行决策。
博弈论的核心概念是"策略"和"支付"。
策略是决策者所选择的一组行动,而支付则代表决策者从特定策略组合中获得的效用或收益。
二、博弈论的应用领域博弈论在经济学中有着广泛的应用,下面我们将从市场竞争、合作与冲突以及信息不完全三个方面来介绍。
1. 市场竞争博弈论可以用来分析市场中企业之间的竞争行为。
在竞争环境下,企业需要选择不同的价格和产量水平以达到最大利润。
通过博弈模型,可以预测企业之间的策略选择,并找到纳什均衡,即博弈参与者做出的决策相互协调且无法通过改变自身策略而获得更大收益的状态。
2. 合作与冲突博弈论也可以用于分析合作与冲突的情况。
在合作关系中,博弈论可以用来研究策略合作的条件、合作效果以及如何有效地分配收益。
而在冲突情况下,博弈论可以帮助分析决策者对抗的策略选择和结果。
3. 信息不完全博弈论在信息不完全的环境下也能发挥作用。
经济活动通常面临信息不对称的问题,某些参与者拥有更多的信息,而其他人则不完全了解。
博弈论可以分析不完全信息下的策略选择和结果,并提供相应的解决方案,如逆向选择、道德风险等问题。
三、博弈论的案例分析博弈论在经济学中有许多经典的案例,下面我们将介绍其中两个具有代表性的案例。
1. 雷奥纳德•齐夫定价模型齐夫定价模型是一个经典的博弈论案例,它研究的是两个垄断企业在定价策略上的博弈。
在这个模型中,两家企业同时制定价格,但通过博弈分析可以发现,最终它们将会达到一个较低的价格,从而相互竞争减少利润损失。
博弈论基础 mobi(实用版)目录1.博弈论的概述2.博弈论的基本要素3.博弈论的分类4.博弈论的应用案例5.博弈论的发展与前景正文一、博弈论的概述博弈论,作为一门研究决策制定的数学理论,主要关注在特定情况下,决策者如何做出最佳选择以实现自身目标。
博弈论的研究对象包括各种决策问题,如竞争、合作、冲突等,旨在揭示这些决策问题的规律性,并提供有效的解决方法。
二、博弈论的基本要素1.参与者:博弈中的决策者,可以是个人、组织或国家等。
2.策略:参与者可选择的行动方案。
3.支付:参与者采取某策略后获得的收益或损失。
4.博弈:参与者之间相互作用的过程,包括策略选择和支付计算。
三、博弈论的分类1.合作博弈与非合作博弈:根据参与者之间是否存在协作关系进行划分。
2.静态博弈与动态博弈:根据博弈过程的时间特性进行划分。
3.完全信息博弈与不完全信息博弈:根据参与者对对方策略的了解程度进行划分。
四、博弈论的应用案例1.囚徒困境:揭示了合作与竞争之间的矛盾,解释了为何在某些情况下,合作可能导致更差的结果。
2.拍卖理论:研究拍卖市场中的策略选择与支付分配问题,为实际拍卖活动提供理论依据。
3.信任博弈:分析信任关系对合作决策的影响,有助于理解人际关系中的信任问题。
五、博弈论的发展与前景1.发展历程:博弈论起源于 20 世纪中叶,经过几代学者的发展,已经成为一门较为完善的理论体系。
2.发展趋势:博弈论与其他学科的交叉研究日益增多,如经济学、社会学、心理学等。
3.前景展望:随着人工智能、大数据等技术的发展,博弈论在实际应用中将发挥更大的作用。
总之,博弈论作为一门研究决策制定的数学理论,不仅具有深厚的理论基础,还具有广泛的应用前景。
博弈论及其在决策中的应用博弈论是一门研究决策策略的数学理论,旨在分析不同利益相关方之间的冲突与合作关系。
它涵盖了很多基本概念和方法,为实施最优决策提供了一套理论框架。
博弈论在各个领域的决策问题中得到了广泛的应用,如经济学、管理学、政治学等。
博弈论的基本概念有玩家、策略、收益和博弈形式。
玩家是参与博弈的个体或群体,策略是玩家选择的行动,收益是博弈结果带给玩家的效益,而博弈形式描述了玩家在不同策略下获得的收益的矩阵。
博弈论在决策中的应用主要体现在以下几个方面。
首先,博弈论可用于分析竞争性市场中的决策问题。
当多个企业在一个市场上竞争时,它们需要决定合适的定价、广告和产品策略。
通过博弈论的方法,可以预测竞争双方的最优策略,并帮助企业做出相应的决策,达到最大利益。
其次,博弈论可用于研究战略决策问题。
例如,军事战争中的战略决策,政治竞选中的策略制定等。
博弈论可以帮助参与者评估不同策略下的可能结果,并制定出最佳的决策方案。
再次,博弈论可用于分析合作博弈中的决策问题。
在合作博弈中,参与者可以通过合作来达到更好的效果。
通过博弈论的方法,可以分析合作博弈中的稳定合作策略,并帮助参与者做出合适的决策。
最后,博弈论可用于分析资源分配问题。
在资源有限的情况下,如何进行公平合理的分配是一个重要的决策问题。
博弈论可以帮助参与者评估不同资源分配策略下的可能结果,并找到最佳的分配方案。
总之,博弈论在各个领域的决策问题中有着重要的应用价值。
通过博弈论的方法,可以分析不同决策策略下的可能结果,并帮助决策者做出最优决策。
在实际应用中,需要综合考虑各个因素,如参与者的利益、目标和约束条件等,以便找到最适合的决策方案。
第一讲博弈论基础及其应用一.要学点博弈论1.几个富有启发性的案例(1)商家作出最低价格承诺的真相是什么?所谓最低价格承诺是指商家承诺自己的价格比任何对手都低,一旦有对手的价格比自己低,作承诺的商家将退回差额,并且承诺支付一定金额的违约罚金。
思考:商家为什么要作出这种承诺呢?是为了促销或者恶性竞争吗?(2)假设有三个候选人或候选方案:x、y 和z;有三个参加投票的人:甲、乙、丙。
三个人对候选对象的态度分别如下:甲:x y z;乙:y z x;丙:z x y。
(注:候选对象排位越靠前,表示越喜欢)现在分别有三个投票程序:程序1,x与y先pk,然后胜利者进入下一轮与z进行pk;程序2,x与z先pk,然后胜利者进入下一轮与y进行pk;程序3,z与y先pk,然后胜利者进入下一轮与x进行pk。
思考:(1)上面每个程序的最终获胜者是谁?(2)为了保证丙自己心目中最喜欢的z当选,如果丙能够操纵投票程序,他应该采用哪个投票程序?(3)如果您是甲,为了避免自己最不喜欢的丙当选,应该怎么办?(3)配硬币博弈的启示乙甲正面反面A.配硬币博弈属于典型的零和博弈,它的制胜要点:a,切忌自己的行为有规律性,应该使自己的策略选择具有随机性,即采用混合策略(即以某个概率分布随机选择自己的策略)而已;b,绝对不能让对手知道自己的选择,能骗则骗,博弈双方没有通过沟通、交流、谈判实现双赢的可能;c,看看对手的行为选择是否具有规律,或想方设法获知对手的选择;d,猜硬币博弈具有后发制人的优势。
B.配硬币博弈的若干重要应用场合:a,是否监控员工就有可能演变成猜硬币博弈博弈:单位有时监控员工,员工有时会偷懒或偷单位的东西;b纳税人与税务部门也可能玩猜博弈博弈:税务部门可能查税,纳税人有时偷税。
c,两军对垒时最容易出现猜硬币博弈,如二战时同盟国与纳粹在确定登陆地点时就存在配硬币博弈。
(4)斗鸡博弈的启示案例白军进攻后退红军进攻后退A.斗鸡博弈的制胜要点:a,重要的不是自己是不是男子汉,是不是勇敢,而是要想方设法让对手相信你是勇敢的男子汉,在这里,通常感觉就是现实(想一想有哪些办法?如烧钱)。
博弈论(对策论、游戏论)博弈论又名对策论、游戏论,是一门研究互动关系“游戏”的参与者各自选择策略的科学,博弈论把这些复杂关系理论化,以便分析其中的逻辑和规律,并对实际决策提供指导和借鉴。
游戏三要素(博弈的规则、结构):1、博弈、游戏参加者。
博弈论分析,假定参与者都是机智而理性的。
2、行为和策略空间。
博弈参与者必须知道他自己及其对手伙伴的策略选择范围,并了解各种策略之间的因果关系。
3、有可评价优劣高下的决策行为结果。
博弈论用数字表示这类结果,并称之为支付。
支付矩阵可以用支付矩阵(得益矩阵、收益矩阵、赢得矩阵)来描述一个博弈结构。
厂商B厂商A支配策略:由于游戏参与者试图实现自身利益最大化并具有理性的决策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具有一个简单而确定的结果。
从厂商A角度来说,它采取策略“下”而得到的支付总是好于“上”(2,1分别对1,0)。
同样,对于厂商B来说,选择策略“左”得到的利益总是优于“右”(1,2分别对0,1)。
因此,我们可以确定预期均衡选择策略是A选择“下”而B选择“左”的策略。
囚徒困境:下面支付矩阵表示著名的“囚徒困境”游戏,从博弈论角度看,这是一个存在支配均衡的博弈;因为对囚犯A、B来说,无论对方如何选择,“坦白”都是各自的最优选择。
虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处(3个月刑期)等竞争性动机阻碍了他们达到更好的互利选择,他们面临“囚徒困境”。
我们将看到,寡头垄断厂商经常面临类似的困境。
囚犯B囚犯A纳什均衡:支配均衡是一个特例,并非每个博弈都存在支配均衡。
下面修改的支配均衡表示博弈中,厂商A、B在选择做广告问题上存在的策略关系。
其中厂商A没有支配策略,因为A的最佳决策取决于B的选择。
例如,当B选择做广告时,A应当选择做广告,由此得到10而不是6的支付得益,然而,当B选择不做广告时,A应当选择不做广告,从而得到20而不是15的支付得益。
假定两个厂商需要同时决策,A应当如何决策?厂商B厂商A 解答这个问题,A 需要把自己放在B 的位臵,从B 的角度看什么是最好的选择,并在此基础上考虑自己的选择。
支付矩阵表明B 有一个支配策略:不论A 选择如何,B 选择做广告时利益较大(5,8对0,2),因而A 可以判断B 会选择做广告,而在B 做广告时,A 应当选择做广告,因而。
均衡结果是双方都做广告。
上述均衡结果被称作纳什均衡。
纳什均衡指给定一组对手行为前提下,各博弈方存在的最佳选择;在纳什均衡状态下,只要其他参与者不变换策略选择,任何单个参与者不可能单方面通过变换策略来提高它的所获支付。
美国数学家和统计学家纳什(Nash )50年代提出的折椅概念,所以称作纳什均衡。
纳什均衡和支配策略均衡的区别是:在纳什均衡下,“我(你)所做的是给定你(我)的选择我(你)所能做的最好的”。
而支配均衡下,“我(你)所做的是不论你(我)的选择,我(你)所能做的更好的”。
支配均衡必然是纳什均衡,纳什均衡未必是支配均衡。
一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策略),有时又可能不存在纳什均衡,下面左表存在两个纳什均衡,右表则没有纳什均衡。
A 重复博弈:上面讨论的“囚徒困境”暗含所几个假定是静态所一次性的博弈,结果陷入了个体理性决策导致集体非理性结果的困境。
现在我们改变条件,讨论博弈可以多次进行的重复博弈(Repeated Game ),这时,囚犯同时选择沉默有可能成为纳什均衡。
因为重复性博弈中,选择坦白的机会成本太高,可能成为不利的选择。
例如:A 有机会对B 组成策略联盟,并对B 宣布如下方针:我将选择沉默,并要求你也如此来增进各自利益;然而,如果你半途背叛选择坦白,我从下一阶段游戏开始一直选择坦白,这一方针跟A 利益一致,因而是可信的。
从B 角度来看,如和A 合作,可能每阶段得到1年监禁的较好结果;如中途变卦,固然当期可得3个月的更好结果,但此后便每次面临5年监禁的结果,显然是不利的。
因而重复博弈中,“沉默”+“沉默”点可能成为双方的最佳选择,因而成为纳什均衡。
——由于博弈条件由一次性变为重复性,均衡状态随之发生变化。
序列博弈前面讨论的博弈是参与者同时选择。
在序列博弈(Sequential Game )中,各博弈方先后依次行动。
下面的支付矩阵描述了一个博弈,如果同时行动,它有两个纳什均衡(“甜,咸”或“咸,甜”)。
假定A 可以先推出甜饼干(假如较快投入生产),就有了序列博弈:A 先作决策,B 随后选择。
A 决策是必须考虑竞争厂商B厂商A者的理性反应;A知道不论自己推出哪种饼干,B处于自身利益会推出另一种;因而A推出甜饼干,B在给定A 决策时选择咸饼干;给定B的选择,A的选择仍然最佳。
结果两个纳什均衡点收敛为一个(下,左)。
其中A由于具有先行者优势(First Mover’s Advantege)而得到较大利益。
中国电信、中国联通的价格竞争模型:A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)刚成立不久,翅膀没有长硬,是政府为打破垄断鼓励竞争而筹建的,B得到了政府的一些优惠,其中就有B的价格可以比A低10%。
这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。
在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。
这时候,A该怎么办?B(中国联通)AA降价、B维持,则A获利15,B损失5,整体获利10;A维持、B维持,则A获利5,B获利10,整体获利15;A维持、B降价,则A损失10,B获利15,整体获利5;A降价、B降价,则A损失5,B损失5,整体损失10。
从A角度看,显然降价要比维持好,降价至少可以保证比B好,在概率均等的情况下,A降价的收益为15×50%-5×50%=5,维持的收益为5×50%-10×50%=-2.5,为了自身利益的最大化,A就不可避免地选择了降价。
从B角度看,降价也比维持好,其降价收益为5,维持收益为2.5,B也会选择降价。
在这轮博弈中,A、B 都将降价作为策略,因此各损失5,整体损失10,整体收益是最差的。
这就是此博弈最终所出现的纳什均衡。
电信业价格战博弈模型是典型的囚徒困境现象,各个局部都寻求利益的最大化,而整体利益却不是最优,甚至是最差。
许多其他行业的价格竞争都是典型的囚徒困境现象,如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。
OPEC组织成员国之间的合作与背叛“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。
上述我们在对电信价格竞争的博弈分析中,只是一次性的“囚徒困境”博弈,因此得到了互相降价的纳什均衡。
而在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。
比如中东石油输出国组织(Organizationg of Petroleum Expoting Countries 简称OPEC)的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。
OPEC之所以能够成立,各组织成员国之间之所以能够合作,是因为囚徒困境如果是一次性博弈(One shot game)的话,基于个人利益最大化,得到纳什均衡解,但如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。
连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”(Folk Theorem)的含义。
但合作的可能性不是必然性。
博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺(Credible commitment),向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。
如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。
这里“可信的承诺”是一个很牵强的翻译,“Credibl e commitment”并不是什么空口诺言,而是实实在在的付出。
所以合作是非常困难的。
所以OPEC组织经常会有成员国不遵守组织的协定,私自增加石油产量。
每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。
当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降--结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌……。
理论上,几乎所有的卡特尔(正是串谋在一起的厂商称作Cartel)都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。
那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。
但只要是有限次的合作,合作就不会成功。
比如合作10次,那么在第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。
但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度。
第八次不合作会使大家在第七次就不合作……一直到,从第一次开始大家都不会采取合作态度。