对策论中的纳什均衡应用
- 格式:docx
- 大小:19.93 KB
- 文档页数:4
纳什均衡的应用1.考虑不对称的古诺双头垄断,市场反需求函数为Q p -=115,A 企业生产的固定成本为1000,B 企业没有固定成本,A 和B 两个企业的可变成本分别为2a q 和2b q 。
(1)请写出A 公司的古诺反应函数的表达式。
(2)请写出B 公司的古诺反应函数的表达式。
(3)请求出纳什均衡时两个企业的产量和利润。
2.在贝特兰德模型中,假定每个企业的最大生产能力是K ,单位生产成本为c =10,需求为100,如果两个企业的价格相同,市场需求在二者之间平分;如果j i P P < (i ,j =1,2,i ≠j),企业i 产量为Min{100-P i ,K},企业j 的产量为Min[Max(0,100-P i -K),K](即只有低价企业不能满足需求时,高价企业才生产,并且产量不超过生产能力)。
(1)求企业的得益函数;(2)假定30<K<45,证明此博弈不存在纯策略纳什均衡。
3.考虑伯特兰德寡头模型。
假设需求函数为{}),2,1,(,,0),(21j i j i bq q M Max q q P j i i ≠=--=,其中商品是部分可替代的,即10<<b 。
证明:两商品的替代性越高,厂商获得的利润越少。
4.若企业1的需求函数为21211),(p p a p p q +-=,企业2的需求函数为12212),(p p a p p q +-=。
若假设两个企业的生产成本都为0,求纳什均衡。
5.如果在一条1千米长的长街上均匀居住着许多居民,有两个人同时想在该厂街开便利店。
(1)如果假设所有居民都是到最近的便利店购买商品,问这两个人会如何选择店面位置?(2)如果每户居民仍然到离得最近的便利店购买,但购买数量与他们到便利店的距离有关,如Q=1-D ,其中D 是购买量,D 是居民到便利店的距离,此时两个人会怎样选择店面的位置?6.假设两国间通过税收优惠吸引资本进入。
两国之间在税收制度上的差别不仅体现在税率的高低不同,而征收管理情况也有差异,如A 国纳税程序简便,而B 国可能相对要复杂一些。
纳什均衡在经济学中的应用纳什均衡是博弈论中的一个重要概念,也是经济学中常用的分析工具。
它描述了一个多方参与的博弈中,每个参与者通过选择最优策略来实现自身利益的状态。
纳什均衡在经济学中有广泛的应用,涉及到市场竞争、合作博弈、价格形成等多个领域。
在市场竞争中,纳什均衡可以帮助我们理解企业之间的互动和策略选择。
以某个特定的市场为例,假设有两家企业同时决定调整自己的价格。
每家企业的利润取决于自己的价格以及竞争对手的价格。
如果企业A选择降低价格,而企业B选择维持原有价格,那么企业A将获得更多的市场份额,但也会损失一部分利润。
反之,如果企业A选择维持原有价格,企业B选择降低价格,情况也是一样的。
而如果两家企业都选择降低价格,由于市场需求有限,它们的利润可能都会下降。
在这种多方参与的博弈中,每个企业都希望通过选择最优策略来实现自身利益的最大化。
纳什均衡就是在这种情况下,每个企业根据对手的策略来调整自己的策略,从而达到一个稳定的状态。
除了市场竞争,纳什均衡还可以应用于合作博弈的分析。
在合作博弈中,参与者之间可以选择合作或者不合作。
每个参与者的利益取决于自己的行动以及其他参与者的行动。
如果每个参与者都选择合作,那么大家都能够获益。
但是,如果有一方选择不合作,那么其他参与者也没有动力继续合作。
在这种情况下,合作博弈就变成了一个多方参与的博弈。
纳什均衡描述了在这种情况下,每个参与者根据对手的策略来调整自己的策略,从而达到一个稳定的状态。
除了市场竞争和合作博弈,纳什均衡还可以应用于价格形成的分析。
在一个市场中,供给和需求的关系决定了价格的形成。
供给方希望通过提高价格来获得更多的利润,而需求方希望通过降低价格来获得更多的产品或服务。
在这个过程中,供给和需求的关系会相互影响,最终形成一个均衡的价格。
纳什均衡描述了供给方和需求方根据对方的策略来调整自己的策略,从而达到一个稳定的价格。
纳什均衡在经济学中的应用非常广泛。
它可以帮助我们分析市场竞争、合作博弈、价格形成等多个领域。
古诺寡头竞争模型有两个参与人,分别称为企业1和企业2;每个企业的战略是选择产量;支付是利润,它是两个企业产量的函数.我们用q i ∈[0,∞)代表第i 个企业的产量,C i (q i )代表成本函数,P =P (q 1+q 2)代表逆需求函数(P 是价格;Q (P )是原需求函数).第i 个企业的利润函数为: 2,1),()()(21=-+=i q C q q P q q i i i i π(*2*1,q q )是纳什均衡产量意味着)()(),(max arg 11*211*211*1q C q q P q q q q -+=∈π )()(),(max arg 222*12*12*21q C q q P q q q q -+=∈π 找出纳什均衡的一个办法是对每个企业的利润函数求一阶导数并令其等于0. 0)()()(1,121,12111=-+++=∂∂q C q q P q q q P q π 0)()()(2,221,22122=-+++=∂∂q C q q P q q q P q π 上述两个一阶条件分别定义了两个反应函数)(21*1q R q = )(12*2q R q = 反应函数意味着每个企业的最优战略(产量)是另一个企业产量的函数.两个反应函数的交叉点就是纳什均衡),(**2*1q q q =.为了得到更具体的结果,让我们来考虑上述模型的简单情况,假定每个企业具有相同的不变单位成本,即:c q q C c q q C 222111)(,)(==,需求函数取如下线性形式:P=a-(q 1+q 2).那么,最优化的一阶条件分别为:0)(0)(2212212111=--+-=∂∂=--+-=∂∂c q q q a q c q q q a q ππ就是说,j 每增加1个单位的产量,i 将减少1/2单位的产量. 解两个反应函数,我们得到纳什均衡为: )(31*2*1c a q q -==每个企业的纳什均衡利润分别为:2*2*12*2*11)(91),(),(c a q q q q -==ππ为了与垄断情况作比较,让我们计算一下垄断企业的最优产量和均衡利润.垄断企业的问题是:)(c Q a Q Max Q--=π容易算出,垄断企业的最优产量为)(32)(21*2*1*c a q q c a Q -=+<-=;垄断利润为22)(92)(41c a c a m ->-=π.寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己最优产产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应.这是典型的囚徒困境问题.例1:设某一市场有1,2两个厂商,它们生产相同的产品.设厂商1的产量为q 1,厂商2的产量q 2,则市场总产量为Q=q 1+q 2.设P 是市场出清价格(可以将产品全部卖出去的价格),则P 是市场总产量的函数P=P(Q)=8-Q .再设生两个厂商的生产都无固定成本,且每增加,且每增加一单位产量的边际生产成本相等 C 1=C 2=2,即它们分别生产q 1和q 2产量的成本分别为2q 1和2q 2.最后设这两个厂商是同时决定各自的产量的,即在决策之前不知道另一方的产量.上述问题构成的博弈中,博弈方为厂商1和厂商2.它们的策略空间都是由不同的产量组成,因为产量受生产能力的限制,因此理论上产量是有一个上限的,但如果假设产量是连续可分得,则它们各自都有无限多种可选策略.该博弈中两博弈方的得益自然是各自的利润,用u 老表示,即各自的销售收入减去各自的成本,根据给定情况,分别为212111211111162)](8[)(q q q q q q q q q C Q P q u --=-+-=-= 222122212222262)](8[)(q q q q q q q q q C Q P q u --=-+-=-=两博弈方的得益(利润)取决于双方的策略(产量).本博弈中两博弈方都有无限多种可选策略,因而无法得益矩阵表示该博弈,但纳什均衡的概念同样适用,即对于两博弈方的一个策略组合),(**2*1q q q =,只要其中*1q 和*2q 相互是对方策略的最佳对策,就是一个纳什均衡.并且如果可证实它是该博弈中唯一的纳什均衡,则它同样是博弈的解.因此本博弈, (*2*1,q q )的纳什均衡的充分必要条件是*2*1q q 、的最大值问题:)6(m a x21*2111q q q q q --和)6(max 22*1222q q q q q --的解. 因为求最大值的两个式子都是各自自变量的二次式,且二次项的系数都小于0,因此*1q 和*2q 只要能使它们各自对q 1和q 2的偏导数为0,就一定能实现它们的最大值. 026*1*2=--q q 026*2*1=--q q联立上两式,解得*1q =*2q =2,并且这是唯一的一组解.因此(2,2)是本博弈唯一的纳什均衡策略组合,也意味着它是本博弈的解.两个厂商将各生产2单位的产量,双方得益(利润)都为2⨯(8-4)-2⨯2=4,市场总产量为2+2=4,价格为8-4=4,两厂商的利润总和为4+4=8.上述是两个独立同时作产量决策,是按它们根据实现自身最大利益的原则行动而得到结果.那么这个结果究竟怎么样?两家厂商有没有真正实现自身的最大利益?从社会总体角度来看效率又如何?如果现在以总体利益目标的.如果现在以总体利益为目标来考虑市场的最佳产量,结果会有怎样的不同呢?首先可以根据市场的条件求出实现最大总得益的总产量.设总产量为Q,则总得益U=QP(Q)-2Q=6Q-Q 2很容易求得使总得益最大的总产量3*=Q ,最大总得益9*=u .将此结果与两个厂商独立决策、只追求自身利益时相比,总产量较小,而总利润却较高。
浅析古诺模型的纳什均衡及应用古诺模型是由著名经济学家John Nash在20世纪50年代提出的,被广泛应用于博弈论和经济学领域。
它是一种简化的博弈理论模型,用来描述多个决策者在特定情况下做出决策的过程。
纳什均衡是古诺模型中的重要概念,指的是在一种特定策略下,每个决策者都采取最优的决策,并且在其他决策者的策略给定的情况下,他们的策略不会改变。
古诺模型主要包括两个核心元素:参与者和策略。
参与者是指在博弈中的个体或者团体,策略是指参与者在特定情况下可能采取的行动。
在古诺模型中,参与者往往是理性的,他们会根据自己的利益来选择策略。
而纳什均衡则是在这种理性的前提下,每个参与者都选择出自己的最佳策略,且在其他参与者给定的策略下,他们的策略不会改变。
这种状态下,任何一方的单方面改变策略都不会让他获得更好的结果,因此这种状态被称为纳什均衡。
古诺模型的纳什均衡可以应用于许多实际情境中,比如拍卖市场、价格竞争、资源分配等。
在拍卖市场中,卖家和买家之间的竞争和博弈过程可以用古诺模型进行描述,通过分析纳什均衡,可以得出每个参与者最优的策略选择,从而推断出可能的拍卖结果。
在价格竞争中,企业之间为了争夺市场份额会进行价格战,古诺模型可以用来分析在不同策略下各企业的收益和利润情况,从而指导它们进行最优的决策。
在资源分配中,不同部门或者利益相关方之间往往存在竞争和合作的情况,古诺模型可以帮助分析各方之间的策略选择和可能的结果,从而指导资源的合理分配和利益的最大化。
古诺模型虽然在理论上提出了一种理性决策的博弈模型,但在实际应用中也存在一些局限性。
它假设所有的参与者都是理性的,即他们都会做出最优的策略选择。
在实际情况中,有些参与者可能受到其他因素的影响,比如情绪、认知偏差等,导致他们的决策不一定符合理性。
古诺模型只能描述静态的博弈过程,在动态博弈中往往需要考虑时间因素和信息的不完全性,这就需要借助其他更复杂的博弈模型来进行描述。
古诺模型在应用过程中需要准确地描述参与者的利益结构和策略空间,这在一些情况下可能非常困难,比如在复杂的经济系统中,参与者之间的关系可能非常复杂,很难准确地描述出他们的利益结构和策略选择。
纳什均衡的含义及应用纳什均衡是一种博弈论的概念,主要用于描述多方参与者在决策过程中,通过权衡自身利益和其他参与者的利益,达成一种相互协调的状态。
纳什均衡是由美国数学家约翰·纳什提出的,他在1950年代中期发表了关于非合作博弈的研究成果,为博弈论的发展做出了重要贡献。
在纳什均衡中,每个参与者根据其他参与者的策略选择,以最大化自己的利益为目标,而不考虑其他参与者的选择。
这种情况下,没有任何一方能够通过改变自己的策略获得更大利益,而参与者之间的策略选择形成一种稳定状态,这就是纳什均衡。
纳什均衡的应用非常广泛。
在经济学中,纳什均衡被用来分析市场竞争、战略合作等问题。
在市场竞争中,各家企业都会根据市场条件和对手的策略选择自己的定价和产量,通过纳什均衡分析可以预测市场的价格和供需关系。
在战略合作中,多方参与者需要通过协商决策达成一致,纳什均衡可以用来帮助找到最佳的合作策略。
此外,纳什均衡还被应用于政治学、社会学、生物学、心理学等领域。
在政治学中,纳什均衡可以用来分析选举竞争、国际关系等问题;在社会学中,纳什均衡可以用于研究人类社会的合作行为和冲突行为;在生物学中,纳什均衡可以用来解释生物进化中的竞争和合作现象;在心理学中,纳什均衡可以用来研究人类决策行为和合作意愿。
纳什均衡的研究也为决策理论提供了重要的思路。
传统的决策理论认为人们会根据最大期望效用准则进行决策,但纳什的研究表明,当存在多个参与者时,人们往往不仅会考虑自己的最大效用,还会考虑其他人的策略选择。
因此,纳什的研究为决策理论添加了一种新的分析维度。
总的来说,纳什均衡作为博弈论的核心概念,对多个参与者的决策行为和策略选择进行了深入研究,提供了一种分析方法和预测工具。
纳什均衡不仅在经济学中有广泛的应用,还在其他学科领域发挥着重要作用,对于理解和解决现实生活中的决策问题具有重要意义。
生活中纳什均衡例子
纳什均衡是博弈论中的一个概念,指在双方或多方进行博弈时,
当每个参与者都选择了最优策略后,游戏的结果已经达到了一个稳定
状态。
生活中,我们可以看到很多纳什均衡的例子。
1.超市降价促销:当超市降价促销时,消费者可以选择是抢购或
等待。
如果大多数人都抢购,那么超市就会获得更多的销售额;如果
消费者等待,那么超市可以考虑再次降价吸引消费者购买。
2.交通拥堵:在道路狭窄且车流量大的情况下,司机们可以选择
是慢行还是超车。
如果每个司机都选择了超车,那么道路的拥堵就会
更加严重;如果司机们都选择慢行,那么车流量就会更加平缓。
3.竞拍:在竞拍中,每个竞拍者都会选择自己认为是最高的出价。
如果竞拍者们都认为这个物品的价值很高,那么竞拍的价格就会越来
越高。
如果有人放弃竞拍,价格就会下降,直到达到平衡。
4.恋爱:在恋爱中,每个人都希望自己的感情得到回报。
如果两
个人都对对方很有感情,那么他们就会在一起;如果只有一个人喜欢
对方,那么他们就不会在一起。
这是一个常见的纳什均衡例子。
总之,纳什均衡是在人与人之间相互影响,相互制约下的一种结果。
只有当每个人都选择自己认为最优的策略,才能形成稳定的状态。
纳什均衡的原理与应用1. 纳什均衡的定义纳什均衡,又称为纳什平衡,是博弈论中的一个概念,由美国数学家约翰·纳什于1950年提出。
它是博弈论研究中的一个重要成果,揭示了多方参与的博弈中可能存在的平衡点。
2. 纳什均衡的原理纳什均衡的原理基于参与者在博弈中追求个人利益的假设,即每个参与者都会尽力追求自己的利益最大化。
在纳什均衡中,没有任何一个参与者可以通过改变自己的策略来提高自己的利益,而其他参与者保持不变。
3. 纳什均衡的应用纳什均衡具有广泛的应用领域,尤其在经济学、社会科学和工程领域中有重要的地位。
以下是一些纳什均衡的应用实例:• 3.1 经济学–拍卖机制:在拍卖中,卖家和买家之间的竞争决定了最终的价格。
纳什均衡理论可以帮助分析卖家和买家的策略选择,以及最终的价格形成。
–垄断定价:在垄断市场中,垄断者面临价格选择的问题。
纳什均衡可以帮助垄断者确定最优的价格策略。
• 3.2 社会科学–博弈论研究:纳什均衡是博弈论中的核心概念,用于描述多方博弈中的平衡点。
社会科学研究中,纳什均衡被广泛应用于对人类行为和决策的建模和原理研究。
–合作与竞争:纳什均衡理论可以帮助分析合作与竞争的关系。
在合作环境中,纳什均衡可以帮助确定最优的合作策略。
• 3.3 工程领域–交通流控制:纳什均衡理论可以用于交通流控制系统的设计,帮助优化交通流的分配和调度。
通过分析交通参与者的决策行为,可以建立交通流动的纳什均衡模型,从而提高交通系统的效率。
–电力市场:电力市场中的供求关系影响着电力价格的形成。
纳什均衡理论可以用于分析电力市场中各个参与者的策略选择,从而优化电力价格的形成。
4. 总结纳什均衡作为博弈论的重要成果,以其理论和应用的价值在经济学、社会科学和工程领域得到广泛的应用。
将纳什均衡理论应用于实际问题的分析中,可以帮助我们更好地理解和解决多方参与的博弈问题,从而提高决策的质量和效率。
以上是对纳什均衡的原理与应用的简要介绍,纳什均衡作为一个重要的博弈论概念,深入研究它的理论和应用,有助于我们更好地理解和改善现实生活中的各种博弈情境。
纳什均衡案例纳什均衡是博弈论中的一个重要概念,由约翰·纳什提出,用于描述博弈参与者之间的一种策略选择状态。
在这种状态下,每个参与者都知道其他参与者的策略选择,并且没有动机单方面改变自己的策略。
纳什均衡是一种稳定状态,当所有参与者都采取最优策略时,任何一方都没有动机改变自己的策略。
下面我们通过一个案例来具体了解纳什均衡的概念。
假设有两家冰淇淋店A和B,它们位于同一条街上,销售的冰淇淋口味和质量都是一样的。
每天下午4点,顾客会同时到两家店购买冰淇淋。
店家可以选择提高或降低价格,而顾客会选择到价格更便宜的店购买冰淇淋。
在这种情况下,我们来分析一下店家的最优策略选择。
首先,我们假设店家A提高了价格,而店家B保持不变,那么顾客肯定会选择到店家B购买冰淇淋,因为价格更便宜。
同理,如果店家B提高了价格,而店家A保持不变,顾客也会选择到店家A购买冰淇淋。
这说明在任何一家店提高价格的情况下,另一家店都会获得更多的顾客。
接着,我们假设店家A降低了价格,而店家B保持不变,那么顾客肯定会选择到店家A购买冰淇淋。
同理,如果店家B降低了价格,而店家A保持不变,顾客也会选择到店家B购买冰淇淋。
这说明在任何一家店降低价格的情况下,另一家店都会失去更多的顾客。
因此,我们可以得出结论,在这种情况下,店家A和店家B都会选择保持自己的价格不变,因为任何一家店单方面改变价格都无法获得更多的顾客,反而会失去顾客。
这种状态就是纳什均衡,即当每个参与者都知道其他参与者的策略选择,并且没有动机单方面改变自己的策略。
通过这个案例,我们可以更好地理解纳什均衡的概念。
在博弈论中,纳什均衡是一种重要的策略选择状态,它描述了参与者之间的稳定状态,当所有参与者都采取最优策略时,任何一方都没有动机改变自己的策略。
纳什均衡的概念不仅在经济学领域有着重要的应用,也在其他领域有着广泛的影响,如政治、生物学等领域都可以看到纳什均衡的身影。
总之,纳什均衡是博弈论中的一个重要概念,通过案例分析可以更好地理解其内涵和应用。
对策论的基本概念引言对策论是一种重要的决策理论,它在多个领域,包括经济学、政治学、管理学等方面都有广泛的应用。
本文将介绍对策论的基本概念,包括对策、对策矩阵、纳什均衡等内容。
对策的定义对策是指在决策过程中,一方的行动将受到另一方行动的影响,从而引发一系列后续行动的反应。
对策是一种针对不确定性情况下的最佳决策方法,通过预测对手的可能行动并制定相应的应对策略来实现最优效果。
对策通常涉及两个或多个决策者之间的互动。
在对策中,每个决策者都试图通过选择最优的行动来达到自己的目标,同时也要考虑到对手的行动。
对策矩阵是对策论分析的基本工具之一,用于描述对策者在不同行动下的收益情况。
对策矩阵通常以表格形式呈现,横轴代表一个决策者的行动,纵轴代表另一个决策者的行动,每个单元格中的数值表示在特定行动组合下各方的收益。
例如,考虑两个决策者A和B在某个游戏中的对策矩阵如下:行动1 行动2 行动3行动1 2, 2 0, 3 1, 1行动2 1, 0 3, 2 2, 1行动3 1, 1 2, 2 0, 3在这个对策矩阵中,每个单元格表示A和B在特定行动组合下的收益情况。
例如,当A选择行动1,B选择行动2时,A的收益为0,B 的收益为3。
纳什均衡是对策论中的一个重要概念,指的是在对策矩阵中,各方在给定对手行动的情况下,选择能够最大化自己收益的行动组合。
在对策矩阵中,如果不存在更好的选择来取代当前的行动组合,那么该组合就是一个纳什均衡。
在纳什均衡下,每个决策者都无法通过改变自己的行动来获得更好的结果。
以前面的对策矩阵为例,在该矩阵中,行动组合(行动1, 行动2)是一个纳什均衡,因为在这种情况下,A选择行动1,B选择行动2时,双方的收益已经达到最大化。
结论对策论是一种重要的决策理论,可以应用于各种领域,帮助我们理解和分析决策者之间的互动和冲突。
本文介绍了对策的基本概念,包括对策、对策矩阵和纳什均衡。
了解对策论的基本概念将有助于我们更好地理解和解决复杂的决策问题。
纳什均衡的定义和应用范围一、定义在不完全信息博弈当中,所有参与博弈的人策略构成一个策略组。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成,即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡又称为非合作博弈均衡,由美国数学家约翰·纳什在1950年提出,他的论文《Non-cooperative Games》奠定了现代博弈论的基础。
1994年,纳什因在博弈论领域的杰出贡献获得诺贝尔经济学奖。
纳什均衡描述了一种策略组合,在这种组合中,任何一个参与者都无法通过单方面改变自己的策略来获得更好的结果。
换句话说,当每个玩家都在使用纳什均衡中的策略时,没有人有动力去偏离自己的策略。
具体来说,在一个包含多个参与者的博弈中,如果每个参与者的策略都是对其他参与者策略的最佳回应,则这个策略组合称为纳什均衡。
二、纳什均衡的应用纳什均衡的应用非常广泛。
在经济学中,可用于帮助解释和预测市场竞争、拍卖设计和定价策略等行为。
在政治学中,可用于分析选举策略、联盟形成和国际关系中的策略选择。
在生物学中,进化博弈理论通过运用纳什均衡来解释动物行为和进化稳定策略。
在社会科学中,纳什均衡用于研究社会规范、合作行为和冲突解决机制。
此外,纳什均衡还在计算机科学中的网络设计、算法博弈论和多代理系统中应用广泛。
纳什均衡作为博弈论中的重要概念,指导着决策制定者在互动环境中做出理性选择的策略。
纳什均衡的应用不仅帮助我们理解和解释了许多现实世界中的决策行为,同时也为我们提供了指导理性决策的思路和方法。
我们可以进一步探索纳什均衡的变种形式和扩展应用,以更好地解决互动决策问题。
第三章纳什均衡第二章通过划线法和箭头法找出的具有稳定性的策略组合,不管是否唯一,都有一个共同的特性,就是其中的每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策。
在两方博弈的情况下,就是“给定你的策略,我的策略是我最好的策略;给定我的策略,你的策略也是你的最好的策略”。
事实上,具有这种性质的策略组合,正是非合作博弈理论中最重要的一个概念,即博弈中的“纳什均衡”。
本节要对这个概念的定义、部分重要性质和它在博弈分析中的作用等,进行一些讨论。
§3-1 纳什均衡的定义(P-52)因为纳什均衡在非合作博弈分析中具有十分关键的作用和地位,因此有必要给出它的一个较正式的定义。
定义:在一个博弈对局中,如果由各个博弈方策略空间的某一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略的组合的最佳对策,则称这个策略组合为该博弈的一个“纳什均衡”。
换言之,纳什均衡是这样一种状态,在该状态下每个参与方所采取的策略都是对于其他参与方的策略的最优反应。
以二人博弈为例,纳什均衡就是一个策略组合(甲的策略,乙的策略),甲的策略是对乙的策略的最优反应,而乙的策略也是对甲的策略的最优反应。
譬如,在囚徒困境博弈中,我们说(甲供认,乙供认)是一个纳什均衡,就因为它满足纳什均衡定义所要求的特性——甲供认是对乙供认的最优反应,而乙供认是对甲供认的最优反应。
换言之,在纳什均衡状态下,所有参与人都已选取其最优反应。
既然如此,我们就可以通过判断一个策略组合中的策略是否满足成为彼此的最优反应来确认它是否是纳什均衡。
囚徒困境中存在优势策略纳什均衡(两个人都选取优势策略),智猪博弈中有反复剔除劣势策略纳什均衡(一人有优势策略,另一人没有)。
但是,在很多的博弈中,所有参与人都没有优势策略(也就不可能有劣势策略)。
这种情况下,我们应如何求解它的纳什均衡呢?1、麦琪的礼物故事模型麦琪的礼物“博弈改编自欧·亨利的同名小说。
聪明人的对策及纳什均衡邱维元(复旦大学数学系教授,博士生导师)有一个激发学生智力的测试题目可能大家都知道。
老师拿了5顶帽子——3顶白帽子、2顶黑帽子——给3个聪明的学生看,然后让学生闭上眼睛,在每人头上戴上一顶白帽子,并将2顶黑帽子藏起来,每个学生只能看到另外两个学生头上的帽子,看不到自己头上的帽子。
问学生们能否猜出自己头上帽子的颜色?据说,这个问题是华罗庚先生在爱因斯坦提出的问题的基础上经过改进后提出的,也称为“华罗庚帽子问题”。
初一看问题似乎无解,每个学生看到另外两个学生戴的是白帽子,那么自己戴的可能是剩下的1个白帽子和2个黑帽子中的一个,无法确定自己头上帽子的颜色,因此他们都犹豫了。
但这是三个非常聪明的学生,不一会儿,他们不约而同地举手告诉老师猜到了自己头上所戴帽子的颜色。
他们是怎么做到的呢?假设三位学生是甲、乙、丙,学生甲假想自己头上戴的是黑帽子,那么学生乙将看到1黑1白两个帽子,在这种情况下乙就会很快知道自己戴的不可能是黑帽子,否则,学生丙将不假思索地立刻猜出自己戴的是白帽子。
现在乙和丙都在犹豫,不能马上猜出,说明他们看到甲戴的不是黑帽子,从而甲就能猜出自己戴的必定是白帽子。
同样,乙和丙也能猜出自己戴的是白帽子。
非常神奇把?看来聪明的学生能得出一般人认为不可能的结论。
上面的问题只是小学生奥数水平的问题,下面这个“海盗分金问题”稍微复杂些。
这个问题首先出现在1999年《科学美国人》杂志上。
传说有5个聪明的海盗,一同抢得了100个金币,要进行分赃。
这些海盗有严格的等级,按等级高低分别称他们为老大、老二、老三、老四和老五,他们的分配规则还算民主:先由等级最高的海盗提出一个分配方案,然后全体海盗投票决定是否接受方案,如果半数或半数以上的海盗同意,那么就按这个方案分配,否则就将提出方案的海盗扔到海里,由下一个等级最高的海盗重新提出分配方案,并继续投票,依此类推。
海盗们以下面的原则作出自己的决定:首先要保命,这当然是最重要的;其次要保证自己的利益最大化,即得到尽量多的金币;最后,在不损害自己利益的情况下,能够害人绝不会仁慈。
对策论中的纳什均衡应用
相对于对策论中的其他模型方法,博弈论是一种独特的处于各学科之间的
研究人类决策行为的方法,或者是研究人们在互动情况下所采取的策略,在现
实生活的选择中,我们会经常运用使用博弈去选择策略,无论是自觉的还是无
意识的。
本文主要探讨博弈博弈论中的纳什均衡在对策论中的应用,即在不确
定条件下,人们所冒的风险很大,这种情况选择合适的战略就显得尤为关键和
重要。
1.博弈论中的纳什均衡
以博弈论中,以经济主体人的自利行为以及相应的市场反应作为研究的出
发点,无论是消费者还是生产者,也无论是竞争形势还是垄断形势,基本上是
经济主体人面对市场做出自己的最优决策。
但是我们知道,作为主体人作出决
策时,不但要面对市场,还要面对作为竞争对手的其他经济主体,因此主体人
作出决策的后果,则是主体人自己的决策及竞争对手决策的共同的结果,这就
是博弈,它有一个前提,即理性人的假定。
纳什均衡是一种不确定条件下的博弈,即非合作、不完全信息下的博弈,
又叫做非合作博弈均衡,是博弈论的一个重要术语,因约翰·纳什而得名。
它的定义可以这样理解:假设有n个局中人参与博弈,在给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于、也可能不依赖于
他人的战略),从而使自己利益最大化。
所有局中人策略构成一个策略组合。
纳什均衡指的是这样一种策略组合:这种策略组合由所有参与人最优策略组成,即在给定另人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡,从
实质上是说是一种非合作博弈状态。
2.纳什均衡及其在对策论中的应用
2.1囚徒困境及其应用
博弈论中一个很著名的例子——囚徒困境,就是一具典型的纳什均衡。
两个小偷在行窃现场附近被抓获并被警方隔离拷问。
每个小偷都必须选择是否坦
白和揭发对方。
如果两个小偷都不坦白,他们都将判刑1年,如果每个小偷都
坦白并揭发对方,他们都将判刑10年,但是,如果一个坦白并揭发对方,而另
一个不坦白,那么与警方合作的小偷将被释放而另一个将判刑20年。
他们的支付矩阵如下:
乙
坦白不坦白
不坦白
运用相对优势策略画线法,可以知道它有两个纳什均衡(10,10)和(1,1)。
但是基于理性的前提假设,两个小偷符合自己利益的选择是坦白即(10,10),而对双方都有利的策略都不坦白而均只判刑1年的状况即(1,1)不会出现。
这就出现了“囚徒困境”,从而造成了个人利益和整体利益的冲突。
囚徒困境是现实生活中许多现象的抽象概括,有着广泛而深刻的意义。
许
多人、乃至许多国家,都曾深陷囚徒困境而无法自拔。
企业之间激烈的价格竞
争就是典型的囚徒困境,任何一个企业都以对方为敌手,只关心自己的利益。
在价格博弈中,如果以对方为敌手,就如同上述两个小偷一样始终认为自己选
择坦白是最佳决策一样,这就促使双方都采取低价策略。
如可口可乐和百事可
乐公司之间的价格竞争、各大航空公司之间的价格战等。
下面我看一个例子:1994年,默多克公司将《纽约邮报》的价格从40美分提高到50美分时,其主要竞争对手《每日新闻》没有跟着提价。
在将《纽约邮报》的价格调回到40美分之生,默多克公司宣布有意向将邮报价格降到25美分,《每日新闻》仍没有做任何响应。
于是,默多克公司将邮报在Saten岛这个试验市场上的价格降到
了25美分,此时其竞争对手《每日新闻》终于明白了对方的策略,将价格提高到50美分,没过多少,默多克公司也将价格重新提高至50美分。
默多克公司
本着“你要了解对方,也让竞争对手了解你”的原则避免了价格战。
由此可知,囚徒困境引起的价格战是可以避免的,想要让公司的策略为竞争对所明了,就
应向竞争对手清楚地表明合作态度,并对背叛行为进行以牙还牙的报复,那么
公司最终将会赢得竞争,而双方都将通过合作而大有收获。
2.2智猪博弈及其在现实中的应用
博弈论中还有个关于子博弈精炼纳什均衡的著名的例子——智猪博弈。
笼子里面
有两只猪,一只比较大,一只比较小。
笼子很长,一头有一个按钮,另一头是饮料的
出口和食槽。
按一下按钮,将有相当于10份的猪食进槽,但是按按钮以后跑到食槽所需要付出的“劳动”加起来要消耗相当于2份的猪食。
问题是按钮和食槽分置于笼子
的两端,按按钮的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
如果大猪先到,大猪吃到9份,小猪只能吃到1份;如果同时到达,大猪吃到7份,
小猪吃到3份;如果小猪先到,小猪可以吃到4份,而大猪吃到6份。
其支付矩阵为:
小猪
按开关等待
大猪等待
对于小猪而言,如果大猪选择按开关,那么其最佳选择是等待,如果大猪
选择等待,其最全选择仍是等待。
这样,无论什么情况小猪都应该选择等待,
因此等待就成为小猪的优势策略。
这种均衡称为重复剔除的优势均衡。
智猪博
弈中可以用在现实生活中,有助于我们降低风险寻找解决途径。
如中小企业很
少花钱去开发新产品,在技术创新市场上,大企业是大猪,其投入大量资金进
行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而
是等待大企业的新产品形成新的市场后模仿大企业的产品进行生产和销售,也
就是所谓的小猪搭便车行为。
企业选择做小猪搭便车,可以省去前期研发投入、避免市场销售不理想等
风险。
在某种新产品刚上市,其性能和功用还不为人所熟识的情况下,如果进
行新产品生产的不仅仅是一家企业,还有其他生产能力和销售能力更强的企业,那么,小企业完全没有必要首先投入大量资金做产品宣传,以达到和其他企业
品牌竞争并取得优势的目的。
腾讯公司成立于1988年11月,是目前中国第一、世界第三的互联网公司。
多年来,腾讯公司依托即时通讯工具QQ,实现在线
交流、搜索、娱乐、游戏、购物、支付等几乎所有的互联网服务。
联众是中国
最早做游戏平台的公司,一度占有在线棋牌游戏市场85﹪以上的市场份额,在新浪、搜狐等门户网站亏损缠身的时候,联众是最早实现赢利的中国互联网企业,一时风光无限。
2003年8月,腾讯QQ游戏第一个公开测试版本正式发布上经后很快超越了联众。
在淘宝网推出“招财进宝”业务时,马化腾看到C2C市场的广阔前景,于是推出腾讯拍拍的电子商务业务。
2010年3月初上线的美团网是国内第一家团财网站,创立仅仅4个月,美团网已经能够盈亏平衡。
但令创办人王兴没有想到的是,2010年7月9日,腾讯QQ团购网上线。
腾讯公司的源于其后发惯例——在决定某项新业务何时推出的时候,考虑的是如何半企业自身的学习周期与该产业的生命周期进行协调,形成一个比较稳妥的扩张节奏,保证企业始终在当前业务与未来扩张之间建立一种平衡,是一种明智的小猪行为。
在风险中选择对策,在对策中寻找优势策略、纳什均衡就是我们在生活中经常遇到的,找准优势策略选择合适的博弈策略可以使我们少走弯路,减少不要的风险。
参考文献
[1]徐玖平,胡能知.运筹学——数据﹒模型﹒决策[M].北京:科学出版社,2004 .
[2]王则柯.新编博弈论评话[M].北京:中信出版社,2003.
[3]格兰.走出“囚徒困境” [J].通信企业管理,2003.
[4]阳飞扬.最神奇的博弈定律 [M].北京:新世界出版社,2011.。