3 纳什均衡应用举例
- 格式:ppt
- 大小:505.00 KB
- 文档页数:17
纳什均衡的应用1.考虑不对称的古诺双头垄断,市场反需求函数为Q p -=115,A 企业生产的固定成本为1000,B 企业没有固定成本,A 和B 两个企业的可变成本分别为2a q 和2b q 。
(1)请写出A 公司的古诺反应函数的表达式。
(2)请写出B 公司的古诺反应函数的表达式。
(3)请求出纳什均衡时两个企业的产量和利润。
2.在贝特兰德模型中,假定每个企业的最大生产能力是K ,单位生产成本为c =10,需求为100,如果两个企业的价格相同,市场需求在二者之间平分;如果j i P P < (i ,j =1,2,i ≠j),企业i 产量为Min{100-P i ,K},企业j 的产量为Min[Max(0,100-P i -K),K](即只有低价企业不能满足需求时,高价企业才生产,并且产量不超过生产能力)。
(1)求企业的得益函数;(2)假定30<K<45,证明此博弈不存在纯策略纳什均衡。
3.考虑伯特兰德寡头模型。
假设需求函数为{}),2,1,(,,0),(21j i j i bq q M Max q q P j i i ≠=--=,其中商品是部分可替代的,即10<<b 。
证明:两商品的替代性越高,厂商获得的利润越少。
4.若企业1的需求函数为21211),(p p a p p q +-=,企业2的需求函数为12212),(p p a p p q +-=。
若假设两个企业的生产成本都为0,求纳什均衡。
5.如果在一条1千米长的长街上均匀居住着许多居民,有两个人同时想在该厂街开便利店。
(1)如果假设所有居民都是到最近的便利店购买商品,问这两个人会如何选择店面位置?(2)如果每户居民仍然到离得最近的便利店购买,但购买数量与他们到便利店的距离有关,如Q=1-D ,其中D 是购买量,D 是居民到便利店的距离,此时两个人会怎样选择店面的位置?6.假设两国间通过税收优惠吸引资本进入。
两国之间在税收制度上的差别不仅体现在税率的高低不同,而征收管理情况也有差异,如A 国纳税程序简便,而B 国可能相对要复杂一些。
三方博弈纳什均衡例题全文共四篇示例,供读者参考第一篇示例:三方博弈是博弈论中一种常见的情形,指的是有三方参与并且彼此之间存在竞争和合作关系的博弈情况。
纳什均衡是博弈论中的一个重要概念,指的是在博弈中每个玩家都做出最佳决策的情况下所达到的一个稳定状态。
在三方博弈中,如果存在某种情况下所有玩家都无法通过改变自身策略而获益,这种状态就是三方博弈的纳什均衡。
下面我们通过一个例子来说明三方博弈纳什均衡的概念。
假设有三位学生A、B、C参加了一个考试竞赛,在这个竞赛中,他们可以选择合作作弊,也可以选择正当的考试。
如果三位学生都选择正当考试,那么每个人都能得到10分的成绩;如果某一位学生作弊而其他两人选择正当考试,那么作弊的学生可以得到15分,而其他两人得0分;如果所有人都选择作弊,那么每个人只能得到5分。
同理,对于学生B和C来说,选择作弊也是更有利的策略。
第二篇示例:三方博弈是博弈论中的一个重要概念,指的是有三个各自独立的决策者同时做出决策的情况。
在三方博弈中,每个决策者都会考虑其他两方的利益和行为,以最大化自己的利益。
纳什均衡是博弈论中一个非常重要的概念,是指在一个博弈当中,每个参与者都选择了最优的行动策略,没有任何一方可以通过改变自己的策略来获得更好的结果。
下面我们来看一个关于三方博弈纳什均衡的例题。
假设有三个玩家A、B、C,他们在一个零和博弈中,并且每个玩家都只有两种可行的策略,分别是合作和背叛。
博弈的收益矩阵如下表所示:| | 合作| 背叛|| ---- | ------ | ------ || 合作| 3,3,3 | 1,4,4 || 背叛| 4,4,1 | 0,2,2 |在这个收益矩阵中,每个元素表示每个玩家在不同组合下的收益,例如当A、B、C都选择合作时,他们的收益分别是3,当A、B、C都选择背叛时,他们的收益分别是2。
现在我们来分析一下这个博弈的纳什均衡。
我们来看一下玩家A的最佳策略。
玩家A会根据其他两个玩家的策略来选择自己的策略,如果B、C都选择合作,那么玩家A选择背叛可以得到更高的收益4;如果B、C都选择背叛,那么玩家A也选择背叛可以得到更高的收益4。
每日一词:纳什均衡1、术语解释️纳什均衡Nash Equilibrium,是指非合作博弈中,所有的博弈当事人都维持自己的支配性策略的均衡状态。
值得说明的是,支配性策略是参与方各自的最优策略,但不一定是总体的最佳策略。
相关概念解释:合作博弈cooperative game:博弈双方达成一致意见,双方基于互相信任的前提下,按照事先约定的策略来做决策。
非合作博弈non-cooperative game:只考虑自己的利益,而不和别人串谋的情况下进行博弈。
支配性策略dominant strategy:对任何一个博弈参与方,无论对手方采取什么策略,自己都维持不变的策略。
支配性策略是参与方的占优策略。
(如备考,不管科目难易,都得认真学习,认真学习就是考生的支配性策略)纳什均衡的几个注意点:•是非合作博弈,不允许串谋。
•博弈当事人都是理性人。
•博弈各方是同时出招的。
•不是任何博弈都会产生纳什均衡的。
2、知识扩展纳什均衡的应用:囚徒困境Prisoners' Dilemma假设情景:AB都是小偷,被警察逮住了,逮住以后要判罪,但警察也没有其他证据。
警察就把AB分别关在两个小黑屋里,按下表所示逐个进行审问,然后根据两个人的招供结果来判罪。
警察是这么审问的:先去A那边问,你到底招不招,可以招可以不招,但是要想清楚后果。
如果你沉默,你兄弟也保持沉默,那关个半年就把你们放了。
如果你沉默,你兄弟坦白了,那你兄弟会立即释放,而你会被关10年。
如果你坦白,你兄弟保持沉默,你会被立即释放,而你兄弟会被关10年。
如果你坦白,你兄弟也坦白了,那就各关你们2年。
然后警察去了B那边,和B讲了同样的话。
然后警察暂时撤离,留他们自己思考。
A心里会嘀咕:B无非就两种选择,要么坦白,要么沉默。
B沉默时:如果我也沉默,我会被关半年,如果我坦白,我不会关。
所以我还是坦白好;B坦白时:如果我也坦白,会被关两年,如果我沉默,会被关10年。
所以我还是坦白好。
首先我们先简单看一下纳什均衡的经济学含义:所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
大家可以现有一个简单的印象,结合下面的案例再回来看这个定义。
案例一、智猪博弈猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。
对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。
反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
案例二、囚徒困境(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。
)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。
如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈A╲B坦白抵赖坦白-8,-80,-10抵赖-10,0-1,-1关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。
古诺寡头竞争模型有两个参与人,分别称为企业1和企业2;每个企业的战略是选择产量;支付是利润,它是两个企业产量的函数.我们用q i ∈[0,∞)代表第i 个企业的产量,C i (q i )代表成本函数,P =P (q 1+q 2)代表逆需求函数(P 是价格;Q (P )是原需求函数).第i 个企业的利润函数为: 2,1),()()(21=-+=i q C q q P q q i i i i π(*2*1,q q )是纳什均衡产量意味着)()(),(max arg 11*211*211*1q C q q P q q q q -+=∈π )()(),(max arg 222*12*12*21q C q q P q q q q -+=∈π 找出纳什均衡的一个办法是对每个企业的利润函数求一阶导数并令其等于0. 0)()()(1,121,12111=-+++=∂∂q C q q P q q q P q π 0)()()(2,221,22122=-+++=∂∂q C q q P q q q P q π 上述两个一阶条件分别定义了两个反应函数)(21*1q R q = )(12*2q R q = 反应函数意味着每个企业的最优战略(产量)是另一个企业产量的函数.两个反应函数的交叉点就是纳什均衡),(**2*1q q q =.为了得到更具体的结果,让我们来考虑上述模型的简单情况,假定每个企业具有相同的不变单位成本,即:c q q C c q q C 222111)(,)(==,需求函数取如下线性形式:P=a-(q 1+q 2).那么,最优化的一阶条件分别为:0)(0)(2212212111=--+-=∂∂=--+-=∂∂c q q q a q c q q q a q ππ就是说,j 每增加1个单位的产量,i 将减少1/2单位的产量. 解两个反应函数,我们得到纳什均衡为: )(31*2*1c a q q -==每个企业的纳什均衡利润分别为:2*2*12*2*11)(91),(),(c a q q q q -==ππ为了与垄断情况作比较,让我们计算一下垄断企业的最优产量和均衡利润.垄断企业的问题是:)(c Q a Q Max Q--=π容易算出,垄断企业的最优产量为)(32)(21*2*1*c a q q c a Q -=+<-=;垄断利润为22)(92)(41c a c a m ->-=π.寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己最优产产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应.这是典型的囚徒困境问题.例1:设某一市场有1,2两个厂商,它们生产相同的产品.设厂商1的产量为q 1,厂商2的产量q 2,则市场总产量为Q=q 1+q 2.设P 是市场出清价格(可以将产品全部卖出去的价格),则P 是市场总产量的函数P=P(Q)=8-Q .再设生两个厂商的生产都无固定成本,且每增加,且每增加一单位产量的边际生产成本相等 C 1=C 2=2,即它们分别生产q 1和q 2产量的成本分别为2q 1和2q 2.最后设这两个厂商是同时决定各自的产量的,即在决策之前不知道另一方的产量.上述问题构成的博弈中,博弈方为厂商1和厂商2.它们的策略空间都是由不同的产量组成,因为产量受生产能力的限制,因此理论上产量是有一个上限的,但如果假设产量是连续可分得,则它们各自都有无限多种可选策略.该博弈中两博弈方的得益自然是各自的利润,用u 老表示,即各自的销售收入减去各自的成本,根据给定情况,分别为212111211111162)](8[)(q q q q q q q q q C Q P q u --=-+-=-= 222122212222262)](8[)(q q q q q q q q q C Q P q u --=-+-=-=两博弈方的得益(利润)取决于双方的策略(产量).本博弈中两博弈方都有无限多种可选策略,因而无法得益矩阵表示该博弈,但纳什均衡的概念同样适用,即对于两博弈方的一个策略组合),(**2*1q q q =,只要其中*1q 和*2q 相互是对方策略的最佳对策,就是一个纳什均衡.并且如果可证实它是该博弈中唯一的纳什均衡,则它同样是博弈的解.因此本博弈, (*2*1,q q )的纳什均衡的充分必要条件是*2*1q q 、的最大值问题:)6(m a x21*2111q q q q q --和)6(max 22*1222q q q q q --的解. 因为求最大值的两个式子都是各自自变量的二次式,且二次项的系数都小于0,因此*1q 和*2q 只要能使它们各自对q 1和q 2的偏导数为0,就一定能实现它们的最大值. 026*1*2=--q q 026*2*1=--q q联立上两式,解得*1q =*2q =2,并且这是唯一的一组解.因此(2,2)是本博弈唯一的纳什均衡策略组合,也意味着它是本博弈的解.两个厂商将各生产2单位的产量,双方得益(利润)都为2⨯(8-4)-2⨯2=4,市场总产量为2+2=4,价格为8-4=4,两厂商的利润总和为4+4=8.上述是两个独立同时作产量决策,是按它们根据实现自身最大利益的原则行动而得到结果.那么这个结果究竟怎么样?两家厂商有没有真正实现自身的最大利益?从社会总体角度来看效率又如何?如果现在以总体利益目标的.如果现在以总体利益为目标来考虑市场的最佳产量,结果会有怎样的不同呢?首先可以根据市场的条件求出实现最大总得益的总产量.设总产量为Q,则总得益U=QP(Q)-2Q=6Q-Q 2很容易求得使总得益最大的总产量3*=Q ,最大总得益9*=u .将此结果与两个厂商独立决策、只追求自身利益时相比,总产量较小,而总利润却较高。
三方博弈纳什均衡例题博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论。
在博弈论中,当参与博弈的决策主体超过两个时,我们称之为多方博弈。
纳什均衡是博弈论中的一个核心概念,它描述的是在给定其他参与者策略的情况下,每个参与者都选择自己的最优策略,从而使得所有参与者的策略构成一个稳定的状态。
下面,我们将通过一个具体的三方博弈的例子来详细解析纳什均衡的概念和应用。
例题:假设有三个公司A、B、C分别生产同类产品,并且它们的市场份额相当。
为了扩大自己的市场份额,每个公司都有两种策略可以选择:增加产量(进攻策略)或减少产量(保守策略)。
这三个公司的决策是相互影响的,每个公司的策略都会对其他两个公司的市场份额产生影响。
1.如果所有公司都选择增加产量,由于市场竞争的加剧,每个公司的市场份额都会下降,假设每个公司的收益都为-1(表示市场份额下降,收益减少)。
2.如果所有公司都选择减少产量,由于市场供应减少,每个公司的市场份额都会上升,假设每个公司的收益都为1(表示市场份额上升,收益增加)。
3.如果其中两家公司选择增加产量,而另一家公司选择减少产量,那么增加产量的两家公司的市场份额会略有上升,而减少产量的公司的市场份额会大幅下降。
假设增加产量的公司的收益为0,减少产量的公司的收益为-2。
4.如果其中两家公司选择减少产量,而另一家公司选择增加产量,那么增加产量的公司的市场份额会大幅增加,而减少产量的两家公司的市场份额会略有下降。
假设增加产量的公司的收益为2,减少产量的公司的收益为0。
基于以上情况,我们可以构建如下的收益矩阵:现在,我们来分析这个三方博弈的纳什均衡。
首先,我们考虑公司A的选择。
如果B和C都选择增加产量(策略为进攻),那么A的最优策略是减少产量(保守策略),因为这样可以避免市场份额的大幅下降。
如果B和C都选择减少产量(策略为保守),那么A的最优策略是增加产量(进攻策略),因为这样可以抓住市场机会增加自己的市场份额。
古诺寡头竞争模型有两个参与人,分别称为企业1和企业2;每个企业的战略是选择产量;支付是利润,它是两个企业产量的函数.我们用q i ∈[0,∞)代表第i 个企业的产量,C i (q i )代表成本函数,P =P (q 1+q 2)代表逆需求函数(P 是价格;Q (P )是原需求函数).第i 个企业的利润函数为:2,1),()()(21=-+=i q C q q P q q i i i i π(*2*1,q q )是纳什均衡产量意味着 )()(),(max arg 11*211*211*1q C q q P q q q q -+=∈π)()(),(max arg 222*12*12*21q C q q P q q q q -+=∈π 找出纳什均衡的一个办法是对每个企业的利润函数求一阶导数并令其等于0.0)()()(1,121,12111=-+++=∂∂q C q q P q q q P q π 0)()()(2,221,22122=-+++=∂∂q C q q P q q q P q π 上述两个一阶条件分别定义了两个反应函数)(21*1q R q = )(12*2q R q = 反应函数意味着每个企业的最优战略(产量)是另一个企业产量的函数.两个反应函数的交叉点就是纳什均衡),(**2*1q q q =.为了得到更具体的结果,让我们来考虑上述模型的简单情况,假定每个企业具有相同的不变单位成本,即:c q q C c q q C 222111)(,)(==,需求函数取如下线性形式:P=a-(q 1+q 2).那么,最优化的一阶条件分别为:0)(0)(2212212111=--+-=∂∂=--+-=∂∂c q q q a q c q q q a q ππ就是说,j 每增加1个单位的产量,i 将减少1/2单位的产量.解两个反应函数,我们得到纳什均衡为:)(31*2*1c a q q -== 每个企业的纳什均衡利润分别为:2*2*12*2*11)(91),(),(c a q q q q -==ππ 为了与垄断情况作比较,让我们计算一下垄断企业的最优产量和均衡利润.垄断企业的问题是:)(c Q a Q Max Q--=π 容易算出,垄断企业的最优产量为)(32)(21*2*1*c a q q c a Q -=+<-=; 垄断利润为22)(92)(41c a c a m ->-=π. 寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己最优产产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应.这是典型的囚徒困境问题.例1:设某一市场有1,2两个厂商,它们生产相同的产品.设厂商1的产量为q 1,厂商2的产量q 2,则市场总产量为Q=q 1+q 2.设P 是市场出清价格(可以将产品全部卖出去的价格),则P 是市场总产量的函数P=P(Q)=8-Q .再设生两个厂商的生产都无固定成本,且每增加,且每增加一单位产量的边际生产成本相等 C 1=C 2=2,即它们分别生产q 1和q 2产量的成本分别为2q 1和2q 2.最后设这两个厂商是同时决定各自的产量的,即在决策之前不知道另一方的产量.上述问题构成的博弈中,博弈方为厂商1和厂商2.它们的策略空间都是由不同的产量组成,因为产量受生产能力的限制,因此理论上产量是有一个上限的,但如果假设产量是连续可分得,则它们各自都有无限多种可选策略.该博弈中两博弈方的得益自然是各自的利润,用u 老表示,即各自的销售收入减去各自的成本,根据给定情况,分别为212111*********)](8[)(q q q q q q q q q C Q P q u --=-+-=-=222122212222262)](8[)(q q q q q q q q q C Q P q u --=-+-=-=两博弈方的得益(利润)取决于双方的策略(产量).本博弈中两博弈方都有无限多种可选策略,因而无法得益矩阵表示该博弈,但纳什均衡的概念同样适用,即对于两博弈方的一个策略组合),(**2*1q q q =,只要其中*1q 和*2q 相互是对方策略的最佳对策,就是一个纳什均衡.并且如果可证实它是该博弈中唯一的纳什均衡,则它同样是博弈的解.因此本博弈, (*2*1,q q )的纳什均衡的充分必要条件是*2*1q q 、的最大值问题:)6(max 21*2111q q q q q --和)6(max 22*1222q q q q q --的解. 因为求最大值的两个式子都是各自自变量的二次式,且二次项的系数都小于0,因此*1q 和*2q 只要能使它们各自对q 1和q 2的偏导数为0,就一定能实现它们的最大值.026*1*2=--q q 026*2*1=--q q 联立上两式,解得*1q =*2q =2,并且这是唯一的一组解.因此(2,2)是本博弈唯一的纳什均衡策略组合,也意味着它是本博弈的解.两个厂商将各生产2单位的产量,双方得益(利润)都为2⨯(8-4)-2⨯2=4,市场总产量为2+2=4,价格为8-4=4,两厂商的利润总和为4+4=8.上述是两个独立同时作产量决策,是按它们根据实现自身最大利益的原则行动而得到结果.那么这个结果究竟怎么样?两家厂商有没有真正实现自身的最大利益?从社会总体角度来看效率又如何?如果现在以总体利益目标的.如果现在以总体利益为目标来考虑市场的最佳产量,结果会有怎样的不同呢?首先可以根据市场的条件求出实现最大总得益的总产量.设总产量为Q,则总得益U=QP(Q)-2Q=6Q-Q 2很容易求得使总得益最大的总产量3*=Q ,最大总得益9*=u .将此结果与两个厂商独立决策、只追求自身利益时相比,总产量较小,而总利润却较高。
生活中纳什均衡例子
纳什均衡是博弈论中的一个概念,指在双方或多方进行博弈时,
当每个参与者都选择了最优策略后,游戏的结果已经达到了一个稳定
状态。
生活中,我们可以看到很多纳什均衡的例子。
1.超市降价促销:当超市降价促销时,消费者可以选择是抢购或
等待。
如果大多数人都抢购,那么超市就会获得更多的销售额;如果
消费者等待,那么超市可以考虑再次降价吸引消费者购买。
2.交通拥堵:在道路狭窄且车流量大的情况下,司机们可以选择
是慢行还是超车。
如果每个司机都选择了超车,那么道路的拥堵就会
更加严重;如果司机们都选择慢行,那么车流量就会更加平缓。
3.竞拍:在竞拍中,每个竞拍者都会选择自己认为是最高的出价。
如果竞拍者们都认为这个物品的价值很高,那么竞拍的价格就会越来
越高。
如果有人放弃竞拍,价格就会下降,直到达到平衡。
4.恋爱:在恋爱中,每个人都希望自己的感情得到回报。
如果两
个人都对对方很有感情,那么他们就会在一起;如果只有一个人喜欢
对方,那么他们就不会在一起。
这是一个常见的纳什均衡例子。
总之,纳什均衡是在人与人之间相互影响,相互制约下的一种结果。
只有当每个人都选择自己认为最优的策略,才能形成稳定的状态。
博弈论中的纳什均衡-教案一、引言1.1博弈论的基本概念1.1.1博弈论的定义:博弈论是研究具有冲突和合作特点的决策制定过程。
1.1.2博弈论的应用:经济学、政治学、心理学等领域。
1.1.3博弈论的重要性:帮助理解竞争和合作中的决策行为。
1.1.4博弈论的局限性:假设理性人行为,实际中存在非理性行为。
1.2纳什均衡的提出1.2.2纳什均衡的意义:预测博弈结果,分析策略选择。
1.2.3纳什均衡的挑战:存在多个纳什均衡,选择合适的均衡。
1.2.4纳什均衡的应用:经济学、社会学、生物学等领域。
1.3教学目标和结构1.3.1教学目标:理解博弈论的基本概念,掌握纳什均衡的原理和应用。
1.3.3教学方法:讲授、案例分析、小组讨论。
1.3.4教学评估:课堂参与、案例分析报告、期末考试。
二、知识点讲解2.1博弈论的基本要素2.1.1参与者:博弈中的决策主体。
2.1.2策略:参与者可选择的行动方案。
2.1.3支付函数:参与者选择不同策略所得到的收益。
2.1.4结果:博弈的最终状态。
2.2纳什均衡的求解方法2.2.1纯策略纳什均衡:参与者选择确定的策略。
2.2.2混合策略纳什均衡:参与者以一定概率选择不同的策略。
2.2.3反复剔除劣势策略:通过剔除劣势策略找到纳什均衡。
2.2.4最佳响应动态:分析参与者对其他参与者策略的最佳响应。
2.3纳什均衡的应用实例2.3.1囚徒困境:两个囚犯选择合作或背叛的策略。
2.3.2鹰鸽博弈:参与者选择攻击或退让的策略。
2.3.3公地悲剧:多个参与者共享资源时的策略选择。
2.3.4供应链协调:供应商和零售商之间的策略选择。
三、教学内容3.1博弈论的基本模型3.1.1零和博弈:参与者的收益和损失相加为零。
3.1.2非零和博弈:参与者的收益和损失不相加为零。
3.1.3完美信息博弈:参与者了解其他参与者的策略和支付。
3.1.4不完美信息博弈:参与者不了解其他参与者的策略和支付。
3.2纳什均衡的性质和分类3.2.1稳定性:在纳什均衡下,参与者没有改变策略的动机。
论日常生活中的“纳什均衡”“囚徒困境”是非合作博弈的均衡即“纳什均衡”的最经典的例子。
从这个例子,我们能知道“纳什均衡”的精要所在。
本文从“囚徒困境”案例出发,总结出“纳什均衡”的原理,并由此去探寻日常生活中的非合作博弈。
1950年和 1951年纳什的两篇关于非合作博弈的重要论文,彻底改变了人们对竞争和市场的看法。
他证明了非合作博弈极其均衡解,并证明了均衡解的存在性,即著名的“纳什均衡”,从而揭示了博弈均衡与经济均衡的内在联系奠定了现代非合作博弈论的基石。
要了解纳什均衡,首先要知道什么是非合作博弈问题。
“囚徒困境”是该问题最经典的例子,我们也从该例为切入点进行探讨:首先,一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。
“囚徒困境”:两个嫌疑犯(A和 B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判 1O年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯 A和 B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:A和 B均坦白或均不坦白、A坦白 B不坦白或者 B 坦白A不坦白,是博弈的结果。
在此,两个嫌疑犯 A和 B面临着两难的选择——坦白或抵赖。
显然最好的策略是双方都抵赖,结果是大家都只被判 1年。
但由于两人处于隔离情况下无法串供。
所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。
因为坦白交代可以期望得到最好的解决办法——释放,但前提是同伙抵赖,显然要比自己抵赖要坐 1O年牢好得多。
好的纳什均衡例子纳什均衡是博弈论中的概念,描述了一种博弈参与者在给定其他参与者策略的情况下,无法通过单方面改变自己策略来获得更好结果的状态。
下面我将介绍一个好的纳什均衡的例子。
假设有两个企业A和B,在同一个市场上销售某种商品。
他们可以选择定价高或者定价低两种策略。
下面是他们的收益矩阵:定价高定价低定价高 (5, 5) (0, 6)定价低 (6, 0) (3, 3)在这个例子中,每个元组(a, b)表示企业A选择定价策略a,企业B选择定价策略b时的收益情况。
例如,如果企业A选择定价高(a=定价高),企业B选择定价高(b=定价高),则企业A和企业B的收益分别为5。
我们可以通过分析这个收益矩阵来找到纳什均衡。
纳什均衡是指在给定其他参与者策略的情况下,每个参与者无法通过改变自己的策略来获得更好结果的状态。
首先,我们看到当企业A选择定价高时,企业B的最佳策略是选择定价高,因为收益为5,而选择定价低只能获得3的收益。
同样地,当企业A选择定价低时,企业B的最佳策略也是选择定价低,因为收益为6,而选择定价高只能获得0的收益。
因此,无论企业A选择定价高还是定价低,企业B都会选择定价低。
同样地,企业B的最佳策略也是选择定价低。
如果企业B选择定价高,企业A的最佳策略是选择定价高,因为收益为5,而选择定价低只能获得0的收益。
因此,无论企业B选择定价高还是定价低,企业A都会选择定价高。
综上所述,(定价高,定价低)是这个博弈的纳什均衡。
在这个均衡状态下,两家企业都无法通过改变自己的策略来获得更好的收益。
这个例子展示了纳什均衡的概念和应用。
在博弈论中,纳什均衡是一种重要的分析工具,可以帮助我们理解和预测各种博弈情景下不同参与者的策略选择和结果。
在实际应用中,纳什均衡可以用于分析市场竞争、决策制定、资源分配等各种博弈情况。
纳什均衡案例
纳什均衡是指博弈论中的一种平衡状态,它是指在博弈中每个参与者都选择了最佳的策略并且没有人愿意改变自己的策略。
下面是几个纳什均衡的案例:
1. 餐馆竞争:假设有两家在同一地区经营相同类型餐馆的商家,他们都可以选择提供更好的餐饮服务或者降低价格来吸引更多的顾客。
如果两家商家都选择提供更好的餐饮服务,那么他们就会处于纳什均衡状态,因为如果其中一家降低价格,顾客可能会前往该店,但是该店会失去利润。
2. 囚徒困境:在这个案例中,两个囚犯被逮捕并被分开审讯。
如果他们都选择拒绝认罪,那么他们将面临较轻的刑罚,但如果其中一个人认罪并作证控告另一个人,那么被控告的人将面临更严重的刑罚。
在这种情况下,如果每个囚犯都选择认罪,那么他们就处于纳什均衡状态,因为即使其中一个人拒绝认罪,他也可能面临更严重的刑罚。
3. 投标竞争:在这个案例中,几个公司竞标一个项目,他们必须决定如何投标以获得合同。
如果所有公司都选择报一个高价,那么他们将失去竞标的机会,但如果所有公司都选择报一个较低的价格,那么获得合同的公司将无法盈利。
在这种情况下,如果每个公司都选择中等价格的投标,那么他们就处于纳什均衡状态,因为这样可以最大限度地获得合同并保持盈利。
- 1 -。
纳什均衡案例奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。
纳什在与命运的博弈中找到均衡,纪念大师最好的方式就是尝试了解博弈论。
纳什均衡的应用是多领域的。
而事实上,从日常生活中可以找到很多纳什均衡的经典案例,让我们普通人也可以尝试了解一下这一世界级的发现和理论!首先我们先简单看一下纳什均衡的经济学含义:所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
大家可以现有一个简单的印象,结合下面的案例再回来看这个定义。
案例一、智猪博弈猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。
对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。
反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
案例二、囚徒困境(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。
)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。