纳什均衡举例4公地悲剧
- 格式:doc
- 大小:42.50 KB
- 文档页数:3
纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
[编辑]关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。
实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。
然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。
阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。
它发展了本身很有意义的n人有限非合作博弈的概念和性质。
并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。
在概念和方法两方面,该论文都是作者的独立创造。
”[编辑]在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
纳什均衡又称为非合作博弈均衡,是博弈论的一个重要术语,它是以美国数学家、日后成为电影《美丽心灵》主人公的纳什的名字命名的。
首先我们先简单看一下纳什均衡的经济学含义:所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
大家可以现有一个简单的印象,结合下面的案例再回来看这个定义。
案例一、智猪博弈猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。
对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。
反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
案例二、囚徒困境(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。
)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。
如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈A╲B坦白抵赖坦白-8,-80,-10抵赖-10,0-1,-1关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。
纳什均衡原理
纳什均衡,英文是 Nash Equilibrium,也有人叫它“非合作均衡”、“非合作博弈均衡”,它是一个比较抽象的概念,需要运用数学的知识才能理解。
纳什均衡是指在一个博弈中,每一个人在做选择时都不能确定其他人是否会做同样的选择。
这个时候,如果一方做出了某种选择,那么另一方就会做出相应的反应。
这个反应的结果,就是双方都选择了一种对自己最有利的行为。
比如在博弈论中有这样一个例子:两个人在玩猫捉老鼠游戏,一个人是猫,另一个人是老鼠。
这个时候如果两个人都不敢抓老鼠,因为如果抓了老鼠的话,那他们俩都会被关进笼子里;如果两个人都抓老鼠的话,那他们俩都会被关进笼子里;但是如果两个人都不抓老鼠的话,那么他们俩都会被关进笼子里。
那么结果是怎样呢?这就是纳什均衡的结果。
在这个游戏中,如果只有一个人选择了不抓老鼠的话,那就只有他自己被关进笼子里;如果两个人都选择了不抓老鼠的话,那就是他们两个都被关进笼子里。
—— 1 —1 —。
生活中纳什均衡例子
纳什均衡是博弈论中的一个概念,指在双方或多方进行博弈时,
当每个参与者都选择了最优策略后,游戏的结果已经达到了一个稳定
状态。
生活中,我们可以看到很多纳什均衡的例子。
1.超市降价促销:当超市降价促销时,消费者可以选择是抢购或
等待。
如果大多数人都抢购,那么超市就会获得更多的销售额;如果
消费者等待,那么超市可以考虑再次降价吸引消费者购买。
2.交通拥堵:在道路狭窄且车流量大的情况下,司机们可以选择
是慢行还是超车。
如果每个司机都选择了超车,那么道路的拥堵就会
更加严重;如果司机们都选择慢行,那么车流量就会更加平缓。
3.竞拍:在竞拍中,每个竞拍者都会选择自己认为是最高的出价。
如果竞拍者们都认为这个物品的价值很高,那么竞拍的价格就会越来
越高。
如果有人放弃竞拍,价格就会下降,直到达到平衡。
4.恋爱:在恋爱中,每个人都希望自己的感情得到回报。
如果两
个人都对对方很有感情,那么他们就会在一起;如果只有一个人喜欢
对方,那么他们就不会在一起。
这是一个常见的纳什均衡例子。
总之,纳什均衡是在人与人之间相互影响,相互制约下的一种结果。
只有当每个人都选择自己认为最优的策略,才能形成稳定的状态。
纳什均衡案例纳什均衡是博弈论中的一个重要概念,由约翰·纳什提出,用于描述博弈参与者之间的一种策略选择状态。
在这种状态下,每个参与者都知道其他参与者的策略选择,并且没有动机单方面改变自己的策略。
纳什均衡是一种稳定状态,当所有参与者都采取最优策略时,任何一方都没有动机改变自己的策略。
下面我们通过一个案例来具体了解纳什均衡的概念。
假设有两家冰淇淋店A和B,它们位于同一条街上,销售的冰淇淋口味和质量都是一样的。
每天下午4点,顾客会同时到两家店购买冰淇淋。
店家可以选择提高或降低价格,而顾客会选择到价格更便宜的店购买冰淇淋。
在这种情况下,我们来分析一下店家的最优策略选择。
首先,我们假设店家A提高了价格,而店家B保持不变,那么顾客肯定会选择到店家B购买冰淇淋,因为价格更便宜。
同理,如果店家B提高了价格,而店家A保持不变,顾客也会选择到店家A购买冰淇淋。
这说明在任何一家店提高价格的情况下,另一家店都会获得更多的顾客。
接着,我们假设店家A降低了价格,而店家B保持不变,那么顾客肯定会选择到店家A购买冰淇淋。
同理,如果店家B降低了价格,而店家A保持不变,顾客也会选择到店家B购买冰淇淋。
这说明在任何一家店降低价格的情况下,另一家店都会失去更多的顾客。
因此,我们可以得出结论,在这种情况下,店家A和店家B都会选择保持自己的价格不变,因为任何一家店单方面改变价格都无法获得更多的顾客,反而会失去顾客。
这种状态就是纳什均衡,即当每个参与者都知道其他参与者的策略选择,并且没有动机单方面改变自己的策略。
通过这个案例,我们可以更好地理解纳什均衡的概念。
在博弈论中,纳什均衡是一种重要的策略选择状态,它描述了参与者之间的稳定状态,当所有参与者都采取最优策略时,任何一方都没有动机改变自己的策略。
纳什均衡的概念不仅在经济学领域有着重要的应用,也在其他领域有着广泛的影响,如政治、生物学等领域都可以看到纳什均衡的身影。
总之,纳什均衡是博弈论中的一个重要概念,通过案例分析可以更好地理解其内涵和应用。
公地悲剧的数理推导主要基于数学建模和博弈论。
首先,假设有一个公共资源,例如一片草地,每个牧羊人都可以在这片草地上放牧。
每个牧羊人都有两个选择:放牧或休息。
如果一个牧羊人选择放牧,他可以从这片草地上获得一定量的收益,但同时也会对草地造成一定的损害。
如果所有的牧羊人都选择放牧,那么这片草地可能会被过度使用,导致草地退化甚至消失,所有牧羊人都无法获得收益。
为了简化问题,假设只有两个牧羊人,他们都希望最大化自己的收益。
每个牧羊人的收益函数可以表示为:收益= 如果草地状况好则放牧的收益-如果草地状况差则放牧的收益-如果草地状况好则休息的收益+ 如果草地状况差则休息的收益根据这个收益函数,我们可以建立以下博弈矩阵:在这个博弈矩阵中,每个格子中的数字表示两个牧羊人的收益。
例如,当两个牧羊人都选择放牧时,草地状况变差,但每个牧羊人都能获得一定的收益(+1)。
当一个牧羊人选择放牧而另一个选择休息时,草地状况变好,但选择放牧的牧羊人获得更大的收益(+1),而选择休息的牧羊人获得较小的收益(-1)。
当两个牧羊人都选择休息时,草地状况变差,但每个牧羊人都获得一定的收益(虽然比放牧时的收益小)。
通过分析这个博弈矩阵,我们可以发现这是一个典型的囚徒困境。
无论对方如何选择,自己选择放牧都是最优策略。
然而,如果两个牧羊人都选择放牧,草地状况会变差,导致所有人的收益都降低。
因此,这个博弈没有纯策略纳什均衡,但存在一个混合策略纳什均衡。
在这个均衡中,每个牧羊人都有一定概率选择放牧和休息,这取决于草地状况的不确定性以及其他因素的影响。
公地悲剧的数理推导表明,当资源是公共的且没有有效的管理制度时,个体理性可能会导致集体非理性。
为了解决这个问题,需要引入外部力量来管理公共资源,或者通过制度设计来激励个体采取更有利于集体的行为。
纳什均衡案例纳什均衡是博弈论中的一个重要概念,由美国数学家约翰·纳什提出。
它指的是在博弈过程中,每个参与者都假设其他参与者的策略保持不变的情况下,选择自己的最佳策略。
在这种情况下,每个参与者的策略都是最优的,没有人会因改变自己的策略而获得更好的结果。
纳什均衡的概念在经济学、政治学、生物学等领域都有广泛的应用。
一个经典的纳什均衡案例是《囚徒困境》。
在这个案例中,两个囚犯被捕,但警察缺乏直接证据定罪他们。
如果两人都保持沉默,他们都只会被判刑1年;如果其中一个人供出另一个人,供出的人将免于刑罚,而另一个人将被判刑3年;如果两人都供出对方,他们将被判刑2年。
在这个案例中,每个囚犯都要考虑另一个囚犯的选择来决定自己的最佳策略。
如果对方保持沉默,供出对方将是最优选择;如果对方供出自己,供出对方也是最优选择。
因此,最终的结果是两人都供出对方,导致最坏的结果出现。
另一个经典的纳什均衡案例是《合作博弈》。
在这个案例中,两个玩家可以选择合作或者背叛对方。
如果两个玩家都选择合作,他们将获得较好的回报;如果一个玩家选择背叛而另一个选择合作,背叛的玩家将获得最大的回报,而合作的玩家将获得最小的回报;如果两个玩家都选择背叛,他们将获得较差的回报。
在这个案例中,每个玩家都需要考虑对方的选择来决定自己的最佳策略。
最终的结果是两个玩家都选择背叛,导致最坏的结果出现。
纳什均衡在现实生活中也有许多应用。
比如在市场竞争中,每家企业都需要考虑其他企业的策略来决定自己的最佳策略;在国际关系中,每个国家都需要考虑其他国家的行为来决定自己的最佳行动。
在这些情况下,纳什均衡可以帮助人们理解和预测各种复杂的博弈情况。
总之,纳什均衡是博弈论中的重要概念,它可以帮助人们理解各种博弈情况下参与者的最佳策略。
通过分析每个参与者的选择和利益,可以找到博弈的最优解。
然而,纳什均衡并不一定是最好的结果,有时候参与者可以通过合作和协商来达到更好的结果。
纳什均衡案例
纳什均衡是指博弈论中的一种平衡状态,它是指在博弈中每个参与者都选择了最佳的策略并且没有人愿意改变自己的策略。
下面是几个纳什均衡的案例:
1. 餐馆竞争:假设有两家在同一地区经营相同类型餐馆的商家,他们都可以选择提供更好的餐饮服务或者降低价格来吸引更多的顾客。
如果两家商家都选择提供更好的餐饮服务,那么他们就会处于纳什均衡状态,因为如果其中一家降低价格,顾客可能会前往该店,但是该店会失去利润。
2. 囚徒困境:在这个案例中,两个囚犯被逮捕并被分开审讯。
如果他们都选择拒绝认罪,那么他们将面临较轻的刑罚,但如果其中一个人认罪并作证控告另一个人,那么被控告的人将面临更严重的刑罚。
在这种情况下,如果每个囚犯都选择认罪,那么他们就处于纳什均衡状态,因为即使其中一个人拒绝认罪,他也可能面临更严重的刑罚。
3. 投标竞争:在这个案例中,几个公司竞标一个项目,他们必须决定如何投标以获得合同。
如果所有公司都选择报一个高价,那么他们将失去竞标的机会,但如果所有公司都选择报一个较低的价格,那么获得合同的公司将无法盈利。
在这种情况下,如果每个公司都选择中等价格的投标,那么他们就处于纳什均衡状态,因为这样可以最大限度地获得合同并保持盈利。
- 1 -。
纳什均衡案例奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。
纳什在与命运的博弈中找到均衡,纪念大师最好的方式就是尝试了解博弈论。
纳什均衡的应用是多领域的。
而事实上,从日常生活中可以找到很多纳什均衡的经典案例,让我们普通人也可以尝试了解一下这一世界级的发现和理论!首先我们先简单看一下纳什均衡的经济学含义:所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
大家可以现有一个简单的印象,结合下面的案例再回来看这个定义。
案例一、智猪博弈猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。
对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。
反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
案例二、囚徒困境(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。
)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。
古诺寡头竞争模型有两个参与人,分别称为企业1和企业2;每个企业的战略是选择产量;支付是利润,它是两个企业产量的函数.我们用q i ∈[0,∞)代表第i 个企业的产量,C i (q i )代表成本函数,P =P (q 1+q 2)代表逆需求函数(P 是价格;Q (P )是原需求函数).第i 个企业的利润函数为: 2,1),()()(21=-+=i q C q q P q q i i i i π(*2*1,q q )是纳什均衡产量意味着)()(),(max arg 11*211*211*1q C q q P q q q q -+=∈π )()(),(max arg 222*12*12*21q C q q P q q q q -+=∈π 找出纳什均衡的一个办法是对每个企业的利润函数求一阶导数并令其等于0. 0)()()(1,121,12111=-+++=∂∂q C q q P q q q P q π 0)()()(2,221,22122=-+++=∂∂q C q q P q q q P q π 上述两个一阶条件分别定义了两个反应函数)(21*1q R q = )(12*2q R q = 反应函数意味着每个企业的最优战略(产量)是另一个企业产量的函数.两个反应函数的交叉点就是纳什均衡),(**2*1q q q =.为了得到更具体的结果,让我们来考虑上述模型的简单情况,假定每个企业具有相同的不变单位成本,即:c q q C c q q C 222111)(,)(==,需求函数取如下线性形式:P=a-(q 1+q 2).那么,最优化的一阶条件分别为:0)(0)(2212212111=--+-=∂∂=--+-=∂∂c q q q a q c q q q a q ππ就是说,j 每增加1个单位的产量,i 将减少1/2单位的产量. 解两个反应函数,我们得到纳什均衡为: )(31*2*1c a q q -==每个企业的纳什均衡利润分别为:2*2*12*2*11)(91),(),(c a q q q q -==ππ为了与垄断情况作比较,让我们计算一下垄断企业的最优产量和均衡利润.垄断企业的问题是:)(c Q a Q Max Q--=π容易算出,垄断企业的最优产量为)(32)(21*2*1*c a q q c a Q -=+<-=;垄断利润为22)(92)(41c a c a m ->-=π.寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己最优产产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应.这是典型的囚徒困境问题.例1:设某一市场有1,2两个厂商,它们生产相同的产品.设厂商1的产量为q 1,厂商2的产量q 2,则市场总产量为Q=q 1+q 2.设P 是市场出清价格(可以将产品全部卖出去的价格),则P 是市场总产量的函数P=P(Q)=8-Q .再设生两个厂商的生产都无固定成本,且每增加,且每增加一单位产量的边际生产成本相等 C 1=C 2=2,即它们分别生产q 1和q 2产量的成本分别为2q 1和2q 2.最后设这两个厂商是同时决定各自的产量的,即在决策之前不知道另一方的产量.上述问题构成的博弈中,博弈方为厂商1和厂商2.它们的策略空间都是由不同的产量组成,因为产量受生产能力的限制,因此理论上产量是有一个上限的,但如果假设产量是连续可分得,则它们各自都有无限多种可选策略.该博弈中两博弈方的得益自然是各自的利润,用u 老表示,即各自的销售收入减去各自的成本,根据给定情况,分别为212111211111162)](8[)(q q q q q q q q q C Q P q u --=-+-=-= 222122212222262)](8[)(q q q q q q q q q C Q P q u --=-+-=-=两博弈方的得益(利润)取决于双方的策略(产量).本博弈中两博弈方都有无限多种可选策略,因而无法得益矩阵表示该博弈,但纳什均衡的概念同样适用,即对于两博弈方的一个策略组合),(**2*1q q q =,只要其中*1q 和*2q 相互是对方策略的最佳对策,就是一个纳什均衡.并且如果可证实它是该博弈中唯一的纳什均衡,则它同样是博弈的解.因此本博弈, (*2*1,q q )的纳什均衡的充分必要条件是*2*1q q 、的最大值问题:)6(m a x21*2111q q q q q --和)6(max 22*1222q q q q q --的解. 因为求最大值的两个式子都是各自自变量的二次式,且二次项的系数都小于0,因此*1q 和*2q 只要能使它们各自对q 1和q 2的偏导数为0,就一定能实现它们的最大值. 026*1*2=--q q 026*2*1=--q q联立上两式,解得*1q =*2q =2,并且这是唯一的一组解.因此(2,2)是本博弈唯一的纳什均衡策略组合,也意味着它是本博弈的解.两个厂商将各生产2单位的产量,双方得益(利润)都为2⨯(8-4)-2⨯2=4,市场总产量为2+2=4,价格为8-4=4,两厂商的利润总和为4+4=8.上述是两个独立同时作产量决策,是按它们根据实现自身最大利益的原则行动而得到结果.那么这个结果究竟怎么样?两家厂商有没有真正实现自身的最大利益?从社会总体角度来看效率又如何?如果现在以总体利益目标的.如果现在以总体利益为目标来考虑市场的最佳产量,结果会有怎样的不同呢?首先可以根据市场的条件求出实现最大总得益的总产量.设总产量为Q,则总得益U=QP(Q)-2Q=6Q-Q 2很容易求得使总得益最大的总产量3*=Q ,最大总得益9*=u .将此结果与两个厂商独立决策、只追求自身利益时相比,总产量较小,而总利润却较高。
纳什均衡举例4:公地悲剧
(1)基本假设:
一个村庄有n个农民和一块公共草地.每个农民都有在草地上放牧、养羊的自由。
用g i∈{0,∞}代表第i个农民饲养的数量,
G=∑g i,代表n个农民饲养的总数量;
V代表每只羊的平均价值,是G的函数,V=V(G)。
公地最大可牧羊量为G mx:当G<Gmx时,V(G)>0;当G≥G mx时,V(G)=0。
同时,。
即平均收益和边际收益都递减。
(2)公地产权不清下的个体决策行为
在这个博弈里,每个农民的问题是选择g以最大化自己的利润。
假定购买一只羊羔的价格为c,那么,第i个农户养羊的利润函数为:
最优化的一阶条件是:
这是一个公地产权没有界定条件下,个人得益最优的一阶条件。
上述n个一阶条件定义了n个反应函数:
n个反应函数的交叉点就是纳什均衡:
将n个一阶条件相加,我们得到:
(3)公地产权清晰下的决策行为
现在假设公地由一家农户享有所有权,其最优的目标是最大化如下定义的总剩余价值:
这里,G**一是其最优的饲养量。
(4)两种情况的比较与结论
公地悲剧的例子表明,一个资源如果没有排他性产权,就会导致资源的过度使用。
像公海捕鱼、中国一些地区的小煤窑的过度发展等。
什么是“纳什均衡”?电影《美丽心灵》完全搞错了!美国时间23日,数学家约翰·纳什与妻子阿莉西亚在新泽西乘出租车时不幸车祸身亡,一颗巨星就此陨落。
我们常在著名概念“纳什均衡”中听到他的名字,但纳什均衡究竟是什么?大部分人都一知半解。
下面这条问答就用最简明的例子来解读这个伟大的博弈论概念:问题:什么是纳什均衡?电影《美丽心灵》里对纳什均衡的表述,是对的吗?魏郎尔回答:因为美丽心灵这部电影,弄得好多人没有真的懂纳什均衡是在说啥……电影里的大意是这样:四个朋友在酒吧里看上了一个美女,都想去搭讪,纳什说,如果我们按照亚当斯密的观点,每人都只为自己着想,一上来就都去找她,就会互相干扰,最后谁也得不到。
但是大家(按照纳什的观点)既考虑自己的利益,又考虑整体的利益,分别各自去找她的同伴,结果就是大家都获益。
但是,这特么根本不是纳什均衡呀……定义:在非合作类博弈中,如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。
(纳什证明了,如果允许混合策略,那么任何一个博弈,只要参与者数量是有限的、参与者可以选择的纯策略也是有限的,那么这个博弈至少有一个纳什均衡。
)(另外,别把纳什均衡和囚徒困境混了。
纳什均衡是个广泛得多的概念。
)例子:打猎。
两个猎人出发去打猎。
假设一头鹿有400公斤肉,但必须两人合作才能打到,一个人打什么都获得不了。
同地区有一群兔子,一共有200公斤肉,两人合作可以全部打完,但一个人打也可以获得100公斤肉。
两个猎人各自都知道对方的平衡策略,但不能通过任何方式影响对方的决策。
最终的结果会怎样?那么,A 鹿B 鹿: 200,200A 鹿B 兔: 0,100A 兔B 鹿: 100,0A 兔B 兔: 100,100这里面有两个纳什均衡。
(1)两人都猎鹿:任何一人单方切换成猎兔子,都会让自己的收益从200跌到100。
(2)两人都猎兔子:任何一人单方切换成猎鹿,都会让自己的收益从100跌到0。
论日常生活中的“纳什均衡”“囚徒困境”是非合作博弈的均衡即“纳什均衡”的最经典的例子。
从这个例子,我们能知道“纳什均衡”的精要所在。
本文从“囚徒困境”案例出发,总结出“纳什均衡”的原理,并由此去探寻日常生活中的非合作博弈。
1950年和 1951年纳什的两篇关于非合作博弈的重要论文,彻底改变了人们对竞争和市场的看法。
他证明了非合作博弈极其均衡解,并证明了均衡解的存在性,即著名的“纳什均衡”,从而揭示了博弈均衡与经济均衡的内在联系奠定了现代非合作博弈论的基石。
要了解纳什均衡,首先要知道什么是非合作博弈问题。
“囚徒困境”是该问题最经典的例子,我们也从该例为切入点进行探讨:首先,一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。
“囚徒困境”:两个嫌疑犯(A和 B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判 1O年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯 A和 B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:A和 B均坦白或均不坦白、A坦白 B不坦白或者 B 坦白A不坦白,是博弈的结果。
在此,两个嫌疑犯 A和 B面临着两难的选择——坦白或抵赖。
显然最好的策略是双方都抵赖,结果是大家都只被判 1年。
但由于两人处于隔离情况下无法串供。
所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。
因为坦白交代可以期望得到最好的解决办法——释放,但前提是同伙抵赖,显然要比自己抵赖要坐 1O年牢好得多。
浅谈纳什均衡浅谈纳什均衡第一次接触到纳什均衡是在电影《美丽心灵》里边,主人公约翰·纳什经过不断探索和创新提出了他梦想的原创理论——纳什均衡定律。
关于纳什均衡的来源,有一段有趣的小故事。
约翰·纳什假设有四男五女,其中有位女士长得非常漂亮以至于所有的男士都去追求这个女士。
由于漂亮女士的天生孤傲,她拒绝了所有人的追求。
于是这四个男士退而求其次,去追求另外四个女士。
而这四个女士都不想作为第二个选择,所以都拒绝了这四个男士,公共利益为零。
这时,约翰·纳什就想道:如果这四个男士一开始都不去追求那位漂亮女士而是直接去追求那四个不那么漂亮的女士,那么毫无疑问都会成功,这时公共效益达到最大。
不管信还是不信,这个故事便是纳什均衡的最初来源了。
亚当·斯密,现代经济学之父,曾经提出:在竞争中,个人的野心往往会促进公共效益。
但是约翰·纳什在普林斯顿大学发表的博士论文彻底推翻了统治了经济学界100多年的亚当·斯密的重要理论。
经过一段时间后,纳什的理论像是一个炸弹爆炸在了各相关学界,引起了相当大的轰动。
约翰·纳什也由于他的原创理论获得了1994年的诺贝尔经济学奖。
随着时间的推移,纳什的理论逐渐进入到博弈学领域,并且成为博弈学界不可或缺的支撑理论。
纳什均衡的定义:假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。
所有局中人策略构成一个策略组合(Strategy Profile)。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。
即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡,从实质上说,是一种非合作博弈状态。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。
纳什均衡也不意味着博弈双方达到了一个整体的最优状态。
纳什均衡举例4:公地悲剧
(1)基本假设:
一个村庄有n个农民和一块公共草地.每个农民都有在草地上放牧、养羊的自由。
用g i∈{0,∞}代表第i个农民饲养的数量,
G=∑g i,代表n个农民饲养的总数量;
V代表每只羊的平均价值,是G的函数,V=V(G)。
公地最大可牧羊量为G mx:当G<Gmx时,V(G)>0;当G≥G mx时,V(G)=0。
同时,。
即平均收益和边际收益都递减。
(2)公地产权不清下的个体决策行为
在这个博弈里,每个农民的问题是选择g以最大化自己的利润。
假定购买一只羊羔的价格为c,那么,第i个农户养羊的利润函数为:
最优化的一阶条件是:
这是一个公地产权没有界定条件下,个人得益最优的一阶条件。
上述n个一阶条件定义了n个反应函数:
n个反应函数的交叉点就是纳什均衡:
将n个一阶条件相加,我们得到:
(3)公地产权清晰下的决策行为
现在假设公地由一家农户享有所有权,其最优的目标是最大化如下定义的总剩余价值:
这里,G**一是其最优的饲养量。
(4)两种情况的比较与结论
公地悲剧的例子表明,一个资源如果没有排他性产权,就会导致资源的过度使用。
像公海捕鱼、中国一些地区的小煤窑的过度发展等。