北大课上纳什均衡的两个案例
- 格式:doc
- 大小:299.00 KB
- 文档页数:5
好的纳什均衡例子(一)好的纳什均衡什么是纳什均衡?纳什均衡是博弈论中的一个重要概念,指的是在博弈参与者之间形成的一种稳定和平衡的策略选择状态。
在纳什均衡下,任何一个参与者都无法通过改变自己的策略来获得更大的利益。
好的纳什均衡指的是存在多个纳什均衡时,其中某些纳什均衡比其他纳什均衡更为理想。
例子一:囚徒困境囚徒困境是博弈论中最经典的例子之一。
假设有两个犯人,他们因为涉嫌合谋犯罪被捕,警察只有有限的证据。
警察与每个犯人分别进行单独审讯,并给他们提供了合作和背叛两个选项,这两个选项对应于认罪和抵赖。
如果两个人都选择合作,即认罪,则每个人都会被判刑2年;如果两个人都选择背叛,即抵赖,则每个人都会被判刑5年;如果一个人选择合作而另一个选择背叛,则合作的人会被判刑6年,而背叛的人会被判刑1年。
在这个案例中,存在两个纳什均衡:互相背叛和互相合作。
然而,互相合作是更为理想的纳什均衡,因为如果两个人都选择合作,他们的总刑期将会最短,只有2年。
例子二:拍卖拍卖是另一个常见的博弈场景。
假设有两个竞拍者A和B,他们在一个拍卖会上竞价购买一件物品。
物品的最低价格为100元。
竞拍者A知道他的估值是200元,而竞拍者B知道他的估值是150元。
他们每次可以按照一定幅度加价,但不能超过自己的估值。
在这个案例中,存在两个纳什均衡:A出价200元,B不出价;B 出价150元,A不出价。
然而,对于卖家来说,A出价200元,B不出价是更好的纳什均衡,因为这样卖家可以以更高的价格售出物品。
例子三:价格战价格战是市场竞争中常见的博弈情景。
假设有两家公司A和B,它们在同一个市场上销售类似的产品。
它们可以根据自己的利润目标制定价格。
如果两家公司的价格相等,则它们将平分市场份额;如果一家公司的价格比另一家低,则它将获得更大的市场份额。
在这个案例中,存在两个纳什均衡:价格相等和一家公司的价格低于另一家。
然而,价格相等是更好的纳什均衡,因为这样两家公司可以共享更多的市场份额,并且避免因为价格战而导致的利润下降。
混合策略纳什均衡例子混合策略纳什均衡是博弈论中的一个重要概念,指的是各参与者选择一个概率分布作为他们的策略,从而达到一个稳定的状态。
在混合策略纳什均衡中,没有任何参与者可以通过单独改变自己的策略来获得更好的结果。
一个经典的混合策略纳什均衡的例子是“岩石-剪刀-布”游戏。
在这个游戏中,两个参与者(称为玩家1和玩家2)可以选择出岩石、剪刀或布中的任意一种。
每一种选择都有一定的胜负规则:岩石胜剪刀,剪刀胜布,布胜岩石。
假设玩家1选择出岩石、剪刀和布的概率分别为p1、q1和r1,玩家2选择出岩石、剪刀和布的概率分别为p2、q2和r2。
两个玩家的利益可以用一个支付矩阵表示如下:| 岩石 | 剪刀 | 布-----------------------------岩石 | 0 | -1 | 1-----------------------------剪刀 | 1 | 0 | -1-----------------------------布 | -1 | 1 | 0在混合策略纳什均衡中,每个玩家选择的概率分布必须使得对于每一种选择,玩家都不希望改变自己的概率分布。
在这个例子中,我们可以通过计算来找到混合策略纳什均衡。
假设玩家1选择出岩石的概率为p1,则选择剪刀的概率为q1=1-p1-0=1-p1,选择布的概率为r1=0-0=0。
同样地,玩家2选择出岩石的概率为p2,则选择剪刀的概率为q2=1-p2-0=1-p2,选择布的概率为r2=0-0=0。
为了找到混合策略纳什均衡,我们需要检查每一种选择,并确保玩家对于每一种选择都不希望改变自己的概率分布。
在这个例子中,无论玩家1选择什么概率分布,玩家2都可以通过选择相应的概率分布来获得更好的结果。
所以,不存在一个混合策略纳什均衡。
总结起来,混合策略纳什均衡是博弈论中一种稳定的策略选择状态,即不存在任何参与者可以通过单独改变自己的策略来获得更好的结果。
岩石-剪刀-布游戏是一个经典的混合策略纳什均衡的例子,其中玩家的选择概率分布是关键因素。
三方博弈纳什均衡例题全文共四篇示例,供读者参考第一篇示例:三方博弈是博弈论中一种常见的情形,指的是有三方参与并且彼此之间存在竞争和合作关系的博弈情况。
纳什均衡是博弈论中的一个重要概念,指的是在博弈中每个玩家都做出最佳决策的情况下所达到的一个稳定状态。
在三方博弈中,如果存在某种情况下所有玩家都无法通过改变自身策略而获益,这种状态就是三方博弈的纳什均衡。
下面我们通过一个例子来说明三方博弈纳什均衡的概念。
假设有三位学生A、B、C参加了一个考试竞赛,在这个竞赛中,他们可以选择合作作弊,也可以选择正当的考试。
如果三位学生都选择正当考试,那么每个人都能得到10分的成绩;如果某一位学生作弊而其他两人选择正当考试,那么作弊的学生可以得到15分,而其他两人得0分;如果所有人都选择作弊,那么每个人只能得到5分。
同理,对于学生B和C来说,选择作弊也是更有利的策略。
第二篇示例:三方博弈是博弈论中的一个重要概念,指的是有三个各自独立的决策者同时做出决策的情况。
在三方博弈中,每个决策者都会考虑其他两方的利益和行为,以最大化自己的利益。
纳什均衡是博弈论中一个非常重要的概念,是指在一个博弈当中,每个参与者都选择了最优的行动策略,没有任何一方可以通过改变自己的策略来获得更好的结果。
下面我们来看一个关于三方博弈纳什均衡的例题。
假设有三个玩家A、B、C,他们在一个零和博弈中,并且每个玩家都只有两种可行的策略,分别是合作和背叛。
博弈的收益矩阵如下表所示:| | 合作| 背叛|| ---- | ------ | ------ || 合作| 3,3,3 | 1,4,4 || 背叛| 4,4,1 | 0,2,2 |在这个收益矩阵中,每个元素表示每个玩家在不同组合下的收益,例如当A、B、C都选择合作时,他们的收益分别是3,当A、B、C都选择背叛时,他们的收益分别是2。
现在我们来分析一下这个博弈的纳什均衡。
我们来看一下玩家A的最佳策略。
玩家A会根据其他两个玩家的策略来选择自己的策略,如果B、C都选择合作,那么玩家A选择背叛可以得到更高的收益4;如果B、C都选择背叛,那么玩家A也选择背叛可以得到更高的收益4。
纳什均衡举例4:公地悲剧
(1)基本假设:
一个村庄有n个农民和一块公共草地.每个农民都有在草地上放牧、养羊的自由。
用g i∈{0,∞}代表第i个农民饲养的数量,
G=∑g i,代表n个农民饲养的总数量;
V代表每只羊的平均价值,是G的函数,V=V(G)。
公地最大可牧羊量为G mx:当G<Gmx时,V(G)>0;当G≥G mx时,V(G)=0。
同时,。
即平均收益和边际收益都递减。
(2)公地产权不清下的个体决策行为
在这个博弈里,每个农民的问题是选择g以最大化自己的利润。
假定购买一只羊羔的价格为c,那么,第i个农户养羊的利润函数为:
最优化的一阶条件是:
这是一个公地产权没有界定条件下,个人得益最优的一阶条件。
上述n个一阶条件定义了n个反应函数:
n个反应函数的交叉点就是纳什均衡:
将n个一阶条件相加,我们得到:
(3)公地产权清晰下的决策行为
现在假设公地由一家农户享有所有权,其最优的目标是最大化如下定义的总剩余价值:
这里,G**一是其最优的饲养量。
(4)两种情况的比较与结论
公地悲剧的例子表明,一个资源如果没有排他性产权,就会导致资源的过度使用。
像公海捕鱼、中国一些地区的小煤窑的过度发展等。
两个纳什均衡的例子
例子一:
假设有两家公司A和B竞争某一物品的售价。
公司A设定物品的
售价为12元,公司B设定物品的售价为10元。
由于物品的品质和需
求相同,消费者将选择购买价格更低的物品。
因此,在这种情况下,
公司B的销售量将高于公司A,从而获得更高的利润。
对于公司A来说,降低价格将导致利润下降,而提高价格将导致销量减少。
因此,这种
情况下的纳什均衡是公司B设定售价为10元,公司A设定售价为12元。
例子二:
假设有两个国家A和B争夺某一资源的开发权。
国家A选择全面
开发该资源,从而带来经济发展和利益增加,但同时对环境产生巨大
破坏。
而国家B选择保护环境,限制资源开发,从而减少环境破坏,
但也丧失了资源开发所能带来的经济利益。
如果国家A单方面全面开发,国家B将面临环境恶化的问题,而国家A将无法享受到经济发展
所带来的最大利益。
因此,这种情况下的纳什均衡是国家A选择限制
资源开发,保护环境,而国家B也选择限制资源开发,从而实现环境
保护和资源合理利用的共同利益。
中微补充讲义 (7)平新乔 (2006年12月17日)关于纳什均衡的两个案例二、占优策略与“密封次高价”拍卖机制拍卖是一种古老且至今仍存在的市场交易方式。
从最宽的定义来说,“拍卖”是指将经济资源配置到某一个当事人手中的方式。
现实生活中,古董的拍卖、艺术品的拍卖、短期国债的拍卖、海上油矿开采权拍卖、天然气开采权拍卖,到无线频道拍卖、国有企业拍卖等。
拍卖形式繁多,而且涉及大宗商品的交易。
“有效”的拍卖机制中涉及到两个概念:(1)有效性:这是指(a )要让资源经过拍卖配置到对该资源(标的物)评价最高的当事人手里;(2)要使得标的物的卖者得到最优高度收益。
(2)机制:机制是指博弈形式(有参与人,有策略集,有博弈规则,有偏好序(支付函数)),该博弈形式让拍卖过程达到有效。
这里只讲“密封次高价拍卖”:这是指这样一个博弈,有几个竞拍人对一个标的物竞拍,他们同时把自己的“出价”写在纸上装入信封交给卖主,出价最高的竞标者赢得购买权,并按次高价买下标的物。
这里有三个问题:第一、 为什么要求赢者以“次高价”而不是自己的出价(即最高价)来买下标的物? 第二、 这里会发生均衡吗? 第三、 均衡唯一吗?我们先回答后两个问题,再回答第一个问题。
分3点来讲解: 1、 模型 假设:(1)设有几个竞拍人,标的物为1个。
(2)竞拍人i (i=1,…,n) 对标的物的真实评价为i v 。
这个i v 是i 独立评判的,不受他人j i ≠对标的物的评价j v 的影响。
(3)几个评估值12{,,...,,}n v v v 按大小排序为:121...n n v v vv ->>>>>0(4)竞拍规则为“密封次高价”:即若竞拍人的竞拍出价(bid price )(){()}max i i j j j ib v b v ≠>则i 赢下标的物,并且只按次高价付款。
于是,i 的得益(payoff )为i 的消费者剩余: i i j u v b =- 这里,{()}max j jjj ib b v ≠=,显然jb是价格(P=j b )。
(5)不考虑竞拍成本。
因此,如竞拍人j 没有赢下标的物,其得益为零,0j u = (6)若出价出现“平局”,有两个以上的竞拍人出价一样,我们假定按竞拍人的身份排号顺序决定胜者。
例如,如1122()()b v b v =,由于1b 下脚标1在2b 下脚标2之前,我们判定竞拍人1胜出。
但这时,由于“次高价”2211()()b v b v =,所以,尽管竞拍人“1”胜出,但“1”的买价等于他自己的出价11()b v 。
于是“1”的得益为:111()v b v -。
为了简化,记()i i i b v b =,从而,如在平局时竞拍人“1”胜出,其得益为111u v b =-。
把上述6个假定写成“策略型博弈”,就有以下博弈形式:(1) 博弈参与人个数为n ,2n ≥(2) 每个参与人i 的策略集为出价i b 的区间:0(2,3,...,)[0,)j b j n =∀=∈∞ (3) i 的偏好与得益函数为:i i j u v b =-, 如i 赢下,{}max j j j i b b ≠=()=,i i v b i j -如与竞价出现平局,且i<j = 0,如i 输掉竞拍2. 均衡这个博弈存在许多个均衡。
我们这里只讲其中的三个均衡:(1)1212(,,...)(,,...)n n b b b v v v =,这个一个均衡。
先看这是什么意思。
这里,i i b v = 1,2,...i n ∀=表示每个竞拍人i 都是按自己内心对标的物的评价i v 而真实标价的。
竞标的结果当然是第1个竞拍人胜出,因为121...n n v v vv ->>>>。
胜者“1”的得益为112u v b =-,其他竞拍人得益为零。
我们来证明为什么1212(,,...)(,,...)n n b b b v v v =是一个纳什均衡。
理由是:第一,竞拍人1对于出价“11b v =”是不会产生背离动机的。
当11b v =时,112120u v b v v =-=->。
如果11b v >,他固然也会赢下标的物,但不会改变112u v b =-这个收益水平;如果11b v <,可能会发生121b b v <<的事件,竞拍人就会输掉,得益为零。
第二,别的竞拍人j (j=2,3,…n)也不会有改变j j b v =的动机。
j j b v =时,0j u =。
如果j j b v ≠,一种可能是11j b b v ≤=,则j 仍然不会赢,于是得益仍是0j u =;另一种可能是11j b b v >=。
这时j 会赢下标的物,但110j j j u v b v v =-=-<,还不如j j b v =时,0j u =的结果。
(2)121(,,...)(,0,0,...0)n b b b v =也是一个均衡。
在这个结果中,由于“1”以外的所有其他竞拍人都报价为零,从而1110u v v =-=。
为什么这也是一个均衡?因为:第一,“1”无背离动机。
如果11b v ≠,但由于1[0,)b ∀∈∞,即使1b =0,“1”也会赢(因为0(2,3,...,)j b j n =∀=,而“1”身份排序在前),且1100u v =-=。
所以,11b v ≠不改变11u v =的值,从而“1”无动力背离11b v =的出价。
第二,别的竞拍人j 也无动力改变0j b =这一策略。
当0j b >时,或者11j b b v <=,j 仍输,仍是0j u =;当11j b b v >=,j 会赢下,但10j j u v v =-<,反不如0j u =。
(3)1221(,,...)(,,0,...0,0)n b b b v v =同样是一个均衡。
1221(,,...)(,,0,...0,0)n b b b v v =是指竞拍人1只报了12b v =,而竞拍人2报价为21b v =,使得21b b >,于是“2”赢了,“1”输了。
10u =,但2u 也等于零,因为111110u v b v v =-=-=。
为什么这也是一个纳什均衡呢?因为:第一,“1”不会背离12b v =这一决策。
这是由于,如11b v ≥,由于21b v =,从而12b b ≥,“1”肯定会赢,但112110u v b v v =-=-=,这不比12b v =时“1”输掉时有任何改善。
如果11b v <,则“1”仍输掉,10u =仍不会改变。
第二,“2”也不会改变21b v =这一策略。
为什么?我们知道21b v =时,20u =。
如果22b v >,则“2”仍会赢( 12b v =),仍有222220u v b v v =-=-=,“2”的收益不会有丝毫改变;如22b v ≤,则“2”会输掉,使20u =。
第三,任何其他竞拍人j(=3,4,…,n)的策略0j b =不会改变。
如果1j b v ≤,则j 会输掉( j>2,当1j b v =时,与21b v =相比为平局,但“2”胜出。
),0j u =;如果1j b v >,j 会赢,但10j j u v v =-<。
上面所举的3个例子里,前2个例子中,是竞拍人1胜,而第三个例子中是竞拍人2胜。
读者可以依次举出让竞拍人3,4,…,n 获胜的例子,并且证明它们是均衡。
因为,我们到此实质上回答了这一节开头提出的后两个问题:密封次高价拍卖存在均衡,并且均衡不唯一。
但第三那个例子等于说,不讲实话的出价(1221,b v b v ==)也可以在密封次高价拍卖中成为一个纳什均衡。
我们知道,当纳什均衡为多个时,某些纳什均衡经过精炼(refine )以后是可以被排除的。
这里,我们只要运用“将弱被占优的策略剔除掉”这一准则,就可以排除了第3个例子中那个纳什均衡。
这个分析的结论,实质上是一个定理。
3. 定理: 在密封次高价拍卖中,对任何竞拍人i=1,…,n 来说,老实出价(i i b v =)是一个弱占优策略。
弱占优的定义是*(,)(,)i i i i i i u s s u s s --≥ 对i i s S ∀∈与i i s S --∀∈我们来证明上述定理。
(用反证法) 如果i i b v ≠,或者“i i b v <”,这有三种可能: (1)j i i b b v <<,i 仍会赢,max{}i i j iu v j b ≠=-,但这不比“iib v =”时好。
(2)i i j b v b <<,这时i 输掉,0i u =。
如i i b v =也会输,但也是0i u =。
从而i ib v =不差于i i b v <。
(3)max{}i ij ib v j b ≠<<, i输掉了,0i u =;而如果i i b v =,i 的得益为max{}i i j iu v j b ≠=->0。
所以这时i i b v =会优于i i b v <。
或者i i b v >,这只有下列三种可能需要讨论: (1)max{}i ij iv b j b ≠<<,这时i 赢,但得益为负:max{}ii j iuv j b ≠=-<0,不如老实报价i i b v =(输掉,但0i u =)。
(2)如max{}ii j ivb j b ≠<<,则max{}i i j iu v j b ≠=-,这不比“i i b v =”好。
(3)如max{}iij ib v j b ≠>>,则0iu=,不比“i i b v =”好。
总结上面讨论,结论是:无论对手j(≠i)如何出价,i i b v =至少与i i b v ≠一样好,即有*(,)(,)i i i i i i i u b v b u b b --=≥,对[0,),[0,)*[0,)*....*[0,)i i b b -∀∈∞∀∈∞∞∞从而,不老实报价的“纳什均衡”最终会被剔除掉。
因此,从理论上我们回答了第一个问题:为什么要让赢者(最高报价者)按次高价付款?因为这个机制可以保证“实话实说”对每个人来说都成为一个弱占优策略。