一个纳什均衡存在的简单证明
- 格式:pdf
- 大小:273.63 KB
- 文档页数:2
纳什均衡点纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。
如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。
[编辑本段]例子经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。
于是,两人同时陷入招供还是不招供的两难处境。
如果两人均不招供,将最有利,只被判刑三年。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年;乙判刑一年不招供甲判刑一年;乙判刑十年甲判刑三年基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
[编辑本段]学术争议和批评第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。
这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下达不到并不能解决问题。
[来源请求]在数学意义上,纳什并没有超越角谷静夫不动点定理。
纳什平衡Nash Equilibrium2010-02-11 16:48:59纳什平衡(Nash Equilibrium),又称为非合作赛局平(Non-Cooperative Games),是博弈论的一个重要概念,以约翰•纳什命名。
定义:如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点。
例子:经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。
大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。
如果两人均不招供,将最有利,只被判刑半年。
于是,两人同时陷入招供还是不招供的两难处境。
但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。
这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑两年甲判刑十年;乙即时获释不招供甲即时获释;乙判刑十年判刑半年基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。
事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
学术争议和批评:第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。
这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下却找不到,因此仍不能解决问题。
证明囚徒困境复制因子方程的稳定均衡为纳什均衡
囚徒困境复制因子方程是一种模型,用于描述两个个体之间的竞争或合作关系。
该模型中存在一个稳定均衡点,称为纳什均衡。
证明囚徒困境复制因子方程的稳定均衡为纳什均衡,需要先了解什么是囚徒困境。
囚徒困境是指两个犯罪嫌疑人被捕后,分别被关押在不同的房间里。
警方让他们各自交代出对方的罪行,如果两人都不说,那么两人各判刑1年;如果两人都说,那么两人各判刑3年;如果一个人说,一个人不说,那么说的人免罪,不说的人则判刑5年。
在囚徒困境中,两个人都想要尽可能地减轻自己的惩罚,但同时也要考虑对方的行为。
这就是典型的非合作博弈。
在复制因子方程中,每个人都有一个策略,即说或者不说。
每次博弈之后,双方的策略会根据结果进行复制,赢家的策略更容易被复制。
这就是复制因子方程的核心思想。
在囚徒困境复制因子方程中,存在一个稳定均衡点,即当两个人都选择不说的时候,这个状态稳定,即使有一方改变策略,也不会有太大的影响。
这个稳定均衡点就是纳什均衡。
为什么说这个稳定均衡点是纳什均衡呢?因为纳什均衡是指在
博弈中,每个人都选择了自己最优的策略,而不考虑对方的策略。
在囚徒困境中,两个人都选择不说的话,对于个体来说,这是最优的策略。
即使对方改变了策略,自己也不会受到太大的影响,因此这个稳定均衡点就是纳什均衡。
综上所述,囚徒困境复制因子方程的稳定均衡为纳什均衡的证明
就是这样的。
nash均衡完整证明过程
Nash均衡是博弈论中的一个重要概念,指的是一种策略组合,其中每个参与者都采取了最优的策略,且没有任何参与者可以通过改变自己的策略来改善自己的收益。
下面是Nash均衡的完整证明过程:
1.定义:首先,我们定义一个博弈模型,包括参与者的策略
空间、收益函数和决策顺序等。
2.假设:我们假设存在一个策略组合,其中每个参与者都采
取了一个最优策略。
我们想要证明这个策略组合是一个Nash均衡。
3.假设其他参与者保持策略不变:我们假设在给定策略组合
下,其他参与者保持他们的策略不变。
我们假设没有参与者试图通过改变自己的策略来改善自己的收益。
4.分析每个参与者的收益:根据假设,我们分析每个参与者
在给定策略组合下的收益。
我们将每个参与者的策略与其他参与者的策略进行配对,并计算每个参与者在每种配对策略下的收益。
5.检查是否存在更优策略:对于每个参与者,我们检查是否
存在其他的策略,通过改变他们的策略可以提高他们的收益。
如果存在这样的策略,那么原来的策略组合就不是一个Nash均衡。
6.结论:如果在步骤5中找不到任何参与者能够通过改变策
略来提高收益,那么该策略组合就是一个Nash均衡。
这
意味着没有参与者可以单独行动来获得更高的收益,给定
其他参与者的策略。
通过以上的证明过程,我们可以确定给定博弈模型下的Nash均衡策略组合。
需要注意的是,Nash均衡并不一定是全局最优解,它只是一种无法通过改变策略来改善自己的收益的策略组合。
纳什均衡证明方法嘿,朋友们!今天咱来唠唠纳什均衡证明方法。
你说这纳什均衡啊,就像是一场微妙的游戏。
咱就拿下棋来打个比方吧,双方都在琢磨着怎么下才能让自己最有利,同时还得考虑对方会怎么应对。
这可不就是纳什均衡嘛!每个人都在根据对方的行动来调整自己的策略,力求达到一种平衡状态。
比如说在商业竞争中,两家公司都在想着怎么定价、怎么推广产品。
如果一家公司大幅降价,那另一家就得好好想想是不是也得跟着降,不然客户不都跑了嘛。
这时候他们就在寻找那个纳什均衡点,找到一个双方都能接受的策略组合。
再想想班级里选班干部,大家都想当,那怎么投票呢?每个人都得考虑别人会投给谁,然后再决定自己的选择。
这也是一种纳什均衡的体现呀!大家都在相互影响、相互制约。
纳什均衡证明方法呢,其实就是帮助我们找到这种平衡的工具。
它让我们能看清在各种复杂的情况下,人们会怎么做出决策,怎么达到一种相对稳定的状态。
咱举个具体例子哈,想象一下有两个商家在竞争市场份额。
如果一个商家加大广告投入,另一个商家可能也得跟着加大,不然市场份额就被抢走了。
但如果都拼命加大广告投入,成本又太高了。
那他们就得好好研究,怎么在投入和收益之间找到那个最佳平衡点,这就是纳什均衡呀!那怎么证明这个纳什均衡呢?这可得好好研究各种因素,像双方的利益、策略选择的范围等等。
就好像解方程一样,要把各种条件都考虑进去,找到那个能让大家都稳定下来的解。
你说这是不是很有意思?在生活中处处都有纳什均衡的影子,从买菜砍价到国际谈判,都离不开它。
你再想想,要是没有纳什均衡,那这个世界得乱成啥样?大家都盲目行动,没有一个相对稳定的策略,那不是乱套了嘛!所以说呀,纳什均衡证明方法真的很重要,它能帮我们更好地理解和应对各种复杂的情况。
总之,纳什均衡证明方法就像是一把钥匙,能打开我们对各种社会现象和经济行为的理解之门。
让我们能更清楚地看到人们是怎么相互作用、怎么达到平衡的。
这可真是个神奇的东西啊,难道不是吗?大家可得好好琢磨琢磨,说不定哪天就能用上呢!。
纳什均衡的存在性与多重性对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。
这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。
所以,倘若某个概念所对应的事物并不存在。
那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。
因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。
所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。
有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。
譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。
除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。
从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。
我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。
按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。
因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。
再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。
博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。
:定义: 纳什均衡策略式博弈中策略组合是个纳什均衡如果给定•策略式博弈中,策略组合s כ是一个纳什均衡,如果给定其他参与者选择了策略组合s כ−i ,对每一个参与者i 而言选收益都不低于选择其他任何策略即择策略的s*i 收益都不低于选择其他任何策略。
即,u i (s כ) ≥ u i (s i , s כ−i ) for every s i ∈S i •s*i ∈arg Max u i (s i , s כ−i )= u i (s כ1, …, s כi-1, s i , s כi+1, …s כN )for all for alli ∈I •s*i ∈B i (s*-i ) for all i ∈I(Vickrey 例:二级价格密封拍卖(Vickrey 拍卖)•SPA(c r c, r ):–入场费:c=0–拍卖底价:r=0–策略:b i (v ) ∈{ No} ∪[ r , ∞)v ∈[0, 1]支付:如果不报价收益为–支付:如果不报价,收益为0如果报价,那么-- if i i i i v z c b z>⎧(,,)()() if - if i i i i i i ii i u b z c p b v z c b z c b z⎪=−−=⎨⎪<⎩–其他竞拍人的最高报价z = Max {b -i }–p (b i ):当出现平局时的竞拍人i 赢得拍卖的概率例:英式拍卖(级价格公开叫价)一级价格公开叫价按钮拍卖(button auction)•button auction–每个人都有一个按钮,–按着按钮:表示继续参加拍卖–不按按钮:表示退出,一旦退出不能再次加入–当只有个人仍然按着按钮时,价格不再上升,拍卖当只有一个人仍然按着按钮时价格不再上升拍卖结束。
–假设:当竞拍人按着按钮时,不知道有多少人还按着(v) ∈{ No} ∪[ r, ∞)v∈[0, 1]•竞拍人的策略集:bi如果–c=0, r=0, b(v)=v是每个竞拍人的弱占优策略–w E= v(2)=w2–E[w E]= E[w2]第十讲混合策略夏纪军上海财经大学经济学院L10L10. 混合策略均衡• A. 混合策略• B. 期望支付函数期望支付数• C. 混合策略纳什均衡C• D.D. 报警博弈• F. Approaching Cars •G. 专家诊断博弈例猜硬币博弈Player 2•例:猜硬币博弈1, -1-1, 1Tail(1-q )Head (p )Head (q )Player 1Player 2-1, 11, -1Tail (1-p )Player 1•混合策略–参与者1:Head 1•以p 的概率选择Head,以1-p 的概率选择Tail•概率分布:α1=(Prob(s 1=Head), Prob(s 1=Tail)=(p , 1-p )参与者–2:•以q 的概率选择Head,以1-q 的概率选择Tail 概率分布(P b(H d)P b(T il)1•概率分布:α2=(Prob(s 2=Head), Prob(s 2=Tail)=(q , 1-q )混合策略定义•定义:–参与者的混合策略是定义在参与者纯策略集上的一个概率分布设定了选择每个纯策略的概率概率分布,设定了选择每个纯策略的概率。
一个纳什均衡存在的简单证明(《Advanced Microeconomic theory 》,Jehle
and Reny )
第一步,定义调整(向量)函数::f M M →,M 是L 个博弈者混合策略的乘积空间。
简单起见,每个博弈人的纯策略都是n 个。
定义博弈者i 的某个纯策略的选取的概率为
''1max(0,(,)())()1max(0,(,)())
ij i i i ij n
i i i j m u j m u m f m u j m u m --=+-=
+-∑ (1)
很显然
1
()1n
ij
j f
m ==∑ 。
请问式子(1)的经济含义?
1(,,)L f f f =L ,其中1(,,)i i in f f f =L ,相似的有1(,,)L m m m =L ,1(,,)i i in m m m =L 。
请问这些符号的经济含义?
第二步,应用布劳威尔不动点定理得到向量函数f 有不动点ˆˆ()f m
m =,把向量函数的不动点写成分量形式得到ˆˆ()ij ij f m m =(注意等式两边的ˆm 和ˆij m )。
第三步,根据式子(1),ˆˆ()ij ij f m
m =可以展开为 ''1ˆˆˆmax(0,(,)())ˆˆˆ1max(0,(,)())ij i i i ij n
i i i j m
u j m u m m
u j m
u m --=+-=+-∑ (2)
整理得到
''1
ˆˆˆˆˆmax(0,(,)())max(0,(,)())n
ij i i i i i i j m
u j m u m u j m u m --=-=-∑ (3) (3)两边同乘ˆˆ(,)()i i i u j m
u m --,并对j 加总得到 ''1
1
1
ˆˆˆˆˆ[(,)()]max(0,(,)())ˆˆˆˆ[(,)()]max(0,(,)())n
n
ij
i
i
i i i i j j n
i i i i i i j m
u j m u m
u j m u m u j m
u m u j m u m --==--=--=--∑∑∑ (4)
因(4)左边1
1
ˆˆˆˆˆˆˆ[(,)()](,)()()0n n
ij i i i ij i i i i j j m
u j m u m m u j m u m u m --==-=-=-=∑∑,有 1
ˆˆˆˆ0=[(,)()]max(0,(,)())n
i i i i i i j u j m
u m u j m u m --=--∑ (5)
根据(5)式,不可能有ˆˆ(,)()0i i i u j m
u m -->,因为这样必然使得(5)右边严格大于零。
因此ˆˆ(,)()0i i i u j m u m --≤,说明不动点ˆm 是NE (为什么)。