当前位置:文档之家› 《博弈论:原理、模型与教程》第04章 Nash均衡解的特性 第02节 Nash均衡的存在性

《博弈论:原理、模型与教程》第04章 Nash均衡解的特性 第02节 Nash均衡的存在性

《博弈论:原理、模型与教程》第04章  Nash均衡解的特性  第02节  Nash均衡的存在性
《博弈论:原理、模型与教程》第04章  Nash均衡解的特性  第02节  Nash均衡的存在性

《博弈论:原理、模型与教程》

第一部分完全信息静态博弈

第4章 Nash均衡解的特性

4.2 Nash均衡解的存在性

(已精细订正!)

===============

===============

本节推荐参考文献:

(01)张石生.不动点理论及应用(M). 重庆:重庆出版社,1984年8月第1版.

(注:有趣的是,该书的责任编辑尹明善,就是后来从摩配起步创业成功的力帆老总)

(02)张奠宙,顾鹤荣.不动点定理(M). 沈阳:辽宁教育出版社,1989年4月第1版.

(03)王则轲,左再思,李志强.经济学拓扑方法(M). 北京:北京大学出版社,2002年1月第1版.

===============

===============

将Nash均衡作为博弈的解,会面临这样的问题:Nash均衡是否存在,或者说对于所关心的博弈问题,是否一定存在一个Nash均衡?

非常庆幸的是,我们能够得到一个肯定的答案。

下面将对本书所涉及的博弈论中一些经典的存在性结论进行介绍。

定理4-1(Nash均衡的存在性定理1,1950)每一个有限的战略式博弈至少存在一个Nash均衡(包括纯战略和混合战略Nash均衡)。

定理4-1是博弈论中关于Nash均衡存在性的最基本定理。1950年,John Nash在文章Equilibrium points in n-person games中首次提出Nash均衡的概念,并给出该存在性定理。无论怎样强调该定理对于博弈论以后的发展的意义都不过分,因为Nash均衡之后的博弈论的发展(尤其是非合作博弈论的发展)基本上都是以该定理为

基石的。定理4-1的条件简单,但得出的结论却十分肯定。

下面给出的定理的详细证明。供有兴趣的读者参考。

为证明该定理,先给出如下必要的基本概念。

定义4-1 从集合X 到集合Y 的一个规则f ,若满足:X x ∈?,都Y ?中的一个集合)(x f 与之对应,则称f 为由X 到Y 的对应,记为f :X →Y 。

简单地说,对应是函数概念的扩展,函数将集合X 中的点映到Y 中的点,而对应将集合X 中的点映到Y 中的子集。

对应f :X →Y 的图像是指X ?Y 中的集合{),(y x ︱}.)(,x f y X x ∈∈。对应f :X →Y 为上半连续的,是指X x ∈? .和Y 中任意包含f )( x 的开集V ,在X 中都存在 x 的一个邻域U )( x ,只要)( x U x ∈,就有

V x f ?)(。显然对应的上半连续性为函数连续性概念的扩展,对应一

个函数它的上半连续性就等于它的连续性。对应f :X →Y 的图像为闭图,是指任意给定,(,)m m m x f y X x ∈∈若),,(),(y x y x m m →就有)(x f y ∈。闭图将闭集的概念推广到集合的直积中。若对应f 的值域Y 为紧集,则f 有闭图就意味着f 为上半连续的。有了这些基本概念,下面证明基本定理4-1.

证明的基本思想是将Kakutani 不动点定理应用于参与人的反应对应上。

参与人i 的反应对应i r 为对手选择i -σ时,i r 将每一个战略组合σ映射到i 的一个混合战略集。给定对手选择i -σ,给混合战略集中的每个战略最大化参与人i 的支付。这里虽然i r 只依赖于i -σ,而不依赖于

i σ,仍将i r 写作σ的对应,因为稍后会在战略组合空间之中寻找一

个不动点。定义反应对应∑→∑:r 为i r 的Cartesian 直积,即

))(),...(()(σσσn i r r r ,=,则r 的不动点为满足)(σσr ∈ 的战略组合σ,因

此对每个参与人i ,)(σσi i r ∈,所以r 的不动点即为一个Nash 均衡。因此,对定理4-1的证明转化为证明参与人的反应对应具有不动点。

由Kakutani 不动点定理,∑→∑:r ,存在不动点的充分条件为: ①∑为有限维欧氏空间的紧的凸子集; ②)(,σσr ?非空; ③)(,σσr ?为凸; ④)(σr 有闭图。

在这里,若①成立,即∑为紧集,且④成立,则对应r 为上半连续的。

下面分别证明这些条件满足:

首先,因为i ∑为维数为1||-i S 的单纯形,所以①满足。 其次,因为每一个参与人的支付函数在自己的混合战略上是线性的,因此也是连续的。连续函数在紧集上取得最大值,所以)(σr 非空,②满足。

再次,为了证明③ ,采用反证法。

若)(σr 非凸,则存在)('σσr ∈及)("σσr ∈ ,且存在)1,0(∈λ,使得

)()1("'σσλλσr ?-+,但对每一个i ,有

)

()1(),(),)1((,"'"''

i i i i i i i i i

i u u u ----+=-+σσλσσλσσλλσ

因此若i 'σ,i "σ是相对于i -σ的最优反应,那么它们的加权平均也是。而这与)(σr 非凸矛盾,所以)(σr 凸。

最后,仍用反证法证明④ 。

假设④不满足,则存在序列),(?),?,()?,(n n n n r σσσσσ

σ∈→但)(?σσ

r ?,所以存在i ,)(?σσi i r ?。因此存在0>ε和i 'σ,使得

i i i u -σσ,('

)εσσ3),(,+>-∧

i i i u 。又因为i u 为连续的且)?,()?,(σσσσ→n n ,因

此对足够大的n ,有

εσσεσσεσσσσ+>+>->----),?(2),?(),(),(,''n

i n i i i i i i i i i n i i u u u u 所以对于 ,n i -σ '

i σ严格优于n i σ

?,这与)(?n i n i r σσ∈矛盾。所以 ④ 满足。 至此,也就完成了有限博弈中Nash 均衡的存在性的证明。

在经济学和现实生活中也有很多无限博弈,即参与人的战略有无限多个或参与人的战略能在一个集合中连续取值,如厂商之间的价格或产量竞争。对应于这些情况有如下的存在性定理。

定理4-2(Nash 均衡的存在性定理2,Debru 1952,Glicksberg

1952,Fan 1952) 对于战略式博弈>Γ=<)();(;i i u S G )i ,若i S 为欧氏空间的非空紧凸子集,支付函数i u 关于战略组合s 连续,关于i s 拟凹,则该博弈存在纯战略的Nash 均衡。

该定理的证明与Nash 均衡的存在性定理4-1类似,支付函数关于所有参与人战略组合的连续性意味着反应对应具有闭图。另外,支付函数关于自己战略的拟凹性意味着反应对应为凸值的。同样运用Kakutani 不动点定理便可以证明该定理。

注意:在上述定理中关于参与人战略组合的连续性条件是非常重要的,它类似于有限博弈中期望支付关于混合战略是连续的,因此Nash 均衡的存在性定理4-1可以看作是该定理的特例。但同时在参与人的支付函数上该定理的条件较Nash 均衡的存在性条件强,但正是因为较强的条件从而导致了较强的结果——纯战略Nash 均衡的存在性!在很多博弈中不存在纯战略的Nash 均衡,但却存在混合战略 Nash 均衡,因此将上述条件放松便得到相关条件下关于混合战略的存在性结论。

定理4-3(Nash 均衡的存在性定理3,Glicksberg 1952) 对于战略式博弈>Γ=<)();(;i i u S G ,若战略空间i S 为距离空间中的非空紧子集,

支付函数i u 关于战略组合s 连续,则该博弈存在混合战略的Nash 均衡(将纯战略Nash 均衡作为混合战略Nash 均衡的特例)。

在上述关于Nash 均衡的存在性定理4-2和定理4-3中,都要求参与人的支付关于所有参与人战略组合的连续性,在经济学的一些理论或应用中,非连续性或非拟凹的收益函数是很常见的。如果有不连续的收益,则一个紧的战略空间就不再确保参与人对应其对手战略的最优反应一定存在。为了探寻此时均衡的存在性,Dasgupta 进一步对以上存在性条件进行放松,得到如下存在性定理。

定理4-4(Nash 均衡的存在性定理4,Dasgupta 和Maskin 1986) 对于战略式博弈 >Γ=<)();(;i i u S G ,若对于所有的i ,i S 为有限维欧氏空间的非空紧凸子集;i u 关于i s 拟凹,关于s 上半连续且

),(i i i s

s s u Max i

-关于i s -连续,则该博弈存在一个纯战略的Nash 均衡。

该定理的证明仍然与前述定理的证明类似,仍然采用Kakutani 不动点定理,其中收益函数关于自己战略的拟凹性保证了反应对应的凸值性,i u 的极大值关于i s -的连续性及i u 的上半连续性保证了反应对

应具有闭图,因此证明过程类似定理4-1,这里不再重复。

在上述定理的基础上,Dasgupta继续对

u的连续性及拟凹性进

i

行放松,得到了当支付函数只在战略集的某个子集上不连续时,相关条件下混合战略均衡的存在性。其思想是用有限分割去近似战略空间,证明的方法仍然是用Kakutani不动点定理。由于涉及一些较复杂的数学名词的解释,这里不再介绍,建议有兴趣的读者参阅相关文献。

至此为止,所列出的关于Nash均衡的存在性结论其证明思想都是Kakutani不动点定理。从数学上看,以上一系列的存在性定理都是在不断放松Kakutani不动点定理成立的条件,而且都在试图不断放松对支付函数的要求以满足Kakutani不动点定理的条件。在反应对应具体凸性这一点上它们是相同的。当反应对应的凸性不再满足,而只是满足一定的单调性(通常指单调增,有些情况下可以单调减)时,支付函数也只是满足一定的单调性时,关于Nash均衡的存在性结论也已经有所发展,这便是超模博弈理论。超模博弈理论为战略空间只是满足一定的序结构,支付函数只是满足一定的单调性的博弈的Nash均衡存在性提供了一定的保证,不仅如此,它还保证了这种博弈有纯战略的Nash均衡。在战略空间的一定序结构下,该类博弈的

Nash 均衡的战略集的上下界存在且与可理性化战略集的上下界重合。在思想方法上由于反应对应的凸性假设不再必要,该类博弈的Nash 均衡的存在性的理论基础不再是Kakutani 不动点定理,而是Tarski 不动点定理。关于该类博弈的具体内容有兴趣的读者请参阅Topkis 的相关著作。

[实际讲授]

============================ ============================

第一部分 回顾

例子1 猜币游戏

一般地,用)(q p *表示在给定参与人2的战略)1,(2q q -=σ的情况下,参与人1的最优反应。由式(3-4)可得

))1,(),1,((1q q p p v --=))1,(,()1())1,(,(11q q R v p q q O pv --+-

=)42()12(p p q -+- (3-10)

在式(3-10)中,参与人1的期望收益在042>-p 时随p 递增,在042<-p 时随p 递减。因此当2

1

1>q 时,参与人1的最优反应0)(=*q p (即选择

反面)(参见图3-7中)(q p *的两段水平虚线)。

前面已经提到,在2

1

=q 时,参与人1选择纯战略正面)(O 或反面)(R 是无差异的。而且从式(3-10)可以看到,参与人1的期望收益

在2

1=q 时与p 无关,所有混合战略)1,(p p -对参与人1都是无差异的。也就是说,当2

1=q 时,对于0到1之间的任何p ,混合战略)1,(p p -都

是对)1,(q q -的最优反应,即[]1,0)2

1(∈*p (参见图3-7所示)(q p *中间

的竖线段)。

综上分析,可得参与人1最优反应)(q p *为

)(q p *[]2

12121,,

01,0,

1>

=<

??

?

??=q q q (3-11)

在式(3-11)中,当2

1

=q 时,)2

1(*p 可以为 ]1,0[中的任一值,从而使得)(q p *有不止一个值。因此,称)(q p *为参与人1的最优反应响应(best correspondence ),而不是最优反应函数1。

对称地,可得参与人2的最优反应响应。

将参与人1与参与人2的最优反应响应置于同一张平面,最优反应响应曲线的交点,即是Nash 均衡。

1

最优反应函数表示给定参与人2的一个战略,参与人1仅有一个最优战略与之相对应;而最优反应响应则表示给定参与人2的一个战略,参与人1不只有一个最优战略与之相对应。参见第5章中关于Cournot 模型的介绍。

例子2 Cournot 寡头博弈模型

假设每个寡头企业具有相同的不变单位成本c ,即i i i q c q c ?=)( ,需求函数为线性形式)(21q q a P +-=,所以

)(),(c q q a q q q j i i j i i ---=π

此时,最优化的一阶条件为

???????=--+-=??=--+-=??0)(0)(2212

21211

1

c q q q a q c q q q a q ππ 企业的最优反应函数为

??

???

--==--==)

(21

)()(21)(11222211c q a q R q c q a q R q 联立求解上式,可得企业的Nash 均衡产量为

)(3

1

2

1

c a q q -==** (5-1)

企业的Nash 均衡利润分别为

2

21)(9

1c a -==**ππ (5-2)

在上述简单假设下,两个企业的最优反应函数均为直线,两条直线的交点即为Nash 均衡,如图5-1所示。

第二部分 实施Nash 定理的证明

已经知道,在考虑混合战略的情况下,一个完全信息静态博弈“通常”都存在纳什均衡。这一认识最早由纳什(Nash ,1950,1951)进行了证明,称为纳什定理。

定理2.1 纳什定理 如果完全信息静态博弈}{u S G ,=是有限的,即参与人是有限的,S 包含的纯策略也是有限的,那么一定存在至少一个(纯策略或混合策略)纳什均衡。

所谓“通常”指的就是博弈的有限性。到目前为止,我们分析的博弈都满足这两个条件。参与人有限——通常为两个人。S 也是有限的——要么存在若干个纯策略,例如猜币游戏;要么虽然纯策略由无穷多,但却是有界闭集2,例如古诺模型中的战略集],0[a S i =,所以前面分析的静态博弈都存在纳什均衡。

对纳什定理的证明分三个部分来完成: 第一步,介绍不动点定理; 第二步,说明纳什均衡就是不动点;

2

在数学中,有界闭集必然意味着是有限的,即它不是无限的,或者说拒斥了无限情。

第三步,完成证明。

第一步,不动点定理。

先来看图2-29。

图2-29中的方框为正方形。BD为45°线,它实际上等价于函数x

x

f=

)

)

(的x称

(,把满足x f

f=

y=

=)

x

(。BD线上的每一点都满足x

x

为不动点。

BD线所代表的函数自变量x取值为]1,0[,称为定义域,而因变量y的取值为]1,0[,称为值域。定义域和值域都为]1,0[的函数)(x

f,又可写作]1,0[

]1,0[:→

f,读作从]1,0[到]1,0[的映射。

现在做一个小游戏:拿一支笔,从AB线出发任意画一条曲线,

记住可以任意画,但必须连续画不能断裂,至到CD 线结束。这时发现无论如何画,这条曲线一定会和BD 相交,这个交点就是不动点。因为任意画的曲线等价于一个函数)(x g ,没有断裂意味着它是连续的,与BD 线相交意味着)(*

*x g ,所以交点为不动点。

所有任意画的曲线都有如下的性质:

(1)定义域]1,0[是非空的、有界的、闭的、凸集合,简称非空凸紧集。有界闭集即为紧集。

(2)函数)(x f 是连续的,并且是自身对自身的映射。

上面考虑的只是一元函数,对于n 元函数是不是如果满足上述性质就存在不动点?布劳尔(Brower )定理肯定地回答了这一点。

定理2.2—布劳尔(Brower )不动点定理。 假设n R A ?是一个非空凸紧集合,并且A A f →:是一个连续函数;那么)(?f 必有一个不动点;即,存在一个A x ∈使得)(x f x =。

这里R 为实数,n R 为实数的n 重笛卡尔积,x 为n 维向量。在前面的例子中]1,0[,1==A n 。在实际运用中,我们常常遇到的不是函数而是对应的情况,例如猜币游戏这个博弈存在的是最优反应对应,而不是函数,这就有了对布劳尔不动点定理的推广。

定理 2.3—角谷(Kakutani)不动点定理。 假设N R A ?是非空凸紧集,并且A A f →:是上半连续对应,并且对于每一个A x ∈,集合

A x f ?)(是非空凸集,那么)(?f 必有一个不动点。即,存在一个A

x ∈使得)(x f x ∈。

角谷不动点定理与布劳尔不动点定理的区别在于:

①映射f 为对应而不是函数,所以)(x f 为一个集合(一个点也能组成集合,所以函数是对应的特例)。

②映射f 是上半连续的。一个对应只有既是上半连续又是下半连续才能称为连续,因而上半连续比连续的要求要弱。

关于对应的上半连续,就是指如果存在一个序列n x x x ,,,21 收敛于x 并且)(,),(),(2211n n x f y x f y x f y ∈∈∈ 收敛于y ,那么一定有)(x f y ∈(如果)(x f 只有唯一值,那么∈就变为=),即对应包含着它的极限点。

在图2-30(a)中,当a x →,即从a 的左边向其收敛时,A x f →)(,但我们看到)(a f A ?,即对应)(x f 并不包含极限点A ,所以它不是上半连续的。

在图2-30(b )中,对应)(x f 包含它的每一个序列的极限点,特别是)(a f A ∈,因而它满足上半连续,但它不是连续的。例如,猜币游戏中每个参与人的最优反应对应就是上半连续的。对于函数而言,

上半连续就等同于连续。

(a )非上半连续 (b )上半连续

图2-30 对应的上半连续

第二步,纳什均衡是不动点。

根据纳什均衡的定义,在给定其他参与人策略的情况下,参与人

i 选择一个策略以使其收益最大化,并且对每一个参与人都如此,即

纳什均衡是一个使每一个参与人收益最大的策略组合。针对其他参与人不同的策略,参与人i 都有一个最优策略与之相对应,用数学来表示就是最优反应函数或对应。如果参与人i 的最优反应函数(对应)定义为,,,1,),,,,,(111n i p p p p p B i n i i i ==+-其中那么n 个参与人的最优反应函数(对应)就构成了一个方程,将其定义为),,(1n p p R ,即

???

?

??

?

??====-+-n n n i

n i i i n n p p p B p p p p B p p p B p p R ),,(),,,,(),,(),,(11111211

如果),,(1**n p p 是纳什均衡,它一定满足),,(1**n p p R ),,(1*

*=n p p ,即纳什均衡是一个不动点。例如,古

诺模型中的最优反应函数共同构成了一个方程组2,1),,(21=i q q R i ,这个方程的解既是不动点,也是纳什均衡。

第三步,完成证明。

现在要完成的是证明:①最优反应对应i B 的定义域为非空凸紧集;②i B 为上半连续的对应。

由于R 是i B ),,2,1(n i =的方程组,i B 满足这两个条件,总的策略方程R 必然满足这两个条件,而根据不动点定理,我们知道存在着不

动点),,(1**n p p ,使得),,(1**n p p R ),,(1*

*=n p p 。

(1)定义域为非空凸紧集。所谓有界集合就是任意画一个圆(圆的半径可以任意大,但不能无穷大)可以把它包下。所谓闭集就是包含边界的集合。有界闭集即为紧致集合,简称紧集。所谓凸集就是在集

纳什均衡

纳什均衡简介 纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以 约翰·纳什命名。在一 个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组 合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。 一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。 纳什均衡的得来 关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在 普林斯顿大学攻读博士学位时完成 的。实际上,博弈论的研究起始于1944年冯·诺依曼( Von Neumann)和 奥斯卡·摩根斯坦 (Oscar Morgenstern)合著的《博弈论和经济行 为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下, 证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而 对“合作博弈 (Cooperative Game)”和“ 非合作博弈”做了明确 的区分和定义。阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。” 纳什均衡例子 博弈论中一个著名的例子就是囚徒困境。 囚徒困境是一个 非零和博弈,说的是两个嫌疑犯 甲和乙私人民宅联手作案,被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉 两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。于是,两个人同时陷入招供还是不招供的两难处境。结果是,尽管甲不知乙是否招供,但他认为自己选择“招供”最好,因而甲会选择“招供”,同样乙也会选择“招供”,两人各判5年。而两人都选择不招供,虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。 博弈矩阵囚犯甲 招供不招供 囚犯乙招供判刑五年 甲判刑十年;乙判刑三个月 不招供

博弈论和纳什均衡

博弈论和纳什均衡文件管理序列号:[K8UY-K9IO69-O6M243-OL889-F88688]

关于博弈论和纳什均衡你应该知道这些 腾讯财经[]2015-05-25 10:05 我要分享 [摘要]纳什在与命运的博弈中找到均衡,纪念大师最好的方式就是尝试了解博弈论。 腾讯财经综合报道(风生)奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。事发当时,这辆出租车失控撞向栏杆,两人均被抛出车外。 约翰-纳什因发表两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即着名的纳什均衡。 不均衡人生中孕育出均衡论 纳什于1928年在美国西弗吉尼亚州出生,曾在麻省理工学院任教,晚年为普林斯顿大学担任数学系教授,死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名,1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。

纳什在数学领域上取得多项突破,但他同时深受精神分裂症困扰,其生平故事在2001年被改编成电影《美丽心灵》,赢得包括最佳电影在内的4项奥斯卡奖项。 尽管西维亚-纳萨斯(Sylvia Nasars)广为人知的小说《美丽心灵》(A Beautiful Mind)和改编自该书的、由拉塞尔-克罗(Russell Crowe)主演的同名奥斯卡电影探究了纳什错综复杂的生平,但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界,人们普遍认为,与牛顿和爱因斯坦的数学理论相比,纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题,而纳什的数学却可以应用在生物学和社会学领域。 如若不是精神疾病的困扰,纳什今天可能已与那些科学伟人齐名。尽管如此,他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就,他与约翰海萨尼(John Harsanyi)和莱茵哈德-泽尔腾(Reinhard Selten)一起获得了1994年诺贝尔经济学奖。 什么是博弈论与纳什均衡 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争

博弈论与纳什均衡

《博弈论与纳什均衡理论》 姓名张贺祺 学号 2010010404 专业政治经济学 指导老师张秉云

摘要 博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 关键字:博弈论;纳什均衡;合作博弈;非合作博弈

目录 摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) (一)博弈论的主要思想 (4) (二)博弈论的分类 (5) 三、经典案例 (7) (一)博弈论的经典案例 (7) (二)纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) (一)博弈论的重要影响 (8) (二)纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论 一、引言 近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 博弈论(Game Theory):亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 纳什均衡:(Nash equilibrium)又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。假设有n人局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 二、博弈论与纳什均衡的主要内容 (一)博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P:为局中人,博弈的参与者,也称为博弈方,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。决策人:在博弈中率先做出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者:在博弈二人对局中行动滞后的那个人,与决策人要做出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,因此对

第二卷智猪博弈案例

第二卷智猪博弈案例 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 1 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

纳什均衡

1.纳什均衡:给出对方的策略,你所选的是最优的(至少不比其它策略差),如果每个局 中人都是这样,那么所构成的策略组合(对局),就称为纳什均衡。 2.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种 消费选择中所获得的愉悦或满足。 3.边际产量:当其他要素不变时,可变要素增加一个单位所带来的总产量的增加量。 4.生产成本:经营一个企业,为达到利润最大化,必须支付一些资金来维持运营,如建造 厂房,采购机器及原料,雇用员工等支出都可视为厂家的生产成本。 5.帕累托标准:如果一种变化可以改善某些人的处境,同时对其他人都没有伤害。则这种 变化是好事,应该给予实行。 6.恩格尔系数:是食品支出总额占个人消费支出总额的比重。一个家庭收入越少,家庭收 入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买食物的支出将会下降。恩格尔系数是用来衡量家庭富足程度的重要指标。 7.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种 消费选择中所获得的愉悦或满足。 8.价格管制:是指政府对新药定价以及上市药品价格上涨实施严格的管制,企业不能自由 定价,而是由政府和制药企业谈判决定新药的价格。 9.软着陆:当一个国家经过强劲的经济增长后,仍维持缓和的增长,并未因此转入衰退, 即使“软着陆”。 10.硬着陆:一个国家的经济在高速增长的同时伴随着高度通货膨胀,使得经济迅速从增高 长直接走入低增长甚至衰退。 11.通货膨胀:平均物价水平持续上扬的状态,通货膨胀率通常是以消费者物价指数(CPI) 的变化率来表示。指数上升→物价上升,货币购买力下降。 12.再贴现率:一般商业银行可以直接向中央银行借贷的利率。所谓“贴现”:通过一定的 方式把发生在未来(或不同时间)的费用和效益转化为现值的方式就叫贴现。 13.机会成本:在资源一定的情况下,多生产一个单位的某种产品,就要以少生产若干单位 的另一种产品为代价。这种放弃若干单位另一种产品生产的代价,就是生产某种成品的机会成本。 14.需求价弹性价格:指在市场需求曲线的任何一点,价格每变动1%所导致的需求量变动 的百分比。它是衡量产品需求量对产品价格变动的敏感指标。 15.生产函数(生产成本):企业在每个时期投入的各种生产要素的数量与获得的产出品的 数量之间的关系。 16.均衡及均衡价格:均衡:供给和需求达到平衡的状态。均衡价格:供需平衡时的价格。 有时被称为市场出清价格。 17.资源的概念及分类:指用于生产能满足人类需要的东西的那些物品或劳务。分类:自由 资源和经济资源 18.恩格尔曲线:某种商品的均衡购买量与消费者货币收入之间的关系。 1.药物需求与供给的特征:需求的特征:需求的不确定性、需求的最高优先性、需求的不 可替代性、需求的外部效应性、需求缺乏弹性、需求的被动性、独特的需求三方结构供给的特征:高质量性、高技术性、高投入性、高风险性、高回报性、高度集中性 2.影响药品需求的因素有哪些: (一)一般经济学因素:1.经济发展水平;2.价格水平(1)是否实施医疗保障制度(2)医疗保障制度下保障的范围(3)医疗保障制度的报销制度和自付比例等(二) 社会人口学因素(三)流行病学因素(四)临床医生和药师因素(五)医药技

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡 在纳什均衡中,你不一定满意其他的策略,但你的策略是回馈对手招数的最佳策略。 从囚徒困境中我们会发现,作为博弈各方的行动就是针对对方行动而确定的最佳对策,而一旦知道对方在做什么,就没人愿意改变自己的做法。博弈论学把这么一个结果称为均衡。这个概念是有普林斯顿大学数学家约翰·纳什提出的,因此被称为纳什均衡。 诺贝尔经济学奖获得者萨缪尔森有句名言,你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词,供给与需求。博弈论专家坎多瑞引申说:“要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是纳什均衡”。 1950年,还是一名研究生的纳什写了一篇论文,题为《n人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。 纳什的贡献是,他证明了在这一类的竞争中,在很广泛的条件下是有稳定解存在的,只要是别人的行为确定下来,竞争者就可以有最佳的策略。 那么,什么纳什均衡呢?简单说,就是一策略组合中,所有的参与者面临这样的一种情况:给定你的策略,我的策略是我最好的策略。给定我的策略,你的策略也是你最好的策略,即双方在对方给定的策略下不愿意调整自己的策略。 纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具,所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展,甚至说是一场革命。 纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战,按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果,

从纳什均衡引出一个悖论:从利己的目的触发,结果损人不利己。“囚徒困境”就是如此,从这个意义说,纳什均衡提出的悖论实际上动摇了西方经济学的基石。 纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。这个法则如下:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。 在囚徒困境中存在唯一的纳什均衡点,即两个囚犯均选择“招认”,这是唯一稳定的结果。 有些博弈的纳什均衡点不止一个,如下述夫妻博弈中有两个纳什均衡点。 丈夫和妻子商量晚上的活动,丈夫喜欢看拳击,而妻子喜欢欣赏歌剧,但两个人都希望在一起度过夜晚。在这个夫妻博弈中有两个纳什均衡点:要么一同去看歌剧,要么一同去看拳击。在有两个或两个以上纳什均衡点的博弈中,其最后的结果难以预测。在夫妻博弈中,我们无法知道,最后结果是一同欣赏歌剧还是一同看拳击。 是不是所有的博弈均存在纳什均衡点呢?不一定存在纯策略纳什均衡点,但至少存在一个混合策略均衡点。 这里所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略,所谓混合策略是指参与者采取的不是唯一的策略,而是其策略空间上的概率分布。 我们下面将在警察与小偷的博弈中给出混合策略的说明。 在西部片里,我们常能看到这样的故事:某个小镇上只有一名警察,他要负责整个镇的治安,现在我们假定,小镇的一头有一家酒馆,另一头有一家银行,再假定该地有一个小偷,要实施偷盗。因为分身乏术,警察一次只能在一个地方

纳什均衡不动点

纳什均衡的存在性与多重性 对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。所以,倘若某个概念所对应的事物并不存在。那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。 有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。 博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。 纳什在1950年代证明了纳什均衡的存在性定理,为非合作博弈打下了重要基础。纳什的工作不仅解决了存在性问题,而且还为其后的博弈论研究提供了一整套方法论工具,即运用不动点定理(fixed point theorem)这一强有力的数学工具进行博弈论数学分析,这对后来的博弈论甚至数理经济学的发展产生了很大的影响。纳什均衡的多重性问题至今仍是困扰博弈论学者的一个主要问题。为了攻克这一问题,博弈论专家已经做出了许多贡献,如聚点均衡、相关均衡,子博弈精炼纳什均衡,颤抖手均衡,序贯均衡等概念的提出。但不幸的是,这类努力还未使得多重均衡问题完全得到解决,许多博弈论专家正在这一领域进行着不懈的工作。 本章将给出纳什均衡的存在性定理和讨论存在多重均衡情况下的均衡选择问题。

博弈论与纳什平衡

博弈论与纳什平衡 博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。 纳什(John Nash)编制的博弈论经典故事"囚徒的困境",说明了非合作博弈及其均衡解的成立,故称"纳什平衡"。 所有的博弈问题都会遇到三个要素。在囚徒的故事中,两个囚徒是当事人(players)又称参与者;当事人所做的选择策略(strategies)是承认了杀人事实,最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人,另外一个抵赖,不承认杀人,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的死刑判决,在纳什故事中两个人都承认了犯罪事实,所以两个囚徒得到的是中间的结果。 类似的:我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。 在互联网这个原始丛林中:最优策略是如何产生的呢? 一、博弈中最优策略的产生 艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。 社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。 A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。 显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。 对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选C,他选D得5

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲 策略性博弈与纳什均衡 1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是 50020D Q p =- (1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。理由如下: 假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,A p 和B p 都不会严格大于10。否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足10A p ≤,10B p ≤。但是由于A p 的下限也是10,所以均衡时10A p =。给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。综上可知,均衡时的价格为10A p =,10B p ε=-。 (2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为: max pq cq ε>- ① 其中10p ε=-,()5002010q ε=-?-,把这两个式子代入①式中,得到: ()()0 max 1085002010εεε>----???? 解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-?--????。 (3)这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本,所以 如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1)中,第一个数表示A 的支付水平,第二个数表示B 的支付水平,a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”,那么: 表10-1 博弈的支付矩阵

博弈论和纳什均衡

博弈论和纳什均衡

关于博弈论和纳什均衡你应该知道这些 美股腾讯财经[微博]2015-05-25 10:05 我要分享 139 [摘要]纳什在与命运的博弈中找到均衡,纪念大师最好的方式就是尝试了解博弈论。 腾讯财经综合报道(风生)奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。事发当时,这辆出租车失控撞向栏杆,两人均被抛出车外。 约翰-纳什因发表两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。 不均衡人生中孕育出均衡论 纳什于1928年在美国西弗吉尼亚州出生,曾在麻省理工学院任教,晚年为普林斯顿大学担任数学系教授,死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名,1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。 纳什在数学领域上取得多项突破,但他同时深受精神分裂症困扰,其生平故事在2001年被改编成电影《美丽心灵》,赢得包括最佳电影在内的4项奥斯卡奖项。 尽管西维亚-纳萨斯(Sylvia Nasars)广为人知的小说《美丽心灵》(A Beautiful Mind)和改编自该书的、由拉塞尔-克罗(Russell Crowe)主演的

同名奥斯卡电影探究了纳什错综复杂的生平,但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界,人们普遍认为,与牛顿和爱因斯坦的数学理论相比,纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题,而纳什的数学却可以应用在生物学和社会学领域。 如若不是精神疾病的困扰,纳什今天可能已与那些科学伟人齐名。尽管如此,他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就,他与约翰海萨尼(John Harsanyi)和莱茵哈德-泽尔腾(Reinhard Selten)一起获得了1994年诺贝尔经济学奖。 什么是博弈论与纳什均衡 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 纳什均衡:又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰-纳什命名。假设有n人局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 近代对于博弈论的研究,开始于策墨咯,波雷尔及冯-诺伊曼。1928年,冯-诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯-诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰-福布斯-纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均

智猪博弈

在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待,一份也得不到;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 启示 在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。 如果再加上一些更为实际的条件,假设大猪小猪分别具有M、m饲料相当的能量,在等待一个单位时间内,两猪会同时消耗1份饲料相当的能量,且当消耗的能量大于一定比例后会虚弱。此时大猪完全可以等待。这样符合一些情况下的市场竞争原则。当然如果要考虑其他更复杂的因素,比如说大猪小猪单位时间消耗的能量不同,这又得考虑最佳能量比。所以智猪博弈只能在一些特殊环境下应用。 带给企业的启示

论博弈论与纳什均衡的影响及局限

论博弈论与纳什均衡的影响及局限 摘要:纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。同时,纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础。 关键词:纳什均衡、博弈论、影响、局限 引言:Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。以两家公司的价格大战为例,Nash 平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。纳什均衡理论正如克瑞普斯①书中所说,?在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。? 博弈论是研究决策主体的行为发生直接相互作用时候的决

以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 一.博弈论的影响 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。 博弈论所研究的是理性的决策者之间冲突及合作的理论,可以为实际决策提供理论基础和方向指导。其最终追求结果是使博弈方达到利益最大化的均衡。 博弈论不仅仅存在于数学的运筹学中,也正在经济学中占据越来越重要的地位,但如果你认为博弈论的应用领域仅限于此的话,那你就大错了。实际上,博弈论甚至在我们的工作和生活中无处不在!在工作中,你在和上司博弈,也在和下属博弈,你也同样会跟其他相关部门人员博弈;而要开展业务,你更是在和你的客户以及竞争对手博弈。在生活中,博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。诺贝尔经济学奖获得者包罗·萨缪尔逊如是说:要想在现代社会

纳什均衡点

纳什均衡点 纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。 如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。 [编辑本段]例子 经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。于是,两人同时陷入招供还是不招供的两难处境。如果两人均不招供,将最有利,只被判刑三年。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。这时,个体的理性利益选择是与整体的理性利益选择不一致的。 囚犯甲的博弈矩阵 囚犯甲 招供不招供 囚犯乙招供判刑五年甲判刑十年;乙判刑一年 不招供甲判刑一年;乙判刑十年甲判刑三年 基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。 [编辑本段]学术争议和批评 第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较 【摘要】均衡概念是构成整个博弈论的基石,对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。本文首先将博弈划分为不同的类型,并对主要的均衡概念进行了数学描述,最后对不同的均衡概念进行了比较。 【关键词】博弈论;纳什均衡;重复博弈 博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。因此,本文将主要的博弈均衡概念进行分类和表述,并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。 一、博弈的主要类型 博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。依据不同的分类标准,博弈可以被划分为不同的类型。 1、静态博弈、动态博弈和重复博弈 博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。 2、完全信息和不完全信息博弈 完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。 3、完美信息和不完美信息博弈 在动态博弈中,一参与人完全了解在自己行为之前的博弈进程,则称此参与人为有完美信息的参与人,如果博弈中所有的参与人都具有完美信息,则称此动态博弈为完美信息的动态博弈。反之,如果在存在具有不完美信息的参与人(参

智猪博弈理论

智猪博弈理论 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 目录 介绍 博弈与制度 由智猪博弈故事得到的启示 编辑本段介绍 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 小猪 行动等待 大猪行动5,14,4 等待9,-10,0  从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。

在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。 编辑本段博弈与制度 由智猪博弈故事得到的启示 在这个例子中,对小猪而言,无论大猪是否踩动踏板,不去踩踏板总比踩踏板好。反观大猪,明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。 对于企业经营者来说,如何理解博弈论,如何运用博弈论原理指导企业有效管理,这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系,以及在与政府的关系和合作等多方面,博弈论都是企业经营者十分有效的决策工具,或者至少是比较科学的决策思路。 还有一个经典案例,是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只是运送犯人的费用要等到犯人送到澳洲后才由政府支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 关于这一问题,现任招商局掌门人秦晓先生在最近做客央视《对话》节目时,也谈了他的一些看法。他认为:企业领导人应该去制定游戏规则,而不应该单纯地去做裁判。他觉得制度应当比个人的权威

相关主题
文本预览
相关文档 最新文档