当前位置：文档之家› 定义纳什均衡定义纳什均衡-上海财经大学经济学院

定义纳什均衡定义纳什均衡-上海财经大学经济学院

:定义: 纳什均衡

策略式博弈中策略组合是个纳什均衡如果给定?策略式博弈中，策略组合s ?是一个纳什均衡，如果给定其他参与者选择了策略组合s ??i ，对每一个参与者i 而言选收益都不低于选择其他任何策略即

择策略的s*i 收益都不低于选择其他任何策略。即，u i (s ?) ≥ u i (s i , s ??i ) for every s i ∈S i ?

s*i ∈arg Max u i (s i , s ??i )= u i (s ?1, …, s ?i-1, s i , s ?i+1, …s ?N )

for all for all

i ∈I ?s*i ∈B i (s*-i ) for all i ∈I

(Vickrey 例：二级价格密封拍卖(Vickrey 拍卖)

?SPA(c r c, r )：

–入场费：c=0–拍卖底价：r=0

–策略：b i (v ) ∈{ No} ∪[ r , ∞)

v ∈[0, 1]

支付：如果不报价收益为–支付：如果不报价，收益为0

如果报价，那么-- if i i i i v z c b z

>?(,,)()() if - if i i i i i i i

i i u b z c p b v z c b z c b z

=??=??

–p (b i )：当出现平局时的竞拍人i 赢得拍卖的概率

例：英式拍卖(级价格公开叫价)

一级价格公开叫价

按钮拍卖（button auction）

?button auction

–每个人都有一个按钮，

–按着按钮：表示继续参加拍卖

–不按按钮：表示退出，一旦退出不能再次加入

–当只有个人仍然按着按钮时，价格不再上升，拍卖

当只有一个人仍然按着按钮时价格不再上升拍卖

结束。

–假设：当竞拍人按着按钮时，不知道有多少人还按着

(v) ∈{ No} ∪[ r, ∞)v∈[0, 1]?竞拍人的策略集：b

如果

–c=0, r=0, b(v)=v是每个竞拍人的弱占优策略

–w E= v(2)=w2

–E[w E]= E[w2]

第十讲混合策略

夏纪军

上海财经大学经济学院

L10

L10. 混合策略均衡? A. 混合策略

? B. 期望支付函数

期望支付数

? C. 混合策略纳什均衡C

? D.D. 报警博弈

? F. Approaching Cars ?G. 专家诊断博弈

例猜硬币博弈

Player 2?例：猜硬币博弈1, -1-1, 1Tail(1-q )

Head (p )Head (q )

Player 1Player 2

-1, 1

1, -1

Tail (1-p )

Player 1

?混合策略

–参与者1：

Head 1?以p 的概率选择Head,以1-p 的概率选择Tail

?概率分布：α1=(Prob(s 1=Head), Prob(s 1=Tail)=(p , 1-p )参与者–2：

?以q 的概率选择Head,以1-q 的概率选择Tail 概率分布(P b(H d)P b(T il)1?概率分布：α2=(Prob(s 2=Head), Prob(s 2=Tail)=(q , 1-q )

混合策略

定义

?定义：–参与者的混合策略是定义在参与者纯策略集上的一个

概率分布设定了选择每个纯策略的概率概率分布，设定了选择每个纯策略的概率。–S i ＝{s i 1,s i 2, …, s i k }

–αi =(Prob(s i 1), …., Prob(s ik ))–参与者i 的混合策略集：?S i

–

混合策略组合：α=(α1,α2,…,αn )

A A.

混合策略Player 2

L (C (R (1L (

q 1) C (q 2)R (1-q 1-q 2)Player 1T (p 1)

0, 23, 31, 1M (4, 00, 42, 3参与者Player 1

M (p 2),,,B (1-p 1-p 2)

3, 4

5, 1

0, 7

?1:

–纯策略集：{T, M, B }混合策略–混合策略：α1=(p 1, p 2,1-p 1-p 2)

?α1(T)=p 1, α1(M)=p 2, α1(B)=1-p 1-p 2.2:

?参与者2: –α2=(q 1, q 2,1-q 1-q 2)

B B. 期望支付函数

Player 2

Head(q)Tail(1-q)

Player 1Head (p)-1 , 11, -1 Tail(1-p)1, -1-1 , 1

?给定策略组合(α1, α2)= ((p, 1-p), ( q,1-q))

A{(H H)(H T)(T H)(T T)}

–A={(H,H), (H,T), (T,H), (T,T)}

–g(α1, α2)

(H H)(1(H T)(1(T H)(1)(1(T T))

=(pqο(H,H), p(1-q)ο(H,T), (1-p)qο(T,H), (1-p)(1-q)ο(T,T))–参与者1 的期望支付

E)(H H)+(1(H T)

Eu1(α1, α2) = pq u1(H,H)+p(1-q)u1(H,T)

+(1-p)qu1(T,H)+ )+(1-p)(1-q)u1(T,T)

B B.

期望支付函数Player 2

Head(q)

Tail(1-q )

Head (p)11Player 1

Head (p)-1 , 11, -1Tail(1-p)

1, -1

-1 , 1

?给定策略组合(α1, α2)=((p , 1-p ), ( q,1-q ))–参与者1 的期望支付

Eu 1(α1, α2) = pq u 1(H,H)+p (1-q )u 1(H,T)

+(1-qu (T,H)+ )+(1-)(1-u (T,T)(p )q 1())(p )(q )1()= p [q u 1(H,H)+(1-q )u 1(H,T)]+(1-) [qu (T,H)+ )+(1-u (T,T)](p )[q 1(,))(q )1(,)]= p ·u 1(H, α2)+(1-p ) ·u 1(T, α2 )=p · (1-2)+(1-) · (2q-1p (q )(p )(q )

B B.

期望支付函数Player 2

Head(q)

Tail(1-q )

Player 1

Head (p)-1 , 11, -1Tail(1p)1

1?给定策略组合, 1-), ( 1-Tail(1-p)

1, -1-1 , 1

((p ,p ),(q,q ))

–参与者1 的期望支付

?Eu α, α) =pEu (H, α)+(1-pEu (T, α2(1,2)p 1(,2)(p )p 1(,2)=p·(1-2q )+(1-p )·(2q-1)–2参与者2 的期望支付函数

?Eu 2(α1, α2) = qEu 2(α1,H) + (1-q )Eu 2(α1,T)

=q·p-)+(1-)·(1-2 q (2p 1)+(1q )(12p )

B B. 期望支付函数

Player 2

L C

L C R

Player1T0, 23, 31, 1 M4, 00, 42, 3

Player 1M ,,,

B3, 45, 10, 7

?混合策略: α1=( p1, p2, p3); α2=(q1, q2, q3)

?参与者1的期望支付:

–EU1(α1, α2) = p1[q1·0+ q2·3 + q3·1]

+ p[q·4+q·0+q·2]

2123

+ p3[q1·3 + q2·5 + q3·0]

=α(T) EU(T, α)+α(M) EU(M, α)+α(B) EU(B, α) 112112112

B B.

期望支付函数–EU α, α)

1(1,2)=α1(T) EU 1(T, α2)+α1(M) EU 1(M, α2)+α1(B) EU 1(B, α2)

)

EU ∑–11

1121

(,)()(,s S EU s s αααα

∈=

)()()

∑22

1122

2112(,,s S EU s s u s s αα

∈=

?11221121122112(,)()()(,)s S s S EU s s u s s αααα∈∈?

=??

∑∑1122

1122112,()()(,)

s S s S s s u s s αα∈∈=

∑

策略式博弈（含混合策略）

定义个?: ( vNM 偏好策略式博弈) 一个vNM 策略式博弈由以下几部分构成：

–参与者集合

–每个参与者的纯策略集

–每个参与者对所有混合策略组合的偏好关系，以及表示该好关系的期望支付函数。

?(,)()()(,)i i i i i i i i i i i i i i s S s S EU s s u s s αααα??????∈∈?

=??

∑∑()()(,)

i i i i i i i s s u s s αα???=

∑

,i i i i

s S s S ??∈∈

C C.

混合策略均衡?定义:

–一个混合策略组合α* 是一个（混合策略）纳什均衡，

如果对所有的参与者i 都有：

EU i (α*i , α*-i ) EU i (αi , α*-i ) ?αi ∈?S i .

?纯策略NE ：策略式博弈中，策略组合s 是一个纳什均衡，如果对每一个参与者i 都有

u s ) ≥ u s , s ?) for every s ∈S i ()

i (i ,i )y i i

C C.

混合策略均衡混合策略组合?α* 是纳什均衡当且仅当对所有的参与者都有α*i ∈B i (α*-i )

?如果每个参与者都有最优反应函数b i (α-i )，那么混*合策略组合α 是纳什均衡的充分必要条件是：–α*i = b i (α*-i ) i =1,2,…,N

C C.

混合策略均衡：例1Player 2Player 2

Head

Tail

Head -1 , 11, -1Player 1

,,Tail

1, -1

-1 , 1

p 1-p

?参与者1 的最优反应函数B 1(q ):

1-q

p 1Max p ∈[0,1]Eu 1(p , q ) = p·(1-2q )+(1-p )·(2q-1)–Eu ′1=2-4q

B 1(q )

1/2

?For q <0.5, p ＝1?For q>0.5, p ＝0For q=05[01]

1/2

?For q=0.5, p ∈[0,1]

C C.

混合策略均衡：例1Player 2Player 2

Head

Tail

Head -1 , 11, -1Player 1

,,Tail

1, -1

-1 , 1

p 1-p

?参与者2 的最优反应函数B 2(p ):

1-q

Max q ∈[0,1]Eu 2(p , q ) =q·(2p-1)+(1-q )·(1-2q )–Eu ′2=4 p-2

p 1B 2(p )

B 1(q )

?For p <0.5, q ＝0?For p>0.5, q ＝1For =05[01]

1/2

?For p =0.5, q ∈[0,1] 1

1/2

C C.

混合策略均衡：例1Player 2?参与者1的最优反应函数B 1(q ):

–For q <0.5, p ＝1

F <05y Head Tail Pl 1

Head -1 , 11, -1p –For q <0.5, p ＝0–For q=0.5, p ∈[0,1]?2B ):

1-q

Player 1Tail

1, -1-1 , 11-p

参与者的最优反应函数2(p )–For p <0.5, q ＝0–For p>0.5, q ＝1F 05[01]

Mixed strategy

Nash equilibrium

1–For p =0.5, q ∈[0,1] ?((0.5,0.5)((0.5,0.5))

1/2

NE ：((0.5,0.5)((0.5, 0.5)) –p = 0.5 ∈B 1(0.5)

–q = 0.5 ∈B 2(0.5)

1/2

The Stag hunt

例2：The Stag hunt ()()

?给定α1=(p ,1-p ) 和α2=(q ,1-q ) –参与者1

?EU 1(α1, α2)= pq·2 +p (1-q )·0 + (1-p )q·1 + (1-p )(1-q )·1=2 pq-p-q+1

?EU 1/?p=2q-1–最优反应函数

?For q >0.5, p =1;?For q <0.5, p =0;Hare(1-q)

Stag (q)Hunter 2?For q =0.5, p ∈[0.1].(2,2)

(0,1)

Stag(p)

Hunter 1(1,0)

(1,1)

Hare(1-p)

Hunter 1

纳什均衡

纳什均衡简介纳什均衡，又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。一个策略组合被称为纳什均衡，当每个博弈者的均衡策略都是为了达到自己期望收益的最大值，与此同时，其他所有博弈者也遵循这样的策略。纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是约翰·纳什在普林斯顿大学攻读博士学位时完成的。实际上，博弈论的研究起始于1944年冯·诺依曼（ Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“ 非合作博弈”做了明确的区分和定义。阿尔伯特·塔克（Albert tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。在概念和方法两方面，该论文都是作者的独立创造。” 纳什均衡例子博弈论中一个著名的例子就是囚徒困境。囚徒困境是一个非零和博弈，说的是两个嫌疑犯甲和乙私人民宅联手作案，被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑3个月，对方将被判刑10年；若两人都不招供则因未获证据但私人民宅将各拘留1年；如果两人均招供，每人将被判刑5年。于是，两个人同时陷入招供还是不招供的两难处境。结果是，尽管甲不知乙是否招供，但他认为自己选择“招供”最好，因而甲会选择“招供”，同样乙也会选择“招供”，两人各判5年。而两人都选择不招供，虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年；乙判刑三个月不招供

浅析囚徒困境与纳什均衡

浅析囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子，指反映个人最佳选择并非团体最佳选择。囚徒困境的经典案例这里不再复述，让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境：减轻中小学生过重负担喊了20多年，仅1985年至2000年的15年里，中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效，中小学生课业负担不减反增。又比如近年来炒得火热的楼市——“我没买房，结果房价还是涨了，因为我们无法保证大家都不买房。可是，我错了吗？没有。当初如果我买房了，房价下跌了呢？因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下，房价竟还能且调且涨。可是，我对了吗？没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”：买，难担高房价重负；不买，难受房价节节攀升的煎熬。再看中国的法治之路。虽然法治让所有人都长期受益，甚至执政者自己也不例外，但是一个狭隘理性社会却偏偏无力支撑法治，以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人，不会故意给自己找茬，多数律师也不例外。不过，任何事物都有两面性，“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”：一种行为模式对于个人看起来是很理性的，但是对于个人构成的集体来说却是非理性的，最后对于每个人来说也是非理性的。我们都不敢站出来说话，对每个人来说都是很“理性”的一种行为方式，但最后的结果只能是让整个社会丧失法治。但囚徒困境一定是坏事吗？就以囚徒困境的经典案例来说，作为一个比喻，我们会为囚犯不能合作而遗憾；可是如果它发生在现实中，我们就巴不得他们不能合作。然而如果是多次博弈，人们就有了合作的可能性，囚徒困境就有可能破解，合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解，这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明，要想使合作成为多次博弈的均衡解，博弈的一方（最好是实力更强的一方）必须主动通过可信的承诺，向另一方表示合作的善意，努力把这个善意表达清楚，并传达出去。比如在楼市的囚徒困境中，政府能适当调控房价，给予购房者房价稳定合理的承诺，那么楼市的囚徒困境是有可能破解的。在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出

纳什均衡

1.纳什均衡：给出对方的策略，你所选的是最优的（至少不比其它策略差），如果每个局中人都是这样，那么所构成的策略组合（对局），就称为纳什均衡。 2.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。 3.边际产量：当其他要素不变时，可变要素增加一个单位所带来的总产量的增加量。 4.生产成本：经营一个企业，为达到利润最大化，必须支付一些资金来维持运营，如建造厂房，采购机器及原料，雇用员工等支出都可视为厂家的生产成本。 5.帕累托标准：如果一种变化可以改善某些人的处境，同时对其他人都没有伤害。则这种变化是好事，应该给予实行。 6.恩格尔系数：是食品支出总额占个人消费支出总额的比重。一个家庭收入越少，家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大，随着家庭收入的增加，家庭收入中或者家庭支出中用来购买食物的支出将会下降。恩格尔系数是用来衡量家庭富足程度的重要指标。 7.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。 8.价格管制：是指政府对新药定价以及上市药品价格上涨实施严格的管制，企业不能自由定价，而是由政府和制药企业谈判决定新药的价格。 9.软着陆：当一个国家经过强劲的经济增长后，仍维持缓和的增长，并未因此转入衰退，即使“软着陆”。 10.硬着陆：一个国家的经济在高速增长的同时伴随着高度通货膨胀，使得经济迅速从增高长直接走入低增长甚至衰退。 11.通货膨胀：平均物价水平持续上扬的状态，通货膨胀率通常是以消费者物价指数（CPI）的变化率来表示。指数上升→物价上升，货币购买力下降。 12.再贴现率：一般商业银行可以直接向中央银行借贷的利率。所谓“贴现”：通过一定的方式把发生在未来（或不同时间）的费用和效益转化为现值的方式就叫贴现。 13.机会成本：在资源一定的情况下，多生产一个单位的某种产品，就要以少生产若干单位的另一种产品为代价。这种放弃若干单位另一种产品生产的代价，就是生产某种成品的机会成本。 14.需求价弹性价格：指在市场需求曲线的任何一点，价格每变动1%所导致的需求量变动的百分比。它是衡量产品需求量对产品价格变动的敏感指标。 15.生产函数（生产成本）：企业在每个时期投入的各种生产要素的数量与获得的产出品的数量之间的关系。 16.均衡及均衡价格：均衡：供给和需求达到平衡的状态。均衡价格：供需平衡时的价格。有时被称为市场出清价格。 17.资源的概念及分类：指用于生产能满足人类需要的东西的那些物品或劳务。分类：自由资源和经济资源 18.恩格尔曲线：某种商品的均衡购买量与消费者货币收入之间的关系。 1.药物需求与供给的特征：需求的特征：需求的不确定性、需求的最高优先性、需求的不可替代性、需求的外部效应性、需求缺乏弹性、需求的被动性、独特的需求三方结构供给的特征：高质量性、高技术性、高投入性、高风险性、高回报性、高度集中性 2.影响药品需求的因素有哪些：（一）一般经济学因素：1.经济发展水平；2.价格水平（1）是否实施医疗保障制度（2）医疗保障制度下保障的范围（3）医疗保障制度的报销制度和自付比例等（二）社会人口学因素（三）流行病学因素（四）临床医生和药师因素（五）医药技

博弈论知识点总结

博弈论知识总结博弈论概述： 1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设： 1、决策主体是理性的，最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别： 3、博弈论与传统决策的区别： 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P ,I)，其中P 为市场价格，I 为消费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

纳什均衡不动点

纳什均衡的存在性与多重性对于数学家来说，一个数学概念的存在性与唯一性是特别需要加以关注的。这是因为，从形式逻辑角度看，如果某个事物并不存在，那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的，因为对于不存在的事物来说，任何关于它的陈述或判断都不可能加以证伪。所以，倘若某个概念所对应的事物并不存在。那么，关于这个概念所给出的研究结论都必然不存在被证伪的可能。因而根据波普尔的证伪主义观点，这样的研究不具备科学上的意义。所以，我们在对任何新提出来的数学概念加以系统研究之前，首先需要弄清楚所研究的对象事物是否存在。有许多被称为伪科学的东西，它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。譬如，所谓的特异功能或“超灵学”并未得到证实，而UFO研究迷们至今也未能拿出一件存在球外生命的证据，所以，特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。除了存在性之外，概念事物的唯一性也是数学家们所关心的问题。从纯理论的兴趣上看，数学家们更多地是从审美的角度上看待概念的唯一性，但从波普尔的证伪主义哲学看，模型均衡解的唯一性关系到模型的预测功能，从而是科学理论应基本具有的特征。我们在第二章中曾指出，理论的预测功能是判别理论的科学性的准绳，而在第三章中，我们提出用纳什均衡作为模型的预测结果。按照这样的逻辑，一个自然的推论就是：模型能否具有科学意义取决于纳什均衡的唯一性。因为倘若纳什均衡不是唯一的，那么就难以根据模型对即将出现的结果加以预测，这种不确定性对于科学理论来说是不存在的。再加上前面谈到的存在性问题，我们可以这样说，模型能否具有科学意义取决于纳什均衡的存在性和唯一性，因为这正是科学理论所具有的基本性质。博弈论目前发展的情况是这样的：已经证明在非常一般的情况下，纳什均衡是存在的，这是一个好的结果；但是，在许多情形，模型的纳什均衡解不是唯一的，这被称为纳什均衡的多重性问题。纳什在1950年代证明了纳什均衡的存在性定理，为非合作博弈打下了重要基础。纳什的工作不仅解决了存在性问题，而且还为其后的博弈论研究提供了一整套方法论工具，即运用不动点定理(fixed point theorem)这一强有力的数学工具进行博弈论数学分析，这对后来的博弈论甚至数理经济学的发展产生了很大的影响。纳什均衡的多重性问题至今仍是困扰博弈论学者的一个主要问题。为了攻克这一问题，博弈论专家已经做出了许多贡献，如聚点均衡、相关均衡，子博弈精炼纳什均衡，颤抖手均衡，序贯均衡等概念的提出。但不幸的是，这类努力还未使得多重均衡问题完全得到解决，许多博弈论专家正在这一领域进行着不懈的工作。本章将给出纳什均衡的存在性定理和讨论存在多重均衡情况下的均衡选择问题。

答疑]动态博弈与子博弈精练纳什均衡

我们已经了解了完全信息静态博弈的内容。这时候，参与人同时行动，或者不同时行动，但是后动的人观察不到先动的人的任何有关其行动的信息，这于同时行动等价。这时候，任何一个参与人选择行动的时候，没有任何可以依据的信息。当博弈成为动态的时候，参与人先后行动，后动者可以观察到先动者的行动，因此，后动者选择他的行动的时候，可以依据观察到的信息作选择。因为先动者可能采取的行动是若干个，所以后动者就有可能观察到同样多的信息。因此，这时后动者选择的已经不简单的行动，而是一套完整的行动计划——这套行动计划指出，在观察到不同的信息时该怎样随机应变选择自己的行动。因此，现在后动者的选择变量就是行动计划，我们就把一套完整的行动计划叫做一个策略。以下图为例，参与人1先动，之后参与人2行动，参与人2可以观察到参与人1的选择。参与人的选择就是L或者R，这既是他的行动有时他的策略，因为参与人1行动时可能出现的信息只有一种情况——空信息集——因为他先动，这时什么信息也没有。1行动之后，1的行动可以被2观察，因此2可能观察到的信息就有可能是L或者R，因此，2的行动会根据这些信息作出。2的一套完整的行动计划应该告诉他，在观察到L时选择什么，观察到R时选择什么，由此我们也可以看出，如果2把行动的选择委托给另外的人，这个人可以根据2的行动计划处理任何可能发生或者面对的形式。这样，2的行动计划——我们称为策略，就有四种可能： 1，观察到L时，选F，观察到R时，选F。我们用一个有序二维向量（F，F）表示。 2，观察到L时，选F，观察到R时，选C。我们用一个有序二维向量（F，C）表示。 3，观察到L时，选C，观察到R时，选F。我们用一个有序二维向量（C，F）表示。 4，观察到L时，选C，观察到R时，选C。我们用一个有序二维向量（C，C）表示。总结：参与人1的行动是L或者R，由于是先动，没有信息，所以策略也就是行动。参与人2的行动是F或者C，由于是后动，有信息，策略是建立在信息上的完整行动——计划，有四个策略：（F，F），（F，C）（C，F）（C，C）。参与人1 L R 参与人2 参与人2 F C F C 6 4 5 8 6 1 ‐10 ‐3

浅析囚徒困境与纳什均衡

浅析囚徒困境令狐采学囚徒困境是博弈论的非零和博弈中具代表性的例子，指反映个人最佳选择并非团体最佳选择。囚徒困境的经典案例这里不再复述，让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境：减轻中小学生过重负担喊了20多年，仅1985年至2000年的15年里，中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效，中小学生课业负担不减反增。又比如近年来炒得火热的楼市——“我没买房，结果房价还是涨了，因为我们无法保证大家都不买房。可是，我错了吗？没有。当初如果我买房了，房价下跌了呢？因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下，房价竟还能且调且涨。可是，我对了吗？没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的

经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”：买，难担高房价重负；不买，难受房价节节攀升的煎熬。再看中国的法治之路。虽然法治让所有人都长期受益，甚至执政者自己也不例外，但是一个狭隘理性社会却偏偏无力支撑法治，以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人，不会故意给自己找茬，多数律师也不例外。不过，任何事物都有两面性，“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”：一种行为模式对于个人看起来是很理性的，但是对于个人构成的集体来说却是非理性的，最后对于每个人来说也是非理性的。我们都不敢站出来说话，对每个人来说都是很“理性”的一种行为方式，但最后的结果只能是让整个社会丧失法治。但囚徒困境一定是坏事吗？就以囚徒困境的经典案例来说，作为一个比喻，我们会为囚犯不能合作而遗憾；可是如果它发生在现实中，我们就巴不得他们不能合作。然而如果是多次博弈，人们就有了合作的可能性，囚徒困境就有可能破解，合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解，这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明，要想使合作成为多次博弈的均衡解，博弈的一方（最好是实力更强的一方）必须主动通过可信的承诺，向另一方表示合

高鸿业,微观经济学,第七版,课后答案,西方经济学18第十章博弈论初步

第十章博弈论初步第一部分教材配套习题本习题详解一、简答题１．什么是纳什均衡？纳什均衡一定是最优的吗？解答：（１）所谓纳什均衡，是参与人的一种策略组合，在该策略组合上，任何参与人单独改变策略都不会得到好处。（２）不一定。如果纳什均衡存在，纳什均衡可能是最优的，也可能不是最优的。例如，在存在多个纳什均衡的情况下，其中有一些纳什均衡就不是最优的；即使在纳什均衡是唯一时，它也可能不是最优的，因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如：囚徒困境。２．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡最多可有几个？为什么？解答：在只有两个参与人（如Ａ和Ｂ）且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡最多可有四个。例如，当Ａ与Ｂ的支付矩阵可分别表示如下时，总的支付矩阵中所有四个单元格的两个数字均有下划线，从而，总共有四个纳什均衡。 A 的支付矩阵＝??????22211211a a a a B 的支付矩阵＝??? ???2221 1211b b b b 例如：a 11=a 12=a 21=a 22，b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。具体事例为： 73737373?? ?? ??

３．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡可能有三个。试举一例说明。解答：在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，纯策略的纳什均衡可能有４个、３个、２个、１个和0个五种情况，所以可能有３个。例如，当参与人Ａ与Ｂ的支付矩阵可分别表示如下时，总的支付矩阵中恰好有三个单元格的两个数字均有下划线，从而，总共有三个纳什均衡。 A 的支付矩阵＝ ??? ???22211211a a a a B 的支付矩阵＝11122122b b b b ???????? A 、 B 共同的支付矩阵＝1111121222222121a b a b a b a b ?? ?????? 具体事例为： 76157323?? ?? ?? ４．在只有两个参与人且每个参与人都只有两个策略可供选择的情况下，如何找到所有的纯策略纳什均衡？解答：可使用条件策略下划线法。具体步骤如下：首先，把整个博弈的支付矩阵分解为两个参与人的支付矩阵；其次，在第一个（即位于整个博弈矩阵左方的）参与人的支付矩阵中，找出每一列的最大者，并在其下画线；再次，在第二个（在位于整个博弈矩阵上方的）参与人的支付矩阵中，找出每一行的最大者，并在其下画线；然后，将已经画好线的两个参与人的支付矩阵再合并起来，得到带有下划线的整个博弈的支付矩阵；最后，在带有下划线的整个的支付矩阵中，找到两个数字之下均画有线的支付组合。由该支付组合代表的策略组合就是博弈的纳什均衡。５．设有Ａ、Ｂ两个参与人。对于参与人Ａ的每一个策略，参与人Ｂ的条件策略有无可能不止一个？试举一例说明。解答：例如，在如表１０—１的二人同时博弈中，当参与人Ａ选择上策略时，参与人Ｂ既可以选择左策略，也可以选择右策略，因为他此时选择这两个策略的支付是完全一样的。因此，对于参与人Ａ的上策略，参与人Ｂ的条件策略有两个，即左策略和右策略。表１０—１

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡 1．假设厂商A 与厂商B 的平均成本与边际成本都是常数，10A MC =，8B MC =，对厂商产出的需求函数是 50020D Q p =- （1）如果厂商进行Bertrand 竞争，在纳什均衡下的市场价格是多少？（2）每个厂商的利润分别为多少？（3）这个均衡是帕累托有效吗？解：（1）如果厂商进行Bertrand 竞争，纳什均衡下的市场价格是10B p ε=-，10A p =，其中ε是一个极小的正数。理由如下：假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ，那么必有10A p ≥，8B p ≥，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，A p 和B p 都不会严格大于10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足10A p ≤，10B p ≤。但是由于A p 的下限也是10，所以均衡时10A p =。给定10A p =，厂商B 的最优选择是令10B p ε=-，这里ε是一个介于0到2之间的正数，这时厂商B 可以获得整个市场的消费者。综上可知，均衡时的价格为10A p =，10B p ε=-。（2）由于厂商A 的价格严格高于厂商B 的价格，所以厂商A 的销售量为零，从而利润也是零。下面来确定厂商B 的销售量，此时厂商B 是市场上的垄断者，它的利润最大化问题为： max pq cq ε>- ① 其中10p ε=-，()5002010q ε=-?-，把这两个式子代入①式中，得到： ()()0 max 1085002010εεε>----???? 解得0ε=，由于ε必须严格大于零，这就意味着ε可以取一个任意小的正数，所以厂商B 的利润为：()()500201010εε-?--????。（3）这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本，所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格，那么厂商B 的利润和消费者的剩余就都可以得到提高，同时又不损害厂商A 的剩余（因为A 的利润还是零）。 2．（单项选择）在下面的支付矩阵（表10-1）中，第一个数表示A 的支付水平，第二个数表示B 的支付水平，a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”，那么：表10-1 博弈的支付矩阵

浅析囚徒困境与纳什均衡

浅析囚徒困境欧阳学文囚徒困境是博弈论的非零和博弈中具代表性的例子，指反映个人最佳选择并非团体最佳选择。囚徒困境的经典案例这里不再复述，让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境：减轻中小学生过重负担喊了20多年，仅1985年至2000年的15年里，中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效，中小学生课业负担不减反增。又比如近年来炒得火热的楼市——“我没买房，结果房价还是涨了，因为我们无法保证大家都不买房。可是，

我错了吗？没有。当初如果我买房了，房价下跌了呢？因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下，房价竟还能且调且涨。可是，我对了吗？没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”：买，难担高房价重负；不买，难受房价节节攀升的煎熬。再看中国的法治之路。虽然法治让所有人都长期受益，甚至执政者自己也不例外，但是一个狭隘理性社会却偏偏无力支撑法治，以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人，不会故意给自己找茬，多数律师也不例外。不过，任何事物都有两面性，“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”：一种行为模式对于个人看起来是很理性的，但是对于个人构成的集体来说却是非理性的，最后对于每个人来说也是非理性的。我们都不敢站出来说话，对每个人来说都是很“理性”的一种行为方式，但最后的结果只能是让整个社会丧失法

纳什均衡的重要影响及其问题局限

研究领域：微观经济学纳什均衡的重要影响及其问题局限高红阳（东北师范大学传媒科学学院，吉林长春 130117；吉林大学管理学院博士生，吉林长春 130022）摘要：纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，其对经济学以及其他社会科学甚至自然科学产生了重要影响。尽管纳什均衡理论及其应用得到了空前的肯定，但近年来纳什均衡分析却遭到了前所未有的质疑。论文从理性前提、犯错误、多重性、静态分析、动态分析、期望效用等六个角度论述了目前理论所存在的问题局限，而且将学界尝试解决上述问题的有限理性、好像理性、颤抖手均衡、聚焦均衡、风险占优均衡、帕累托最优均衡、防联盟均衡、相关均衡等方法一并加以讨论阐述。关键词：纳什；纳什均衡；局限博弈论（game theory）研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，纳什均衡（Nash Equilibrium）是博弈解的一般名称，是当前博弈理论体系的核心概念。从1994年纳什（Nash）、泽尔腾（Selten）和海萨尼（Harsanyi）三位博弈论专家获得诺奖，博弈论一直是十余年来学界最活跃的研究领域之一，被经济学、政治学、生物学、军事学等许多学科奉为重要的方法论基础。 1纳什均衡的重要影响 1.1纳什及纳什均衡的得来纳什1928年生于美国西弗吉尼亚州。关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是纳什在普林斯顿大学攻读博士学位时完成的。实际上，博弈论的研究起始于1944年冯·诺依曼（Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“非合作博弈”做了明确的区分和定义。图克（Tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。在概念和方法两方面，该论文都是作者的独立创造。” 1.2纳什均衡的重要影响纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，正如克瑞普斯（Kreps，1990）在《博弈论和经济建模》一书的引言中所说，“在过去的一二十年内，经济学在方法论以及语言、概念等方面，经历了一场温和的革命，非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面（谢识予，1999）：（1）改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等，均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域，改变了这些学科领域的内容和结构，成为这些学科领域的基本研究范式和理论分析工具，从而改变了原有经济学理论体系中各分支学科的内涵。（2）扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济

浅谈纳什均衡

浅谈纳什均衡第一次接触到纳什均衡是在电影《美丽心灵》里边，主人公约翰·纳什经过不断探索和创新提出了他梦想的原创理论——纳什均衡定律。关于纳什均衡的来源，有一段有趣的小故事。约翰·纳什假设有四男五女，其中有位女士长得非常漂亮以至于所有的男士都去追求这个女士。由于漂亮女士的天生孤傲，她拒绝了所有人的追求。于是这四个男士退而求其次，去追求另外四个女士。而这四个女士都不想作为第二个选择，所以都拒绝了这四个男士，公共利益为零。这时，约翰·纳什就想道：如果这四个男士一开始都不去追求那位漂亮女士而是直接去追求那四个不那么漂亮的女士，那么毫无疑问都会成功，这时公共效益达到最大。不管信还是不信，这个故事便是纳什均衡的最初来源了。亚当·斯密，现代经济学之父，曾经提出：在竞争中，个人的野心往往会促进公共效益。但是约翰·纳什在普林斯顿大学发表的博士论文彻底推翻了统治了经济学界100多年的亚当·斯密的重要理论。经过一段时间后，纳什的理论像是一个炸弹爆炸在了各相关学界，引起了相当大的轰动。约翰·纳什也由于他的原创理论获得了1994年的诺贝尔经济学奖。随着时间的推移，纳什的理论逐渐进入到博弈学领域，并且成为博弈学界不可或缺的支撑理论。纳什均衡的定义：假设有n个局中人参与博弈，给定其他人策略

的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。纳什均衡达成时，并不意味着博弈双方都处于不动的状态，在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态。标准定义，在博弈G=﹛S1,…,Sn：u1,…,un﹜中，如果由各个博弈方的各一个策略组成的某个策论组合（s1*,…,sn*）中，任一博弈方i的策论si*，都是对其余博弈方策略的组合（s1*,…s*i-1,s*i+1,…,sn*）的最佳对策，也即ui（s1*,…s*i-1, si*,s*i+1,…,sn*）≥ui（s1*,…s*i-1, sij*,s*i+1,…,sn*）对任意sij∈Si都成立，则称（s1*,…,sn*）为G的一个纳什均衡。关于纳什均衡最经典的案例莫过于囚徒困境了，关于这个经典案例已经分析得太多太多，这里就不详细介绍了。那么就通过生活中的例子来简单加入纳什均衡定理吧。话说马上就要期末考试了，有小A同学和小B同学两位刻苦学习的好孩子。他们相约一起复习，假设两人对各个学科的掌握情况不一致，小A对《经济学原理》比较熟络，而小B则更加擅长于《博弈与实践》课程。于是他们两个就打起了小算盘：如果小A和小B都自己复习自己所掌握

团队管理中的纳什均衡

团队管理中的纳什均衡众所周知，团队就是由每一位个体员工和管理者个体组成的一个共同体，该共同体能够集中每个个体的知识、智慧和技能优势，促进个体之间的高度互补与工作协调，并形成团队优质，解决问题，实现共同目标，而纳什均衡则是指定博弈、对策和游戏中的一种情形，一种给定博弈、对策和游戏对手的最佳选择，自己的最佳选择，即每个人都从利己的角度出发做出最佳选择，选择对自己最有利的策略，而不考虑社会福利或其他对手的利益，这种策略组合由所有局中人的最佳策略组合构成，在缺乏有效外力推动的情况下，没有人会主动改变自己的策略以便获得更大利益。在团队管理中，如果团队成员之间的选择是在非完全信息对称的情况下做出的，则团队建设就很有可能遇到纳什均衡。下面我们试分析之。企业文化与个人追求企业文化是作为一个组织的企业内部的全体员工的共同价值观和道德准则，共同的精神追求和行为规范，从人本逻辑上来讲，企业文化则是企业家文化，而企业家文化的形成和确定，则必然打上企业家个人的价值取向烙印，即企业家自己的所谓最有利的选择。而团队成员在某种特定的企业文化氛围里边也有着每个人的追求，即所谓的

他所做的对自己最有利的选择，如果团队成员的选择与企业家的选择是一致的，这构成一种合作均衡，否则，团队成员的选择与企业的选择不同甚至完全相反，这就形成了纳什均衡。如在市场经济条件下，一家企业文化的价值追求体系是效率公平，则每一个团队在这种特定选择中，彼此的最佳选择就是追求效益最大化，更快更好地完成团队目标，其结果是企业目标的顺利实现；相反如果一家企业文化的价值追求体系是伦理公平，讲求平均主义，则每一个团队及其成员则会在这种给定选择中，彼此的最佳选择就是追求不劳而获，减少劳动量，甚至是高效能人才的大量流失和闲置，其结果是企业目标的落空。团队精神与团队冲突团队精神要求团队每个成员的行为能够积聚团队的整体优势，形成合力，解决问题，向团队目标迈进，而团队冲突则是由于团队成员在交往中产生意见与分歧，出现分歧，对抗导致彼此间关系紧张的局面，如果团队成员都能把团队精神视作其他成员的行为出发点和落脚点，那么该成员则也会做好他的最佳选择－－做团队精神的捍卫者和实践者，从而达成每一个成员的最佳选择；相反如果团队成员认为其他成员完全站在对抗和竞争的立场上与之对话，那么该成员也必然会站在同样的立场上做出选择，其结果导致团队冲突升级，如果在冲突升级过程中没有任何成员做出重新的以团队精神为导向的选择，那么团队精神就会沦为乌有，团队也会走向解体。职责分工与利益分配在团队管理中，进行岗位的职责分工并进行相对应的利益分配是

博弈论与纳什均衡

《博弈论与纳什均衡理论》姓名张贺祺学号 2010010404 专业政治经济学指导老师张秉云

摘要博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法，也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。关键字：博弈论；纳什均衡；合作博弈；非合作博弈

目录摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) （一）博弈论的主要思想 (4) （二）博弈论的分类 (5) 三、经典案例 (7) （一）博弈论的经典案例 (7) （二）纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) （一）博弈论的重要影响 (8) （二）纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论一、引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。 1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。博弈论（Game Theory）:亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：（Nash equilibrium）又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。二、博弈论与纳什均衡的主要内容（一）博弈论的主要思想一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P：为局中人，博弈的参与者，也称为博弈方，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。决策人：在博弈中率先做出决策的一方，这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者：在博弈二人对局中行动滞后的那个人，与决策人要做出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。他的策略可能依赖于决策人劣势的策略选择，因此对

博弈类型及其表述形式

博弈类型及其表述形式 1 博弈的分类博弈模型一般分为合作博弈（cooperative game ）和非合作博弈（non- cooperative game ），如图 1.1。合作博弈是以单个参与者的可能行动集合为基本元素，而非合作博弈是以参与人群的可能联合行动集合为基本元素（Martin J.Osborne and Ariel Rubinstein ，2000，P2），也就是说，在合作博弈中，博弈中所有参与者都独立行动，不存在有约束力的合作、联合或联盟的关系，而在非合作博弈中，在一些参与者之间存在着有约束力的合作、联合或联盟的关系，并因为这种关系影响到博弈的结局。合作博弈强调的是团体理性（collective rationality ）、效率、公正和公平；非合作博弈强调的是个人理性、个人最优决策，其结果可能是有效率的，也可能是低效率或无效率的（张维迎，1996，P5）。20世纪50年代，合作博弈的研究达到鼎盛期，同时开始出现对非合作博弈的研究，此后，博弈论的研究主流逐步转向在非合作博弈领域。有些人认为非合作博弈模型比合作博弈更“基本”，但有些人认为两者不相上下（Martin J.Osborne and Ariel Rubinstein ，2000，P2）。合作博弈，有时也叫做联盟博弈（coalitional game ），一般根据有无转移支付而分为两类：可转移支付联盟博弈（coalitional game with transferable payoff ）和不可转移支付联盟博弈（coalitional game with non-transferable payoff ）。可转移支付也叫有旁支付（side payment ），可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得，且各联盟的赢得可以按任意方式在联盟成员中分摊；否则，就是不可转移支付联盟博弈。图1.1 博弈的分类非合作博弈的分类主要从两个角度进行划分。一是参与者的行动顺序。从这个角度博弈

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t