当前位置:文档之家› 博弈论 第一章

博弈论 第一章

博弈论 第一章
博弈论 第一章

1 完全信息静态博弈1.0 对策论研究的内容与基本形式

对策论研究的内容

对策论研究多个行为主体的决策问题。

对策论研究的形式

博弈(game),由多个行为主体构成的系统。

Stackelberg model

Cournot model

博弈的类型

参与者行动的时间与顺序

同时行动——静态博弈;

先后行动——动态博弈。

参与者的信息多少

信息相同——完全信息;

信息不同——不完全信息。

1.1 基本理论: 博弈的标准式和纳什均衡

例1 儿童游戏:“石头、剪刀、布”。

博弈的标准式表示(normal-form representation)

(1) 参与人( player).

n 个参与人:1, 2, …, i, …, n.

(2) 战略(strategy).

一个参与人的战略是他采取的一个行动。

参与人i 的战略:s i.

参与人i 的战略空间: S i.

战略的一个组合: s ={s1,s2, …, s n}.

简化表示:s-i ={ s1,…, s i -1,s i+1, …, s n }.

(3) 收益(payoff).

参与人i 的收益:u i= u i(s1,s2, …, s n)

n个参与人博弈的标准形式表示:

G = {S1, S2, …, S n;u1, u2, … , u n}

完全信息(complete information):每个参与人知道其他人的战略空间和收益。

静态博弈(static game):所有的参与人同时行动。

每个人行动时,不知道其他人的行动。

例1(续):博弈{石头、剪刀、布} 的描述:

参与人:1,2。

战略空间:S1 = S2 = {石头、剪刀、布}

收益:两人出手的函数

u1 (石头,石头) = 0,u1 (石头,剪刀) = 1,u1 (石头,布) = -1 …

u2 (石头,石头) = 0,u2 (石头,剪刀) = -1,u2 (石头,布) = 1 ……

收益表:两个参与人,有限个战略的博弈的表示方法。

P2

石头剪刀布

石头0 ,0 1 ,-1 -1 ,1

P1剪刀-1 ,1 0 ,0 1 ,-1

布 1 ,-1 -1 ,1 0 ,0

博弈的问题:能否知道每个参与人选择的战略?

例2: 囚徒困境(The Prisoner’s Dilemma)

囚徒 2

沉默招认

沉默-1 ,-1 -9 ,0

囚徒 1

招认0 ,-9 -6 ,-6

囚徒1的考虑:无论对方选沉默还是招认,自己选“招认”好于“沉默”。

囚徒2的考虑:无论对方选什么,“招认”好于“沉默”。

两人的选择: (招认,招认)。

定义:s i'是s i''的严格劣势战略(strictly dominated),如果:

u i(s i',s-i)

“沉默”是“招认”的严格劣战略

例3:

参与人2

左中右

上 1 ,01,3 3 ,0

参与人1 中0, 2 0 ,1 6 ,0

下0, 2 2, 4 5, 3

参与人1: 没有严格劣战略。

参与人2: “右”严格劣于“中”

考虑:重复剔除严格劣战略(iterated elimination of strictly dominated strategies)

可预见的两人选择: (下, 中)。

例4: 图 1.1.4

参与人2

左中右

上0 ,4 4,0 5 ,3

参与人1 中4, 0 0 ,4 5 ,3

下3, 5 3, 5 6, 6

两人都没有严格劣战略。 两人会如何选择各自的战略?

定义:s * = (s 1*,…,s n *)是一个纳什均衡(Nash equilibrium), 如果

u i (s i *,s -i *) ≥ u i (s i ,s -i *)

纳什均衡为最大化问题的解

i

i S s ∈max u i = u i (s 1*, …, s i , …, s n *)

各例中的纳什均衡: 囚徒困境: (招认,招认) 例3: (下,中)

例4( 图1. 1. 4): (下, 右).

纳什均衡与重复剔除严格劣势战略的关系: 没有被剔除的唯一的战略组合是纳什均衡.

如果战略是一个纳什均衡,它们在重复剔除严格劣势战略后留下.

多个纳什均衡

例5 性别战 (the battle of the Sexes)

帕特 歌剧 拳击

歌剧 2 ,1 0 ,0

克里斯

拳击 0 ,0 1 ,2

纳什均衡: (歌剧,歌剧),(拳击,拳击)

1.2 应用

例 古诺双头垄断模型(Cournot Model of Duopoly )

二个企业,生产产量: q 1, q 2

市场需求: P = a – Q , Q = q 1 + q 2 企业成本: C i (q i ) = cq i , i = 1, 2.

企业利润:πi (q 1, q 2) = Pq i – C i (q i ) = (a – (q 1 + q 2))q i – cq i , 博弈的描述:

参与人:企业1,企业2 战略:产量 q i 收益:πi (q 1, q 2) 企业 i 选择产量求

i

i S s ∈max πi (s i , , s j *):

一阶条件

1

1

dq d π = a – c – 2q 1 – q 2* = 0 和

2

2

dq d π = a – c –q 1* –2q 2 = 0 厂商选择自己利润最大的产量

q 1 =

22q c a -- q 2 =2

1

q c a -- 解纳什均衡得

q 1* = q 2* =

3

c

a -

利润

π1 = π2 = ( a – c – (3c a -+3c a -))3

c

a - = 9)(2c a -

当 u i 是可微分的时候 , 纳什均衡为下列方程组的的解:

i

n i s s s s u ??)

,...,,(21= 0, i = 1,…, n

思考:用重复剔除严格劣势战略求纳什均衡 比较:如果两个厂商生产

q 1 = q 2 =4

c

a - 利润

π1 =π2 = ( a – c – (4c a -+4c a -))4

c

a - = 8)(2c a -

例 贝特兰德双头垄断模型(Bertrand Model of Duopoly ) 两个企业生产有差别的商品。 消费者对企业 i 的需求

q i (p i , p j ) = a – p i + bp j , 成本: C i (q i ) = cq i , i = 1, 2. 战略 s i : p i ≥ 0

收益: πi (p i , p j ) = (a – p i + bp j )( p i – c )

纳什均衡 (p 1*, p 2*) 满足

max πi (p i , p j *) = max (a – p i + bp j *)( p i – c )

解得 p 1* = p 2* = b

c

a -+2

例 最后要价仲裁 (Final-offer Arbitration)

一个企业和一个工会,通过一个仲裁人决定工资。

企业和工会同时提出工资: w f, w u

仲裁人有一个标准:x,选择双方提议中比较靠近x的提议:

如果x < ( w f + w u )/2,则w f

如果x > ( w f + w u )/2,则w u

w f(w f + w u )/2x w u

企业和工会不知道x,但知道x的分布函数F(x)和密度函数f(x)。分析

w f 被选择的概率:Prob {x <

2

u

f

w

w+

} = F??

?

?

?

?+

2

u

f

w

w

w u被选择的概率:Prob{ x >

2

u

f

w

w+

} = 1 –F??

?

?

?

?+

2

u

f

w

w

期望工资

Ew = w f F??

?

?

?

?+

2

u

f

w

w

+ w u 1 –F??

?

?

?

?+

2

u

f

w

w

w f* 满足

f

w

m in w f F??

?

?

?

?+

2

*

u

f

w

w

+ w u* 1 –F

?

?

?

?

?

?+

2

*

u

f

w

w

w u* 满足

u

w

max w f*F??

?

?

?

?+

2

*

u

f

w

w

+ w u 1 –F

?

?

?

?

?

?+

2

*

u

f

w

w

由一阶条件

F??

?

?

?

?+

2

u

f

w

w

+

2

1w

f f ??

?

?

?

?+

2

u

f

w

w

-

2

1w

u f ??

?

?

?

?+

2

u

f

w

w

= 0

2

1w

f f ??

?

?

?

?+

2

u

f

w

w

+ 1 - F??

?

?

?

?+

2

u

f

w

w

-

2

1w

u f ??

?

?

?

?+

2

u

f

w

w

= 0 由此解出工资的均衡提议。

两式相减

F??

?

?

?

?+

2

u

f

w

w

=

2

1

两式相加

w u*f ??

?

?

?

?+

2

u

f

w

w

–w f*f ??

?

?

?

?+

2

u

f

w

w

= 1

如果x为正态分布: x ~ N(m, σ2)

2

*

*

u

f

w

w+

= m

w u* –w f*=

)

(

1

m

f

= 2

2πσ,

纳什均衡

w u* = m +2/2

πσ, w f* = m–2/2

πσ

例公共财产问题

一个村庄,有n个村民,在公共草地上放羊。

村民i放牧的羊数:g i

全村的羊总数:G = g1+ ... + g n

养一只羊的(私人)成本为c,一只羊的价值为v(G)

当G < G max, v(G) > 0, v'(G) < 0, v''(G) < 0

当G > G max , v (G ) = 0

每个村民选择养羊数量使自己收益最大

g i v (G ) – cg i 一阶条件

v (G ) + g i v ' (G ) – c = 0, i = 1,..., n 将n 个等式相加得到

nv (G ) + G v ' (G ) – nc = 0 即纳什均衡G 1满足

v (G 1) +

n

G 1

v ' (G 1) – c = 0 全村在总收益最大的放牧数G 2满足

max G 2 v (G 2) – cG 2 一阶条件

v (G 2) + G 2 v ' (G 2) – c = 0 G 1与 G 2哪一个大? G1大

v

v (G ) O G max G

G v ' (G )/n

v' (G)

G v' (G)

决策问题:在条件变差时, 收益上升还是下降?

在通常的(一人)决策中,如果有几个选择,决策者选择收益最大的一个。

如果外界条件改变,使他的一个或几个收益下降,则它无论怎样选择,都不会使收益比原来更大。

例在一块田里选择种植的(纯)收入:

棉花3000元

花生3700元

玉米3500元

如果成本上升,收入变为

棉花3000元

花生3200元

玉米3400元

人决策收益通常下降

例在多人决策时的收益下降与增加

(1)初始时

参与人 2

T1T2

S15,48,3

参与人1

S2 4 ,3 6 ,5

均衡为(S1,T1),参与人1的收益为5。

(2)外界条件使参与人1在选择S1时的收益下降

参与人2

T1T2

S13,45,2

参与人1

S24, 3 6,5

均衡变为(S2,T2)

参与人1的收益为6。

多人决策时,收益可能上升。

1.3 混合战略和均衡的存在

例1 儿童游戏:“石头、剪刀、布”

不存在纳什均衡。如何选择战略?

例6 猜硬币(Matching Pennies)

参与人2

正面反面

正面-1,1 1,-1

参与人1

反面1,-1 -1,1

也不存在纳什均衡。

将原来的战略s ik称为纯战略(pure strategy)。

战略空间S i =(s i1,…,s iK)。

混合战略(mixed strategy): 战略空间S i的概率分布: p i =(p i1,…,p iK).

——由参与人选定。(参与者在可选行动中所有行动的一个概率分布)

收益: v i(p1,…,p n) = ∑k(∏j p jk)u i(s1,…,s n)

=E u i(s1,…,s n)

——由概率计算的期望值。

较简单的情形: 二个参与人

S1 = { s11,…,s1J } , S2= { s21, …, s2K }

收益:

v1(p1, p2) = ∑∑

==

J

j

K

k

11

p1j p2 k u1(s1 j, s2 k)

猜硬币的收益:如果p1 = (

4

1,

4

3), p

2 = (3

1,

3

2), 则

v1 = –

4

3

1+

4

3

2+

4

3

1–

4

3

2= -1/6

v2 =

4

3

1–

4

3

2–

4

3

1+

4

3

2=1/6

任意的混合战略,p1= (p,1-p),p2= (q,1-q), 则

v1 (p1,p2) = pq(-1) + p(1-q) + (1-p)q + (1-p)(1-q)(-1)

=2p(1-2q) + 2q -1

v2(p1,p2) = pq + p(1-q)(-1) + (1-p)q(-1) + (1-p)(1-q)

=2q(2p-1) + 1 – 2p

混合战略中的劣战略

例7

参与人2

L R

T 3,-- 0,--

参与人1M 0, -- 3,--

B 1, -- 1, --

如果只考虑纯战略,B不是严格劣战略。在纯战略时,如果参与人选

L,则1选T,如果参与人2选R,则1选R。能否剔除B?

如果1选择p = ( 0.5, 0.5, 0),则对2的任何混合战略(q,1 –q) v1 (p, q) = 0.5q?3 + 0.5?(1-q)?0 + 0.5?q?0 + 0.5?(1-q)?3 = 1.5 考虑以概率1选择B,即p B = ( 0, 0, 1), 则

v1 (p B, q) = q?1 + (1-q)?1 = 1

即 B 为p的严格劣战略。

v

3

M T

p

1 B

O 1 q

似乎可以剔除B?

如果改写一下:

参与人2

L R

T 3,-- 0,--

参与人1M 0, -- 3,--

B 2, -- 2, --

结果有何变化?

给出其它人的混合战略p-i,i的最优反应: p

v i(p i, p-i) ≥v i (p'i, p-i)

例6(续)在猜硬币中,参与人1的收益:

v1(p1,p2) = pq(-1) + p(1-q) + (1-p)q + (1-p)(1-q)(-1)

=2p(1-2q) + 2q -1

参与人1的最优反应

1,p =1;

如果q<

2

1,p = 0;

如果q>

2

1,p在[0, 1]中任意。

如果q =

2

参与人2的收益:

v2(p1,p2) = pq + p(1-q)(-1) + (1-p)q(-1) + (1-p)(1-q)

=2q(2p-1) + 1 – 2p

参与人2 的最优反应

1,q = 0;

如果p<

2

1,q = 1;

如果p >

2

1,q在[0, 1]中任意。

如果p =

2

p p

1 1

1/2

O 1/2 1 q O 1 q

参与人1 参与人2

混合战略的纳什均衡

纳什均衡:p * =(p 1*,…,p n *)满足

v i (p *i ,p *-i ) ≥ v i (p i ,p *-i ) 纳什均衡为最大化问题的解

i

p max v i = v i (p 1*, …, p i , …, p n *)

在猜硬币中,{(21,

21), (21, 2

1

)}是一个纳什均衡. p

1

O 1/2 1 q

例8 性别战(续)

克里斯取混合战略 (p , (1 – p )),帕特取(q , (1 – q )) 克里斯收益

v 1 = 2pq + (1-p )(1-q ) =p (3q -1) +1 - q 她的最优反应

p = 0,当 q <

31, p = 1, 当 q > 3

1

p 任意在[0, 1]中,当 q =3

1 帕特收益

v 2 = pq + 2(1-p )(1-q ) =q (3p -2) + 2 – 2p

他的最优反应

q = 0,当p <

32; q = 1,当p > 3

2

q 任意在[0, 1]中,当 p =3

2.

p p

O q O q 克里斯 帕特

纳什均衡:

{(3

2,

31), (31, 3

2

) }; {(0, 1), (0, 1)}; {(1, 0), (1, 0)}.

纳什均衡的存在 二个参与人,二个战略

参与人 2 L R

U x , a y , b

参与人 1

D z , c w , d

参与人 1的混合战略: (p , 1- p ); 参与人 2的混合战略: (q , 1- q ).

参与人1 的收益:

v1(p, q) = pq x+ p(1 –q)y + (1 –p)qz + (1 –p)(1 –q)w

=p[q(x –z + w –y) – (w –y)] + q(z –w) + w

分3种情况:

(1) x –z + w– y = 0。

v1(p,q) = p(y–w) + q(z–w) + w

p = 1, 当y>w;

p = 0, 当y

p ∈[0, 1],当y = w.

p p

O q O q y>w y

(2) x – z + w – y > 0

p = 0, 当q < (w –y)/(x – z + w – y)

p = 1, 当q > (w –y)/(x – z + w – y);

p ∈[0, 1], 当q = (w –y)/( x – z + w – y).

p

O q

0< (w –y)/(x – z + w – y)< 1

p p

O q q 1< (w –y)/(x – z + w – y)(w –y)/(x – z + w – y)<0

(3) x – z + w – y < 0

p = 1, 当q < (w –y)/( x – z + w – y ) ;

p = 0, 当q >( w - y) /(x – z + w – y ) ,

p∈[0, 1], 当q = (w -y) /(x – z + w – y ) .

p

O q

0 < (w –y)/( x – z + w – y ) < 1

p p

O q O q (w –y)/( x – z + w – y ) < 0 1 < (w –y)/( x – z + w – y )

最优反应曲线一共可以归结为4种情况。

类似的分析可得参与人 2的最优反应曲线只有4种可能:

p p

O q O q

p p

O q O q

纳什均衡的存在: 参与人 1 的任何最优反应与参与人 2的任何最优反应至少有一个交点。

超过二个参与人或超过二个战略的情形 参与人 i 的最优反应: p i = ( p i 1

, p i 2

, …, p i k – 1

, 1 –∑-121k ss

s

i p ) = f i (p -i )

n 个参与人的反应表示成

( p 1, p 2, …, p n , ) = ( f 1(p -1), f 2(p -2), …, f n (p -n )) 用向量形式:

q = F (p )

由不动点定理, 至少存在一个 s

s = F (s )

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) ~ 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) — 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

1博弈论复习题

完全信息静态博弈习题 基本概念 严格下策反复消去法 划线法 剪头法 纳什均衡 纯策略 混合策略 混合策略纳什均衡 反应函数 一致预测 纳什定理 本章习题 1. 占优均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么? 2. 求出下图中支付矩阵所表示的博弈中的混合策略纳什均衡。 3. 设古诺模型中有n 家厂商。q i 为厂商i 的产量,n q q q Q +++="21为市场总产量。P 为市场出清价格,且已知Q a Q P P ?==)(当(a Q <时,否则P =0)。假设厂商i 生产q i 产量的总成本为i i i i cq q C C ==)(,也就是说没有固定成本且各厂商的边际成本都相同,为常数 )(a c c <。假设各厂商同时选择产量,该模型的纳什均衡是什么?当n 趋向于无穷大时博弈分析是否仍有效? 完全信息动态博弈习题 基本概念 扩展式博弈 博弈树 扩展式博弈的战略 相机选择 可信性 子博弈 子博弈精炼纳什均衡 逆推归纳法 重复博弈 有限重复博弈 无限重复博弈 平均收益 可行收益 总收益 贴现率 有惟一纯策略纳什均衡博弈的有限次(无限次)重复博弈 无限重复博弈的民间定理 触发策略 两期战略 斯塔克博(Stackelberg)格模型 蜈松博弈 L R T 2,1 0,2 B 1,2 3,0 博弈方2 博弈方1

1. 如果开金矿博弈中第三阶段已选择打官 司后的结果尚不能肯定,即图2-1中a 、b 的 数值不确定。试讨论本博弈可能有哪几种 可能的结果。如果本博弈中的“威胁”和 “承诺”是可信的,a 或b 应满足什么条件? 图2-1 2. 设一四阶段两博弈方之间的动态博弈如图2-2所示。试找出全部子博弈,讨论该博弈中可信性问题,求子博弈完美纳什均衡策略组合和博弈结果。 图2-2 3. 三寡头市场有需求函数Q P ?=100,其中Q 是三个厂商的产量之和,并且已知三个厂商都有常数边际成本2而无固定成本。如果厂商1和厂商2先同时决定产量,厂商3根据厂商1和厂商2的产量决策,问他们各自的产量和利润是多少? 4. 设在无限回合讨价还价博弈中,博弈方的贴现因子不同(博弈方1为δ1,博弈方2为 δ2),请给出这种情况下的均衡结果。 不完全信息静态博弈习题 基本概念 贝叶斯博弈(不完全信息博弈) 静态贝叶斯博弈(不完全信息静态博弈) 类型和类型空

博弈论第一章

Kousha Etessami AGTA:Lecture1

Kousha Etessami AGTA:Lecture1

Kousha Etessami AGTA:Lecture1

Kousha Etessami AGTA:Lecture1

is a pair(n-tuple)of strategies for the2players(n players)such that no player can bene?t by unilaterally (i.e.,randomized)Nash equilibrium.?Example1:The pair of dominant strategies (Defect,Defect)is a pure solution to this zero-sum game.The“minimax value”is0, as it must be because the game is“symmetric”.)?Question:How do we compute a Nash Equilibrium for a given game?

”(also called“normal form . What if,as is often the case,the game is played by a sequence of moves over time?(Think,e.g.,Chess.) Consider the following2-person game tree: ?How do we analyze and compute“solutions”to extensive form Kousha Etessami AGTA:Lecture1

博弈论课后习题

第一章导论 1、什么是博弈?博弈论的主要研究内容是什么? 2、设定一个博弈模型必须确定哪几个方面? 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法,有哪些主要的类型? 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择?(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么?(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么? 7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。 第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么? 2、为什么说纳什均衡是博弈分析中最重要的概念? 3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响? 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么? 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分10 000元进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10 000,如果s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会要求什么数额,为什么? 8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则P=0)。假设厂商i生产qi产量的总成本为Ci=Ci(qi)=cqi,也就是说没有固定成本且各厂商的边际成本都相同,为常数c(c<a).假设各厂商同时选择产量,该模型的纳什均衡是什么?当n趋向于无穷大时博弈分析是否仍然有效? 9、两寡头古诺模型,P(Q)=a-Q等与上题相同,但量厂商的边际成本不同,分别为c1和c2。如果0<ci <a/2,问纳什均衡产量各为多少?如果c1<c2<a,但2c2>a+c1,则纳什均衡产量又为多少? 10、甲乙两公司分属两个国家,在开发某种新产品方面有下面得益矩阵表示的博弈关系(单位:百万美元)。该博弈的纳什均衡有哪些?如果乙公司所在国政府想保护本国公司利益,有什么好的办法? 11、设一个地区选民的观点标准分布于【0,1】上,竞选一个公职的每个候选人同时宣布他们的竞选立场,即选择0到1之间的一个点。选民将观察候选人们的立场,然后将选票投给立场与自己的观点最接近的候选人。例如有两个候选人,宣布的立场分别为x1=和x2=,那么观点在x=左边的所有选民都会投候选人1的票,而观点在x=右边的选民都会投候选人2的票,候选人1将以60%的选票获胜。再设如果又候选人的立场相同,那么立场相同的候选人将平分该立场所获得的选票,得票领先的候选人票数相同时则用抛硬币决定哪个候选人当选。我们假设候选人唯一关心的知识当选(即不考虑自己对观点的真正偏好),如果又两个候选人,问纯策略纳什均衡是什么?如果又三个候选人,也请作出一个纳什均衡。 12、运用本章的均衡概念和思想讨论下列得益矩阵表示的静态博弈。

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论 第一章

1 完全信息静态博弈1.0 对策论研究的内容与基本形式 对策论研究的内容 对策论研究多个行为主体的决策问题。 对策论研究的形式 博弈(game),由多个行为主体构成的系统。 例 Stackelberg model Cournot model 博弈的类型 参与者行动的时间与顺序 同时行动——静态博弈; 先后行动——动态博弈。 参与者的信息多少 信息相同——完全信息; 信息不同——不完全信息。 1.1 基本理论: 博弈的标准式和纳什均衡 例1 儿童游戏:“石头、剪刀、布”。

博弈的标准式表示(normal-form representation) (1) 参与人( player). n 个参与人:1, 2, …, i, …, n. (2) 战略(strategy). 一个参与人的战略是他采取的一个行动。 参与人i 的战略:s i. 参与人i 的战略空间: S i. 战略的一个组合: s ={s1,s2, …, s n}. 简化表示:s-i ={ s1,…, s i -1,s i+1, …, s n }. (3) 收益(payoff). 参与人i 的收益:u i= u i(s1,s2, …, s n) n个参与人博弈的标准形式表示: G = {S1, S2, …, S n;u1, u2, … , u n} 完全信息(complete information):每个参与人知道其他人的战略空间和收益。 静态博弈(static game):所有的参与人同时行动。 每个人行动时,不知道其他人的行动。 例1(续):博弈{石头、剪刀、布} 的描述: 参与人:1,2。 战略空间:S1 = S2 = {石头、剪刀、布} 收益:两人出手的函数 u1 (石头,石头) = 0,u1 (石头,剪刀) = 1,u1 (石头,布) = -1 …

博弈论的基础知识与应用

博弈论的基础知识与应用(转) 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的? 3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的? 4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗? 5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗? 6)在这些情况下,真正的人类行为与“理性”行为是否相符? 7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是? 因而,博弈论研究的“博弈”包括: 破产 门口的野蛮人(Barbarians at the Gate) 网络战(Battle of the Networks) 货物出门,概不退换(Caveat Emptor) 征召(Conscription) 协调(Coordination) 逃避(Escape and Evasion) 青蛙呼叫配偶(Frogs Call for Mates) 鹰鸽博弈(Hawk versus Dove) Mutually Assured Destruction 多数决定原则(Majority Rule) Market Niche 共同防卫(Mutual Defense) 囚徒困境(Prisoner’s Dilemma) 补贴小商业Subsidized Small Business 公共地悲剧Tragedy of the Commons 最后通牒Ultimatum

博弈论第一章习题

博弈论练习一 班级学号姓名 一、名词解释(20分) 博弈 零和博弈 完全信息静态博弈 纳什均衡 混合策略 纳什定理 动态博弈 子博弈 子博弈完美纳什均衡 逆推归纳法 二、填空题(10分) 1.根据博弈中的得益可以把博弈分为:()、()和()。 2.根据博弈的过程可以把博弈分为:()、()和()。 3.纳什均衡的价值主要在于它有一些重要的性质,()就是其中最重要的性质之一。4.分析完全信息静态博弈的方法包括:()、()、()和()。 5、纳什均衡分析在动态博弈的失效与动态博弈各博弈方策略中选择行为的()问题 是联系在一起的。

三、判断题(4分) 1. 各博弈方混合策略纳什均衡的得益大于纯策略纳什均衡的得益。( ) 2. 在具有有限的博弈方和策略集的博弈中,纳什均衡不一定存在。( ) 3. 动态博弈中各博弈方不会同时作出选择。( ) 4. 博弈方的理性是影响动态博弈的重要因素。( ) 四、单项选择题(10分) 1.根据各博弈方的得益信息,我们可以把博弈分为:( )。 A .零和博弈、常和博弈和变和博弈 B .完全信息博弈和不完全信息博弈 C .静态博弈和动态博弈 D .完美信息博弈和不完美信息博弈 2.根据是否所有博弈方都对选择前的博弈过程完全了解,我们可以把博弈分为:( )。 A .零和博弈、常和博弈和变和博弈 B .完全信息博弈和不完全信息博弈 C .静态博弈和动态博弈 D .完美信息博弈和不完美信息博弈 3.( )可以排除不可信威胁。 A .纳什均衡 B .帕雷托上策均衡 C .子博弈完美均衡 D .风险上策均衡 4.颤抖手均衡是理解( )中偏离子博弈完美纳什均衡行为最为重要的思想之一。 A .完全信息静态博弈 B .完全理性动态博弈 C .完美信息动态博弈 D .有限理性博弈 5、寻找子博弈完美均衡的方法一般是( )。 A .划线法 B .箭头法 C .上策均衡分析 D .逆推归纳法 五、计算分析题(50分) 1.夫妻博弈:(10分) 丈夫 时装 足球 妻子 时装 足球 (1)求博弈的纯策略纳什均衡(4分) (2)求博弈的混合策略纳什均衡(4分) (3)比较纯策略纳什均衡与混合策略纳什均衡夫妻的得益。(2分)

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论课后习题

博弈论课后习题 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】

第一章导论 1、什么是博弈博弈论的主要研究内容是什么 2、设定一个博弈模型必须确定哪几个方面 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法,有哪些主要的类型 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么 7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。 第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么

2、为什么说纳什均衡是博弈分析中最重要的概念 3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡博弈的结果是什么 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分10 000元进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10000,如果 s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么如果你是其中一个博弈方,你会要求什么数额,为什么 8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则 P=0)。假设厂商i生产qi产量的总成本为Ci=Ci(qi)=cqi,也就是说没有固定成本且各厂商的边际成本都相同,为常数c(c<a).假设各厂商同时选择产量,该模型的纳什均衡是什么当n趋向于无穷大时博弈分析是否仍然有效 9、两寡头古诺模型,P(Q)=a-Q等与上题相同,但量厂商的边际成本不同,分别为c1和c2。如果0<ci<a/2,问纳什均衡产量各为多少如果c1<c2<a,但2c2>a+c1,则纳什均衡产量又为多少

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论基础

ECON 40050 Game Theory Exam 1- Answer Key Instructions: 1) You may use a pen or pencil, a hand-held nonprogrammable calculator, and a ruler. No other materials may be at or near your desk. Books, coats, backpacks, etc... must be placed against the wall. No electronic communication devices may be used. 2) As soon as the instruction to begin the test is given, please check that you have 10 numbered pages. 3) Be sure to show all of your work. Answers without supporting calculations will receive zero credit. You will receive credit only for the answers and supporting calculations that appear in this test packet. 4) All exams must be turned in by 1:45 pm. No extensions will be granted. 5) Be sure to read each question in its entirety before beginning your analysis. 6) The time estimates at the beginning of each question are only suggestions to help you manage your time. NAME ____________________________________________ Question 1 (10 minutes)_______ (15 points) Question 2 (10 minutes)_______ (15 points) Question 3 (10 minutes)_______ (15 points) Question 4 (15 minutes)_______ (15 points) Question 5 (20 minutes)_______ (20 points) Total: (65 minutes)_______ (80 points)

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

博弈论基础

博弈论 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。参见:行为生态学(behavioral ecology)。 约翰·冯·诺依曼 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。 1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的 策墨洛(Zermelo) 基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出

博弈论 战略分析入门第一章课后题答案

Instructor’s Guide to Game Theory: A Nontechnical Introduction to the Analysis of Strategy Chapter 1. Conflict, Strategy, and Games 1.Objectives and Concepts The major objective of this chapter is to introduce the student to the idea that “serious” interactions can be usefully treated as games – what I have called the “scientific metaphor” at the root of game theory. Secondary objectives are to introduce the concepts of best-response strategies and the representation of games in normal form. Thus, the chapter starts with an example from war, which most people without preparation in game theory would think of as a most natural field for thinking of strategy, and the chapter begins with an example presented in extensive form, because it seems to be a more intuitive and natural way of thinking about strategy. Interweaved with this are some discussions of the origins of game theory. The chapter also takes up an episode from the movie version of “A Beautiful Mind,” since it seems very likely that many students will have seen the movie and it may be a major source of whatever ideas they have about game theory. The Prisoner’s Dilemma is the one example they are most likely to have seen in one or more other classes, so it belongs here, too. Using the Karplus Learning Cycle as a major organizing principle, I open with an example – the Spanish Rebellion – and only then introduce the general ideas it illustrates, and then follow with another example, NIM. Again, the discussion of the game in normal form begins with an example, the familiar Prisoner’s Dilemma, then proceeds to the general principles and follows with two more examples, the one from the movie and an advertising dilemma. This procedure is “psycho-logical” rather than logical, and some

相关主题
文本预览