当前位置:文档之家› 第八章╲t博弈论

第八章╲t博弈论

第八章╲t博弈论
第八章╲t博弈论

第八章博弈论

一、重点和难点

(一)重点

1.博弈论及其基本概念

2.纳什均衡

3.占优策略均衡

4.囚徒困境博弈

(二)难点

1.最小最大值(或最大最小值)策略

2.子博弈精炼纳什均衡

3.动态博弈战略行动

4.不完全信息静态博弈

5.不完全信息动态博弈

二、关键概念

博弈零和博弈非常和博弈囚徒困境纳什均衡支付子博弈精炼纳什均衡完全信息静态博弈占优策略均衡重复博弈战略移动可信威胁豪尔绍尼转换三、习题

(一)单项选择题

1.博弈论中,局中人从一个博弈中得到的结果常被称为()。

A. 效用

B. 支付

C. 决策

D. 利润

2.博弈中通常包括下面的内容,除了()。

A.规则

B.占优战略均衡

C.策略

D.结局

3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有一个囚徒会坦白

B.两个囚徒都没有坦白

C.两个囚徒都会坦白

D.任何坦白都被法庭否决了

4.在多次重复的双头博弈中,每一个博弈者努力()。

A.使行业的总利润达到最大

B.使另一个博弈者的利润最小

C.使其市场份额最大

D.使其利润最大

5.一个博弈中,直接决定局中人支付的因素是()。

A. 策略组合

B. 策略

C. 信息

D. 行动

6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡

B.一报还一报的均衡

C.占优策略均衡

D.激发战略均衡

7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的战略称为()。

A.一报还一报的战略

B.激发战略

C.双头战略

D.主导企业战略

8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双方都获胜

B.博弈双方都失败

C.使得先采取行动者获胜

D.使得后采取行动者获胜

9.在双寡头中存在联合协议可以实现整个行业的利润最大化,则()。

A.每个企业的产量必须相等

B.该行业的产出水平是有效的

C.该行业的边际收益必须等于总产出水平的边际成本

D.如果没有联合协议,总产量会更大

10.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时

B.当一个寡头行业面对的是重复博弈时

C.当一个垄断行业被迫重复地与一个寡头行业博弈时

D. 当一个寡头行业进行一次博弈时

11.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种战略是一种()。

A.主导战略

B.激发战略

C.一报还一报战略

D.无用战略

12.关于策略式博弈,正确的说法是()。

A. 策略式博弈无法刻划动态博弈

B. 策略式博弈无法表明行动顺序

C. 策略式博弈更容易求解

D. 策略式博弈就是一个支付矩阵

13.下面关于共同知识的说法,正确的是()。

A. 每一个局中人都知道的事,就是共同知识

B. 一般地,假定支付为共同知识

C. 共同知识的假定要求局中人的计算能力不是很强

D. 纳什均衡不需要共同知识的假定

14、导致价格战爆发的原因是()

A.合作均衡

B.使用一报还一报的战略的企业的出现,这一战略是其竞争者在前一阶段遵守联合协议时采取的

C.进入该行业并立刻同意遵守联合协议的新企业的出现

D.新企业进入一个行业后,所有企业发觉自己处在囚徒困境中 (二)判断说明题

1.博弈论是用来分析垄断竞争企业行为的。

2.在一次性囚徒困境博弈中,对一个囚徒来说,如果他相信另一个囚徒会坦白,则他的占优战略就是坦白。

3.因为零和博弈中博弈方之间的关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。

4.凡是博弈方的选择、行为有先后次序的一定是动态博弈。

5.合作博弈就是博弈方采取相互合作态度的博弈。

6.纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

7.如果一博弈有两个纯策略纳什均衡,则一定还存在一个混合策略均衡。

8.在动态博弈中,因为后行为的博弈方可以先观察对方行为后再选择行为,因此总是有利的。

9.多人博弈中的“破坏者”会对所有博弈方的利益产生不利影响。 10.纯策略纳什均衡和混合策略纳什均衡都不一定存在。 (三)计算题

1.北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。

(1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

2.Smith 和John 玩数字匹配游戏,每个人选择1、2、3,如果数字相同, John 给Smith 3美元,如果不同,Smith 给John 1美元。 (1)列出收益矩阵。

(2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少?

3.假设双头垄断企业的成本函数分别为:1120Q C =,2222Q C =,市场需求曲线为

Q P 2400-=,其中,21Q Q Q +=。

(1)求出古诺(Cournot )均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点。

(2)求出斯塔克博格(Stackelberg )均衡情况下的产量、价格和利润,并以图形表示。 (3)说明导致上述两种均衡结果差异的原因。

4.假设有两个游戏者A 和B ,他们分别代表两家企业,生产不同的部件,但生产的部件在型号选择上有“大”、“小”之分。若一家企业选择的型号为“大”,另一家企业选择的型号为“小”,则会发生不匹配的问题。只有当两家企业选择的型号匹配时,才会有均衡。下表给出了这一合作博弈的形式。

(1)假设企业A 先走一步,企业B 的策略选择有多少种?写出A 和B 的策略组合及相应的收益矩阵。

(2)在这些策略组合中,有无纳什均衡?如有,哪些是?

(3)将上述策略组合写成广延型博弈形式,并求出子博弈完美纳什均衡。

5.假设在一个博弈模型中,有两个参与者,即政府和私人部门。私人部门选择的是预期的通货膨胀率,政府选择的是实际的通货膨胀率。并且政府不仅关心通货膨胀问题,而且还关心失业问题。设政府的效用函数为:

2*2)(ky y c U ---=π

其中,π是通货膨胀率,*y 是自然失业率下的均衡产量,y 是实际产量,0>c ,1>k 。 同时假定产出与通货膨胀率之间的关系是由含有通货膨胀预期的菲利浦斯曲线决定,也就是说菲利浦斯曲线是:

)(*e y y ππβ-+=

其中,e π是预期的通货膨胀率,0>β。

如果私人都具有理性预期,那么运用博弈论的有关知识来证明,在短期内政府所采取的通货膨胀政策不能增加产出。 (四)问答题

1.举一个你在现实生活中遇到的囚犯两难困境的例子。

表中每组数字前面一个表示A 企业的收益,后一个数字表示B 企业的收益。 (1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡?

(2)存在帕累托改进吗?如果存在,在什么条件下可以实现?福利增量是多少? (3)如何改变上述A 、B 企业的收益才能使均衡成为纳什均衡或占优策略均衡?如何改变上述A 、B 企业的收益才能使该博弈不存在均衡?

3.在纳税检查的博弈中,假设A 为应纳税款,C 为检查成本,F 是偷税罚款,且C

(1)写出支付矩阵。 (2)分析混合策略纳什均衡。

(五)案例分析题

1.阅读以下材料,联系实际情况,运用所学理论进行评析。

囚徒困境中的宝洁公司

宝洁(P&G)、联合利华和花牌同时计划进入杀虫胶带市场。它们都面临同样的成本和需求条件,而各厂商必须在考虑到他的竞争者们的情况下决定一个价格。如果P&G 和它的竞争者都将价格定在1.50美元,他能得到更多的利润。这从下表中的支付矩阵中看得很清楚。如果所有厂商都定价1.50美元,它们每月各可赚到20000美元利润,而不是定价l.40美元可以赚到的12000美元。那么为什么它们不定价1.50美元呢?

联合利华和花牌定价

宝洁(P&G)

l.40美元 1.50美元

*假设联合利华和花牌定相同的价格。矩阵中数字以每月千美元为单位。

因为这些厂商处在一个囚徒的困境中,不管联合利华和花牌定价多少,宝洁定价l.40美元都能赚更多的钱。例如,若联合利华和花牌定价1.50美元,宝洁定价l.40美元每月可赚29000美元,而定价1.50美元只能赚20000美元。这对联合利华和花牌也是正确的。例如,宝洁定价l.50美元而联合利华和花牌定价1.40美元,它们将各赚到21000美元而不是20000美元。结果,宝洁知道如果它定价1.50美元,它的竞争者会有强烈的低价竞争,定价l.40美元的冲动,这样P&G 将只有一个很小的市场份额和只能赚到每月3000美元的利润。P&G 应该冒险防信任竞争者定价1.50美元吗?如果你面对这样的困境,你会怎么做呢?

2.一个工人给老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于50元的负效用,老板想克扣工资则总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒时老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道。请问

(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形式表示该博弈并作简单分析。

(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形式表示该博弈并作简单分析。

参考答案

(一)单项选择题

1.(B )

2.(B )

3.(C )

4.(D )

5.(A )

6.(C )

7.(A )

8.(A )

9.(C ) 10.(D ) 11.(C ) 12.(B ) 13.(B ) 14.(D ) (二)判断说明题

1.错

【解题思路】:本题分析博弈论与寡头垄断企业的关系。 【解析】:博弈论是用来分析寡头垄断企业行为的理论。 2.错

【解题思路】:本题分析占优战略。

【解析】:在囚徒困境博弈中,占优战略是招供,即不管对方的行为是怎样的,每个囚徒都会采取招供的战略。

3.错

【解题思路】:本题考察零和博弈和非合作博弈的关系。

【解析】:虽然零和博弈中博弈方的利益确实是对立的,但非合作博弈的含义并不是博弈方之间的关系是竞争性的、对立的,而是指博弈方是以个体理性、个体利益最大化为行为的逻辑和依据,是指博弈中不能包含有约束力的协议。

4.错

【解题思路】:本题考察动态博弈。

【解析】:其实并不是所有选择、行为有先后次序的博弈问题都是动态博弈。例如两个厂商先后确定自己的产量,但只要后确定产量的厂商在定产之前不知道另一厂商的产量是多少,就是静态博弈问题而非动态博弈问题。

5.错

【解题思路】:本题考察合作博弈。

【解析】:合作博弈在博弈论中专门指博弈方之间可以达成和运用有约束力的协议限制行为选择的博弈问题,与博弈方的态度是否合作无关。

6.错

【解题思路】:本题考察纳什均衡。

【解析】:只要任一博弈方单独改变策略不会增加利益,策略组合就是纳什均衡了。单独改变策略只能得到更小得益的策略组合是严格纳什均衡,是比纳什均衡更强的均衡概念。

7.对

【解题思路】:本题考察纳什均衡。

【解析】:这是纳什均衡的基本性质之一:奇数性所保证的。

8.错

【解题思路】:本题考察动态博弈。

【解析】:实际上动态博弈中先行为的博弈方往往是有先行优势的,因此常常是先行为的博弈方更有利而不是后行为的博弈方有利。

9.错

【解题思路】:本题考察多人博弈。

【解析】:多人博弈中的“破坏者”对博弈方的利益是否有影响和影响方向是不确定的。事实上,正是因为这种不确定性才被视为“破坏者”。这种“破坏者”实质上是指对博弈分析造成破坏,而不是对博弈方的利益造成破坏,因此肯定会受到不利影响的是博弈分析者而不是博弈方。

10.错

【解题思路】:本题考察纳什均衡。

【解析】:虽然纯策略纳什均衡不一定存在,但在我们所分析的博弈中混合策略纳什均衡总是存在的。这正是纳什定理的根本结论。也许在有些博弈中只有惟一的纯策略纳什均衡,没有严格意义上上的混合策略纳什均衡,这时把纯策略理解成特殊的混合策略,混合策略纳什均衡就存在了。

(三)计算题

1.【解题思路】:这是一个有关囚徒困境博弈的题目。

【解析】:(1)用囚徒困境的博弈表示如下表:

(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。

2.【解题思路】:这是一个有关零和博弈的题目。

【解析】:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳什均衡。

(2)Smith 选(1/3,1/3,1/3)的混合概率时, John 选1的效用为:

31131131)3(311-=?+?+-?=

U John 选2的效用为:

31131)3(311312-=?+-?+?=

U John 选3的效用为:

31)3(311311313-=-?+?+?=

U

类似地,John 选(1/3,1/3,1/3)的混合概率时,

Smith 选1的效用为:

31)1(31)1(31331'1=-?+-?+?=

U Smith 选2的效用为:

31)1(31331)1(31'

2=-?+?+-?=

U Smith 选3的效用为:

31331)1(31)1(31'3=?+-?+-?=

U

因为

321U U U ==,'3'2'1U U U ==,

所以:

??

????)31,31,31(),31,31,31(是纳什均衡,策略值分别为John :31-=U ;Smith :31'

=U 。 3.【解题思路】:本题考察双寡头博弈中的生产决策。

【解析】:(1)对于垄断企业1来说:

2

19020)](2400max[211

121Q Q Q Q Q Q -=

?-+-

这是垄断企业1的反应函数。

其等利润曲线为:21211122380Q Q Q Q --=π 对垄断企业2来说:

4

502)](2400max[122

2

221Q Q Q Q Q Q -

=?-+-

这是垄断企业2的反应函数。

(2)当垄断企业1为领导者时,企业2视企业1的产量为既定,其反应函数为:

4/5012Q Q -=

则企业1的问题可简化为:

均衡时价格为: 利润为:1=π

企业2领先时可依此类推。

(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。而企业2获得的利润较少。这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势”。

4.【解题思路】:本题重点考察子博弈完美纳什均衡。

【解析】:(1)如果企业A 先走一步,则企业B 的策略选择有四种: ①若A 选择“大”,B 也选择“大”;若A 选择“小”,B 仍然选择“大”。 ②若A 选择“大”,B 也选择“大”;若A 选择“小”,B 也选择“小”。 ③若A 选择“大”,B 选择“小”;若A 选择“小”,B 选择“大”。

④若A 选择“大”,B 选择“小”;若A 选择“小”,B 也选择“小”。 根据B 的策略选择,可得到一个2×4的标准型博弈,如下表所示:

(2)上述A 和B 的策略组合中有三个均衡,即X={大,(大,大)}、Y={大,(大,小)}和Z={小,(小,小)}。而且,这三个均衡都是纳什均衡。先看X 。当A 选“大”时,B 必定选“大”;而由于B 必然选“大”,故A 选“大”是其最优反应。再看Y 。当A 选“大”时,B 也选“大”;当A 选“小”时,B 也选“小”,结果两者仍选“大”,这是合作均衡。最后看Z 。若A 选“小”,则B 必选“小”,与X 一样,(小,小)是两者最优反应的组合,所以是纳什均衡。

(3

从上图可以看出,策略组合X={大,(大,大)}不是子博弈完美纳什均衡。因为,尽管X 是整个博弈的纳什均衡,也是以B 1为始点的子博弈的纳什均衡,但它不是以B 2为始点的子博弈的纳什均衡。策略组合Z={小,(小,小)}也不是子博弈完美纳什均衡。理由是,Z 是整个博弈和以B 2为始点的纳什均衡,但不是以B 1为始点的子博弈的纳什均衡。因而,只有Y={大,(大,小)}属于子博弈完美纳什均衡,因为组合Y 在上述三个子博弈中,都是纳什均衡。

5.【解题思路】:这是一道有关完全信息动态博弈模型的题目。

【解析】:因为是在给定私人部门通货膨胀预期的情况下制定货币政策,也就是确定实际通货膨胀率,所以,政府面临的最大化问题就是:

2*2)(max ky y c U ---=π

)(..*e y ????y ?t s ππβ-+=

运用拉格朗日函数解这一最大化问题,可得π的值:

])1([)(*12*y k c e -++=-βπββπ 上式是政府的反应函数。

又由于假设私人部门具有理性预期,也就是说预期的通货膨胀率等于*π,这样就将

*ππ=e 代入政府的反应函数,可得:

*1*)1(y k c e -==-βππ

这样,由于私人部门具有理性预期,实际产出水平将与通货膨胀率无关而等于自然失业率下的产出水平;另一方面却要忍受通货膨胀率的痛苦。因此,原题结论得以证明。

(四)问答题

1.【解题思路】:日常生活中囚徒困境博弈的例子很多。

【解析】:在校园的人行道交叉路口,无需红绿灯。现在两人分别骑车从东西方向和南北方向通过路口。若同时往前冲,必定相撞,各自支付为(-2,-2);若同时停下,都不能按时前进,支付为(0,0);若一人前进一人停下,支付为(2,0)或(0,2)。相应的策略和支付矩阵如下表。

2.【解题思路】:本题重点考察纳什均衡。

【解析】:(1)有两个纳什均衡,即(啤酒,白酒)、(白酒,啤酒),都是纳什均衡而不

是占优策略均衡。

(2)显然,(白酒,啤酒)是最佳均衡,此时双方均获得其最大收益。若均衡解为(啤酒,白酒),则存在帕累托改善的可能。方法是双方沟通,共同做出理性选择,也可由一方向另一方支付报酬。福利由800+900变为900+1000,增量为200。

(3)如将(啤酒,白酒)支付改为(1000,1100),则(啤酒,白酒)就成为占优策略均衡。比如将(啤酒,白酒)支付改为(800,500),将(白酒,啤酒)支付改为(900,500),则该博弈就不存在任何占优策略均衡或纳什均衡。

3.【解题思路】:本题从混合纳什均衡出发进行考虑。

【解析】:(1)该博弈的支付矩阵如下表:

(2)先分析税收检查边际:因为S为税务机关检查的概率,E为纳税人逃税的概率。给定E,税收机关选择检查与否的期望收益为:

=)

+

-

-

-

+

,1(

)

=

(

)

)(

1

(

E

C

A

C

+

A

EF

E

E

K-

A

F

C

E

K-

E

+

?

A

=

+

-

E

)

)

A

1(

1(

)

,0(E

解)

A

C

=。

/(F

E+

,0(

)

,1(E

K

E

K=,得:)

如果纳税人逃税概率小于E,税收机关的最优决策是不检查,否则是检查。

再分析逃税边际:给定S,纳税人选择逃税与否的期望收益是:

(+

-

(

)

=

-

-

=

-

+

?

)1,

S

S

1(

F

S

F

A

A

(

)

S

K)

=)

-

+

1

)0,

(

(

)(

-

A

A

-

AS

S

S

=

K-

解)0,

A

/(F

=。即如果税收机关检查的概率小于S,纳税人的K=,得:)

S+

A

S

)1,

(

K

(S

最优选择是逃税,否则是交税。

因此,混合纳什均衡是(S,E),即税收机关以S的概率查税,而纳税人以E的概率逃税。

(五)案例分析题

1.【解题思路】:这是一道有关日常生活中囚徒困境博弈的示例。

【解析】:囚徒困境是一种“二人博弈”。在一次性的囚徒困境博弈中,每个博弈者都有一种欺骗的优势策略,即招供。囚徒困境的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为其基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同最优。简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。

从案例的分析来看,定价1.4美元成为企业的占优战略。而我们现实生活中囚徒困境的例子很多的,例如厂商之间的价格战、恶性的广告竞争,初等、中等教育中的应试教育等,其实都是囚徒困境博弈的表现形式。

对于任何想进入中国市场的跨国公司来说,也面临着类似的“囚徒困境”。假设有两个跨国公司A和B正在争取同一个项目。在这种情况下,他们在处理与政府公职人员的关系上

有两个选择,行贿或者不行贿。如果大家都不行贿,那么获得项目与否要依靠实力来决定,在两者实力相当的情况下,双方获得项目的可能性均为50%左右。如果大家都行贿,最终的结果可能要综合考察实力强弱和贿赂的额度而定,如果一方行贿而另一方不行贿,那么在实力相当的情况下肯定是行贿方胜出,最终获得项目。在这种情况下,跨国公司该如何选择呢?显然,它在决定自己行为的时候必须考虑对方的行为选择。通常,跨国公司争取的项目都是利润非常丰厚的项目,行贿所带来的成本与可以获得的收益相比是很小的。因此,获得该项目,最终跨国公司的选择就是行贿,或者说为了获得与对手平等的竞争机会,它也会去行贿。是在囚徒困境的激励下,跨国公司纷纷向外国政府公职人员进行违法支付。如朗讯和西门子公司都在中国陷入“贿赂门”事件等等。

2. 【解题思路】:本题主要目的在于区分动态博弈与静态博弈。

【解析】:(1)由于老板在决定是否克扣工资前可以完全清楚工人是否偷懒,因此这是一个动态博弈,而且是一个完全信息的动态博弈。此外,由于双方都有关于得益的充分信息,因此这是一个完全且完美信息的动态博弈。该博弈用扩展形表示如下:

根据上述得益情况可以看出,在该博弈中偷懒对工人总是有利的,克扣对老板也总是有利的,因此在双方都只考虑自己的利益最大化的情况下,该博弈的通常结果是工人偷懒和老板克扣。

(2)由于老板在决定是否克扣工资之前无法清楚工人是否偷懒,因此该博弈可以看作静态博弈。由于双方仍然都有关于得益的充分信息,是一个完全信息的静态博弈。该博弈用得益矩阵表示如下:

老板

工 人

偷懒 不偷懒其实根据该得益矩阵,不难得到与上述动态博弈同样的结论,仍然是工人会选择偷懒和老板会选择克扣。这个博弈实际上与囚徒困境是相似的。 四、考研试题精选 (一)计算题

1.两家计算机厂商A 和B 正计划推出办公信息管理系统。两厂商可开发的管理系统有高速、高质(H )和低速、低质两种(L )。市场研究表明各厂商在不同策略下相应的利润由如下的收益矩阵给出。

(1)如果两厂商同时做出决策且使用极大化极小(低风险)策略,结果将是什么?

(2)假设两厂商都试图最大化利润,且A先开始计划并实施,结果会怎样?如果B先开始,结果又会如何?(上海交大2004研)

2.A、B两企业利用广告进行竞争。若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。

(1)画出A、B两企业的支付矩阵。

(2)求纳什均衡。(北大1995研)

3.博弈的收益矩阵如下表:

(1)如果(上,左)是占优策略均衡,则a、b、c、d、e、f、g、h之间必然满足哪些关系?(尽量把所有必要的关系式都写出来)

(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足?

(3)如果(上,左)是占优策略均衡,那么它是否必定是纳什均衡?为什么?

(4)在什么情况下,纯战略纳什均衡不存在?(北大2000研)(二)问答题

1.在博弈论中,占优策略均衡(dominant strategy equilibrium)总是纳什均衡(Nash equilibrium)吗?纳什均衡一定是占优策略均衡吗? (北大1996研)

2.判断下列说法正误:

(1)斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润。(北大1997研)

(2)由于两个罪犯只打算犯罪一次,所以被捕后才出现了不合作的问题即囚徒困境。但如果他们打算重复合伙多次,比如说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供。(北大1997研)

3.试用博弈论思想论述中国为什么要加入世界贸易组织?(对外经贸大学2002研)

参考答案

(一)计算题

1.【解题思路】:本题考察的重点是极大极小战略和纳什均衡。

【解析】:(1)如果两厂商同时做出极大化极小的低风险决策,大家都会力求避免做出L 决策,而都在H 决策中选择,选择结果将出现一个左上的均衡(30,30)。

(2)如果A 先开始行动并力求使利润最大,则会选择H 中的50,B 厂商如果在A 厂商行动的基础上做出选择,则会选择L 决策,结果将出现一个(50,35)的均衡。如果B 先开始行动,结果会出现(40,60)的均衡。事实上,这两个结果都是纳什均衡。

2.【解题思路】:这是一个完全信息静态博弈中的纳什均衡的例子。

【解析】:(1)由题目中所提供的信息,可画出A 、B 两企业的支付矩阵(如下表)。

(2)因为这是一个简单的完全信息静态博弈,对于纯策纳什均衡解可运用划横线法求解。

如果A 厂商做广告,则B 厂商的最优选择是做广告,因为做广告所获得的利润8大于不做广告获得的利润2,故在8下面划一横线。如果A 厂商不做广告,则B 厂商的最优选择也是做广告,因为做广告获得的利润为12,而不做广告的利润为6,故在12下面划一横线。

如果B 厂商做广告,则A 厂商的最优选择是做广告,因为做广告获得的利润20大于不做广告所获得的利润10,故在20下面划一横线。如果B 厂商不做广告,A 厂商的最优选择是不做广告,因为不做广告获得的利润30大于做广告所获得的利润25,故在30下面划一横线。

在本题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是A 、B 两厂商都做广告。

3.【解题思路】:本题可以从占优策略均衡的角度进行思考。

【解析】:(1)e a >,g c >,d b >,h f >。本题另外一个思考角度是从占优策略均衡的定义出发。对乙而言,占优策略为),(),(h d f b >;而对甲而言,占优策略为),(),(g e c a >。综合起来可得到所需结论。

(2)纳什均衡只需满足:甲选上的策略时,d b >,同时乙选左的策略时,e a >。故本题中纳什均衡的条件为:d b >,e a >。

(3)占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。 (4)当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。

(二)问答题

1.【解题思路】:占优策略均衡和纳什均衡的关系。

【解析】:占优策略均衡总是纳什均衡,但纳什均衡不一定是占优策略均衡。

设策略组),,(1I S S S Λ=,博弈为)}]({},{,[?=i i u S I G 。根据纳什均衡的定义,对每一i 且所有的i i S S ∈',有),(),('i i i i i i S S u S S u --≥;根据占优策略均衡的定义,对每一i 且所有的

i i S S ∈',i

i S S --∈',有),(),(''i i i i i i S S u S S u --≥。显然,占优策略均衡是纳什均衡的一种特殊情况。在这种情况下,不管其他游戏者采取何种策略,游戏者i 采取策略i 总要占优于别的策

略。而在纳什均衡中,只要在对手策略给定的情况下,游戏者i 的策略最优即可。

2.【解题思路】:这两题分别考察斯塔克博格模型中的均衡和囚徒困境博弈。 【解析】:(1)正确。在斯塔克博格模型中,领导者可以根据跟随者的反应曲线来制定自己的最优产量。其利润一定不会小于古诺均衡下的利润,否则,领导者将采取古诺博弈中双方同时行动的策略而获得古诺均衡的利润。

(2)错误。只要两囚犯只打算合作有限次,其最优策略均为招供。比如最后一次合谋,两小偷被抓住了,因为将来没有合作机会了,最优策略均为招供。回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢。依此类推,对于有限次内的任何一次,两小偷均不可能合作。

3.【解题思路】:本题考察博弈论的日常运用。 【解析】:(1)博弈论,英文为Game theory, 是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的,也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。

(2)我国外贸额90%以上是同世贸组织成员发生的,此时的中国就类似于智猪博弈中的“小猪”,世贸组织成员类似于“大猪”,因为一旦发生贸易摩擦,往往以双边政治关系为“抵押”,却无权引用多边争端解决机制,从而在贸易中处于被动地位。而无权引用乌拉圭回合的反倾销协议和反补贴协议下的权益,也使中国往往成为歧视性反倾销反补贴的首要对象。

(3)加入世贸组织能够为中国在新世纪的发展中争取更为有利的生存环境。加入世贸组织,也将带来一些压力和挑战,如会给中国国内的部分企业带来更大的竞争压力。但专家们指出,这些压力将促使企业加速技术改进,改进管理,提高产品质量,在全球化的经济环境下,不断提高自身的竞争能力,进入良性循环状态。加入WTO 之后,由于可以借助WTO 的仲裁机制,类似针对中国的单方面的制裁会多了一个申诉的渠道,不会光吃哑巴亏。就如斗鸡博弈理论一样,其他国家单方面对我国进行歧视性反倾销时,我国可以利用世贸组织的游戏规则行事,避免过于被动。同时,中国作为世贸组织的正式成员将参加到二十一世纪的国际贸易规则的决策过程当中,摆脱别人制定规则,中国被动接受的不利局面,而且参预制定规则,有利于中国的合法权益得到反映;同时,可把国际贸易争端交到世贸组织的仲裁机关处理,免受不公正处罚。

第八章╲t博弈论

第八章博弈论 一、重点和难点 (一)重点 1.博弈论及其基本概念 2.纳什均衡 3.占优策略均衡 4.囚徒困境博弈 (二)难点 1.最小最大值(或最大最小值)策略 2.子博弈精炼纳什均衡 3.动态博弈战略行动 4.不完全信息静态博弈 5.不完全信息动态博弈 二、关键概念 博弈零和博弈非常和博弈囚徒困境纳什均衡支付子博弈精炼纳什均衡完全信息静态博弈占优策略均衡重复博弈战略移动可信威胁豪尔绍尼转换三、习题 (一)单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.规则 B.占优战略均衡 C.策略 D.结局 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。 A.囚徒困境式的均衡

B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的战略称为()。 A.一报还一报的战略 B.激发战略 C.双头战略 D.主导企业战略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败 C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在双寡头中存在联合协议可以实现整个行业的利润最大化,则()。 A.每个企业的产量必须相等 B.该行业的产出水平是有效的 C.该行业的边际收益必须等于总产出水平的边际成本 D.如果没有联合协议,总产量会更大 10.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 11.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种战略是一种()。 A.主导战略 B.激发战略 C.一报还一报战略 D.无用战略 12.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 13.下面关于共同知识的说法,正确的是()。 A. 每一个局中人都知道的事,就是共同知识 B. 一般地,假定支付为共同知识 C. 共同知识的假定要求局中人的计算能力不是很强 D. 纳什均衡不需要共同知识的假定 14、导致价格战爆发的原因是()

博弈论谢识予第四五章参考标准答案

博弈论谢识予第四五章参考答案

————————————————————————————————作者:————————————————————————————————日期: 2

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。 如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

博弈论教学大纲

【博弈论】课程教学大纲 【课程代码】0410955 【学分】2 【参考学时】32 【讲授学时】32 【实验学时】0 【实习学时】0 【课程性质】专业选修【参考教材】《经济博弈论》(复旦大学出版社) 【课程基础】 具备一定的高等数学基础,包括微积分、线性代数与概率统计。具备微观经济学与宏观经济学的学生将会发现本门课程分析问题的崭新角度,因而特别推荐经济学专业的学生选修此门课程。 【适应对象】 尽管本门课程的大多数例子是经济学的,但也不乏其他学科的,如法律、政治学、社会学等。这样不仅可以使经济类专业的学生开阔视野,同时也可以为其他学科有兴趣的同学提供接触经济学,了解经济学的机会,但这里强烈建议那些非经济类预选本门课程的同学,先掌握一些基本的经济学常识及一定的数学基础。 【教学目的】 著名经济学家Jean Tirole说过“正如理性预期使宏观经济学发生革命一样,博弈论广泛而深远地改变了经济学家的思维方式”。现实情况也确实如此,新古典经济学的前提假设与现实相距甚远,非完全竞争市场和不完全信息时的价格制度常常不是实现合作和解决冲突的最有效安排。而非价格制度的最显著特征是参与人之间行为的相互作用,此种情况下发展起来的通用方法便是博弈论。通过本科的学习使学生能够基本了解博弈论的基本思想与方法,具备一定的运用博弈论分析现实经济与社会问题的能力。 【内容提要】 博弈论是近年来现代经济学中发展最迅速的分支学科。博弈论研究多人决策问题,在社会经济的各个层面都有许多可用博弈论分析或解决的决策问题,因此博弈论在经济学理论和应用学科有着广泛的应用,是掌握现代经济学的关键。 第一章导论 一、什么是博弈论

高鸿业,微观经济学,第七版,课后答案,西方经济学18第十章博弈论初步

第十章 博弈论初步 第一部分 教材配套习题本习题详解 一、简答题 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒 困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211a a a a B 的支付矩阵=??? ???2221 1211b b b b 例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。 具体事例为: 73737373?? ?? ??

3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??? ???22211211a a a a B 的支付矩阵=11122122b b b b ???????? A 、 B 共同的支付矩阵=1111121222222121a b a b a b a b ?? ?????? 具体事例为: 76157323?? ?? ?? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合 代表的策略组合就是博弈的纳什均衡。 5.设有A、B两个参与人。对于参与人A的每一个策略,参与人B的条件策略有无 可能不止一个?试举一例说明。 解答:例如,在如表10—1的二人同时博弈中,当参与人 A选择上策略时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两个策略的支付是完全一样 的。因此,对于参与人A的上策略,参与人B的条件策略有两个,即左策略和右策略。 表10—1

博弈论

第八章 博 弈 论 教学目的:明确博弈产生与发展的有关基本理论;各种博弈种类的比较。 教学要求:阐明博弈理论与传统微观经济学理论的关系。 教学重点:完全信息静态博弈;不完全信息动态博弈;不完全信息静态与动态博弈。 教学难点:纳什均衡;最大化最小化原理;不完全信息博弈。 第一节博弈问题概述 一、博弈论及其基本概念 博弈也叫作对策,译自英文的Game,字面意义可理解为游戏。博弈论“是关于策略相互作用的理论”,研究两个或两个以上参加者在对抗性或竞争性局势下如何采取行动,如何作出有利于己方的决策及其均衡问题。 在前面几章的分析中,除了寡头市场外,消费者和企业的最优决策是在简单环境下进行的,没有考虑各经济主体之间决策的相互影响。 而博弈论研究人与人之间相互“斗智”的形式和后果。 当人们的利益存在冲突时,每个人所获得的利益不仅取决于自己所采取的行动,也取决于其他人采取的行动或者对自己行动的反应,即某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体的决策。 博弈论描述在这种形势下各方理性地选择自己的行动所实现的结果,分析决策各决策主体的行为发生相互作用时的决策以及这种决策的均衡问题。 博弈论的基本概念包括:参与人、策略、支付。 (1)参与人(player)也称为局中人,是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体,局中人可以是自然人,也可以是各种社会组织,如:企业、政府、社团等等。 (2)策略(strategy)是指参与人选择行动的计划或规则,它规定参与人如何对其他人的行动作出反应,即在每种情况下应该如何行动,因而代表着参与者的相机行动方案。而行动是指参与人的决策变量。策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 (3)信息(information)是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。(4)在博弈论中,可以用数值表示各局中人从博弈中各自获益多少或相应的效用水平,这个数值称为支付(payoff);支付函数是所有参与人策略或行动的函数,是每个参与人真正关心的东西。博弈均衡是所有参与人的最优策略或行动的组合。

博弈论谢识予第四五章参考答案

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。 6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

高鸿业《西方经济学(微观部分)》(第6版)笔记(第10章 博弈论初步)

高鸿业《西方经济学(微观部分)》(第6版)第10章博弈论初步 复习笔记 跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。 以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。 博弈论在20世纪50年代由数学家约翰·冯·诺依曼和经济学家奥斯卡·摩根斯坦引入经济学,目前已经成为主流经济分析的主要工具,对寡头理论、信息经济学等经济理论的发展作出了重要贡献。 一、博弈论的几个基本概念 博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响。因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人的可能反应来决定自己的决策和行动。 1.博弈参与人 参与人或称局中人,是指博弈中的决策主体,即在博弈中进行决策的个体。参与人既可以是个人,也可以是团体(企业或国家)。 2.策略 策略是指参与人选择行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。 3.支付函数 支付函数也称为效用函数,表明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。 4.支付矩阵 参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵,也称之为博弈矩阵或收益矩阵。 其中,博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。 二、完全信息静态博弈:纯策略均衡 1.条件策略和条件策略组合 在同时博弈中,在给定其他参与人的策略时,某个参与人的最优策略称之为该参与人的条件优势策略(简称条件策略),而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件优势策略组合(简称条件策略组合)。 2.纳什均衡 如表10-1所示,(不合作,不合作)既是甲厂商的条件策略组合,也是乙厂商的条件策略组合,在该策略组合上,甲厂商和乙厂商都没有单独改变策略的倾向。 表10-1 寡头博弈:合作与不合作

第十章 博弈论初步 微观经济学微观课后答案

第十章 博弈论初步 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是最优的;即使在纳什均衡是唯一时,它也可能不是最优的——因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人(如A 和B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211 a a a a B 的支付矩阵=?? ????22211211b b b b 3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有4个、3个、2个、1个和0个,五种情况,所以可能有3个。例如,当参与人A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??????22211211a a a a B 的支付矩阵=11122122b b b b ???????? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解为两个参与人的支付矩阵;其次,在第一个(即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大

博弈论第四章习题

第四章习题 一、如果T次重复齐威王田忌赛马,双方在该重复博弈中的策略是什么?博弈结果如何? 答:因为这是零和博弈,结论比较具体。重复Nash 均衡,均以1/6的概率选择各个策略,期望收益分别为1和-1。 因为这是竞争性的零和博弈,无论是有限次重复博弈还是无限次的重复博弈,均不能达成合作的条件。 二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。 答:火车站和机场餐饮业的服务的顾客往往是一次性的,回头客和常客也比较少,价格高,质量差,一次性博弈。效率也比较低。 商业区和居民区的餐饮业和商业服务业,回头客和常客比较多,比较注重信誉,质优、价廉,重复博弈。效率也比较高。 三、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?

答:动态博弈的逆向归纳法可以用于有限次重复博弈,但不能用于无限次重复博弈,主要用逆向归纳法。 无限次重复博弈的效率往往高于有限次重复博弈。当重复次数较少不一定考虑贴现问题,但无限次重复博弈必须考虑贴现问题。 启发:重视有限次与无限次的区别,区分和研究这两类博弈,在实践方面重要启发是促进和保持经济的长期稳定和可持续发展,提高社会经济效率是非常有意义的。 四、判断下列表述是否正确,并作简单讨论: (1)有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。 答:不一定。对于有两个以上纯策略纳什均衡的条件下就不一定。如“触发策略”就不是。 (2)有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。 答:是,根据子博弈完美纳什均衡的要求,最后一次必须是原博弈的一个纳什均衡。 (3)无限次重复博弈均衡解的得益一定优于原博

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

博弈论第四章

4 非完全信息动态博弈 4.1 精炼贝叶斯均衡概述 例简单的非完全信息动态博弈 参与人1的类型t为个人信息。 参与人2 不知道t,但知道t的概率分布。 博弈的时序: (1)参与人1选择行动a1∈A1; (2)参与人2观察a1,选择a2∈A2 博弈的收益:u1 (a1, a2, t ), u2 (a1, a2, t ) u1u1u1u1 u1u1u1u1 u2u2u2u2 u2u2u2u2例: 1 R L M 1 3 p 2 1- p L'R'L'R' 2 0 0 0 1 0 1 2

标准式表示 参与人2 L'R' L2,10,0 参与人1 M0, 20, 1 R1, 31, 3 纯战略纳什均衡: (L,L'), (R,R') 均为子博弈精炼纳什均衡(无子博弈)。 但是(R, R')不可信。 排除不可信的纳什均衡: 要求1 参与人必须有一个推断(belief). 要求2 参与者的战略必须满足序贯理性(sequentially rational). 定义 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集. 处于均衡路径之外(off the equilibrium path)的信息集: 在均衡战略下,博弈不会到达此集. 要求 3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。 例要求3的说明 参与人1的类型空间:{ t1,t2,t3,t4 } 行动空间:A= { L,R}

推断p i : 观察到L 后,参与人1的类型是t i 的概率。 推断q i : 观察到R 后,参与人1的类型是t i 的概率。 p 1 + p 2 + p 3 + p 4 = 1 q 1 + q 2 + q 3 + q 4= 1 如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。 参与人2对p i 与 q i 的推断: p 1 = 3.02.02.0+= 0.4, p 2 = 3 .02.03 .0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3 .02.03 .0+= 0.6, 要求 4 在处于均衡路径之外的信息集上, 可能情况下,推断由贝叶斯法则和参与人的均衡战略决定。 原文:At information sets off the equilibrium path, beliefs are determined by Bayes ’ rule and the players ’ equilibrium strategies where possible.

博弈论课后习题

第一章导论 1、什么是博弈?博弈论的主要研究内容是什么? 2、设定一个博弈模型必须确定哪几个方面? 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法,有哪些主要的类型? 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择?(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么?(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么? 7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。 第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么? 2、为什么说纳什均衡是博弈分析中最重要的概念? 3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响? 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么? 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分10 000元进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10 000,如果s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会要求什么数额,为什么? 8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则P=0)。假设厂商i生产qi产量的总成本为Ci=Ci(qi)=cqi,也就是说没有固定成本且各厂商的边际成本都相同,为常数c(c<a).假设各厂商同时选择产量,该模型的纳什均衡是什么?当n趋向于无穷大时博弈分析是否仍然有效? 9、两寡头古诺模型,P(Q)=a-Q等与上题相同,但量厂商的边际成本不同,分别为c1和c2。如果0<ci <a/2,问纳什均衡产量各为多少?如果c1<c2<a,但2c2>a+c1,则纳什均衡产量又为多少? 10、甲乙两公司分属两个国家,在开发某种新产品方面有下面得益矩阵表示的博弈关系(单位:百万美元)。该博弈的纳什均衡有哪些?如果乙公司所在国政府想保护本国公司利益,有什么好的办法? 11、设一个地区选民的观点标准分布于【0,1】上,竞选一个公职的每个候选人同时宣布他们的竞选立场,即选择0到1之间的一个点。选民将观察候选人们的立场,然后将选票投给立场与自己的观点最接近的候选人。例如有两个候选人,宣布的立场分别为x1=和x2=,那么观点在x=左边的所有选民都会投候选人1的票,而观点在x=右边的选民都会投候选人2的票,候选人1将以60%的选票获胜。再设如果又候选人的立场相同,那么立场相同的候选人将平分该立场所获得的选票,得票领先的候选人票数相同时则用抛硬币决定哪个候选人当选。我们假设候选人唯一关心的知识当选(即不考虑自己对观点的真正偏好),如果又两个候选人,问纯策略纳什均衡是什么?如果又三个候选人,也请作出一个纳什均衡。 12、运用本章的均衡概念和思想讨论下列得益矩阵表示的静态博弈。

博弈论第4章答案

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4,1 0,0 3,0 0,1 2,2 2,2 纯战略纳什均衡:( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡:( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡:( R, M ’ ) 子博弈精炼纳什均衡:( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2,2 2,2 3,0 0,1 0,1 3,0 六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。 求混合战略精炼贝叶斯均衡: 设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则: 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又 联立得 所以 L L M L L M L R L

4.3答案(见4.5) 4.4 表示方法 第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号; 第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a ) [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== (b ) [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案 (a ) [(,),(,),1/3,1/2]R R u d p q >= (b ) 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=

高鸿业-微观经济学-第七版-课后答案-西方经济学18第十章博弈论初步教学内容

学习-----好资料 第十章 博弈论初步 第一部分 教材配套习题本习题详解 一、简答题 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒 困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211a a a a B 的支付矩阵=??? ???2221 1211b b b b 例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。 具体事例为: 73737373?? ????

3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??? ???22211211a a a a B 的支付矩阵=11122122b b b b ??????? ? A 、B 共同的支付矩阵=1111121222222121a b a b a b a b ???????? 具体事例为: 76157323?? ?? ?? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合 代表的策略组合就是博弈的纳什均衡。 5.设有A、B两个参与人。对于参与人A的每一个策略,参与人B的条件策略有无 可能不止一个?试举一例说明。 解答:例如,在如表10—1的二人同时博弈中,当参与人 A选择上策略时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两个策略的支付是完全一样 的。因此,对于参与人A的上策略,参与人B的条件策略有两个,即左策略和右策略。 表10—1

高鸿业-微观经济学-第七版-课后答案-西方经济学18第十章博弈论初步汇编

第十章博弈论初步 第一部分教材配套习题本习题详解 一、简答题 1?什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人(如A和B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A的支付矩阵=B的支付矩阵= b21 b22例如:a ii=a i2=a^i=a^2,b ii=b i2=b2i=b22就会得到以上四个纳什均衡。 具体事例为: [7 3 7 3〕 7 3 7 3^

3. 在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯 策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的 纳什均衡可能有4个、3个、2个、1个和 0个五种情况,所以可能 有3个。例如,当参与 人A 与E 的支付矩阵可分别表示如下时,总的支付矩阵 中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 4. 在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 如 何找到所有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下: 首先,把整个博弈的支付 矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵 左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次, 在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行 的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合 并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个 的支付矩阵中,找到两个数字之下均画有线的支付组合。 由该支付组合 代表的 策略组合就是博弈的纳什均衡。 5 .设有A 、E 两个参与人。对于参与人A 的每一个策略,参与人E 的条件 策略有 无 可能不止一个?试举一例说明。 解答:例如,在如表10 — 1的二人同时博弈中,当参与人 A 选择上策略 时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两 个策略的支付是完全一样 的。因此,对于参与人A 的上策略,参与人B 的条件 策略有两个,即左策略和右策略。 表10 — 1 A 的支付矩阵= a i1 a i2 I a 2i a 22 A 、 B 共同的支付矩阵=— a 21 具体事例为: 7 6 1 _7 3 2 [b 11 b 12 B 的支付矩阵= 'b 21 b 22 b ii 玄伐 b i2 I b 21 a 22 b 22 5 3 _

高鸿业《西方经济学(微观部分)》(第2版)名校考研真题详解-第十章 博弈论初步【圣才出品】

第十章 博弈论初步 一、名词解释 1.占优策略均衡(中央财经大学2011研;兰州大学2014研) 答:在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。也就是说,无论其他参与人采取什么策略,该参与人的最优策略是唯一的,这样的策略称之为占优策略。如表10-1所示,通过对支付矩阵的分析可以看出,如果 A 、 B 两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都会选择做广告。这种策略均衡称之为占优策略均衡。 表10-1 广告博弈的支付矩阵 2.纳什均衡(华中科技大学2002研;中国海洋大学2002研;东北大学2003研;武汉大学2003、2007研;北京大学2004研;北京师范大学2005研;中南大学2005研;东华大学2006研;东北财经大学2007研;中南财经政法大学2007、2009研;中央财经大学2007研;财政部财政科学研究所2008研;华南师范大学2011研) 答:纳什均衡又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰·纳什的名字命名。 纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略的情况下,他选择了最好的策略。

纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而没有人有积极性去打破这个均衡。 3.混合策略(东北大学2007研;华中科技大学2008研) 答:混合策略是指在博弈中,博弈方的决策内容不是确定性的具体的策略,而是在一些策略中随机选择的概率分别的策略。混合策略情况下的决策原则有以下两个:(1)博弈参与者互相不让对方知道或猜到自己的选择,因而必须在决策时利用随机 性来选择策略,避免任何有规律性的选择。 (2)博弈参与者选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通 过有针对性倾向的某一种策略而在博弈中占上风。 4.以牙还牙策略(东北财经大学2012研) 答:以牙还牙策略的内容是:所有的成员一开始是合作的。对于每一个成员来说,只要其他成员是合作的,则他就把合作继续下去。但只要有一个成员一旦背弃合作协议采取不合作的策略,则其他成员便会采取“以牙还牙”的惩罚和报复策略,即其他成员都采取相同的不合作策略,并将这种不合作的策略在重复博弈中一直进行下去,以示对首先破坏协议者的惩罚和报复。 博弈论分析中,寡头厂商的合作是不稳定的,易陷入“囚徒困境”。在具有“以牙还牙”策略的无限次重复博弈中,所有的寡头厂商则都会遵守协议,采取合作的策略。 二、简答题 1.用囚徒困境模型说明为什么双寡头市场的价格战难以避免。(西南财经大学2006

相关主题
文本预览
相关文档 最新文档