经济博弈论考试复习

  • 格式:doc
  • 大小:148.00 KB
  • 文档页数:6

下载文档原格式

  / 6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

经济博弈论考试复习

一、

1.什么是博弈论?

“博弈论”译自英文“Game Theory ”,直译就是“游戏理论”。是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。

博弈:一些个人、组织,面对一定的环境条件,在一定的规律下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。包括:博弈的参加者,各博弈方的全部策略或行为集合,进行博弈的次序,博弈方的得益四方面。

2.什么是纳什均衡?

在博弈G=﹛1S ,…,n S ;1u ,…,n u ﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(1s *,…,n s *)中,任一博弈方i 的策略i s *,都是对其余博弈方策略组合(1s *,…,1i s -*, i s *,1i s +*,… n s *)的最佳对策,也即i u (1s *,…,1i s -*, i s *,1i s +*,… n s *)》i u (1s *,…,1i s -*, i s *,1i s +*,… n s *)对任意ij s ϵi S 都成立,则称(1s *,…,n s *)为G 的一个“纳什均衡”。

(假设有n 个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略,从而使自己利益最大化。所有局中人策略构成一个策略组合就是纳什均衡。这种策略组合由所有参与人最优策略组成,即在给定别人策略的情况下,没有人有足够理由打破这种均衡。)

3.什么是囚徒困境?

囚徒困境的基本模型是这样的:警察抓住了两个合伙犯罪的罪犯。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们窜供或结成攻守同盟:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白这从轻处理,立即释放,而另一人则将重判八年徒刑;如果两人同时坦白认罪,他们将各被判五年监禁。

坦白 不坦白(囚徒2)

双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。由于这两个囚徒不能串通,个人都追求自己的最大利益而不会顾及同伙的利益,又不敢相信对方,以此只能实现他们都不理想的结果。该博弈揭示了个体理性与团体立项之间的矛盾——从个体理性出发的行为往往不能实现团体的最大利益,最终也不能真正实现个体的最大利益,甚至

会得到相当差的结果。

二、

1.什么是完全信息静态博弈?

完全信息静态博弈是指各博弈方同时决策,且所有的博弈方对各方得益都了解的博弈。完全信息是指信息的充分性、对称性和透明性,静态是指同时决策,没有时间的差别。

2.如何求解纳什均衡?

求解纳什均衡的4种方法:

①离散、有限策略博弈:划线法

②连续、无限策略博弈:反映函数法

③零和博弈:最大最小法

④循环相克博弈:混合战略(无差异原则)

(1)离散有限——划线法

通过在每个博弈方对其他博弈方每个策略或策略组合的最佳对策对应的得益下划线,分析博弈的方法称为“划线法”。

例:囚徒的困境博弈

坦白 不坦白(囚徒2)

着只有这个策略满足双方的策略相互使对对方策略的最佳对策。就是博弈的结果。

划线法一策略之间的相对优劣为基础,在分析用得益矩阵表示的博弈问题时十分有普遍适用性。但事实上,也有许多博弈根本不存在确定性的结果,无法用这种方法。

(2)连续无限——函数法(求导,建立拉格朗日方程)

反应函数法: 对一个一般的博弈,只要是得益是策略的多元连续函数,我们都可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数,也就是反应函数,而解出的各个博弈方反应函数的交点就是纳什均衡。利用反应函数求博弈的纳什均衡的方法称为“反应函数法”

设:U x =U x (x,y) U y =U y (x,y)

x,y,U x ,U y 连续,U x ,U y 二阶可微并且 22

ux x

∂∂<0, 2

2uy y

∂∂ <0, 则求解反映函数: uy y

∂∂=0 ux x

∂∂=0。其解即为Nash 均衡 例:养羊博弈模型(P67)

局限性:1)对于不连续的得益函数无法用先求导数找出各个博弈方的反应函数的方法求纳

什均衡,所以无法发挥作用。

2)并不能保证各博弈方的反应函数有交点,特别是唯一的交点。

(3)零和博弈

1)有限离散策略——最大最小值法:

X 给出一个策略a x ’,则y 会给出一个行动a y ’,使U x (a x ’,a y ’)=minU x (a x ,a y ),而x 要选

择一个a x *,使U x 最大,U x (a x *,a y *)=max minU x (a x ,a y )=min maxU x (a x *,a y *).

y 的一个策略a y ,x 却会选一个a x ’使U x 最大,即U x (a x ’,ay)=maxU x (ax,ay),则y 会选一个a y *使U x (a x *,a y *)=minmaxU x (a x ,a y )

2)无限连续策略——反应函数方程(同上反应函数法)

(4)循环相克博弈(混合战略)——无差异法

1)所谓循环相克博弈是指博弈者的任何一项战略行为都受到对方某种战略的完全克制,对手之间的各个战略,形成相互克制的封闭环。如: “石头、剪子、布”游戏

2)所谓混合战略:

设: ,A x ={a x1,a x2,……,a xn },A y ={a y1,a y2,……,a ym }

设x 在A x 中随机选择战略,且某种战略被选择概率是Xk σ,

1n X k k σ=∑=1,则X σ=

﹛1122(),(),......,()X X X X XN XN a a a σσσ﹜是x 的混合战略。

同理,y 的混合战略 y σ ={ 1122(),(),......,()y y y y ym ym a a a σσσ}

例: P74~80

3)混合战略Nash 均衡的确定原则——无差异原则

即给定我的混合战略,你的任何战略都是无差异的。同时,给定你的混合战略,我的任何战略也都是无差异的。

在循环相克博弈中,均衡的状态就是从彼此克制中摆脱,使彼此相克转为彼此都不能相克——彼此不被对方克制的状态就是一种双方同时实现最优的状态。因为,任何一种纯战略都会陷入被对方克制的局面,只有采取一种混合战略,才能摆脱相互克制的局面。同时,这种混合战略还必须使对方的战略都无差异。 3.如何甄别、区分多重均衡?

(1)帕累托最优型Nash 均衡

设x,y 是两个player,(a x 1,a y 1)和(a x 2,a y 2)是两组Nash 均衡策略,(u x 1,u y 1)和(u x 2,u y 2

)是x 和y 在两种Nash 均衡策略下的效用()

如果满足u x 1>u x 2,并且u y 1>u y 2,则称,(a x 1,a y 1)是帕累托最优的Nash 均衡。