经济博弈论复习重点

  • 格式:docx
  • 大小:46.90 KB
  • 文档页数:2

下载文档原格式

  / 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果

纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方的策略,都是对其余博弈方策略的组合

的最佳对策,也即 对任意 都成立,

则称 为G 的一个纳什均衡

混合策略纳什均衡在博弈 中,

博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。

:包含混合策略的策略组合,构成纳什均衡。

多个纳什均衡的某一个给所有博弈方带来的得益都大于其他所有那好似均衡带来的得益,则各个博弈方都会倾向于此纳什均衡的策略,博弈能够实现帕雷托效率,称此纳什均衡为帕累托上策均衡。

如果所有博弈方在预计其他博弈方采用各种策略的概率相同时,某一策略给他带来的期望得益最大,各博弈方都偏爱这样的策略的策略组合,就称之为风险上策均衡。 “聚点”均衡(focal point equilibrium)。在制度经济学中,信息就可以解释为参与一个社会必须存在的“道德传统”(D.诺斯称之为“文化意识型态”),从而可以决定在多个纳什均衡中会出现某一个特定的均衡。此处的聚点(focal point )作用被解释为:当参与人之间没有正式的信息交流时,他们存在于其中的“环境”往往可以提供某种暗示,使得参与人不约而同地选择与各自条件相称的策略(聚点),从而达到均衡。 相关均衡:博弈方根据观察到的信号或者相关信号来确定自己的行为而形成的更广泛意义下的纳什均衡

如果一个博弈的某个策略组合满足下列要求:

(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;

(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;

(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。 称为“防共谋均衡”。

从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法” 如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

有限次重复博弈:给定一个基本博弈G (可以是静态博弈,也可以是动态博弈),重复进行T 次G ,并且在每次重复G 之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G 的T 次重复博弈”,记为G(T)。而G 则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。无限次重复博弈:一个基本博弈G 一直重复博弈下去的博弈,记为G( )策略:博弈方在每个阶段针对每种情况如何行为的计划子博弈:从某个阶段(不包括第一阶

}

,;,{11n n u u S S G =),(*

*n i s s ),...,,(**1*1*n i i i s s s s +- ),...,,,(),...,,,(**1*1***1**1*n i ij i i i n i i i i i s s s s s u s s s s s u +-+-≥ i j i S s ∈),(*

*n i s s },;,{11n n u u S S G =

段)开始,包括此后所有的重复博弈部分均衡路径:由每个阶段博弈方的行为组合串联而成 设原博弈G 有唯一的纯策略纳什均衡,则对任意整数T ,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G 的纳什均衡策略。各博弈方在G(T)中的总得益为在G 中得益的T 倍,平均得益的与原博弈G 中的得益。

要求1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”。对非单节点信息集,一个“判断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信息集,则可理解为“判断达到该节点的概率为1” 要求2:给定各博弈方的“判断”, 他们的策略必须是“序列理性”的。即在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益或期望得益最大。此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段中,针对所有可能情况如何行为的完整计划 要求3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略决定 要求4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定

中相应选择的行动将从自己的行为空间,博弈方类型抽取的各种为博弈方设定对于“自然”可能。函数的一个各种可能类型的一个策略,就是自己博弈方中在静态贝叶斯博弈i i i i i i i i i i n

n

n

n

a A i t i t S t S T t t i u u p p T T A A G )()()(,}

,,;,,;,,;,,{1

1

1

1

∈= 贝叶斯纳什均衡纯策略的一个为则称策略组合都能满足

所选择的行动,型和他的每一种可能的类中,如果对任意博弈方在静态贝叶斯博弈)(),,()}|(]),(,),(,,,),([{max )(},,;,,;,,;,,{**1**1*1*11*11111G S S S t t p t t S t S a S t S u a t S T t i u u p p T T A A G N t i i i n n i i i i i A a i i n n n n i

i

i =∈=∑--++-∈的策略和叶斯法则也仍要符合对应的信息集处的判断在使即使不存在的策略和贝叶斯法则。集处的判断必须符合的信息在对应于,则使得,如果存在对每个的解

最大化问题是的得益最大,即必须使的选择时,的策略给定的解

是最大化问题最大,即的期望得益必须使的行为,的信号和的判断给定的概率分布是每种类型时,选择的判断,即的类型之后,必须有关于的信号在观察到信号发出方信号接收方S m R m t m T t S m R m t m T t M m m a m t u t m S t m S m a R a m t u m t p m a R m a R m S m t p R m t p m t p t S m S S m S R j j i i j j i i j j j i S m i i j k j i R t j i a j j j j i t j i j i i j j j

i

k

i

=∈=∈∈=≥∑∑)()(.4)](,,[max )()()(.3),,()|(max )()()|(.21

)|(,0)|(.1*****

*

**

)

,(),(.4},{.3.21

)()(,),(},{.1,111,1k i R k i S K

K j i j j i T

i i T T i a t u a t u a a a A t t t t T t t p t p t p t t T t ,行为方的得益为声明方的得益为中选合后,在可选择的行为集声明行为方在听到声明方的以不同(说假话)相同(说真话),也可可以与当然作为自己声明的类型。中选择以后,从声明方了解对自己的随机抽取,其中中以概率分布集合,抽取的方法是从类型自然抽取声明方的类型 ===∑=