当前位置:文档之家› 不完全信息静态博弈

不完全信息静态博弈

第八章 不完全信息静态博弈

这一章里我们讨论不完全信息静态博弈,也称为贝叶斯博弈(Bayes)。不完全信息博弈中,至少有一个参与者不能确定另一参与者的收益函数。非完全信息静态博的一个常见例子是密封报价拍卖(sealed —bid auction):每一报价方知道自己对所售商品的估价,但不知道任何其他报价方对商品的估价;各方的报价放在密封的信封里上交,从而参与者的行动可以被看作是同时的。静态贝叶斯博弈问题的主要来源也是现实经济活动,许多静态博弈关系都有不完全信息的特征,研究贝叶斯博弈不仅是完善博弈理论的需要,也是解决实际问题的需要。

8.1 静态贝叶斯博弈和贝叶斯纳什均衡

为了更好的说明不完全信息与完全信息之间的差异,我们用一个典型静态贝叶斯博弈作为例子,自然的引进静态贝叶斯博弈概念。

考虑如下两寡头进行同时决策的产量竞争模型。其中市场反需求函数由Q a Q P -=)(给出,这里21q q Q +=为市场中的总产量。企业1的成本函数为1111)(q c q C =,不过企业2的成本函数以θ的概率为222)(q c q C H =,以θ-1的概率为222)(q c q C L =,这里H L c c <。并且信息是不对称的:企业2知道自己的成本函数和企业1的成本函数,企业1知道自己的成本函数,但却只知道企业2边际成本为高的概率是θ,边际成本为低的概率是

θ-1(企业2可能是新进入这一行业的企业,

也可能刚刚发明一项新的生产技术)。上述一切都是共同知识:企业1知道企业2享有信息优势,企业2知道企业1知道自己的信息优势,如此等等。

现在我们来分析这个静态贝叶斯博弈。一般情况下,企业2的边际成本较高时选择较低的产量,边际成本较低时,选择较高的产量。企业1从自己的角度,会预测到企业2根据其成本情况将选择不同的产量。设企业1的最佳产量选择为*1q ,企业2 边际成本为H c 时的最佳产量选择为)(*2H c q ,企业2 边际成本为L c 时的最佳产量选择为)(*2L c q ,如果企业2的成本较高,它会选择)(*2H c q 满足:

类似地,如果企业2的成本较低,)(*2L c q 应满足:

从而,企业l 为了使利润最大化,选择*1q 应满足:

三个最优化问题的一阶条件为:

及 ]})()[(1(])([({2

11*21*2*1c c q a c c q a q L H ---+--=θθ 三个一阶条件构成的方程组的解为:

及 3)1(2*1L H c c c a q θθ-++-=

把这里的*1q 、)(*2H c q 和)(*2L c q 与成本分别为1c 和2c 的完全信息古诺均衡相比较,假

定1c 和2c 的取值可使得两个企业的均衡产量都为正,在完全信息的条件下,企业的产出为

3/)2(*j i i c c a q +-=。与之不同的,在不完全信息条件下,H H c c q c q =>2*2*2

,)(当, L L c c q c q =<2*2*2,)(当。之所以会出现这种情况,是因为企业2不仅根据自己的成本调整其产出,同时还将考虑到企业l 的情况选择最优反应。如果企业2的成本较高,它就会因成本较高而减少产量,但同时又会生产稍多一些,因为它知道企业1将根据期望利润最大化的原则决定产出,从而要低于企业1确知企业2成本较高时的产量。

现在,我们要建立非完全信息同时行动博弈的标准式表述,也称为静态贝叶斯博弈。首

先要表示出非完全信息的关键因素,即每一参与者知道他自己的收益函数,但也许不能确知其他参与者的收益函数。令参与者i 可能的收益函数表示为);,,(1i n i t a a u Λ,其中i t 称为参与者i 的类型(type ),它属于一个可能的类型集(亦称为类型空间(type pace))i T ,每一类型i t 都对应着参与者i 不同的收益函数的可能情况。

作为具体的例子,考虑前面的的古诺博弈。企业的行动是它们的产量选择1q 和2q 。企业2有两种可能的成本函数,从而有两种可能的利润或收益函数:

企业1只有一种可能的收益函数:

我们说企业2的类型空间为了},{2H L c c T =,企业1的类型空间为了}{11c T =。

在这样定义参与者的类型之后,说参与者i 知道自己的收益函数也就等同于说参与者i 知道自己的类型,类似地,说参与者i 可能不确定其他参与者的收益函数,也就等同于说参与者i 不能确定其他参与者的类型,我们用},,,,,{111n i i i t t t t t ΛΛ+--=表示其他参与者的类型。并用i T -表示i t -所有可能的值的集合,用概率)(i i i t t p -)表示参与者在知道自己的类型是i t 的前提下,对其他参与者类型i t -的推断,即在自己的类型是i t 的前提下,对其他参与者类型i t -出现的条件概率。在完全信息静态博弈的标准式的基础上,增加类型和推断两个概念,得到静态贝叶斯博弈的标准式概念。

定义9.1 一个n 人静态贝叶斯博弈的标准式表述包括:参与者的行动空间n A A ,,1Λ和它们的类型空间n T T ,,1Λ,他们的推断n p p ,,1Λ,以及他们的收益函数n u u ,,1Λ。参与者i 的类型作为参与者i 的私人信息,决定了参与者i 的收益函数);,,(1i n i t a a u Λ。参与者i 的推断)(i i i t t p -描述了i 在给定自己的类型i t 时,对其他n —1个参与者可能的类型i t -的不确定性。我们用},,;,;,;,,{1111n n n n u u p p T T A A G ΛΛΛΛ=表示这一博弈。

静态贝叶斯博弈的一般表示法,对于由现实问题抽象和建立静态贝叶斯博弈模型,提供了思路和帮助,我们根据静态贝叶斯博弈表达式中的几个方面,来确定模型的主要内容。不过最重要的问题是如何来分析问题,那么用什么样的方法来分析这类博弈呢?

信息的不完全使得博弈分析变的复杂,1967年以前,博弈论专家认为这样的不完全信息博弈是无法分析的,因为当一个参与人不知道在与谁博弈时,博弈的规则是无效的。海萨尼(Harsanyi ,1967-1968)提出了处理不完全信息博弈的方法,巧妙地引入一个“第三者”----自然,将复杂问题的不完全信息博弈转换为完全但不完美信息博弈,称之为“海萨尼转换”。

海萨尼转换的具体方法是:

(1) 一个虚拟的参与人“自然”,自然首先决定参与人的类型,赋予各参与人的类型

向量),,(1n t t t Λ=, 其中,n i T t i i ,,1,Λ=∈;

(2) 自然告知参与者i 自己的类型,却不告诉其他参与者的类型;

(3) 参与者同时选择行动,每一参与者i 从可行集i A 中选择行动方案i a ;

(4) 各方得到收益);,,(1i n i t a a u Λ。

借助于第一步和第二步中虚构的参与者“自然”的行动,我们可以把一个不完全信息的博弈表述为一个不完美信息的博弈。海萨尼转换是处理不完全信息博弈的标准方法。

静态贝叶斯博弈转化的都是两阶段有同时选择的、特殊类型的不完美信息动态博弈,对于这类博弈有专门的分析方法和均衡概念。为了定义贝叶斯纳什均衡概念,首先定义此类博弈中参与者的战略空间。动态博弈中参与者的一个战略是关于行动的一个完整计划,包括了参与者在可能会遇到的每一种情况下将选择的可行行动。在给定的静态贝叶斯博弈的时间顺序中,自然首先行动,赋予每一参与者各自的类型,参与者i 的一个(纯)战略必须包括参与者i 在每一可行的类型下选择的一个可行行动。定义如下:

定义9.2 在静态贝叶斯博弈},,;,;,;,,{1111n n n n u u p p T T A A G ΛΛΛΛ=中,参与者i 的一个战略是一个函数)(i i t s ,其中对i T 中的每一类型i t ,)(i i t s 包含了自然赋予i 的类型为i t 时,i 将从可行集中i A 中选择的行动i a 。

我们用不完全信息古诺模型来阐述战略定义,从前面分析知道博弈的解由三个产量选择组成:*1q 、)(*2H c q 和)(*2L c q 。用刚刚给出的关于战略的定义,()(*2H c q ,)(*2L c q )就是企业2的战略,*

1q 是企业1的战略,很容易想到企业2根据自己的成本情况会选择不同的产量,但是还应注意到的同样重要的一点,是企业l 在选择产量时也应同样考虑企业2将根据不同的成本选择不同的产量。从而,如果我们的均衡概念要求企业l 的战略是企业2战略的最优反应,则2的战略必须是一对产量,分别对应于两种可能的成本类型,否则企业1就无法计算它的战略是否确实是企业2战略的最优反应,无法进行博弈分析。

给出贝叶斯博弈中关于战略的定义之后,我们就可以定义贝叶斯纳什均衡了。尽管定义中的符号十分复杂,但中心思路却既简单又熟悉:每一参与者的战略必须是其他参与者战略的最优反应,亦即贝叶斯纳什均衡实际上就是在贝叶斯博弈中的纳什均衡。

定义9.3 在静态贝叶斯博弈},,;,;,;,,{1111n n n n u u p p T T A A G ΛΛΛΛ=中,战略组合),,(**1*n s s s Λ=是一个纯战略贝叶斯纳什均衡,如果对每一参与者i 及对i 的类型集i T 中

的每一i t ,)(*i i t s 满足 定义中求最大值的和是对i t -求和,即对其他参与人的各种可能的类型组合求和,“纯策略”的意义与完全信息博弈相同。当静态贝叶斯博弈中参与人的一个战略组合是贝叶斯纳什均衡时,没有参与者愿意改变自己的战略,即使这种改变只涉及一种类型下的一个行动。

贝叶斯纳什均衡是分析静态贝叶斯博弈的核心概念,一个有限的静态贝叶斯博弈(即博弈中n 是有限的,并且),,(1n A A Λ和),,(1n T T Λ都是有限集)理论上存在贝叶斯纳什均衡,包括采用混合战略的情况。

8.2 应用举例

海萨尼(1973)提出这样的一个结论:完全信息静态博弈的混合战略纳什均衡,几乎总是可以解释为与之密切相关、存在少量不完全信息的博弈中的纯战略贝叶斯纳什均衡。混合战略纳什均衡的重要特征,不是参与者以随机地方法选择一个战略,而是参与者不能确定其他参与人的选择,这种不确定性既可产生于随机因素,又可能(更为合理地)因为少量不完全信息,如下面的例子。

前面所讲的性别战博弈,存在两个纯战略纳什均衡(歌剧,歌剧)和(拳击,拳击)及一个混合战略纳什均衡,其中妻子以2/3的概率选择歌剧,丈夫以2/3的概率选择拳击。

图9-1 性别战

现在假设尽管两人已经认识了相当一段时间,但不能完全肯定地把握对方的想法。假定如果双方都选择歌剧妻子的收益为w t +2,其中w t 的值是妻子的私人信息,双方都去观看拳击时丈夫的收益为h t +2,其中h t 的值为丈夫的私人信息;w t 和h t 相互独立,并服从[0,x ]区间上的均匀分布,(w t 和h t 的值是指原博弈收益的随机扰动项,我们可以认为x 是一个很小的正数)。所有其他情况下的收益不变。表述为标准式则为:静态贝叶斯博弈},;,;,;,{h w h w h w h w u u p p T T A A G =中,行动空间为h w A A =={歌剧,拳击},类型空间为],0[x T T h w ==,关于类型的推断为对所有的w t 和h t ,x t p t p w h h w /1)()(==,收益情况如图9-2。

图9-2 非完全信息性别战

我们构建这个性别战博弈的纯战略贝叶斯(Bayes )纳什均衡。其中w t 超过某临界值w 时妻子选择歌剧,否则选择拳击;丈夫在h t 超过某临界值h 时选择拳击,否则选择歌剧。在这一均衡中,妻子以x w x /)(-的概率选择歌剧,丈夫则以x h x /)(-的概率选择拳击。

假设妻子和丈夫都采用上面所给出的战略,对一个给定的x ,我们计算相应的w 和h ,以使双方的战略符合贝叶斯纳什均衡的条件。给定丈夫的战略,妻子选择歌剧和选择拳击的期望收益分别为

从而,当且仅当w h

x t w =-≥3,选择歌剧是最优的。同样,假定妻子采用了临界值w 战略,丈夫选择拳击和选择歌剧的期望收益分别为

和 所以,当且仅当h w

x t h =-≥3,选择拳击是最优的。 解联立方程组 ⎪⎪⎩⎪⎪⎨⎧=-=-h w

x w h x 33

得 ⎩⎨⎧=-+=032x h h h

w

解二次方程得 x

x h w 24931+-+== 当x 趋于0时,该式的值趋于2/3。也就是说,随着不完全信息的消失,参与者在此不完全信息博弈纯战略贝叶斯纳什均衡下的行动趋于其在原完全信息博弈混合战略纳什均衡下的行动。

我们用贝叶斯纳什均衡的思想,来讨论暗标拍卖问题。基本的暗标拍卖规则是各投标人密封标书投标,统一时间开标,标价最高者中标。如果出现标价相同的情况,用抛硬币或类似方法决定中标者。假设有两个投标人,分别为1、2,投标人i 对商品的估价为i v ——即如果投标人i 付出价格p 得到商品,则i 的收益为p v i -。两个投标人的估价相互独立,并服从[0,1]区间上的均匀分布。投标价格不能为负,且双方同时给出各自的投标价。出价较高的一方得到商品,并支付他报的价格;另一方的收益和支付都为0。投标方是风险中性的,所有以上都是共同信息。

为把这一问题化为标准式的静态贝叶斯博弈,我们必须确定行动空间、类型空间、推断及收益函数。参与者i 的行动是给出一个非负的投标价i b ,其类型即他的估价i v (在抽象博弈},;,;,;,{21212121u u p p T T A A G =中表示为,行动空间),0[∞=i A ,类型空间]1,0[=i T )。由于估价是相互独立的,参与者i 推断j v 服从[0,1]区间上的均匀分布,而不依赖于i v 的值。最后,参与者i 的收益函数为

为推导这一博弈的贝叶斯纳什均衡,我们首先建立参与者的战略空间。在静态贝叶斯博弈中,一个战略是由类型到行动的函数。参与者i 的一个战略为函数)(i i v b ,据此可以决定i 在每一种类型(即对商品的估价)下选择的投标价格。在贝叶斯纳什均衡下,参与者1的战略)(11v b 与参与者2的战略)(22v b 互相是对方的最优反应。若战略组合)](),([2211v b v b 是贝叶斯纳什均衡,那么每个类型]1,0[∈i v ,)(i i v b 满足

我们寻找该问题的一组线性均衡解,即假设)(11v b 和)(22v b 都是线性函数。11111)(v c a v b +=及22222)(v c a v b +=,并据此对上式进行简化。但应注意我们不是限制了参与者的战略空间,使之只包含了线性战略;而是允许参与者任意地选择战略,而只看是 否存在线性的均衡解。我们会发现由于参与者的估价是均匀分布的,这样的线性均衡解不仅存在。而且是惟一的。其结果为2/)(i i i v v b =,也就是说,每一参与者以其对商品估价的l /2作为投标价。这样,一个投标价格反映出投标方在拍卖中遇到的最基本的得失权衡:投

标价格越高,中标的可能性越大;投标价格越低,一旦中标所得的收益就越大。

假设参与者j 采取战略j j j j j v c a v b +=)(,对一个给定的i v 值,参与者i 的最优反应为下式的解

因为j v 服从均匀分布,所以j j j j j v c a v b +=)()服从均匀分布,0}{==j i b b P 。由于i 的投标价应高于参与者j 最低的可能投标价格,否则没有意义,同时应低于j 最高的可能投标价格,我们有j j i j c a b a +≤≤,于是,上式变为

一阶条件为2/)(j i i a v b +=。在j i a v <时,j j i i a a v b <+=2/)(,这样时根本不可能中标的,至少j i a b =。综上,参与者i 的最优反应为

如果10<

博弈论与经济分析(不完全信息静态)

博弈论与经济分析(不完全信息静态) 第四章 不完全信息静态博弈 不完全信息意味着至少有一个参与者不能确定另一个参与者的收益函数,或者说类型。 我们用一个例子来引入要讨论的问题: 例:信息不对称条件下的古诺模型 市场:P(Q)=a-Q ,Q=q1+q2 企业1:C1(q1)=cq1 企业2:以θ的概率为高成本,即222()H C q c q =;以1θ-的概率为低成本,即 222()L C q c q =。当然,H L c c >。 信息不对称:企业2知道自己的成本,也知道企业1的成本;企业1知道自己的成本,但是只知道企业2成本状况的概率分布。 以上都是公共信息,即企业1知道企业2享有信息优势,企业2知道企业1知道,企业1也知道企业2知道企业1知道……如此等等。 解题: 企业1会预测企业2在不同情况下的最优选择: 当企业2为高成本时2 122max[()]H q a q q c q * --- 当企业2为低成本时2 122max[()]L q a q q c q * --- 既然企业只知道企业2成本情况的概率分布,则企业1只能根据上述预测最大化自己的期望收益:1 121121max [(())](1)[(())]H L q a q q c c q a q q c c q θθ* * ---+---- 以上三个优化问题的一阶条件为: 12 ()2 H H a q c q c **--= 12 ()2 L L a q c q c **--= 221 [()](1)[()] 2 H L a q c c a q c c q θθ** *--+---= 联立求解: 221()()36 H H H L a c c q c c c θ * -+-= +-

完整版)博弈论知识点总结

完整版)博弈论知识点总结 博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。 博弈中涉及到的变量包括:参与人、行动、战略和信息。完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。 博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。

与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。 战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。 博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。 根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。

博弈论名词解释(修改)

1.有限博弈:一个博弈中每个博弈方的策略数都是有限的。常见的是数种策略。 无限博弈:一个博弈中至少有某些博弈方的策略有无限多个。 零和博弈:一方的得益必定是另一方的损失,博弈方之间利益始终对立,偏好通常不同。两人零和博弈也称为“严格竞争博弈”。 2.常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系。 3.变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。可以站在社会 利益的立场对其效率进行评价。 4.静态博弈:所有博弈方同时或可看作同时选择策略的博弈。 5.动态博弈:各博弈方的选择和行动有先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到 其他博弈方的选择和行动。 6.重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能。 7.完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益 8.不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称“不对称信息博弈” 9.完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈 10.不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈 11.完全理性:有完美的分析判断能力和不会犯选择行为的错误 12.有限理性:博弈方的判断选择能力有缺陷 13.个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化 14.上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的 结果,上策均衡不是普遍存在的。 15.严格下策反复消去法:反复寻找策略之间两两比较意义上的“严格下策”,并将它们消去的方法。 16.反应函数:对于厂商2的每一个可能的产量,厂商1的最佳对策产量的计算公式,它是厂商2产量的一个 连续函数,我们称这个连续函数为厂商1对厂商2产量的一个“反应函数”。 17.帕累托上策均衡:博弈中存在多个纳什均衡,如这些纳什均衡存在明显的优劣差异,所有博弈方都偏好其 中同一个纳什均衡,该纳什均衡给所有博弈方带来的得益都大于其他纳什均衡。用这种方法选择出来的纳什均衡称为“帕累托上策均衡”。 18.风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏向于某一 纳什均衡。则该均衡即是风险上策均衡。 19.聚点均衡:利用博弈设定以外的信息和依据选择的均衡。如利用博弈方共同的文化背景等。 20.防共谋均衡:如果一个博弈的某个策略组合满足下列要求: (1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图; (2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果; (3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。则称为“防共谋均衡”。 21.子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所 需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。 22.子博弈完美纳什均衡:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整 个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。子博弈完美纳什均衡可以排除均衡策略中不可信的威胁或承诺。 23.逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行 为选择,一直到第一个阶段的分析方法。 24.重复博弈:指基本博弈重复进行构成的博弈过程 25.有限次重复博弈:由基本博弈的有限次重复构成的重复博弈 26.无限次重复博弈:一个基本博弈一直重复博弈下去的重复博弈 27.有唯一纯策略纳什均衡博弈的有限次(无限次)重复博弈: 28.有限次重复博弈的民间定理:设原博弈G有唯一的纯策略纳什均衡,则对任意正整数T,重复博弈G(T) 有唯一的子博弈完美纳什均衡,即胳膊一方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益等于原博弈G中对的得益。

贝叶斯博弈

不完全信息的市场进入博弈 参与人:企业1,企业2 行动空间:企业1选择建厂或不建厂,企业2 选择进入或不进入 行动顺序和信息结构:自然先以概率对(p,1 p)选择企业1 的成本类型(高,低),企业1 观察到自然的选择而企业2 不能观察到自然的选择;然后企业1 和企业2 同时采取其可选的行动。 赢利状况:如下表 对于例子的不完全信息博弈,将不完全信息博弈转化为标准形式贝叶斯博弈。这一方法是Harsanyi(1967-1968)创造的。 企业1选择DB, 企业2选择IN,构成贝叶斯纳什均衡;意思是,企业1当高成本类型时,选择“不建厂”,而当低成本类型时企业1选择“建厂”,企业2选择“进入”与企业1展开竞争。贝叶斯纳什均衡的结果为:(2.3,0.4),即双方获得的均衡利润。

不完全信息动态博弈(贝叶斯博弈) 我们将介绍另一种新的均衡概念——完美贝叶斯均衡,就有了四个均衡概念:完全信息静态博弈中的纳什均衡、完全信息动态博弈中的子博弈完美纳什均衡、不完全信息静态博弈中的贝叶斯纳什均衡以及不完全信息动态博弈中的完美贝叶斯均衡。表面上看好像对所研究的每一类型的博弈都发明出了一种新的均衡概念,但事实上这些概念是密切相关的。随我们研究的博弈逐步复杂,我们对均衡概念也逐渐强化,从而可以排除复杂博弈中不合理或没有意义的均衡,而如果我们运用适用于简单博弈的均衡概念就无法区分。在每一种情况下,较强的均衡概念只在应用于复杂的博弈时才不同于较弱的均衡概念,而对简单的博弈并没有区别。引入完美贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡,这和子博弈完美纳什均衡强化了纳什均衡是相同的。正如我们在完全信息动态博弈中加上了子博弈完美的条件,是因为纳什均衡无法包含威胁和承诺都应是可信的这一思想;我们在对非完全信息动态博弈的分析中将集中于完美贝叶斯均衡,是因为贝叶斯纳什均衡也存在同样的不足。回顾前面讲过的,如果参与者的策略要成为一个子博弈完美纳什均衡,则它们不仅必须是整个博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。如果参与者的策略要成为博弈的一个完美贝叶斯均衡,它们不仅必须是整个博弈的贝叶斯纳什均衡,而且还必须构成每一个后续博弈的子博弈完美纳什均衡。完美贝叶斯均衡是对贝叶斯均衡的精炼,也是子博弈思想在不完全信息博弈中的推广,它本身是纳什均衡。 为引进完美贝叶斯均衡概念,考虑如下不完全信息动态博弈。 [例1]首先,参与者1在3个行动中进行选择——L、M及R,如果参与者1选择R,则博弈结束(不等参与者2行动);如果参与者1选择了L或M,则参与者2就会知道1没有选择R (但不清楚1是选择了L还是M),并在或L'或R'两个行动中进行选择,博弈随之结束。收益情况由图10-1的扩展式博弈给出。

博弈论

第1章博弈论基本模型 1、在一个博弈中,所有的局中人都选择合作行为,该博弈是否为合作博弈? 答:如果在一项活动中,参与人具有合作的意向,而合作的行为又能得到有力的保障,则称这种博弈活动为合作博弈。存在有力的保障,实际上说明了合作博弈问题的博弈方之间既存在共同利益,但利益又不完全一致。而事实上合作博弈协议的内容除了约定行为以外就是利益分配,达成协议的前提是通过讨价还价就利益分割达成一致。因此,并不是所有局中人选择合作行为,就是合作博弈。 2、完全信息静态博弈问题必须用策略型博弈模型刻画,完全信息动态博弈模型必须用扩展型博弈模型刻画,是否正确? 答:不正确。博弈论模型从形式可分为策略型模型与扩展型模型。扩展型模型完整地刻画了一项博弈活动。策略型博弈模型的结构简单,但它忽略了博弈的时序与信息,其侧重点在于分析参与人的策略选择。只不过是相对而言,对于信息完全静态博弈用策略型博弈刻画更为合适;对信息完全的动态博弈,用扩展型博弈模型描述更为合适。 3、一个博弈问题既可用策略型博弈模型刻画,也可用扩展型博弈模型刻画,是否正确?答:博弈论从形式可分为策略型和扩展型模型。扩展型完全地刻画了一项博弈活动,而策略型则结构简单,忽略了博弈的时序与信息,重点在于分析参与人的策略选择。因此,对于一个博弈问题,要视乎所要解决的问题是完整的还是只分析参与人的策略选择。 4、策略就是行动吗? 答:○1称参与人i∈N在博弈中所有可能选择的行动构成的集合A i为局中人i的行动集合。 A i中的元素a i称为局中人i的行为。 ○2局中人i=1,2,…,n的策略集合用Si表示,S i中的元素si称为局中人i的策略。它定义为局中人i的信息集类I i到行动集Ai的映射: S i:I i→A i,S i(I ik)=a i∈A i,i=1,2,…,r i ○3从以上的定义,清楚地表明了策略是信息集的映射,行动是映射值,两者是不同的。 5、策略与行动何时是一致的? 答:在静态博弈模型中,局中人的策略与行动等同。 6、完美信息博弈与完全信息博弈是否一致? 答:假设G= 为有限扩展型博弈模型。如果所有的局中人催构成G的元素N、Y、U、I、q都完全了解,称G为完全信息博弈。其中,如果G的每个信息集都是单点信息集,表明博弈的每个参与人在选择行动时对博弈到现在为止的历程都完全了解,这时才称G为完美信息博弈。因此,完美信息博弈与完全信息博弈不是一致的。 7、静态博弈必须要求参与人同时选择行动吗? 答:如果所有的局中人都同时选择行动,更本质的,如果所有局中人在选择行动时不知道对手选择了什么行动,称G为静态博弈。因此,静态博弈本质不是要求所有局中人同时选择行动,而是要求局中人在选择时不知道对方的行动。 第2章纳什均衡 1、纳什均衡主要应用于预测什么样的博弈问题的均衡结果?

第六章 不完全信息静态博弈与动态博弈的基本理论教材

第六章不完全信息静态博弈与动态博弈的基本理论 第一节不完全信息静态博弈的基本理论 一.不完全信息博弈 1.回顾:本课2-4章介绍的均为完全信息博弈。如何区分完全信息与不完全信息?如何区分完美信息与不完美信息? 2.不完全信息博弈又称之为贝叶斯博弈(B ayesian game),在这里,博弈参与人的支付函数不再是博弈的公共知识,至少有一个参与人对另一个参与人的支付函数的了解是不确定的,即该参与人不了解另一个参与人究竟属于何种类型的参与人。例举生活中不完全信息博弈的情形。 不完全信息博弈包括两种类型:不完全信息静态博弈(又称静态贝叶斯博弈,static B ayesian game)与不完全信息动态博弈(又称动态贝叶斯博弈,dynamic B ayesian game)。激励机制设计中大量地涉及不完全信息博弈,通过巧妙的机制设计让私人信息拥有者报告自己的真实信息是机制设计的核心任务之一。 二.不完全信息静态博弈的刻画 1.例子 例一:不完全信息饮酒博弈 一个南方人和一个北方大汉在宴会相遇,这个北方大汉酒量大是众所周知的,而这个南方人是否酒量大,只有南方人自己清楚;北方大汉只知道这个南方人有p的概率酒量大,1-p的概率酒量小,这一点也是博弈的公共知识。具体情形如下: 图1:南方人酒量大 南方人 喝不喝 北方人喝 不喝 图2:南方人酒量小 南方人 喝不喝 北方人喝 不喝 问题:(1)南方人是否喝?(2)北方大汉是否喝? 如果北方人喝,期望支付为多少?北方人不喝,期望支付是多少?

例二:不完全信息古诺竞争模型 (1)假设该市场上只有两家生产同一产品的企业1和2;市场均衡价格由下式决定: ()P Q a Q =-,其中12Q q q =+,1q 、2q 分别代表企业1和2提供的产量;企业1的生产成本为:111()C q cq =,这一点是博弈双方的公共知识;企业1对企业2的成本函数是不确定的,即企业2的成本函数是企业2的私人信息,企业1只知道企业2的成本函数有θ的概率为:222()h C q c q =,有1-θ的概率为222()l C q c q =,其中h l c c >,这一点也是博弈的公共知识。两家企业同时选择自己的产量以最大化自己的利润。问题:请问两家企业应该如何确定自己的利润最大化产量。 (2)模型分析 A .求解企业2的产量选择 显然,不同成本类型的企业会选择不同的产量水平,即企业的产量选择是与成本挂钩的,于是企业2的产量选择有两种情形:2()h q c 与2()l q c 。 当企业2属于h c 类型时,2*212max ()q h q a q q c π=--- 当企业2属于l c 类型时,2*212max ()q l q a q q c π=--- 由上述两个规划问题的一阶条件,有: * 2 ()h q c =*12h a q c --;*2()l q c =*12l a q c -- B .求解企业1的产量选择 1*121max (())q h a q q c q θ--+(1-θ)*1211(())l a q q c q cq ---(思考:为什么这么写?) 由上式的一阶条件,有: *** 221(())(1)(())2h l a q c c a q c c q θθ--+---= C .联立三个一阶条件生成的方程组,可以得 *221()()36 h h h l a c c q c c c θ-+-= +-; *22()()36 l l h l a c c q c c c θ-+=-- *12(1)3h l a c c c q θθ-++-= (3)将上述结果与完全信息条件下的结果进行比较,h c 与l c 型企业在哪一种情形生产得更多?为什么?(导致这一局面的根本原因不仅在于企业的产量要受自己成本水平的影响,

博弈论知识点总结完整版

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965) c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968) d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i,si*称为参与 人i的严格占优战略,如果满 足: ui(si*,s-i)>ui(si',s-i) "s-i, " si' ¹si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣”的含义: 设s i’和s i’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’, s-i), 则说策略s i’严劣于策略s i’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’。 b、定义:重复剔除严格策略就是 各参与人在其各自策略集中,

博弈论第六章不完全信息静态博弈题库

博弈论第六章不完全信息静态博弈题库 【原创实用版】 目录 一、引言:介绍博弈论及其在经济学中的应用 二、不完全信息静态博弈的定义和特点 三、博弈论第六章不完全信息静态博弈的主要内容 四、如何解决不完全信息静态博弈问题 五、结论:总结博弈论在经济学中的重要性 正文 一、引言 博弈论作为经济学的一个重要分支,主要研究多个理性决策者在特定规则下的决策行为及其结果。在经济学中,博弈论的应用已经渗透到许多领域,如市场竞争、价格博弈、合作与信任等。通过研究博弈论,我们可以更好地理解经济现象及其背后的决策过程。 二、不完全信息静态博弈的定义和特点 不完全信息静态博弈是指在博弈过程中,参与者拥有不完全的信息。在这种情况下,参与者需要根据已知的部分信息和其他人的可能策略来选择最佳行动。不完全信息静态博弈的特点包括: 1.参与者拥有不完全的信息,无法了解其他参与者的准确策略和支付函数。 2.参与者的决策是静态的,即他们在一个特定的时间点上做出决策,不考虑未来可能的变化。 三、博弈论第六章不完全信息静态博弈的主要内容 博弈论第六章主要讨论了不完全信息静态博弈的解决方法,包括:

1.贝叶斯纳什讨价还价解:通过贝叶斯定理,参与者可以根据已知的部分信息和其他人的可能策略来推测其他人的支付函数,从而找到一个纳什讨价还价解。 2.声誉模型:在不完全信息静态博弈中,参与者可以通过建立声誉来影响其他参与者的决策。声誉好的参与者更容易达成合作,从而获得更好的支付。 3.信号博弈:信号博弈是一种通过发送信号来传递信息的博弈。参与者可以通过观察其他参与者的信号来推测其策略和支付函数,从而找到一个合适的行动。 四、如何解决不完全信息静态博弈问题 在不完全信息静态博弈中,参与者需要根据已知的部分信息和其他人的可能策略来选择最佳行动。以下是一些解决不完全信息静态博弈问题的方法: 1.充分沟通:参与者之间可以通过充分沟通来传递信息,从而减少不确定性,提高决策效率。 2.建立信任:在博弈过程中,参与者可以通过建立信任关系来降低其他参与者的背叛风险,从而更容易达成合作。 3.提高信息透明度:通过提高信息透明度,参与者可以获得更准确的信息,从而更容易找到合适的策略。 五、结论 博弈论在经济学中的应用为我们提供了一种理解和分析经济现象的有效方法。在不完全信息静态博弈中,参与者需要根据已知的部分信息和其他人的可能策略来选择最佳行动。

不完全信息静态博弈总结

不完全信息静态博弈总结 不完全信息静态博弈 1.不完全信息静态博弈特点:在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。在不完全信息静态博弈中,在博弈开始前存在关于博弈人信息的不确定性,这个不确定像通常是博弈参与人的类型。 在市场进入博弈中不完全信息表现为:在位者的成本类型(高成本、低成本)在斗鸡博弈中不完全信息表现为:参与人的性格类型(强硬,软弱) 2.海萨尼转换 由于在不完全信息静态博弈中,参与人的类型存在不确定性,所以当一个参与人并不知道在与谁博弈时,博弈的规则是无法定义的,海萨尼提出了海萨尼转换解决这种不确定的问题。解决方法:海萨尼指出,引入虚拟参与人——自然,由自然先决定参与人的不同类型,将不完全信息博弈转换为不完美信息博弈。海萨尼通过引入“虚拟”参与人,将博弈的起始点提前,从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性。这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法称为 Harsanyi转换。 3.不完全信息静态博弈均衡——贝叶斯纳什均衡 贝叶斯博弈的定义: 贝叶斯博弈包含以下五个要素:1.参与人集合BΓ={1,2,…,n};2.参与人的类型集合T1,…,T2;3.参与人关于其他参与人类型的推断P1(t-1 |t1),…,Pn(t-1n|tn);4.参与人类型相依的行动集A(t1),…, A(tn);5.参与人类型相依的支付函数 贝叶斯博弈的战略:在贝叶斯博弈G={Γ;(Ti);(Pi);(A(ti);(ui(a(t);ti)}中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti);它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。

不完全信息静态博弈案例 扶老人 林志涵

让道德与理性同行 ——不完全信息静态博弈案例分析 2012333501054 林志涵 12经济学1班 摘要:通过简单的博弈论分析方法对日常生活中具有现实意义的社会现象进行分析,从而在理性人假设的前提下,在各种因素的影响下,在个人取得利益最大化的同时,通过政策或法律的有效实施来使得道德能得到发扬提倡。 关键词:不完全信息静态博弈社会现象道德与理性 不完全信息静态博弈 在不完全信息静态博弈里,参与人并不完全清楚有关博弈的一些信息,所有参与人在共同决策环境中同时选择行动策略,每个参与人只选择一次。 纳什均衡,在给定的其他参与人选择的前提下,参与人根据自身收益选择的最优战略。 1.背景: “除非有人证物证,否则我不会再去扶跌倒的老人!”广东肇庆的阿华在扶起倒地的70多岁阿婆却遭诬陷后表示。事发7月15日早上,阿华开摩托车上行人道准备买早餐,看到路边有位老太太跌倒在求救,阿华立刻停下来,扶起老奶奶,殊不知却遭到阿婆的诬陷,随后和阿婆的女婿发生争执。阿婆被送到医院住院观察。为调查真相,交警暂扣了阿华的摩托车。事发后几天,阿华说没睡过一次好觉,还向单位请了几天假,天天在附近找证人,就是为了证实自己清白。 这一案件的真想不言而喻,老婆婆家人蛮不讲理地要求赔偿和阿华地好心搀扶倒地老婆婆形成了鲜明的对比,好心被当驴肝肺的事情就这么真真实实的发生在了我们的身边,社会风气遇到了极大的挑战,这引发了社会各界针对这一事件的激烈讨论。到底该不该扶?本文将在经济人假设的前提下,通过不完全信息静态博弈的思想进行分析阐述,并探讨我们如何通过一系列客观因素的影响,来使得利益与道德同行。 2.博弈的假设与建模: 假设: ①参与博弈的双方是理性人,都会选择个人利益最大化的行动。 ②假设阿婆在未有人搀扶时便决定是否坑钱,而路人并不知道阿婆是否会坑钱,即参与人在决策时不知道对方的策略同时也并不知道对方能够的收益函数。 ③假定当事人双方最终解决方法由交警决定,当事人将面临交警正确处理和错误处理两种。 参与人:阿婆、路人 行动选择:路人——帮忙扶起、不帮忙扶起 阿婆——被扶起后坑钱、不坑钱 3.支付收益: 1)在不考虑交警是否正确判断因素下,阿婆倒地没人扶会有-10的身体伤 害,在阿婆不坑钱的情况下仍然没有人扶会多产生负收益-10的心灵损 失(路人不知道阿婆是否坑钱);路人选择帮忙且阿婆不坑钱会产生10

博弈论四种博弈类型

华为在阿根廷电信设备市场上的竞争博弈 华为技术冇限公司是一家总部位于中国广东省除圳市的生产销售电信设备的员工持股 的民营科技公司,经过数十年的发展,成为全球最人的电信网络解决方案提供商,全球第二 人电信基站设备供应商,同时也是全球第六人手机厂商,其海外市场的利润占到其总利润的 75%:在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场山岌鼻信、阿尔卡特- 朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下來,我们将分析其不同条件下 的博弈结果: 1、完全信息情况下的静态轉弈 A 、纳什均衡:我们将上述三家公司统称为原有垄断者•,华为称为虎视眈眈的潜在进入 者,原冇垄断者想要保住自己现冇的垄断地位,就会想要阻止潜在进入者进入,在这个博弈 中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同 竞争,具体的支付矩阵结果表示如下: 不斗争 斗争 根据纳什均衡的定义:各个参与者所做的是在给定其他参与者的策略是所能够做出的瑕 好的一组策略。当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获彳'J 70单位 的利润;同样的,原有垄断者选择不斗争的情况2潜在进入者的最优选择是进入,获得 20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个 纳什均衡(不进入,斗争)。 B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许町证,在严格管制 情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各 自均有止的利润)在这两种情况卜考虎两者是否进行价格战的情况,具体支付矩阵如卜•所示: 原有垄断者 对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进 行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润, 在原有垄断者定高价时,潜在进入者定低价町以获得额外的10单位利润,从而确定华为必 将进行价格战,在完全信息情况卜,原何垄断者会将自己豐于潜在进入者的位豐进行决策, 从而决定自己也要进行价格战,否则会失去更多的利润。 A 情况与实际情况相同,因为根据相关资料显示•华为的研发费用、人力成本等对电信 设备价格影响审人的成本仅约为其他竞争者的八分之一,其他竞争者没有能力进行价格战从 而阻止华为进入阿根廷电信市场。 B 怙况与实际不相符,按照华为在发展中国家的竟炉策略, 其战略重心并不在于短期的利润,而在于抢夺市场份额,排挤竞争对手,而其竞爭对于•往往 无力在削价竞争中与华为竞争,价格仍然较高。 2、完全信息情况下动态博弈 A 、威胁与承诺:动态聘弈指的是参与若的行动有先后,且后行动者町以观测到先行动 者的行为,那么完全信息静态博弈A 中支付矩阵需要表示为陣弈树形式: 原有垄断者 /不斗争 20,70 进入< 潜在进入 低价 者 高价 低价 高价

博弈论——不完全信息静态博弈讲义

3 不完全信息静态博弈 3.1 简介 博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。 不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。如在拍卖商品或工程招投标中。 信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。 但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。 在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。 3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡 在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。

Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。 N 首先行动,决定每个局中人的特征。每个局中人知道自己的特征,但不知道其他局中人特征。这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。 局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。 不完全信息静态博弈中,局中人的类型存在多种可能,因而与局中人相关的各种概念都随其类型的不同而不同。局中人的行动空间i A 将随类型i θ而变化,即)(i i i A A θ=。支付函数也是类型依存的,可将其记为:),,,,,(1i n i i i a a a u u θ = n i ,,1 =。 该式给出的是在其他局中人已选定行动j a ,n j ,,1 =,i j ≠时,局中人选行动)(i i i A a θ∈获得的支付。显然给定j a 时最大化i u 的i a 与i θ有关,即)(**i i i a a θ=,其中*i a 是给定j a 时最大化i u 的i a 。 用“类型依存”来描述包括最优战略在内的相关概念与类型的对应关系。

几个博弈案例

几个博弈案例 1.囚徒困境 警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境与面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。问:两个罪犯会如何选择(坦白还是抵赖)? 2.智猪博弈(占优战略均衡) 猪圈里有一头大猪,一头小猪。猪圈的边缘有个踏板,每踩一下,远离踏板的投食口就会落下少量食物。如果是小猪踩踏板,大猪会在小猪跑到食槽之前吃光所有食物;若是大猪踩踏板,则小猪还有机会吃到一点残羹冷炙,因为小猪食量小嘛。那么,两头猪会采取什么策略呢?答案是:小猪将安安心心地等在食槽边,而大猪则不知疲倦地奔忙于踏板与食槽之间。办公室里也会出现这样的场景:有人做“小猪”,舒舒服服地躲起来偷懒;有人做“大猪”,疲于奔命,吃力不讨好。但不管怎么样,“小猪”笃定一件事:大家是一个团队,就是有责罚,也是落在团队身上,所以总会有“大猪”悲壮地跳出来完成任务。想一想,你在办公室里扮演的角色,是“大猪”,还是“小猪”?(其实小猪的决策是明智的,想想同一个公司,小股东与大股东的行为。) 3.性别之争(多重纳什均衡) “有一对夫妻,丈夫喜欢看足球赛节目,妻子喜欢看肥皂剧节目,但是家里只有一台电视,于是就产生了争夺频道的矛盾。假设双方都同意看足球赛,则丈夫可得到2单位效用,妻子得到一单位效用;如果都同意看肥皂剧,则丈夫可得到1单位效用,妻子得到2单位效用;如果双方意见不一致,结果只好大家都不看,各自只能得到0单位效用。这个博弈的策略式表达如下:

博弈论第六章不完全信息静态博弈题库

博弈论第六章不完全信息静态博弈题库 摘要: I.博弈论简介 A.博弈论的基本概念 B.博弈论的重要应用 II.不完全信息静态博弈 A.定义与基本概念 B.常见的不完全信息静态博弈模型 C.均衡与解的概念 III.不完全信息静态博弈题库 A.题库概述 B.题库的使用方法 C.题库的实践价值 IV.解题技巧与策略 A.分析问题的方法 B.解题的一般步骤 C.常见错误及其避免方法 V.总结与展望 A.本章学习内容的总结 B.对未来学习的展望 正文:

博弈论是研究决策制定和结果影响的数学理论。它不仅可以应用于经济学、社会学和心理学等学科,还可以应用于政治、军事和生态等领域。博弈论主要包括完全信息博弈和不完全信息博弈。其中,不完全信息静态博弈是博弈论中的一个重要分支,其研究和应用在经济学、社会学等领域具有广泛的应用。 不完全信息静态博弈是指在一个博弈过程中,参与者不完全了解其他参与者的策略或支付,需要通过观察和推理来获取信息。这种博弈模型广泛存在于现实生活中,如消费者与生产者之间的竞争、雇主与员工之间的工资谈判等。 为了更好地学习和研究不完全信息静态博弈,许多学者和机构整理了相关的题目,形成了题库。这些题库可以帮助学习者更好地理解博弈论的概念和方法,提高解题技巧和策略。在使用题库时,学习者需要注意理解题目的背景和条件,分析题目所涉及的博弈过程,以及根据已知信息寻找合适的解决方案。 在解题过程中,学习者需要掌握一定的分析方法和策略。例如,可以通过画出博弈树、分析支付矩阵等方式来理解题目的条件和问题。此外,解题的一般步骤包括理解题目、分析问题、寻找解决方案和检验答案等。在解题过程中,学习者需要避免一些常见的错误,如忽视某些策略、错误地理解支付矩阵等。 总之,不完全信息静态博弈是博弈论中的一个重要分支,其在经济学、社会学等领域具有广泛的应用。通过学习和研究题库,学习者可以更好地理解博弈论的概念和方法,提高解题技巧和策略。

博弈论的分类

博弈论的分类 博弈的分类 博弈可以按照不同的分类方式进行分类,比如按照博弈者出招的顺序,博弈者对其他参与博弈者特征、策略空间和收益是否了解进行分类。 1、从按照博弈者出招的顺序、博弈持续时间和重复次数的角度,博弈可以分为静态博弈(Static Game)和动态博弈(Dynamic Game)。 静态博弈指的是参与博弈的各方同时采取策略,这些博弈者的收益取决于博弈者们不同的策略组合。因此静态博弈又称为“同时行动的博弈”(Simultaneous-Move Games)。有时候博弈方采取策略有先后,但是他们并不知道之前其他人做出的策略。比如“囚徒困境”中罪犯1采取策略后,轮到罪犯2采取策略时他并不知道罪犯1所做出的策略。 动态博弈(序贯博弈)指的是在博弈中,参与博弈的博弈方所采取策略是有先后顺序的(Sequential-Move),且博弈者能够知道先采取策略者所选择的策略。 2、从博弈者对其他参与博弈者所了解的信息的完全程度,博弈可以分为完全信息博弈(Complete Information Game)与不完全信息博弈(Incomplete Information Game),以及完美信息博弈(Perfect Information Game)与不完美信息博弈(Imperfect Information Game),确定的博弈(Certainty Game)与不确定的博弈(Uncertain Game),对称信息博弈(Symmetric Game)与非对称信息博弈(Asymmetric Game)等等。 其中,完全信息是指博弈中每一个博弈者对其他博弈者的特征、策略空间和收益函数都了解,也就是博弈者的收益集(Pay offs)是所有博弈者都知道的。

不完全信息博弈

不完全信息博弈 不完全信息博弈(Incomplete information game / Imperfect information game),也称贝叶斯博弈(Bayesian game) [编辑] 什么是不完全信息博弈 不完全信息博弈是指对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。博弈参与者对于对手的收益函数没有完全信息(incomplete information)。 在约翰·海萨尼的研究框架下,我们可以将自然(Nature)作为一个参与者引入到贝叶斯博弈中。自然将一个随机变量赋予每个参与者。这个随机变量决定了该参与者的类型(type),并且决定了各个类型出现的概率、或是概率密度函数。在博弈进行过程中,根据每个参与者的类型空间所赋的概率分布,自然替每个参与者随机地选取一种类型。海萨尼的这一方法将贝叶斯博弈从不完全信息转化为不完美信 息(此时,有的参与者不知道该博弈的历史)。参与者的类型决定了该参与者的收益函数。在贝叶斯博弈中,不完全信

息所指的是,至少存在一个参与者,他(她)不能确定其他某个参与者的类型,从而也不能确定其收益函数。 [编辑] 不完全信息博弈动态、静态分析 ∙不完全信息动态博弈:精炼贝叶斯 均衡 精炼贝叶斯(纳什)均衡是不完全信息动态博弈的均衡概念。 在市场进入博弈中,精炼贝叶斯均衡是:在位企业产品定价较高,潜在企业推断其为高成本,选择进入;在位企业产品定价较低,潜在企业推断其为低成本,选择不进入。 ∙不完全信息静态博弈:贝叶斯均衡贝叶斯均衡通常被描述为:在给定自己的类型和对手类型的概率分布的情况下,每个参与者的期望效用达到了最大化从而没有参与者愿意改变自己的行为或策略。 在下图的博弈中假定在位企业属于高成本类型的企业的概率大于0.2,潜在企业选择进入才是最优的。

完全信息和不完全信息-博弈论相关

3、完全信息和不完全信息: 完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数. 在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数. 温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。显然不完全信息意味着不完美信息,但逆命题不成立。 12、完美和不完美信息: 不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。 完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然")的行动选择有准确了解的情况,即每一个信息集只包含一个值。 2、贝叶斯均衡: 是纳什均衡在不完全信息博弈中的自然扩展。在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择.给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型.这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用 14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。 贝叶斯纳什均衡:P147 4、有限次重复博弈: 16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。 7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。 激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。显然,只有代理人选择委托人所希望的行动是得到的期望效用不小于他选择其他行动是得到的期望效用时,代理人才有积极性选择委托人所希望的行动。满足激励相容约束的机制称为可实施机制。 8、似然率f l/f h:统计学上,似然率度量给定代理人选择a=L时PAI发生的概率与给定代理人选定a=H是PAI发生的概率的比率,它告诉观测者观测到的PAI在多大程度上来自分布f l而不是来自于f h。较高的似然率意味着PAI 有较大的可能性来

8.1静态贝叶斯博弈和贝叶斯纳什均衡

第八章 不完全信息静态博弈 这一章里我们讨论不完全信息静态博弈,也称为贝叶斯博弈(Bayes)。不完全信息博弈中,至少有一个参与者不能确定另一参与者的收益函数。非完全信息静态博的一个常见例子是密封报价拍卖(sealed —bid auction):每一报价方知道自己对所售商品的估价,但不知道任何其他报价方对商品的估价;各方的报价放在密封的信封里上交,从而参与者的行动可以被看作是同时的。静态贝叶斯博弈问题的主要来源也是现实经济活动,许多静态博弈关系都有不完全信息的特征,研究贝叶斯博弈不仅是完善博弈理论的需要,也是解决实际问题的需要。 8.1 静态贝叶斯博弈和贝叶斯纳什均衡 为了更好的说明不完全信息与完全信息之间的差异,我们用一个典型静态贝叶斯博弈作为例子,自然的引进静态贝叶斯博弈概念。 8.1.1不完全信息古诺模型 考虑如下两寡头进行同时决策的产量竞争模型。其中市场反需求函数由Q a Q P -=)(给出,这里21q q Q +=为市场中的总产量。企业1的成本函数为1111)(q c q C =,不过企业2的成本函数以θ的概率为222)(q c q C H =,以θ-1的概率为222)(q c q C L =,这里H L c c <。并且信息是不对称的:企业2知道自己的成本函数和企业1的成本函数,企业1知道自己的成本函数,但却只知道企业2边际成本为高的概率是θ,边际成本为低的概率是θ-1(企业2可能是新进入这一行业的企业,也可能刚刚发明一项新的生产技术)。上述一切都是共同知识:企业1知道企业2享有信息优势,企业2知道企业1知道自己的信息优势,如此等等。 现在我们来分析这个静态贝叶斯博弈。一般情况下,企业2的边际成本较高时选择较低的产量,边际成本较低时,选择较高的产量。企业1从自己的角度,会预测到企业2根据 其成本情况将选择不同的产量。设企业1的最佳产量选择为*1q ,企业2 边际成本为H c 时 的最佳产量选择为)(*2H c q ,企业2 边际成本为L c 时的最佳产量选择为)(*2L c q ,如果企业2的成本较高,它会选择)(* 2H c q 满足: 22*1])[(max 2q c q q a H q --- 类似地,如果企业2的成本较低,)(*2L c q 应满足: 22*1])[(max 2q c q q a L q --- 从而,企业l 为了使利润最大化,选择*1q 应满足: }])()[(1(])([(max{11*2111*212q c c q q a q c c q q a L H q ----+---θθ 三个最优化问题的一阶条件为: 2)( ,2)(*1*2*1* 2L L H H c q a c q c q a c q --=--=

相关主题
文本预览
相关文档 最新文档