当前位置：文档之家› 不完全信息静态博弈

不完全信息静态博弈

第八章不完全信息静态博弈

这一章里我们讨论不完全信息静态博弈，也称为贝叶斯博弈(Bayes)。不完全信息博弈中，至少有一个参与者不能确定另一参与者的收益函数。非完全信息静态博的一个常见例子是密封报价拍卖(sealed —bid auction)：每一报价方知道自己对所售商品的估价，但不知道任何其他报价方对商品的估价；各方的报价放在密封的信封里上交，从而参与者的行动可以被看作是同时的。静态贝叶斯博弈问题的主要来源也是现实经济活动，许多静态博弈关系都有不完全信息的特征，研究贝叶斯博弈不仅是完善博弈理论的需要，也是解决实际问题的需要。

8.1 静态贝叶斯博弈和贝叶斯纳什均衡

为了更好的说明不完全信息与完全信息之间的差异，我们用一个典型静态贝叶斯博弈作为例子，自然的引进静态贝叶斯博弈概念。

8.1.1不完全信息古诺模型

考虑如下两寡头进行同时决策的产量竞争模型。其中市场反需求函数由Q a Q P -=)(给出，这里21q q Q +=为市场中的总产量。企业1的成本函数为1111)(q c q C =，不过企业2的成本函数以θ的概率为222)(q c q C H =，以θ-1的概率为222)(q c q C L =，这里H L c c <。并且信息是不对称的：企业2知道自己的成本函数和企业1的成本函数，企业1知道自己的成本函数，但却只知道企业2边际成本为高的概率是θ，边际成本为低的概率是

θ-1(企业2可能是新进入这一行业的企业，

也可能刚刚发明一项新的生产技术)。上述一切都是共同知识：企业1知道企业2享有信息优势，企业2知道企业1知道自己的信息优势，如此等等。

现在我们来分析这个静态贝叶斯博弈。一般情况下，企业2的边际成本较高时选择较低的产量，边际成本较低时，选择较高的产量。企业1从自己的角度，会预测到企业2根据其成本情况将选择不同的产量。设企业1的最佳产量选择为*1q ，企业2 边际成本为H c 时的最佳产量选择为)(*2H c q ，企业2 边际成本为L c 时的最佳产量选择为)(*

2L c q ，如果企业2的成本较高，它会选择)(*2H c q 满足：

22*1])[(max 2q c q q a H q --- 类似地，如果企业2的成本较低，)(*2L c q 应满足：

22*1])[(max 2q c q q a L q --- 从而，企业l 为了使利润最大化，选择*1q 应满足：

}])()[(1(])([(max {11*2111*212q c c q q a q c c q q a L H q ----+---θθ 三个最优化问题的一阶条件为：

2)( ,2)(*1*2*1*

2L L H H c q a c q c q a c q --=--=

及 ]})()[(1(])([({2

11*21*2*1c c q a c c q a q L H ---+--=θθ 三个一阶条件构成的方程组的解为：

) ( 6

132)(1*2L H H H c c c c a c q --++-=θ ) ( 632)(1*2L H L L c c c c a c q -++-=

θ 及 3)1(2*1L H c c c a q θθ-++-=

把这里的*1q 、)(*2H c q 和)(*2L c q 与成本分别为1c 和2c 的完全信息古诺均衡相比较，假

定1c 和2c 的取值可使得两个企业的均衡产量都为正，在完全信息的条件下，企业的产出为

3/)2(*j i i c c a q +-=。与之不同的，在不完全信息条件下，H H c c q c q =>2*2*2

,)(当， L L c c q c q =<2*2*2,)(当。之所以会出现这种情况，是因为企业2不仅根据自己的成本调整其产出，同时还将考虑到企业l 的情况选择最优反应。如果企业2的成本较高，它就会因成本较高而减少产量，但同时又会生产稍多一些，因为它知道企业1将根据期望利润最大化的原则决定产出，从而要低于企业1确知企业2成本较高时的产量。

8.1.2静态贝叶斯博弈

现在，我们要建立非完全信息同时行动博弈的标准式表述，也称为静态贝叶斯博弈。首先要表示出非完全信息的关键因素，即每一参与者知道他自己的收益函数，但也许不能确知其他参与者的收益函数。令参与者i 可能的收益函数表示为);,,(1i n i t a a u ，其中i t 称为参与者i 的类型（type ），它属于一个可能的类型集(亦称为类型空间(type pace))i T ，每一类型i t 都对应着参与者i 不同的收益函数的可能情况。

作为具体的例子，考虑前面的的古诺博弈。企业的行动是它们的产量选择1q 和2q 。企业2有两种可能的成本函数，从而有两种可能的利润或收益函数：

企业1只有一种可能的收益函数：

我们说企业2的类型空间为了},{2H L c c T =，企业1的类型空间为了}{11c T =。

在这样定义参与者的类型之后，说参与者i 知道自己的收益函数也就等同于说参与者i 知道自己的类型，类似地，说参与者i 可能不确定其他参与者的收益函数，也就等同于说参与者i 不能确定其他参与者的类型，我们用},,,,,{111n i i i t t t t t +--=表示其他参与者的类

型。并用i T -表示i t -所有可能的值的集合，用概率)(i i i t t p -)表示参与者在知道自己的类型是i t 的前提下，对其他参与者类型i t -的推断，即在自己的类型是i t 的前提下，对其他参与者类型i t -出现的条件概率。在完全信息静态博弈的标准式的基础上，增加类型和推断两个概念，得到静态贝叶斯博弈的标准式概念。

定义9.1 一个n 人静态贝叶斯博弈的标准式表述包括：参与者的行动空间n A A ,,1 和它们的类型空间n T T ,,1 ，他们的推断n p p ,,1 ，以及他们的收益函数n u u ,,1 。参与者i 的类型作为参与者i 的私人信息，决定了参与者i 的收益函数);,,(1i n i t a a u 。参与者i 的推断)(i i i t t p -描述了i 在给定自己的类型i t 时，对其他n —1个参与者可能的类型i t -的不确定性。我们用},,;,;,;,,{1111n n n n u u p p T T A A G =表示这一博弈。

静态贝叶斯博弈的一般表示法，对于由现实问题抽象和建立静态贝叶斯博弈模型，提供了思路和帮助，我们根据静态贝叶斯博弈表达式中的几个方面，来确定模型的主要内容。不过最重要的问题是如何来分析问题，那么用什么样的方法来分析这类博弈呢？

8.1.3海萨尼转换

信息的不完全使得博弈分析变的复杂，1967年以前，博弈论专家认为这样的不完全信息博弈是无法分析的，因为当一个参与人不知道在与谁博弈时，博弈的规则是无效的。海萨尼（Harsanyi ，1967-1968）提出了处理不完全信息博弈的方法，巧妙地引入一个“第三者”----自然，将复杂问题的不完全信息博弈转换为完全但不完美信息博弈，称之为“海萨尼转换”。

海萨尼转换的具体方法是：

（1）一个虚拟的参与人“自然”，自然首先决定参与人的类型，赋予各参与人的类型

向量),,(1n t t t =，其中，n i T t i i ,,1, =∈；

（2）自然告知参与者i 自己的类型，却不告诉其他参与者的类型；

（3）参与者同时选择行动，每一参与者i 从可行集i A 中选择行动方案i a ；

（4）各方得到收益);,,(1i n i t a a u 。

借助于第一步和第二步中虚构的参与者“自然”的行动，我们可以把一个不完全信息的博弈表述为一个不完美信息的博弈。海萨尼转换是处理不完全信息博弈的标准方法。

8.1.4贝叶斯纳什均衡

静态贝叶斯博弈转化的都是两阶段有同时选择的、特殊类型的不完美信息动态博弈，对于这类博弈有专门的分析方法和均衡概念。为了定义贝叶斯纳什均衡概念，首先定义此类博

弈中参与者的战略空间。动态博弈中参与者的一个战略是关于行动的一个完整计划，包括了参与者在可能会遇到的每一种情况下将选择的可行行动。在给定的静态贝叶斯博弈的时间顺序中，自然首先行动，赋予每一参与者各自的类型，参与者i 的一个(纯)战略必须包括参与者i 在每一可行的类型下选择的一个可行行动。定义如下：

定义9.2 在静态贝叶斯博弈},,;,;,;,,{1111n n n n u u p p T T A A G =中，参与者i 的一个战略是一个函数)(i i t s ，其中对i T 中的每一类型i t ，)(i i t s 包含了自然赋予i 的类型为i t 时，i 将从可行集中i A 中选择的行动i a 。

我们用不完全信息古诺模型来阐述战略定义，从前面分析知道博弈的解由三个产量选择组成：*1q 、)(*2H c q 和)(*2L c q 。用刚刚给出的关于战略的定义，（)(*2H c q ，)(*2L c q ）就是企业2的战略，*

1q 是企业1的战略，很容易想到企业2根据自己的成本情况会选择不同的产量，但是还应注意到的同样重要的一点，是企业l 在选择产量时也应同样考虑企业2将根据不同的成本选择不同的产量。从而，如果我们的均衡概念要求企业l 的战略是企业2战略的最优反应，则2的战略必须是一对产量，分别对应于两种可能的成本类型，否则企业1就无法计算它的战略是否确实是企业2战略的最优反应，无法进行博弈分析。

给出贝叶斯博弈中关于战略的定义之后，我们就可以定义贝叶斯纳什均衡了。尽管定义中的符号十分复杂，但中心思路却既简单又熟悉：每一参与者的战略必须是其他参与者战略的最优反应，亦即贝叶斯纳什均衡实际上就是在贝叶斯博弈中的纳什均衡。

定义9.3 在静态贝叶斯博弈},,;,;,;,,{1111n n n n u u p p T T A A G =中，战略组合),,(**1*n s s s =是一个纯战略贝叶斯纳什均衡，如果对每一参与者i 及对i 的类型集i T 中

的每一i t ，)(*i i t s 满足 )}(];)(,)(,),(,),([({max *1*11*11*1i i i i t n n i i i i i i A a t t p t t s t s a t s t s u i

i i -++--∈∑- 定义中求最大值的和是对i t -求和，即对其他参与人的各种可能的类型组合求和，“纯策略”的意义与完全信息博弈相同。当静态贝叶斯博弈中参与人的一个战略组合是贝叶斯纳什均衡时，没有参与者愿意改变自己的战略，即使这种改变只涉及一种类型下的一个行动。

贝叶斯纳什均衡是分析静态贝叶斯博弈的核心概念，一个有限的静态贝叶斯博弈(即博弈中n 是有限的，并且),,(1n A A 和),,(1n T T 都是有限集)理论上存在贝叶斯纳什均衡，包括采用混合战略的情况。

8.2 应用举例

海萨尼(1973)提出这样的一个结论：完全信息静态博弈的混合战略纳什均衡，几乎总是可以解释为与之密切相关、存在少量不完全信息的博弈中的纯战略贝叶斯纳什均衡。混合战

略纳什均衡的重要特征，不是参与者以随机地方法选择一个战略，而是参与者不能确定其他参与人的选择，这种不确定性既可产生于随机因素，又可能(更为合理地)因为少量不完全信息，如下面的例子。

8.2.1混合策略和不完全信息

前面所讲的性别战博弈，存在两个纯战略纳什均衡(歌剧，歌剧)和(拳击，拳击)及一个混合战略纳什均衡，其中妻子以2／3的概率选择歌剧，丈夫以2／3的概率选择拳击。

图9-1 性别战

现在假设尽管两人已经认识了相当一段时间，但不能完全肯定地把握对方的想法。假定如果双方都选择歌剧妻子的收益为w t +2，其中w t 的值是妻子的私人信息，双方都去观看拳击时丈夫的收益为h t +2，其中h t 的值为丈夫的私人信息；w t 和h t 相互独立，并服从[0，x ]区间上的均匀分布，(w t 和h t 的值是指原博弈收益的随机扰动项，我们可以认为x 是一个很小的正数)。所有其他情况下的收益不变。表述为标准式则为：静态贝叶斯博弈},;,;,;,{h w h w h w h w u u p p T T A A G =中，行动空间为h w A A =={歌剧，拳击}，类型空间为],0[x T T h w ==，关于类型的推断为对所有的w t 和h t ，x t p t p w h h w /1)()(==，收益情况如图9-2。

图9-2 非完全信息性别战

我们构建这个性别战博弈的纯战略贝叶斯（Bayes ）纳什均衡。其中w t 超过某临界值w 时妻子选择歌剧，否则选择拳击；丈夫在h t 超过某临界值h 时选择拳击，否则选择歌剧。在这一均衡中，妻子以x w x /)(-的概率选择歌剧，丈夫则以x h x /)(-的概率选择拳击。

假设妻子和丈夫都采用上面所给出的战略，对一个给定的x ，我们计算相应的w 和h ，以使双方的战略符合贝叶斯纳什均衡的条件。给定丈夫的战略，妻子选择歌剧和选择拳击的期望收益分别为

)2(0)2(w w t x

h x h x t x h +=?-++

和

h x x h x x h -=?-+?10 从而，当且仅当w h

x t w =-≥3，选择歌剧是最优的。同样，假定妻子采用了临界值w 战略，丈夫选择拳击和选择歌剧的期望收益分别为

)2()2(0h h t x w t x w x w x +=++?- 和

w x x w x w x -=?+?-01 所以，当且仅当h w

x t h =-≥3，选择拳击是最优的。解联立方程组 ???????=-=-h w

x w h x 33

得 ???=-+=0

32x h h h w

解二次方程得 x

x h w 24931+-+== 当x 趋于0时，该式的值趋于2／3。也就是说，随着不完全信息的消失，参与者在此不完全信息博弈纯战略贝叶斯纳什均衡下的行动趋于其在原完全信息博弈混合战略纳什均衡下的行动。

8.2.2暗标拍卖

我们用贝叶斯纳什均衡的思想，来讨论暗标拍卖问题。基本的暗标拍卖规则是各投标人密封标书投标，统一时间开标，标价最高者中标。如果出现标价相同的情况，用抛硬币或类似方法决定中标者。假设有两个投标人，分别为1、2，投标人i 对商品的估价为i v ——即如果投标人i 付出价格p 得到商品，则i 的收益为p v i -。两个投标人的估价相互独立，并服从[0，1]区间上的均匀分布。投标价格不能为负，且双方同时给出各自的投标价。出价较高的一方得到商品，并支付他报的价格；另一方的收益和支付都为0。投标方是风险中性的，所有以上都是共同信息。

为把这一问题化为标准式的静态贝叶斯博弈，我们必须确定行动空间、类型空间、推断及收益函数。参与者i 的行动是给出一个非负的投标价i b ，其类型即他的估价i v (在抽象博弈},;,;,;,{21212121u u p p T T A A G =中表示为，行动空间),0[∞=i A ，类型空间]1,0[=i T )。

由于估价是相互独立的，参与者i 推断j v 服从[0，1]区间上的均匀分布，而不依赖于i v 的值。最后，参与者i 的收益函数为

?????<=->-=

0 )/2( ),;,(2121j i j i i i j i i i i b b b b b v b b b v v v b b u 当当当

为推导这一博弈的贝叶斯纳什均衡，我们首先建立参与者的战略空间。在静态贝叶斯博弈中，一个战略是由类型到行动的函数。参与者i 的一个战略为函数)(i i v b ，据此可以决定i 在每一种类型(即对商品的估价)下选择的投标价格。在贝叶斯纳什均衡下，参与者1的战略)(11v b 与参与者2的战略)(22v b 互相是对方的最优反应。若战略组合)](),([2211v b v b 是贝叶斯纳什均衡，那么每个类型]1,0[∈i v ，)(i i v b 满足

}]{)(2

1}{) [(max j i i i j i i i b b b P b v b b P b v i =-+>- 我们寻找该问题的一组线性均衡解，即假设)(11v b 和)

(22v b 都是线性函数。11111)(v c a v b +=及22222)(v c a v b +=，并据此对上式进行简化。但应注意我们不是限制了参与者的战略空间，使之只包含了线性战略；而是允许参与者任意地选择战略，而只看是否存在线性的均衡解。我们会发现由于参与者的估价是均匀分布的，这样的线性均衡解不仅存在。而且是惟一的。其结果为2/)(i i i v v b =，也就是说，每一参与者以其对商品估价的l ／2作为投标价。这样，一个投标价格反映出投标方在拍卖中遇到的最基本的得失权衡：投标价格越高，中标的可能性越大；投标价格越低，一旦中标所得的收益就越大。

假设参与者j 采取战略j j j j j v c a v b +=)(，对一个给定的i v 值，参与者i 的最优反应为下式的解

}]{)(2

1}{) [(max j i i i j j j i i i b b b P b v v c a b P b v i =-++>- 因为j v 服从均匀分布，所以j j j j j v c a v b +=)()服从均匀分布，0}{==j i b b P 。由于i 的投标价应高于参与者j 最低的可能投标价格，否则没有意义，同时应低于j 最高的可能投标价格，我们有j j i j c a b a +≤≤，于是，上式变为

j j i b j j i j i i b j j j i i i b c a b c a b v P b v v c a b P b v i i i -=-<-=+>-max }]{)[(max }]{) [(max 一阶条件为2/)(j i i a v b +=。在j i a v <时，j j i i a a v b <+=2/)(，这样时根本不可能中标的，至少j i a b =。综上，参与者i 的最优反应为

?????<≥+=

2/)()(j i j j i j i i i a v a a v a v v b 当当如果10<

第二章完全信息静态博弈的基本理论

第二章完全信息静态博弈的基本理论 0．完全信息（complete information）博弈与不完全信息（incomplete information）博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识；只要有一个参与人的支付函数不是该博弈的公共知识，就意味着该博弈是不完全信息博弈。特别提示：如果该博弈是完全信息博弈，这意味着参与人不仅知道自己是什么类型的人，也知道对手们是什么类型的人。一．求解方法之一：剔除严格劣策略 1.占优策略与劣策略。严格占优策略与严格劣策略：不管对手采取什么策略，如果参与人采取a策略所获得的支付严格大于b策略，则称a策略是相对于b策略的严格占优策略（strictly dominating strategy），b策略是相对于a策略的严格劣策略（strictly dominated strategy）。弱占优策略与弱劣策略：不管对手采取什么策略，如果参与人采取a策略所获得的支付不低于b策略，且至少有一种情况下的支付会严格大于b策略，则称b策略是相对于a策略的弱劣策略（weakly dominated strategy ）；a策略则是相对于b策略的弱占优策略（weakly dominating strategy）。占优策略就是我们平时所说的上策，劣策略就是我们平时所说的下策。特别提示：本文对占优策略的理解与其他教材不同，本文可以将以上述方式定义出来的占优策略称为局部占优策略；如果不管对手采取什么策略，如果参与人采取a策略所获得的支付严格大于其他所有策略，则称a策略是全局严格占优策略。类似地，可以定义局部劣策略与全局劣策略。理性的人在博弈时绝对不会选择严格劣策略。通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。 2.案例案例1 乙甲坦白不坦白

1.完全信息静态博弈实验指南(2020)

西方经济学实验一：完全信息静态博弈实验指南一、博弈论概述博弈论(game theory)又被称为“对策论”、“赛局论”。博弈论是研究相互依赖、相互影响的决策主体的理性决策行为及这些决策的均衡结果的理论。博弈主要包括局中人、行动、信息、战略、支付（效用）、结果和均衡等要素，其中，局中人、战略和支付是描述一个博弈所需的最少要素。局中人、行动和结果统称为“博弈规则”。（1）依据博弈参与者相互作用时能否达成一个具有约束力的协议，可将博弈分为合作博弈和非合作博弈。如果有具有约束力的协议，就是合作博弈；如果没有，就是非合作博弈。（2）依据博弈局中人行为的时间序列性，可将博弈分为静态博弈、动态博弈两类。静态博弈是指在博弈中，局中人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，局中人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。（3）按照局中人对其他局中人的了解程度，可将博弈分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中，每位局中人对其他局中人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果局中人对其他局中人的特征、策略空间及收益函数信息了解得不够准确，或者不是对所有局中人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。目前经济学家们所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博理论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈可分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈，其对应的均衡概念和理论研究的代表人物如表1所示。（1）纳什均衡纳什均衡（Nash equilibrium）的核心思想是：博弈的理想结局是，每个局中人选择的策略是对其他局中人所选策略的最佳反应，其中每一个局中人都不能因单方面改变自己的策略而获益。纳什均衡有一个很重要的特点，是可以自我实施的，即信念和选择之间的一致性。就是说，基于信念的选择是合理的，同时支持这个选择的信念也是正确的。如果所有人都认为这个结果会出现，这个结果就真的会出现。如果局中人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳

完全信息静态博弈及其纳什均衡解

1 第四章完全信息动态博弈及其均衡解 1.完全且完美信息动态博弈完全信息博弈指的是参与者的收益是共同知识。完全且完美信息动态博弈指的是：博弈中的每一步中参与人都知道这一步之前博弈进行的整个过程。因此，我完全且完美信息动态博弈的特点：（1）行动是顺序发生的；（2）下一步行动选择之前所有以前的行动都可以被观察到；（3）每一可能的行动组合下的参与人的收益都是公共知识。而不完美信息博弈指的是，在某一步参与人不知道以往博弈所进行的历史或者没有观察到以往的所有行动。例4.1．我们来考虑这样一个动态博弈: 假定甲在开采一个价值4万元的金矿时需要1万元资金，乙有1万元资金。甲向乙借钱来开金矿。在这个博弈的第一阶段，甲向乙承诺: 如果乙借钱给他的话，那么他就会将采到的金子与乙对半分成，即(2，3)——乙得到2万元的金子，同时收回自己的1万元投资。对于甲的承诺，乙如果不借钱给甲的话，那么博弈到此为止，双方收益为(0，1)。如果乙借钱给甲的话，那么博弈进入第二个阶段。在第二阶段中，若甲遵守他的承诺，分给乙一半的金子，这样两人的收益为(2，3)，其中1万元为投资成本。〖JP3〗然而，若甲违背自己的承诺，博弈就会进入到第三个阶段: 如果乙同甲打官司，那么由于打官司费时费力，两个人的收益为(0，1)；若乙不打官司，那么两个人的收益就为(5，0)。参见图1。乙借不借甲分不分（0，1）乙乙（2，3）打官司不打官司（1，2）（5，0）图1. 借钱博弈的博弈树 2.逆向归纳法与子博弈纳什均衡解逆向归纳法（Backward induction ）又称逆推法，是指这样一种动态博弈求解方法：从博弈的最后一步开始，计算最后一步的参与人的最优行动，逐步逆推到博弈开始时进行第一步的参与人的最优行动，从而确定每个参与人的最优行动。在动态博弈中逆向归纳法能够进行的前提：参与人是理性的——任何一步参与人都选择甲乙

不完全信息下的静态博弈习题

非完全信息静态博弈习题 1、考虑下面的Cournot 双头垄断模型。市场的反需求函数为Q a Q p -=)(，其中21q q Q +=为市场总产量，两个企业的总成本都为()i i i cq q c =，但需求却不确定：分别以θ的概率为高（H a a =）,以θ-1的概率为低（L a a =）,此外，信息也是非对称的：企业1知道需求是高还是低，但企业2不知道，所有这些都是共同知识，两企业同时进行决策。要求：假定H a 、L a 、θ和c 的取值范围使得所有均衡产出都是正数，试问此博弈的贝叶斯纳什均衡是什么解：在市场需求为高时，企业1的最优战略为： ()H H H q c q q a Max 121?--- 由一阶条件可以推出2 21c q a q H H --= (1) 在市场需求为低时，企业1的最优战略为： ()L L L q c q q a Max 121?--- 《由一阶条件可以推出2 21c q a q L L --= (2) 企业2的最优战略为 ()()(){}2212211q c q q a q c q q a Max L L H H ----+---θθ 由一阶条件可得： ()()()211*2c q a q a q L L H H ---+=-θθ (3) 方程(1)、(2)和(3)联立可得： ()()()()6 21311*1c q a q a q L L H H H ------=θθ ()6 22*1c a a q H L L --+=θθ ()31*2c a a q H L -+-=θθ

由此可知，企业1的战略()*1*1,L H q q 和企业2的战略*2q 构成贝叶斯纳什均衡。； 2、在下面的静态贝叶斯博弈中，求出所有的纯战略贝叶斯纳什均衡：（1）自然决定收益情况由博弈1给出还是由博弈2给出，选择每一博弈的概率相等；（2）参与者1了解到自然是选择了博弈1还是博弈2，但参与者2不知道；（3）参与者1以相同概率选择T 或B ，同时参与者2选择L 或R; （4）根据自然选择的博弈，两参与者都得到了相应的收益。 L R T B L R ） T B 解：（1）（B ，L ）（2）参与者1在上边博弈时选T ，下边博弈时选B ； % 如果参与者推断自然选择上边博弈的概率>2/3，参与者2选L 如果参与者推断自然选择上边博弈的概率=2/3，参与者2选L 和选R 无差异如果参与者推断自然选择上边博弈的概率<2/3，参与者2选R （3）参与者1以相同的概率选T 或选B ；如果参与者推断自然选择上边博弈的概率>2/3，参与者2选L 如果参与者推断自然选择上边博弈的概率=2/3，参与者2选L 和选R 无差异如果参与者推断自然选择上边博弈的概率<2/3，参与者2选R （4）自然选择上边博弈时，参与者1选T ，参与者2 选L ；自然选择下边博弈时，参与者1选B ，参与者2 选R ；

几个博弈案例

几个博弈案例 1.囚徒困境警察抓住了两个罪犯，但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判一年徒刑；如果两人中有一人坦白认罪，则坦白者立即释放而另一人将重判10年徒刑；果两人都坦白认罪，则他们将被各判8年监禁。问：两个罪犯会如何选择（坦白还是抵赖）？ 2.智猪博弈（占优战略均衡）猪圈里有一头大猪，一头小猪。猪圈的边缘有个踏板，每踩一下，远离踏板的投食口就会落下少量食物。如果是小猪踩踏板，大猪会在小猪跑到食槽之前吃光所有食物；若是大猪踩踏板，则小猪还有机会吃到一点残羹冷炙，因为小猪食量小嘛。那么，两头猪会采取什么策略呢？答案是：小猪将安安心心地等在食槽边，而大猪则不知疲倦地奔忙于踏板和食槽之间。办公室里也会出现这样的场景：有人做“小猪”，舒舒服服地躲起来偷懒；有人做“大猪”，疲于奔命，吃力不讨好。但不管怎么样，“小猪”笃定一件事：大家是一个团队，就是有责罚，也是落在团队身上，所以总会有“大猪”悲壮地跳出来完成任务。想一想，你在办公室里扮演的角色，是“大猪”，还是“小猪”？(其实小猪的决策是明智的，想想同一个公司，小股东和大股东的行为。) 3.性别之争（多重纳什均衡） “有一对夫妻，丈夫喜欢看足球赛节目，妻子喜欢看肥皂剧节目，但是家里只有一台电视，于是就产生了争夺频道的矛盾。假设双方都同意看足球赛，则丈夫可得到2单位效用，妻子得到一单位效用；如果都同意看肥皂剧，则丈夫可得到1单位效用，妻子得到2单位效用；如果双方意见不一致，结果只好大家都不看，各自只能得到0单位效用。这个博弈的策略式表达如下：

不完全信息静态博弈案例扶老人林志涵

让道德与理性同行 ——不完全信息静态博弈案例分析 2012333501054 林志涵 12经济学1班摘要：通过简单的博弈论分析方法对日常生活中具有现实意义的社会现象进行分析，从而在理性人假设的前提下，在各种因素的影响下，在个人取得利益最大化的同时，通过政策或法律的有效实施来使得道德能得到发扬提倡。关键词：不完全信息静态博弈社会现象道德与理性不完全信息静态博弈在不完全信息静态博弈里，参与人并不完全清楚有关博弈的一些信息，所有参与人在共同决策环境中同时选择行动策略，每个参与人只选择一次。纳什均衡，在给定的其他参与人选择的前提下，参与人根据自身收益选择的最优战略。 1.背景： “除非有人证物证，否则我不会再去扶跌倒的老人！”广东肇庆的阿华在扶起倒地的70多岁阿婆却遭诬陷后表示。事发7月15日早上，阿华开摩托车上行人道准备买早餐,看到路边有位老太太跌倒在求救，阿华立刻停下来，扶起老奶奶，殊不知却遭到阿婆的诬陷，随后和阿婆的女婿发生争执。阿婆被送到医院住院观察。为调查真相，交警暂扣了阿华的摩托车。事发后几天，阿华说没睡过一次好觉，还向单位请了几天假，天天在附近找证人，就是为了证实自己清白。这一案件的真想不言而喻，老婆婆家人蛮不讲理地要求赔偿和阿华地好心搀扶倒地老婆婆形成了鲜明的对比，好心被当驴肝肺的事情就这么真真实实的发生在了我们的身边，社会风气遇到了极大的挑战，这引发了社会各界针对这一事件的激烈讨论。到底该不该扶？本文将在经济人假设的前提下，通过不完全信息静态博弈的思想进行分析阐述，并探讨我们如何通过一系列客观因素的影响，来使得利益与道德同行。 2.博弈的假设与建模：假设： ①参与博弈的双方是理性人，都会选择个人利益最大化的行动。 ②假设阿婆在未有人搀扶时便决定是否坑钱，而路人并不知道阿婆是否会坑钱，即参与人在决策时不知道对方的策略同时也并不知道对方能够的收益函数。 ③假定当事人双方最终解决方法由交警决定，当事人将面临交警正确处理和错误处理两种。参与人：阿婆、路人行动选择：路人——帮忙扶起、不帮忙扶起阿婆——被扶起后坑钱、不坑钱 3.支付收益： 1)在不考虑交警是否正确判断因素下，阿婆倒地没人扶会有-10的身体伤害，在阿婆不坑钱的情况下仍然没有人扶会多产生负收益-10的心灵损失（路人不知道阿婆是否坑钱）；路人选择帮忙且阿婆不坑钱会产生10

完全信息静态博弈

博弈论第二章练习 8.设股诺模型中有n家厂商，qi为厂商i的产量，Q=q1+……+qn为市场总产量。P为市场出清价格，且已知P=P(Q)=a-Q（当Qa+ C1,则纳什均衡产量又为多少？答：当情形变为两个厂商，则利润分别为 u1=Pq1-c1q1=(a-q1-q2)q1-c1q1 u2=Pq2-c2q2=(a-q1-q2)q2-c2q2 对q求导并令其为0得 a-q1-c1-2q1=0 a-q2-c2-2q2=0 反应函数为q1=(a-q2-c1)/2 q2=(a-q1-c2)/2 若0a+c1时，q2<0,厂商1垄断了市场，此时纳什均衡产量为q1=q*=(a-c1)/2 思考题：卡特尔能够持久存在吗？为什么石油输出国组织能长期维持？答：（1）我认为卡特尔不能持久存在。因为有两个因素导致了卡特尔具有天然的不稳定性：第一，潜在进入者的威胁：一旦卡特尔把价格维持得较高水平，那么就会吸引新企业进入这个市场，而新企业进入后，可以通过降价扩大市场份额，此时卡特尔要想继续维持原来的高价就很不容易了。第二，卡特尔内部成员所具有的欺骗动机：这是一个典型的“囚徒困境”，给定其他企业的生产数量和价格都不变，那么一个成员企业偷偷地增加产量将会获得额外的巨大好处，这会激励成员企业偷偷增加产量，如果每个成员企业都偷偷增加产量，显然市场总供给大量增加，市场价格必然下降，卡特尔限产提价的努力将瓦解。如果卡特尔不能有效解决这个问题，最终将导致卡特尔的解体。事实上，经济学家研究得出，世界上卡特尔的平均存续期间约为6.6年，最短的两年就瓦解了此外，随着各国政府反垄断法的实施，卡特尔也可能因为违反了政府法

不完全信息静态博弈

第八章不完全信息静态博弈这一章里我们讨论不完全信息静态博弈，也称为贝叶斯博弈(Bayes)。不完全信息博弈中，至少有一个参与者不能确定另一参与者的收益函数。非完全信息静态博的一个常见例子是密封报价拍卖(sealed —bid auction)：每一报价方知道自己对所售商品的估价，但不知道任何其他报价方对商品的估价；各方的报价放在密封的信封里上交，从而参与者的行动可以被看作是同时的。静态贝叶斯博弈问题的主要来源也是现实经济活动，许多静态博弈关系都有不完全信息的特征，研究贝叶斯博弈不仅是完善博弈理论的需要，也是解决实际问题的需要。 8.1 静态贝叶斯博弈和贝叶斯纳什均衡为了更好的说明不完全信息与完全信息之间的差异，我们用一个典型静态贝叶斯博弈作为例子，自然的引进静态贝叶斯博弈概念。 8.1.1不完全信息古诺模型考虑如下两寡头进行同时决策的产量竞争模型。其中市场反需求函数由Q a Q P -=)(给出，这里21q q Q +=为市场中的总产量。企业1的成本函数为1111)(q c q C =，不过企业2的成本函数以θ的概率为222)(q c q C H =，以θ-1的概率为222)(q c q C L =，这里H L c c <。并且信息是不对称的：企业2知道自己的成本函数和企业1的成本函数，企业1知道自己的成本函数，但却只知道企业2边际成本为高的概率是θ，边际成本为低的概率是 θ-1(企业2可能是新进入这一行业的企业，也可能刚刚发明一项新的生产技术)。上述一切都是共同知识：企业1知道企业2享有信息优势，企业2知道企业1知道自己的信息优势，如此等等。现在我们来分析这个静态贝叶斯博弈。一般情况下，企业2的边际成本较高时选择较低的产量，边际成本较低时，选择较高的产量。企业1从自己的角度，会预测到企业2根据其成本情况将选择不同的产量。设企业1的最佳产量选择为*1q ，企业2 边际成本为H c 时的最佳产量选择为)(*2H c q ，企业2 边际成本为L c 时的最佳产量选择为)(* 2L c q ，如果企业2的成本较高，它会选择)(*2H c q 满足： 22*1])[(max 2q c q q a H q --- 类似地，如果企业2的成本较低，)(*2L c q 应满足： 22*1])[(max 2q c q q a L q --- 从而，企业l 为了使利润最大化，选择*1q 应满足： }])()[(1(])([(max {11*2111*212q c c q q a q c c q q a L H q ----+---θθ 三个最优化问题的一阶条件为： 2)( ,2)(*1*2*1* 2L L H H c q a c q c q a c q --=--=

第七章不完全信息静态博弈与动态博弈在管理中的应用

第七章不完全信息静态博弈与动态博弈在管理中的应用一．拍卖理论与拍卖方式的选择 1．什么是拍卖与招标（1）日常生活对拍卖与招标的认识：拍卖是指以竞买的方式配置资源；招标是指以竞卖的方式配置资源；在拍卖中物品——交易标的物是已经存在的，买卖双方的信息比较对称，而工程及服务招标中工程及服务是未来提供的，交易中涉及更多的不确定性。（2）从经济学理论的角度来看，拍卖与招标在实质上是一样的、同构的，所以我们并不区分二者（发现事物之间的同构是学问研究的一向基本能力，学问研究的基本倾向是发现不同事物之间的同构或类似性，以尽可能少的理论解释尽可能多的现象，而不是相反）。 2．四大经典的拍卖方式（1）英国式拍卖：由低到高公开竞价，出价最高者获得拍卖标的物，以最高出价作为成交价。（2）荷兰式拍卖：由高到低公开叫价，第一个应价者者获得拍卖标的物，以应价作为成交价。（3）密封第一价格拍卖：拍卖参与人以独立的、密封的方式提交自己的报价，出价最高者获得拍卖标的物，以最高出价作为成交价。（4）密封第二价格拍卖，又称vickrey拍卖：拍卖参与人以独立的、密封的方式提交自己的报价，出价最高者获得拍卖标的物，以第二高出价作为成交价。（在哪儿见过？） 3．独立私人价值(individual private value)拍卖与共同价值（common value）拍卖（1）独立私人价值拍卖：每个拍卖参与人对拍卖品的估价仅取决于自己的个人偏好，每个人的估价行为均是独立的。如纯粹私人纪念品的拍卖。（2）公共价值拍卖：对所有潜在的买主而言，拍卖品的价值是一样的（因为拍卖品的价值并不取决于每个买者的偏好），但具体的价值是多少事先并不确定（如开采权及经营权的拍卖），因而估价可能不存在独立性。因此，这种类型的拍卖容易出现“倒霉的赢家”现象（winner’s curse）。 4．从买方的出价策略角度对四大拍卖方式的研究（1）.假定拍卖参与人或买方是风险中性的；拍卖属于独立私有价值拍卖（2）从买方的出价策略角度，英国式拍卖与密封第二价格拍卖具有策略等价性，在这两种拍卖方式中，买方具有占优策略——即自己的最优出价与别人的出价无关，其占优策略是自己的报价等于（或不超过）自己的保留价格，即买方是说真话的。（3）从买方的出价策略角度，荷兰式拍卖与密封第一价格拍卖具有策略等价性，在这两种拍卖方式中，买方均面临出价高一点还是低一点的二难选择，其出价策略不存在占优策略，只存在最优反应策略——即自己的最优出价取决于别人的出价。

完全信息静态博弈例子(作业)

例1：完全信息静态博弈在银行监管中的应用一、完全信息静态博弈模型的建立 (一)博弈的参与人商业银行(监管对象)作为理性经济人,其行为动机是部门、个人利益最大化。但由于在管理体制、经营方式、技术手段、人员素质、资产质量与外资银行之间存在差距,其经营难度和盈利能力都会受到不利的冲击。在遵循一定条件下的预期效用最大化的原则下,商业银行有足够的动力进行违规操作,例如私自变动利率或进行不符合政策的违规金融创新,借以获得竞争优势,实现最大化效用。银监会作为监管者,通过行使行政管理、现场检查、非现场检查以及违规处罚等监管权力,对商业银行的市场准入和退出,日常业务营运等进行指导、监督、管理。而在目前市场经济没有完善的条件下,无论是现场检查还是非现场检查,都存在监管工作量大,连续性强的特点。因此,实行严格监管策略有着较高的成本:监管费用增加,监管机构“暗箱”操作增长,创造经济租金使商业银行寻租行为增多,商业银行内部创新能力削弱等等。监管成本的增加可能会超过市场交易成本。 (二)博弈的假设前提 (1)银监会的策略空间为严格监管和宽松监管;(2)银监会在进行严格监管工作时,有成本支出。当商业银行违规经营时,可采用罚款、取消高级人员资格等措施。但在商业银行合规经营时,银监会宽松监管会带来收益;(3)商业银行的策略空间是违规经营和合规经营;(4)商业银行合规经营时,无论监管者监管与否,商业银行都将得到自己的正常收益;(5)商业银行违规经营的期望收益是违规所得,其在违规经营中将获得超额利润,但在银监会严格监管的条件下也将付出成本。注:R1、R2分别是银监会宽松监管,商业银行合规经营的正常收益。A为银监会采取监管措施所花费的成本;B为银监会在商业银行违规经营情况下,采取宽松监管所遭受的损失;C 为商业银行在违规经营条件下受到严格监管所造成的损失;M为银监会采取宽松监管,商业银行违规经营所获得的超额收益。其中A,B,C都与M成正相关。P为银监会严格监管的概率,1-p 是银监会宽松监管的概率;q是商业银行合规经营的概率,1-q是商业银行违规经营的概率。二、博弈模型的分析当商业银行合规经营时,银监会宽松监管的收益大于严格监管的收益,所以其最优选择是采取宽松监管;当商业银行违规经营时,银监会是采取严格监管还是宽松监管主要取决于A与B的比较。当A>B时,银监会采取宽松监管,商业银行的最优选择则是违规经营;当AB时,不管M与C的大小如何,银监会与商业银行之间存在纯策略纳什均衡(宽松监管,违规经营)。其含义为:银监会采取严格监管措施付出的成本大于商业银行违规经营对其造成的损失

不完全信息静态博弈总结

不完全信息静态博弈 1.不完全信息静态博弈特点：在博弈开始之前参与人之间的信息存在不确定性，但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。在不完全信息静态博弈中，在博弈开始前存在关于博弈人信息的不确定性，这个不确定像通常是博弈参与人的类型。在市场进入博弈中不完全信息表现为：在位者的成本类型（高成本、低成本）在斗鸡博弈中不完全信息表现为：参与人的性格类型（强硬，软弱） 2.海萨尼转换由于在不完全信息静态博弈中，参与人的类型存在不确定性，所以当一个参与人并不知道在与谁博弈时，博弈的规则是无法定义的，海萨尼提出了海萨尼转换解决这种不确定的问题。解决方法：海萨尼指出，引入虚拟参与人——自然，由自然先决定参与人的不同类型，将不完全信息博弈转换为不完美信息博弈。海萨尼通过引入“虚拟”参与人，将博弈的起始点提前，从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性。这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法称为 Harsanyi转换。 3.不完全信息静态博弈均衡——贝叶斯纳什均衡贝叶斯博弈的定义：贝叶斯博弈包含以下五个要素：1.参与人集合BΓ={1,2，…,n};2.参与人的类型集合T1,…,T2;3.参与人关于其他参与人类型的推断P1(t-1 |t1)，…,Pn(t-1n|tn);4.参与人类型相依的行动集A(t1),…, A(tn);5.参与人类型相依的支付函数贝叶斯博弈的战略：在贝叶斯博弈 G={Γ;(Ti)；（Pi）；（A（ti）；（ui（a（t）；ti）}中，参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti)；它包含了当自然赋予i的类型为ti时，i将从可行的行动集Ai(ti)中选择的行动。贝叶斯纳什均衡：在贝叶斯博弈中，对于一个理性的参与人i，当他只知道自己的类型ti 而不知道其他参与人的类型时，给定其他参与人的战略s-i ，他将选择使自己期望效用(支付)最大化的行动 ai*(ti)。贝叶斯博弈纳什均衡的存在性:一个有限的贝叶斯博弈一定存在贝叶斯Nash均衡。 4.贝叶斯博弈与混合战略均衡（关于混合战略纳什均衡的一个解释）首先，混合策略均衡不是现实生活的一个合理描述，人们并不是根据概率分布来选择自己行动；海萨尼证明，在完全信息情况下的混合策略均衡可以解释为不完全信息情况下纯策略均衡的极限。混合策略的本质：混合策略的本质不在于参与人随机的选择行动，而在于他不能确定其他参与人将选择什么纯策略，这种不确定性可能来自于参与人不知道其他参与人的类型。 5.贝叶斯均衡：机制设计问题机制设计的基本模型：机制设计是典型的3阶段不完全信息博弈，阶段1：机制设计者(委托人)设计一种“机制”，或者“契约”，或者“激励方案”；阶段2：代理人选择接受或拒绝该机制，拒绝的代理人得到某个外生的“保留效用”；阶段3：接受机制的代理人选择自己的行动(或者战略)，实现一个博弈结果。机制设计的目的：机制设计的目的就是要设计出可行的可实施机制，从而在该机制中找出最优规则以追求最大化收益。

文档之家

不完全信息静态博弈

第二章 完全信息静态博弈的基本理论

1.完全信息静态博弈实验指南(2020)

完全信息静态博弈及其纳什均衡解

不完全信息下的静态博弈习题

几个博弈案例

不完全信息静态博弈案例 扶老人 林志涵

完全信息静态博弈

不完全信息静态博弈

第七章 不完全信息静态博弈与动态博弈在管理中的应用

完全信息静态博弈例子(作业)

不完全信息静态博弈总结

第二章完全信息静态博弈的基本理论

不完全信息静态博弈案例扶老人林志涵

第七章不完全信息静态博弈与动态博弈在管理中的应用