当前位置:文档之家› 第二章-完全信息静态博弈的基本理论

第二章-完全信息静态博弈的基本理论

第二章-完全信息静态博弈的基本理论
第二章-完全信息静态博弈的基本理论

第二章完全信息静态博弈的基本理论

0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈

完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。

特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。

一.求解方法之一:剔除严格劣策略

1.占优策略与劣策略。

严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。

弱占优策略与弱劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付不低于b策略,且至少有一种情况下的支付会严格大于b策略,则称b策略是相对于a策略的弱劣策略(weakly dominated strategy );a策略则是相对于b策略的弱占优策略(weakly dominating strategy)。

占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。

特别提示:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。类似地,可以定义局部劣策略与全局劣策略。

理性的人在博弈时绝对不会选择严格劣策略。通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。

2.案例

案例1

甲坦白

不坦白

案例2

不作广告

甲 不作广告

作广告

在上面的两个例子中,通过剔除严格劣策略,可以获得一个占优策略均衡(坦白,坦白),(作广告,作广告)。

3.请思考下面这个例子是否存在占优策略均衡?

经过重复剔除严格劣策略,可以获得一个占优策略均衡(上,中),这就是求解方法之一——严格劣策略的迭代剔除方法。

思考:占优策略均衡(上,中)是通过不断剔除严格劣策略而获得的,为了成功地进行剔除,需要什么样的前提条件?由此可以理解公共知识的重要性。

4.思考:下面这个博弈是否存在占优策略均衡?

剔除严格劣策略并不适合于求解所有的博弈,许多博弈是不存在占优策略均衡的。

5.社会(或集体)困境(dilemma )、合作与非合作博弈、占优策略均衡 (1)案例

案例1:霍布斯博弈

假设鲁滨逊与星期五生活在一个自然状态之中。为了生存,他们各自有两个选择:自己生产财富或掠夺对方的财富。博弈情形如下:

甲生产

掠夺

思考:面对囚徒困境、广告博弈、霍布斯博弈,请思考如何解决社会困境?(答案略;最低价格承诺实际上就是为解决寡头之间的串谋困境提供了有效的解决机制)

案例2:1964年以前,美国香烟的电视广告非常普遍,1964年卫生总监的报告宣布以后,美国四大烟草公司经过协商与联邦政府达成协议,决定不再做电视广告,协议于1971年生效。各大烟草公司的利润得以大幅增加。

(2)合作博弈与非合作博弈

A合作博弈:参与人直接事先达成具有约束力的协议,以集体协商的方式选择策略,故又可称之为联盟博弈。由此形成的策略选择与支付被称为博弈的合作解,通常以帕累托最优作为度量标准。合作博弈其实就是指参与人在行动前能够实现进行沟通、交流,且沟通交流达成的协议是有约束力的。

B非合作博弈:又称策略博弈,参与人以独立的方式选择策略。由此形成的策略选择与支付被称为博弈的非合作解。

C一般所说的博弈论是指非合作博弈理论。

(3)社会(或集体)困境与占优策略均衡

A所谓社会(或集体)困境就是指博弈的不合作解与合作解相悖。

B凡是存在社会(或集体)困境问题的场合必定存在占优策略均衡,即社会(或集体)困境问题是存在占优策略均衡的重要博弈类型。

C注意:不要认为占优策略均衡都一定意味着社会(或集体)困境。以下面的政治博弈为例:甲乙作为竞选的对手,分别有三种立场可以选择:左中右;选民的分布是对称的;甲乙均追

思考:该博弈存在占优策略均衡吗?该博弈存在社会困境吗?

从这个博弈可以看出,只有中间立场在政治上被充分表达,绝大多数的非中间立场的选民的立场被严重忽视。

(4)占优策略均衡在制度设计中有着广泛的应用价值。

二.求解方法之二:最优反应法——符合理性人性质的方法,博弈论最重要的求解方法

1.最优反应策略:给定其他所有参与人策略选择的情况下,能够给某参与人带来最大收益的策略,其思维过程为:如果对手采用……,某参与人就应该采用……。这是一种相对优势策略。

通过最优反应方法所获得的博弈解称之为纳什均衡。

2.如何寻找纳什均衡?划线法(仅适合二人有限策略博弈)

案例1 竞选博弈假设甲乙两个参与人分别在上中下,左中右之间作选择:

思考(下,右)这个策略组合具有什么特点?互相构成对对手策略选择的最优反应。

案例2 选址博弈

甲乙两家百货公司考虑开店,可供选择的地址有四个:市郊、市中心、城市东部、城市西部。具体支付情况如下:

思考(市中心市中心)这个策略组合具有什么特点?

3.纳什均衡:它是由全部参与人所选择的策略构成的这样一个组合,在这个组合中,每个参与人的策略都是针对其他参与人人策略选择的最优反应。

特别注意,均衡是针对策略组合的,而不是支付组合的,即在上面的博弈中,(下,右)才是均衡,(6 6)是这个博弈的均衡结果,不要把均衡与均衡结果混淆,这显然与微观经济学不同,在微观经济学中均衡是针对结果而言的。

4.关于纳什均衡的体会:纳什均衡具有策略稳定性,在均衡状态之下没有人愿意单方面改变自己的策略选择,因此,纳什均衡具有自我实施特征。

特别说明:策略稳定性不同于均衡稳定性。

5.纳什均衡与占优策略均衡

(1)占优策略均衡肯定也是纳什均衡,但是纳什均衡不一定是占优策略均衡。

(2)纳什均衡与占优策略均衡都是博弈的非合作解。

6.多重纳什均衡问题

(1)寻找下列博弈的纳什均衡

案例1 节目选择博弈

甲乙两个电台各有三种节目形式可供选择,分别是摇滚乐、乡村音乐以及谈话节目

案例2 夫妻博弈

足球芭蕾

夫足球

芭蕾

上述两个例子的共同特点就是存在多个纳什均衡,这是纳什均衡的最大缺陷,降低了纳什均衡解的预测能力,因为一旦参与人的预期不一致,就可能出现极为糟糕的结局。

(2)多重纳什均衡的精炼(refine)

所谓精炼就是通过附加另外的合理的标准,使得某些不合理的纳什均衡被剔除掉,以减少纳什均衡的个数,提高理论分析对现实的预测能力(因为纳什均衡只是涵盖了理性的一个方面:最优反应)。

精炼方法之一:寻找支付帕累托占优均衡

推不推

甲推

不推

通过比较发现,(推,推)在支付上帕累托优于(不推不推)

精炼方法之二:寻找风险占优均衡

通过比较发现,在上面的博弈中,(不推,不推)在风险上优于(推推)

精炼方法之三:寻找焦点(focus)或谢林点(schelling point)

所谓焦点就是指那些依据某种线索或信号(如:历史、习俗、惯例、经验、自然或社会标志物)能够成为所有博弈参与人共识的纳什均衡。

特别说明:一方面,习俗和惯例能够为多重纳什均衡提供解,另一方面,习俗和惯例的稳定性正在于它们是纳什均衡。虽然依据某些线索或信号,某个纳什均衡更有可能发生,成为博

弈的焦点,但是并不是所有存在多重纳什均衡的博弈都有焦点。

三.求解方法之三:最大最小(maxmin)方法,一种非常保守稳健的方法

1.最大最小策略:首先确定参与人在每一个策略下所能够获得的最小支付,在所有的最小支付中最大那个支付所对应的策略就是最大最小策略。

由所有参与人的最大最小策略所构成的策略组合就是博弈的最大最小解,

2.案例

案例1:抢答博弈

按不按

甲按

不按

案例2:开车博弈

等待前行

甲等待

前行

3.最大最小解与纳什均衡的关系

(1)零和博弈与非零和博弈;常数和博弈与非常数和博弈

零和博弈:在任何博弈策略组合下所有参与人的支付总和均为零。

非零和博弈:在任何博弈策略组合下所有参与人的支付总和并不都是零。

常数和博弈:在任何博弈策略组合下所有参与人的支付总和为一个常数,其实任何常数和博弈均可以转化为零和博弈。

非常数和博弈:在任何博弈策略组合下所有参与人的支付总和不是一个常数。

(2)在常数和博弈中,最大最小解与纳什均衡解是一致的。在非常数和博弈中,最大最小解与纳什均衡解可能不一致。

采用最大最小方法的逻辑在于无论我选择什么策略,对手的最佳反应是采取使我支付最低的策略,故这个方法特别适合于零和博弈。特别注意:最大最小方法并不适用于求解所有的零和博弈,如配硬币博弈就是一个例子。

案例:配硬币博弈

正面反面

甲正面

反面

(3)当最大最小解与纳什均衡解不一致时,采用哪种方法更加合理?

一般来说,纳什均衡解更加合理,但是一旦存在多重纳什均衡且无法进行精炼,博弈存在极大的不确定性时,采用最大最小方法更加合理。

思考:配硬币博弈是否存在纳什均衡?

正面反面

甲正面

反面

四.混合策略纳什均衡

1.在配硬币博弈以及儿童常玩的“石头、剪刀、布”一类的游戏中,按照我们前面给出的寻找纳什均衡的方法,不存在纳什均衡。对这类游戏,人们的一个经验就是避免行为的规律性,随机地选择自己的策略,使得对手摸不着北,然后看能否凭运气击败对手,即使自己的策略选择具有不可预测性。

2.混合策略(mixed strategy)与纯策略(pure strategy)

(1)混合策略:参与人策略集上的概率分布,即参与人以随机方式选择策略。假设参与人拥有两个策略,则混合策略可以写成(p,1-p);假设参与人拥有三个策略,则混合策略可以写成(p,r,1-p-r)

(2)纯策略:参与人以非随机的方式选择策略,其实,纯策略是一种特殊的混合策略。纯策略其实就是指博弈矩阵旁边标示的策略,或者说参与人策略集中所包括的策略。

3.参与人的期望支付

(1)一旦参与人采取混合策略,参与人的支付就必须用期望支付来表示。

(2)一个实例:计算甲乙参加配硬币博弈的期望支付

正面

反面

甲 正面

反面

假设甲选择正面的概率为p ;假设乙选择正面的概率为q 。

EU 甲=(11(1))p q q -?+?-+(1)(1(1)(1))p q q -?+-?-=(21)(12)q p -- EU 乙=(21)(21)q p --

(3)二人博弈中计算期望支付的一般公式

1m

i EU ==∑

甲1n

i j ij

j p q a

=∑

1

m

i EU ==∑

乙1

n

i

j ij

j p q b

=∑

依据:当对手正在进行随机选择时,他一定会选择这样的概率组合,使得我选择任意纯策略

的期望收益均相等,从而使我无从下手,所以我也将进行随机选择,而且我选的概率组合也会使得对手无所适从。于是所有参与人的混合策略就构成了一个纳什均衡。

4.混合策略纳什均衡

(1)混合策略纳什均衡是指这样一个策略组合,每个参与人的混合策略都是针对其他参与人所选择的混合策略的最优反应。相应地,过去所说的纳什均衡就叫纯策略纳什均衡。

(2)如何计算混合策略纳什均衡?

案例1:计算配硬币博弈的混合策略纳什均衡(答案略)

案例2:计算夫妻博弈的混合策略纳什均衡,并且将混合策略均衡下参与人的支付与纯策略情况下的支付进行比较(答案略,注:协调博弈下的混合策略纳什均衡是不稳定的,只要略为偏离该概率分布,参与人的最优反应策略就是纯策略)。

5.两个重要的结论:

纳什定理:任何有限博弈均存在纳什均衡(博弈论最重要的结论之一)。注:有限博弈是指参与人的人数以及参与人的策略集均是有限的。 奇数定理:博弈的纳什均衡一般是奇数个。

6.一个进一步的讨论问题:我为什么要做随机选择?这难道不是意味着我的放弃吗?

解释:Harsanyi (1973)认为参与人混合策略的合理性在于当参与人i 并不清楚参与人j 究竟会选择哪个策略集中哪个纯策略,那么合理的假设也许是假设参与人j 以随机的方式选择纯策略。而参与人i 并不清楚参与人j 的实际选择,乃是因为参与人j 拥有少量的私人信息(也可能是因为随机化(randomization ))。这个解释实际上是认为参与人j 本身其实并没有玩混合策略,只是由于信息不对称的缘故,使得参与人i 应该认为参与人j 在玩混合策略。

五.求解纳什均衡的一般方法——反应函数法 1.博弈标准型表示的严格定义

n 人博弈的标准型表示是,每个参与人的策略集1S …i S …n S ;每个参与人的支付函数(由可称效用函数)1U …i U …n U ;从而可以表示用G ={1S …i S …n S ;1U …i U …n

U }。

其中,i S 可能是有限的,也可能是无限的,记i i s S ∈为i 的一个具体策略;i U 的一般形式为:1(i U s …2s …)n s 。

练习:请用上述一个定义表示囚徒困境,包括写出参与人的策略集以及支付函数。

2.案例:古诺竞争模型

假设该市场上只有两家生产同一产品的企业1和2;市场均衡价格由下式决定:

()P Q a Q =-,其中12Q q q =+,1q 、2q 分别代表企业1和2提供的产量;每家企业i 的

生产成本均为:()i i i C q cq =,且有a c >;两家企业同时选择自己的产量以最大化自己的利润。

问题:两家寡头各自的最优产量应该是多少? 求解:1112max ()q q a q q c π=--- 得一阶条件:121

()2

q a q c =

-- (1) 求解:2212max ()q q a q q c π=---

得一阶条件:211

()2

q a q c =

-- (2) 结合(1)和(2),解方程组有:**

123

a c q q -==

3.反应函数方法的一般做法

首先针对其他参与人的任意策略选择,找出能够使参与人i 支付最大化的策略选择,即参与人i 的反应函数(实际上就是参与人i 的目标函数的一阶条件);联立所有参与人的反应函数,解联立方程组,就可以求出该博弈的纳什均衡。

六.另一种纳什均衡的精炼方法:颤抖手(trembling-hand )纳什均衡——1994年度诺贝尔经济学奖得主selten 的贡献。

1.严格劣策略与弱劣策略的进一步比较

(1)案例:

案例1:囚徒困境

坦白沉默

坦白

沉默

案例2:选课博弈

数学语文

数学

语文

(3)一个非常重要的结论:

例子:在选课博弈中,纳什均衡有哪些?通过剔除弱劣策略所得到的结果是什么?

结论:如果一个博弈存在纳什均衡,则通过反复剔除严格劣策略所得到的占优策略均衡与原博弈的纳什均衡相同,所以,通过反复剔除劣策略方法寻找均衡只能适用于严格劣策略。反复剔除劣策略方法一般不适用于弱劣策略,因为无法保证剔除后所得到的均衡正好等于原博弈的纳什均衡。

能否有一种方法允许参与人剔除弱劣策略?

2. 颤抖手均衡:如果博弈中每个参与人都假定其他参与人会选择最优反应策略,但也有很小的概率犯错误,则每一位参与人都会选择期望支付最大的策略,由此获得的均衡称之为颤抖手均衡。

例子:假设参与人在策略选择中有可能犯错误,但犯错误的概率比较小,而且这一事实是参与人博弈的公共知识。例如,假设每个参与人有90%的可能性选择纳什均衡策略,但有10%的可能性不选择纳什均衡策略,则甲选择语文的期望支付为3.79,而选择数学至少可以得到3.8,所以甲会选择数学。同样,乙选择数学的期望支付是3.98,而选择语文至少可以得到4。由此被保留的均衡就是(数学;文学)

3.颤抖手均衡允许参与人选择弱优策略与最优反应策略,从而可以精炼纳什均衡。实际上,颤抖手均衡属于对纳什均衡进行“确保安全检验”(the fail-safe test),为剔除弱劣策略提供了理由。

七.解决多重纳什均衡中协调问题的一种方法:相关均衡(correlated)——诺贝尔经济学奖得主Aumann贡献(“公共知识”也是他的贡献)。

1.案例:(源自Aumann)

左右

请求解该博弈所有的纳什均衡?

(上,左)、(下,右)以及每个参与人以相同概率选择各自的纯策略,各得期望支付2.5。这是这个博弈的三个纳什均衡。

现在假设甲乙二人事先达成一个协议,甲乙猜拳,二人获胜的概率相同,如果甲赢,则甲选择上,乙选择左;如果乙赢,则甲选择下,乙选择右。请计算在这个转化后的博弈中参与人的支付是多少?甲乙二人有没有积极性违背这个实行约定的行动规则?

2.相关均衡是指参与人事先主动设计某种机制从而确定博弈结局的一种均衡选择,即通过参与人事先能够观测到的共同信号确定博弈的均衡结局。

3.对相关均衡的进一步体会

(1)相关均衡是通过改造原博弈形成新的均衡,即事先确定的博弈规则构成了一个纳什均衡。

(2)从前面的例子可以看出,相关均衡的结果具有公平性。不对称纳什均衡来说,相关均衡的结果具有明显的优势,但是并不是说所有的相关均衡都具有公平性。

(3)相关均衡实际上就是参与人事先形成了一个联盟,以集体方式随机地选择策略,而且该联盟的集体策略是由每个人的最优反应策略构成的,即联盟的协定具有自我约束力。

(4)相关均衡是非合作博弈的一种新的解的形式,即相关均衡是非合作均衡。相关均衡提高了联盟在非合作博弈中的地位。在非合作博弈中,通常难以形成有约束力的联盟,但在存在多重纳什均衡的博弈中,联盟是有可能形成的,关键是联盟的协定要构成纳什均衡。

第二章 完全信息静态博弈的基本理论

第二章完全信息静态博弈的基本理论 0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈 完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。 特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。 一.求解方法之一:剔除严格劣策略 1.占优策略与劣策略。 严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。 弱占优策略与弱劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付不低于b策略,且至少有一种情况下的支付会严格大于b策略,则称b策略是相对于a策略的弱劣策略(weakly dominated strategy );a策略则是相对于b策略的弱占优策略(weakly dominating strategy)。 占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。 特别提示:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。类似地,可以定义局部劣策略与全局劣策略。 理性的人在博弈时绝对不会选择严格劣策略。通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。 2.案例 案例1 乙 甲坦白 不坦白

1.完全信息静态博弈实验指南(2020)

西方经济学实验一:完全信息静态博弈实验指南 一、博弈论概述 博弈论(game theory)又被称为“对策论”、“赛局论”。博弈论是研究相互依赖、相互影响的决策主体的理性决策行为及这些决策的均衡结果的理论。 博弈主要包括局中人、行动、信息、战略、支付(效用)、结果和均衡等要素,其中,局中人、战略和支付是描述一个博弈所需的最少要素。局中人、行动和结果统称为“博弈规则”。 (1)依据博弈参与者相互作用时能否达成一个具有约束力的协议,可将博弈分为合作博弈和非合作博弈。如果有具有约束力的协议,就是合作博弈;如果没有,就是非合作博弈。 (2)依据博弈局中人行为的时间序列性,可将博弈分为静态博弈、动态博弈两类。静态博弈是指在博弈中,局中人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 (3)按照局中人对其他局中人的了解程度,可将博弈分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中,每位局中人对其他局中人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果局中人对其他局中人的特征、策略空间及收益函数信息了解得不够准确,或者不是对所有局中人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。 目前经济学家们所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博理论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈可分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,其对应的均衡概念和理论研究的代表人物如表1所示。 (1)纳什均衡 纳什均衡(Nash equilibrium)的核心思想是:博弈的理想结局是,每个局中人选择的策略是对其他局中人所选策略的最佳反应,其中每一个局中人都不能因单方面改变自己的策略而获益。 纳什均衡有一个很重要的特点,是可以自我实施的,即信念和选择之间的一致性。就是说,基于信念的选择是合理的,同时支持这个选择的信念也是正确的。如果所有人都认为这个结果会出现,这个结果就真的会出现。 如果局中人事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳

完全信息静态博弈及其纳什均衡解

1 第四章 完全信息动态博弈及其均衡解 1.完全且完美信息动态博弈 完全信息博弈指的是参与者的收益是共同知识。 完全且完美信息动态博弈指的是:博弈中的每一步中参与人都知道这一步之前博弈进行的整个过程。因此,我完全且完美信息动态博弈的特点:(1)行动是顺序发生的;(2)下一步行动选择之前所有以前的行动都可以被观察到;(3)每一可能的行动组合下的参与人的收益都是公共知识。 而不完美信息博弈指的是,在某一步参与人不知道以往博弈所进行的历史或者没有观察到以往的所有行动。 例4.1.我们来考虑这样一个动态博弈: 假定甲在开采一个价值4万元的金矿时需要1万元资金,乙有1万元资金。甲向乙借钱来开金矿。在这个博弈的第一阶段,甲向乙承诺: 如果乙借钱给他的话,那么他就会将采到的金子与乙对半分成,即(2,3)——乙得到2万元的金子,同时收回自己的1万元投资。对于甲的承诺,乙如果不借钱给甲的话,那么博弈到此为止,双方收益为(0,1)。如果乙借钱给甲的话,那么博弈进入第二个阶段。在第二阶段中,若甲遵守他的承诺,分给乙一半的金子,这样两人的收益为(2,3),其中1万元为投资成本。〖JP3〗然而,若甲违背自己的承诺,博弈就会进入到第三个阶段: 如果乙同甲打官司,那么由于打官司费时费力, 两个人的收益为(0,1);若乙不打官司,那么两个人的收益就为(5,0)。参见图1。 乙 借 不借 甲 分 不分 (0,1) 乙 乙 (2,3) 打官司 不打官司 (1,2) (5,0) 图1. 借钱博弈的博弈树 2.逆向归纳法与子博弈纳什均衡解 逆向归纳法(Backward induction )又称逆推法,是指这样一种动态博弈求解方法:从博弈的最后一步开始,计算最后一步的参与人的最优行动,逐步逆推到博弈开始时进行第一步的参与人的最优行动,从而确定每个参与人的最优行动。 在动态博弈中逆向归纳法能够进行的前提:参与人是理性的——任何一步参与人都选择 甲乙

不完全信息下的静态博弈习题

非完全信息静态博弈习题 1、考虑下面的Cournot 双头垄断模型。市场的反需求函数为Q a Q p -=)(,其中21q q Q +=为市场总产量,两个企业的总成本都为()i i i cq q c =,但需求却不确定:分别以θ的概率为高(H a a =),以θ-1的概率为低(L a a =),此外,信息也是非对称的:企业1知道需求是高还是低,但企业2不知道,所有这些都是共同知识,两企业同时进行决策。 要求:假定H a 、L a 、θ和c 的取值范围使得所有均衡产出都是正数,试问此博弈的贝叶斯纳什均衡是什么? 解: 在市场需求为高时,企业1的最优战略为: ()H H H q c q q a Max 121?--- 由一阶条件可以推出2 21c q a q H H --= (1) 在市场需求为低时,企业1的最优战略为: ()L L L q c q q a Max 121?--- 由一阶条件可以推出2 21c q a q L L --= (2) 企业2的最优战略为 ()()(){}2212211q c q q a q c q q a Max L L H H ----+---θθ 由一阶条件可得: ()()()211*2c q a q a q L L H H ---+=-θθ (3) 方程(1)、(2)和(3)联立可得: ()()()()6 21311*1c q a q a q L L H H H ------=θθ ()6 22*1c a a q H L L --+=θθ ()31*2c a a q H L -+-=θθ 由此可知,企业1的战略()*1*1,L H q q 和企业2的战略* 2q 构成贝叶斯纳什均衡。

几个博弈案例

几个博弈案例 1.囚徒困境 警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。问:两个罪犯会如何选择(坦白还是抵赖)? 2.智猪博弈(占优战略均衡) 猪圈里有一头大猪,一头小猪。猪圈的边缘有个踏板,每踩一下,远离踏板的投食口就会落下少量食物。如果是小猪踩踏板,大猪会在小猪跑到食槽之前吃光所有食物;若是大猪踩踏板,则小猪还有机会吃到一点残羹冷炙,因为小猪食量小嘛。那么,两头猪会采取什么策略呢?答案是:小猪将安安心心地等在食槽边,而大猪则不知疲倦地奔忙于踏板和食槽之间。办公室里也会出现这样的场景:有人做“小猪”,舒舒服服地躲起来偷懒;有人做“大猪”,疲于奔命,吃力不讨好。但不管怎么样,“小猪”笃定一件事:大家是一个团队,就是有责罚,也是落在团队身上,所以总会有“大猪”悲壮地跳出来完成任务。想一想,你在办公室里扮演的角色,是“大猪”,还是“小猪”?(其实小猪的决策是明智的,想想同一个公司,小股东和大股东的行为。) 3.性别之争(多重纳什均衡) “有一对夫妻,丈夫喜欢看足球赛节目,妻子喜欢看肥皂剧节目,但是家里只有一台电视,于是就产生了争夺频道的矛盾。假设双方都同意看足球赛,则丈夫可得到2单位效用,妻子得到一单位效用;如果都同意看肥皂剧,则丈夫可得到1单位效用,妻子得到2单位效用;如果双方意见不一致,结果只好大家都不看,各自只能得到0单位效用。这个博弈的策略式表达如下:

不完全信息静态博弈案例 扶老人 林志涵

让道德与理性同行 ——不完全信息静态博弈案例分析 2012333501054 林志涵 12经济学1班 摘要:通过简单的博弈论分析方法对日常生活中具有现实意义的社会现象进行分析,从而在理性人假设的前提下,在各种因素的影响下,在个人取得利益最大化的同时,通过政策或法律的有效实施来使得道德能得到发扬提倡。 关键词:不完全信息静态博弈社会现象道德与理性 不完全信息静态博弈 在不完全信息静态博弈里,参与人并不完全清楚有关博弈的一些信息,所有参与人在共同决策环境中同时选择行动策略,每个参与人只选择一次。 纳什均衡,在给定的其他参与人选择的前提下,参与人根据自身收益选择的最优战略。 1.背景: “除非有人证物证,否则我不会再去扶跌倒的老人!”广东肇庆的阿华在扶起倒地的70多岁阿婆却遭诬陷后表示。事发7月15日早上,阿华开摩托车上行人道准备买早餐,看到路边有位老太太跌倒在求救,阿华立刻停下来,扶起老奶奶,殊不知却遭到阿婆的诬陷,随后和阿婆的女婿发生争执。阿婆被送到医院住院观察。为调查真相,交警暂扣了阿华的摩托车。事发后几天,阿华说没睡过一次好觉,还向单位请了几天假,天天在附近找证人,就是为了证实自己清白。 这一案件的真想不言而喻,老婆婆家人蛮不讲理地要求赔偿和阿华地好心搀扶倒地老婆婆形成了鲜明的对比,好心被当驴肝肺的事情就这么真真实实的发生在了我们的身边,社会风气遇到了极大的挑战,这引发了社会各界针对这一事件的激烈讨论。到底该不该扶?本文将在经济人假设的前提下,通过不完全信息静态博弈的思想进行分析阐述,并探讨我们如何通过一系列客观因素的影响,来使得利益与道德同行。 2.博弈的假设与建模: 假设: ①参与博弈的双方是理性人,都会选择个人利益最大化的行动。 ②假设阿婆在未有人搀扶时便决定是否坑钱,而路人并不知道阿婆是否会坑钱,即参与人在决策时不知道对方的策略同时也并不知道对方能够的收益函数。 ③假定当事人双方最终解决方法由交警决定,当事人将面临交警正确处理和错误处理两种。 参与人:阿婆、路人 行动选择:路人——帮忙扶起、不帮忙扶起 阿婆——被扶起后坑钱、不坑钱 3.支付收益: 1)在不考虑交警是否正确判断因素下,阿婆倒地没人扶会有-10的身体伤 害,在阿婆不坑钱的情况下仍然没有人扶会多产生负收益-10的心灵损 失(路人不知道阿婆是否坑钱);路人选择帮忙且阿婆不坑钱会产生10

完全信息静态博弈

博弈论第二章练习 8.设股诺模型中有n家厂商,qi为厂商i的产量,Q=q1+……+qn为市场总产量。P为市场出清价格,且已知P=P(Q)=a-Q(当Qa+ C1,则纳什均衡产量又为多少? 答:当情形变为两个厂商,则利润分别为 u1=Pq1-c1q1=(a-q1-q2)q1-c1q1 u2=Pq2-c2q2=(a-q1-q2)q2-c2q2 对q求导并令其为0得 a-q1-c1-2q1=0 a-q2-c2-2q2=0 反应函数为q1=(a-q2-c1)/2 q2=(a-q1-c2)/2 若0a+c1时,q2<0,厂商1垄断了市场,此时纳什均衡产量为q1=q*=(a-c1)/2 思考题:卡特尔能够持久存在吗?为什么石油输出国组织能长期维持? 答:(1)我认为卡特尔不能持久存在。 因为有两个因素导致了卡特尔具有天然的不稳定性: 第一,潜在进入者的威胁:一旦卡特尔把价格维持得较高水平,那么就会吸引新企业进入这个市场,而新企业进入后,可以通过降价扩大市场份额,此时卡特尔要想继续维持原来的高价就很不容易了。 第二,卡特尔内部成员所具有的欺骗动机:这是一个典型的“囚徒困境”,给定其他企业的生产数量和价格都不变,那么一个成员企业偷偷地增加产量将会获得额外的巨大好处,这会激励成员企业偷偷增加产量,如果每个成员企业都偷偷增加产量,显然市场总供给大量增加,市场价格必然下降,卡特尔限产提价的努力将瓦解。如果卡特尔不能有效解决这个问题,最终将导致卡特尔的解体。事实上,经济学家研究得出,世界上卡特尔的平均存续期间约为6.6年,最短的两年就瓦解了 此外,随着各国政府反垄断法的实施,卡特尔也可能因为违反了政府法

不完全信息静态博弈

第八章 不完全信息静态博弈 这一章里我们讨论不完全信息静态博弈,也称为贝叶斯博弈(Bayes)。不完全信息博弈中,至少有一个参与者不能确定另一参与者的收益函数。非完全信息静态博的一个常见例子是密封报价拍卖(sealed —bid auction):每一报价方知道自己对所售商品的估价,但不知道任何其他报价方对商品的估价;各方的报价放在密封的信封里上交,从而参与者的行动可以被看作是同时的。静态贝叶斯博弈问题的主要来源也是现实经济活动,许多静态博弈关系都有不完全信息的特征,研究贝叶斯博弈不仅是完善博弈理论的需要,也是解决实际问题的需要。 8.1 静态贝叶斯博弈和贝叶斯纳什均衡 为了更好的说明不完全信息与完全信息之间的差异,我们用一个典型静态贝叶斯博弈作为例子,自然的引进静态贝叶斯博弈概念。 8.1.1不完全信息古诺模型 考虑如下两寡头进行同时决策的产量竞争模型。其中市场反需求函数由Q a Q P -=)(给出,这里21q q Q +=为市场中的总产量。企业1的成本函数为1111)(q c q C =,不过企业2的成本函数以θ的概率为222)(q c q C H =,以θ-1的概率为222)(q c q C L =,这里H L c c <。并且信息是不对称的:企业2知道自己的成本函数和企业1的成本函数,企业1知道自己的成本函数,但却只知道企业2边际成本为高的概率是θ,边际成本为低的概率是 θ-1(企业2可能是新进入这一行业的企业, 也可能刚刚发明一项新的生产技术)。上述一切都是共同知识:企业1知道企业2享有信息优势,企业2知道企业1知道自己的信息优势,如此等等。 现在我们来分析这个静态贝叶斯博弈。一般情况下,企业2的边际成本较高时选择较低的产量,边际成本较低时,选择较高的产量。企业1从自己的角度,会预测到企业2根据其成本情况将选择不同的产量。设企业1的最佳产量选择为*1q ,企业2 边际成本为H c 时的最佳产量选择为)(*2H c q ,企业2 边际成本为L c 时的最佳产量选择为)(* 2L c q ,如果企业2的成本较高,它会选择)(*2H c q 满足: 22*1])[(max 2q c q q a H q --- 类似地,如果企业2的成本较低,)(*2L c q 应满足: 22*1])[(max 2q c q q a L q --- 从而,企业l 为了使利润最大化,选择*1q 应满足: }])()[(1(])([(max {11*2111*212q c c q q a q c c q q a L H q ----+---θθ 三个最优化问题的一阶条件为: 2)( ,2)(*1*2*1* 2L L H H c q a c q c q a c q --=--=

完全信息静态博弈例子(作业)

例1:完全信息静态博弈在银行监管中的应用 一、完全信息静态博弈模型的建立 (一)博弈的参与人 商业银行(监管对象)作为理性经济人,其行为动机是部门、个人利益最大化。但由于在管理体制、经营方式、技术手段、人员素质、资产质量与外资银行之间存在差距,其经营难度和盈利能力都会受到不利的冲击。在遵循一定条件下的预期效用最大化的原则下,商业银行有足够的动力进行违规操作,例如私自变动利率或进行不符合政策的违规金融创新,借以获得竞争优势,实现最大化效用。 银监会作为监管者,通过行使行政管理、现场检查、非现场检查以及违规处罚等监管权力,对商业银行的市场准入和退出,日常业务营运等进行指导、监督、管理。而在目前市场经济没有完善的条件下,无论是现场检查还是非现场检查,都存在监管工作量大,连续性强的特点。因此,实行严格监管策略有着较高的成本:监管费用增加,监管机构“暗箱”操作增长,创造经济租金使商业银行寻租行为增多,商业银行内部创新能力削弱等等。监管成本的增加可能会超过市场交易成本。 (二)博弈的假设前提 (1)银监会的策略空间为严格监管和宽松监管;(2)银监会在进行严格监管工作时,有成本支出。当商业银行违规经营时,可采用罚款、取消高级人员资格等措施。但在商业银行合规经营时,银监会宽松监管会带来收益;(3)商业银行的策略空间是违规经营和合规经营;(4)商业银行合规经营时,无论监管者监管与否,商业银行都将得到自己的正常收益;(5)商业银行违规经营的期望收益是违规所得,其在违规经营中将获得超额利润,但在银监会严格监管的条件下也将付出成本。 注:R1、R2分别是银监会宽松监管,商业银行合规经营的正常收益。A为银监会采取监管措施所花费的成本;B为银监会在商业银行违规经营情况下,采取宽松监管所遭受的损失;C 为商业银行在违规经营条件下受到严格监管所造成的损失;M为银监会采取宽松监管,商业银行违规经营所获得的超额收益。其中A,B,C都与M成正相关。P为银监会严格监管的概率,1-p 是银监会宽松监管的概率;q是商业银行合规经营的概率,1-q是商业银行违规经营的概率。 二、博弈模型的分析 当商业银行合规经营时,银监会宽松监管的收益大于严格监管的收益,所以其最优选择是采取宽松监管;当商业银行违规经营时,银监会是采取严格监管还是宽松监管主要取决于A与B的比较。当A>B时,银监会采取宽松监管,商业银行的最优选择则是违规经营;当AB时,不管M与C的大小如何,银监会与商业银行之间存在纯策略纳什均衡(宽松监管,违规经营)。 其含义为:银监会采取严格监管措施付出的成本大于商业银行违规经营对其造成的损失

相关主题
文本预览
相关文档 最新文档