当前位置：文档之家› 博弈分析及其应用

博弈分析及其应用

1引言

在社会生活和经济、军事活动中，经常碰到各种各样具有竞争或利益相对抗的现象，如下棋、打扑克、为争夺市场展开的广告战、军事斗争中双方兵力的对垒等，竞争的各方总是希望击败对手，取得尽可能好的结果，都想用自己最好的战术去取胜，这就是博弈现象．博弈现象实际上是一类特殊的决策，在关于不确定型的决策分析中，决策者的对手是“大自然”，它对决策者的各种策略不产生反应，更没有报复行为．但在博弈现象中，代替“大自然”的是有理性的人，因而任何一方做出决定时都必须充分考虑其他对手可能作出的反应．博弈论的英文名为Game Theory，又称对策论，用比较简短的话来概括，所谓博弈是指局中人按一定规则，在充分考虑其他局中人可能采取的策略的基础上，从自己的策略集中选取相应策略，并从中得到回报的过程．尽管博弈论中研究的问题形形色色，但任何一个博弈问题都包含下列三个要素：

1．局中人（players）是指参与竞争的各方，它可以是一个人，也可以是一个集团，但局中人必须是有决策权的主体，而不是参谋或从属人员．局中人可以有两方，也可以有多方．当存在多方的情况下，局中人之间可以有结盟和不结盟之分．

2．策略（strategies）是指局中人所拥有的对付其他局中人的手段、方案的集合．在静态博弈中，策略必须是一个独立的完整的行动，而不能是若干相关行动中的某一步．例如一次乒乓球男子团体比赛中，包括两名单打和一对双打选手出场，比赛前提交的名单除规定出场球员姓名之外，两名单打还必须明确谁是第一单打，谁是第二单打，这样不同单打和双打队员的出场搭配以及两名单打队员的不同排序构成了不同的策略．相应每个局中人的策略选择形成的策略组称为一个局势．

3．收益函数（payoff function）指一局博弈后各局中人的输赢得失，通常用正的数字表示局中人的赢得，负的数字表示局中人的损失．

博弈论研究决策主体的行为在发生直接相互作用时，人们如何进行决策以及这种决策的均衡问题．博弈论是研究理性的决策之间冲突与合作的理论．在博弈论分析中，一定场合中的每个对弈者在决定采取何种行动时都策略地、有目的地行事，他考虑到他的决策行为对其他人的可能影响，以及其他人的行为对他的可能影响，通过选择最佳行动计划，来寻求收益或效用的最大化．由于在现实生活中人们的利益冲突与一致具有普遍性，因此，几乎所有的决策问题都可以认为是博弈．博弈论在政治学、军事学、生物进化学、心理学、社会学、伦理学、经济学等许多领域都有着广泛的应用．在经济学中博弈论作为一种重要的分析方法已渗透到几乎所有的领域，每一领域的最新进展都应用了博弈论，博弈论已经成为主流经济学的一部分，对经济学理论与方法正产生越来越重要的影响．正因为如此，1994年瑞典皇家科学院决定将诺贝尔经济学奖授予了纳什（John Nash）、哈萨尼（John Sanyi）和泽尔腾（Reinhard Selten）三位博弈理论家和经济学家，表彰他们在博弈论理论和应用研究方面作出的杰出贡献．目前博弈论在定价、招投标、谈判、拍卖、委托–代理以及很多重要的经营决策中得到应用，它已成为现代经济学的重要基础．

博弈中有关局中人的策略集、收益函数等构成了博弈的信息．按局中人对信息掌握情况，可区分为完全信息博弈和不完全信息博弈．按局中人采取行动的次序，当同时采取行动或在

互相保密情况下采取行动，称这种情况为静态博弈．如果局中人采取行动有先后，后采取行动的人可以观察到前面人采取的行动，则属于动态博弈．综合上述，博弈可分为完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈和不完全信息动态博弈．当然按局中人是否结盟情况，博弈还可区分为合作博弈和非合作博弈．

合作博弈是一种解决多利益主体协调行动产生效益分配问题的有效数学模型．合作是指参与者从自己的利益出发，选择行动，但选择行动的结果对各方都有利．合作博弈研究的问题就是要找到一种效益分配方式，能促使所有利益主体合作．基于合作博弈理论的收益分配是希望通过联合从事某项活动，使每个人的收益比单独从事这项活动或作小范围联合时的收益多．

当代世界，合作与竞争共存成为时代的主题，而企业间各种形式的合作联盟更成为当今经济界竞争的热点模式．组成合作联盟进行合作创新已经成为越来越多企业的选择．在社会活动中的若干实体，为了在日益激烈的竞争中争得一席之地，也为了获得更多的经济或社会效益，相互合作结成联盟或集团．这种合作通常是为了利益，是非对抗性的，确定合理分配这些效益的最佳方案是促成合作的前提．

2 多人合作博弈概念

在日常生活及社会经济活动中，一个人（或集团）为了克服自身弱点（如力量或财力有限），寻求与他人（集团）进行合作，结成一个联盟，以完成单个人或集团所不能完成的事，这就是多人合作博弈．该联盟一旦形成，就作为一个整体共同采取行动，其目标是使联盟获得最大利益．一旦博弈完毕，可以根据某种事先商定的契约以及各个局中人本身的贡献大小，分配共同所得的利益．

联盟的数学定义是：设有n 个局中人{}n N ,,2,1 =进行博弈，所谓一个联盟就是N 的

一个非空子集S ．为方便起见，有时称空集?也是一个联盟．n 个局中人共能形成n

2个联盟．

一旦联盟S 形成，组成联盟S 的局中人不再关心自己的特殊利益，而为整个联盟的最大利益去努力．因此，他们主要关心联盟S 所能获得的最大值．所有联盟S 所获得的最大值都确定以后，整个博弈就完全清楚．这样的博弈可以用特征函数加以描述：

定义1[]

1：给定{

}n N ,,2,1 =，合作n 人博弈记为[]v N ,=Γ，N 上的特征函数v 是定义在N

2上的实值函数，满足：

()0=?v ，

()()()N T S T S T v S v T S v ??=+≥,,, . （1）

对于一个联盟S ，()S v 的值可以通过下列方式获得：S 中局中人形成联盟为使S 获得最大利益而努力，这时最糟的情况是剩下的所有局中人S N -形成一个联盟和S 抗衡，这

样可看成是两个局中人S 与S N -在进行非合作博弈，

()S v 就是在上述两人非合作博弈中，S 所获得的最大收入．

对于合作博弈，局中人之间可以相互协商，共同采取使全体都有利的策略，如果某些局

中人对采取某些特定策略不满意，可以事先订立契约，等博弈完了以后再进行补偿，以便大家共同采取的策略使联盟总体的利益达到最大．因此，博弈完毕后，如何分配共同形成的总体联盟N 所得的收入()N v 就是合用博弈研究的主要任务．

()S v 的一种分配方案由n 维向量{}n x x x X ,,,21 =表示,i x 表示局中人i 的所得．显

然，对每一个局中人i 来说，它至少期望得到的i x 满足：

()N i i v x i ∈≥,. （2）

（2）称为个体合理性条件；还有一个必须满足的条件是：

()N v x

i i

=∑=1

. （3）

（3）称为群体合理性条件．（2）、（3）合到一起就得到一种分配方案．

当所有n 个局中人均参与合作时，{

}n N ,,2,1 =为最大的一个联盟，记()N v 为最大的联盟成果，如何将()N v 分配给各局中人？一个很自然的方法就是依据各局中人给联盟带来的贡献来分配．

设i x 为第i 个局中人从()N v 中获得的分配，n i ,,2,1 =则有：

{}()11v x =，

{}(){}()12,12v v x -=， {}(){}()2,13,2,13v v x -=，

……，

(){}()n N v N v x n --=.

然而上述的分配通常与局中人编号的次序有关，如把局中人1,2,,1, -n n 的编号改为

n ''',,2,1 ，则有新的分配方案：

{}()n v x ='

1，

{}(){}()n v n n v x --='

1,2，

{}(){}()1,2,1,3----='

n n v n n n v x ，

……，

(){}()1--='

N v N v x n .

对于局中人其它编号的次序均有对应的分配方案，由于n 个局中人编号的次序共有!n 种，所以对应的分配方案也有!n 种．为此取各局中人分配的平均值作为局中人的平均贡献．

记()v i ?为第i 个局中人的平均贡献，则有：

(){}()()[]

n i S v i S v n v i

i i ,,2,1,!1 =-=

∑π

ππ?. （4）其中π为由n ,,2,1 组成的所有n 级排列，∑为针对所有的!n 个不同n 级排列求和，

{}i j j S i <=ππ|，显然i S π为排列π中排在i 之前的那些局中人组成的联盟，将满足S

S i

=π排列归为一类，（4）式可以表示为:

()()()(){}()[]n i i S v S v n S S n v S

i i ,,2,1,!

1! =----=∑

∈?, （5）

其中S 为N 中包含{}i 的所有子集，S 为子集S 中局中人的人数．可以证明：

()()N v v n

i i =∑=1

?. （6）

（6）式表明各局中人在联盟中的平均贡献()v i ?之和等于联盟的总“成果”．定义2

[]

3称()()()()()v v v v n ????,,,21 =为合作n 人博弈的Shapley 值.

在多人合作博弈中，利用Shapley 值法解决分配问题是一种比较公正、合理且行之有效

的方法．本文的目的是探讨Shapley 值法在利益分配问题，费用分摊问题，及如何确定组合预测权系数中的应用．下面就通过实例来说明Shapley 值法在这些方面的具体应用．

3 利益分配问题

随着科学技术进步和信息技术的迅速发展，世界市场已由过去的相对稳定变成动态多变的特征，由过去的局部竞争演变成全球范围的竞争．在此情景下，以最快的速度推出产品、以最好的质量、最低的成本和最优的服务满足不同用户的需求成为每个企业认真解决的问题．于是越来越多的企业纷纷寻找合作伙伴，结成联盟，利用各方优势以更好地适应快速变化的市场要求．各企业结成联盟后获得了更大的收益，如何利用Shapley 值把联盟的整体收益合理地分配给各个企业，下面给出一实例．

设现有三家企业A 、B 、C 为了抓住某一市场机遇，决定实施联盟生产某种新产品投入市场，联盟成功后将获得一批可观的收益，现如何用Shapley 值分配这一联盟收益．让我们先看在特定场合单家企业生产或两家联盟生产以及三家联盟生产的收益情况（见表1）．表1

由表中可以看出，两家联盟比单家生产合算，三家联盟比两家联盟合算，按Shapley 值法计算：

()()()20031200

48032402808024013120=?-+?-+-+?=

A ?， ()()()14031280

48032402001202401380=?-+?-+-+?=B ?，

()()()1403

1240

48032802001202801340=?-+?-+-+?=C ?．

4 费用分摊问题

在我国区域经济中中小型制造企业数量很大，行业型企业联盟有利于企业抵御风险、降

低成本、提高市场竞争力．行业型企业联盟中企业协作的形式有多种，基于行业信息网络的行业联合采购是联盟企业协作的重要手段之一．在联合采购中，各采购企业通过合作使得在满足各自采购目标时的采购总费用()Y 小于各采购企业单独采购时的采购总费用()X ，每个采购企业都希望自身分配的收益越大越好，分摊的联合采购成本费用越少越好．下面就用Shapley 值法对联合采购费用进行合理分摊计算．

先给出一些符号定义：

()S C ：联盟S 的总采购费用；

{}m M ,,2,1 =：企业采购物资的集合；

()M N n R y y y ?∈=,,1 ：其中M N R ?是联盟N 购买的所有物资的集合，()M im i i R y y y ∈=,,1 ，其中ij y 是企业i 购买物资j 的数量，M j N i ∈∈,；

()y p j ：购买第j 种物资，数量为y 时的价格；

()k f i ：

企业i 采购物资k 次时的交易费用，()k f S 为联盟S 联合采购k 次的交易费用．物资采购中，采购费用包括采购的交易费用和采购物资的实际费用两部分．采购的交易费用是指一次物资采购中，采购主体（单个企业或行业采购中心）发布消息、组织招投标等进行辅助交易的费用，而采购物资的实际费用是指采购物资的实际数量和实际采购价格之积．

行业联合采购中，联盟S 的采购总费用为：

()()()∑=?+=m

j j S j S j S S y y p k f S C 1

．（7）

对所有的联盟S 都算出()S C ，就得到行业联合采购的一个n 人合作博弈()C N ,． Shapley 值法的行业联合采购的费用分摊计算公式为：

()()(){}()[]∑

?∈----=

S S i i i S C S C n S S n U !

1!．（8）

（8）式中i U 表示企业i 联合采购时的分摊采购费用，{}()i S C -表示企业i 没有加入联盟S 时的采购费用，(){}()[]i S C S C --表示企业的边际费用（也称可分离费用），即企业

i 加入到联盟S 中至少应承担的费用（最小分摊费用）．

下面举一实例说明Shapley 值法在行业联合采购中的费用分摊计算．

某行业型企业联盟中有四家企业拟联合采购两类物资，假定企业独自均能采购这两类物资并可任意结盟进行联合采购．描述如下：

{}4,3,2,1=N ：局中人为四家企业； {}B A M ,=：有两类采购物资；

()N P 为：(){}{}{}{}{}{}{}{}{}{}{,4,3,4,2,3,2,4,1,3,1,2,1,4,3,2,1=N P

{}{}{}{}}4,3,2,1,4,3,2,4,2,1,3,2,1．

对每一个联盟()N P S ∈，其采购费用函数()S C 可由（7）式算出．在本实例中，不失一般性，假定企业单独采购或联盟联合采购均能一次采购完所需物资，并且四个企业单独采购的交易费用均相等，即：

()()()()200011114321====f f f f 元．（9）

而所有联盟的采购费用也相等，即：

()30001=S f 元，()N P S ∈且1>S ．（10）

在本实例中，不失一般性，价格函数()y p j 假定为购买数量的线性函数，其表达式为：

()?

??≥<<-≤=max

min max min min max ,

,,j j j j j j j j j y y P y y y y a b y y P y p ．（11）

式中，max j P 和min j P 分别是第j 种物资在最小购买量()min j y 和最大购买量()

max j y 时的最高、最低价格．本实例中，设min max min max ,,,A A A A y y P P 分别为90元、60元、160单位和40单位，

min max min max ,,,B B B B y y P P 分别为100元、60元、150单位和50单位．因此可分别算出物资

B A 、的价格函数：

()???????≥<<-≤=160,6016040,410040,90y y y y y p A ，()??

?????≥<<-≤=150,

6015050,5

212050,

100y y y y y p B ．（12）

因此可算出所有联盟()N P S ∈的采购费用如表2所示．

续表2 各种联盟采购物资数量（单位）及采购费用（元）表

利用Shapley 值法计算公式（8）求行业联合采购的费用分摊，得：

()()()+?-+-+-+=

49700182404900161007700117604134151U ()()()()4

167752220034130401897515140205751160018815-+?-+-+-

08.8742=

同理可得，08.48372=U ，75.27433=U ，09.5877

4=U ．由此可以看出，对联盟贡献少（采购物资少）的企业分摊的采购费用相对较少，将获得更多

收益，因此是一种根据企业对联盟贡献大小来分摊费用的方法．

5 组合预测权系数的确定

预测是根据以往及现在的已知信息，采取一定的方法或技术，对事物的未来发展趋势和结果进行估计或推测．组合预测就是综合利用各种预测方法所提供的信息，以适当的加权平均形式得出组合预测模型．组合预测最关心的问题就是如何求出加权平均系数，使得组合预测模型更加有效地提高预测精度．

设某社会经济现象的指标序列的观察值为{}M t x t ,,2,1| =，设有n 个单项预测方法

对其进行预测，n 个单预测方法用{}n N ,,2,1 =表示，则N 为组合预测方法的局中人集合．N 中的任一子集N S 2∈形成组合预测方法的一个联盟，若干个局中人结成联盟后，这个联盟作为一个整体进行组合预测就是希望尽可能多的降低组合预测误差，本文采用误差平方和这个指标来反映预测精度．

设it x 为第t 时刻的预测值，记it t it x x e -=为第i 种预测方法在第t 时刻的预测误差，

n i ,,2,1 =，M t ,,2,1 =．

设nt n t t t x l x l x l x

+++= 2211?为t x 的组合预测值，n l l l ,,,21 为各种预测方法的加权系数，且满足

n i l l

i n

i i

,,2,1,0,11

=≥=∑=．设t e 为第t 时刻组合预测误差，则有：

()∑∑===-=-=n

i it i n

i it t i t t t e l x x l x

x e 1

?．（13）组合预测模型的误差平方和为：

()∑∑∑∑======M t n i n

j jt it j i M t t e e l l e N J 111

．（14）

记m

m M t jt it e e E ?=??? ??=∑1，()T

n l l l L ,,,21 =,()n T I ?=11,,1,1 ,称矩阵E 为组合预测模

型的误差信息矩阵，称L 为组合预测模型加权系数向量，则以组合预测误差平方和的非负

权最优组合预测模型可写为：

()??

???≥==01

min L L I EL L N J T

T （15）令()()S J S v -=，()S v 为特征函数，()S J 表示联盟S 进行组合预测所得的预测误差平方和，()S v 表示()S J 相反数．

因为预测误差平方和越大，预测精度越低，所以()S v 越大，表明预测精度越高．由Shapley 值即可计算第i 种单项预测方法同联盟合作的平均贡献()v i ?，考虑到()N v 为误差平方和的负值，需将()v i ?做如下归一化处理可得组合预测的加权系数n l l l ,,,21 ：

()()()()

∑==

j j i i v N v v N v l 1??，n i ,,2,1 =．（16）

显然它们满足

n i l l

i n

i i

,,2,1,0,11

=≥=∑=．

组合预测权系数确定的合作博弈方法计算步骤：

1）根据组合预测误差信息矩阵对角线上的元素，采用某种正权组合方法，如方差倒数加权法，均方差倒数加权法等给出初始的组合预测权系数的估计．

2）根据（14）式计算各种联盟合作的特征函数．

3）根据（5）式计算各种预测方法的所获得的平均分配，即Shapley 值．

4）根据（16）式对各种单项预测方法的所获得的平均分配做归一化处理即得组合预测权系数．

下面用一实例来说明．

设某组合预测问题有{}3,2,1=N 三种单项预测方法组合而成．其预测误差的信息矩阵为：

()????

?????==?6454435383

3ij e E

其中332211,,e e e 分别是3,2,1这三种单项预测方法的预测误差平方和．本例采用方差倒数加权法，其一般计算公式为：

()()

1221

111

1121,,,,,,----=-?

??=∑nn

n i ii n e e e

e l l l ．（17）所以按照（17）式3,2,1这三种单项预测方法在组合预测中的加权系数为：

()??

??=??? ????? ??++=-134136133614181614181,,1

321l l l ．

再按照（15）式得

()3314.4134136133645443538134136133=??

? ??????

????????? ??=T

N J ，

即()()3314.4-=-=N J N v ，同理，采用方差倒数加权法可得

{}()9172.12,1-=v ，{}()7041.13,1-=v ，{}()5562.23.2-=v ， {}()81-=v ，{}()42-=v ，{}()63-=v

按照（5）式计算得：

()()()[]()()[]3

267041.149172.11381?---+---+?-=

v ?

()()3196

.23

15562.23314.4-=?---+

．

同理可得

()6213.02-=v ?，()5859.13-=v ?．

按（16）式计算组合预测加权系数得：

16139.01=l ，60255.02=l ，23606.03=l ．

所以

()()?????

?????=64544353823606.060255.016139.0N J

()09734.423606.060255.016139.0=T

．

若3,2,1这三种单项预测方法按（15）式利用Mathlab 软件包可求得最优组合预测加权系数得：

1667.01=*l ，8333.02=*

l ，03

=*l ．对应的最小的预测误差平方和：

()8333.3=*N J ．

由此可见，本例用Shapley 值法确定的组合预测加权系数明显优于用方差倒数加权法确

定的，且与最优组合预测方法预测精度很接近．该方法不仅适用于以误差平方和为准则的组合预测模型，而且适用于基于预测有效度的组合预测模型．

6 结束语

本文主要阐述了解决多人合作博弈中联盟分配问题的一种方法——Shapley 值法．举例说明此方法在利益分配问题，费用分摊问题，以及组合预测权系数的等方面中有着较好的应用，而且利用Shapley 值法解决这些方面的问题具有一定的公正性和合理性和一定的实用价值．

但是，从理论上来说，在多人合作博弈中，如果局中人数量越多，在利用Shapley 值法计算时需要的信息量也就越大，也从不同程度上加大了计算量．因此，在实际应用中，是否采用Shapley 值法来分配联盟的收益也要根据具体问题而确定．

致谢：感谢盛宝怀老师的悉心指导！

博弈论案例分析

博弈论博弈论（Game Theory），亦名―对策论‖、―游戏理论‖，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自选择的行为或是策略进行选择并加以实施，并从各自取得相应结果或收益的过程，在经济学上博奕论是个非常重要的理论概念。什么是博弈论？古语有云，世事如棋。生活中每个人如同棋手，其每一个行为如同在一张看不见的棋盘上布一个子，精明慎重的棋手们相互揣摩、相互牵制，人人争赢，下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们―出棋‖ 招数中理性化、逻辑化的部分，并将其系统化为一门科学。换句话说，就是研究个体如何在错综复杂的相互影响中得出最合理的策略。现在，我们就一些例子来讨论博弈论相关内容。一、从“囚徒困境”开始在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的―囚徒困境‖（prisoners’ dilemma）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。表囚徒困境博弈 [Prisoner's dilemma] 我们来看看这个博弈可预测的均衡是什么。对A来说，尽管他不知道B作何选择，但他知道无论B选择什么，他选择―坦白‖总是最优的。显然，根据对称性，B也会选择―坦白‖，结果是两人都被判刑8年。但是，倘若他们都选择―抵赖‖，每人只被判刑1年。在表2.2中的四种行动选择组合中，（抵赖、抵赖）是帕累托最优的，因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出，―坦白‖是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占优战略均衡。要了解纳什的贡献，首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲―囚犯的两难处境‖的例子，每本书上的例子都大同小异。话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人，斯卡尔菲丝和那库尔斯，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

博弈论在管理制度中的应用

博弈论在管理中的应用

————————————————————————————————作者：————————————————————————————————日期：

博弈论在管理中的应用不知道大家有没有为这些事情困惑过：为什么员工技能竞赛，技能比拼很难开展，即便开展了，为什么工作效率也没有像预想的那样提高？为什么企业中总有些人拖大家的后退而不努力工作？为什么有的领导手段强硬，有的领导风格怀柔？你是否为“办公室政治”烦恼不已？你有没与遇到过和你看法不一致，总是与你针锋相对的下属？遇到强硬的下属你该怎么办？为什么酒店联盟或者企业间的联盟总是很难做？你是否在做决策之时衡量反复却不知道选择何种策略？。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理？你如何提出科学而又合理解决方法？以上种种问题，你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识，并以隐藏在我们身边的博弈为例子，给大家提供解决某些实际问题的思路。那么什么是博弈论呢？所谓博弈论，就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式，既谋略性思考问题的方式。对博弈论通俗的理解就是，关于人与人的斗争中“老谋深算”的学问。假如你正跟恋人用手机通电话，突然信号断了。这时你是会立即拨电话过去，还是等你的恋人拨电话过来？很显然，你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨，那么另一方最好是等待；如果一方等待，那么另一方最好拨过去。如果双方都拨，那么就会出现线路忙；如果双方都等待，那么时间就会在等待中消逝。这，就是博弈。

基于博弈论的夫妻冲突分析

一个女人能有多美，通常是由与她相伴的男人来决定；一个男人能走多远，往往是由与他相随的女人来决定。夫妻之间的物质生活水平，通常是由收入较高的一方来决定；夫妇之间的精神生活水平，往往是由素质较低的一方来决定。囚徒困境在囚徒困境这个例子中，两个囚犯的上策都是坦白，因此最容易出现的结局也就是两人都被判5年。这个结局构成了一种博弈均衡状态，当对局者选择的都是上策的时候，这种均衡叫做上策均衡。在博弈论中，所谓均衡是指一种稳定的结局，当这种结局出现的时候，所有对局者都不想再改变他们所选择的策略。二．情侣冷战对峙现将囚徒困境的报酬矩阵分析引入到一对情侣的冷战对峙中，见下图： H表示主动的一方感觉自己付出更多从而受到伤害，生出不平衡感；E代表不主动的一方有种优越成就感谈过恋爱的人都会对此有深刻的体会吧。闹矛盾有别扭之后，有时也可能两人都想主动了，但谁也不先迈出这一步，在不知道对方策略和想法的情况下，一权衡一算计就总害怕自己亏了，又或者碍于情面拉不下面子，不肯服个软。于是乎，秋水望穿了，花瓣也掰完了，最后是怎样呢？在这个矩阵中我们需要考虑的是，或者说我们的假设前提是，双方都是完全理性的，是完全以利己目的和最大化利益为原则行事的人。上策均衡显然并非最好的结局，但却是博弈双方经过反复权衡后所采取的认为对自己最有利的选择。但我们知道，所谓的爱情是没有理性可言的，它是一种激情，一旦斤斤计较反复权衡利弊得失，那就不叫爱。所以非常有意思的是，这个矩阵中出现的上策均衡（O,O——OVER），即双方都不主动从而导致感情破裂爱情失败的结局，正说明了爱情只要一权衡一算计，俩人都矜持和自私的话，那么最终铁定玩完。三、夫妻关系的博弈分析感情，爱情，亲情夫妻关系尴尬的了现实的活动中，夫妻关系既有和谐、融洽的一面，也存在冲突、矛盾的一面。每5对佳侣新婚燕尔之时，就有一对夫妻分道扬镳。无论是丈夫还是妻子，双方都有自己的利益追求和价值取向，而家庭生活成为他们博弈的载体和工具。

北京大学光华金融内部考研资料讲义-博弈论经典试题

[1]春节前夕,某小镇上两个商铺主甲和乙同时看到一个赚钱的机会:去城里批发一批鞭炮回来卖,总费用为5000元,如果没有竞争对手,这批货在小镇上能卖6000元,如果两家同时卖,价格下跌使得这批鞭炮只能卖4000元。 1. 写出支付矩阵，找出纳什均衡 2. 若甲先行动、乙看到甲的结果在行动，均衡结果是什么？ 3. 若乙与第三者丙打赌，说自己肯定会进货，若不进货乙给丙2000元，若进货丙给乙5毛钱，并且甲知道乙和丙的赌局。求均衡结果 [2]（光华1996年原题）如下博弈：参赛者1是否存在占优策略？ [3]（光华2000年真题） 1，若果（上，左）是占优策略均衡，那么abcdef 之间必须满足那

些关系？ 2，若果（上，左）是纳什均衡，哪些条件需要成立？ 3，如果（上，左）是占优策略均衡，那么它是否一定是纳什均衡？ 4，在什么条件下，纯策略纳什均衡不存在？ [4]2005年光华真题请问：什么是纳什均衡？求出该博弈中所有有可能的纳什均衡 [5]2007年真题其中X 、Y 、Z 是参与者1的策略，ABC 是参与者2的策略 1. 求纳什均衡 2. 如果该博弈是1先行动的序贯博弈，即1先做出决策，2再根据1的选择进行选择。求纳什均衡。

3.若果1可以在2做出选择后再次修改自己的选择，且双方不存在不均衡信息。求纳什均衡。 [6]有五个海盗抢劫到了一个不可分割的金蛋。他们在坐船回来的过程中决定把金蛋分给他们5个中的其中一个人，他们同意按下面方案实行：他们随即编号为1、2、3、4、5号。由一号开始提方案（即把金蛋给某个人，或者自己）,船上所有表决是否同意（包含其自己），如果有超过一半人同意，按此方案实施，否则将1号扔到海里淹死，由2号继续提方案，以此类推。生命、金蛋对每个人的效用分别为100、10.海盗间彼此冷漠，死掉一个海盗其他海盗都可获得1的效用。假设此方案可以完美实施。根据子博弈完美纳什均衡，谁最有可能得到金蛋？ [7]2010年真题：两支军队争夺一个岛屿，一开始军队2占领岛屿，但军队1可以选择是否进攻岛屿，该岛屿易攻难守，若进攻，进攻方获胜占领岛屿，且双方各损失一个营的兵力。军队1有K个营，军队2有L个营（K、L均为正整数）。岛屿的价值高于一个营，低于两个营。如果某一方没有剩余的营了，那么岛屿对它的价值为0. 问：根据子博弈完美纳什均衡，谁将占领这个岛屿？（20分）

管理博弈论

管理博弈论管理博弈论(Game Theory of Management) [编辑] 什么是管理博弈论[1] 管理博弈论也称管理激励与约束机制设计理论，是指管理博弈论是对近年来的管理激励与约束机制设计中不同模型、不同方法研究成果的概括和提炼。所以可以说管理博弈论就是围绕管理激励与约束机制设计的一系列理论与方法，是博弈论在管理学领域的运用与发展。 [编辑] 管理博弈论的产生[1] 现代管理的核心职能是激发人最大限度地发挥主观能动性，创造性地开展工作，这其中自然包含了管理者和被管理者之间的博弈。但由于管理对象是有限理性的社会人，不是理性的经济人；由于管理环境是复杂多变而组织目标是相对稳定的，因而管理活动更具多阶段特性；由于被管理者的需求是多方面的，因而管理激励与约束是多因素的；还由于管理活动通常具有多目标、多层次的特点，使博弈论方法在管理学中的应用远比在其他领域的应用更为复杂、多样。由于引入了管理激励与约束机制设计的概念，使得管理和博弈有了结合部，博突论在管理学的应用有了切入点。之所以说管理激励与约束机制是管理博弈论产生和发展的载体，是由于它既切合管理实践发展需要，又能将个人理性与非理性、优化结果的定量与定性描述、需求的单因素与多因素、管理的单目标与多目标、单阶段与多阶段、单一管理层次与多管理层次有机地结合起来，从而为博弈论在管理学中的应用与发展开辟了道路。 [编辑] 管理博弈论的基本内容管理博弈论的基本内容包括：需要激励，目标激励，榜样激励，压力约束，纠偏约束。 [编辑] 管理博弈论管理的核心[2]

管理博弈论管理的核心是如何最大限度地发挥主观能动性创造性地开展工作，这其中就包含了管理者与被管理者之间的博弈。现代管理是以人为中心的管理，一个组织内部的效率取决于全体员工的努力水平。因此，激励与约束就成了管理的核心职能。在企业中如何提高员工的素质，如何创造出使员工感到上下级平等的环境，如何达成组织目标和个人目标的统一，这都是一个组织在进行管理的时候考虑如何运用管理激励与约束手段的问题。从社会现实来看，假冒伪劣产品的出现，污染问题，体育比赛中的黑哨问题，运动员的违规问题等等都是管理激励与约束措施不当造成的。建立有效的管理与约束机制已经成为现代管理实践的迫切需要。管理博弈论就是一门关于激励与约束机制体系设计的新学科，它是博弈论在管理应用中的一个重要的、新的分支，管理博弈论进行定量化．模型化研究的基本数学基础就是博弈论。 [编辑] 管理博弈论的学科特点[1] 管理博弈论作为一门以管理激励与约束机制设计为研究对象的新兴学科，有自己产生的时代背景，有自己明确的研究对象与范围，有自己的理论基础，是应管理实践需要而生的。具体而言这门新学科具有如下一些特点： (1)管理博弈论是一门新兴综合性交叉学科。管理博弈论研究的对象是管理激励与约束机制设计，管理激励与约束机制问题往往非常复杂。由于管理者与被管理者之间一般信息是不对称的，他们既可能是合作关系，也可能是非合作的关系，管理激励与约束机制设计中需要综合运用合作博弈、非合作博弈、非对称信息博弈的理论与方法，还可能用到各种现代数学最优化理论，还要以管理学激励与约束理论为指导。因此，管理博突论是由众多学科理论交叉形成的，以特定的管理激励与约束机制设计为研究对象的综合性新学科。 (2)管理博弈论是一门应用性管理类新学科。管理博弈论是根据管理实践的需求而产生发展的，它的问题来源于管理实践，它的研究服务在于管理实践，故而它是一门理论与实践紧密结合的应用性管理类新学科。 (3)博弈模型的机制式表述。博弈论中博弈模型的基本表述形式有战略式表述、扩展式表述；非对称信息博弈论中博弈模型的基本表述形式为特征函数式表述。这些博弈模型的表述形式都是管理博弈论中博弈模型可采用的表述形式，但是，由于对复杂的多目标、多样因素、多阶段博弈难以表述，故其应用具有很大的局限性。为此，管理博弈论提出了适应于解决多目标、多因素、多阶段复杂的管理激励与约束机制模型的基本表述形式——机制式表述。 (4)定性要素研究与定量要素研究相结合。博弈论与非对称信息博弈论中博弈模型不仅可容纳的要素较少，而且要求要素只能是定量的。管理问题中涉及的资源要素不仅多，而且定性要素占的比重很大。不能反映定性要素作用的模型，显然不足以反映问题的全貌，设计出的模型必然是有缺陷的。管理博弈论强调定性要素研究与定量要素研究相结合，在其机制式表述中，通过定性因素定量化，将定性因素纳入模型，研究其作用与影响,力图达到充分全面反映问题的目的。

范里安《微观经济学：现代观点》【教材精讲+考研真题解析】第28章博弈论【圣才出品】

第28章博弈论 28.1本章要点 ●纳什均衡 ●囚徒困境 ●序贯博弈 28.2重难点解读博弈论关注的是对策略互动的一般性分析，它可以应用于研究营业博弈、政治谈判和经济行为等。一、博弈的收益矩阵假设两人进行简单的博弈，参与人A在纸上记下“上”或“下”。同时，参与人B独立地在另一张纸上记下“左”或“右”。他们最终获得的收益如表28-1所示。

表28-1博弈的收益矩阵占优策略：不论其他参与人如何选择，每个参与人都有一个最优策略（there is one optimal choice of strategy for each player no matter what the other player does.）。如果在某个博弈中，每个参与人都有一个占优策略，那么，可以预期这个占优策略组合就是该博弈的均衡结果。二、纳什均衡纳什均衡：如果其他参与人不改变自己的策略，任何一个参与人都不会改变自己策略的均衡状态。即如果给定B的选择，A的选择是最优的，并且给定A的选择，B的选择也是最优的。那么，这样一组策略就是一个纳什均衡，即给定其他人的选择，每个参与人都作出了最优的选择（each person is making the optimal choice,given the other person’s choice）。一个纳什均衡可以看作关于每个参与人的策略选择的这样一组预期，这些预期使得当任何一个人的选择被揭示后，没有人愿意改变自己的行为，如表28-2所示。表28-2一个纳什均衡

纳什均衡的评价：第一，一个博弈可能会存在一个以上的纳什均衡。表28-2中，策略组合（下，右）与（上，左）都是纳什均衡。第二，有一些博弈根本不存在纳什均衡，如表28-3所示。表28-3不存在（纯策略）纳什均衡的博弈三、混合策略纯策略：每个参与人只选择一种策略并始终坚持这个选择。混合策略：参与人随机化按照概率选择策略。混合策略纳什均衡：给定其他参与人的策略选择概率，每个参与人都为自己确定了选择每一种策略的最优概率。表28-3所示的例子中，可以证明，如果参与人A以3/4的概率选择策略“上”，以1/4的概率选择策略“下”，参与人B以1/2的概率选择策略“左”，以1/2的概率选择策略“右”，那么，这个混合策略组合就构成一个纳什均衡。

博弈论经典案例分析

博弈论经典案例分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

《管理经济学》(二)-论博弈论对企业决策的启示 (5)

南开大学现代远程教育学院考试卷 2020年度春季学期期末(2020.2) 《管理经济学》（二）主讲教师：卿志琼一、请同学们在下列（20）题目中任选一题，写成期末论文。 1、完全竞争市场、垄断竞争市场、寡头垄断市场和完全垄断市场特点比较分析 2、完全竞争市场的特点与评价 3、完全竞争市场厂商短期关门点决策 4、完全竞争市场厂商长期均衡的利润状况分析 5、完全垄断市场的特点分析 6、完全垄断市场厂商的长期均衡条件分析 7、论价格歧视及其条件 8、论一级差别定价、二级差别定价和三级差别定价的含义与适用条件 9、论垄断竞争市场的条件与企业决策 10、垄断竞争市场厂商的价格竞争与非价格竞争 11、寡头市场结构的特点分析 12、比较完全竞争、完全垄断和垄断竞争市场结构的长期均衡条件与效率分析 13、卡特尔定价与价格领导的含义与应用 14、论博弈论对企业决策的启示 15、运用某一市场结构分析企业的定价与产量决策 16、成本加成定价法的含义及其应用 17、企业不同的定价实践与应用 18、市场进入障碍与市场结构——以某市场为例 19、长期投资决策原则与应用 20、囚徒困境与纳什均衡的含义与应用二、论文写作要求 1、论文题目应为授课教师指定题目，论文要层次清晰、论点清楚、论据准确； 2、论文写作要理论联系实际，同学们应结合课堂讲授内容，广泛收集与论文有关资料，含有一定案例，参考一定文献资料。 3、第13题——20题，可以加副标题。如第20题，囚徒困境与纳什均衡的含义与应用——以可口可乐与百事可乐广告战为例三、论文写作格式要求：论文题目要求为宋体三号字，加粗居中；正文部分要求为宋体小四号字，标题加粗，行间距为1.5倍行距；论文字数要控制在2000－2500字；

基于博弈论的爱情浅析

基于经济学的爱情攻略浅析摘要随着市场经济的发展，人们对事物认知态度的变化，经济学的应用范围进一步扩大，人们的行事原则越来越趋向于经济学上的“理性”。就现状而言，经济学的分析不仅局限于某些领域，只要存在人类的社会活动，就存在经济，就存在资源合理配置问题，也就有经济分析的必要。谈恋爱是校园中的一个普遍现象，本文从经济学的视野中透视，爱情中的微观经济学问题，包括从预算线角度分析择偶以及爱情中的博弈关系，并试图以经济学的理论提出缓解和解决有关爱情现象问题的建议。关键词：微观经济学；爱情；预算线；博弈论

Analysis based on the economics of love Raiders 【Abstract】:With the development of market economy, people's attitudes change perception of things, to further expand the scope of application of economics. More and more people tend to act on the principle of "rational" economics. On the current situation, the analysis is not limited to certain areas of economics. As long as the existence of human social activities, there is the economy. There is a reasonable allocation of resources, there is need for economic analysis. Love is a common phenomenon in the campus. This paper is from the perspective of economy. The love of microeconomics issues, including the budget line from the perspective of the relationship between mate and love the game, and tried to ease the economic theory proposed and recommendations to address issues related to the phenomenon of love. 【Key words】:Game theory; microeconomics; love; budget line

合作博弈

合作博弈博弈论又称为对策论，是一门应用极其广泛的学科，它既是一个数学分支，又属于经济学和管理科学范畴，其应用涉及经济学、管理学、社会科学以及计算机科学等众多学科领域。在过去的几十年中，博弈论在国内外发展迅速，既有对传统非合作博弈的突破，更有新的理论分支，比如合作博弈、模糊合作博弈等的飞速发展。如今，博弈论在经济学中的地位日益凸显，已经成为一种标准用于衡量生产活动的经济性。博弈论发展至今的种类繁多，可以根据不同标准进行不同分类。按博弈中的参与者采用的对策能否在博弈开始前确定，可以将博弈分为策略型博弈和展开型博弈。根据博弈的周期是否与时间长短有关，分为动态博弈和静态博弈。如果一场博弈活动中，参与者之间互不关联，参与者在进行博弈时禁止任何形式的信息往来，同时禁止参与者互相签订任何形式的强制性约定，则称这种博弈为非合作博弈（non-cooperative game）；合作博弈（cooperative game）则是指参与者在进行博弈前可以互相沟通，交换信息，共同完成博弈过程，合作博弈中相互合作的参与者通常称之为一个联盟。本文主要针对合作博弈进行讨论。合作博弈理论主要关系的是联盟（即参与者集合），协调他们的行动并且经营他们的收益。因此，合作博弈研究的重点问题是如何在组成联盟的成员之间分配他们的额外收益（或节省的费用）。分配该额外收益的结果或方法称为合作博弈的解。由于合作博弈的解能够适用于复杂或者运算量较大的系统，因此合作博弈解法在电力工业中的应用已经得到国内外学者的广泛研究，其模型涵盖输配电竞价、电网建设招投标、输电定价、系统费用分摊等领域。与采用传统的非合作博弈模型求解相比，合作博弈解可以为市场中的参与者提供良好的经济信号，刺激参与者互相竞争获得更大的利益。通常情况下，生产活动中的参与者（或局中人）通过某种协定形成联盟，各联盟之间的参与者通过协商并联合行动，来实现联盟整体利益的最大化，进一步实现个体利益的最优分配。参与者在追求整体和个体利益最大化的同时，也受到相互之间协定的约束，从而避免自身获取利益的行为造成其他参与者利益的损失。由于参与者采用合作博弈方法进行生产活动时，各自分配的利益能够被全体参与者所接受，因此对合作博弈方法的研究很有必要。令N为参与者（这些参与者考虑不同的合作可能性）的非空有限集合，即{} =，每个子集S看作是参与者不同的合作组成的一个联盟，则联盟N n 1,2,3,..., ∈。对于每一个联盟S，其中的参与者均通过协商采取一致的策略行动，为S N 实现该联盟的总利益最大而互相合作。集合N称为大联盟，集合φ称为空联盟。

博弈论基础作业及答案

博弈论基础作业一、名词解释纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。囚徒困境的例子：军备竞赛；中小学生减负；几个大企业之间的争相杀价等等；以中小学生减负为例：在当前的高考制度下，给定其他学校对学生进行减负，一个学校最好不减负，因为这样做，可以带来比其他学校更高的升学率。给定其他学校不减负，这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此，不论其他学校如何选择，这个学校的最佳选择都是不减负。每个学校都这样想，所以每个学校的最佳选择都是不减负，因此学生的负担越来越重。请用同样的方法分析其他例子。智猪博弈的例子：大企业开发新产品；小企业模仿；股市中，大户搜集分析信息，散户跟随大户的操作策略以股市为例：给定散户搜集资料进行分析，大户的最佳选择是跟随。而给定散户跟随，大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随，散户的最佳选择都是跟随。因此如果大户和散户是聪明的，并且大户知道散户也是聪明的，那么大户就会预见到散户会跟随，而给定散户跟随，大户只有自己分析。请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。破釜沉舟是一个承诺行动。目的是要断绝自己的退路，让自己无路可退，让自己决一死战变得可以置信。也就是说与敌人对决时，只有决一死战，这样才可以取得胜利。否则，如果不破釜沉舟，那么遇到困难时，就很有可能退却，也就无法取得胜利。穷寇勿追就是要给对方一个退路，由于有退路，对方就不会殊死抵抗。否则，对方退无可退，只有坚决抵抗一条路，因而必然决一死战。自己也会付出更大的代价。

平新乔《微观经济学十八讲》课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡跨考网独家整理最全经济学考研真题，经济学考研课后习题解析资料库，您可以在这里查阅历年经济学考研真题，经济学考研课后习题，经济学考研参考书等内容，更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验，从前辈中获得的经验对初学者来说是宝贵的财富，这或许能帮你少走弯路，躲开一些陷阱。以下内容为跨考网独家整理，如您还需更多考研资料，可选择经济学一对一在线咨询进行咨询。 1．假设厂商A 与厂商B 的平均成本与边际成本都是常数，10A MC =，8B MC =，对厂商产出的需求函数是 50020D Q p =- （1）如果厂商进行Bertrand 竞争，在纳什均衡下的市场价格是多少？（2）每个厂商的利润分别为多少？（3）这个均衡是帕累托有效吗？解：（1）如果厂商进行Bertrand 竞争，纳什均衡下的市场价格是10B p ε=-，10A p =，其中ε是一个极小的正数。理由如下：假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ，那么必有10A p ≥，8B p ≥，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，A p 和B p 都不会严格大于10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足10A p ≤，10B p ≤。但是由于A p 的下限也是10，所以均衡时10A p =。给定10A p =，厂商B 的最优选择是令10B p ε=-，这里ε是一个介于0到2之间的正数，这时厂商B 可以获得整个市场的消费者。综上可知，均衡时的价格为10A p =，10B p ε=-。（2）由于厂商A 的价格严格高于厂商B 的价格，所以厂商A 的销售量为零，从而利润也是零。下面来确定厂商B 的销售量，此时厂商B 是市场上的垄断者，它的利润最大化问题为： max pq cq ε>- ① 其中10p ε=-，()5002010q ε=-?-，把这两个式子代入①式中，得到： ()()0 max 1085002010εεε>----???? 解得0ε=，由于ε必须严格大于零，这就意味着ε可以取一个任意小的正数，所以厂商B 的利润为：()()500201010εε-?--????。（3）这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本，所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格，那么厂商B 的利润和消费者的剩余就都可以得到提高，同时又不损害厂商A 的剩余（因为A 的利润还是零）。 2．（单项选择）在下面的支付矩阵（表10-1）中，第一个数表示A 的支付水平，第二个数表示B 的支付水平，a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”，那么：

博弈论分析

中美军备竞赛的博弈分析 1.理论介绍 1.1博弈论的概念博弈论（Game Theory），亦名“对策论”、“赛局理论”，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。 1.2博弈论的主要特点博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure)，所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。具有竞争或对抗性质的行为成为博弈行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。 1.3博弈的分类博弈的分类根据不同的基准也有不同的分类。一般认为，博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。从行为的时间序列性，博弈论进一步分为静态博弈、动态博弈两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。通俗的理解："囚徒困境"就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈。按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。目前经济学家们现在所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。与上述四种博弈相对应的均衡概念为：纳什均衡(Nash equilibrium），子博弈精炼纳什均衡（sub game perfect Nash equilibrium），贝叶斯纳什均衡(Bayesian Nash equilibrium），精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium）。博弈论还有很多分类，比如：以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（战略型）或者展开型等等。 1.4纳什均衡纳什均衡的定义：在博弈G=﹛S1，…，Sn：u1，…，un﹜中，如果由各个博弈方的各一个策略组成的某个策论组合（s1*，…，sn*）中，任一博弈方i的策论si*，都是对其余博弈方

管理经济学(二)-卿志琼论博弈论对企业决策的启示

南开大学现代远程教育学院考试卷《管理经济学》（二）主讲教师：卿志琼一、请同学们在下列（20）题目中任选一题，写成期末论文。 1、完全竞争市场、垄断竞争市场、寡头垄断市场和完全垄断市场特点比较分析 2、完全竞争市场的特点与评价 3、完全竞争市场厂商短期关门点决策 4、完全竞争市场厂商长期均衡的利润状况分析 5、完全垄断市场的特点分析 6、完全垄断市场厂商的长期均衡条件分析 7、论价格歧视及其条件 8、论一级差别定价、二级差别定价和三级差别定价的含义与适用条件 9、论垄断竞争市场的条件与企业决策 10、垄断竞争市场厂商的价格竞争与非价格竞争 11、寡头市场结构的特点分析 12、比较完全竞争、完全垄断和垄断竞争市场结构的长期均衡条件与效率分析 13、卡特尔定价与价格领导的含义与应用 14、论博弈论对企业决策的启示 15、运用某一市场结构分析企业的定价与产量决策 16、成本加成定价法的含义及其应用 17、企业不同的定价实践与应用 18、市场进入障碍与市场结构——以某市场为例 19、长期投资决策原则与应用 20、囚徒困境与纳什均衡的含义与应用论博弈论对企业决策的启示一、博弈论概念及其起源博弈论又称对策论或竞赛论，是研究具有对抗或竞争性质现象的数学理论和方法，它是现代数学的一个新分支，起源于 20 世纪初。1944 年冯诺依曼和摩根斯坦合著的《博弈论和经济行为》奠定了博弈论的理论基础。简单地说，博

弈论就是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间决策的均衡。张维迎教授对博弈论的定义是：“研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题”。也就是说，当一个主体，比如说一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润。如果垄断可以形成，则博弈双方的共同利润最大。这种情况就是垄断经营所做的，通常会抬高价格。另一个极端的情况是厂商用正常的价格，双方都可以获得利润。从这一点，我们又引出一条基本准则：“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中，每一企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。二、博弈论与企业决策的关系博弈论研究个体如何在错综复杂的相互影响中得出最合理的策略。在充满竞争的商界里，经验、竞争战略和博弈论就好比是企业管理的术、法、道，掌握博弈之道的企业管理者往往比不懂博弈之道的更加理性和高明。从冯诺伊曼创立博弈理论至今，博弈论已经从早期的静态博弈发展到动态博弈，并在商业、法律、心理学等领域都得到广泛的应用。人类的很多活动，特别是经济活动都是相互

黄亚钧《微观经济学》第4版笔记和课后习题含考研真题详解(博弈论)【圣才出品】

黄亚钧《微观经济学》第4版笔记和课后习题含考研真题详解第6章博弈论 6.1复习笔记考点一：静态博弈★★★★★ 1．囚徒困境与上策（1）博弈论的三个基本要素 ①对局者。对局者也就是游戏的参与者，通常是由几个厂商或个人（消费者）组成，他们都是利益极大化的理性人。 ②策略。在博弈论中，有多种策略可供对局者选择。每个对局者总是从自身的利益出发，根据现有的信息，按照一定的规则来选择自己的策略。 ③得益。对局者通过选择自己的策略得到一定的得益，得益可能是利润或效用。每个对局者分别选择自己认为是最好的策略，但他最后得到的得益却是所有对局者采取的策略共同作用的结果。（2）囚徒困境表6-1显示了囚徒困境博弈的得益矩阵。表6-1囚徒困境

囚徒A会分别根据B的两种选择做出对自己最优的决策，B也会同样做出对自己最优的决策，所以最终的均衡时（坦白，坦白）。因此，可以看出，个人做出的对自己最优的决策，对于群体却带来了最坏的结果。（3）上策与上策均衡上策是指无论对方如何选择都使自己利益极大化的策略。在囚徒的例子里，无论B如何选择，A的利益极大化的策略是坦白；同样，无论A作出什么决定，B的最优选择也是坦白，因此上策就是坦白。囚徒困境的最后均衡是在矩阵的左上角，即大家都坦白，这种均衡也称之为上策均衡。上策均衡是博弈均衡的一种特殊状态，但纳什均衡却不一定是上策均衡。 2．纳什均衡（1）纳什均衡的含义纳什均衡是指在对手选择既定的情况下，每一个对局者的选择都是最佳选择。因此，在纳什均衡条件下，所有的对局者都不会去改变他们所选择的策略。（2）纳什均衡的例子 ①价格战如表6-2所示，假定两家厂商A和B，双方抢占市场份额的策略都为降价和不降价，双方的得益为表中数字表示，对局的纳什均衡为（降价，不降价）。表6-2不同市场份额厂商的价格战厂商A存在上策“降价”，而厂商B面对A不同的决策选择不存在上策。因此，A一定

用博弈论分析生活中的现象

上海第二工业大学 2012-2013学年第二学期用博弈论分析生活现象论文

博弈论分析生活中现象博弈论它较好地解决了对竞争等问题的可操作性分析，成为经济学中激荡人心的一个研究领域，主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下，博弈论就是分析博弈行为和博弈决策的一门科学。其实博弈现象不只现身于经济领域对于我们日常生活中也是处处可见的，所以博弈论的思想不仅仅能够用来分析经济从而获得最大的盈利，我们也可以尝试将博弈论的思想运用到生活实践中从而获得最优的策略。比如某一天你觉得应该是你女朋友的生日，但又不能肯定，如果是女朋友的生日的话，你可以送一束花，女朋友会特别高兴，你不送花，女朋友会埋怨你忘了她的生日如果不是女朋友的生日的话，你可以送女朋友一束花女朋友感到意外的惊喜，你不送花结果生活同往常一样。生日非生日买花 1 ，1 2 ，1 不买花-1，-1 0 ，0 确定今天是女朋友的生日或确定今天不是女朋友的生日，但你的最好行动都是买花。谈到博弈论我们不得不说到囚徒困境，其内容大致为两名罪犯A 和B隔离审讯。如果两个都不招，因为证据不充分，两人都只能判1年。如果一方招了，属立功表现，功罪相抵，无罪释放；而另一方则属抗拒从严，判10年刑但如果两人都招了，则各判 5 年。结果大家都知道：两个人争先恐后地招了，结结实实地各判了5年。两个犯

人陷入的就是囚徒困境， A B 招不招招 5 ，5 无罪释放，10 不招10，无罪释放 1 ，1 其结果就是A和B都招，判5年刑。如果两人协商后选择不招，但如果A或B其中一人招了，另一人就会判10年，而招的一人就会无罪释放，这样的诱惑足以让两名罪犯违背两人协议。而选择招。这样最有可能就是俩人都招。人际交往中的博弈人与人之间的相互矛盾和相互冲突的关系实际上就是一种博弈关系。矛盾冲突的结果也有三种情况负和游戏、零和游戏和正和游戏。“负和游戏”是一种两败俱伤的游戏故也称为双输博弈。在人与人的交往时由于相互的冲突和矛盾不能达到统一交际双方都不让步，最后使交际活动不能展开，结果是交际的双方都从中受损两败俱伤。如果是朋友，也会因不断发生“负和游戏”而逐渐疏远，夫妻间经常出现“负和”现象感情自然会受到影响。交际中之所以经常会发生“负和博弈”现象，大多是因为心胸狭窄，遇事爱使性负气，必然会出现“负和”局面。如果不使性负气，而是互相谅解，与人交往采取合作态度，便能使有矛盾和冲突的交际活动朝好的方向发展。在交际中如果遇到了和交际对象发生冲突的时候能够想着退一步海阔天高，采取一种和对方合作的态度就一定能避免交际中“负和游戏”的发生。至于“零和游戏”这种简单的“你输我赢”的思考方式往往会给人们带来更大的麻烦。其实在人与人之间的交往中双方的关系并不是简单

工程施工企业项目管理中的博弈分析(最新版)

( 安全管理 ) 单位：_________________________ 姓名：_________________________ 日期：_________________________ 精品文档 / Word文档 / 文字可改工程施工企业项目管理中的博弈分析(最新版) Safety management is an important part of production management. Safety and production are in the implementation process

工程施工企业项目管理中的博弈分析(最新版) 1．引言最近二三十年，经济学经历了一场剧烈的“博弈论”革命。博弈论日益受到人们的重视，同时博弈论在经济学中的应用领域也越来越广泛，大有“吞噬”整个现代西方经济理论的气势，在现代经济学中占有非常重要的作用和地位，它已经成为了经济学中一种基本的分析工具。博弈论（gametheory）又叫对策论，[1]是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡情况。其基本出发点这样的：人是理性的，是会在约束条件下追求自身利益最大化的经济人。博弈论承认个人利益和局部利益，承认人们追求自身利益最大化的合法性，因而在市场经济条件下用于分析人们的经济行为、

经济关系和社会经济活动时得到了广泛的应用。 2．“囚徒困境”博弈模型分析 “囚徒困境”[2]是博弈论里最经典的博弈模型之一，其基本模型是：警察在现场抓住了两个合伙的犯罪嫌疑人（甲和乙），但却没有掌握足够的证据。于是警察把他们隔离关押起来以防止串供，并要求坦白交代。如果两人都坦白，每人将入狱3年；如果两人都不坦白，将以防碍公务罪入狱1年；如果一人抵赖另一人坦白，那么坦白者将得到释放，而抵赖者则将入狱5年。分别用-1、-3、-5、和0表示罪犯入狱1年、5年、8年和释放的得益，那么甲、乙两人的博弈格局如图1的“得益矩阵”所示。面对两个都只考虑自己利益的理性经济人，选择的结果如下：如果乙抵赖而甲坦白，则甲将得到释放；如果乙坦白同时甲也坦白，则甲入狱3年，但如果此时甲抵赖却要入狱5年。由此可见，对甲而言，无论乙采取什么策略（坦白或抵赖），坦白给他自己带来的利益总是最大，所以坦白始终是甲的上策，也就是说，不管乙是坦白还是抵赖，甲的最佳选择始终是坦白。同理，对于乙而言，坦白也

文档之家