当前位置:文档之家› 博弈分析及应用

博弈分析及应用

博弈分析及应用
博弈分析及应用

博弈分析及其应用

葛利萍

(绍兴文理学院数学系,浙江绍兴312000)

摘要:系统地阐述了多人合作博弈理论,并提出利用Shapley值法计算联盟的收益函数中各局中人的分配,且具有一定的公正性和合理性,特别在利益分配问题,费用分摊问题,以及组合

预测权系数的确定中有着广泛的应用,并对这些方面进行举例分析.

关键词:合作博弈;Shapley值;利益分配;费用分摊;组合预测

1引言

在社会生活和经济、军事活动中,经常碰到各种各样具有竞争或利益相对抗的现象,如下棋、打扑克、为争夺市场展开的广告战、军事斗争中双方兵力的对垒等,竞争的各方总是希望击败对手,取得尽可能好的结果,都想用自己最好的战术去取胜,这就是博弈现象.博弈现象实际上是一类特殊的决策,在关于不确定型的决策分析中,决策者的对手是“大自然”,它对决策者的各种策略不产生反应,更没有报复行为.但在博弈现象中,代替“大自然”的是有理性的人,因而任何一方做出决定时都必须充分考虑其他对手可能作出的反应.博弈论的英文名为Game Theory,又称对策论,用比较简短的话来概括,所谓博弈是指局中人按一定规则,在充分考虑其他局中人可能采取的策略的基础上,从自己的策略集中选取相应策略,并从中得到回报的过程.尽管博弈论中研究的问题形形色色,但任何一个博弈问题都包含下列三个要素:

1.局中人(players)是指参与竞争的各方,它可以是一个人,也可以是一个集团,但局中人必须是有决策权的主体,而不是参谋或从属人员.局中人可以有两方,也可以有多方.当存在多方的情况下,局中人之间可以有结盟和不结盟之分.

2.策略(strategies)是指局中人所拥有的对付其他局中人的手段、方案的集合.在静态博弈中,策略必须是一个独立的完整的行动,而不能是若干相关行动中的某一步.例如一次乒乓球男子团体比赛中,包括两名单打和一对双打选手出场,比赛前提交的名单除规定出场球员姓名之外,两名单打还必须明确谁是第一单打,谁是第二单打,这样不同单打和双打队员的出场搭配以及两名单打队员的不同排序构成了不同的策略.相应每个局中人的策略选择形成的策略组称为一个局势.

3.收益函数(payoff function)指一局博弈后各局中人的输赢得失,通常用正的数字表示局中人的赢得,负的数字表示局中人的损失.

博弈论研究决策主体的行为在发生直接相互作用时,人们如何进行决策以及这种决策的均衡问题.博弈论是研究理性的决策之间冲突与合作的理论.在博弈论分析中,一定场合中的每个对弈者在决定采取何种行动时都策略地、有目的地行事,他考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化.由于在现实生活中人们的利益冲突与一致具有普遍性,因此,几乎所有的决策问题都可以认为是博弈.博弈论在政治学、军事学、生物进化学、心理学、社会学、伦理学、经济学等许多领域都有着广泛的应用.在经济学中博弈论作为一种重要的分析方法已渗透到几乎所有的领域,每一领域的最新进展都应用了博弈论,博弈论已经成为主流经济

学的一部分,对经济学理论与方法正产生越来越重要的影响.正因为如此,1994年瑞典皇家科学院决定将诺贝尔经济学奖授予了纳什(John Nash )、哈萨尼(John Sanyi )和泽尔腾(Reinhard Selten )三位博弈理论家和经济学家,表彰他们在博弈论理论和应用研究方面作出的杰出贡献.目前博弈论在定价、招投标、谈判、拍卖、委托–代理以及很多重要的经营决策中得到应用,它已成为现代经济学的重要基础.

博弈中有关局中人的策略集、收益函数等构成了博弈的信息.按局中人对信息掌握情况,可区分为完全信息博弈和不完全信息博弈.按局中人采取行动的次序,当同时采取行动或在互相保密情况下采取行动,称这种情况为静态博弈.如果局中人采取行动有先后,后采取行动的人可以观察到前面人采取的行动,则属于动态博弈.综合上述,博弈可分为完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈.当然按局中人是否结盟情况,博弈还可区分为合作博弈和非合作博弈.

合作博弈是一种解决多利益主体协调行动产生效益分配问题的有效数学模型.合作是指参与者从自己的利益出发,选择行动,但选择行动的结果对各方都有利.合作博弈研究的问题就是要找到一种效益分配方式,能促使所有利益主体合作.基于合作博弈理论的收益分配是希望通过联合从事某项活动,使每个人的收益比单独从事这项活动或作小范围联合时的收益多.

当代世界,合作与竞争共存成为时代的主题,而企业间各种形式的合作联盟更成为当今经济界竞争的热点模式.组成合作联盟进行合作创新已经成为越来越多企业的选择.在社会活动中的若干实体,为了在日益激烈的竞争中争得一席之地,也为了获得更多的经济或社会效益,相互合作结成联盟或集团.这种合作通常是为了利益,是非对抗性的,确定合理分配这些效益的最佳方案是促成合作的前提.

2 多人合作博弈概念

在日常生活及社会经济活动中,一个人(或集团)为了克服自身弱点(如力量或财力有限),寻求与他人(集团)进行合作,结成一个联盟,以完成单个人或集团所不能完成的事,这就是多人合作博弈.该联盟一旦形成,就作为一个整体共同采取行动,其目标是使联盟获得最大利益.一旦博弈完毕,可以根据某种事先商定的契约以及各个局中人本身的贡献大小,分配共同所得的利益.

联盟的数学定义是:设有n 个局中人{}n N ,,2,1Λ=进行博弈,所谓一个联盟就是N 的

一个非空子集S .为方便起见,有时称空集?也是一个联盟.n 个局中人共能形成n

2个联盟.

一旦联盟S 形成,组成联盟S 的局中人不再关心自己的特殊利益,而为整个联盟的最大利益去努力.因此,他们主要关心联盟S 所能获得的最大值.所有联盟S 所获得的最大值都确定以后,整个博弈就完全清楚.这样的博弈可以用特征函数加以描述:

定义1[]

1:给定{

}n N ,,2,1Λ=,合作n 人博弈记为[]v N ,=Γ,N 上的特征函数v 是定义在N

2上的实值函数,满足:

()0=?v ,

()()()N T S T S T v S v T S v ??=+≥,,,I Y . (1)

对于一个联盟S ,()S v 的值可以通过下列方式获得:S 中局中人形成联盟为使S 获得最大利益而努力,这时最糟的情况是剩下的所有局中人S N -形成一个联盟和S 抗衡,这样可看成是两个局中人S 与S N -在进行非合作博弈,()S v 就是在上述两人非合作博弈中,

S 所获得的最大收入.

对于合作博弈,局中人之间可以相互协商,共同采取使全体都有利的策略,如果某些局中人对采取某些特定策略不满意,可以事先订立契约,等博弈完了以后再进行补偿,以便大家共同采取的策略使联盟总体的利益达到最大.因此,博弈完毕后,如何分配共同形成的总体联盟N 所得的收入()N v 就是合用博弈研究的主要任务.

()S v 的一种分配方案由n 维向量{}n x x x X ,,,21Λ=表示,i x 表示局中人i 的所得.显

然,对每一个局中人i 来说,它至少期望得到的i x 满足:

()N i i v x i ∈≥,. (2) (2)称为个体合理性条件;还有一个必须满足的条件是:

()N v x

n

i i

=∑=1

. (3)

(3)称为群体合理性条件.(2)、(3)合到一起就得到一种分配方案.

当所有n 个局中人均参与合作时,{

}n N ,,2,1Λ=为最大的一个联盟,记()N v 为最大的联盟成果,如何将()N v 分配给各局中人?一个很自然的方法就是依据各局中人给联盟带来的贡献来分配.

设i x 为第i 个局中人从()N v 中获得的分配,n i ,,2,1Λ=则有:

{}()11v x =,

{}(){}()12,12v v x -=, {}(){}()2,13,2,13v v x -=,

……,

(){}()n N v N v x n --=.

然而上述的分配通常与局中人编号的次序有关,如把局中人1,2,,1,Λ-n n 的编号改为

n ''',,2,1Λ,则有新的分配方案:

{}()n v x ='

1,

{}(){}()n v n n v x --='

1,2,

{}(){}()1,2,1,3----='

n n v n n n v x ,

……,

(){}()1--='

N v N v x n .

对于局中人其它编号的次序均有对应的分配方案,由于n 个局中人编号的次序共有!

n 种,所以对应的分配方案也有!n 种.为此取各局中人分配的平均值作为局中人的平均贡献.

记()v i ?为第i 个局中人的平均贡献,则有:

(){}()()[]

n i S v i S v n v i

i i ,,2,1,!1ΛY =-=

∑π

ππ?. (4) 其中π为由n ,,2,1Λ组成的所有n 级排列,∑为针对所有的!n 个不同n 级排列求和,

{}i j j S i <=ππ|,显然i

S π为排列π中排在i 之前的那些局中人组成的联盟,将满足S

S i =π排列归为一类,(4)式可以表示为:

()()()(){}()[]n i i S v S v n S S n v S

i i ,,2,1,!

!

1!Λ=----=∑

∈?, (5)

其中S 为N 中包含{}

i 的所有子集,S 为子集S 中局中人的人数.可以证明: ()()N v v n

i i =∑=1

?. (6)

(6)式表明各局中人在联盟中的平均贡献()v i ?之和等于联盟的总“成果”. 定义2

[]

3 称()()()()()v v v v n ????,,,21Λ=为合作n 人博弈的Shapley 值.

在多人合作博弈中,利用Shapley 值法解决分配问题是一种比较公正、合理且行之有效的方法.本文的目的是探讨Shapley 值法在利益分配问题,费用分摊问题,及如何确定组合预测权系数中的应用.下面就通过实例来说明Shapley 值法在这些方面的具体应用.

3 利益分配问题

随着科学技术进步和信息技术的迅速发展,世界市场已由过去的相对稳定变成动态多变的特征,由过去的局部竞争演变成全球范围的竞争.在此情景下,以最快的速度推出产品、以最好的质量、最低的成本和最优的服务满足不同用户的需求成为每个企业认真解决的问题.于是越来越多的企业纷纷寻找合作伙伴,结成联盟,利用各方优势以更好地适应快速变化的市场要求.各企业结成联盟后获得了更大的收益,如何利用Shapley 值把联盟的整体收益合理地分配给各个企业,下面给出一实例.

设现有三家企业A 、B 、C 为了抓住某一市场机遇,决定实施联盟生产某种新产品投入市场,联盟成功后将获得一批可观的收益,现如何用Shapley 值分配这一联盟收益.让我们

先看在特定场合单家企业生产或两家联盟生产以及三家联盟生产的收益情况(见表1).

由表中可以看出,两家联盟比单家生产合算,三家联盟比两家联盟合算,按Shapley 值法计算:

()()()20031200

48032402808024013120=?-+?-+-+?=

A ?, ()()()14031280

48032402001202401380=?-+?-+-+?=B ?,

()()()1403

1240

48032802001202801340=?-+?-+-+?=C ?.

4 费用分摊问题

在我国区域经济中中小型制造企业数量很大,行业型企业联盟有利于企业抵御风险、降

低成本、提高市场竞争力.行业型企业联盟中企业协作的形式有多种,基于行业信息网络的行业联合采购是联盟企业协作的重要手段之一.在联合采购中,各采购企业通过合作使得在满足各自采购目标时的采购总费用()Y 小于各采购企业单独采购时的采购总费用()X ,每个采购企业都希望自身分配的收益越大越好,分摊的联合采购成本费用越少越好.下面就用Shapley 值法对联合采购费用进行合理分摊计算.

先给出一些符号定义:

()S C :联盟S 的总采购费用;

{}m M ,,2,1Λ=:企业采购物资的集合;

()M N n R y y y ?∈=,,1Λ:其中M N R ?是联盟N 购买的所有物资的集合,

()M im i i R y y y ∈=,,1Λ,其中ij y 是企业i 购买物资j 的数量,M j N i ∈∈,;

()y p j :购买第j 种物资,数量为y 时的价格;

()k f i :企业i 采购物资k 次时的交易费用,()k f S 为联盟S 联合采购k 次的交易费用.

物资采购中,采购费用包括采购的交易费用和采购物资的实际费用两部分.采购的交易费用是指一次物资采购中,采购主体(单个企业或行业采购中心)发布消息、组织招投标等进行辅助交易的费用,而采购物资的实际费用是指采购物资的实际数量和实际采购价格之积.

行业联合采购中,联盟S 的采购总费用为:

()()()∑=?+=m

j j S j S j S S y y p k f S C 1

. (7)

对所有的联盟S 都算出()S C ,就得到行业联合采购的一个n 人合作博弈()C N ,. Shapley 值法的行业联合采购的费用分摊计算公式为: ()()(){}()[]∑

?∈----=

N

S S i i i S C S C n S S n U !

!

1!. (8)

(8)式中i U 表示企业i 联合采购时的分摊采购费用,{}()i S C -表示企业i 没有加入联盟S 时的采购费用,(){}

()[]i S C S C --表示企业的边际费用(也称可分离费用),即企业i 加入到联盟S 中至少应承担的费用(最小分摊费用).

下面举一实例说明Shapley 值法在行业联合采购中的费用分摊计算.

某行业型企业联盟中有四家企业拟联合采购两类物资,假定企业独自均能采购这两类物资并可任意结盟进行联合采购.描述如下:

{}4,3,2,1=N :局中人为四家企业; {}B A M ,=:有两类采购物资;

()N P 为:(){}{}{}{}{}{}{}{}{}{}{,4,3,4,2,3,2,4,1,3,1,2,1,4,3,2,1=N P {

}{}{}{}}4,3,2,1,4,3,2,4,2,1,3,2,1. 对每一个联盟()N P S ∈,其采购费用函数()S C 可由(7)式算出.在本实例中,不失一般性,假定企业单独采购或联盟联合采购均能一次采购完所需物资,并且四个企业单独采购的交易费用均相等,即:

()()()()200011114321====f f f f 元. (9) 而所有联盟的采购费用也相等,即:

()30001=S f 元,()N P S ∈且1>S . (10)

在本实例中,不失一般性,价格函数()y p j 假定为购买数量的线性函数,其表达式为:

()?

??

??≥<<-≤=max

min max min min max ,

,,j j j j j j j j j y y P y y y y a b y y P y p . (11)

式中,m ax j P 和m in j P 分别是第j 种物资在最小购买量()min j y 和最大购买量()

m ax j y 时的最高、最低价格.本实例中,设min max min max ,,,A A A A y y P P 分别为90元、60元、160单位和40

单位,min max min max ,,,B B B B y y P P 分别为100元、60元、150单位和50单位.因此可分别算出物资B A 、的价格函数:

()???????≥<<-≤=160,6016040,410040,90y y y y y p A ,()??

?????≥<<-≤=150,

6015050,5212050,

100y y y y y p B .(12) 因此可算出所有联盟()N P S ∈的采购费用如表2所示.

表2 各种联盟采购物资数量(单位)及采购费用(元)表

续表2 各种联盟采购物资数量(单位)及采购费用(元)表

利用Shapley 值法计算公式(8)求行业联合采购的费用分摊,得:

()()()+?-+-+-+=

3

49700182404900161007700117604134151U ()()()()4

167752220034130401897515140205751160018815-+?-+-+-

08.8742=

同理可得,08.48372=U ,75.27433=U ,09.58774=U .

由此可以看出,对联盟贡献少(采购物资少)的企业分摊的采购费用相对较少,将获得更多收益,因此是一种根据企业对联盟贡献大小来分摊费用的方法.

5 组合预测权系数的确定

预测是根据以往及现在的已知信息,采取一定的方法或技术,对事物的未来发展趋势和结果进行估计或推测.组合预测就是综合利用各种预测方法所提供的信息,以适当的加权平均形式得出组合预测模型.组合预测最关心的问题就是如何求出加权平均系数,使得组合预测模型更加有效地提高预测精度.

设某社会经济现象的指标序列的观察值为{}M t x t ,,2,1|Λ=,设有n 个单项预测方法

对其进行预测,n 个单预测方法用{

}n N ,,2,1Λ=表示,则N 为组合预测方法的局中人集合.N 中的任一子集N

S 2∈形成组合预测方法的一个联盟,若干个局中人结成联盟后,这个联盟作为一个整体进行组合预测就是希望尽可能多的降低组合预测误差,本文采用误差平

方和这个指标来反映预测精度.

设it x 为第t 时刻的预测值,记it t it x x e -=为第i 种预测方法在第t 时刻的预测误差,

n i ,,2,1Λ=,M t ,,2,1Λ=.

设nt n t t t x l x l x l x

+++=Λ2211?为t x 的组合预测值,n l l l ,,,21Λ为各种预测方法的加权系数,且满足

n i l l

i n

i i

,,2,1,0,11

Λ=≥=∑=.设t e 为第t 时刻组合预测误差,则有:

()∑∑===-=-=n

i it i n

i it t i t t t e l x x l x

x e 1

1

?. (13) 组合预测模型的误差平方和为: ()∑∑∑∑======

M t n i n

j jt it j i M

t t

e e l l e

N J 111

1

2

. (14)

记m

m M t jt it e e E ?=??? ??=∑1,()T n l l l L ,,,21Λ=,()n T

I ?=11,,1,1Λ,称矩阵E 为组合预测模

型的误差信息矩阵,称L 为组合预测模型加权系数向量,则以组合预测误差平方和的非负权

最优组合预测模型可写为:

()??

?

??≥==01min L L I EL L N J T T (15)

令()()S J S v -=,()S v 为特征函数,()S J 表示联盟S 进行组合预测所得的预测误差平方和,()S v 表示()S J 相反数.

因为预测误差平方和越大,预测精度越低,所以()S v 越大,表明预测精度越高.由Shapley 值即可计算第i 种单项预测方法同联盟合作的平均贡献()v i ?,考虑到()N v 为误差平方和的负值,需将()v i ?做如下归一化处理可得组合预测的加权系数n l l l ,,,21Λ:

()()

()()∑==

n

j j

i i v N v v N v l 1??,n i ,,2,1Λ=. (16) 显然它们满足

n i l l

i n

i i

,,2,1,0,11

Λ=≥=∑=.

组合预测权系数确定的合作博弈方法计算步骤:

1) 根据组合预测误差信息矩阵对角线上的元素,采用某种正权组合方法,如方差倒数加权法,均方差倒数加权法等给出初始的组合预测权系数的估计.

2) 根据(14)式计算各种联盟合作的特征函数.

3) 根据(5)式计算各种预测方法的所获得的平均分配,即Shapley 值.

4) 根据(16)式对各种单项预测方法的所获得的平均分配做归一化处理即得组合预测权系数.

下面用一实例来说明.

设某组合预测问题有{

}3,2,1=N 三种单项预测方法组合而成.其预测误差的信息矩阵为:

()????

?

?????==?6454435383

3ij e E

其中332211,,e e e 分别是3,2,1这三种单项预测方法的预测误差平方和.本例采用方差倒数加权法,其一般计算公式为:

()()1

1221

11

1

1121,,,,,,----=-?

?

?

??=∑nn

n i ii n e e e

e l l l ΛΛ. (17) 所以按照(17)式3,2,1这三种单项预测方法在组合预测中的加权系数为:

()??

?

??=??? ????? ??++=-134136133614181614181,,1

321l l l .

再按照(15)式得

()3314.4134136133645443538134136133=??

? ?????

?

????????? ??=T N J ,

即()()3314.4-=-=N J N v ,同理,采用方差倒数加权法可得

{}()9172.12,1-=v ,{}()7041.13,1-=v ,{}()5562.23.2-=v , {}()81-=v ,{}()42-=v ,{}()63-=v

按照(5)式计算得:

()()()[]()()[]3

267041.149172.11381?---+---+?-=

v ? ()()3196.23

15562.23314.4-=?---+

同理可得

()6213.02-=v ?,()5859.13-=v ?.

按(16)式计算组合预测加权系数得:

16139.01=l ,60255.02=l ,23606.03=l . 所以

()()????

?

?

?????=64544353823606.060255.016139.0N J

()09734.423606.060255.016139.0=T

若3,2,1这三种单项预测方法按(15)式利用Mathlab 软件包可求得最优组合预测加权系数得:

1667.01=*l ,8333.02=*

l ,03

=*l . 对应的最小的预测误差平方和:

()8333.3=*N J .

由此可见,本例用Shapley 值法确定的组合预测加权系数明显优于用方差倒数加权法确

定的,且与最优组合预测方法预测精度很接近.该方法不仅适用于以误差平方和为准则的组合预测模型,而且适用于基于预测有效度的组合预测模型.

6 结束语

本文主要阐述了解决多人合作博弈中联盟分配问题的一种方法——Shapley 值法.举例说明此方法在利益分配问题,费用分摊问题,以及组合预测权系数的等方面中有着较好的应用,而且利用Shapley 值法解决这些方面的问题具有一定的公正性和合理性和一定的实用价值.

但是,从理论上来说,在多人合作博弈中,如果局中人数量越多,在利用Shapley 值法计算时需要的信息量也就越大,也从不同程度上加大了计算量.因此,在实际应用中,是否采用Shapley 值法来分配联盟的收益也要根据具体问题而确定.

致谢:感谢盛宝怀老师的悉心指导!

参考文献

[1] 刘德铭,黄振高.对策论及其应用[M].国防科技大学出版社,1995 [2] 胡运权等.运筹学基础及应用[M].第四版.高等教育出版社,2004 [3] 谢政.对策论[M].国防科技大学出版社,2004

[4] 任民.铁路客运收入分配的多人合作对策问题[J].宝鸡文理学院学报(自然科学版),1999,19(3):

24~29

[5] 贾平,刘雷.企业动态联盟的博弈分析[J].生产力研究,2003,02:254~255

[6] 陈伟,查迎春.关于成本分摊的合作博弈方法[J].运筹与管理,2004,13(2)

[7] 李波,杨灿军,陈鹰.基于合作对策的行业联合采购费用分摊研究[J].系统工程理论与实践,2003,

11:65~70

[8] 陈文颖,侯盾.基于合作对策思想的总量控制优化治理投资费用分摊方法[J].环境科学学报,1999,

19(1):57~62

[9] 周玉霞.合作对策方法在确定组合预测权系数中的应用[J].重庆师范学院学报(自然科学版),2003,

20(2):6~8

[10] 陈友华.组合预测权系数确定的一种合作对策方法[J].预测,2003,1:75~77

Game Analysis and Its Applications

Ge Liping

(Department of Mathematics,Shaoxing College of Arts and Sciences,Shaoxing,Zhejiang 312000)

Abstract: In this paper, we introduce the game theory of many people’s cooperation, and put forward a method of calculating the distribution of every player with Shapley values. The method has some impartialty and rationality. Especially, it has extensive applications in payoff allocation, cost allocation and combination forecasting weight coefficient’s determination, some practical examples of the applications of such method are presented.

Key words: cooperative games; Shapley values; payoff allocation; cost allocation; combination forecasting

博弈论案例分析

博弈论 博弈论(Game Theory),亦名―对策论‖、―游戏理论‖,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们―出棋‖ 招数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。现在,我们就一些例子来讨论博弈论相关内容。 一、从“囚徒困境”开始 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的―囚徒困境‖(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 表囚徒困境博弈 [Prisoner's dilemma] 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择―坦白‖总是最优的。显然,根据对称性,B也会选择―坦白‖,结果是两人都被判刑8年。但是,倘若他们都选择―抵赖‖,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,―坦白‖是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲―囚犯的两难处境‖的例子,每本书上的例子都大同小异。 话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

博弈论在管理制度中的应用

博弈论在管理中的应用

————————————————————————————————作者:————————————————————————————————日期:

博弈论在管理中的应用 不知道大家有没有为这些事情困惑过:为什么员工技能竞赛,技能比拼很难开展,即便开展了,为什么工作效率也没有像预想的那样提高?为什么企业中总有些人拖大家的后退而不努力工作?为什么有的领导手段强硬,有的领导风格怀柔?你是否为“办公室政治”烦恼不已?你有没与遇到过和你看法不一致,总是与你针锋相对的下属?遇到强硬的下属你该怎么办?为什么酒店联盟或者企业间的联盟总是很难做?你是否在做决策之时衡量反复却不知道选择何种策略?。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理?你如何提出科学而又合理解决方法? 以上种种问题,你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识,并以隐藏在我们身边的博弈为例子,给大家提供解决某些实际问题的思路。 那么什么是博弈论呢?所谓博弈论,就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式,既谋略性思考问题的方式。对博弈论通俗的理解就是,关于人与人的斗争中“老谋深算”的学问。 假如你正跟恋人用手机通电话,突然信号断了。这时你是会立即拨电话过去,还是等你的恋人拨电话过来?很显然,你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨,那么另一方最好是等待;如果一方等待,那么另一方最好拨过去。如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中消逝。 这,就是博弈。

第二卷智猪博弈案例

第二卷智猪博弈案例 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 1 在博弈论经济学中,有一个博弈叫“智猪博弈”,“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,我们来分析一下,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;大猪,小猪同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。从中我们可以看出,在两头猪都有智慧的前提下,最好的结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

范里安《微观经济学:现代观点》(第9版)课后习题详解-(博弈论的应用)【圣才出品】

第30章博弈论的应用 1.在一个双人博弈纳什均衡中,每一个参与人都在针对什么作出最优的反应?在一个占优策略均衡中,每一个参与人又都在针对什么作出最优的反应? 答:(1)在纳什均衡中,每个参与人都对其他选手的最优反应作出了自己的最优反应。 (2)在一个占优策略均衡中,每个参与人的选择都是对其他选手所有选择的最优反应。特别地,占优均衡一定是纳什均衡,但纳什均衡却未必是占优均衡。 2.在有关混合策略的章节中,考虑行参与人和列参与人的最优反应。它们会产生最优反应函数吗? 答:行参与人和列参与人没有最优反应函数。如图30-1所示,这两条曲线分别体现了行参与人和列参与人对应于对方选择时的最优反应。曲线的交点就是纳什均衡。在这种情况下,博弈存在三个均衡,其中,两个是纯策略均衡,一个是混合策略均衡。当行参与人选择r=2/3时,列参与人存在无穷多个最优反应,而不是像函数的数学定义所要求的那样,只有一个最优反应。

图30-1 最优反应曲线 3.在一个合作博弈中,如果博弈双方作出相同的选择,那么,结果对于他们两个对这都令人满意。这个结论是否正确? 答:这个说法不正确。 这是因为合作博弈的结果取决于博弈的收益,而非两个人是否选择相同的策略。比如在汽车博弈中,如果双方都选择直线驾驶,他们将陷入最糟糕的境况。 4.本章正文指出,在均衡状态,行参与人在62%的时间内会得分。这个数值是如何得到的? 答:博弈的均衡策略为“行参与人按0.7的概率踢向左方,而列参与人以0.6的概率扑向左方”,由于射门方向和扑救方向共有四种组合,从而得到每种组合的概率分布如表30-1所示。 表30-1不同组合的概率分布

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论分析

中美军备竞赛的博弈分析 1.理论介绍 1.1博弈论的概念 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 1.2博弈论的主要特点 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。 具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。 1.3博弈的分类 博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。 目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(sub game perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。 博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型等等。 1.4纳什均衡 纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方

博弈论在管理中的应用

管理中的博弈论 在博弈中,你必须考虑对方的选择来确定你的最优选择,而对方也必须考虑你的选择来确定他的最优选择,你从博弈中得到的赢利——或者说是利益,不仅取决于你自己的行动,也取决于对方的行动,而对对方来说也是如此,你们当中的每一方都试图尽可能的使自己的利益最大化。总之,你们的行动既互相影响又相互依赖,这正是博弈最本质的特征。 在一场博弈中,每个人的目标都是其利益的最大化。在博弈理论中,有一个基本的假设,就是人们不会有道德,良心和情感上的考虑,所有的一切都只以是否符合自身利益作为选择标准。不过我们有时候也会从心理上、情感上对这一假设进行修正。不过,这种假设在绝大多数情况下是成立的。虽然我们研究的是对抗性行为,但是我们不要寄希望于博弈论可以使你所向无敌,不过博弈论确实可以增强你对某些局势的洞察力,因为它有自己独特而又保持逻辑内在一致性的思考方法。 我们来看一个现实的例子。 一个经理,为了提高工作效率而让手下有两个主管进行比赛,获胜者将得到一笔奖金。如果这两个员工都拼命工作,那么每人都有1/2的概率得到奖金,但是每个人也都会承受艰苦工作而带来的负效用,而经理自然可以得到好处。但是这两个员工实际上也可以合谋而皆不努力,这时他们两个得到奖金的概率仍然是1/2,但是谁也不需要承担艰苦劳动所带来的负效用,这使得每个员工都从合谋中得到了好处。不过,经理遭殃了,因为预期的工作效率下降了。假如你是这个经理,你会怎么做? 有什么办法来防范合谋呢?大家可能会想到监督。监督的确可以防范合谋,但是进行有效的监督是很困难的,一是监督者也有可能与被监督者合谋,二是对于隐性的默契合谋,监督对此无能为力。那么有什么办法来防范合谋呢?一个办法就是对员工进行歧视。比如,两名员工是一男一女,那么这个歧视的方案是男员工在比赛中胜出将获得100元,而女员工则只能获得50元。这个方案会导致女员工不努力,而男员工为了胜出将努力而不与女员工合谋。实际上,组织正是通过打击某些员工而拉拢另一些员工来瓦解员工之间的合谋行为的。 不过,这个方案有个问题,她会使被歧视员工不再努力,另外由于法律的相关因素,这样的显性歧视方案不会被广泛采用。我们可以借鉴的是隐形歧视理论。比如在组织中两个员工为了争夺一个更高的职位而竞争。显然,两个员工也可以合谋而不努力,让老天来决定谁来得到这个岗位,并且约定,不管是谁得到这个岗位都需要对对方进行补偿。这个问题仍然

智猪博弈案例整理

案例一、 有一个经典案例,就是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只就是运送犯人的费用要等到犯人送到澳洲后才由政府按实到犯人人数支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 案例二、 公司并购中的搭便车: 面对收购者,如果存在大股持有人与小股持有人,小股持有人宁愿当搭便车者,因为收购之后的股价会超出收购价格- 收购溢价,由于小股持有人无论出售股权还就是保留股权都不能成为承购成功与否的决定因素,所以以不变应万变,存在不卖的优势策略。而大股持有人只有出售才能促成收购的成功,不出卖就得不到收购价格,逼迫她出卖股权,而小股东也会得利。 为了打击小股东的搭便车行为,往往在公司成立之初就会通过法律来届定权利,比如规定收购者一旦接管公司有权利稀释那些没有转让的股权。 案例三、 员工与企业也就是一个“智猪博弈”过程,员工就就是大猪,员工有两种选择,努力工作或者消磨时间。如果员工努力工作那么企业与员工都受益,如果员工敷衍工作,拿多少工资干多少活,那么最终会被企业辞退。员工只有行动才会受益,不行动则不受益或者受损。而企业可以选择物资奖励,也可以选择说教等待,物资奖励企业必先拿出部分资金作为奖励品,显然收益为负,而等待则不受损,即使辞退员工也可以有人填补空缺,让员工有危机感反而会促进员工的积极性。所以聪明的员工会选择努力工作引起领导注意而得到加薪。 案例四、 在现实生活中,我们随时随地都在扮演着“小猪”或就是“大猪”,进行着一场场“智猪博弈”,只就是我们并没发现而已。下面将具体从“学生社团”的案例来具体说明“智猪博弈”在生活学习中的存在性以及其作用。 在学校,参加社团就是一件很平常的事情,但社团里的那些事情,其实也就是一场场生动的博弈论案例。就我自己的经历来说,大二时我当上了某个校社团的会长,社团里还有多个部长,

博弈论及其应用(期末学习报告)

博弈论及其应用长虹与同行家电业的价格战 姓名: 学号: 学院: 专业:

博弈论及其应用 长虹与同行家电业们的价格战 一、事件背景 由军工厂转型的长虹是国内最早从日本松下引进彩电生产线的企业。1985年,军人气质十足的倪润峰执掌长虹。1994年,长虹在上海证交所上市;1995宣布自己成为“中国最大彩电基地”。 1996年,长虹的指挥官倪润峰决定拿出更大的动作。提出一个令人意外的“产业报国”计划。1996年,本土彩电企业陷入最艰难的苦战时刻,一个潜在的危机正在步步逼近。4月1日开始,彩电的进口关税将大幅下降。3月26日,长虹宣布,所有品种彩电一律大幅度让利销售,降价幅度从8%到18%。随后,猝不及防的其他中国厂家纷纷选择跟进。彩电业的价格大战,就在这样一种“产业报国”的氛围之中,拉开大幕。 价格战刚刚开打一个月,长虹的市场占有率就上升到19%,比降价前增加了7.9%。到年底,长虹坐稳了“彩电大王”的宝座。中国每卖出三台彩电,有一台出自长虹,有一台是外资品牌,还有一台才是其他国内品牌。倪润峰逐渐把国内同行们逼到了死角。在此战之前,国内各省市其实还有60多个地方性的彩电品牌,它们大部分是国有企业,作为当地的支柱产业割据一方,小富即安。然而在长虹的降价冲击下,大多数企业迅速凋零,成为行业重组中一颗颗散落的棋子,只能到长虹、康佳、TCL那里请求收购。彩电业从此步入由五六家大公司瓜分市场的时代。这一年,预算内国有企业的净销售利润率降低到历史最低点,亏损总数是1985年的28.6倍。相比之下,全国乡镇企业的产值增长22%,中外合资企业的所得税增长40%。 1997年,用价格战给中国企业家们好好上了一课的倪润峰被推上了事业的巅峰,1998年,在价格战中得到洗礼的国内同行开始显山露水。1999年,长虹的净利润下降74%;2000年5月,倪润峰卸下总经理职务,退隐江湖。2000年6月9日,康佳和TCL在内的九大国内彩电巨头联手组成价格联盟,准备正面迎击长虹的价格战。2005年4月16日,在这个特意挑选的休市日,长虹公布了2004年年报,抛出中国股市有史以来上市公司亏损之最:36.81亿元。价格战的发明者和坚决的拥护者,为最后的豪赌交出了最昂贵的学费。 二、各方的观点

管理博弈论

管理博弈论 管理博弈论(Game Theory of Management) [编辑] 什么是管理博弈论[1] 管理博弈论也称管理激励与约束机制设计理论,是指管理博弈论是对近年来的管理激励与约束机制设计中不同模型、不同方法研究成果的概括和提炼。所以可以说管理博弈论就是围绕管理激励与约束机制设计的一系列理论与方法,是博弈论在管理学领域的运用与发展。 [编辑] 管理博弈论的产生[1] 现代管理的核心职能是激发人最大限度地发挥主观能动性,创造性地开展工作,这其中自然包含了管理者和被管理者之间的博弈。但由于管理对象是有限理性的社会人,不是理性的经济人;由于管理环境是复杂多变而组织目标是相对稳定的,因而管理活动更具多阶段特性;由于被管理者的需求是多方面的,因而管理激励与约束是多因素的;还由于管理活动通常具有多目标、多层次的特点,使博弈论方法在管理学中的应用远比在其他领域的应用更为复杂、多样。由于引入了管理激励与约束机制设计的概念,使得管理和博弈有了结合部,博突论在管理学的应用有了切入点。之所以说管理激励与约束机制是管理博弈论产生和发展的载体,是由于它既切合管理实践发展需要,又能将个人理性与非理性、优化结果的定量与定性描述、需求的单因素与多因素、管理的单目标与多目标、单阶段与多阶段、单一管理层次与多管理层次有机地结合起来,从而为博弈论在管理学中的应用与发展开辟了道路。 [编辑] 管理博弈论的基本内容 管理博弈论的基本内容包括:需要激励,目标激励,榜样激励,压力约束,纠偏约束。 [编辑] 管理博弈论管理的核心[2]

管理博弈论管理的核心是如何最大限度地发挥主观能动性创造性地开展工作,这其中就包含了管理者与被管理者之间的博弈。现代管理是以人为中心的管理,一个组织内部的效率取决于全体员工的努力水平。因此,激励与约束就成了管理的核心职能。在企业中如何提高员工的素质,如何创造出使员工感到上下级平等的环境,如何达成组织目标和个人目标的统一,这都是一个组织在进行管理的时候考虑如何运用管理激励与约束手段的问题。从社会现实来看,假冒伪劣产品的出现,污染问题,体育比赛中的黑哨问题,运动员的违规问题等等都是管理激励与约束措施不当造成的。建立有效的管理与约束机制已经成为现代管理实践的迫切需要。管理博弈论就是一门关于激励与约束机制体系设计的新学科,它是博弈论在管理应用中的一个重要的、新的分支,管理博弈论进行定量化.模型化研究的基本数学基础就是博弈论。 [编辑] 管理博弈论的学科特点[1] 管理博弈论作为一门以管理激励与约束机制设计为研究对象的新兴学科,有自己产生的时代背景,有自己明确的研究对象与范围,有自己的理论基础,是应管理实践需要而生的。具体而言这门新学科具有如下一些特点: (1)管理博弈论是一门新兴综合性交叉学科。管理博弈论研究的对象是管理激励与约束机制设计,管理激励与约束机制问题往往非常复杂。由于管理者与被管理者之间一般信息是不对称的,他们既可能是合作关系,也可能是非合作的关系,管理激励与约束机制设计中需要综合运用合作博弈、非合作博弈、非对称信息博弈的理论与方法,还可能用到各种现代数学最优化理论,还要以管理学激励与约束理论为指导。因此,管理博突论是由众多学科理论交叉形成的,以特定的管理激励与约束机制设计为研究对象的综合性新学科。 (2)管理博弈论是一门应用性管理类新学科。管理博弈论是根据管理实践的需求而产生发展的,它的问题来源于管理实践,它的研究服务在于管理实践,故而它是一门理论与实践紧密结合的应用性管理类新学科。 (3)博弈模型的机制式表述。博弈论中博弈模型的基本表述形式有战略式表述、扩展式表述;非对称信息博弈论中博弈模型的基本表述形式为特征函数式表述。这些博弈模型的表述形式都是管理博弈论中博弈模型可采用的表述形式,但是,由于对复杂的多目标、多样因素、多阶段博弈难以表述,故其应用具有很大的局限性。为此,管理博弈论提出了适应于解决多目标、多因素、多阶段复杂的管理激励与约束机制模型的基本表述形式——机制式表述。 (4)定性要素研究与定量要素研究相结合。博弈论与非对称信息博弈论中博弈模型不仅可容纳的要素较少,而且要求要素只能是定量的。管理问题中涉及的资源要素不仅多,而且定性要素占的比重很大。不能反映定性要素作用的模型,显然不足以反映问题的全貌,设计出的模型必然是有缺陷的。管理博弈论强调定性要素研究与定量要素研究相结合,在其机制式表述中,通过定性因素定量化,将定性因素纳入模型,研究其作用与影响,力图达到充分全面反映问题的目的。

智猪博弈理论

智猪博弈是经济学中一个很典型的博弈理论,在这个理论中会有许多经典的意义所在,现在让我们来了解一下吧。 【问题】 假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将有10个单位的猪食进入猪食槽,供两头猪食用。 两头猪场面临选择的策略有两个:自己去按按钮或等待另一头猪去按按钮。 如果某一头猪作出自己去按按钮的选择,它必须付出如下代价: 第一,它需要收益相当于两个单位的成本;

第二,由于猪食槽远离猪食,它将比另一头猪后到猪食槽,从而减少吃食的数量。 假定:若大猪先到(小猪按按钮),大猪将吃到9个单位的猪食,小猪只能吃到1个单位的猪食;若小猪先到(大猪场按按钮),大猪和小猪各吃到4个单位的猪食;若两头猪同时到(两头猪都选择等待,实际上两头猪都吃不到猪食),大猪吃到6个单位的猪食,小猪吃到4个单位的猪食。 问:大小猪的最优决策是什么?最后的结果很可能是什么样子的?? 【答案】 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 从这个矩阵上不难看出,小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)是最佳选择。 原因很简单:在大猪选择行动的前提下,小猪选择等待的话,在大猪返回食槽之前,小猪可得到4个单位的纯收益,大猪到达之后只能得

到剩下的6个单位,实得4个单位;而小猪和大猪同时行动的话,则它们同时到达食槽,分别得到1个单位和5个单位的纯收益;在大猪选择等待的前提下,小猪如果行动的话,小猪在返回到达食槽之前,大猪已吃了9个单位,小猪只能吃到剩下的1个单位,则小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 【启示】 博弈与制度 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。 对于企业经营者来说,如何理解博弈论,如何运用博弈论原理指导企业有效管理,这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系,以及在与政府的关系和合作等多方面,博弈论都是企业经营者十分有效的决策工具,或者至少是比较科学的决策思路。

博弈论在经济学中的应用

博弈论在经济学中的应用 刘肃素 (华中师范大学经济与工商管理学院 2011211086) 摘要:博弈论是研究策略博弈的数学理论,亦称对策论。它的作用在于发现普遍有效的博弈原则。在现代经济社会中充满了博弈,这就需要了解博弈的思想,用科学理论来指导行为。博弈论应用于经济学,已经和正在引起现代经济学一系列的发展和突破。博弈论在经济学中所取得的重大进展发现,博弈论方法越来越成为经济学研究的主流方法。随着博弈论在现代经济学中的运用和研究的深化以及经济复杂性现象的不断涌现,博弈论的经济学研究呈现出合作化、对称化和连续化的发展新趋势。 关键词:博弈论经济学对策论应用 Abstract:game theory is the mathematical theory of research strategy game, which is also called game theory. It is found that the average effective principles of game. In the modern economic society is full of game, this game, you need to understand in a scientific theory to guide behavior. Game theory is applied to economics, has been and is causing a series of modern economics development and breakthrough. Major progress was made in the game theory in economics, found that the game theory method is becoming the mainstream in the economics research method. With

用博弈论分析生活中的现象

上海第二工业大学 2012-2013学年第二学期 用博弈论分析生活现象论文

博弈论分析生活中现象 博弈论它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域,主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,博弈论就是分析博弈行为和博弈决策的一门科学。其实博弈现象不只现身于经济领域对于我们日常生活中也是处处可见的,所以博弈论的思想不仅仅能够用来分析经济从而获得最大的盈利,我们也可以尝试将博弈论的思想运用到生活实践中从而获得最优的策略。 比如某一天你觉得应该是你女朋友的生日,但又不能肯定,如果是女朋友的生日的话,你可以送一束花,女朋友会特别高兴,你不送花,女朋友会埋怨你忘了她的生日如果不是女朋友的生日的话,你可以送女朋友一束花女朋友感到意外的惊喜,你不送花结果生活同往常一样。 生日非生日 买花 1 ,1 2 ,1 不买花-1,-1 0 ,0 确定今天是女朋友的生日或确定今天不是女朋友的生日,但你的最好行动都是买花。 谈到博弈论我们不得不说到囚徒困境,其内容大致为两名罪犯A 和B隔离审讯。如果两个都不招,因为证据不充分,两人都只能判1年。如果一方招了,属立功表现,功罪相抵,无罪释放;而另一方则属抗拒从严,判10年刑但如果两人都招了,则各判 5 年。结果大家都知道:两个人争先恐后地招了,结结实实地各判了5年。两个犯

人陷入的就是囚徒困境, A B 招不招 招 5 ,5 无罪释放,10 不招10,无罪释放 1 ,1 其结果就是A和B都招,判5年刑。如果两人协商后选择不招,但如果A或B其中一人招了,另一人就会判10年,而招的一人就会无罪释放,这样的诱惑足以让两名罪犯违背两人协议。而选择招。这样最有可能就是俩人都招。 人际交往中的博弈 人与人之间的相互矛盾和相互冲突的关系实际上就是一种博弈关系。矛盾冲突的结果也有三种情况负和游戏、零和游戏和正和游戏。“负和游戏”是一种两败俱伤的游戏故也称为双输博弈。在人与人的交往时由于相互的冲突和矛盾不能达到统一交际双方都不让步,最后使交际活动不能展开,结果是交际的双方都从中受损两败俱伤。如果是朋友,也会因不断发生“负和游戏”而逐渐疏远,夫妻间经常出现“负和”现象感情自然会受到影响。交际中之所以经常会发生“负和博弈”现象,大多是因为心胸狭窄,遇事爱使性负气,必然会出现“负和”局面。如果不使性负气,而是互相谅解,与人交往采取合作态度,便能使有矛盾和冲突的交际活动朝好的方向发展。在交际中如果遇到了和交际对象发生冲突的时候能够想着退一步海阔天高,采取一种和对方合作的态度就一定能避免交际中“负和游戏”的发生。至于“零和游戏”这种简单的“你输我赢”的思考方式往往会给人们带来更大的麻烦。其实在人与人之间的交往中双方的关系并不是简单

《经济博弈论》期末考试复习解析

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

智猪博弈理论

智猪博弈理论 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 目录 介绍 博弈与制度 由智猪博弈故事得到的启示 编辑本段介绍 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 小猪 行动等待 大猪行动5,14,4 等待9,-10,0  从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。

在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。 编辑本段博弈与制度 由智猪博弈故事得到的启示 在这个例子中,对小猪而言,无论大猪是否踩动踏板,不去踩踏板总比踩踏板好。反观大猪,明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。 对于企业经营者来说,如何理解博弈论,如何运用博弈论原理指导企业有效管理,这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系,以及在与政府的关系和合作等多方面,博弈论都是企业经营者十分有效的决策工具,或者至少是比较科学的决策思路。 还有一个经典案例,是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只是运送犯人的费用要等到犯人送到澳洲后才由政府支付给商船。仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。 关于这一问题,现任招商局掌门人秦晓先生在最近做客央视《对话》节目时,也谈了他的一些看法。他认为:企业领导人应该去制定游戏规则,而不应该单纯地去做裁判。他觉得制度应当比个人的权威

初探博弈论及其应用【开题报告】

毕业论文开题报告 信息与计算科学 初探博弈论及其应用 一、选题的背景与意义 在人类历史上,很早就有了博弈思想的故事,如众所周知的“田忌赛马”。在社会生活中,我们也能碰到类似的情形和现象,如下棋、打扑克、猜拳等想用自己的战术去取胜,这就是所谓的博弈现象。博弈论是研究理性的个体在相互依存时如何做出决策的一门理论知识,主要是强调决策主体的行为而引起的直接相互作用。 上世纪80年代以后,博弈论经历了突飞猛进的发展,主要是在经济方面的发展,越来越多的人把它归为主流经济学的重要组成部分。不仅是在经济上有广泛的应用,而且在军事、信息、政治等方面也能看见它的影子。1994年的诺贝尔经济学奖获得者就是三位博弈论的专家。以后又有三次奖授给了与博弈论有关的专家。在我国,经济学界对经济博弈论的关注和兴趣也在迅速增强。由于博弈论应用的广泛性和实用性,越来越来多的人开始学习和研究博弈论。可以说,博弈论正将进入一个崭新的阶段。 二、论文的主要思想 博弈论研究理性的个体在相互依存时如何作出决策。因此博弈论在研究时需要作出一定的假设,当然也包括一些基本定义。所以本文从介绍博弈论的基本假设和基本概念开始,在对基本概念了解的基础上学习博弈论中的经典模型,从中学习博弈过程中的双方博弈思维,然后再选取一些实际中的例子,运用所学的博弈论思维,从博弈双方的角度考虑得出该做出何种决策。 三、研究的步骤及方法 研究步骤 1. 1.10——1.20 明确毕业论文的设计方向,查阅文献资料,完成开题报告。 2. 2.10——2.25 撰写文献综述,翻译外文资料。 3. 2.26——3.05 列出论文正文部分的撰写提纲。 4. 3.06——4.01 撰写论文初稿。 5. 4.02——4.20 根据指导老师的建议进一步修改。 6. 4.21——4.27 论文定稿,装订成册,按时完成其它各项任务,准备答辩。 研究方法

博弈分析及其应用

博弈分析及其应用 1引言 在社会生活和经济、军事活动中,经常碰到各种各样具有竞争或利益相对抗的现象,如下棋、打扑克、为争夺市场展开的广告战、军事斗争中双方兵力的对垒等,竞争的各方总是希望击败对手,取得尽可能好的结果,都想用自己最好的战术去取胜,这就是博弈现象.博弈现象实际上是一类特殊的决策,在关于不确定型的决策分析中,决策者的对手是“大自然”,它对决策者的各种策略不产生反应,更没有报复行为.但在博弈现象中,代替“大自然”的是有理性的人,因而任何一方做出决定时都必须充分考虑其他对手可能作出的反应.博弈论的英文名为Game Theory,又称对策论,用比较简短的话来概括,所谓博弈是指局中人按一定规则,在充分考虑其他局中人可能采取的策略的基础上,从自己的策略集中选取相应策略,并从中得到回报的过程.尽管博弈论中研究的问题形形色色,但任何一个博弈问题都包含下列三个要素: 1.局中人(players)是指参与竞争的各方,它可以是一个人,也可以是一个集团,但局中人必须是有决策权的主体,而不是参谋或从属人员.局中人可以有两方,也可以有多方.当存在多方的情况下,局中人之间可以有结盟和不结盟之分. 2.策略(strategies)是指局中人所拥有的对付其他局中人的手段、方案的集合.在静态博弈中,策略必须是一个独立的完整的行动,而不能是若干相关行动中的某一步.例如一次乒乓球男子团体比赛中,包括两名单打和一对双打选手出场,比赛前提交的名单除规定出场球员姓名之外,两名单打还必须明确谁是第一单打,谁是第二单打,这样不同单打和双打队员的出场搭配以及两名单打队员的不同排序构成了不同的策略.相应每个局中人的策略选择形成的策略组称为一个局势. 3.收益函数(payoff function)指一局博弈后各局中人的输赢得失,通常用正的数字表示局中人的赢得,负的数字表示局中人的损失. 博弈论研究决策主体的行为在发生直接相互作用时,人们如何进行决策以及这种决策的均衡问题.博弈论是研究理性的决策之间冲突与合作的理论.在博弈论分析中,一定场合中的每个对弈者在决定采取何种行动时都策略地、有目的地行事,他考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化.由于在现实生活中人们的利益冲突与一致具有普遍性,因此,几乎所有的决策问题都可以认为是博弈.博弈论在政治学、军事学、生物进化学、心理学、社会学、伦理学、经济学等许多领域都有着广泛的应用.在经济学中博弈论作为一种重要的分析方法已渗透到几乎所有的领域,每一领域的最新进展都应用了博弈论,博弈论已经成为主流经济学的一部分,对经济学理论与方法正产生越来越重要的影响.正因为如此,1994年瑞典皇家科学院决定将诺贝尔经济学奖授予了纳什(John Nash)、哈萨尼(John Sanyi)和泽尔腾(Reinhard Selten)三位博弈理论家和经济学家,表彰他们在博弈论理论和应用研究方面作出的杰出贡献.目前博弈论在定价、招投标、谈判、拍卖、委托–代理以及很多重要的经营决策中得到应用,它已成为现代经济学的重要基础. 博弈中有关局中人的策略集、收益函数等构成了博弈的信息.按局中人对信息掌握情况,可区分为完全信息博弈和不完全信息博弈.按局中人采取行动的次序,当同时采取行动或在

相关主题
文本预览
相关文档 最新文档