当前位置:文档之家› 国际关系博弈论

国际关系博弈论

国际关系博弈论
国际关系博弈论

西方国际关系理论博弈论(2007-03-17 10:22:31)转载分类:管理理论

一、前言

博弈论是科学行为主义学派极为推崇的一种理论框架,它包含研究“合理行为”的策略和方法,是游戏规则和策略选择的统一。

博弈论萌芽于18世纪初,但其真正的发展还在20世纪。20世纪20年代,法国数学家布莱尔用最佳策略法研究弈棋和其它具体的决策问题,并从数学角度作了尝试性的分析。第二次世界大战期间,博弈论的思想方法、研究手段被运用到军事领域和战时的其他活动中,显示了它的重要作用。1944年约翰·纽曼和摩根斯坦合著的《博弈论与经济行为》一书的出版

标志着博弈理论的初步形成。纽曼和摩根斯坦认为,博弈论是关于运用数学方法研究处于利益冲突的双方在竞争性活动中制定最优化的胜利策略的理论,博弈方法即根据游戏规则选择处理竞争、冲突或危机的最佳方案。

事实上,我们在日常生活中经常需要先分析他人的意图从而做出合理的行为选择,而所谓博弈就是行为者在一定环境条件和规则下,选择一定的行为或策略加以实施并取得相应结果的过程。

博弈论的目的在于向行为者表明:在所有理性参与者都想获胜或是受益最大化的情况下,他们可以根据博弈论计算方法找到一种最有力的途径。

20世纪50年代以后,国际关系理论学者在运筹学的博弈概念基础上综合运用心理学、统计学、社会学和策略学等原理,逐步形成国际关系学的博弈论。其主要代表著作有:托马斯·谢林的《博弈:冲突策略》、约翰·哈森尼的《博弈论与国际冲突分析》。学者们从不同角度阐明和丰富了博弈论的内容。他们强调指出:博弈论既是研究国际冲突的策略理论,又是处理国际关系的实际手段,其目的是为行为者在面临危机和冲突时设计各种合理选择和理性行为。

二、博弈理论的一些基本概念

(一)定义:

博弈论,又称对策论或游戏理论。它原是数学运筹中的一个支系,用于严格的处理在战略博弈中参与者最理想的行为和决定拮据的均衡,或是使具有理性的竞赛者找到他们应采用的最佳策略。在博弈中,每个参与者都在特定条件下争取其最大利益。博弈的结果,不仅取决于某个参与者的行动,而且还取决于其他参与者如何行动。不同参与者有时利益一致,有时又彼此对立。

(二)博弈论的两个基本假设:

1、争各方在安排其优先选择,估算的是和估计对方选择时都是符合理性的;

2、每个竞争者的战略和决策都取决于另一个(或其余多个)竞争者的战略与决策。

博弈的定理使人和理性策略均以最小最大值为基础。即:每个竞争者都力求使其能确保的最小收益达到最大限度,或使其必须遭受的最大损失减少到最小限度。

(三)博弈论的几种类型:

1、双方零和,即一方所得为另一方之所失,双方互相抵消。

(正负相抵消原理,为最简单、无意义的,基本上是不存在的零和。)

2、双方非零和,即一方所得并非另一方之所失,双方都可能赢或输。

(更多运用在我们做选择时的考虑,是一种可能性的存在,在“谁是懦夫”中用到。)

3、“多方零和”,游戏中有若干个竞争者,在游戏中的是相抵。

(即相互遏制原理→一个暂时的博弈状态)

4、“多方非零和”,即若干个竞争者之间得失不相同,得与失之和不等于零。

(层次越来越复杂,最有意义的,好理解,在国际关系中经常碰到。)

(四)博弈论将国际政治的竞争分为三类:

1、利益一致的竞争(较难理解。利益和收益是不同的,利益是前提,收益是目的。利益一致即目标一致,很显然在国际竞争中收益是不对称的,这与国家的实力相关联→实力强,收益大)

2、利益对立的竞争

3、混合利益的竞争(主要在国际合作中,参与方掺杂了许多国际组织,不光是国家→不纯粹是政治或经济利益→导致利益的复杂性)

多数情况下,博弈论所涉及的是混合利益的竞争,既竞争者的利益某些方面一致,在其他方面有不一致。竞争者之间既可能合作,也可能不合作。

(五)博弈包括的几个要素:(展开博弈必须具备的条件)

1、弈者,每场博弈都有两个以上弈者组成;

2、受益,由于行为者的价值体系不同,收益也不同;

3、规则,只有遵守规则才能使博弈正常进行;

(若要展开一场游戏,必须要在一定的游戏规则下进行。否则失去了意义,游戏就不存在了。只有在游戏确定了一个规则之后,博弈才能展开。)

4、信息条件,它决定每一行为者对博弈环境以及其他行为者的选择所掌握的信息数量和质量;

5、每一行为者拥来达到目的的战略;(中心环节)

6、进行博弈的整体环境,不论行为者是否对此有充分的认识;

7、动态的相互作用,在这个国层中,一方的选择可能促使对方改变选择。(如:美伊战争→若伊拉克承认有核武器,战争可能会讨价还价,甚至避免战争爆发→单方面坚持,美国有了借口→这是一个动态过程,双方都可以改变自己的选择)

环境、条件、动态的相互作用等方面的信息是重要的决策依据和决定博弈结构的重要因素。但博弈者得到的信息往往是有限的,一般很难确切知道对方的实力、意图和战略战术,在这种条件下,博弈者可以根据博弈论的原理找到一个最佳的策略或策略组合,有的也可以在动态或多次重复的博弈过程中使决策合理化。

一国具体政策不可能分毫不差地同既定目标保持一致,但从长期来看,一国的政策目标是相当稳定的,其变化一般非常缓慢。此外,很多外交决策是在仔细权衡了利弊得失之后作出的,这正符合“合理行为”的分析模式。

(六)博弈的基本形式

1、零和博弈:两方零和博弈、多方零和博弈

2、变数博弈:两方变数博弈、多方变数博弈

三、博弈模式

·谁是懦夫(胆小鬼)博弈

·囚犯困境

·猎鹿博弈

一、谁是懦夫(胆小鬼)博弈

B

b1(让路) b2(不让路)

②a1b1

(双方让路)

+10

(赢)

③a1b2

(A让B不让)

(输)

—10

—10

(输)

④a2b1 (A不让B让) (赢)

+10

—100 (死)

①a2b2 (相撞) (死)

—100

a1

(让路)

A

a2

(不让路)

最合理的为②,②为观望状态,较温和,是保守做法。在国际冲突中,最安全、最稳妥的做法即为最保守的做法。

根据博弈论假设第二条→③④以自己的出发点考虑→最大值最小值问题→最有利的两种状况→不知他人如何想→不理性的选择

②→谁向前走?停下来干什么?

①③④都有可能导致战争,②只是等一下,以便更好的协调。

例如:古巴导弹危机→若最后一刻苏联不让步,危机则会演变为战争,而且是核战争→危及全世界

朝核危机→有冲突发生的可能→各国观望→让步→开会、协调→开会稳妥,开战不稳妥

二、猎鹿博弈(较简单的一种类型)

A

假设A、B、C三方(总称D→围猎者)

守住三个出口,E为鹿。

E

B C

D:A、B、C→目标(利益)一致:抓鹿→如何获得鹿?

结果有三种:

①真正意义的合作:一起来抓鹿

1、A、B、C合作→

②先守住出口,围住鹿,再观望协调(“谁是懦夫”)

2、A、B、C各自抓鹿

3、三方互不合作,看到其他更有价值的动物而去抓其他动物去了→导致鹿自己逃跑

这三种结果的风险和安全性:

1、最安全。

抓住:收益最大

2、假设B先擅自行动单独抓鹿不如先大家一起协调合作抓鹿

抓不住:什么也得不到

虽然获得的不是一只完整的鹿,但总比什么也得不到的好。

3、三方不合作→是因为等的时间太长,把注意力转向其他动物→这往往由于第一种情况合作不力(利益分配不好,出现矛盾)而导致的。

(当然,也会出现某一方吃“回头草”的情况,捡到便宜。)

三、“囚犯困境”博弈

B

b1(拒绝交待) b2(交待) —10

(关押1年)

①a1b1

(双方拒绝交待)

(关押1年)

—10

+50

(关押3个月)

③a1b2

(A不交待B交待)

(关押10年)

—100

—100

(关押10年)

②a2b1

(A交待B不交待)

(关押3个月)

+50

—50

(关押5年)

④a2b2

(双方都交待)

(关押5年)

—50

a1

(拒绝交待)

A

a2

(交待)

②→A收益> B收益(A可以减刑)

③→A收益< B收益

④→A收益= B收益(对等,“各打50大板”)

①→谁也不让步→观望态度→缓和,有可能采取协调方式

安全和风险:④最保险

②→双方合作最不可靠→信息条件不发达→不知道另一方是否会出卖自己→订立攻守同盟太冒险

当面对现实利益时,往往会先考虑自己如何获得最大利益,再去考虑合作的问题。

所谓合作局面,仍然是为下一轮竞争作准备的,合作只是暂时的,是双方为了暂时的利益而合作的。

例如:美苏军备竞争→美苏双方互不信任→采取①②③→愈演愈烈

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论案例分析

博弈论 博弈论(Game Theory),亦名―对策论‖、―游戏理论‖,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们―出棋‖ 招数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。现在,我们就一些例子来讨论博弈论相关内容。 一、从“囚徒困境”开始 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的―囚徒困境‖(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 表囚徒困境博弈 [Prisoner's dilemma] 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择―坦白‖总是最优的。显然,根据对称性,B也会选择―坦白‖,结果是两人都被判刑8年。但是,倘若他们都选择―抵赖‖,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,―坦白‖是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲―囚犯的两难处境‖的例子,每本书上的例子都大同小异。 话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

博弈论与社会选择中的理性

博弈论与社会选择中的理性 第一讲个体理性决策与博弈论 经济学的两个基本观念:理性(rationality)与折中权衡(trade-off) 什么意义上,我们可以运用理性选择理论,实现什么目的?描述或解释人类行为,进行机制设计的基础 行为者(决策者、博弈者)对所处场景的主观认知:物我两分;形式系统及其解释 有界理性: 理论性概念与经验性概念:Craig定理 社会物理学:个体理性决策、博弈论与社会选择,机制设计 社会科学的两大基石:博弈论与社会选择 博弈论的两个互补观念:协调性与稳定性(稳健性) 作为描述性理论的as if解释:图灵实验 描述性与规范性之间的不协调 个体理性决策

阿罗:“方法论个人主义的当代形式是博弈论”,“所有解释都必须以个人之间的行动和对行动的回应的方式进行”(Arrow, 1994, p5, p1)。 “我们研究的模型假设每个决策者在如下意义上是理性的,他知道他的可选择对象,形成关于任何未知事物的预期,具备清晰的偏好,在某些优化过程后深思熟虑地选择他的行为”(Osborne & Rubinstein, 1994, p4)。 选择、偏好、效用 选择:一致性(consistency),弱显示偏好公理 偏好: 完全性:不能不选择 传递性: R A x M∈ ? A = ∈ A , y } : { , (xRy ) x R A G? = A ∈ ? ∈ { y , } ) : A (yPx , Rational Fool :tie-breaking 布里丹的驴子 “全局理性”:How to decide … how to decide to how decide rationally Herbert Simon:“bounded rationality”;满意原则(秘书问题),是一种进化出来的能力而非计算的结果 选择规则 如果假设一个决策者对所有备选方案都是无差异的,那么任何行为都可以被理性化。但是,理论的强度越弱,预见性也越差。 满足连续性的偏好可以被一个效用函数所表示。 偏好和效用反映了行为主体的主观性判断。利己主义、利他主义与妒忌型人格可以被区分开。 不确定环境(行动与结果之间的对应关系)下的决策 个体知识的划分(partition)刻画:非幻觉性;如果你知道某事,那么你知道你知道某事;如果你不知道某事,那么你知道自己不知道某事 风险、不确定性、无知 两类模型,决策者在两类模型中都是在彩票中进行选择。概率(probability)模型定义的彩票是彩金的概率分布,适用于描述客观未知(objective unknowns)情形,即奈特所谓的风险(risk)和(Anscombe & Aumann ,1963)中的轮盘(roulette)彩票;状态变量

博弈论在管理制度中的应用

博弈论在管理中的应用

————————————————————————————————作者:————————————————————————————————日期:

博弈论在管理中的应用 不知道大家有没有为这些事情困惑过:为什么员工技能竞赛,技能比拼很难开展,即便开展了,为什么工作效率也没有像预想的那样提高?为什么企业中总有些人拖大家的后退而不努力工作?为什么有的领导手段强硬,有的领导风格怀柔?你是否为“办公室政治”烦恼不已?你有没与遇到过和你看法不一致,总是与你针锋相对的下属?遇到强硬的下属你该怎么办?为什么酒店联盟或者企业间的联盟总是很难做?你是否在做决策之时衡量反复却不知道选择何种策略?。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理?你如何提出科学而又合理解决方法? 以上种种问题,你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识,并以隐藏在我们身边的博弈为例子,给大家提供解决某些实际问题的思路。 那么什么是博弈论呢?所谓博弈论,就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式,既谋略性思考问题的方式。对博弈论通俗的理解就是,关于人与人的斗争中“老谋深算”的学问。 假如你正跟恋人用手机通电话,突然信号断了。这时你是会立即拨电话过去,还是等你的恋人拨电话过来?很显然,你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨,那么另一方最好是等待;如果一方等待,那么另一方最好拨过去。如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中消逝。 这,就是博弈。

博弈论知识点总结

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己 的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处 环境以及其他参与者的行为形成正确的 信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完 全信息)等的信息。

1、

2、 既定下,消费者效用只依赖于自己 的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅 选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相 比,扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论在现实社会经济生活中的意义

【内容提要】博弈论研究的是把自己的策略建立在假定对手会按其最佳利益行动基础上的策略理论。博弈论在现实社会经济生活中有着广泛的适用范围。本文从博弈论的含义入手分析了博弈论的基本原理,并在此基础上针对一些现实社会经济生活中的问题,运用博弈论加以分析和思考。文章认为应该借鉴博弈论为我国经济建设服务。【关键词】博弈论社会经济生活市场有人说经济学就是一门研究如何做出选择的学问。在现实的社会经济生活中企业或个人为了自身利益的最大化面对市场会做出自己的最优决策。不同的市场情形会影响经济主体人的决策行为。在完全竞争市场条件下,企业会根据给定商品的市场价格计算出生产和供应到市场上的商品的数量,以实现最大的利润。而寡头市场的情形要比完全竞争市场复杂的多。企业大量面对的是信息不完全的市场。企业不知道面对强大的竞争对手该如何做出抉择。市场的时效性又要求企业必须在信息不完全的情况下做出决策。在这样的决策中存在着三个合理的假设为前提。第一是理性的“经济人”。每一个行为主体都依据自身利益的最大化作为行动的出发点。第二是每一个行为主体做出的决策都不是在真空的世界中。现实的世界使得一个人的生存必须以他人的生存为前提。这种相互依赖的关系使得一个行为主体的决策会对其他为主体产生重要的影响,同样其他行为主体的决策也会直接影响着这个行为主体的决策结果。第三是寡头市场的情形。也即一个行业里面只有少数几家企业,甚至只有两三家企业,每一方的市场份额都很大。由于竞争对手很少,每一个主体的行为产生的后果受对手的行为的影响都很大。那么这样的决策就带有了博弈的色彩。一、博弈论释义博弈论(gametheory)所分析的就是两个或两个以上的比赛者或参与者选择能够共同影响每一个参加者的行动或策略的方式。博弈论的核心思想是:假设你的对手在研究你的策略并追求自己最大利益行动的时候,你如何选择最有效的策略。举例说明:(一)、囚徒困境“囚徒困境”说的是两个囚徒一起做坏事,结果被警察发现抓了起来,进行隔离审讯。如果他们都承认犯罪,每人将入狱三年;如果他们都不坦白,由于证据不充分,每人将只入狱一年;如果一个抵赖而另一个坦白并且愿意作证,那么抵赖者将入狱五年,而坦白者将得到宽大释放。这样两个囚徒面临着如何选择的问题。从表面上看,他们应该互相合作,保持沉默,以便能得到自由。但他们不得不仔细考虑对方可能采取什么样的选择。甲犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后获释而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以甲犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个获释出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,甲犯也只需服刑三年而不用五年。同样乙犯也会有这样的想法。结果只能是两个囚犯都坐牢服刑三年。用矩阵图形来分析两个囚徒选择的根据。[!--empirenews.page--]乙坦白抵赖35坦白30甲01抵赖51囚徒困境图示(图中左下方的数字代表甲犯入狱的年限,右上方的数字代表乙犯入狱的年限)对于甲来说不管乙采取什么策略,他选择坦白总是比较有利的。同样对于乙来说选择坦白也是比较有利的。在图中我们设想一下甲面临的选择。甲犯如果坦白,不论乙采取怎样的选择,甲的选择总是最好的。甲如果抵赖,不论乙采取怎样的选择,甲的选择总是最坏

浅谈博弈论中的囚徒困境的解决方法

浅谈博弈论中的囚徒困境的解决方法 摘要:囚徒困境是博弈论中的一个重要范例,这个问题涉及各个领域。本文通过三个简单的实例,来谈谈解决的方法。 案例一:一个面馆的囚徒困境 我曾经在路边一个小店里吃面,由于当时客人不是很多,就顺便与小老板聊了起来。通过老板的介绍听出了一些门道。以前面馆开店的时候请了一个师傅,开始的时候为了调动他的积极性他们采用按销售量分成,一碗面给5毛钱提成。这样的话,客人越多他挣得也就越多,为了吸引更多的顾客,他在碗里放很多的肉来吸引回头客,一碗面才6块钱,本来就靠薄利多销,他放的肉多,面馆自然也赚不到钱。后来呢,就换了一个结算方式,给厨师发固定的工资,这样客人多少跟他没有什么关系,但是新的问题又出现了,这次他在碗里放肉放很少,基本上把所有的客人都赶走了。客人少了,他就轻松了啊反正他拿的是固定的工资。通过这个案例我们可以了解到面馆的老板与厨师在工资的分配上存在一定的分歧,由于没有处理好,使得双方都处在不利的结局。 解决方法:面馆的老板应该对厨师明确,每碗面的元材料是固定的,大师傅的工资还是按照销售量提成走,但是前题是每个月使用的原材料不能超额,否则只有基本工资。或者就规定每碗面里就放多少克肉。此外,还有一个更简单的办法就是:面馆的小老板亲自放肉。因为关键的资源一定要掌握在关键的人手里。 经过以上的分析,我们可以得知解决的方法:1.工资加提成的制度确实能调动员工的积极性;2.权利下放可以,但是要有度;3.员工的工资提成不能只和销量挂钩,应该和老板的利润挂钩。4.有效的沟通、激励,平时给员工传达精神的奖励,让员工认为自己也是公司的主人。 案例二:小餐馆的囚徒困境 在天津新建的一片经济适用房社区里有两家小餐馆,他们都是经营当地的家常炒菜及快餐。因为这里是新开发的经济适用房,而周边像小饭馆这样的生活配套设施很缺乏,所以附近的建筑工人都是在这两家小饭馆解决三餐。 这两家餐馆因为在口味、价格、菜的品种等都基本相同,所以一直以来这两家面对都是这些人,营业额都差不多,而附近的建筑工人们对于吃饭也没有什么特殊的爱好。好景不长,就在今年的夏天,两家餐馆的其中一家,暂且称为A

博弈论重点

第一章 1.囚徒困境的均衡是:剔除严格劣势策略 2.猜硬币的均衡是:纯策略纳什均衡 3.博弈的基本要素(填空): 博弈的标准式表达包括以下八个基本要素: 1. 博弈的参与者(Players) 2. 各博弈方各自可选择的全部策略(Strategies)或行为(Actions)的集合 3. 进行博弈的次序(Orders) 4. 博弈方的得益(Payoffs) 5.博弈行为(action) 6.博弈信息(information) 7.结果(outcome)* 8.均衡(equilibrium) *-分析追求的结果 理性假设:参与者聪明的,利己的;聪明人假设 4.博弈的分类(填空) 1.按照博弈者的先后顺序,博弈持续的时间和重复的次数进行分类,博弈可以划分为静态博弈(Static game)和动态博弈(Dynamic Game)。 动态博弈是指在博弈中,博弈者的行动有先后顺序(Sequential-Move),且后行动者能够观察到先行动者所选择的行动或策略,因此, 动态博弈又叫做序贯博弈。 动态博弈的一类特殊形式叫做重复博弈(Repeated Games),又分为有限次重复博弈和无限次重复博弈。“有限次重复博弈”(Finitely Repeated Games)“无限次重复博弈”(Infinitely Repeated Games)。 5.策略表达方式:1)矩阵式(静态博弈)2)扩展式(动态博弈) 第二章 1.占优策略均衡(不需要理性人假设) 2.求严格下策消去法(填空或计算) 所谓“严格劣策略”(Strictly Dominated strategies)是指:在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略。 思路: 1、先找出某个参与人的劣策略(假定存在),把它剔除,重新构造一个不包含已剔 除策略的新博弈; 2、然后再剔除新博弈中某个参与人的劣策略;…… 3、直至剩下一个唯一的策略组合。该策略组合就是博弈的均衡解,称为“重复剔 除的占优策略均衡”。 3.纳什均衡(问答或填空)

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论在管理中的应用

管理中的博弈论 在博弈中,你必须考虑对方的选择来确定你的最优选择,而对方也必须考虑你的选择来确定他的最优选择,你从博弈中得到的赢利——或者说是利益,不仅取决于你自己的行动,也取决于对方的行动,而对对方来说也是如此,你们当中的每一方都试图尽可能的使自己的利益最大化。总之,你们的行动既互相影响又相互依赖,这正是博弈最本质的特征。 在一场博弈中,每个人的目标都是其利益的最大化。在博弈理论中,有一个基本的假设,就是人们不会有道德,良心和情感上的考虑,所有的一切都只以是否符合自身利益作为选择标准。不过我们有时候也会从心理上、情感上对这一假设进行修正。不过,这种假设在绝大多数情况下是成立的。虽然我们研究的是对抗性行为,但是我们不要寄希望于博弈论可以使你所向无敌,不过博弈论确实可以增强你对某些局势的洞察力,因为它有自己独特而又保持逻辑内在一致性的思考方法。 我们来看一个现实的例子。 一个经理,为了提高工作效率而让手下有两个主管进行比赛,获胜者将得到一笔奖金。如果这两个员工都拼命工作,那么每人都有1/2的概率得到奖金,但是每个人也都会承受艰苦工作而带来的负效用,而经理自然可以得到好处。但是这两个员工实际上也可以合谋而皆不努力,这时他们两个得到奖金的概率仍然是1/2,但是谁也不需要承担艰苦劳动所带来的负效用,这使得每个员工都从合谋中得到了好处。不过,经理遭殃了,因为预期的工作效率下降了。假如你是这个经理,你会怎么做? 有什么办法来防范合谋呢?大家可能会想到监督。监督的确可以防范合谋,但是进行有效的监督是很困难的,一是监督者也有可能与被监督者合谋,二是对于隐性的默契合谋,监督对此无能为力。那么有什么办法来防范合谋呢?一个办法就是对员工进行歧视。比如,两名员工是一男一女,那么这个歧视的方案是男员工在比赛中胜出将获得100元,而女员工则只能获得50元。这个方案会导致女员工不努力,而男员工为了胜出将努力而不与女员工合谋。实际上,组织正是通过打击某些员工而拉拢另一些员工来瓦解员工之间的合谋行为的。 不过,这个方案有个问题,她会使被歧视员工不再努力,另外由于法律的相关因素,这样的显性歧视方案不会被广泛采用。我们可以借鉴的是隐形歧视理论。比如在组织中两个员工为了争夺一个更高的职位而竞争。显然,两个员工也可以合谋而不努力,让老天来决定谁来得到这个岗位,并且约定,不管是谁得到这个岗位都需要对对方进行补偿。这个问题仍然

博弈论重点

博弈论期末复习要点 纳什均衡(P52):指的是参与人的这样一种策略组合,在该策略组合中,每个人的策略都是最优的,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略。 完全信息(P34):各个博弈方都完全了解所有博弈方在各种情况下的得益状况。 上策均衡(P41):在某个博弈中,如果不管其他博弈方选择什么策略,一博弈方的某一个策略给他带来的收益始终高于其他策略,至少不低于其他策略。 帕累托上策均衡(P92):多个纳什均衡的某一个均衡策略给所有博弈方带来的得益都大于其他所有纳什均衡带来的得益,则各个博弈方都会倾向于此纳什均衡的策略,博弈能够实现帕累托效率。 聚点均衡(P97):在多重纳什均衡博弈中,双方同时会选择一个聚点构成的纳什均衡。 合并均衡(P268):具有完美信息的博弈方在博弈中,不管自己情况如何,都采取相同的市场均衡。(在合并均衡中,完美信息博弈方的情况不同,并不会导致他们的行为不同,因此他们的行为不会给不完美信息的博弈方透露任何有用的消息) 分开均衡(P268):在不同情况下,完美信息博弈方所采取完全不同的市场策略。(在分开均衡中,由于博弈方的情况不同,采取的不同的市场策略,因此完美信息博弈方的策略可以完全反映他的情况,因此能够给不完美信息博弈方的“判断”提供充分的信息和依据) 海萨尼转换(P292):将得益不了解转化为类型不了解的基础上,进一步将不完全信息静态博弈转化为完全但不完美信息动态博弈进行分析的思路。 完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全了解的博弈。 不完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全不了解的博弈。 混合策略(P72):博弈方以一定的概率分布在可选策略中随机选择的决策方式。 一致性预测(P53):如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略。简单来说,各个博弈方的实际选择行为与他们自己的预测是一致的。 严格下策反复消去法与纳什均衡的关系(P55): (1)在n个博弈方的博弈G={S1,…,S n;u1,…,u n}中,利用严格下策反复消去法排除了除(s1*,…,s n*)之外的所有策略组合,那么(s1*,…,s n*)一定是该博弈唯一的纳什均衡; (2)在n个博弈方的博弈G={S1,…,S n;u1,…,u n}中,如果(s1*,…,s n*)是G的一个纳什均衡,那么严格下策反复消去法一定不会将它消去。 动态博弈中引入纳什均衡的原因,他与纳什均衡的关系(P119): 子博弈完美纳什均衡即动态博弈中具有这样特征的策略组合;它们不仅在整个博弈中构成纳什均衡,而且在所有的子博弈中也都构成纳什均衡。在动态博弈分析中引进子博弈完美纳什均衡概念的原因在于,动态博弈中各个博弈方的行为有先后次序,因此往往会存在相机抉择问题,也就是博弈方可能在博弈过程中改变均衡策略设定的行为,从而使得均衡策略存在可信性问题,而且纳什均衡无法消除这种问题,只有子博弈完美纳什均衡能够解决它。 子博弈完美纳什均衡一定是纳什均衡,但纳什均衡不一定是子博弈完美纳什均衡。因此一个动态博弈的所有子博弈完纳什均衡是该博弈所有纳什均衡的一个子集。 有限次重复博弈与无限次重复博弈的区别(P188): 从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中

博弈论分析

中美军备竞赛的博弈分析 1.理论介绍 1.1博弈论的概念 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 1.2博弈论的主要特点 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。 具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。 1.3博弈的分类 博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。 目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(sub game perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。 博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型等等。 1.4纳什均衡 纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方

博弈论视野下的社会福利

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 博弈论视野下的社会福利 博弈论视野下的社会福利博弈论视野下的社会福利作者:柯华庆来源: 学习时报字数: 2583 转变经济发展方式、完善社会主义市场经济体制需要一系列配套制度才能实现,而社会保障制度无疑是其中重要一环。 例如国家要不要对失业的人们或者弱势群体进行基本的生活保障?怎么保障?社会保障的实际效果又怎样?这一类的福利政策和制度设计关乎民生,也关乎国家的稳定与长远发展。 社会福利博弈按照米事亚(R. Mishra) 的定义,福利国家是指国家承担提供福利的责任并且通过立法和其他宪法手段建立机制机构和程序来提供服务和其他形式的福利以满足基本需要。 在具体的操作上由政府代表国家提供福利。 表面看来,福利的提供主体是政府,实际上,政府只是一个中介机构,真正提供福利的是国民,其基本途径来自于税收。 经济自由主义者对于社会福利最有力的批判来自于提供社会福利的后果。 他们会说,享受社会福利政策的人们会偷懒: 一方面,本来能够工作的人也不愿意工作了;另一方面,对富人来说,税收过高会降低投资和工作的积极性,因为多挣的钱给了享有福利却不愿工作的穷人。 1 / 11

这样的结果是,失业率居高不下、社会财富减少、社会弥漫着懒汉思想。 这确实是有些福利国家存在的现象。 对此我们可以提供著名的社会福利博弈模型加以说明。 我们把政府面对失业者时的博弈称为社会福利博弈。 在福利国家,政府对那些失业者进行救济,例如,发放最低生活保障金,免费培训以便再就业,培训对于再就业找到更好工作有帮助。 如此会出现三种情况: (1)政府救济,失业者找工作,对于社会来说是最好的选择;(2)政府救济,但失业者不工作,政府的投资没有回报,失业者享受其他纳税人提供的福利;(3)政府不救济,没有经过培训的失业者找不到工作、即便找到工作给社会带来的利益也比较少,这可以理解为政府没有履行其职责。 我们来分析该博弈: (1)如果政府救济,失业者最好的选择是呆在家里不工作;(2)如果政府不救济,失业者最好的选择是再找工作,否则就会饿肚子;(3)如果失业者愿意再找工作,政府的最优策略是救济;(4)如果失业者喜欢呆在家里,政府的最优策略是不救济。 如果把此博弈当成静态博弈,则该博弈没有纯策略纳什均衡解。 该博弈实际上是一个动态博弈,由政府先决定是否救济,政

博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考 二、囚徒困境的解释 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。 实际上囚徒困境在我们的实际生活中也有很多,下面举两个进行说明

三、经济学例子:关税战 两个国家,在关税上可以有以两个选择: 提高关税,以保护自己的商品。(背叛) 与对方达成关税协定,降低关税以利各自商品流通。(合作) 当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。) 四、商业例子:广告战 商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。 两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。 此二公司可以有二选择: 互相达成协议,减少广告的开支。(合作) 增加广告开支,设法提升广告的质量,压倒对方。(背叛) 若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 除了这些还有的很多类似的例子,比如说公共产品的提供,商家的价格战等等,在这里就不多赘述了。 五、“囚徒困境”现象的意义和启示 通过以上几个关于囚徒困境的例子,特别是作为经济管理学院的学生,我们可以将博弈论的一些知识运用好,更好的指导我们的经济生活。理论的重要意义在于类似的情况之下给人们社会经济生活带来指导。在经济发展中,我们应该认识到“看不见的手”还有更多内涵,有待我们去发掘。 本文主要通过对该理论的分析,从中发现对企业经营管理活动的有义启示。 第一,在市场竞争过程中,一名优秀的经营者,无论做任何决策还是考虑问题应该有战略眼观,特别是在做出对企业乃至行业今后发展的竞争策略时,从长远出发,做正确的决断。 第二,保存对手就是保存自己。在市场竞争中,让竞争对手发展就是自己发展,本着求同存异的思想,共谋发展,避免恶性竞争,避免两败俱伤的情况。 第三,市场竞争不是纯粹的竞争,在义和利之间应该如何取舍,是一位有战略眼观的企业家该做的第一个选择。 2杜兰:走出“囚徒困境”《通信企业管理》[J] 2003年第4期,第31页

管理博弈论

管理博弈论 管理博弈论(Game Theory of Management) [编辑] 什么是管理博弈论[1] 管理博弈论也称管理激励与约束机制设计理论,是指管理博弈论是对近年来的管理激励与约束机制设计中不同模型、不同方法研究成果的概括和提炼。所以可以说管理博弈论就是围绕管理激励与约束机制设计的一系列理论与方法,是博弈论在管理学领域的运用与发展。 [编辑] 管理博弈论的产生[1] 现代管理的核心职能是激发人最大限度地发挥主观能动性,创造性地开展工作,这其中自然包含了管理者和被管理者之间的博弈。但由于管理对象是有限理性的社会人,不是理性的经济人;由于管理环境是复杂多变而组织目标是相对稳定的,因而管理活动更具多阶段特性;由于被管理者的需求是多方面的,因而管理激励与约束是多因素的;还由于管理活动通常具有多目标、多层次的特点,使博弈论方法在管理学中的应用远比在其他领域的应用更为复杂、多样。由于引入了管理激励与约束机制设计的概念,使得管理和博弈有了结合部,博突论在管理学的应用有了切入点。之所以说管理激励与约束机制是管理博弈论产生和发展的载体,是由于它既切合管理实践发展需要,又能将个人理性与非理性、优化结果的定量与定性描述、需求的单因素与多因素、管理的单目标与多目标、单阶段与多阶段、单一管理层次与多管理层次有机地结合起来,从而为博弈论在管理学中的应用与发展开辟了道路。 [编辑] 管理博弈论的基本内容 管理博弈论的基本内容包括:需要激励,目标激励,榜样激励,压力约束,纠偏约束。 [编辑] 管理博弈论管理的核心[2]

管理博弈论管理的核心是如何最大限度地发挥主观能动性创造性地开展工作,这其中就包含了管理者与被管理者之间的博弈。现代管理是以人为中心的管理,一个组织内部的效率取决于全体员工的努力水平。因此,激励与约束就成了管理的核心职能。在企业中如何提高员工的素质,如何创造出使员工感到上下级平等的环境,如何达成组织目标和个人目标的统一,这都是一个组织在进行管理的时候考虑如何运用管理激励与约束手段的问题。从社会现实来看,假冒伪劣产品的出现,污染问题,体育比赛中的黑哨问题,运动员的违规问题等等都是管理激励与约束措施不当造成的。建立有效的管理与约束机制已经成为现代管理实践的迫切需要。管理博弈论就是一门关于激励与约束机制体系设计的新学科,它是博弈论在管理应用中的一个重要的、新的分支,管理博弈论进行定量化.模型化研究的基本数学基础就是博弈论。 [编辑] 管理博弈论的学科特点[1] 管理博弈论作为一门以管理激励与约束机制设计为研究对象的新兴学科,有自己产生的时代背景,有自己明确的研究对象与范围,有自己的理论基础,是应管理实践需要而生的。具体而言这门新学科具有如下一些特点: (1)管理博弈论是一门新兴综合性交叉学科。管理博弈论研究的对象是管理激励与约束机制设计,管理激励与约束机制问题往往非常复杂。由于管理者与被管理者之间一般信息是不对称的,他们既可能是合作关系,也可能是非合作的关系,管理激励与约束机制设计中需要综合运用合作博弈、非合作博弈、非对称信息博弈的理论与方法,还可能用到各种现代数学最优化理论,还要以管理学激励与约束理论为指导。因此,管理博突论是由众多学科理论交叉形成的,以特定的管理激励与约束机制设计为研究对象的综合性新学科。 (2)管理博弈论是一门应用性管理类新学科。管理博弈论是根据管理实践的需求而产生发展的,它的问题来源于管理实践,它的研究服务在于管理实践,故而它是一门理论与实践紧密结合的应用性管理类新学科。 (3)博弈模型的机制式表述。博弈论中博弈模型的基本表述形式有战略式表述、扩展式表述;非对称信息博弈论中博弈模型的基本表述形式为特征函数式表述。这些博弈模型的表述形式都是管理博弈论中博弈模型可采用的表述形式,但是,由于对复杂的多目标、多样因素、多阶段博弈难以表述,故其应用具有很大的局限性。为此,管理博弈论提出了适应于解决多目标、多因素、多阶段复杂的管理激励与约束机制模型的基本表述形式——机制式表述。 (4)定性要素研究与定量要素研究相结合。博弈论与非对称信息博弈论中博弈模型不仅可容纳的要素较少,而且要求要素只能是定量的。管理问题中涉及的资源要素不仅多,而且定性要素占的比重很大。不能反映定性要素作用的模型,显然不足以反映问题的全貌,设计出的模型必然是有缺陷的。管理博弈论强调定性要素研究与定量要素研究相结合,在其机制式表述中,通过定性因素定量化,将定性因素纳入模型,研究其作用与影响,力图达到充分全面反映问题的目的。

博弈论信息经济学知识点

博弈论与信息经济学 完全信息静态博弈 考察占优战略均衡概念及求解 解题思路:理性参与人做出是最优选择,该博弈存在占优战略均衡,据此可知答案为(3)。 考察重复剔除劣战略占优战略均衡概念及求解 说明:考察重复剔除劣战略,求解占优均衡的方法。答案:(U,L) 下面考察PNE及其解法

妻子 丈夫 (a )请检验,纳什均衡(最优战略组合)是同生共死;均衡结果是同生,或者共死; (b )请检验,占优均衡(占优战略组合)是坚强活着;均衡结果是同生(互相煎熬); (c )请检验,纳什均衡(最优战略组合)是你死我活;均衡结果是死活,或者活死; 显然,(c )情形之下,二人之间的仇恨比(b )中更深。 一些类型的博弈中,PNE 未必存在。以下考察MNE 及其解法 说明:猜谜游戏,是一种典型的零和博弈。这类博弈没有纯战略NE ,但是却存在混合战略 (c ) 活着 死了 (b ) 活着 死了 活着 死了 (a ) 活着 死了 活着 死了

NE。希望大家通过这个例子,加深对NE的概念及NE存在性定理的理解。同时,混合战略NE求解也是本题考察点。以下两个例子,与此相同,供大家练习使用。 模型化如下博弈:两个小朋友一起做猜拳游戏,每人有三个纯战略:石头、剪刀、布。胜负规则为:石头胜剪刀,剪刀胜布,布胜石头,如二人出手相同则未分胜负。二人同时出手。胜者的支付为1,负者的支付为-1,未分胜负时支付均为0。(1)请写出该博弈的支付矩阵,并判断其是否存在占优战略均衡。(2)该博弈是否存在纯战略纳什均衡,是否存在混合战略纳什均衡?如果存在,请写出。 下例来自张维迎,P131。 美国普林斯顿大学“博弈论”课程中有这样一道练习题:如果给你两个师的兵力,你来当司令,任务是攻克“敌人”占据的一座城市。而敌人的守备是三个师,规定双方的兵力只可整师调动,通往城市的道路有甲、乙两条,当你发起攻击时,若你的兵力超过敌人你就获胜;若你的兵力比敌人守备部队兵力少或者相等,你就失败。你如何制定攻城方案? 与零和博弈不同,有些博弈既有PNE,又有MNE。如以下性别战博弈和斗鸡博弈。 性别战博弈:

相关主题
文本预览
相关文档 最新文档