当前位置:文档之家› 关于定价的博弈论模型

关于定价的博弈论模型

关于定价的博弈论模型
关于定价的博弈论模型

CH13 关于定价的博弈论模型

分析寡头市场的最大困难在于策略问题。在此情形下,市场上仅有几家企业,每一家企业在做决策时,都必须在一定程度上考虑其它企业的行为。博弈论就是用以研究策略选择的一种主要的工具。

一、基本概念

在一些情况下,个人或企业必须作出策略性选择,并且最终的结果依赖于每一个行动者的选择,这种情况就可以看成是一个博弈。 1.博弈的三要素

任何一个博弈都必须具备三个要素: (1)博弈的参与者

参与人的具体身份无关紧要,在博弈中没有“好人”与“坏蛋”之分,我们只是简单地假设每个参与者在考虑到对手行为的前提下,做出最有利的策略性选择。 (2)策略

策略是博弈参与者的行动规则。

在非合作博弈中,参与者之间不能就策略选择达成一个有约束力的协议。 (3)支付(payoffs )

支付是参与者的最终受益。支付包括了与博弈结果相关的所有方面,既包括显性的货币报酬,也包括隐性的参与者关于结果的心理感受。 2. 符号

两个参与者(A 和B )之间的博弈G 用下式表示 [,,(,),(,A B A B

G S S U a b U a b

其中,A S 和B S 分别表示参与者A 和参与者B 的可选策略,(,)A U a b 和(,)B U a b 分别表示当参与者A 和B 分别选择策略a 和策略b 时,各自所得到的支付(,A B a S b S ∈∈)。

二、Nash 均衡

市场均衡:在均衡价格和产量下,买方和卖方都没有动力去改变自己的行为。

Nash 均衡:对于策略组合(**,a b ),如果给定其它参与者的策略,没有一个参与者会选择单方面偏离,那么这个策略组合就构成一个Nash 均衡。也就是说 **

*

(,)(,)A A U a b U a b '≥ 对于所有A a S '∈ **

*

(,)(,)B B U a b U a b '≥ 对于所有B b S '∈

对纳什均衡的理解

设想所有参与者在博弈之前达成一个(没有约束力的)协议,规定每个参与人选择一个特定的战略。那么,给定其他参与人都遵守此协议,是否有人不愿意遵守此协议?如果没有参与人有积极性单方面背离此协议,我们说这个协议是可以自动实施的(self-enforcing ),这个协议就构成一个纳什均衡。否则,它就不是一个纳什均衡。

三、一个例子

两个厂商(A 和B )决定自己花多少钱用于做广告。每个厂商可以选择较高的预算(H )或较低的预算(L )。 1.博弈的扩展式表述

图13.1

2.博弈的策略式(规范式)表述

表13.1

3.占优策略和Nash 均衡

从表13.1可以看出,低预算(L )是厂商B 的占优策略,即不管厂商A 选择哪一种策略,L 都是厂商B 的最佳选择。由于该博弈的结构是公共知识,厂商A 也知道L 是厂商B 的占优策略,所以厂商A 将选择L 。因此,该博弈的均衡是(L ,L )。 请验证(L ,L )构成一个Nash 均衡,而其它三个策略组合都不是Nash 均衡。

四、混合策略Nash 均衡

上面的博弈存在唯一的Nash 均衡,但是并非所有博弈都是如此。在下图所示的猜谜博弈中,没有上述意义上的Nash 均衡存在;而在“性别之战”博弈中,存在两个Nash 均衡。

儿童B H(正面) T(反面) 儿童A

H(正面)

T(反面)

表13.2 猜谜博弈

表13.3 “性别之战”

Nash 均衡不存在的一个主要原因是参与人的策略较少,缺乏灵活性。在以下两种情况下,参与者的潜在策略数无穷大,就可以保证博弈至少存在一个均衡:(1)参与者的策略是某一区间内的连续变量(比如厂商对产量或价格的选择);(2)参与者使用混合策略——以一定的概率选择某种概率。相应地,以概率1选择某种行动的策略叫做“纯策略”。 下面,我们来求解“猜谜博弈”的混合策略Nash 均衡。

Suppose that the players decide to randomize amongst his strategies and play a mixed strategy. Player A could flip a coin and play H with probability r and T with probability 1-r , and player B flip a coin and play H with probability s and T with probability 1-s.

Given these probabilities, the outcomes of the game occur with the following probabilities: H-H , rs ; H-T, r (1-s ); T-H, (1-r )s ; T-T,(1-r )(1-s ). Player A ’s expected utility is then given by

()(1)(1)(1)(1)(1)(1)

A E u r s r s r s r s =+

--+--+-- 42212(21)2r s r s r s s =--+=--+

Oviously, A ’s optimal choice of r depends on B ’s probability, s. If 12s <, utility is maximized by choosing 0r =. If 12s >, A should opt for 1r =. And when 12s =, A ’s expected utility is 0 no matter what value of r is choosen. A ’s best response function is 0,

12

()1, 12[0,1], 12

i f s r s i f s i f s

=>

??=?

For player B, expected utility is given by

()(1)(1)(1)(1)(1)(1)(1

(4221)2(12)(12)

B E u rs r

s

r s r s rs r s s r r =-+-+-+---=---+=---

Now, when 12r >, B ’s expected utility is maximized by choosing 0s =. If 12r <, A should opt for 1s =. And when 12r =, A ’s expected utility is independent of what s is

choosen. B ’s best response function is 1, 12

()0, 12[0,1], 12

i f r s r i f r i f r

=>

??=?

s

Nash equilibria are shown in the figure by the intersections of optimal response curves for A and B.

Or, we can get the equilibrium through the FOC ()1420 2A E u s s r ?=-=?=?

()1420 2

B E u r r s

?=-=?=

?

对上式的理解:在给定参与人B 采用混合战略() (1-)s H s T +的情况下,如果混合战略

() (1-)r H r T +是参与人A 的最优选择,必有()()A A Eu H Eu T =。同样的,在给定参与人

A 采用混合战略() (1-)r H r T +的情况下,如果混合战略() (1-)s H s T +是参与人

B 的最优选择,必有()()B B Eu H Eu T =。这样,混合策略Nash 均衡就可以由以下两式得到 ()()()()A A B B Eu H Eu T

Eu H Eu T

=??=?

1(1)(1)(1)1(1(1)1(1)1(1)(1)

s s s s r r r r ?+-?-=-?+?-

??

-?+?-

=?

+-?-

?

这样很容易就可以得到上面的混合策略Nash 均衡。

四、囚徒困境

囚徒B

囚徒A

表13.3 囚徒困境

抵赖is a dominated strategy. A rational player would therefore never 抵赖. This solves the game since every player will 坦白. Notice that I don't have to know anything about the other player.

囚徒困境:个人理性与集体理性之间的矛盾。

This result highlights the value of commitment in the Prisoner's dilemma – commitment consists of credibly playing strategy 抵赖.

囚徒困境的广泛应用:军备竞赛、卡特尔、公共品的供给。

五、动态博弈

参与人A首先行动,参与人B在观察到参与人A的行动以后,再行动。相对于动态博弈,参与者同时行动,或者虽然行动上又先后,但是后行动者不能观察到先行动者的选择的博弈叫做静态博弈。

1. 扩展式表述

图13.2

2.策略式表述

表13.4

请注意企业B的策略和策略空间。策略是对行动规则的完备描述,由于在参与者A选择以后,

参与者B可能面临两种情况——参与者A选择了H或者选择了L,因此,参与者B的策略就要分别描述这两种情况下自己的行动选择。以策略(L,H)为例,它表示如果参与人A选择了L,那么参与人B就选择L,如果参与人A选择了H,那么参与人B也选择H。

3. 均衡

(1)Nash均衡

根据表13.4的策略式表述,该博弈一共有3个纯策略Nash均衡:[L, (L, L)]、[L, (L, H)]和[H, (H,L)]。其中,[L, (L, H)]和[H, (H,L)]并不合理。以[H, (H,L)]为例,参与人A之所以选择H,是因为他相信如果自己选择了L,参与人B将选择H。但是很明显,参与人B的这一“威胁”并不可信。因为一旦参与人A真的选择了L,对参与人B来说,最有选择是L而不是H。策略组合[L, (L, H)]同样存在这一问题。只有[L, (L, L)]是唯一合理的均衡。

因此,Nash均衡不能剔除动态博弈中的不可信威胁。为了得到更为合理的均衡,我们需要更强的均衡概念。

(2)子博弈精炼(完备)均衡(Subgame Perfect Equilibrium)

定义:一个扩展式博弈的子博弈由单个决策结x和该决策结的所有后续结(包括终点结)组成,它不能切割原博弈的信息集。

图13.2中的博弈包含3个子博弈——原博弈本身以及由参与者B的两个决策结点开始的两个子博弈;而图13.1中的博弈仅包含1个子博弈,那就是原博弈本身。

定义:如果策略组合在每一个子博弈上都构成Nash均衡,那么,该策略组合构成子博弈精炼(完备)均衡。

运用逆向归纳法,我们可以剔除不可信威胁,得到子博弈精炼均衡[L, (L, L)]。

六、重复博弈

在重复博弈中,参与者的策略集扩大。在这种博弈中,前期的行动结果可能影响到后期的行动选择,因此,需要考虑可信威胁和子博弈精炼的问题。

重复博弈的结果受博弈重复次数的影响很大。

1.有限期重复博弈

B

A

表13.5

很容易看出,该博弈的唯一Nash均衡是(U,L)——一个典型的囚徒困境博弈。

由逆向归纳法可知,在重复次数有限的情况下,重复博弈的唯一子博弈精炼均衡是每一期博弈的策略组合都是(U,L)——即简单地重复单期博弈的Nash均衡。

2.无限期重复博弈

上述逻辑在无限期重复博弈中不再适用。在无限期博弈中,逆向归纳法没有一个起始点。在此情形下,参与者可以宣布自己将采用“触发策略”(trigger strategy )——从第一期开始,自己一直采用最优的合作策略,即(D ,R ),只要其它参与者也这样做;一旦发现有人背离此策略组合,将永远采用单期Nash 均衡策略(U ,L )。 要使两个参与人都采用触发策略成为一个子博弈精炼均衡,必须使该威胁(承诺)可信。假设在第K 期,参与人A 宣布自己将采用触发策略,在该期合作,那么参与人B 有无动力背离?如果参与人B 合作,在每一期都可以得到2;如果背离(选择L ),在第K 期得到3,而在随后的每一期得到1。

以δ表示贴现因子。如果合作,参与人B 的总收益的现值是 2

22221δδ

δ

+++=

-

如果背离,参与人B 的总收益的现值是 2

3113

δδ

δ

+++=+-

参与人选择合作当且仅当 2311δ

δ

δ

>+

--

12δ>

也就是说,只要参与人有足够的耐心,合作就可以实现。这就是著名的“无名氏定理”的主要内容。

七、静态博弈中的定价

假设有两个企业,A 和B ,均以不变的边际成本c 生产相同的产品。每个企业的策略是选择各自的价格,A p 和B p 。显然,价格不可能小于c 。由于两家企业的产品是同质的,因此,如果A B p p =,我们假设两家企业的市场份额相等。 1.Bertrand-Nash 均衡

假设两家企业的生产能力不受限制。该博弈的唯一均衡是A B p p c ==。

如果企业A 的价格高于c ,企业B 将选择一个比A p 稍低的价格得到这个市场,并取得正的利润。

2.生产能力约束:Cournot 均衡

假设双寡头垄断中的每个厂商必须选择一个有特定能力的产出水平,在该产出水平范围内,边际成本为常数,高于此水平则边际成本无穷大。显然,厂商首先选择产出量然后选择价格

的两阶段博弈与古诺竞争的实质是一样的。一旦厂商确定了生产能力(产量),唯一可行的价格就是使市场需求量等于两个厂商市场能力之和的价格。

假设两家厂商的生产能力非别为A q 和B q ,并且1()A B p D q q -=+,其中1D -是逆需求函数。如果A B p p p =<,总需求超过产业总产量A B q q +,那么任意一家企业都可以通过略微提高价格(仍然能够卖出A q )以获取正的利润。因此,A B p p p =<不可能是一个均衡。另一方面,如果A B p p p =>,厂商A 可以稍微降低一点自己的价格,将自己的销量提高到A q ,也能获得更多的利润。因此,A B p p p =>也不可能是一个均衡。唯一的均衡就是

A B p p p ==。

在Cournot 竞争和Bertrand 竞争中,厂商数目都是两个,但是二者的均衡迥异,这说明博弈(资源配置)结果高度依赖于竞争的具体形式。 3.重复博弈和默契合谋

假设Bertrand 博弈可以无限期地重复下去,贴现因子为δ(或者假设贴现因子为1,但是在每一期,博弈继续进行的概率都为δ)。在情形下,两个厂商都实行“触发策略”是可能的。假设垄断价格为M p 。假设两家企业从一开始就选择价格M p ,如果发现有厂商偏离此价格,则在后续博弈中一直选择完全竞争价格c 。

如果某家厂商在第K 期背离,选择一个略低于M p 的价格得到整个市场,并因此得到垄断利润(实际上略低于此)。由于在后续博弈中,对方会采用触发策略进行惩罚,利润为零。因此,背离的总收益为M π。

如果不背离,两家厂商在每一期都得到2M π。因此,没有厂商选择背离当且仅当 121M

M ππδ

<-

12δ>

默契合谋成立的条件:(1)厂商A 的背叛行为很容易被厂商B 察觉;(2)厂商B 愿意长期采取自损性惩罚行为。

八、承诺性投资和进入阻止

在以前讨论厂商进入或退出市场时,都没有考虑厂商之间的策略性行为。实际上,厂商在决定进入或退出市场时,一般都会猜测其行为对于其对手的行为以及未来市场价格的影响。 在图13.6中,在位企业(企业1)可以通过不可转移的投资(sunk cost ),阻止竞争对手(企业2)进入市场。因为有了这种不可转移的投资,企业1的“打击”威胁变得可信。

2?

?

打击

??

211进入进入不进入

不进入

打击

容忍

容忍

-3?? ???

22?? ???

60?? ???

-2-2?? ??? 3.53.5?? ???

100?? ???

图13.6

P460,Example15.7 自学。

九、进入和不完全信息 十、不完全信息博弈

关于定价的博弈论模型

CH13 关于定价的博弈论模型 分析寡头市场的最大困难在于策略问题。在此情形下,市场上仅有几家企业,每一家企业在做决策时,都必须在一定程度上考虑其它企业的行为。博弈论就是用以研究策略选择的一种主要的工具。 一、基本概念 在一些情况下,个人或企业必须作出策略性选择,并且最终的结果依赖于每一个行动者的选择,这种情况就可以看成是一个博弈。 1.博弈的三要素 任何一个博弈都必须具备三个要素: (1)博弈的参与者 参与人的具体身份无关紧要,在博弈中没有“好人”与“坏蛋”之分,我们只是简单地假设每个参与者在考虑到对手行为的前提下,做出最有利的策略性选择。 (2)策略 策略是博弈参与者的行动规则。 在非合作博弈中,参与者之间不能就策略选择达成一个有约束力的协议。 (3)支付(payoffs ) 支付是参与者的最终受益。支付包括了与博弈结果相关的所有方面,既包括显性的货币报酬,也包括隐性的参与者关于结果的心理感受。 2. 符号 两个参与者(A 和B )之间的博弈G 用下式表示 [,,(,),(,A B A B G S S U a b U a b 其中,A S 和B S 分别表示参与者A 和参与者B 的可选策略,(,)A U a b 和(,)B U a b 分别表示当参与者A 和B 分别选择策略a 和策略b 时,各自所得到的支付(,A B a S b S ∈∈)。 二、Nash 均衡 市场均衡:在均衡价格和产量下,买方和卖方都没有动力去改变自己的行为。

Nash 均衡:对于策略组合(**,a b ),如果给定其它参与者的策略,没有一个参与者会选择单方面偏离,那么这个策略组合就构成一个Nash 均衡。也就是说 ** * (,)(,)A A U a b U a b '≥ 对于所有A a S '∈ ** * (,)(,)B B U a b U a b '≥ 对于所有B b S '∈ 对纳什均衡的理解 设想所有参与者在博弈之前达成一个(没有约束力的)协议,规定每个参与人选择一个特定的战略。那么,给定其他参与人都遵守此协议,是否有人不愿意遵守此协议?如果没有参与人有积极性单方面背离此协议,我们说这个协议是可以自动实施的(self-enforcing ),这个协议就构成一个纳什均衡。否则,它就不是一个纳什均衡。 三、一个例子 两个厂商(A 和B )决定自己花多少钱用于做广告。每个厂商可以选择较高的预算(H )或较低的预算(L )。 1.博弈的扩展式表述 图13.1 2.博弈的策略式(规范式)表述 表13.1 3.占优策略和Nash 均衡 从表13.1可以看出,低预算(L )是厂商B 的占优策略,即不管厂商A 选择哪一种策略,L 都是厂商B 的最佳选择。由于该博弈的结构是公共知识,厂商A 也知道L 是厂商B 的占优策略,所以厂商A 将选择L 。因此,该博弈的均衡是(L ,L )。 请验证(L ,L )构成一个Nash 均衡,而其它三个策略组合都不是Nash 均衡。

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

从博弈论角度看古诺模型

从博弈论角度看古诺模 型 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

博弈论的观点看古诺模型 罗思蕴 (华中师范大学数学与应用数学系,武汉430079) 摘要:运用博弈论的研究方法,对古诺模型的几种变式进行分析,给出模型解法的代数表达式,并对结果进行适当的对比分析,最后总结出不同模型对结论的改变情况。 关键词:古诺模型纳什均衡完全信息不完全信息静态博弈动态博弈 古诺模型(Cournot model)是博弈论中最具有代表性的模型之一,也是是纳什均衡最早的版本。它是法国经济学家古诺(Augustin Cournot)在1938年出版的《财富理论的数学原理研究》一书中最先提出的。而古诺的定义比纳什的定义早了一百多年,足以体现博弈论这样一个学科是深深扎根于经济学的土壤中的。从经济学的角度,它的研究价值在于古诺模型是介于两种极端状况完全竞争和垄断之间。 在古诺生活的时代,大多数市场都只有少数的厂商经营,所以这个模型在当时是极具现实意义的。随着时间的推移,古诺模型也演变出了各种不同的版本。如果从博弈论的角度分析,有四种情况极具代表性:完全信息静态博弈的古诺模型、不完全信息静态博弈的古诺模型、完全且完美信息动态博弈的古诺模型、无限次重复博弈的古诺模型。 1 经典古诺模型 古诺模型最初的形态是来自于经济学的。在经济学中,寡头的概念是指那种在某一产业只有少数几个卖者的市场组织形式。古诺模型对寡头具有如下的基本假设。一,

假定一个产业只有两个寡头,每个寡头生产同质产品,并追求利润最大化。二,两个寡头之间进行的是产量的竞争而不是价格竞争,且产品的价格依赖于两者生产的产品总量。三,寡头之间无勾结行为。四,每个生产者都把对方的产出水平视为定值。五,边际成本为常数。 在经典的古诺模型中,每个企业具有相同的不变单位成本: 需求函数为: 第i个企业的利润为: 最优化的一阶条件为: 反应函数为: 解得纳什均衡为: 每个公司的利润为: 古诺模型是在假定寡头具有完全信息的基础上导出的。在这一均衡中,每个寡头都可以准确猜测对手的产量,从而选择自己的最大产出。 最重要的是,古诺均衡解在寡头无勾结的假定下求出的。如果考虑寡头之间相互勾结而达到均衡的情况,那么经过计算可以得到实际产出水平与实际价格上等于完全垄断条件下达到的产量与价格。更广泛的,考虑无勾结寡头市场、垄断市场、自由市场,可以得到:无论是产量还是价格,无勾结寡头市场都是处于中间的位置。也就是说,如果寡头市场不存在勾结的行为,其效率高于完全垄断,低于完全竞争。 2 博弈分类下的两种古诺模型 不完全信息静态博弈的古诺模型 完全信息静态博弈的古诺模型即经济学中最经典的形式,它假设了厂商相互完全

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博 弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则 为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信 息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消

费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与 人在何时行动; 3、 序列结构:每个参与人行动时面 临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。 比较: 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流治理(采购与供应链1班) 学号:1040407122 姓名:曾维乐

二〇一一年十二月十八日 价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。

关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单讲来确实是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自同意选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中能够看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人,也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般

博弈论的总结|博弈论总结

博弈论学习的个人总结刘艳丽 第一部分基本情况 视频来源耶鲁公开课《博弈论》1----5讲,人人影视 参考资料耶鲁校园网 《博弈论--战略分析入门》,美,罗杰A麦凯恩,原毅军译,机械工业出版社,2006,42元《策略博弈》,阿维纳什迪克西特,蒲勇健译,中国人民大学出版社,第二版,2009,65元班级工商,人力08级学生 课时8节 我的时间投入视频26个小时;书籍,25小时;上网时间,无法统计。 第二部分知识层面 一、The five lessons五个基本的结论 1、Don"t play a strictly dominated strategy

2、Rational choices can lead to bad outcomes 3、You can"t get what you want 4、Put yourself in other people"s shoes 5、Yale students are evil 二、Game 2: "pick a number."数字游戏 Without showing your neighbor what you"re doing, put in the box below a whole number between 1 and a 100 [whole number between 1 and 100--integer.] We will calculate the average number chosen in the class. The winner in this game is the person whose number is closest to two-thirds times the average in the class. 三、The Prisoners" Dilemmasome examples囚徒困境 A joint project Price competition

博弈论培训心得

博弈论培训心得 -------李佳航 经过两次对博弈论的培训本人感触很深,也看了许多关于博弈的案例也从案例从学习了很多关系学习生活为人方面的博弈。 学习后现在简单总结一下: 1、博弈论中有很多的模型,其实记住模型并不是最重要的东西,掌握将问题变成博弈格局图以及进行优势策略标注法,找到纳什均衡更加重要。世界上的事情千变万化,仅仅靠这几个模型是无法全部解释的,而且模型与模型之间,仅仅变换几个数字,则发生变化。 2、博弈论可以将社会问题变成一个数学模型来计算推理,因此我们运用此模型时,需要相对准确地核定博弈各方的支付大小,解决问题的过程中,可设法改变参数让博弈对自己更加有利。 3、基本博弈模型的作用在于解决问题时更加容易去套,而不需要计算即知道博弈的结果将是什么,因此对于分析问题是有益的。有了模型在,对于一些谈判,容易让人站在博弈论的高度去分析它,这往往让人对谈判更加具有控制力。 4、对于较为简单的事件,完全不需要学习博弈论即能找到问题的答案,我们现实生活中的都自然而然的达到了博弈的均衡结果。 本周培训主要是讲的卡尼曼的前景理论和损失规避。 前景理论: 1、“二鸟在林,不如一鸟在手”,在确定的收益和“赌一把”之间,多数人会选择确定的好处。所谓“见好就收,落袋为安。称之为“确定效应”。 2、在确定的损失和“赌一把”之间,做一个抉择,多数人会选择“赌一把”。称之为“反射效应”。 3、白捡的100元所带来的快乐,难以抵消丢失100元所带来的痛苦。称之为“损失规避”。 4、很多人都买过彩票,虽然赢钱可能微乎其微,你的钱99.99%的可能支持福利事业和体育事业了,可还是有人心存侥幸搏小概率事件。称之为“迷恋小概率事件”。 5、多数人对得失的判断往往根据参照点决定,举例来说,在“其他人一年挣6万元你年收入7万元”和“其他人年收入为9万元你一年收入8万”的选择题中,大部分人会选择前者。称之为“参照依赖”。 损失规避: 如何理解“损失规避”?用一句话打比方,就是“白捡的100元所带来的快乐,难以抵消丢失100元所带来的痛苦”。 前景理论最重要也是最有用的发现之一是:当我们做有关收益和有关损失的决策时表现出的不对称性。对此,就连传统经济学的坚定捍卫者保罗·萨缪尔森,也不得不承认:“增加100元收入所带来的效用,小于失去100元所带来的效用。” 这其实是前景理论的第3个原理,即“损失规避”(lossaversion):

博弈模型

有趣味的博弈论模型 按语: 本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页;在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”;2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”(请看最后附录),这篇科普文章名列首位,我们还有一篇文章名列第七。如果读者有兴趣可以去看看,或等我有时间找出来。我觉得,把新兴科学应用通俗易懂的语言写出来,有利于科学知识普及。这也应该是一个科学工作者的责任。 在自然界和人类社会经济等领域中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论,它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是,有三次诺贝尔获奖者是博弈论的杰出科学家,他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家,1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。 博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和研究了许多博弈模型,比较著名的有三个模型:囚徒困境、“雪堆”博弈和“少数者”博弈,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家了解博弈论及其应用概况。 “囚徒困境”模型 囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕,分别关在不同的屋子里,如果双方都拒绝承认同伴的罪行,则由于证据不足两人都会被轻判(收益为);为此,警方设计了一个机制:如果一方出卖同伴,而另一方保持忠 诚,则背叛者将无罪释放(收益为T ) ;坚持忠诚的一方将被重判(收益为);如果双方都背叛了对方,则双方都会被判刑(收益为R S P ) 。这里假设上述收益参数满足下面的条件:。对每个参与者来说,如果对手坚持忠诚,则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ;如果对手选择背叛,则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 S P 可见,无论对手采取哪种策略,自己的最佳策略就是背叛,双方都选择背叛称为囚徒困境的唯一“纳什均衡”(纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖);同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下,理性参与者面临着两难的困境。 自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

博弈论与经济模型第10章

第10章机制设计与拍卖 10.1 导论 在本章和下一章里,我们将介绍博弈论中用来处理机制和市场设计的主要工具。存在着许多这样一些类型的例子。政府可能会去规制(regulate)垄断企业,使其行为符合特定的所期望的准则;艺术品收藏家要在出售其手中的画作中获得尽可能高的收益;社会计划者要保证开支在使用者之间有效地分配;学校管理系统要按照某种准则把它的空间在学生之间进行配置,等等。在本章里,我们主要关心销售机制的设计问题;在下一章中,我们将处理两组个体之间的匹配问题。 10.2 拍卖 10.2.1 历史概述 在一个“拍卖”中,物品被卖给出价最高的人。广义的“拍卖”是指对重要的经济资源进行配置,从艺术品到短期政府公债到近海油气田开发权再到无线电频率使用权等等。它采用多种不同的形式。例如,可以用轮流报价的方法(如艺术品拍卖)或密封式提交报价等。支付的成交价可以是最高报价,或某些其它价格;如果拍卖的物品不止一种,则既可以采用所有物品打包式的同时报价,也可用每种物品陆续报价的方式。博弈论分析有助于我们理解各类报价设计的结果;例如,它建议出可以最有效配置资源且带来最高收入的拍卖机制设计。在这一节里,我们来讨论这样的拍卖,其中每个买者知道他自己以及每个其他买者对于物品的估价。在后面的章节里,我们还要发展出允许我们假定买者之间互相不知道别人对物品的估价的情况下,对拍卖进行研究的工具来。 拍卖的现实背景:从巴比伦到网上购物拍卖有着相当长的历史。Herodotus,公元前1500年的古希腊作家,曾与Thucydies一起创立了历史学,曾对巴比伦的拍卖加以了描述。他写道,巴比伦人“最引人注目”的传统就是每个村庄里一年一度的拍卖,这种拍卖是对到了结婚年龄的女子进行的拍卖。对男人最具吸引力的女人首先被出;他们要求一个正的价格,而最不具吸引力的女人则倒过来向娶她的男子支付价格。在每次拍卖中,报价是轮流出价的,出价最高的男子胜出,并支付他报出的价格。 拍卖也出现于公元前1500年和400年的雅典,是出售征税权,对没收的财产的处置权,以及出租土地与矿山等。关于这些拍卖的实质内容的证据很少,但有一些有趣的东西留了下来。例如,雅典政治家Andocides(C.440—391B.C.)曾对一个征税权拍卖中的串谋提出了一个报告。 在古罗马经常开展一些拍卖的活动,且在罗马帝国之后的中世纪欧洲还继续着这种活动(例如,在中世纪和早期现代低地国家中的城镇里,每年都要对征税权进行拍卖)。最早出现英语单

博弈论理论经典讲解

博弈论经典案例 冰晶淩(杂物区)2010-04-09 22:31:28 阅读258 评论0 字号:大中小订阅 引用 光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什,泽尔腾和海萨尼.而博弈论可以划分为合作博弈和非合作博弈.那三位博弈论专家的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈.合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有,就是合作博弈;反之,就是非合作博弈.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效率的,也可能是无效率的.而合作博弈强调的是团体理性.下面是我收集的张维迎教授的几个有关博弈论的经典 案例. <案例一:囚徒困境> 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯.警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白一人抵赖,坦白的放出去,不坦白的判刑10年(这有点'坦白从宽,抗拒从严'的味道).这里,每个囚徒都有两种战略:坦白或抵赖.表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字为第二个囚徒的支付.战略形式又称标准形式,是博弈的两种表述形式之一,它特别方便于静态博弈分析. 在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白.事实上,这里,(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡.就是说,不论对方如何选择,个人的最优选择是坦白.比如说,如果B不坦白,A坦白的话被放出来,不坦白的话判1年,所以坦白比不坦白好;如果B坦白,A坦白的话判8年,不坦白的话判10年,所以,坦白还是比不坦白好。 这样,坦白就是A占优战略;同样,坦白也是B的占优战略.结果是,每个人都选择坦白,各判刑8年. <案例二:智猪博弈> 这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮,因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的 成本,支付水平分别为5和1.其他情形可以类推. 在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择"按"还是"等待",小猪的最优选择均是"等待".比如说给定大猪按,小猪也按时得到1个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位,等待则得0单位,所以,"等待"是小猪的占优战略.给定小猪总是选择"等待",大猪的最优选择只能是"按".所以,纳什均衡就是:大猪按,小猪等待,各得4个单位.多劳者不多得! <案例三:性别战>

价格战中博弈论的浅析

价格战中博弈论的浅析

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流管理(采购与供应链1班) 学号:1040407122 姓名:曾维乐 二〇一一年十二月十八日

价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。 关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单说来就是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、

博弈论经典案例

博弈论经典案例: 案例一 囚徒困境 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 囚徒困境博弈[Prisoner's dilemma] A╲B 坦白抵赖 坦白-8,-8 0,-10 抵赖-10,0 -1,-1 对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 案例二 智猪博弈 一、经济学中的“智猪博弈”(Pigs’payoffs)这个例子讲的是: 假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行动(去按按钮),收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。

博弈论(整理过名词解释和简答)

博弈论(整理过名词解释和简答)

一、名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响

6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。

博弈论浅谈

博弈论浅谈 2015年6月15日 ***学院

摘要 通过半个学期对博弈论这门课的学习,我对博弈论有了自己初步的看法,并且能运用其简单的去分析一些事情。我觉得这是我学习博弈论所获得的最大收获。当今社会是一个激烈竞争的社会,是一个各方利益明争暗斗和各方势力此消彼长的社会。面对错综复杂的社会关系和日益功利的社会环境,如何在不对等情况和不公平背景下以弱制强,以少胜多是我们必须深思的问题。那么,如何在面对各种对自己不利的博弈中胜出呢?我想多少了解一点博弈论对自己是有好处的。 博弈是智慧的较量,互为攻守却又相互制约。有人的地方就有竞争,有竞争的地方就有博弈。人生充满博弈,若想在现代社会做一个有成就,就必须懂得博弈的运用。在博弈论中,有以下几种博弈:囚徒困境(引申出来的有“旅行者困境”)、纳什均衡、智猪博弈、猎鹿博弈、酒吧博弈、枪手博弈、警察与小偷博弈、斗鸡博弈、协和博弈、海盗分金博弈、讨价还价博弈和路径依赖博弈等。如果我们可以将博弈论的原理和规则运用到自己的人生实践中,那么面对问题并可做出理性选择,一定程度上避免盲目行动。 关键词:博弈论囚徒困境智猪博弈公路飙车博弈

目录 摘要 .................................................................................................................................... II 目录 ................................................................................................................................... I II 一.对博弈论的理解 (1) 二.几个模型 (3) 1.囚徒困境 (3) 2. 智猪博弈 (4) 3.公路飙车博弈 (4) 三.总结 (6) 参考文献 (7)

博弈论分析航空定价

基于博弈论的国内五大航空公司串谋联合涨价分析据《国际金融报》记者统计,从今年2月至今,包括东航、南航和海航在内的国内航空公司已经轮番上调了800公里以下和800公里以上的国内航班的燃油附加费,目前分别为60元和110元,较之前上调了20%和22%。同时,诸多国内外航空公司还多次上涨了飞赴欧洲、美洲、中东等航班的燃油附加费。4月20日起,国内航线机票销售已经开始实行新的运价体系,按照新的计算方法,目前广州出港航班机票价格普遍上升一成左右。在没有特价的情况下,运价调整后正常票价最低只能是5.2折,比以前的正常最低票价高了0.8折。另外,国内航线的特价票也比以前少了很多。以前还有0.8折这样的超低折扣,但现在基本绝迹了,特价票能有2~3折左右就不错了。国内五大航空公司:中国东方航空公司、中国国际航空公司、海南航空公司、中国南方航空公司、深圳航空公司,几乎垄断了国内市场,用博弈论可以很好的研究分析他们串谋涨价的行为。 寡头企业为获得利润最大化,会联合其他企业寻求合作,他们就像一家企业一样联合行动,如制定价格联盟,限制产量等,对获得市场进行瓜分,这就是企业的串谋行为。假如寡头企业之间各自博弈,为获得市场,可能会率先降价,其他企业就会跟着做出反应纷纷降价,就会陷入囚徒困境,最终结局是个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。当然五大航空公司自然不会选择独自博弈,相反走向了串谋。 当然五大航空公司的经营成本不会相同,基于技术,服务及管理层营销策略不同,又可以将这五大航空公司分为两大类:低成本A类和高成本B类厂商。低成本厂商可以获得利润,而高成本厂商获得微薄利润或者亏损。B类厂商比A 类厂商更有动力提高价格。都不提价时,A类利润/B类利润=(1742997+250783)/(-250783)≈8/(-1),价格需求弹性Ed=19.23,价格弹性较大。B类厂商单独提价,它的市场份额就会明显下降,因此B类厂商获得收益是-3, A类厂商不提价获得收益是9。如果两类厂商都提价,A类厂商获得收益是10,B类厂商获得收

博弈论模型

1. 囚徒困境 这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。 “囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发 现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情 形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他 们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这 两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就 可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪 来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会 得到奖赏。 那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看, 他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。 但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔 丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也 意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一 理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保 持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个 逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。 企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打 交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互 之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对 方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪, 就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着 控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是 9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1

经济博弈论论文

博弈论及其在现代经济生活中的应用 工造3班 魏XX [摘要]:本文从“囚徒困境模型”和“智猪博弈模型”两个方面来阐述博弈论及其 在现代经济生活中的运用。 [关键词]:博弈论囚徒困境模型智猪博弈模型应用 [正文]: 有一个典型的案例:甲乙两人合伙作案,结果被警察抓了起来,分别被隔离 审讯。在不能互通信息的情形下———也就是不知道对方是坦白还是缄默的前提 下,每个嫌疑犯都可以作出自己的选择:或者供出同伙,即与警察合作,从而背 叛同伙;或者保持沉默,也就是与同伙合作,而不是与警察合作。这样会出现以 下几种情况:如果两人都不坦白,警察会因证据不足而将两人各判刑! 年;如果 一人招供而另外一人不招,坦白者作为证人将不会被起诉,另一人将会被重判!" 年;如果两人都招供,则会因罪名成立各判!# 年。这两个嫌疑犯该怎么办呢? 是选择合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这 样对他们整体而言是最好的结果———都只判!年。但是他们不得不仔细考虑对 方可能采取的选择。问题就这样开始了,两个人都十分精明,而且只关心减少自 己的刑期,并不会在乎对方被判多少年。每个人都会这样推理:假如对方不招, 我只要一招供,马上可以获得自由,而不招却要坐牢! 年,显然招比不招好;假 如对方招了,我若不招,则要坐牢!" 年。招了只要坐牢!# 年,显然还是招更好 些。可见,对方无论招或者不招,我的最佳选择都是招认。两个人都会基于同样 的想法作出招供的选择,这对他们个人来说都是最佳策略,但对整体而言却是一 个最差的结果。 这就是博弈论的一个经典模型———“囚徒困境模型”。作为一种关于决策和 策略的理论,博弈论其实就在我们身边,它研究的许多例子来自于日常生活和经 济活动中的游戏和事物。 博弈的英文即,中文译为“博弈”是非常传神和贴切的,因为中国古代称下棋 为“弈”,“博”则含有争斗的意思。在下棋这样的游戏中有一个重要的特点:即策 略在其中起着举足轻重的影响和作用。精明慎重的棋手们相互揣摩、相互牵制, 人人争赢,布每一个棋子时,都必须考虑到对手的策略选择,从而选择自己的最 佳策略。这也就是博弈的核心问题:决策主体的一方行动后,参与博弈的其他人 将会采取什么行动?参与人为取得最佳效果应采取怎样的对策?我们可以将博 弈论定义为:一些个人、一些团队或其他组织,面对一定的环境条件,在一定的 规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的 行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。博弈 论是(# 世纪四五十年代发展起来的。美国经济学家冯?诺依曼与奥斯卡?摩根斯特 恩于!)**年合著的《博弈论与经济行为》被公认为博弈论诞生的标志。 博弈论可以分为合作博弈理论和非合作博弈理论。前者主要强调的是集体理 性;而后者主要研究人们在利益相互影响的局势中如何选择策略使自己的收益最 大,强调的是个人理性。所谓“个人理性”是反映个体的行为始终都是以实现自身 的最大利益为惟一目标,除非是为了实现自身利益的需要,否则不会考虑其他的 个体或社会利益这样一种决策原则。非合作博弈要求各参与人之间不能存在任何

相关主题
文本预览
相关文档 最新文档