- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
失败,成功
失败,成功
3
例3 鸽派和鹰派
美 国 鸽派政策 苏联 鹰派政策
鸽派政策
鹰派政策
0,0
+1,–1
–1,+1
– ∞,– ∞
4
从上面的三个例子中,我们可以概括出一个博弈 所具有的共同特征:利益相冲突的参与者、参与 者总是根据对手可能采取的策略来采取相应的行 动----相互依存的策略和行动、参与者总是追求自 身利益最大化。根据这些共同特征我们就能给出 一个博弈的定义,只要符合这个定义,就可以将 其纳入到博弈论的研究范畴之中。
15
(三)博弈论基础的均衡概念——纳什均衡
纳什均衡是博弈论分析的基础,但纳什均衡
的概念实际上却非常简单。为了更好的理解 我们将从两个层面来加以理解。
一是,纳什均衡是指这样一种策略组合,其
中没有任何一个参与者有动机单方面改变策 略——单边背离。不存在单边背离的策略组 合即为纳什均衡。
16
纳什均衡——不存在单边背离
(2,0)
成功,失败
成功,失败
失败,成功
11
2、博弈扩展式
扩展式之所以称为“扩展”根本的原因在于 它比基本式“详细”。特别是对博弈中参与 者的行动顺序和信息状态做出了比基本式 “详细”得多地刻画。正因为如此,所以扩 展式通常被用来描述复杂的动态博弈。 通俗地说,我们把博弈中所有从开始到结束 的行动序列称为一个play(全历史或完整路 径),全历史中从开始到某个阶段就叫子历 史或路径。
定义1 博弈是指利益存在冲突的决策主体(个人, 企业,集团,政党,国家等等)在相互对抗(或 合作)中,对抗双方(或多方)相互依存的一系 列策略和行动的过程集合。
5
在定义1中,我们最需要注意的就是策略的相互 依存性。对于策略的相互依存性,传统的经济学 不是不想研究,而是缺乏有效的工具。从这个意 义上而言,博弈论正是为了解决这一问题而产生 的。也是从这个意义上讲,我们有了博弈论的定 义。 定义2 博弈论是专门研究博弈如何出现均衡的规 律的学科。
参与者2
左 中 1,2 3,3 0,1 右 0,1 1,1 2,0 上 中 下 1, 0 2,1 0,3
参与者1
参与者2
12
用参与者函数来表示在每一个全历史上,当博弈进 行到某个阶段时谁来行动。因而要完整地描述一个 动态博弈,必须具备四个要素: (1)参与者集合; (2)全历史集合; (3)参与者函数; (4)偏好。
定义4 博弈的扩展式为 Γ =(N, H, P, u),其中N为参 与者集合,H为博弈的全历史集合,即H={(a1, a2, …, aK)},其中K为博弈从开始到结束依次发生的行动次 数,行动序列中的每一个a都为向量。P为参与者函 数,即P(h)={i: i∈N}, 。u为收益函数,表示博弈 参与者的偏好。
13
例5 取消管制 扩展式的一个等价形式就是所谓的博弈树。
政府 维持 进 2 取消 1
退 退
进
退
进
图2 取消管制
14
取消管制的扩展式为 Γ =(N, H, P, u),其中 (1)参与者集合:政府1,企业2和企业3, N={1, 2, 3}。 (2)全历史集合:维持为C,取消为D,进 入为E,退出为Q,那么全历史集合H ={(C), (D, [E, E]), (D, [E, Q]), (D, [Q, E]), (D, [Q, Q])。 (3)参与者函数:P(Ø ) = 1,P(D) = {2, 3}。 (4)偏好:对于政府而言,根据五个历史 对应的社会福利进行排序,对于企业1和企 业2而言,则为五个历史对应的利润排序。
8
定义3 博弈表达的基本式(或策略式)由博 弈的参与者N,策略空间S和收益函数u三个 要素组成,即G = {N, S, u}。其中N为自然数 集合{1, …, n},S为n重笛卡尔集,Si为参与 者i的纯策略集合,u为参与者的收益函数集 合。 完全信息静态博弈是最简单的博弈,所以通 常用策略式来描述之,策略式最常见的一种 方式就是所谓的“博弈矩阵”。我们在前面 已经接触到。
(2)博弈的扩展式 博弈的扩展式就是非常详细地描绘出一个博弈的参 与者、策略、行动顺序以及行动时拥有的信息、 可能结果和收益等细节就称为博弈的扩展式。
7
1、博弈策略式的定义 在具体情况中,不同博弈的故事千差万别, 但其中总有一些本质的东西是不变的。通常 描述一个博弈必不可少的要素包含三个: (1)参加博弈有哪些“人”; (2)每个参与者都有些什么样的“策略”, 由于策略的定义比较复杂,这里我们先将策 略理解为“行动”; (3)偏好和效用函数(收益函数)。