- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
结论:地球是圆的。
27
图1 地球是圆的?还是平的?。
做出上面这个思维实验的人就是大名鼎 鼎的希腊智者——亚里斯多德。
28
会( 现二 象) 用 囚 徒 困 境 解 释 各 种 社
( 一 ) 标 准 的 囚 徒 困 境
29
(一)囚徒困境 囚徒困境的策略式 1)参与者集合:囚徒1定义为1,囚徒2定 义为2,N = {1 , 2}。 (2)策略空间:囚徒1的策略空间S1 = {沉 默,招供},囚徒2的策略空间S2 = {沉默, 招供}。策略s11 = s21 = 沉默,s12 = s22 = 招 供。 (3)偏好和收益函数:囚徒1的偏好,从好 到差排序为(招供,沉默)……(沉默,招 供)。囚徒2与此类似。
姚国庆 yaogqing@
( 五 ) 博 弈 模 型 的 分 类
( 四 ) 博 弈 论 的 两 个 前 提 假 设
( 三 ) 纳 什 均 衡
( 二 ) 博 弈 表 达 的 科 学 式
( 一 、剪刀、布
猪八戒
(2)博弈的扩展式 博弈的扩展式就是非常详细地描绘出一个博弈的参 与者、策略、行动顺序以及行动时拥有的信息、可 能结果和收益等细节就称为博弈的扩展式。
7
1、博弈策略式的定义 在具体情况中,不同博弈的故事千差万别, 但其中总有一些本质的东西是不变的。通常 描述一个博弈必不可少的要素包含三个: (1)参加博弈有哪些“人”; (2)每个参与者都有些什么样的“策略”, 由于策略的定义比较复杂,这里我们先将策 略理解为“行动”; (3)偏好和效用函数(收益函数)。
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼底设防 成功,失败
失败,成功
失败,成功
3
例3 鸽派和鹰派
美 国 鸽派政策 苏联 鹰派政策
30
囚徒困境的博弈矩阵
囚徒2
沉默 沉默 招供 –9,0
囚徒1
– 1 ,– 1
招供
0 ,– 9
–6,–6
31
(二)用囚徒困境解释各种社会经济现象
a. 全球气候变暖与碳减排 b. 北京交通的拥堵 c. 人民公社为什么垮掉 d. 三个和尚没水喝 e. 为什么社会缺乏信用
f. 合同法能解决囚徒困境吗?
g. 道德的价值
22
表 1 博弈的分类和均衡概念
完全信息 静态 非完全信息
完全信息静态博弈 非完全信息静态博弈 (纳什均衡) (贝叶斯均衡)
完全信息动态博弈 非完全信息动态博弈 动态 (子博弈精炼均衡) (序列均衡)
23
非完全信息动态博弈
非完 全信 息静 态博 弈
完全 信息 动态 博弈
完全信息静态博弈
一般均衡
图1-2 四个博弈模型关系图
鸽派政策
鹰派政策
0,0
+1,–1
–1,+1
– ∞,– ∞
4
从上面的三个例子中,我们可以概括出一个博弈 所具有的共同特征:利益相冲突的参与者、参与 者总是根据对手可能采取的策略来采取相应的行 动----相互依存的策略和行动、参与者总是追求自 身利益最大化。根据这些共同特征我们就能给出 一个博弈的定义,只要符合这个定义,就可以将 其纳入到博弈论的研究范畴之中。
从博弈论的角度来看,父母的关爱越深切反而 会进一步削弱父母的威慑力,有趣的是,如果 女儿怀疑父母不爱她,反而有可能把对手的威 胁当真,这就是中国古语所说“异子而教”。
35
2、破釜沉舟
破釜沉舟这个成语故事对中国人来说妇孺皆知, 他之所以2千年了仍被人传唱,根本的原因就 是项羽成功的解决了不可置信的难题,并将其 变成了一种激励,鞭笞士兵拼命。
参与者1
参与者2
正面 反面
参与者1
正面
反面
+1, -1
-1, +1
-1, +1
+1, -1
17
二是,所谓混合策略是指参与者按照概率 来选择行动,这个概率分布就是所谓的混 合策略。
定义5 如果一个策略组合s* = (s1* , …, sn*) 是博弈G = {N, S, u}的一个纳什均衡,那么 对任一参与者i = 1, 2, …, n,对其任一个策 略 si,不等式 ui(s*i, s*– i) ≥ ui(si, s*– i) (1) 成立。
13
例5 取消管制 扩展式的一个等价形式就是所谓的博弈树。
政府 维持 进 2 取消 1
退 退
进
退
进
图2 取消管制
14
取消管制的扩展式为 Γ =(N, H, P, u),其中 (1)参与者集合:政府1,企业2和企业3, N={1, 2, 3}。 (2)全历史集合:维持为C,取消为D,进 入为E,退出为Q,那么全历史集合H ={(C), (D, [E, E]), (D, [E, Q]), (D, [Q, E]), (D, [Q, Q])。 (3)参与者函数:P(Ø ) = 1,P(D) = {2, 3}。 (4)偏好:对于政府而言,根据五个历史 对应的社会福利进行排序,对于企业1和企 业2而言,则为五个历史对应的利润排序。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来科 学地描述一个博弈,就称为博弈表达的策略式(或 基本式、标准式)。
18
博弈论在研究的过程中有两个基本前提假设 一是,理性人假设。 二是,博弈结构对参与者是公共知识。特别
是,参与者满足完美回忆。
19
例6 旅行者困境 两个旅行者在旅游圣地买了两个花瓶,但在 回程途中被航空公司打碎。航空公司知道花 瓶大约值100元,但并不清楚花瓶的确切价 格。于是,航空公司要求两位旅客各自写下 花瓶的价格,并按照两个旅客中所写的最低 价格进行赔偿(航空公司认为写最低价格的 旅客讲的是真话),为了鼓励旅客讲真话, 规定对讲真话的旅客奖励2元,对讲假话的旅 客罚款2元。容易证明,在理性人的假设下, 这个游戏唯一的结果是两人都写0。
32
这里我们首先考虑一个极端的例子,故事是
这样的,一个穷人威胁,如果富人不给他三 百万,那么穷人就要和富人同归于尽。我们 可以将这个博弈变成一个动态博弈,第一阶 段,富人首先行动已决定给不给钱(给钱或 是不给),第二阶段,穷人根据富人的行动 决定是否拉手榴弹。穷人的威胁是可置信的 吗?
33
手榴弹游戏的扩展式
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方
(0,2) (0,2) 失败,成功 成功,失败 成功,失败 (1,1) 成功,失败 失败,成功 成功,失败 (2,0) 成功,失败 成功,失败 失败,成功
攻方
(1,1) (2,0)
11
2、博弈扩展式
扩展式之所以称为“扩展”根本的原因在于 它比基本式“详细”。特别是对博弈中参与 者的行动顺序和信息状态做出了比基本式 “详细”得多地刻画。正因为如此,所以扩 展式通常被用来描述复杂的动态博弈。 通俗地说,我们把博弈中所有从开始到结束 的行动序列称为一个play(全历史或完整路 径),全历史中从开始到某个阶段就叫子历 史或路径。
15
纳什均衡是博弈论分析的基础,但纳什均衡
的概念实际上却非常简单。为了更好的理解 我们将从两个层面来加以理解。
一是,纳什均衡是指这样一种策略组合,其
中没有任何一个参与者有动机单方面改变策 略——单边背离。不存在单边背离的策略组 合即为纳什均衡。
16
纳什均衡——不存在单边背离
参与者2
左 中 1,2 3,3 0,1 右 0,1 1,1 2,0 上 中 下 1, 0 2,1 0,3
20
博弈中最重要的两个因素是信息与顺序。
信息上可以分为完全信息和非完全信息。
在博弈的顺序上则可以分为静态与动态。
21
完全信息和非完全信息,完全和非完全判 断的标准就是如果有些信息只有一部分参 与者知道,并不是所有的信息都是公共信 息,那么博弈就是非完全信息博弈。 静态博弈和动态博弈,静态和动态的区别 并不在于时间上是否同时,而是在行动上 是否同时。如果参与者1在行动时,不知道 参与者2的行动,反之也一样,即为同时行 动。
25
这个模型是这样的:
第一个模型 假设:地球是圆的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到远方驶来 船只的船桅,并逐渐看到船的下部(与现实 中观察到的事实相符)
26
第二个模型
假设:地球是平的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到的是整个 船身(与现实中观察到的事实相悖)
8
定义3 博弈表达的基本式(或策略式)由博 弈的参与者N,策略空间S和收益函数u三个 要素组成,即G = {N, S, u}。其中N为自然数 集合{1, …, n},S为n重笛卡尔集,Si为参与 者i的纯策略集合,u为参与者的收益函数集 合。 完全信息静态博弈是最简单的博弈,所以通 常用策略式来描述之,策略式最常见的一种 方式就是所谓的“博弈矩阵”。我们在前面 已经接触到。
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。