经济博弈论第五章 离散博弈中的纳什均衡

  • 格式:pptx
  • 大小:340.58 KB
  • 文档页数:47

下载文档原格式

  / 47
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


TR
TR D2 1,0,0 1,0,0
D1
1,0,0 1,0,0

纳 什 均 衡 的 定 义



如果博弈中有n个参与者,就要满足n个条件。 纳什均衡必须满足全部条件,有几个人就要满足 几个条件, 对于所有人,都不可能在其他人不改变策略的情 况下,通过改变自己的策略提高自身的支付。 否则不是纳什均衡,什么都不是! 如: 赛车手2 转弯 不转弯 1, 3 0, 0

参 与 人 1
a b c
1,0 3,1 0,2
理性化可解。理性成为 共同知识,结果是(b,y)
赛车手2 转弯 转弯 赛车手 1 不转弯 2,2 3,1 不转弯 1,3 0,0
运用可理性化方法找不 到均衡。 是有均衡的,方法不同


纳 什 均 衡 的 定 义




纳什均衡正式定义:对于一个策略组合s∈S,当 且仅当si∈BRi(s-i)对于每个参与人i都成立时,称 s为一个纳什均衡。亦即,对于任何si’∈Si及任 一参与人i来说,都有ui(si,s-i) ≥ui(si’,s-i) 通俗定义:若每个参与者都根据对其他参与者所 采取策略的信念,采用最大化自身收益的策略, 则这样的策略组合就是纳什均衡。 纳什均衡的定义包括两个假设: 参与者是理性的。每个参与者基于对其他参与者 策略的信念,采取最大化自身收益的策略。 信念是正确的,每个参与者对其他参与者策略的 信念符合事,即采取的策略的概率大必须赋予大 于0.5的概率值。
1, 2, 1 1, 2, 1 1, 2, 1
1, 2, 1 1, 2, 1 0, 1, 2
A B C
2, 0, 0, A 0, 1, 1, 0 2 2 1
0 B 1, 2 0, C 1, 2
1, 2, 1 0, 1, 2
0, 1, 2 0, 1, 2

股 东 投

均衡求解如下:5个纳什均衡 (AAA)(ACC)(BBB)(BBC)(CCC) 一个纳什均衡不能排除一个参与者使用弱劣策略的可能性 3投A 3投B 3投C
0,1,0
1,0,0
参与者3采取策略D2
TR TR D2 D3 1,0,0 1,0,0 1,0,0 D1 1,0,0 1,0,0 1,0,0 D3 1,0,0 1,0,0 1,0,0

求解结果如下:19个纳什均衡。 说明纳什均衡定义不够严格,对我们的帮助很有限。
参与者3采取策略TR 参与者3采取策略D1
三人博弈中的纳什均衡
股 东 投 票


一个公司有3位股东。股东1掌握25%的股份,股东2掌握 35%的股份,股东3掌握40%的股份。该公司可以收购另外 的公司A和B,也可以选择不收购(用C表示)。三位股东 的偏好如下表所示。 一位股东的首选得到执行产生的支付为2,次选产生的支 付为1,三选被执行产生的支付为0.三股东同时投票。100 张票按股份进行分配。股东必须将所持有的选票投给一个 方案。每个参与者的策略集合由A、B和C构成。
第四节
追 星 博 弈
女2 带A 带Bebe
三人博弈中的纳什均衡
女3
女1穿带E的衣服
带C
女2
带Bebe

带A
带Bebe
2,2,2 0,1,0wk.baidu.com
1,0,0 1,1,0
女1穿带Bebe的衣服 女3 带C 0,0,1 1,0,1 带Bebe 0,1,1 1,1,1
结果:两个纳什 均衡 (E,A,C) (Bebe, Bebe, Bebe)

纳什 均衡
重复剔除严格劣 势策略留下来的 策略组合
所有策略组合
第二节两人博弈中的纳什均衡
囚 徒 困 境
嫌疑人1
坦白 不坦白
一个犯罪团伙的两名犯罪嫌疑犯被关在不同的房 子里单独审讯。他们被告知:如果一人坦白,另 一人不坦白,坦白者将被释放,而不坦白者将被 关3年;如果两个人都坦白,都被关2年;如果都 不坦白,每个人都被关1年 刑期越短,支付(收益)水平越高。
赛车手 转弯 1 不转弯

2, 2 3, 1
这个博弈有两个纳什均衡
纳 什 均 衡 的 理 论 基 础
如果策略组合(x,y,z)是一个纳什均衡,那么这些策 略就能在重复剔除严格劣势策略之后留下来。 纳什均衡比严格剔除劣势策略要求更高。

所有纳什均衡都满 足重复剔除严格劣 势策略的条件,因 而与理性是共同知 识相一致。 但重复剔除严格劣 势策略之后留下来 的策略组合,不一 定是一个纳什均衡。
求出下列博弈中的纳什均衡

a 参与人 1 b c d
参与人2
w 0,1 1,2 2,1 3,0 x 0,1 2,2 0,1 1,0 y 1,0 4,0 1,2 1,1 z 3,2 0,2 1,0 3,1

这个博弈中有三个纯策略的纳什均衡(b,x) (a,z)(d,z)
第三节 最优反应法

其实,我们一直在使用最优反应法。这里只 不过明确指出而已。
1,1 -1,-1
规 范

结果:两个纳什均衡 纳什均衡表明司机将采用同样的标准,但 并不能告诉我们司机到底采用哪种标准。 历史表明,社会的确会制定一个统一的行 驶规范,这个被达成的均衡,称为谢林点
大卫
打电话
等待
2,3 1,1
打 电 话
杰克
打电话 等待
0,0 3,2
有两个纳什均衡:即一个人打电话,另 一个等待。 到底谁打电话,谁等待,纳什均衡是无 法确定的
嫌疑人2 坦白 嫌疑人 1 不坦白 不坦白
坦白
-2,-2
-3,0
0,-3
-1,-1
对 称 博 弈
对一个对称博弈中的一个策略组合而言,如果一 个参与者的策略是最优反应,则所有参与人的策 略都是最优反应。 若一个参与者有一个占优策略,则一个纳什均衡 要求该参与者使用占优策略。若所有参与者都有 一个占优策略,则只有一个纳什均衡,其中的每 个参与者都使用占优策略。


支付矩阵如下: 3投A 2 A B C 2, A 0, 0 2, 1 B 0, 0 2, C 0, 0 2, 0, 0 1, 2, 1 2, 0, 0 2, 0, 0 2, 0, 0 0, 1, 2 3投B 2 A B C 3投C 2
股 东 投 票
2, A 0, 0 1, 1 B 2, 1 1, C 2, 1
公司股东
1 2 3
首选1
A B C
次选2
B C B
三选3
C A A

为了求出支付矩阵,首先需要判断投票如何产生各种结果。 3投B 2 A B C A A B B
股 东 投
1 3投A 2 A B C A A A A B A B A C A A C 1
B B B B C B B C
3投C 2 A B C 1 A A C C B C B C C C C C
结果:2个纯策略纳什均 衡:(a,y)(b,x) 杰克:bc对x、a对y、c对 z的最优反应 大卫:xy对a、x对b、y对 c的最优反应。
小明

石头
石头

剪刀
优 反 应 法
0, 0
-1,1
1,-1
小伟

剪刀
1,-1 -1,1
0, 0 1,-1
-1,1 0, 0
小伟:布对石头、剪刀对布、石头对剪刀的最 优反应 小明:布对石头、剪刀对布、石头对剪刀的最 优反应 不存在纯策略纳什均衡。 但存在混合策略纳什均衡。
晋 级 博
参与者3采取策略D2
TR
TR 3,0,0 2,-3,0
D1
D3
2,-1,0 3,-1,-1 1,-4,0 2,-4,-1

D2
D3
2,0,-1 1,-1,-1 2,-1,-4

晋 级
参与者的支付水平取决于他晋级的可能性。如果一个参与 者最终成绩高于其他两人,其成功晋级,支付为1。如果 两个参与者的成绩相同且高于第三人,则他们的支付都为 1/2。如果三人成绩相同,则支付均为1/3。如果参与者的 成绩低于其他人,则其支付为0。支付矩阵如下:
晋 级 博
TR D2
TR
1,0,0 1,0,0
D1
1,0,0 1/2,0,1/2
D3
1,0,0 1,0,0 TR
TR 1,0,0
D1 0,1/2,1/2
D3 1,0,0
D2
D3

1,0,0
1/2,1/2,0
0,0,1
0,1,0
1,0,0
1,0,0
D3
1,0,0
1,0,0
1,0,0
参与者3采取策略D2
自己是否努力 0 0 遭到几个人诋毁 0 1 成绩 Vi Vi-1
0
1 1 1
2
0 1 2
Vi-4
Vi+1 Vi Vi-3

假设V1=2,V2=V3=0。参与者采取各种策略时的得分情 况如下所示:
参与者3采取策略TR TR TR 3,1,1 2,0,1 2,1,0 D2 D3 D1 2,0,1 1,-1,1 1,0,0 D3 3,0,0 2,-1,0 2,0,-3 TR D2 D3 参与者3采取策略D1 TR 2,1,0 1,0,0 1,1,-1 D1 -1,0,0 -2,-1,0 -2,0,-1 D3 2,0,-1 1,-1,-1 1,0,-4

嫌疑人2 坦白 嫌疑人 1 不坦白 坦白 -2,-2 -3,0 不坦白 0,-3 -1,-1 转弯 赛车手2
转弯 赛车手 1 不转弯
2, 2 3, 1
不转弯
1, 3 0, 0
都有占优策略, 有1个纳什均衡
都没有占优策略, 有2个纳什均衡
司机2
左边行驶
右边行驶
-1,-1 1,1
行 驶

司机1
左边行驶 右边行驶
大卫 x y z x 大卫 y z
a
杰克 b
1, 1
2, 3
2, 1
0, 2
2, 0
2, 1 杰克
a
b
1, 1
2, 3
2, 1
0, 2
2, 0
2, 1
c
2, 1
1, 2
3, 0
c
2, 1
1, 2
3, 0
大卫
x a 杰克 b c 1, 1 2, 3 2, 1 y 2, 1 0, 2 1, 2 z 2, 0 2, 1 3, 0

2, 2, 0, C 0, 0, 1, 0 0 2
1, 1, 0, C 2, 2, 1, 1 1 2
0, 0, 0, C 1, 1, 1, 2 2 2

晋 级 博 弈


为了探究卑劣手段是在何时以何种方式将领先者拉下台的, 我们假定在某一情形中,有三个参与者争夺晋级权利,成 绩最高者晋级。 每个参与者的策略有三种:努力提高自己的成绩(用TR表 示),诋毁其他两名竞争者之一(用Di表示,i为被诋毁者 编号)。 比赛开始前,参与者i的成绩为Vi。如果一个参与者努力, 其成绩增加1.如果一个参与者诋毁参与者i,则参与者i的成 绩被减去1.如果两个参与者都诋毁参与者i,则参与者i的成 绩减去4。

嫌疑人2
坦白 -2,-2 -3,0 不坦白 0,-3 -1,-1
囚 徒 困 境
博弈结果:都坦白,都被关2年 如果两个人都不坦白,都被关1年 这个博弈反映了一个问题:个人理性与集体理性 之间的矛盾。 在现实中存在的,公共资源的占用等问题。



关于囚徒困境的说明: (1)囚徒困境是典型的对 称博弈。如果参与者有相 同的策略集合,转换策略 就会转换收益,那么两人 博弈就是对称博弈。 (2)如果一个策略组合对 一个参与人是最优的,那 么这个策略组合对于另一 个参与者也是最优的。
2 A B C
2, 2, 2, A 0, 0, 0, 0 0 0 1 2, 1, 2, B 0, 2, 0, 0 1 0 1
2 A B C
2, 1, 1, A 0, 2, 2, 0 1 1 1, 1, 1, B 2, 2, 2, 1 1 1 1
2 A B C
2, 0, 0, A 0, 1, 1, 0 2 2 0 1, 0, B 1, 2, 1, 2 1 2

小明 石头 布 -1,1 剪刀 1,-1
石 头 、 剪 子 、 布
石头
0,0
小伟

剪刀
1,-1
-1,1
0,0
1,-1
-1,1
0,0
*这个博弈没有纯策略的纳什均衡。 *因为石头、布、剪刀之间是相互制衡的,循环 的。没有哪个比另外两个绝对的好或绝对的差。
*每种策略组合中的收益之和总等于同一个数字, 这类博弈称为常和博弈。 *本博弈中该数字为0,该博弈又称零和博弈。
参与者3采取策略TR 参与者3采取策略D1
TR
TR 1,0,0 1,0,0 D2
D1
1,0,0 1/2,0,1/2
D3
1,0,0 1,0,0 TR D2
TR
1,0,0 1,0,0
D1
0,1/2,1/2 0,0,1
D3
1,0,0 1,0,0
博 弈
D3
1,0,0
1,0,0
1,0,0
D3
1/2,1/2,0
第五章 离散博弈中的纳什均衡
纳什均衡的定义 两人博弈中的纳什均衡 最优反应法 三人博弈中的纳什均衡 N人博弈中的纳什均衡 多重纳什均衡的解
第一节

纳什均衡的定义
冯.诺依曼:思想压倒一切的时代已经来临。在 我们这个时代思想是最重要的。
参与人2 x y 1,1 2,2 1,2 z 0,0 1,0 3,0