- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
者 率i分的布一个mi混=(合p1战,p略2 ,…mi是,p在k) 战略集上的一个概
混合战略集:Mi 混合战略组合:m=(m1, …,mN) M iN1 Mi 支付:
ui (m) m1(s1) mN (sN ) ui (s)
sS
43
纳什均衡
❖纳什均衡(NE) 给定战略式博弈G (Si ,ui )iN1 ,战略组合 mˆ
我们说知识M是共同知识,如果每个参与者知 道M,每个参与者知道“每个参与者知道 M”,……
11
信息
❖ 私人信息
在博弈中(开始博弈前或博弈中),参与者 i 的私人信息是指他知道,但不是所有参与者的 共同知识。
12
信息
❖ 不完全信息博弈
自然首先行动,而且他的行动至少对某一参与 者来说是不可观察的。(Rasmueson)
那么称 si 为参与者在S上的弱劣战略
31
❖ 重复剔除弱劣战略均衡
木村
北线(短) 南线(长)
北线 肯尼
南线
2,-2 1, -1
2,-2 4, -4
32
❖ Win :为经过n轮重复剔除弱劣战略后i的战略 集。
❖Iteratively Weakly Undominated Strategies 战略si,如果n 1 ,都有si Win,那么称
是一个纳什均衡,如果对每一个参与者都有
ui (mˆ i , mˆ i) ui (mi , mˆ i) mi Mi
44
纳什均衡
❖ 定理7.1
a、mˆ 是纳什均衡
b、对每个参与者i而言,在NE中赋予正概率的
战略si都有 ui ( mˆ ) ui (si , mˆ i ) ,而对于其 他赋予0概率的战略都有ui ( mˆ ) ui (si , mˆ i )
21
❖ 占优战略均衡
由每个参与者的严格占优战略组成的战略组合 囚徒2
抵赖 坦白
囚徒1
抵赖 坦白
-1,-1 0, -9
-9, 0 -8 -8
22
❖ 合作博弈与非合作博弈
如果参与者能够达成有约束力的协议,那么该 博弈称为合作博弈 (Cooperative Game)
23
参与者2
L
M
R
U 3,0 0,-5 0,-4 参与者1 C 1,-1 3,3 -2,4
部分参与者不知道其他参与者的支付函数 (Funderberg & Tirole)
——在参与者开始计划自己的战略行动前,部 分参与者具有其他人不知道的私人信息(初始 私人信息)
13
博弈的描述
❖ 博弈的分类
完全信息
不完全信息
静态 静态完全信息 静态不完全信息博弈
动态 动态完全信息 动态不完全信息博弈
14
u2 (d, d ) 8
17
基本假设
❖ 博弈规则是共同知识 ❖ “参与者是理性的”是共同知识
并且每个参与者在不确定下的效用函数都具有 期望效用函数性质。
18
❖ 最优反应函数
给定其他参与者的战略选择s-i的最优反应战略
s* i
(能够最大化其支付的战略)
s* i
ri (si )
s.t. ui (si*, si ) ui (si , si )
该战略为ISUS
29
❖ 俾斯麦海之战(1943)
日军上将木村:将日军运送到新西兰 美军上将肯尼:轰炸日军运输船
木村
北线(短) 南线(长)
北线 肯尼
南线
2,-2 1, -1
2,-2 4, -4
30
❖ 弱劣战略 对于战略 si ,如果存在战略 sˆi,
ui (sˆi , si ) ui (si , si ) si Si
都有
ui (sˆi , sˆi) ui ( si , sˆi) si Si
38
纳什均衡
❖ 求解
女
足球 芭蕾
男
足球 2,1
0,0
芭蕾 0, 0
1, 2
39
纳什均衡
❖ 分级协调博弈
大 公司1
小
公司2
大
小
2,2 -1,-1
-1,1 1, 1
40
纳什均衡
❖ 猜硬币
参与者1 上 (出牌)
下
参与者2(猜)
si si*
19
❖ 最优反应函数:
囚徒2 抵赖 坦白
囚徒1
抵赖 坦白
-1,-1 0, -9
-9,0 -8, -8
20❖ 严格占优战略 (St Nhomakorabeaictly Dominant Strategies)
参不与管者其i他的参最与优者反选应择。怎样的战略,sˆi 始终是
si Si
ui (sˆi , si ) ui (si , si ) si sˆi
S0 1
S1
{U ,C, D}
S1 1
{U ,
D}
S0 2
S2
{L, M , R}
S1 2
{L,
R}
S2 1
{U}
S2 2
{L}
28
❖ Sin :为经过n轮重复剔除严格劣战略后i的战 略集。
❖Iteratively Strictly Undominated Strategies 战略si,如果n 1 ,都有 si Sin,那么称
5
博弈的描述
❖ 战略 si
给定信息集下,一个战略决定了在每一个时点 上选择何种行动。
——是参与者行动计划的一个完整描述,告诉 参与者在每一种可预见的情况下选择什么行动。
❖ 战略集 Si ❖ 战略组合:s=(s1,…,sN)
s Nj1 Si
注:战略中隐含了关于参与者信息、行动集、行动顺序的信息6
博弈的描述
上 -1,1
下 1,-1
1, -1 -1, 1
——不存在纯战略纳什均衡
41
纳什均衡
❖ 零和博弈(Zero Game)
u2 (s1, s2 ) u2 (s1, s2 ) s (s1, s2 ) S1 S2
42
纳什均衡
❖ 混合战略
给定一个有限的战略式博弈 G (Si ,ui )iN1,参与
❖
按章操作莫乱改,合理建议提出来。2 020年1 1月上 午4时12 分20.1 1.2404:12November 24, 2020
❖
作业标准记得牢,驾轻就熟除烦恼。2 020年1 1月24 日星期 二4时12 分25秒 04:12:2 524 November 2020
还需证明:ui ( mˆ ) ui (si , mˆ i ) if mˆi (si ) 0
46
纳什均衡
❖ 证明:
例:t [0,1] max{x, y} t x (1 t) y min{x, y}
如果 t x (1 t) y y maxt[0,1] t x (1 t) y t*=1
c、对所有参与者都有:
ui ( mˆ ) ui (si , mˆ i ) si Si
45
纳什均衡
❖ 证明:ab mˆ 是NE ui (mˆ i ,mˆ i) ui (mi , mˆ i) mi Mi
令mi=(0,0,1,..0) =si
ui (mˆ ) ui ( si , mˆ i) si Si
❖
安全在于心细,事故出在麻痹。20.11. 2420.1 1.2404:12:2504 :12:25 November 24, 2020
❖
踏实肯干,努力奋斗。2020年11月24 日上午4 时12分 20.11.2 420.11. 24
❖
追求至善凭技术开拓市场,凭管理增 创效益 ,凭服 务树立 形象。2 020年1 1月24 日星期 二上午4 时12分 25秒04 :12:252 0.11.24
47
纳什均衡
❖ 证明: 假设:ui ( mˆ ) ui (si , mˆ i )
ui (si , mˆ i )
m1(s1),.., mi1(si1) mi1(si1),.., mN (sN ) ui (s)
sS
ui (
mˆ
) si Si
mi (si ) ui (si , mˆ i ) ui (si , mˆ i )
❖ 支付 ui
当所有参与者(包括自然)都选择了各自的战 略,而且博弈以及完成之后,参与者i所得到 的效用。
❖ 支付函数:
ui:Nj1 Si
:参与者的支付函数
符号 S-i :其他所有人的战略
ui(s)= ui(si ,s-i)
7
博弈的描述
❖ 博弈结果 (outcome)
博弈结束后,建模者从行动、支付和其他变量 的取值中所挑出来的他感兴趣的要素的集合。
Ch 7 Game Theory: Introduction
1
博弈论初步
❖ 博弈的描述
参与者(players) 行动(actions) 信息(information) 战略(strategies) 支付(payoff)
2
博弈的描述
❖ 参与者 N
决策主体,其目标是通过选择行动来最大化 自身的效用
ui (si, mˆ i ) ui (si , mˆ i )
let mi(si) mˆ i (si) mˆ i (si ) mi(si ) 0
then
ui (
mi, mˆ i)
ui
(
mˆ )
——与
mˆ
是NE矛盾
48
❖
树立质量法制观念、提高全员质量意 识。20. 11.2420 .11.24 Tuesday , November 24, 2020
虚拟参与者:自然——在博弈的特定时点上以 特定的概率随机决定行动
3
博弈的描述