- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
13.3.3 线性规划法
y1 L
x1 a11 L
A M
M
O
xm am1 L
yn
min
甲至少期望赢得
n
a1n a1 j y j
aM mn
j 1
M
n
amj y j
max
min
X S1* YS2*
m i 1
n
aij xi y j
j 1
V
j 1
乙采取策略组合y1,…,yn时,是从利己主义出发的,会使自己的期望损失最 小(也即甲的赢得最小)
猜硬币游戏属于矩阵对策,儿童甲的策略有出正面向上(α1)
和出反面向上(α2),儿童乙的策略有猜正面向上(β1)和猜反
面向上(β2)。
min
A
1
1
1 1 1 1 max 1
max 1{1
min1
min j
max i
aij
min j
max i
aij
2020/5/14
课件
13
13.3.1 混合策略的概念
(2) 当x>0.5时,E1 E2 ,理性的儿童乙会选择猜正面; (3) 当x=0.5时,E1 E2 0 ,儿童乙不论采取何种策略,平均赢得都是零。
x
x
x
1
1
1
0.5
0.5
0.5
0
0.5
1y
乙的策略
2020/5/14
0
0.5
1y
同理甲的策略
课件
0
0.5
1y
最优混合策略
14
13.3.1 混合策略的概念
局中人采用不同策略对策时,各方总是有得或有失,统称赢得(payoff)或
得益。
1
2
3
4
5
6
(上中下) (上下中) (中上下) (中下上) (下上中) (下中上)
(1上中下) (2上下中) (3中上下) (4中下上) (5下上中) (6下中上)
3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
2 3 11
A 7
5
2
S1 1,2 S2 1, 2 , 3
解 设甲的混合策略为x,(1x),x∈[0,1], 则 乙 分 别 使 用 β1,β2,β3时,甲赢得值:
1 : v1 2x 7(1 x) 7 5x
2 : v2 3x 5(1 x) 5 2x
: v 2020/5/14 33
2020/5/14
课件
5
13.1.1 对策模型的基本要素
1.局中人
局中人(players)是指参与竞争的各方,每方必须有独立的决策能力和承 担风险的能力。(如:田忌、齐王)
2.策略集
在对策问题中,局中人为了应对其他局中人的行动而采取的方案和手段 称为该局中人的一个策略(strategy)。
3.赢得及赢得函数
min
2 3 4 4 4
A 6 4 2
4 3 3
2 3 2
5 2 4
5 2
max
2
4
max 61 4432 44 432
最优纯策略(3 ,4 )
2020/5/14
min2
课件
12
13.3.1 混合策略的概念
【例13.5】 猜硬币游戏:甲、乙两个儿童玩猜硬币游戏, 甲手中拿着一枚硬币,把硬币盖在桌子上,让儿童乙猜是 正面向上还是反面向上。如若猜对甲给乙1元钱,猜错乙给 甲1元钱。
11x
2(1
x)
9x
2
步骤:
(1)绘制x数轴,标出x取值范围[0,1]
(2)x取0和1,确定三条直线端点,绘制三 条甲赢得值直线
(3)由于乙是理智的,甲的赢得值只能是 最小的(粗线所示)
(4)甲只能在最小中取最大,对应的策略 为 X * ( 3 , 8 ) ,最优对策值为V*=49/11
11 11
β3
3
522源自α230x*
2 1x
故β1的概率为0.设β2,β3的概率为 y,(1-y).由效率矩阵:
0
y* 1 y
由于甲是理智的,故乙取最大损
2 3 11
A 7 5
2
失(粗线)
乙会在最大损失中找出最小,即 乙最优混合策略为:
可知,当甲使用α1,α2,时,乙的损失
2值020为/5/14:
课件
Y * (0, 9 , 2 ) 11 11 18
设局中人甲使用策略i的概率为xi
m
则m维概率向量x (x1,..., xm )T , xi 1, xi 0称为甲的一个混合策略 i 1
则m维称S1*
x
(x1,..., xm )T
|
m i 1
xi
1, xi
0 称为甲的混合策略集
同理可定义局中人乙的混合策略与混合策略集.
当甲采取混合策略x,乙采取混合策略y,则称(x,y)为一个混合局势.
2020/5/14
课件
9
13.2.1超优原则
1.对 r ,s 若恒有arj asj 则称 r 超优于 s 2.对 h , k 若恒有aih aik 则称 h 超优于 k
【例13.2】
第3行优超
6
1
A5
1
4 2 5 3
5 0 1.5 3
4 3 4 0
6.5
7
9
8
于第2行, 第1行优超 于第5行
甲会使用某种策略组合x1,…,xm,使得在最小赢得的概率组合尽可能地大.
因此有: aij y j ≤V
j
y j 1
j
i 1, 2,L , m
令:yj
yj V
,则:
n j 1
yj
1 V
,于是有 :
n
max
y
j
j 1
y j ≥ 0
j 1, 2,L , n
乙的目标是期望损失最小:minV或max 1
课件
10
【例13.3】 某地区有甲、乙两家企业生产同种产品,采取相同的价格
出售,为了提高市场份额,均采取做广告的方式扩大自己的销售量。
甲和乙均有三种广告策略。甲企业所占的市场份额增加的百分数如下
面矩阵A所示。 1 2 3 min
A 1 2
3 5
1 6
4 1 1 6 max 1
3 4 2 3 3
第13章 对策论
教学目标与要求
【教学目标】 1. 理解下列基本概念: 矩阵对策,矩阵对策三要素,最优纯策略与最优混合策略,鞍点和对策值 2. 算法要求: (1) 会用“超优原则”和“最大最小”原则求矩阵对策的最优纯策略 (2) 会用“线性规划”方法求矩阵对策的最优混合策略 (3) 了解纯策略和混合策略的纳什均衡求取。 【知识结构】
max 514 21 434
min1
2020/5/14
课件
11
13.2.2 最大最小原则
1 L
A 1
M
a11
M
L O
m am1 L
n min
a1n M
max
ars
amn
如果ars ahk ,则该值所对 应的策略为最优纯策略
max 1 44 2 4 43
min ahk
【例13.4】
M
n
min amj y j
max
min
X S1* YS2*
m i 1
n
aij xi y j
j 1
m
m
j 1
乙各方案最大损失max ai1xi L max ain xi
i 1
i 1
mn
乙最多期望损失 min max a x y YS2* XS1* i1 j1 ij i j
由于甲乙都是理智的,故
设甲出正面(α1)的概率x,出反面(α2)的概率1-x;乙猜正面(β1)的概率y,猜反 面(β2)的概率1-y。则乙两个策略的期望值分别为:
E1 1 x (1)(1 x) 2x 1 E2 (1) x 1 (1 x) 1 2x
令E1 E2 , 可得x 0.5
(1) 当x<0.5时,E1 E2,理性的儿童乙会选择猜反面;
1,-1 3,-3 -1,1 1,-1 1,-1 1,-1
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
2020/5/14
最优混合策略为max min E(X,Y ) min max E(X,Y )时X,Y的解
X S1 YS2
YS2 X S1
2020/5/14
课件
15
13.3.1 混合策略的概念
矩阵对策G S1 , S2 , A
甲的策略集S1 1 , ...,m 乙的策略集S2 1 , ..., n 赢得矩阵A aij mn
1 1 6
A1 3 5
4 1
0 4 2 1 3
第1列优超于 第5列,第4列 优超于第2列
1
1 6 A2 3 5
3
5 1.5
4 1 3
4
4 4
第1行优于 2、3行
0
A3
1
2 3 4 5
4 5 4 6.5
5 1.5 4
9
3 3 0 8
1
2
3
6 4 5
2020/5/14
最优纯策略(α1,β2)
11
7 β1
5 β2
β3
3
2
2
课0 件
x*
1 x 17