- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【例11-6】某单位采购员在秋天时要决定冬季取暖 用煤的采购量。已知在正常气温条件下需要煤15吨, 在较暖和较冷气温条件下分别需要煤10吨和20吨。 假定冬季的煤价随天气寒冷程度而变化,在较暖、 正常、较冷气温条件下,每吨煤的价格分别为500元、 750元和1000元。又设秋季时每吨煤的价格为500元, 在没有关于当年冬季气温情况准确预报的条件下, 秋季时应采购多少吨煤能使总支出最少?
0 1 1
A 1 0
1
1 1 0
最优纯策略
对策的值——一个矩阵对策G,如果其支付矩阵A
的元素满足:
max
1i m
min
1 j n
aij
min
1 j n
max
1i m
aij
则称这个值V为矩阵对策G的值。
矩阵对策G的鞍点——如果纯局势 使 (i* , j* ) ai* j* G 的值V
则称 (i* , j* ) 为对策G的鞍点,也称它是对策G在纯 策略中的解,此时 i* 与 j* 分别为局中人Ⅰ和局中人
性质:ai* j*是第j*列的最大元素,是第i*行的最小元
素。也就是说,对于纯局势(i* , j* ) ,有下式成立:
min
1 jn
ai*
j
max
1im
aij*
定理2:
若 (i, j ) 和(k , t ) 都是矩阵对策G的鞍点, 则 (i, t ) 和 (k , j ) 也都是G的鞍点(称为鞍点的可 交换性),且在鞍点处的值都相等(称为鞍点的 无差别性)。
第一节 矩阵对策及其解法
本节的主要内容
• 对策现象的三要素及其分类 • 矩阵对策的数学模型 • 最优纯策略 • 混合策略和混合扩充 • 矩阵对策基本定理 • 矩阵对策的求解
对策现象的三要素及其分类
对策现象三个基本要素:局中人(players) 、 策略集(strategies)和支付函数(赢得函数) (payoff function)。
Ⅱ的最优纯策略。
【例11-3】对于一个矩阵对策G ={Ⅰ,Ⅱ;S1,
S2;A},其中 S1 {1,2,3,4}, S2 {1, 2, 3}
5 1 7
A
3
2
5
16 1 9
4 0 4
求双方的最优策略。
定理1:
(i* , j* ) 为对策G的鞍点的充要条件是对于任意的
i,j,有aij* ai* j* ai* j ,即鞍点 (i* , j* ) 具有这样的
对策现象的分类:根据局中人的数量分为 “两人对策”和“多人对策”;根据局中人之间 是否允许合作分为“合作对策”和“非合作对 策” ;根据局中人的策略集中的策略个数可分为 “有限对策”和“无限对策” ;根据局中人的支 付函数的代数和是否为零可分为“零和对策”和 “非零和对策”等。
矩阵对策的数学模型
矩阵对策就是有限两人零和对策。即参加对策的 局中人只有两个,双方的利益是完全对抗的;每个局 中人都有有限个可供选择的策略;且在任一局势(在 对策论中,从每个局中人的策略集中各取一个策略组 成的策略组)中,一个局中人的所得即为另一个局中 人的所失,两个局中人的得失之和总等于零。
第十一章 对策论
➢矩阵对策及其解法 ➢其他类型对策问题 ➢对策论在物流企业竞争策略分析中的应用
知识目标
了解对策论模型的三要素,掌握矩阵对策的模型、 基本定理及解法;
了解其他类型对策,能够用所学对策论知识解决 一些简单的实际问题.
技能目标
根据实际问题建立支付矩阵(建模);
根据最小最大原则、最大最小原则、优超原则等, 利用图解法和线性规划法求出矩阵对策的最优策 略和对策值.
,n,
j 1
E
E(X
,Y
)
|
X
S1* , Y
S
* 2
,
称 G* {S1*, S2*; E} 为 G 的混合扩充。
矩阵对策基本定理
定理 3 对于给定的矩阵对策 G {S1, S2; A},G* {S1*, S2*; E} 为
其混合扩充。设 X * S1* ,Y * S2* ,则 X*,Y * 为 G 的最优解的充 要条件是下列三个条件中的任一个成立:
V E(X *,Y*):
m
m
aij xi V ( j 1, 2, , n); xi 0, xi 1
i 1
i 1
(11-6)
n
n
aij y j V (i 1, 2, , m); y j 0,
•混合扩充——给定一个矩阵对策 G {S1, S2; A}。设
S*1是S1上一切混合策略的集合,S*2是S2上一切混合
策略的集合:
S1*
( x1 ,
x2
,
m
, xm | xi 1且xi 0, i 1, 2,
, m,
n
, yn | y j 1且y j 0, j 1, 2,
对于一个矩阵对策,当其3个基本要素确定后,这 个对策的数学模型也就给定了。如果给定了局中人Ⅰ、 Ⅱ的纯策略集合分别为S1、S2,局中人的支付矩阵为A, 则把这个矩阵对策的数学模型记为
G ={Ⅰ,Ⅱ;S1;S2;A }或G = {S1,S2;A }
【例11-2】(“石头、剪刀、布”游戏)每个人都 可能玩过这种游戏。石头击败剪刀,剪刀战胜布, 而布又胜过石头。这里也是两个局中人:局中人Ⅰ、 Ⅱ,双方各有3个策略,策略1代表出石头,策略2代 表出剪刀,策略3代表出布。假定胜者得1分,负者 得-1分。策略一样,就算“平局”,双方都不得分。 取S1={石头、剪刀、布},S2={石头、剪刀、布},则 局中人Ⅰ的支付矩阵A为
混合策略和混合扩充
•混合策略——对于矩阵对策 G {S1, S2; A}
m
, X (x1, x2 ,
, xm )
是 S1上的一个概率分布 (xi 0, xi 1) ,局中人Ⅰ分别以
i 1
概率 x1, x2 , , xm 采用策略1,2, ,m ,则称X (x1, x2, , xm )
是局中人Ⅰ的一个混合策略。
(1)对任 X S1* ,Y S2* ,有 E(X ,Y *) E(X *,Y *) E( X *,Y ) ;
(2)对任 i 1, 2, , m , j 1, 2, , n ,有
n
m
aij y*j E( X *,Y * ) aij xi*
j 1
i 1
(11-5)
(3)存在数 V,使得 X *,Y* 是下列两组不等式的解,且