矩阵对策
- 格式:ppt
- 大小:977.50 KB
- 文档页数:56
,m α,
,
,n β;则分别为
},m α和},n β。
当局中人Ⅰ选定纯策略i α和局中人Ⅱ选定纯策略后,就形成了一个纯局)j ,这样的纯局势共有m n ⨯个。
对任一纯局势赢得值为ij a ,称
12122
212n n m m mn a a a a a ⎤⎥⎥⎥⎥⎦
为局中人Ⅰ的赢得矩阵。
局中人Ⅱ的赢得矩阵就是当局中人Ⅰ,Ⅱ的策略集12,S S 及局中人Ⅰ的赢得矩阵对策也就给定了,记为{}12,,G S S A =。
在齐王赛马的例子中,齐王的赢得矩阵
},
,m α,
},n β,max )
成立,记其值为)成立的纯局势()
,i j αβ**
在纯策略意义下的解(或鞍点)
},m α,},n S β,
1,2,
,,m x ∑1,2,
,,n y ∑分别称为局中人Ⅰ和Ⅱ的混合策略集分别称为局中人Ⅰ和Ⅱ的混合策略(或策略),对
),m x 可设想成当两个局中人多次重复进行对策
12,,
,m ααα的频率。
若只进行一次时对策,混合
对策可设想成局中人Ⅰ对各纯策略的偏爱程度。
求解混合策略的问题有图解法,迭代法、线性方程组法和线性规划法,在。
矩阵对策问题及其解法背景对策论研究具有竞争性质的现象。
有权决定⾃⾝⾏为的对策参加者称为局中⼈,所有局中⼈构成集合I,在⼀局对策中可供剧中⼈选择的⼀个实际可⾏的完整的⾏动⽅案成为策略,对于任意剧中⼈i∈I,都有⾃⼰的策略集S i。
⼀局对策中由各剧中⼈选定的策略构成的策略组称为局势s=(s1,...,s n),⽽全体局势集合S=S1×...×S n。
局势决定了对策的结果,对局势s∈S,局中⼈i可以得到收益H i(s),也称为局中⼈i的赢得函数。
矩阵对策即⼆⼈有限零和对策,是⼀类较为简单的对策模型。
矩阵对策基础我们假设,局中⼈ I 有纯策略α1,...,αm,局中⼈ II 有纯策略β1,...,βn,⼆者各选择⼀个纯策略则构成m×n个纯局势 (αi,βj),将 (αi,βj)下 I 的赢得值记为a i,j,设矩阵A=[a i,j],称为 I 的赢得矩阵或 II 的⽀付矩阵。
局中⼈ II 的赢得矩阵就是 −A T。
最优纯策略若纯局势 (a i∗,b j∗) 满⾜max i minj a i,j=minjmaxi a i,j=a i∗,j∗则称为矩阵对策 {S1,S2;A} 的最优纯策略。
显然,最有纯策略在赢得矩阵中对应的元素⼀定满⾜,其是所在⾏的最⼩元素,也是所在列的最⼤元素,即矩阵的鞍点。
混合策略当纯策略不存在时,我们希望给出⼀个选取不同策略的概率分布。
我们记 I,II 的概率分布向量分别为x,y,所有概率分布向量构成的集合为S1,S2,则局中⼈ I 的赢得函数为E(x,y)=x T Ay。
纯策略是混合策略的特例。
若混合局势 (x∗,y∗) 满⾜max x miny E(x,y)=minymaxx E(x,y)=E(x∗,y∗)则称为矩阵对策 {S1,S2;A} 的最优混合策略。
同样,混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数E(x,y) 的鞍点。
§2 矩阵对策模型具有竞争或对抗性质的现象称为对策行为。
在对策行为中,各方面要达到自己的目标,必须考虑对手的各种可能行动方案,从而选出对自己的最有利的策略。
在一个对策行为中,有权决定自己的行动方案的对策参加者称为局中人。
一般在一个对策中至少有两个局中人,我们把只有两个局中人的对策称为二人对策,而多于两个局中人的对策称为多人对策。
策略是指在一个对策中,可供局中人采用的实际可行的完整方案。
每个局中人策略的全体集合称为策略集。
每个局中人从自己的策略集中选择一个策略,便构成一个局势。
当局势确定了,则对策的结果就确定了。
对每个局中人而言,就是或胜或负、名次的前或后、财物的收入或支出等等。
这些结果可以用数字来表示,于是我们得到在全部局势集合上的一个实值函数,用它来描述每个局势完结后局中人的得失,这个函数称为赢得函数。
在任一局势中,全体局中人的赢得函数值和等于零时,称为零和对策。
其实,如果每种对策组合的结果是一个和具体对策组合无关的常数,也都可以作为零和对策。
一般二人有限零和对策的赢得函数可用表格形式表示出来,这个表格又可用矩阵A 来表示。
在对策模型G 中,设甲、乙为两个局中人,甲和乙的策略集分别为},,,{211m S ααα =和},,,{212n S βββ =,当甲选定策略i α,而乙选定策略j β时,就有了局势),(j i βα,对此局势局中人甲的赢得函数值为ij a ,我们称n m ij a A ⨯=)(为局中人甲的赢得矩阵。
因此也称G 为一个矩阵对策,记为};,{21A S S G =。
为了不和后面的有关概念混淆,以后称策略为纯策略,称局势为纯局势。
对于一个矩阵对策,在什么情况下,对策双方才能选出对自己的最有利的策略?即存在最优纯策略的条件是什么?下面通过一个例子加以阐述。
如果两家电视台可能播放的节目分别为四个、三个、甲台节目收视率(%)如下表所示:表1 甲台节目收视率(%)为获得最大收视率,他们各自会采取什么样的对策呢?分析情况可以用通过下表表示。