A
3
2
4
16 4 3
其步骤是:
3
0
5
第一步:分别确定A各行中的最小值,并在该数字上加圈表示;
第二步:分别确定A各列中的最大值,并在该数字上加框表示;8
第三步:若A中的某元素同时被圈和框住,则该元素即 为对策的值,该元素所在的行和列对应的策略则分别为局 中人Ⅰ和Ⅱ的最优纯策略,并由最优纯策略组成了对策的 解。
略。齐王与田忌的策略集中,各自都有六个纯策略:
S1,S2={(上、中、下),(上、下、中),(中、上、下),(中、下、
上),(下、上、中),(下、中、上)}
2
3.赢得函数(支付函数) (1)局势:对策中,每一局中人所选定策略形成的策略
组 合 称 一 个 局 势 。 设 局 中 人 1 从 自 己 的 策 略 集 S1={1,2 …,m}中选定策略i,局中人2从自己的策略集S2={1, 2 …, n}选定策略j,则(i, j)就构成两人对策中的一个局势。
局中人。局中人总是被假定是聪明且有理智的。
2.策略集:对策中可供局中人选择的一个实际可行的完整
的行动方案,称为一个(纯)策略;参加对策的每一局中
人iI的策略集记为Si。一般每一局中人的策略集中至少应 包括两个(纯)策略。如《齐王赛马》中,若用(上、中
、下)表示以上马、中马、下马依次参赛,就是一个纯策
§ 5.2 两人有限零和对策
一、数学模型
混合策略对策 有限策略对策 无限策略对策
两人有限零和对策,又称为矩阵对策。其数学模型为:
={Ⅰ,Ⅱ;S1,S2,A}或={S1,S2;A}
其中策略集S1={1,2,…,m},S2={1, 2, …, n}分别为
局中人Ⅰ和Ⅱ的策略集,A=(aij)mxn为局中人Ⅰ的赢得矩阵 ,由于假定对策的结果为零和,所以局中人Ⅱ的羸得矩阵