9
例如,在齐王和田忌赛马的博弈中,双方都有六个 策略: (上,中,下),(上,下,中),(中,上,下),(中,下,上), (下,中,上),(下,上,中),这六个策略形成一个策略 集合。 相应每个局中人的策略选择形成的策略组称为一个 局势。
3.收益函数(Payoff function):指一局博弈后各局 中人的输赢得失,用正的数字表示局中人的赢得, 负的数字表示局中人的损失。显然,收益函数的取 值与局中人选定的策略有关,于是一局博弈的“得 失”是“局势”的函数。
§1 引 言
在社会活动、经济管理、军事活动中,经常会遇到 具有竞争性或利益相对抗的现象,例如下棋、打桥 牌、体育竞赛、市场竞争、军事斗争等。竞争的各 方总是想用最好的策略击败对方,取得尽可能好的 结果,这就是博弈现象。
4
早期工作 1912年E.Zermelo “关于集合论在象棋对策中 的应用” 1921年E.Borel 引入最优策略 1928年J.V.Neumann证明了一些猜想
二人零和博弈也称为矩阵博弈。
博弈可表为 GS1,S2;A
15
例1 写出“石头、剪子、布”游戏的收益矩阵。石 头赢剪刀1分,布赢石头1分,剪刀赢布1分。
解:甲的策略集为{石头,布,剪刀} 乙的策略集为{石头,布,剪刀}
乙 石头 布
甲
石头
0
-1
布
1
0
剪刀
-1
1
剪刀
1 -1 0
16
例2 写出齐王和田忌赛马中齐王的收益矩阵。 (赢一场得一千金)
夫
决
运
胜
筹 帷
博弈论
于
千
幄
里
之
之
中
Game Theory