博弈论 Microsoft Word 文档
- 格式:doc
- 大小:603.50 KB
- 文档页数:25
博弈论的发展历程虽然早在18世纪初以前便开始了对具有策略依存特点的决策问题的零星研究,但博弈论真正的发展还是在20世纪。
20世纪初期是博弈论的萌芽阶段,其研究对象主要是从竞赛与游戏中引申出来的严格竞争博弈,即二人零和博弈.这类博弈中不存在合作或联合行为,对弈两方的利益严格对立,一方所得必意味着存在另一方的等量损失。
这符合下棋等二人室内游戏的情形,但应用在经济与政治上,则大多数情况并不合适。
此时,关于二人零和博弈理论有丰硕的研究成果,尤其是提出了博弈扩展型策略、混合策略等重要概念,为日后研究对象范围的拓展与研究的深化奠定了基础。
这一阶段最重要的成就是泽梅罗定理(1913)与冯·诺伊曼的最小最大定理(1928),后者为二人零和博弈提供了解法,同时对博弈论的发展产生了重大影响,例如非合作几人博弈中的基本概念——纳什均衡就是最小最大定理的延伸与推广。
1944年,美国数学家冯·诺伊曼(Von Neumann)和摩根斯坦(Morgensien)合著的《博弈论与经济行为》一书的出版,标志着系统的博弈理论的初步形成.该巨著汇集了当时博弈论的研究成果,将其框架首次完整而清晰地表述出来,使其作为一门学科获得了应有的地位。
同时身为经济学家的摩根斯顿首先清楚而全面地确认,经济行为者在决策时应考虑到经济学上的利益冲突性质.该书详尽地讨论了二人零和博弈,并对合作博弈作了深入探讨,开辟了一些新的研究领域.更重要的是将博弈论加以空前广泛的应用,尤其是在经济学上,由于博弈论数学上的严整性与经济学应用上的广泛性,一些经济学家将该巨著的出版视为数理经济学确立的里程碑。
接下来的一段时期对合作博弈的研究有了长足进步。
按豪尔绍尼(1966)的观点,如果一博弈中意愿表示--协议、承诺、威胁——具有完全的约束力并可强制执行,则该博弈是合作的。
如意愿表示不可强制执行,则为非合作博弈.非合作博弈随后发展起来,纳什、泽尔滕和豪尔绍尼因此而获奖,但当时注意力主要集中在合作博弈上。
经典的博弈论分析案例一一“海盗分金”问题5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。
“海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。
在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。
假设前提假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。
所以,4号惟有支持3号才能保命。
3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。
不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3 号,而给予4号和5号各一枚金币。
由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。
这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97, 0,1, 2, 0)或(97, 0,1, 0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。
由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。
这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。
分配方案可写成(97, 0, 1, 2, 0)或(97, 0, 1, 0, 2)。
分析1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。
生活中的博弈学生姓名:张朝阳专业:材料物理摘要博弈是每个人与生俱来的技能,他不是靠后天习得的,而是人的必备素养,可以说博弈在人类社会哪怕是整个自然里都无时不在,无处不在,日常生活中的一切,均可以从博弈得到解释,大到国家战略的竞争,小到菜市场里的讨价还价。
中国自古就有很多经典的博弈典故,田忌赛马、完璧归赵、赤壁之战等,把博弈二字演绎的精湛完美。
最初人们对博弈局势的把握只停留在经验上,没有向理论化发展,近代对于博弈论的研究,开始于策梅洛,波莱尔及冯·诺依曼。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的学科。
总而言之,博弈论博大精深,他并不是只研究象棋、桥牌、赌博中的胜负问题,而是渗透在生活中的方方面面。
关键词:生活;大学生;家庭;老师,策略在生活中肯定会有矛盾发生,人与人之间的相互矛盾和相互冲突的关系,实际上就是一种博弈关系。
矛盾冲突的结果也有三种情况:负和游戏、零和游戏和正和游戏。
“负和游戏”,是一种两败俱伤的游戏,故也称为双输博弈。
在人与人的交往时,由于相互的冲突和矛盾,不能达到统一,交际双方都不让步,最后使交际活动不能展开,结果是交际的双方都从中受损,两败俱伤。
交际中之所以经常会发生“负和博弈”现象,大多是因为心胸狭窄,遇事爱使性负气,必然会出现“负和”局面。
经典的博弈论分析案例——“海盗分金”问题5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。
“海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。
在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。
假设前提假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?”推理过程从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。
所以,4号惟有支持3号才能保命。
3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。
不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。
由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。
这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。
由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。
这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。
分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。
分析1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。
《博弈论前沿专题》Word版教案第一章:博弈论概述1.1 教学目标让学生了解博弈论的基本概念及其应用领域。
使学生理解博弈论在经济学、政治学、心理学等学科中的重要性。
培养学生运用博弈论分析问题的能力。
1.2 教学内容博弈论的定义与分类博弈论的基本概念(如参与者、策略、支付矩阵等)博弈论的应用领域及发展历程1.3 教学方法采用讲授法,系统介绍博弈论的基本概念和理论体系。
案例分析法,通过具体案例使学生了解博弈论在实际问题中的应用。
1.4 教学活动引入博弈论的基本概念,引导学生思考现实生活中的博弈现象。
讲解博弈论的分类及特点,让学生了解不同类型的博弈。
分析具体案例,如囚徒困境、智猪博弈等,让学生体验博弈论在实际问题中的应用。
1.5 作业与练习课后阅读材料:博弈论相关论文或书籍。
完成课后练习题,巩固所学内容。
第二章:完全信息静态博弈让学生掌握完全信息静态博弈的基本概念和理论。
培养学生运用完全信息静态博弈分析问题的能力。
2.2 教学内容完全信息静态博弈的定义和特点支付矩阵与纳什均衡完全信息静态博弈的求解方法(如逆向归纳法)2.3 教学方法采用讲授法,系统介绍完全信息静态博弈的基本理论和方法。
案例分析法,通过具体案例使学生了解完全信息静态博弈在实际问题中的应用。
2.4 教学活动引入完全信息静态博弈的基本概念,引导学生思考现实生活中的博弈现象。
讲解支付矩阵和纳什均衡的概念,让学生了解完全信息静态博弈的解。
分析具体案例,如石头剪刀布、拍卖等,让学生体验完全信息静态博弈在实际问题中的应用。
2.5 作业与练习课后阅读材料:完全信息静态博弈相关论文或书籍。
完成课后练习题,巩固所学内容。
第三章:完全信息动态博弈3.1 教学目标让学生掌握完全信息动态博弈的基本概念和理论。
培养学生运用完全信息动态博弈分析问题的能力。
完全信息动态博弈的定义和特点博弈树与子博弈完美均衡完全信息动态博弈的求解方法(如倒推法、动态规划法等)3.3 教学方法采用讲授法,系统介绍完全信息动态博弈的基本理论和方法。
博弈论与信息经济学作业一1、上策均衡、严格下策反复消去法(重复剔除严格劣策略)和纳什均衡相互之间的关系是什么?上策(占优策略):在某个博弈中,如果无论其他博弈方选择什么策略,博弈方i的策略给他带来的得益始终高于(至少不低于)其他策略带来的得益),则称为博弈方i的上策。
严格劣策略不管其他博弈方的策略如何变化,博弈方i的某种策略给他带来的得益,总是比另一种策略给他带来的得益要小,则称前一种策略为相对于后一种策略的一个“严格劣策略”。
❖重复剔除严格劣策略:找到策略之间两两比较意义上的“严格劣策略”,并把它们消去的方法❖相当于排除法,把不可能采用的策略排除掉,缩小选择范围.博弈的纳什均衡,是一种最优策略组合,每一个局中人都不能通过单方面改变自己的策略而增加收益,每个局中人选择的策略是对其他局中人所选策略的最佳反应。
❖纳什均衡与上策均衡——上策均衡包含在纳什均衡范围之内,上策均衡肯定是纳什均衡——纳什均衡不一定是上策均衡,上策均衡是比纳什均衡更强、稳定性更高的均衡概念——上策均衡的普遍性比纳什均衡差❖ 纳什均衡与重复剔除严格劣策略——纳什均衡一定是在重复剔除严格劣策略过程中没有被剔除掉的策略组合,反之则不成立上策均衡是各博弈方绝对最优策略的组合,而纳什均衡则是 各博弈方相对最优策略的组合.因此上策均衡是比纳什均衡要求 更高,更严格的均衡概念.上策均衡一定是纳什均衡,但纳什均衡 不一定是上策均衡.对于同一个博弈来说,上策均衡的集合是纳 什均衡集合的子集,但不一定是真子集.严格下策反复消去法与上策均衡分别对应两种有一定相对性 的决策分析思路:严格下策反复消去法对应排除法,即排除绝对最 差策略的分析方法;上策均衡对应选择法,即选择绝对最优策略的 均衡概念.严格下策反复消去法和上策均衡之间并不矛盾,甚至 可以相互补充,因为严格下策反复消去法不会消去任何上策均衡, 但却可以简化博弈.严格下策反复消去法与纳什均衡也是相容和补充的,因为严格下策反复消去法把严格下策消去时不会消去纳什均衡,但却能简化博弈,使纳什均衡分析更加容易.2、下面的得益矩阵表示两博弈方之间的一个静态博弈,该博弈有没有纯策略纳什均衡?博弈的结果是什么?博弈方2博弈方1T M B3、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。
第十章 博弈论初步【学习精要】一、学习重点1. 条件策略组合2. 纳什均衡3. 寻找纳什均衡的方法4. 二人同时博弈的一般理论5. 混合策略均衡6. 序贯博弈的纳什均衡精炼二、知识脉络博弈论基本概念 纳什均衡基本概念博弈论初步 同时博弈 序贯博弈 寻找纳什均衡的方法纳什均衡的存在性、唯一性、最优性 二人博弈的一般理论三、理论精要知识点一 纳什均衡博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。
策略性环境指每一个人进行的决策和采取的行动都会对其他人产生影响。
策略性决策和策略性行动指每个人要根据其他人的可能反应来决定自己的决策和行动。
博弈的三个基本要素:参与人、参与人的策略及参与人的支付。
不会得到好处。
知识点二寻找纳什均衡的方法寻找纳什均衡的方法:条件策略下划线法。
根据纳什均衡定义和条件策略组合的定义可得:纳什均衡是所有参与人的条件策略组合的公约数,即纳什均衡是每一个参与人的条件策略组合。
条件策略下划线法:在支付矩阵中每一个参与人的条件策略所对应的支付下面划线,如果支付组合中都有划线,则该支付组合代表的策略组合即为纳什均衡。
知识点三纳什均衡的存在性、唯一性和最优性在同时博弈中,(纯策略的)纳什均衡既可能存在,也可能不存在。
在纳什均衡存在的条件下,它既可能是唯一的,也可能不唯一。
知识点四二人同时博弈的一般理论二人同时博弈(二个策略)每个参与人有9 种可能的支付矩阵,整个博弈有81 种可能的支付矩阵。
全部纳什均衡可分为五种类型:第一种:四个均衡;第二种:三个均衡;第三种:二个均衡;第四种:一个均衡;第五种:零个均衡。
知识点五混合策略均衡混合策略指赋予纯策略的概率向量。
纯策略可以是有限的,由于概率取值的无限性,以有限的纯策略为基础的混合策略一定是无限的。
混合策略组合:((p1, p2),(q1, q2)。
期望支付是指对于每一个混合策略组合,参与人都有一个期望支付即支付的期望值。
条件混合策略: 在其他参与人选择既定的混合策略条件下,参与人所选择的可以使其期望支付最大的混合策略。
博弈论 Microsoft Word 文档对策论(Theory of Games) 第1、2讲对策论也称博弈论,是运筹学的一个重要分支。
1928年冯·诺意曼(J.von Neumann)等人由于经济问题的启发,研究了一类具有某种特性的博弈问题,这是对策论的最早期的工作。
在我国古代的战国时期,“齐王与田忌赛马”就是一个非常典型的对策论的例子。
对策论所研究的主要对象是带有斗争性质(或至少含有斗争成分)的现象。
由于对策论研究的对象与政治、军事、工业、农业、交通、运输等领域有密切关系,处理问题的方法又有着明显的特色,所以越来越受到人们的注意。
日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为,例如下棋、打牌、体育比赛等,还如战争活动中的双方,都力图选取对自己最为有利的策略,千方百计去战胜对手,在政治方面,国际间的谈判,各种政治力量之间的斗争。
各国际集团之间的斗争等无一不具有斗争的性质。
经济生活中,各国之间、各公司之间的各种经济谈判,企业为争夺市场而进行的竞争等,举不胜举。
具有竞争或对抗性质的行为,称为对策行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益,为了达到各自的目标和利益各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案,对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。
在我国古代,“齐王赛马”就是一个典型的对策论研究的例子。
战国时期,齐王有一天提出要与大将田忌赛马。
双方约定:从各自的上中下三个等级的马中选一匹参赛。
每匹马均只能参赛一次;每次比赛双方各出一匹马,负者要付给胜者千金。
已经知道,在同等级的马中,田忌的马不如齐王的马,而如果田忌的马比齐王的马高一等级,则田忌的马可取胜。
当时,田忌手下的一个谋士给田忌出了个主意:每次比赛时先让齐王牵出他要参赛的马,然后用下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。
比赛结果,田忌,二胜一负,可得千金,由此看来,两人各采取什么样的出马次序,对胜负是至关重要的。
还如日常生活中,儿童或喝酒中不会猜拳的用“石头—剪子—布”游戏也是带有竞争性质的现象,大家都知道游戏的规定:第一,每人每局比赛中,只能在石头、剪子、布三种出法中选一种;第二,在一局比赛中,石头对剪子认为石头赢,剪子对布认为剪子赢,布对石头认为布方赢,如果双方都是同一种,则认为没有输赢。
这样一局比赛中,各方是赢是输,不仅与自己所采取的发法(亦称策略)有关,而且与对方所采取的出法有关,下面介绍对策论中的矩阵对策。
§1对策问题的三个基本要求以下称具有对策行为的模型为对策模型或对策。
对策模型的种类可以千差万别,但本质上都必须包括如下三个基本要素:(1)局中人在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者称为局中人,通常用I表示局中人的集合,如果有n个局中人,则I={1.2……n},一般要求一个对策中至少要有二个局中人,如在“齐王赛马”例子中,局中人是齐王与田忌。
当然,对策中关于局中人的概念是具有广义性的,局中人除了可以理解为个人外,还可以理解为某一集体。
需要补充的一点是,在对策中总是假定每一个局中人都是理智的,聪明的决策者或竞争者。
即对任一局中人来讲,不存在利用其它局中人决策的失误,来扩大自身利益的可能性或相反。
(2)策略集一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略,参加对策的每局中人,i ∈I 都有自己的策略集iS ,一般,每一局中人的策略集中至少应包括两个策略。
在“齐王赛马”例子中,如用(上、中、下)表示以上马、中马、下马依次参赛次序,这是一个完整的行动方案,即为一个策略。
可见,局中人齐王与田忌各自都有六个策略:(上、中、下)、(上、下、中)、(中、上、下)、(中、下、上)、(下、中、上)、(下、上、中)。
(3)赢得函数(支付函数)在一局对策中,当局势给定以后,就用一个数来表示得失(或输赢),显然,这种“得失”或“输赢”是局势的函数,称为支付函数。
例如,S i 是i 个局中人的一个策略,则n 个局中人的策略组=S (s 1,s 2 …s n ) 是一个局势,全体局势的集合S 可用各局人策略集的笛卡尔积表示,即=S s 1×s 2×…×s n当局势出现后,对策结果也就确定了,即对任一局势s ∈S ,局中人I 可能得到一个赢得H (s )。
显然H i (s)是局势s 的函数,称为第I 个局中人的赢得函数(支付函数)齐王赛马中,局中人集体I={1.2}齐王的策略集用=1S {α1,α2,α3,α4,α5,α6} 田忌的策略集用=2S {β1,β2,β3,β4,β5,β6}表示这样齐王的任一策略αi 和田忌的任一策略βj ,就决定了一个局势S ij ,如果α1=(上、中、下)、β1 =(上、中、下)则在局势S 11下齐王的赢得值为H 1(S 11)=3。
田忌的赢得值为H 2(S 11)=-3 如此等等 一般当这三个基本因素确定后,一个对策模型也就给定了,对策论的模型很多,如矩阵对策、连续对策、微分对策、阵地对策、随机对策等。
在众多对策模型中占有重要地位的是二人有限零和对策对策,又称矩阵对策。
矩阵对策是到目前为止在理论研究和求解方法方面比较完善的一类对策,而且这类对策的研究思想和理论结果又是研究其它类型对策模型的基础,由于学时的限制,我们只能主要介绍矩阵对策的基本理论和方法。
§2 矩阵对策我们来看几个矩阵对策的例子。
例1、我们称“石头—剪子—布”游戏是一个对策问题,设参加游戏的是甲、乙两人,他们的策略集合都是{石头、剪子、布},也就是说他们在每一局比赛中都只能采取各自策略集合中的一个策略,如果我们再规定,赢得的一方得一分,输的那方得-1分。
显然,这个问题是两人有限零和对策,即矩阵对策。
我们可以列出甲、乙两人在一局比赛中的各种局势下的赢输分数。
因为这是零和对策,故只需知道甲、乙任何一方在各种局势下的分数,就能够知道对分的情况了。
乙两人在各种局势下的得分情况如下表所示如把表中数字用矩阵形式表示,则有0 1 -1A -1 0 11 -1 0我们称A为甲的应得矩阵.例2、(齐王赛马)战国时期,齐王要与大将田忌赛马,双方约定:从自己的上、中、下三个等级的马中各选出一匹进行比赛。
每次比赛输者要付给赢者千金。
就同等级的马而言,齐王的马都比田忌的强,他们俩人的策略集合都是,{(上、中、下)、(上、下、中)、(中、上、下)、(中、下、上)、(下、上、中)、(下、中、上)}并且可以知道,在每一局比赛结束时,齐王和田忌任何一方赢得的千金数恰是对方输丢的千金数。
可见这是两人有限零的对策。
即矩阵对策。
下表列出齐王在各种局势下赢得千金的数值,(表中-1表齐王输一千金)。
(矩阵)3 1 1 1 1 -11 3 1 1 -1 1A= 1 -1 3 1 1 1-1 1 1 3 1 1 称作齐王的赢得矩阵1 1 -1 1 3 11 1 1 -1 1 3一般情况,设两个局中人分别记为I 、II ,局中人I 有m 个策略α1,α2…,αm ;局中人II 有n 个策略β1,β2,…βn 。
用S 1表示局中人I 的策略集合,S 2表示局中人II 的策略集合,即=1S {α1,α2…,αm } =2S {β1,β2,…βn }为了与后面的概念区分开来,称αi 为I 的纯策略,βj 为II 的纯策略,对于纯策略构成布局势(αi ,βj )称为纯局势。
局中人I 的赢得矩阵记为11a 12a ...j a 1 ... n a 121a 22a …ja 2… na 2…………………… =A 1i a 2i a … ija … ina……………………1m a 2m a …mj a …mnaA 中的元素αij 表示在纯局势(αi ,βj )下局中人I 得分,也表示在同一局势下,局中人II 得分为-αij 。
我们把矩阵对策记为=G {I ,Ⅱ;s 1,s 2;A}或=G {s 1,s 2;A} 矩阵对策模型给定后,各局中人面临的问题是:如何选择对自己最为有利的纯策略,以谋取最大的赢得(或最少损失),这就是所谓矩阵对策的最优纯策略。
第3、4讲(一)矩阵对策的最优纯策略。
我们用一个例子来说明最优纯策略的概念。
例3、设有一矩阵对策=G {s 1,s 2;A},其中=1S {α1,α2,α3,α4},=2S {β1,β2,β3}1β 2β 3β-6 1 -8 1α 3 2 4 2α=A 9 -1 -10 3α-3 0 6 4从A 可看出,局中人I 的最大赢得是9,要想得到这个赢得,他就得选择纯策略α3。
由于,假定局中人II 也是理智的,他考虑到了局中人I 打算出α3的心理于是侵准备以β3对付之。
使局中人不但得不到9,反而失掉10,局中人I 当然也会猜到局中人II 的这一心理,故想出α4来对付,使局中人II 得不到10而失掉6……,所以,如果双方都不想冒险,都不存在侥幸心理,而是考虑到对方必然会设法使自己的所得最少这一点,就应该从各自可能出现的最不利的情形中选择一种最为有利的情形作为决策的依据,这就是所谓“理智行为”,也是对策双方实际上都能接受的一种隐妥方法。
例3中,局中人I 分析出纯策略α1,α2,α3,α4可能带来的最少赢得(矩阵A 中每行的最小元素)分别为:-8,②,-10,-3 max {-8,2,-10,-3}=2在这些最少赢得(最不利的情形)中最好的结果(最有利的情形)是赢得为2。
因此,局中人I 只要以α2参加对策,无论局中人II 取什么样的纯策略,都能保证局中人I 的收入不会少于2,而出其它纯策略,其收入都有可能小于2,甚至输给对方。
因此,对局中人II 来说,各纯策略β1,β2,β3可能带来的对其最不利的结果(矩阵A 中每列中最大元素)分别为:9,②,6 min {9,2,6}=2 在这些最不利的结果中,最好的结果(输得最少)也是2,即局中人II 只要选择纯策略β2(无论局中人I 采取什么纯策略,都能保持自己的支付不会多于2,而采取其它任何策略,都有可能使自己的所失多于2。
上面的分析表明,局中人I 、II 的“理智行为”分别是,选择纯策略α2和β2,这时局中人I 的赢得值和局中人II 的所失值的绝对值相等(都是2),局中人I 是按最大最小原则。
局中人II 是按最小最大原则选择各自的纯策略,这对双方来说都是一种最为稳妥的行为,因此,α2,β2分别为局中人I 、II 的最优纯策略。
于是我们引出矩阵对策解的概念:定义 1 设=G {s 1,s 2;A}为矩阵对策,其中=1S {α1,α2,…αm },=2S {β1,β2,…βn}。