第十章 对策论
- 格式:doc
- 大小:235.00 KB
- 文档页数:8
对策论对策论是对决策者之间的行为的相互影响的研究。
因为对对策论的研究特别强调决策者行为的理性,在过去的二十年间,对策论已被广泛地应用于经济学中。
确实大多数经济行为能够被看成是对策论的一个特殊的情形。
5.1 对策的描述一个对策是对许多决策者的行为的相互影响的正式的表示。
行为的相互影响意思是每一个人的福利不仅依赖她自己的行为而且依赖其他人的行为。
而且她可能采取的最好的行为依赖于她对其他人的行为的预期。
要想完整地描述一个对策,我们必须知道以下四件事情:(1)局中人:有那些人卷入该对策?(2)规则:谁什么时候行动?当他们行动时他们知道什么?他们能干什么?(3)结果:对于局中人的每一组行为,对策的结果是什么?(4)报酬:局中人关于各种可能的结果的偏好(也即效用函数)是什么?例子5.1.1:配对的便士(A)局中人:这里有两个局中人,分别记为1和2。
规则:两个局中人同时抛下一个便士,要么正面向上要么反面向上。
结果:如果两个便士是配对的(要么两个正面向上要么两个反面向上),那么局中人1付一元钱给局中人2;否则,局中人2付一元钱给局中人1。
报酬:每个局中人的报酬简单地等于她得到的或失去的钱的数量。
一般地,这里有两种方法描述一个对策:策略(规范)形式的表示和扩展形式的表示。
5.1.1 一个对策的策略(规范)形式表示假设这里有有限个局中人,局中人的集合为},,2,1{I 。
每一个局中人i ∈},,2,1{I 有一个策略集,记为i S 。
在一个-I 人对策中,局中人的策略组合用一个向量表示为},,{1I s s s =,这里i s 是局中人i 的策略选择。
有时我们也把策略组合s 表示成),(i i s s -,这里i s -是除了局中人i 以外的)1(-I 个局中人的策略组合。
对于每一个策略组合},,{1I s s s =,局中人i 的效用函数为),,(1I i s s u 。
一个-I 人对策的规范形式的表示记为)}]({},{,[⋅=Γi i N u S I 。
第一节:概述 一、对策现象对策是决策者在竞争(对抗)条件下做出的,关于行动方案的决定,或者说,是在竞争(对抗)条件下的决策。
对策论是研究对策现象并寻求致胜策略的一门科学,是运筹学的一个重要分枝。
早在战国时期,就有一个齐王、田忌赛马的故事 如出三匹马,三场比赛,输一场就输千金在现代的企业经营管理中,竞争(对抗)更加激烈,更加复杂,不过从上例,可见在竞争(对抗)中,如何寻求致胜策略是大可研究的。
二、对策现象的三要素1、局中人:齐王一方,田忌(孙膑)一方;桥牌:东、南、西、北 三国:刘、孙、曹2、策略:局中人的可行的、自始自终通盘筹划的行动方案称策略: 如: 是三个不同的策略,策略的全体,称为策略集合。
3、一局对策的得失上 下 中中 中 上 下 上 下从每个局中人的策略集合中采取一个策略组成的策略组,称作局势。
得失是局势的函数。
如果在任一局势中,全体局中人的“得失”相加总是等于0时,这个对策就称为“零和对策”,否则就称为“非零和对策”。
对策的分类:一、矩阵对策矩阵对策就是二人有限零和对策。
它是指这样一类对抗和争斗现象。
1、局中人:二人;2、每个局中人都仅有有限个可供选择的策略;3、在任何一局势中,两个局中人的得失之和恒为零,即局中人甲的所得,总是局中人乙的所失。
这类对策比较简单,在理论上也比较成熟。
而且这些理论奠定了研究“对策现象”的基本思路。
矩阵对策是对策论的基础。
矩阵对策:有鞍点,无鞍点 二、数学模型a 2 a 21 A 2 … a 2n … … … … …a ma m1a m2…a mn其中a ij 为当甲出策略a i ,乙出策略βj 时,甲的赢得或支付; -a ij 为当甲出策略a i ,乙出策略βj 时,乙的赢得或支付; 因为A=(a ij )mxn 为局中人甲的赢得矩阵; A *=(-a ij )mxn 为局中人乙的赢得矩阵。
以甲方赢得矩阵为准:S 1=(a 1,a 2,…,a m )叫甲的策略集合; S 2=(β1,β2,…,βn )叫乙的策略集合;为了和以后的(无鞍点、混合策略相区别),称a i ,βj 叫做纯策略。
对策型决策当决策系统中的自然状态是由竞争对手的策略(行动方案)决定的时候,这种情况下的决策就构成了对策型决策。
与上不同的是此时的自然状态的出现是由人决定的,甚至是比你聪明的对手出的招数。
对策论是研究对策型决策的数学学科,即在不完全知道对方行动或意图的条件下构建和研究的数学决策模型。
对策论(Game Theory)又称为博弈论,是研究带有竞争与对抗问题的理论与方法。
在现实生活中,我们常常看到双方对抗、竞争的现象,例如从日常生活中的下棋、游戏到政治、军事上的斗争,以及经济领域各个企业的相互竞争,均属此类现象。
最著名的例子是田忌赛马和乒乓球团体赛队员出场名单及出场顺序。
在有对抗性和竞争性现象中,斗争的各方总是希望自己一方最终取得胜利或获的尽可能好的结局。
但是总会遭遇对方的干扰、破坏、抵抗或进攻。
在这种情况下人们想获得尽可能好的结局,必须考虑对手可能怎样采取策略,从而选取自己的一个好的对付策略。
对策型决策的三要素:1局中人:具有决策权的双方(或多方)称为局中人。
如棋局中的对弈双方,战争中敌我双方的司令员等。
2 策略:是指决策者为了战胜对手所可能选择的行动方案。
所有策略一起构成一个策略集。
每个局中人各有一个策略集。
3 局势和支付函数:在对策型决策问题中,每一个局中人从各自的策略集中任取一个策略,组成的策略组称为一个局势。
局势直接导致的结果是局中人是失败还是成功,对它的定量表述在一般经济问题中称为支付函数。
支付函数是以局势为自变量,以局中人的得失为因变量的函数。
我们下面主要讨论零和对策和矩阵决策。
所谓零和决策是指:若在任意局势中,全体局中人的得与失相加等于零,这种决策称为零和决策。
又当只有两个局中人且他们的策略集均是有限集时,支付函数可用矩阵表示,称此时的零和对策为矩阵决策。
矩阵对策及其数学模型:局中人Ⅰ的m个纯策略S1={α1,α2,…αm}。
局中人Ⅱ的n个纯策略S2={β1,β2,…βn}。
支付矩阵:A=(aij )m*n称为局中人Ⅰ的赢得矩阵(或局中人Ⅱ的损失矩阵),即aij 表示在局势(αi,βj)的情况下局中人Ⅰ赢得的值(等于局中人Ⅱ损失值)。
第十章 对策论主要内容:1、对策行为的基本要素; 2、矩阵对策; 3、矩阵对策的解法。
重点与难点:矩阵对策的数学模型,最优策略,混合策略,无鞍点矩阵对策的求解方法。
要 求: 准确理解极大极小原理、最优策略,最优混合策略,熟练掌握求解矩阵对策的公式法、图解法和线性规划方法,并能够正确使用这些方法解决实际问题。
§1 概述 一、对策行为和对策论对策论亦称竞赛论或博奕论,是研究具有斗争或竞争性质现象的数学理论和方法。
具有竞争或对抗性质的行为称为对策行为。
二、对策行为的三个要素具有对策行为的模型称为对策模型或对策。
对策模型的种类千差万别,但从本质上都包括如下三个要素:(1)局中人在一个对策行为(或一局对策)中有权决定自己行动方案的对策参加者,称为局中人。
一般要求一个对策中至少要有两个局中人。
(2)策略一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。
局中人所制定的策略全体,称为局中人的策略集合。
在一局对策中,如果各局中人的策略有限,则称之为“有限策略”,否则称之为“无限策略”。
(3)赢得函数(支付函数)一局对策结束时,对每个局中人来说,结果总是肯定的,并以一定的形式表现出来。
我们称这样的结果为“赢得”或“支付”。
一局对策结束时,每个局中人的盈亏是该策略组的函数,通常称为“赢得函数”或“支付函数”。
从每个局中人的策略集中各取一个策略组成的策略组,称为“局势”。
§2 矩阵对策矩阵对策就是有限二人零和对策。
它指的是只有两个参加对策的局中人,每个局中人都具有有限个策略可供选择。
在任一局势下,两个局中人的赢得之和总是等于零,即双方的利益是激烈对抗的。
一、矩阵对策的数学模型用Ⅰ、Ⅱ分别表示两个局中人,并设局中人Ⅰ有m 个纯策略m ααα,,, 21可供选择,局中人Ⅱ有n 个纯策略n βββ,,, 21可供选择,则局中人Ⅰ、Ⅱ的策略集分别为:{}{}n m s s βββααα,,,,,, 212211==当局中人Ⅰ选定纯策略i α和局中人Ⅱ选定纯策略j β后,就形成了一个纯局势),(j i βα。
局中人Ⅰ的赢得值用ij a 表示,便得到一个矩阵A ,称之为局中人Ⅰ的赢得矩阵。
由于假定对策为零和的,故局中人Ⅱ的赢得矩阵为-A 。
⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=mn m m n n a a aa a a a a a A 212222111211 矩阵对策可记为}{A s s G ,,,,21ⅡⅠ=或{}A s s G ,,21=在“齐王赛马”的例子中,齐王的赢得可列成如下表赢得矩阵⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡------=311111131111113111111311111131111113A二、最优策略和极大极小原理 设有矩阵对策{}A s s G ,,21=,其中:{}43211,,,αααα=s ,{}3212,,βββ=s ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-----=6031019423816A对Ⅰ2)m i n (m a x =ij jia对Ⅱ2)m a x (m i n =ij ija一般地,若等式**max min min max j i ij ijij jia a a ==成立,记**j i G a V =,则称G V 为对策G 的值,该等式是矩阵对策在纯对策下有解的充分必要条件,亦即求解矩阵对策的极大极小原理。
**ji βα,称为局中人Ⅰ、Ⅱ的最优纯策略,),(**j i βα称为最优局势,亦可称为矩阵对策G 的“鞍点”。
三、混合策略设{}A s s G ,,21=,其中⎥⎦⎤⎢⎣⎡--=5423A此时2min max -=ij ji a3m a x m i n =ij ija显然二者不相等,面对这种对策现象,极大极小原理不再适应,局中人可采取混合策略进行对策。
所谓混合策略,就是局中人为了预防对方识破自己的行动,按照一定的概率分布随机地选取各个纯策略。
这时,局中人的赢得称为“期望赢得”。
对本例,若局中人Ⅰ以概率1p 选取纯策略1α,以概率2p 选取2α;局中人Ⅱ以概率1q 选取1β,以概率2q 选取2β,此处12121,1q q p p -=-=于是局中人Ⅰ的期望赢得值:21)21)(149(1459714)1)(1(5)1(4)1(235423),(111111*********2122111+--=+--=--+----=+--==q p q p q p q p q p q p q p q p q p q p q p q p E V G所以,局中人Ⅰ的最优策略{}}145,149{,21==p p p局中人Ⅱ的最优策略{}}21,21{,21==q q q 对策值21=G V§3 矩阵对策的解法矩阵对策可分为有鞍点和无鞍点两大类。
有鞍点矩阵对策用极大极小原理来求解,本节只讨论无鞍点矩阵对策的解法。
一、2×2矩阵对策的公式法 设 {}A s s G ,,21=,其中 ⎥⎦⎤⎢⎣⎡=22211211a a a a A 局中人Ⅰ、Ⅱ的混合策略:{}{}2121,,q q q p p p ==则G V q p a q p a q p a q p a =+++2222122121121111 ⎩⎨⎧=+=+=+≥=+++)2()1(1,0)()(2221212121112122212122121111GG i GV q a q a V q a q a p p p V q a q a p q a q a p同理:∴⎩⎨⎧=+=+=+≥)4()3(1,022211222111121G Gj Vp a p a V p a p a q q q解方程组(1)—(4)得:)()()()()()()()()()(21122211211222112112221121112211222111222121122211121122112221121221a a a a a a a a V a a a a a a q a a a a a a q a a a a a a p a a a a a a p G +-+-=+-+-=+-+-=+-+-=+-+-=例1 求解矩阵对策{}A s s G,,21=,其中⎥⎦⎤⎢⎣⎡=2431A 解:双方最优混合策略分别为:25,43,41,21,21=⎭⎬⎫⎩⎨⎧=⎭⎬⎫⎩⎨⎧=G V q p 对策值二、2×n 或m ×2矩阵对策的图解法 (1)2×n 对策的图解法局中人Ⅰ只有两个策略,他的最小收入{}{})1()(min ,,2,1,min 2112122211p p a p a a n j p a p a V j j j j j j jG -=+-==+=他所希望的是上式最小值中的最大者。
例2 求解赢得矩阵为⎥⎦⎤⎢⎣⎡=06145132A 的矩阵对策。
解:在横坐标上截取长度为1的线段,并在0,1处分别作横坐标的两条垂直线Ⅰ-Ⅰ、Ⅱ-Ⅱ(垂线上点的纵坐标值分别表示局中人Ⅰ采取纯策略21αα和时,局中人Ⅱ采取各种纯策略时的赢得值)。
然后取1,021==p p ,并分别绘出在赢得矩阵各列上的G V 图线。
如图:①代表2242221221111+=+=+=p p p p a p a V G ②代表323221222112+-=+=+=p p p p a p a V G ③代表156221223113+=+=+=p p p p a p a V G ④代表55521224114+-==+=p p p a p a V GA 点为所有最小赢得中的最大者,它是②、③的交点。
于是有⎩⎨⎧+=+=+-=+=156323221221p p p V p p p V GG 解得:75,717,7212===p V p G 则 即局中人Ⅰ的最优混合策略为⎭⎬⎫⎩⎨⎧=72,75p ,期望赢得值717=GV 。
由于最优混合策略与局中人Ⅱ采取的纯策略41,ββ无关,所以041==q q 。
又 ⎩⎨⎧+-=+=+=+=+=+=656123232323222232313212q q q q a q a V q q q q a q a V G G解得:72,7532==q q 所以,局中人Ⅱ的最优混合策略是⎭⎬⎫⎩⎨⎧=0,72,75,0q 。
(2)m ×2对策的图解法 自己讨论三、m ×n 矩阵对策的线性规划解法 设赢得矩阵[]nj m i a A ij,,2,1,,2,1 ===即⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=mn m m n n a a a a a a a a a A212222111211 设矩阵对策值为G V ,则将其转化为求解两个不等式方程组:⎪⎪⎪⎩⎪⎪⎪⎨⎧=+++≥+++≥+++≥+++1)1(21221122221121221111m Gm mn n n G m m G m m p p p Vp a p a p a V p a p a p a V p a p a p a ⎪⎪⎪⎩⎪⎪⎪⎨⎧=+++≤+++≤+++≤+++1)2(21221122221211212111n Gn mn m m G n n G n n q q q Vq a q a q a V q a q a q a V q a q a q a即 ⎪⎪⎩⎪⎪⎨⎧≥=≥∑∑==)0(111i m i i mi G i ij p p V p a⎪⎪⎩⎪⎪⎨⎧≥=≤∑∑==)0(111j nj j G nj j ij q q V q a 令Gj j G ii V q y V p x ==,,则有⎪⎪⎪⎩⎪⎪⎪⎨⎧≥=≥∑∑==01111i G m i i mi i ij x V x x a ⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧≥=≤∑∑==01111j G nj j nj j ij y V y y a 对局中人Ⅰ来说,他要获得尽可能大的G V ,就应使m Gx x x V +++= 211最小。
对局中人Ⅱ来说,他要获得尽可能小的G V ,就应使n Gy y y V +++= 211最大。
所以,上述问题可转化为两个线性规划问题;(1)m x x x z+++= 21min ⎪⎩⎪⎨⎧≥≥∑=011imi i ij x x a(2)n y y y z+++= 21max⎪⎩⎪⎨⎧≥≤∑=011jnj j ij y y a例3、利用线性规划方法求解赢得矩阵为⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=1109092927A 的矩阵对策。
解:上述问题可化为两个互为对偶的线性规划问题。
(1)⎪⎪⎩⎪⎪⎨⎧≥≥+≥+≥++++=0,,11191921927min 3213121321321x x x x x x x x x x x x x z (2) ⎪⎪⎩⎪⎪⎨⎧≥≤+≤+≤++++=0,,11191921927max 3213121321321y y y y y y y y y y y y y ω用单纯形法求得:415201215101415201332211=⨯=⋅==⨯=⋅==⨯=⋅=∴x V p x V p x V p G G G即局中人Ⅰ的最优混合策略⎭⎬⎫⎩⎨⎧=41,21,41p同理求得: 41,21,41321===q q q即局中人Ⅱ的最优混合策略⎭⎬⎫⎩⎨⎧=41,21,41q。