对策论
- 格式:doc
- 大小:40.50 KB
- 文档页数:5
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。
博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。
简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。
1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。
20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。
在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。
1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。
博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。
它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。
正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。
正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。
对策论对策论是对决策者之间的行为的相互影响的研究。
因为对对策论的研究特别强调决策者行为的理性,在过去的二十年间,对策论已被广泛地应用于经济学中。
确实大多数经济行为能够被看成是对策论的一个特殊的情形。
5.1 对策的描述一个对策是对许多决策者的行为的相互影响的正式的表示。
行为的相互影响意思是每一个人的福利不仅依赖她自己的行为而且依赖其他人的行为。
而且她可能采取的最好的行为依赖于她对其他人的行为的预期。
要想完整地描述一个对策,我们必须知道以下四件事情:(1)局中人:有那些人卷入该对策?(2)规则:谁什么时候行动?当他们行动时他们知道什么?他们能干什么?(3)结果:对于局中人的每一组行为,对策的结果是什么?(4)报酬:局中人关于各种可能的结果的偏好(也即效用函数)是什么?例子5.1.1:配对的便士(A)局中人:这里有两个局中人,分别记为1和2。
规则:两个局中人同时抛下一个便士,要么正面向上要么反面向上。
结果:如果两个便士是配对的(要么两个正面向上要么两个反面向上),那么局中人1付一元钱给局中人2;否则,局中人2付一元钱给局中人1。
报酬:每个局中人的报酬简单地等于她得到的或失去的钱的数量。
一般地,这里有两种方法描述一个对策:策略(规范)形式的表示和扩展形式的表示。
5.1.1 一个对策的策略(规范)形式表示假设这里有有限个局中人,局中人的集合为},,2,1{I 。
每一个局中人i ∈},,2,1{I 有一个策略集,记为i S 。
在一个-I 人对策中,局中人的策略组合用一个向量表示为},,{1I s s s =,这里i s 是局中人i 的策略选择。
有时我们也把策略组合s 表示成),(i i s s -,这里i s -是除了局中人i 以外的)1(-I 个局中人的策略组合。
对于每一个策略组合},,{1I s s s =,局中人i 的效用函数为),,(1I i s s u 。
一个-I 人对策的规范形式的表示记为)}]({},{,[⋅=Γi i N u S I 。
数学对策论的概念数学对策论(Mathematical Game Theory)是研究冲突和合作情况下决策制定的数学模型与方法的学科。
它将数学工具应用于游戏、竞争和冲突的分析,研究个体或群体之间的最佳策略选择。
其中,个体可以是个人、企业、政府等。
数学对策论的目标是帮助决策者在不同情境中做出最明智的决策。
数学对策论起源于20世纪早期的经济学领域,最早由约翰·冯·诺依曼(John von Neumann)和奥斯卡·摩根斯泰恩(Oskar Morgenstern)于1944年的著作《博弈论与经济行为》中提出。
数学对策论不仅仅应用于经济学领域,还逐渐在其他领域如政治学、生物学、计算机科学等得到广泛应用。
数学对策论的基本概念包括博弈、策略、收益、纳什均衡等。
首先,博弈是指参与者之间的相互作用。
在数学对策论中,博弈通常通过数学模型来描述,其中参与者之间的行动和收益均以数值的形式表示。
其次,策略是参与者在博弈中做出的选择。
每个参与者都可以有多个策略可选择,而这些策略的选择将影响参与者的收益。
收益是博弈中参与者通过选择策略而获得的回报。
在数学对策论中,收益通常用数值表示,并且参与者的目标是最大化自己的收益。
纳什均衡是数学对策论中的关键概念。
它是指在博弈中参与者选择策略的一种状态,其中每个参与者对于其他参与者的策略选择没有更好的替代选择。
换句话说,纳什均衡是一种稳定的策略状态,使得没有参与者能够通过改变自己的策略来获得更高的收益。
除了上述基本概念之外,数学对策论还包括其他重要的概念和方法,例如博弈的分类、策略的优化、信息不对称、合作博弈等。
博弈可以分为合作博弈和非合作博弈。
合作博弈是指参与者之间可以进行合作以达到更大的利益,而非合作博弈是指各方之间没有明确的合作关系。
策略的优化是指通过数学方法来确定最佳策略选择的过程。
例如,使用线性规划、动态规划等方法可以帮助决策者在博弈中确定最优策略。
对策论最大最小化原理
对策论是一种决策理论,它通过考虑各种可能的对策来进行决策。
而最大最小化原理是对策论中的一个重要原理,旨在寻找一种
策略,使得在最坏情况下所获得的收益最大化。
最大最小化原理的核心思想是,在面对不确定性和风险的情况下,决策者应该采取一种策略,使得无论对手采取何种对策,决策
者所能获得的最小收益也是最大的。
这种策略被称为最大最小化策略。
最大最小化原理可以用于各种决策场景,比如博弈论、优化问
题等。
在博弈论中,最大最小化原理可以帮助决策者在面对对手的
不确定行动时,选择一种最佳的策略,以最大化自己的利益。
在优
化问题中,最大最小化原理可以帮助寻找一种最优的决策方案,使
得在最坏情况下所获得的收益最大化。
最大最小化原理的应用需要考虑多个因素,包括决策者的目标、对手的行动空间、概率分布等。
通过分析各种可能的对策和其对应
的收益,可以找到最大最小化策略。
这种策略通常是在最坏情况下
保持最大收益的一种平衡选择。
总结来说,最大最小化原理是对策论中的一个重要原理,通过寻找一种策略,在面对不确定性和风险的情况下,无论对手采取何种对策,决策者所能获得的最小收益也是最大的。
它可以应用于博弈论、优化问题等多个领域,帮助决策者做出最佳的决策。
习题十二
12.1 A、B两人各有1元、5角和1角的硬币各一枚。
在双方互不知道的情况下各出一枚硬币,并规定当和为奇数时,A赢得B所出硬币;当和为偶数时,B赢得A所出硬币。
试据此列出二人零和对策的模型,并说明该项游戏对双方是否公平合理。
12.2A、B两人在互不知道的情况下,各自在纸上写﹛-1,0,1﹜三个数字中的任意一个。
设A所写数字为s,B所写数字为t,答案公布后B付给A的钱为〔s(t-s)+t(t+s)〕元。
试列出此问题对A的支付矩阵,并说明该游戏对双方是否公平合理。
12.3 已知A、B两人对策时对A的赢得矩阵如下,求双方各自的最优策略及对策值。
(1) 2 1 4 (2)―3 -2 6
2 0
3 2 0 2
-1 -2 0 5 -2 -4
12.4 在下列矩阵(a ij)3×3中确定p和q的取值范围,使得该矩阵在元素a22处存在鞍点。
(1) 1 q 6 (2) 2 4 5
p 5 10 10 7 q
6 2 3 4 p 6
12.5 A和B进行一种游戏。
A先在横坐标x轴的〔0,1〕区间内任选一个数,但不让B知道,然后B在纵坐标y的〔0,1〕区间内任选一个数。
双方选定后,B对A的支付为p(x,y)=0.5y2-2x2-2xy+3.5x+1.25y
求A、B各自的最优策略及对策值。
12.6 证明下列矩阵对策具有纯策略解(其中字母为任意实数)
(1) a b (2) a e a e a e a e
c d b f b f f b f b
a d c g g c c g g c
c b
12.7 下列矩阵为A、B对策时A的赢得矩阵,先尽可能按优超原则简化,再
用图解法求A,B各自的最优策略及对策值。
(1)-3 3 0 2 (2) 2 4 0 -2
-4 -1 2 -2 4 8 2 6
1 1 -
2 0 -2 0 4 2
0 -1 3 -1 -4 -2 -2 0
12.8 用线性规划方法求解下列对策问题:
(1) 3 -1 -3 (2)―1 2 1
-3 3 -1 1 -2 2
-4 -3 3 3 4 -3
12.9 每行与每列均包含有整数1,…,m的m×m矩阵称为拉丁方。
例如一个4×4的拉丁方为: 1 3 2 4
2 4
3 1
3 1
4 2
4 2 1 3
试证明对策矩阵为拉丁方的m×m矩阵对策的值为
2)1
(
m。
12.10 A,B,C三人进行围棋擂台赛。
三人中A最强,C最弱,又,一局棋赛中A胜C的概率为p,A胜B的概率为q,B胜C的概率为r。
擂台赛规则为先任选两人对擂,其胜者再同第三人对擂,若连胜,该人即为优胜者;反之,任何一局对擂的胜者再同未参加该局比赛的第三人对擂,并往复进行下去,直至任何一人连胜两局对擂为止,该人即为优胜者。
考虑到C最弱,故确定由C来定第一局由哪两人对擂。
试问C应如何抉择,使自己成为优胜者的概率为最大。
12.11有A,B两家生产小型电子计算器工厂,其中A厂研制出一种新型袖珍计算器。
为推出这种新产品加强与B厂竞争,考虑了三个竞争对策:①将新产品全面投入生产;②继续生产现有产品,新产品小批量试产试销;③维持原状,新产品只生产样品征求意见。
B厂了解到A厂有新产品情况下也考虑了三个策略:①加速研制新计算器;②对现有计算器革新;③改进产品外观和包装。
由于受市场预测能力限制,下表只表明双方对策结果的大致的定性分析资料(对A厂而言):若用打分法,一般记0分,较好打1分,好打2分,很好为3分,较差打一1分,差为一2分,很差为一3分,试通过对策分析,确定A,B两厂各应采取哪一种策略。
12.12有甲、乙两支游泳队举行包括三个项目的对抗赛。
这两支游泳队各有一名健将级运动员(甲队为李,乙队为王),在三个项目中成绩都很突出,但规则准许他们每人只能参加两项比赛,每队的其他两名运动员可参加全部三项比赛。
已知各运动员平时成绩(秒)见下表。
假定各运动员在比赛中都发挥正常水平,又比赛第一名得5分,第二名得3分,第三名得1分,问教练员应决定让自己队健将参加哪两项比赛,使本队得分最多?(各队参加比赛名单互相保密,定下来后不
12.13 A,B,C三人进行围棋擂台赛。
已知三人中A最强,C最弱,又知一局棋赛中A胜C的概率为p,A胜B的概率为q,B胜C的概率为r。
擂台赛规则为先任选两人对擂,其胜者再同第三者对擂,若连胜,该人即为优胜者;反之,任何一局对擂的胜者再同未参加该局比赛的第三者对擂,并往复进行下去,直至任何一人连胜两局对擂为止,该人即为优胜者。
考虑到C最弱,故确定由C来定第一局由哪两人对擂。
试问C应如何抉择,使自己成为优胜者的概率为最大。
12.14 有分别为l,2,3点的三张牌。
先给A任发一张牌,A看了后可以叫“小”或“大”,如叫“小”,赌注为2元,叫“大”时赌注为3元。
接下来给B 任发剩下来牌中的一张,B看后可有两种选择:①认输,付给A1元;②打赌,如上叫“小”,谁的牌点子小谁赢,如叫“大”,谁的牌点子大谁赢,输赢钱数为下的赌注数。
问在这种游戏中A、B各有多少个纯策略,根据优超原则说明哪些策略是拙劣的,在对策中不会使用,再求最优解。
12.15 有一种赌博游戏,游戏者I拿两张牌:红l和黑2,游戏者Ⅱ也拿两张牌:红2和黑3。
游戏时两人各同时出示一张牌,如颜色相同,Ⅱ付给I钱,如果颜色不同,I付给Ⅱ钱。
并且规定,如I打的是红l,按两人牌上点数差付钱。
如I打的是黑2,按两人牌上点数和付钱。
求游戏者I,Ⅱ的最优策略,并回答这
种游戏对双方是否公平合理?
12.16 A ,B 两名游戏者双方各持一枚硬币,同时展示硬币的一面。
如均为正面,A 赢32元,均为反面,A 赢31元,如为一正一反,A 输2
1元。
写出A 的赢得矩阵,A ,B 双方各自的最优策略,并回答这种游戏是否公平合理?
12.17 甲、乙两人对策。
甲手中有三张牌:二张K 和一张A 。
甲任意藏起一张后,然后宣称自己手中的牌是KK 或AK ,对此乙可以接受或提出异议。
如甲叫的正确而乙接受,甲得一元;如甲手中是KK 叫AK 时而乙接受,甲得二元;甲手中是AK 叫KK 时而乙接受,甲输二元。
如乙对甲的宣称提出异议,输赢和上述恰恰相反而且钱数加倍。
列出甲、乙各自的纯策略,求最优解和对策值,说明对策是否公平合理?
12.18 有一种游戏:任意掷一个钱币,先将出现是正面或反面的结果告诉甲。
甲有两种选择:①认输,付给乙一元;②打赌,只要甲认输,这一局就终止重来。
当甲打赌时,乙也有两种选择:①认输,付给甲一元;②叫真,在乙叫真时,如钱币掷的是正面,乙输给甲二元,如钱币是反面,甲输给乙二元。
试建立甲方的赢得矩阵,求对策值及双方各自的最优策略。
复习思考题
12.15 试述组成对策模型的三个基本要素及各要素的涵义。
12.16 试述二人零和有限对策在研究对策模型中的地位、意义,为什么它又被称为矩阵对策。
12.17 解释下列概念,并说明同组概念之间的联系和区别:(a)策略、纯策略、混合策略;(b)鞍点、平衡局势、纯局势、纯策略意义下的解;(c)混合扩充、混合局势、混合策略意义下的解;(d)优超,某纯策略被另一纯策略优超,某纯策略为其它纯策略的凸线性组合所优超。
12.18 判断下列说法是否正确:
(1)矩阵对策中,如果最优解要求一个局中人采取纯策略,则另一局中人也必须采取纯策略;
(2)矩阵对策中当局势达到平衡时,任何一方单方面改变自己的策略(纯策略或混合策略)将意味着自己更少的赢得或更大的损失;
(3)任何矩阵对策一定存在混合策略意义下的解,并可以通过求解两个互为对偶的线性规划问题得到;
(4)矩阵对策的对策值相当于进行若干次对策后局中人I 的平均赢得值或局中人Ⅱ的平均赢得值。