数学建模讲座之博弈论(一)
- 格式:ppt
- 大小:1.38 MB
- 文档页数:40
博弈论的数学模型作者:竺可桢学院01混合班王大方何霈邹铭摘要博弈论现在得到了广泛的应用,涉及到人的决策问题都可以用博弈论的模型加以解释。
本文首先用数学的方法表述实际生活中的博弈行为,并导出一般情况下的博弈的结果,进而讨论一些不同的外部约束条件对博弈过程的影响。
我们用经济学中的垄断竞争现象作为博弈问题的一个实例,讨论生产者在不同状态下的决策,进而分析双方共谋的动机和可能性。
(一)基本博弈模型的建立一, 博弈行为的表述博弈的标准式包括:1.1.博弈的参与者。
2.2.每一个参与者可供选择的战略集。
3.3.针对所有参与者可能选择的战略组合,每一个参与者获得的利益在n人博弈中,用Si为参与者i的可以选择战略空间,其中任意一个特定的纯战略为s i,其中任意特定的纯战略为s i,s i∈Si,n元函数u i(s1,s2,……s n), 当n个博弈者的决策为s1,s2,……s n时,表示第I各参与者的收益函数。
二, 博弈的解当博弈进入一个稳定状态时,参与者选择的战略必然是针对其他参与者既定战略的最优反应,在此状态下没有人愿意单独背离当前的局势。
这个局势叫纳什均衡:在n个参与者标准式博弈,G={ S1,S2,……S n;u1,u2,……u n}中,若战略组合{s1*,s2*,……s n*}满足对每一个参与者i,s i*是针对{ s1*,s2*,……s i-1*,s i+1*……s n*}的最优反应战略,,目标战略组合{s1*,s2*,……s n*}为该博弈的纳什均衡。
即:u i { s1*,s2*,……s i-1*,s i*,s i+1*……s n*}≥u i { s1*,s2*,……s i-1*,s i,s i+1*……s n*},对一切s i∈Si均成立。
纳什于1950年证明在任何有限个参与者,且每个参与者可选择的纯战略为有限个的博弈中,均存在纳什均衡。
(包括混合战略)混合战略指认某种概率分布来取一个战略空间中的战略,在本文中不加讨论。
博弈论的概念博弈论又被称为对策论(Games Theory),是研究具有斗争或竞争性质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博弈论是个非常重要的理论概念。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的的学科。
博弈论的基本概念博弈要素(1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
(2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
(3)得失:一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
数学建模博弈论在前一讲中,我们讨论了决策论,其中决策者面对的结果和支付只依赖于他本人的决策,而不依赖一个或者多个其他参与者的决策。
决策论最后决定的结果可能存在机会和风险,但不会与另一个参与者的决策有关系。
比如假定两个国家在军备竞赛而希望裁军,如果一方裁军,这个国家的结果不仅依赖于该国的决策,也依赖于第二个国家的决策。
如果只依赖于一个参与者,我们把这类决策模型称为决策论;如果结果依赖于多于一个参与者的决策,我们把这类决策模型称为博弈论;10.1:博弈论:完全冲突:按照参与者之间的冲突是完全冲突还是部分冲突对博弈论进行分类。
进一步把完全冲突的博弈按照最优策略是纯策略还是混合策略进行分类。
举例1:一个有纯策略的完全冲突博弈:例如有两家连锁店,都同时想在两个城市开连锁店,假设为A,B两地,如图所示是两个连锁店所占的市场份额:从上图可以发现两家连锁店其中一家每得到一点份额都是需要另一家失去一点份额,而市场总额是1,并且两家连锁店的决策结果不仅取决于自身还取决与对手的策略。
这个博弈是完全冲突的。
定义:纯策略是参与者可采取的行动的集合,每个参与者选定的策略共同决定博弈的结果以及每个参与者的花费。
通过图中数据我们也可以发现,无论甲连锁店开在何处,乙连锁店只需要开在A地就可以始终占优。
占优策略:定义:策略A占优与策略B,是指策略A的每一个结果至少和B的对应结果一样好,并且至少A的某一个结果严格优于B的对应结果。
占优原理:在严格冲突博弈中,一个理性的参与者应该永远不要采用被占优的策略。
同时也可以发现结果(A,A)即两个连锁店都开在A地时,此时没有任何一个参与者可以单方面改变策略而使得自己获得改善,这种情况我们称为纳什均衡:表示这样一个结果,任何一个参与者都不能通过单方面更改策略而获得好处。
同时由于这些每个结果和是1,完全冲突博弈也称作常数和博弈:如果对每一个可能的结果,每个参与者的支付之和是同一个常数,这个博弈称为完全冲突博弈。