博弈论game theory
- 格式:ppt
- 大小:41.08 MB
- 文档页数:161
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的学科。
博弈的分类根据不同的基准也有所不同。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
第三节博弈论(Game Theory)在国际关系的研究过程中,我们时常会运用到博弈论这样一个工具。
博弈论在英语中称之为“Game Theory”。
很多人会认为这是一种所谓的游戏理论,其实不然,我们不能把Games 与Fun 同论,而应该将博弈论称之为是一种“Strategic interaction”(策略性互动)。
“博弈”一词现如今在我们的生活中出现的已经很频繁,我们经常会听说各种类型的国家间博弈(如:中美博弈),“博弈论”已经深刻的影响了世界局势和地区局势的发展。
在iChange创设的危机联动体系中,博弈论将得到充分利用,代表也将有机会运用博弈论的知识来解决iChange 核心学术委员会设计的危机。
在这一节中,我将对博弈论进行一个初步的介绍与讨论,代表们可以从这一节中了解到博弈论的相关历史以及一些经典案例的剖析。
(请注意:博弈论的应用范围非常广泛,涵盖数学、经济学、生物学、计算机科学、国际关系、政治学及军事战略等多种学科,对博弈论案例的一些深入分析有时需要运用到高等数学知识,在本节中我们不会涉及较多的数学概念,仅会通过一些基本的数学分析和逻辑推理来方便理解将要讨论的经典博弈案例。
)3.1 从“叙利亚局势”到“零和博弈”在先前关于现实主义理论的讨论中,我们对国家间博弈已经有了初步的了解,那就是国家是有目的的行为体,他们总为了实现自己利益的最大化而选择对自己最有利的战略,其次,政治结果不仅仅只取决于一个国家的战略选择还取决于其他国家的战略选择,多种选择的互相作用,或者策略性互动会产生不同的结果。
因此,国家行为体在选择战略前会预判他国的战略。
在这样的条件下,让我们用一个简单的模型分析一下发生在2013年叙利亚局势1:叙利亚危机从2011年发展至今已经将进入第四个年头。
叙利亚危机从叙利亚政府军屠杀平民和儿童再到使用化学武器而骤然升级,以2013年8月底美国欲对叙利亚动武达到最为紧张的状态,同年9月中旬,叙利亚阿萨德政府以愿意向国际社会交出化学武器并同意立即加入《禁止化学武器公约》的态度而使得局势趋向缓和。
博弈论GameTheory;亦名“对策论”、“赛局理论”;属应用数学的一个分支;博弈论已经成为经济学的标准分析工具之一..目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用..博弈论主要研究公式化了的激励结构间的相互作用..是研究具有斗争或竞争性质现象的数学理论和方法..也是运筹学的一个重要学科..博弈论考虑游戏中的个体的预测行为和实际行为;并研究它们的优化策略..生物学家使用博弈理论来理解和预测进化论的某些结果..几个重要的概念1、策略strategies:一局博弈中;每个局中人都有选择实际可行的完整的行动方案;即方案不是某阶段的行动方案;而是指导整个行动的一个方案;一个局中人的一个可行的自始至终全局筹划的一个行动方案;称为这个局中人的一个策略..如果在一个博弈中局中人都总共有有限个策略;则称为“有限博弈”;否则称为“无限博弈”.. 2、得失payoffs:一局博弈结局时的结果称为得失..每个局中人在一局博弈结束时的得失;不仅与该局中人自身所选择的策略有关;而且与全局中人所取定的一组策略有关..所以;一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数;通常称为支付payoff函数..3、次序orders:各博弈方的决策有先后之分;且一个博弈方要作不止一次的决策选择;就出现了次序问题;其他要素相同次序不同;博弈就不同..4、博弈涉及到均衡:均衡是平衡的意思;在经济学中;均衡意即相关量处于稳定值..在供求关系中;某一商品市场如果在某一价格下;想以此价格买此商品的人均能买到;而想卖的人均能卖出;此时我们就说;该商品的供求达到了均衡..5、纳什均衡NashEquilibrium:在一策略组合中;所有的参与者面临这样一种情况;当其他人不改变策略时;他此时的策略是最好的..也就是说;此时如果他改变策略他的支付将会降低..在纳什均衡点上;每一个理性的参与者都不会有单独改变策略的冲动..纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出..所谓“均衡偶”是在二人零和博弈中;当局中人A采取其最优策略a;局中人B也采取其最优策略b;如果局中人B仍采取b;而局中人A却采取另一种策略a;那么局中人A的支付不会超过他采取原来的策略a的支付..这一结果对局中人B亦是如此..经典的博弈问题1、“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一..讲的是两个嫌疑犯A和B作案后被警察抓住;隔离审讯;警方的政策是"坦白从宽;抗拒从严";如果两人都坦白则各判8年;如果一人坦白另一人不坦白;坦白的放出去;不坦白的判10年;如果都不坦白则因证据不足各判1年..在这个例子里;博弈的参加者就是两个嫌疑犯A和B;他们每个人都有两个策略即坦白和不坦白;判刑的年数就是他们的支付..可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白;是博弈的结果..A和B均坦白是这个博弈的纳什均衡..这是因为;假定A选择坦白的话;B最好是选择坦白;因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话;B最好还是选择坦白;因为B坦白判不被判刑而抵赖确要被判刑1年..即是说;不管A坦白或抵赖;B的最佳选择都是坦白..反过来;同样地;不管B是坦白还是抵赖;A的最佳选择也是坦白..结果;两个人都选择了坦白;各判刑8年..在坦白、坦白这个组合中;A和B都不能通过单方面的改变行动增加自己的收益;于是谁也没有动力游离这个组合;因此这个组合是纳什均衡..囚徒困境反映了个人理性和集体理性的矛盾..如果A和B都选择抵赖;各判刑1年;显然比都选择坦白各判刑8年好得多..当然;A和B可以在被警察抓到之前订立一个"攻守同盟";但是这可能不会有用;因为它不构成纳什均衡;没有人有积极性遵守这个协定..2、海盗分金币问题在一座座荒岛上;有5个强盗掘出了100块非常珍贵的金币..他们商定了一个分配金币的规则:首先抽签决定每个人的次序;排列成强盗一至五..然后由强盗一先提出分配方案;经5人表决;如多数人同意;方案就被通过;否则强盗一将被扔入大海喂鲨鱼..如果强盗一被扔入大海;就由强盗二接着提出分配方案;如多数人同意方案就被通过;否则强盗二也要被扔入大海..以下依次类推..假定每个强盗都足够聪明;都能做出理性的选择;那么;强盗一提出什么样的分配方案;能够使自己得到最大的收益对于这个问题要采用方向推导方法:如果1至3号强盗都喂了鲨鱼;只剩4号和5号的话;5号一定投反对票让4号喂鲨鱼;以独吞全部金币..所以;4号惟有支持3号才能保命..3号知道这一点;就会提出“100;0;0”的分配方案;对4号、5号一毛不拔而将全部金币归为已有;因为他知道4号一无所获但还是会投赞成票;再加上自己一票;他的方案即可通过..不过;2号推知3号的方案;就会提出“98;0;1;1”的方案;即放弃3号;而给予4号和5号各一枚金币..由于该方案对于4号和5号来说比在3号分配时更为有利;他们将支持他而不希望他出局而由3号来分配..这样;2号将拿走98枚金币..同样;2号的方案也会被1号所洞悉;1号并将提出97;0;1;2;0或97;0;1;0;2的方案;即放弃2号;而给3号一枚金币;同时给4号或5号2枚金币..由于1号的这一方案对于3号和4号或5号来说;相比2号分配时更优;他们将投1号的赞成票;再加上1号自己的票;1号的方案可获通过;97枚金币可轻松落入囊中..这无疑是1号能够获取最大收益的方案了答案是:1号强盗分给3号1枚金币;分给4号或5号强盗2枚;自己独得97枚..分配方案可写成97;0;1;2;0或97;0;1;0;2..1号看起来最有可能喂鲨鱼;但他牢牢地把握住先发优势;结果不但消除了死亡威胁;还收益最大..而5号;看起来最安全;没有死亡的威胁;甚至还能坐收渔人之利;却因不得不看别人脸色行事而只能分得一小杯羹..在“海盗分金”中;任何“分配者”想让自己的方案获得通过的关键是;事先考虑清楚“挑战者”的分配方案是什么;并用最小的代价获取最大收益;拉拢“挑战者”分配方案中最不得意的人们..3、旅行者困境两个旅行者从一个以出产细瓷花瓶着称的地方旅行回来;他们都买了花瓶..提取行李的时候;发现花瓶被摔坏了;于是他们向航空公司索赔..航空公司知道花瓶的价格大概在八九十元的价位浮动;但是不知道两位旅客买的时候的确切价格是多少..于是;航空公司请两位旅客在100元以内自己写下花瓶的价格..如果两人写的一样;航空公司将认为他们讲真话;就按照他们写的数额赔偿;如果两人写的不一样;航空公司就认定写得低的旅客讲的是真话;并且原则上按这个低的价格赔偿;同时;航空公司对讲真话的旅客奖励2元;对讲假话的旅客罚款2元..为了获取最大赔偿而言;本来甲乙双方最好的策略;就是都写100元;这样两人都能够获赔100元..可是不;甲很聪明;他想:如果我少写1元变成99元;而乙会写100元;这样我将得到101元..何乐而不为所以他准备写99元..可是乙更聪明;他算计到甲要算计他写99元;于是他准备写98元..想不到甲还要更聪明一个层次;估计到乙要写98元来坑他;于是他准备写97元……大家知道;下象棋的时候;不是说要多“看”几步吗;“看”得越远;胜算越大.. 你多看两步;我比你更强多看三步;你多看四步;我比你更老谋深算多看五步..在花瓶索赔的例子中;如果两个人都“彻底理性”;都能看透十几步甚至几十步上百步;那么上面那样“精明比赛”的结果;最后落到每个人都只写一两元的地步..事实上;在彻底理性的假设之下;这个博弈唯一的纳什均衡..4、枪手博弈彼此痛恨的甲、乙、丙三个枪手准备决斗..甲枪法最好;十发八中;乙枪法次之;十发六中;丙枪法最差;十发四中..如果三人同时开枪;并且每人只发一枪;第一轮枪战后;谁活下来的机会大一些一般人认为甲的枪法好;活下来的可能性大一些..但合乎推理的结论是;枪法最糟糕的丙活下来的几率最大..我们来分析一下各个枪手的策略..枪手甲一定要对枪手乙先开枪..因为乙对甲的威胁要比丙对甲的威胁更大;甲应该首先干掉乙;这是甲的最佳策略..同样的道理;枪手乙的最佳策略是第一枪瞄准甲..乙一旦将甲干掉;乙和丙进行对决;乙胜算的概率自然大很多..枪手丙的最佳策略也是先对甲开枪..乙的枪法毕竟比甲差一些;丙先把甲干掉再与乙进行对决;丙的存活概率还是要高一些..我们计算一下三个枪手在上述情况下第一轮枪战中的存活几率:甲:24%被乙丙合射40%X60%=24%乙:20%被甲射100%-80%=20%丙:100%无人射丙第二轮枪战中甲乙丙存活的几率粗算如下:1假设甲丙对决:甲的存活率为60%;丙的存活率为20%..2假设乙丙对决:乙的存活率为60%;丙的存活率为40%..第一轮:甲射乙;乙射甲;丙射甲..甲的活率为24%40%X60%;乙的活率为20%100%-80%;丙的活率为100%无人射丙..第二轮:情况1:甲活乙死24%X80%=19.2%甲射丙;丙射甲──甲的活率为60%;丙的活率为20%..情况2:乙活甲死20%X76%=15.2%乙射丙;丙射乙──乙的活率为60%;丙的活率为40%..情况3:甲乙皆活24%X20%=4.8%重复第一轮..情况4:甲乙皆死76%X80%=60.8%枪战结束..甲的活率为12.672%19.2%X60%+4.8%X24%=12.672%乙的活率为10.08%15.2%X60%+4.8%X20%=10.08%丙的活率为75.52%19.2%X20%+15.2%X40%+4.8%X100%+60.8%X100%=75.52%通过对两轮枪战的详细概率计算;我们仍然发现枪法最差的丙存活的几率最大;枪法较好的甲和乙的存活几率仍远低于丙的存活几率..对于这样的例子;有人会发出“英雄创造历史;庸人繁衍子孙”的感叹..。
博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
在博弈论中,通常包括以下基本概念:
局中人:在一场竞赛或博弈中,具有决策权的参与者被称为“局中人”。
在一个博弈中,每个局中人都要做出选择。
行动:局中人在博弈中的每一个决策或选择被称为“行动”。
信息:局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。
策略:局中人基于可获得的信息,制定的决策方案或规则称为“策略”。
收益:局中人在博弈中的得失或输赢称为“收益”。
均衡:当所有局中人都认为自己的策略选择最优,并且其他局中人也认为该策略选择是最优时,这种状态被称为“均衡”。
结果:在一场博弈结束后,所有局中人的收益总和被称为“结果”。
博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。
其中,局中人、策略和收益是最基本要素。
发展过程方面,博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。