第八章╲t博弈论
- 格式:doc
- 大小:258.00 KB
- 文档页数:15
效用(英文:Utility),是经济学中最常用的概念之一。
一般而言,效用是指对于消费者通过消费或者享受闲暇等使自己的需求、欲望等得到的满足的一个度量。
正和博弈亦称为合作博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。
负和博弈,是指双方冲突和斗争的结果,是所得小于所失,就是我们通常所说的其结果的总和为负数,也是一种两败俱伤的博弈,结果双方都有不同程度的损失那是定理在一个有n个博弈方的博弈G=﹛S1,…,Sn:u1,…,un}中,如果n是有限的,且Si 都是有限集(对i=1,…,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
是由纳什发现的。
美苏争霸的囚徒困境军备竞赛是囚徒困境的又一个典型例子。
下面讲的,源自30年前美国的博弈论课本,本书不敢掠美。
从军事上看,30多年前,美国和苏联是世界上的两个超级大国,它们相互对垒。
假定每一方都有两种策略选择,一个是扩军,发展战略核武器,甚至实施“星球大战”计划等;另一个是彻底裁军,直至不设军备。
如果双方都扩军,则各花费2 000亿美元用于军费。
彻底裁军,则军费为0。
在一个弱肉强食的世界上,如果美国裁军不设防,但是苏联扩军,苏联就可以任意欺侮和损害美国。
这样,美国会受到很大损失。
损失之大,直至丧失主权。
这使我们可以非正式地把这种情况下美国的赢利记做–∞,即负无穷大。
这时候,欺侮人的一方的赢利是多少呢?你可能想象应该是+∞,即正无穷大。
其实不然。
你想想,砍伐一片森林所造成的损失,难道可以用所得到的木材的价值来补偿吗?更不必说占领甚至炸毁对方一座城市,你所得到的远远低于对方的损失。
被欺侮一方的损失,并不会等量地转化为欺侮人的一方的利益,这常常是对抗的规律。
所以,在一方扩军欺侮别人而另一方裁军任人欺侮的情况下,我们假定欺侮人的一方将只掠夺到一个有限数额的财富,比方说10 000亿美元。
这10 000亿美元的掠夺成本是上面讲的2 000亿美元。
第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。
本章讨论这个问题,建立复杂环境下的决策理论。
开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。
最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。
大部分经济行为都可视作博弈的特殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。
博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。
第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。
一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。
当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。
博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。
博弈论推广了标准的一人决策理论。
在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。
下面来举例说明。
例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。
局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。
对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。
当甲和乙都作出选择时,博弈的局势就确定了。
显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。
走近博弈论也记不清到底何时开始接触博弈论的,反正生活中总是会不经意的碰到一些与博弈有关的行行色色的问题。
在上大学之前,毕竟没有比较理性的学习与其有关的知识,对于一些问题也不会那么认真地去解决,然而接触的东西多了,使我不得不看了一些与博弈策略、心理学之类的书籍,更深入地去了解了一下它。
现如今,博弈论属于应用数学的一个分支,它已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家也使用博弈理论来理解和预测进化论的某些结果。
可见,博弈论真的为我们的生产生活带来许多重要的影响。
所以说,很有必要去认真了解一下它的比较基础的东西。
博弈的目的就是利益,而利益便是形成博弈的基础。
经济学的最基本的假设就是经济人或理性人的目的就在于使收益最大化。
参与博弈者正是为了自身收益的最大化而相互竞争。
也就是说,参与博弈的各方形成相互竞争、相互对抗的关系,以争得利益的多少来决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。
博弈的基本概念便是:决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。
对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。
他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。
局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。
1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。
2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。
博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。
于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。
中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。
博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。
生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。
而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。
特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。
由此可见,博弈论是适合所有人的科学。
在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。
博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。
可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。
从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。
第八章 若干专题及扩展本书的最后一章将对纳什均衡的一些扩展进行一个介绍性的讨论,这些扩展反映着博弈论最前沿的研究与最新的运用。
同时,这些扩展也为更好地理解博弈论提供了新的角度和基础。
这一章主要涉及到三个专题,即同盟博弈及其解概念——核、演化博弈及其解概念——演化稳定策略和学习博弈。
第一节 同盟博弈与核同盟博弈(Coalitional game)所关注的是博弈参与者是如何组成各种利益集团的,以及同盟的稳定性。
一个利益集团就被看作是一个同盟(Coalition),如果一个同盟包含所有的博弈参与者就称为大同盟(Grand coalition)。
实际上,如果我们把所有博弈参与者看作一个全集,用N 表示,那么一个同盟就是N 的子集,并且是对N 的一个分割(Partition),即如果我们定义一个博弈中的各同盟为S i ,i =1, …, k ,那么,i ≠j 和i j S S =∅I 1ki i S N ==U 。
为了方便,我们用N 来表示大同盟,用S 来表示其他的任意同盟。
显然,大同盟是一个极端,而每一个参与者都是一个同盟是另一个极端,而大多数同盟分割都位于两个极端之间。
对于同盟博弈而言,主要感兴趣的是位于两个极端之间的同盟分割情况。
由于博弈参与者唯一能做的就是站队,因而参与者的偏好实际上就是对各利益集团(同盟)的行动进行排序。
定义8.1 同盟博弈可表示为G={N, A S, u},其中(1)参与者集合:N={1, …, n}。
(2)对于每一个同盟S而言的行动集合:A S。
(3)偏好:每一个参与者的偏好就是对(其参与其中的)各同盟行动的排序。
例8.1 景泰蓝的分工协作要生产出一个景泰蓝需要n个劳动者分工协作,生产出来的景泰蓝所获收益(不妨假设为1)在各工人之间进行分配。
只要有一个工人不合作,景泰蓝就无法生产出来。
每一个工人都希望自己获得的收益份额越多越好。
该情景的同盟博弈为G={N, A S, u}:(1)参与者集合:N={1, …, n}。
第八章博弈论一、重点和难点(一)重点1.博弈论及其基本概念2.纳什均衡3.占优策略均衡4.囚徒困境博弈(二)难点1.最小最大值(或最大最小值)策略2.子博弈精炼纳什均衡3.动态博弈战略行动4.不完全信息静态博弈5.不完全信息动态博弈二、关键概念博弈零和博弈非常和博弈囚徒困境纳什均衡支付子博弈精炼纳什均衡完全信息静态博弈占优策略均衡重复博弈战略移动可信威胁豪尔绍尼转换三、习题(一)单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。
A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.规则B.占优战略均衡C.策略D.结局3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的战略称为()。
A.一报还一报的战略B.激发战略C.双头战略D.主导企业战略8.在囚徒困境的博弈中,合作策略会导致()。
A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在双寡头中存在联合协议可以实现整个行业的利润最大化,则()。
A.每个企业的产量必须相等B.该行业的产出水平是有效的C.该行业的边际收益必须等于总产出水平的边际成本D.如果没有联合协议,总产量会更大10.在什么时候,囚徒困境式博弈均衡最可能实现()。
A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时11.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种战略是一种()。
A.主导战略B.激发战略C.一报还一报战略D.无用战略12.关于策略式博弈,正确的说法是()。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵13.下面关于共同知识的说法,正确的是()。
A. 每一个局中人都知道的事,就是共同知识B. 一般地,假定支付为共同知识C. 共同知识的假定要求局中人的计算能力不是很强D. 纳什均衡不需要共同知识的假定14、导致价格战爆发的原因是()A.合作均衡B.使用一报还一报的战略的企业的出现,这一战略是其竞争者在前一阶段遵守联合协议时采取的C.进入该行业并立刻同意遵守联合协议的新企业的出现D.新企业进入一个行业后,所有企业发觉自己处在囚徒困境中 (二)判断说明题1.博弈论是用来分析垄断竞争企业行为的。
2.在一次性囚徒困境博弈中,对一个囚徒来说,如果他相信另一个囚徒会坦白,则他的占优战略就是坦白。
3.因为零和博弈中博弈方之间的关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。
4.凡是博弈方的选择、行为有先后次序的一定是动态博弈。
5.合作博弈就是博弈方采取相互合作态度的博弈。
6.纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。
7.如果一博弈有两个纯策略纳什均衡,则一定还存在一个混合策略均衡。
8.在动态博弈中,因为后行为的博弈方可以先观察对方行为后再选择行为,因此总是有利的。
9.多人博弈中的“破坏者”会对所有博弈方的利益产生不利影响。
10.纯策略纳什均衡和混合策略纳什均衡都不一定存在。
(三)计算题1.北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。
如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。
如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。
(1)将这一市场用囚徒困境的博弈加以表示。
(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。
2.Smith 和John 玩数字匹配游戏,每个人选择1、2、3,如果数字相同, John 给Smith 3美元,如果不同,Smith 给John 1美元。
(1)列出收益矩阵。
(2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少?3.假设双头垄断企业的成本函数分别为:1120Q C =,2222Q C =,市场需求曲线为Q P 2400-=,其中,21Q Q Q +=。
(1)求出古诺(Cournot )均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点。
(2)求出斯塔克博格(Stackelberg )均衡情况下的产量、价格和利润,并以图形表示。
(3)说明导致上述两种均衡结果差异的原因。
4.假设有两个游戏者A 和B ,他们分别代表两家企业,生产不同的部件,但生产的部件在型号选择上有“大”、“小”之分。
若一家企业选择的型号为“大”,另一家企业选择的型号为“小”,则会发生不匹配的问题。
只有当两家企业选择的型号匹配时,才会有均衡。
下表给出了这一合作博弈的形式。
(1)假设企业A 先走一步,企业B 的策略选择有多少种?写出A 和B 的策略组合及相应的收益矩阵。
(2)在这些策略组合中,有无纳什均衡?如有,哪些是?(3)将上述策略组合写成广延型博弈形式,并求出子博弈完美纳什均衡。
5.假设在一个博弈模型中,有两个参与者,即政府和私人部门。
私人部门选择的是预期的通货膨胀率,政府选择的是实际的通货膨胀率。
并且政府不仅关心通货膨胀问题,而且还关心失业问题。
设政府的效用函数为:2*2)(ky y c U ---=π其中,π是通货膨胀率,*y 是自然失业率下的均衡产量,y 是实际产量,0>c ,1>k 。
同时假定产出与通货膨胀率之间的关系是由含有通货膨胀预期的菲利浦斯曲线决定,也就是说菲利浦斯曲线是:)(*e y y ππβ-+=其中,e π是预期的通货膨胀率,0>β。
如果私人都具有理性预期,那么运用博弈论的有关知识来证明,在短期内政府所采取的通货膨胀政策不能增加产出。
(四)问答题1.举一个你在现实生活中遇到的囚犯两难困境的例子。
表中每组数字前面一个表示A 企业的收益,后一个数字表示B 企业的收益。
(1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡?(2)存在帕累托改进吗?如果存在,在什么条件下可以实现?福利增量是多少? (3)如何改变上述A 、B 企业的收益才能使均衡成为纳什均衡或占优策略均衡?如何改变上述A 、B 企业的收益才能使该博弈不存在均衡?3.在纳税检查的博弈中,假设A 为应纳税款,C 为检查成本,F 是偷税罚款,且C<A+F ;S 为税务机关检查的概率,E 为纳税人逃税的概率;不存在纯战略纳什均衡。
(1)写出支付矩阵。
(2)分析混合策略纳什均衡。
(五)案例分析题1.阅读以下材料,联系实际情况,运用所学理论进行评析。
囚徒困境中的宝洁公司宝洁(P&G)、联合利华和花牌同时计划进入杀虫胶带市场。
它们都面临同样的成本和需求条件,而各厂商必须在考虑到他的竞争者们的情况下决定一个价格。
如果P&G 和它的竞争者都将价格定在1.50美元,他能得到更多的利润。
这从下表中的支付矩阵中看得很清楚。
如果所有厂商都定价1.50美元,它们每月各可赚到20000美元利润,而不是定价l.40美元可以赚到的12000美元。
那么为什么它们不定价1.50美元呢?联合利华和花牌定价宝洁(P&G)l.40美元 1.50美元*假设联合利华和花牌定相同的价格。
矩阵中数字以每月千美元为单位。
因为这些厂商处在一个囚徒的困境中,不管联合利华和花牌定价多少,宝洁定价l.40美元都能赚更多的钱。
例如,若联合利华和花牌定价1.50美元,宝洁定价l.40美元每月可赚29000美元,而定价1.50美元只能赚20000美元。
这对联合利华和花牌也是正确的。
例如,宝洁定价l.50美元而联合利华和花牌定价1.40美元,它们将各赚到21000美元而不是20000美元。
结果,宝洁知道如果它定价1.50美元,它的竞争者会有强烈的低价竞争,定价l.40美元的冲动,这样P&G 将只有一个很小的市场份额和只能赚到每月3000美元的利润。
P&G 应该冒险防信任竞争者定价1.50美元吗?如果你面对这样的困境,你会怎么做呢?2.一个工人给老板干活,工资标准是100元。
工人可以选择是否偷懒,老板则选择是否克扣工资。
假设工人不偷懒有相当于50元的负效用,老板想克扣工资则总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒时老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道。
请问(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形式表示该博弈并作简单分析。
(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形式表示该博弈并作简单分析。
参考答案(一)单项选择题1.(B )2.(B )3.(C )4.(D )5.(A )6.(C )7.(A )8.(A )9.(C ) 10.(D ) 11.(C ) 12.(B ) 13.(B ) 14.(D ) (二)判断说明题1.错【解题思路】:本题分析博弈论与寡头垄断企业的关系。
【解析】:博弈论是用来分析寡头垄断企业行为的理论。
2.错【解题思路】:本题分析占优战略。
【解析】:在囚徒困境博弈中,占优战略是招供,即不管对方的行为是怎样的,每个囚徒都会采取招供的战略。
3.错【解题思路】:本题考察零和博弈和非合作博弈的关系。
【解析】:虽然零和博弈中博弈方的利益确实是对立的,但非合作博弈的含义并不是博弈方之间的关系是竞争性的、对立的,而是指博弈方是以个体理性、个体利益最大化为行为的逻辑和依据,是指博弈中不能包含有约束力的协议。
4.错【解题思路】:本题考察动态博弈。
【解析】:其实并不是所有选择、行为有先后次序的博弈问题都是动态博弈。
例如两个厂商先后确定自己的产量,但只要后确定产量的厂商在定产之前不知道另一厂商的产量是多少,就是静态博弈问题而非动态博弈问题。
5.错【解题思路】:本题考察合作博弈。
【解析】:合作博弈在博弈论中专门指博弈方之间可以达成和运用有约束力的协议限制行为选择的博弈问题,与博弈方的态度是否合作无关。