当前位置：文档之家› 7第七章不完全信息动态博弈

7第七章不完全信息动态博弈

完全信息动态博弈练习题

1、空中客车与波音两家公司在研发新型商业客机方面展开激烈竞争。波音公司在研发过程中已经处于领先地位，而空中客车正考虑是否参与这场竞争。假如空中客车不参与竞争，那么它的收益为0，而波音公司将会获得垄断地位，获得10亿美元的收益。假如空中客车决定参与竞争，则波音公司就不得不决定与空中客车进行和平竞争，还是打价格战。如果和平竞争，双方各自获得3亿美元的收益；如果打价格战，则客机价格下滑，双方都无法收回研发成本，各损失1亿美元。请画出博弈树，找出子博弈精炼纳什均衡。 2、考虑可乐行业，可口可乐与百事可乐是两家主要公司，市场规模为80亿美元。每家公司可以选择是否做广告，广告成本为10亿美元；如果一家企业做广告而另一家不做，则前者强的所有市场；如果两家企业都做广告，则各占一半市场，并付出广告成本；如果两家公司都不做广告，也各占一般市场，但不支付广告成本。（a）画出博弈支付表，并找出当两家公司同时行动时的纳什均衡; （b）假定博弈序贯进行，画出可口可乐公司率先行动时该博弈的博弈树。（c）在（a）、（b）均衡中，从可口可乐与百事可乐的共同观点来看，哪一个是最佳的，这两家公司要怎样才会有更好的结果？ 3、假设巨人、太阳神、弗里达三大百货公司正考虑在波士顿两个新的大型购物中心中的一个开设分店。其中，城市购物中心靠近人口密集的富人区，规模不大，最多只能以两家大百货商场为龙头。而郊区购物中心地处较远的郊外，相对较穷，能以三家百货商场为龙头。三家百货公司都不想在两个地方同时开店，因为顾客有相当部分重复，两处都开店无疑是同自己竞争。每家百货公司都不愿意在一个地方独家经营，拥有多家商场的购物中心能够吸引更多的顾客，顾客总量的增加自然会使商场利润增加。此外，它们都偏向争夺富人群体的城市购物中心，所以它们必须在城市购物中心（如果这个尝试失败了，它们将会尝试在郊区建立商场）和郊区购物中心（不争取城市市场而直接进入郊区市场）之间作出选择。在该案例中，百货公司将5种可能结果按等级排列如下：5 （最好）和另一家公司在城市购物中心；4 和一家或两家公司在郊区购物中心；3 在城市购物中心独家经营；2 在郊区购物中心独家经营； 1 最坏，在尝试进入城市市场失败后在郊区独家经营，而此时其他非百货业公司已经签约获得郊区购物中心的最好地盘。三家百货公司因管理结构各不相同，所以做新购物中心扩展市场工作的快慢也不同。弗里达公司动作最快，其次是巨人公司，最后是太阳神公司，它在准

完全信息动态博弈习题(一)

完全信息动态博弈习题（一） 1、在一个由三个寡头垄断者操纵的市场上，反需求函数由()Q a Q P -=给出，此处321q q q Q ++=，i q 表示企业i 生产的产量。每一企业生产的边际成本函数为常数c ，并且没有固定成本。企业按以下顺序进行产出决策：（1）企业1选择01≥q ；（2）企业2和3观测到1q ，并同时分别选择2q 和3q 。试求出此博弈的子博弈精炼解。解：采用逆向归纳法。（1）在第二阶段企业2和企业3决策： ()[]223212 222cq q q q q a Max Max q q ----≥≥=π π ()[]333213 333cq q q q q a Max Max q q ----≥≥=π π 求出反应函数为：??? ??????????? --=--=33 1312q c a q q c a q （2）第一阶段企业1的决策： ()[]113211cq q q q q a Max ----π 一阶条件： 023211 1=----=??c q q q a q π，将 3 31 31 2q c a q q c a q --= --= 带入可求得： 2 1c a q -= ，6 32c a q q -= =

2、假设家长和孩子进行一个博弈：令收入为p I （家长的收入）和c I （孩子的收入）是外生给定的，第一，孩子决定收入c I 中的多少用于储蓄S 以备将来，并消费掉其余部分B I c -；第二，家长观测到孩子的选择S 并决定给予一个赠与额B 。孩子的收益（支付）为当期和未来的效用之和：()()B S U S I U c ++-21；家长的收益（支付）为()()()[]B S U S I U k B I V c p ++-+-21（其中k>0反映出家长关心孩子的福利）。假定效用函数1U 、2U 和V 递增并且严格凹，试证明：在逆向归纳解中，孩子的储蓄非常少，从而可诱使家长给予更高的赠与（即如果S 增加，并使B 相应减少，家长和孩子的福利都会提高）。解：采用逆向归纳法，先最大化家长的收益（支付）：给定的孩子的行动S ，来选择自己的行动B, Max ()()()[]B S U S I U k B I V c p ++-+-21 一阶条件： ()()B S kU B I V p +' =-'2 反应函数满足： 0//122*+dS B S d ，所以（S+B ）会增加，从而()B S U +2也会增加；同时，因为()B S U +2增加的幅度比()S I U c -1减小的幅度大，所以孩子的收益（支付）效用增大了，同时家长的收益（支付）效用也增大了。

博弈论——完全信息动态博弈

2 完全信息的动态博弈 2.1完全和完美信息的动态博弈动态博弈(dynamic game)：参与人在不同的时间选择行动。完全信息动态博弈指的是各博弈方先后行动，后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合下所有参与人相应的得益都完全了解的博弈静态博弈习惯用战略式(Strategic form representation)表述，动态博弈习惯用扩展式（Extensive form representation）表述。战略式表述的三要素：参与人集合、每个参与人的战略集合、由战略组合决定的每个参与人的支付。扩展式表述的要素包括：参与人集合、参与人的行动顺序、参与人的行动空间、参与人的信息集、参与人的支付函数、外生事件（自然的选择）的概率分布。 n人有限战略博弈的扩展式表述用博弈树来表示 1 (1,2) (0,3)

①结：包括决策结和终点结。决策结是参与人采取行动的时点，终点结是博弈行动路径的终点。第一个行动选择对应的决策结为“初始结”，用空心圆表示，其它决策结用实心圆表示。X表示结的集合，x X表示某个特定的结。z表示终点结，Z表示终点结集合。表示结之间的顺序关系，x x′表示x在x′之前。x之前所有结的集合称为x的前列集，x之后所有结的集合称为x的后续集。以下两种情况不允许：前者违背了传递性和反对称性；后者违背了前列节必须是全排序的。在以上两个假设之下，每个终点结都完全决定了博弈树的某个路径。 ②枝：博弈树上，枝是从一个决策结到其直接后续结的连线，每一个枝代表参与人的一个行动选择。在每一个枝旁标注该具体行动的代号。一般地，每个决策结下有多个枝，给出每次行动时参与人的行动空间，即此时有哪些行动可供选择。 ③信息集（information sets）：博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结集合称为一个信息集。博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合)，该子集包括所有满足下列条件的决策结：(1)每一个决策结都是同一个参与人的决策结。(2)该参与人知道博弈进入该集合的某个决策结，但不知道自己究竟处于哪一个决策结。引入信息集的目的是为了描述当一个参与人要作出决策时他可能不知道“之前”发生的所有事情。（之前加引号是因为，博弈树中的决策结的排序并不一定与行动的时间顺序相一致）

网络安全不完全信息动态博弈模型

万方数据

网络安全不完全信息动态博弈模型作者：贾春福，钟安鸣，张炜，马勇， Jia Chunfu， Zhong Anming， Zhang Wei， Ma Yong 作者单位：贾春福,Jia Chunfu(中国科学技术大学信息科学技术学院,合肥,230026;南开大学信息技术科学学院,天津,300071)，钟安鸣,张炜,马勇,Zhong Anming,Zhang Wei,Ma Yong(南开大学信息技术科学学院,天津,300071) 刊名：计算机研究与发展英文刊名：JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT 年，卷(期)：2006,43(z2) 被引用次数：4次参考文献(4条) 1.B V John A conceptual model of hacker development and motivations 2001(02) 2.B Schneier Attack trees:Modeling security threats 1999(12) 3.M Rogers Psychology of hackers:A new taxonomy available 2001 4.向叔文约束条件下的Nash平衡点[期刊论文]-贵州工业大学学报 1998(04) 本文读者也读过(5条) 1.苘大鹏.杨武.杨永田.周渊.张冰.Man Dapeng.Yang Wu.Yang Yongtian.Zhou Yuan.Zhang Bing基于弱点关联和安全需求的网络安全评估方法[期刊论文]-高技术通讯2009,19(2) 2.唐成华.姚淑萍.张翔.崔中杰.Tang Chenghua.Yao Shuping.Zhang Xiang.Cui Zhongjie网络安全综合监控平台中安全策略的研究[期刊论文]-计算机研究与发展2006,43(z2) 3.李英楠.张宏莉.云晓春.方滨兴.LI Ying-nan.ZHANG Hong-li.YUN Xiao-chun.FANG Bin-xing基于网络拓扑的网络安全事件宏观预警与响应分析[期刊论文]-哈尔滨工业大学学报2005,37(11) 4.王起宏.李芝棠.WANG Qihong.Li Zhitang网络欺骗在网络安全中作用的分析[期刊论文]-华中科技大学学报（自然科学版）2005,33(5) 5.张海霞.苏璞睿.冯登国.Zhang Haixia.Su Purui.Feng Dengguo基于攻击能力增长的网络安全分析模型[期刊论文]-计算机研究与发展2007,44(12) 引证文献(5条) 1.娄燕强.宋如顺.马永彩基于RBF神经网络的攻防博弈模型[期刊论文]-计算机应用与软件 2011(1) 2.娄燕强.宋如顺.马永彩基于RBF神经网络的攻防博弈模型[期刊论文]-计算机应用与软件 2011(1) 3.孟祥宏信息安全攻防博弈研究[期刊论文]-计算机技术与发展 2010(4) 4.浅议信息安全攻防对抗[期刊论文]-网络安全技术与应用 2009(9) 5.石乐义.贾春福.吕述望服务跳变抗DoS机制的博弈理论分析[期刊论文]-电子与信息学报 2009(1) 本文链接：https://www.doczj.com/doc/847785821.html,/Periodical_jsjyjyfz2006z2101.aspx

第九章不完全信息动态博弈

第九章不完全信息动态博弈我们将介绍另一种新的均衡概念——完美贝叶斯均衡，就有了四个均衡概念：完全信息静态博弈中的纳什均衡、完全信息动态博弈中的子博弈完美纳什均衡、不完全信息静态博弈中的贝叶斯纳什均衡以及不完全信息动态博弈中的完美贝叶斯均衡。表面上看好像对所研究的每一类型的博弈都发明出了一种新的均衡概念，但事实上这些概念是密切相关的。随我们研究的博弈逐步复杂，我们对均衡概念也逐渐强化，从而可以排除复杂博弈中不合理或没有意义的均衡，而如果我们运用适用于简单博弈的均衡概念就无法区分。在每一种情况下，较强的均衡概念只在应用于复杂的博弈时才不同于较弱的均衡概念，而对简单的博弈并没有区别。引入完美贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡，这和子博弈完美纳什均衡强化了纳什均衡是相同的。正如我们在完全信息动态博弈中加上了子博弈完美的条件，是因为纳什均衡无法包含威胁和承诺都应是可信的这一思想；我们在对非完全信息动态博弈的分析中将集中于完美贝叶斯均衡，是因为贝叶斯纳什均衡也存在同样的不足。回顾前面讲过的，如果参与者的战略要成为一个子博弈完美纳什均衡，则它们不仅必须是整个博弈的纳什均衡，还必须是其中每一个子博弈的纳什均衡。如果参与者的战略要成为博弈的一个完美贝叶斯均衡，它们不仅必须是整个博弈的贝叶斯纳什均衡，而且还必须构成每一个后续博弈的贝叶斯纳什均衡。完美贝叶斯均衡是对贝叶斯均衡的精炼，也是子博弈思想在不完全信息博弈中的推广，它本身是纳什均衡。 9.1 完美贝叶斯均衡定义为引进完美贝叶斯均衡概念，考虑如下完全但不完美信息动态博弈。［例１］首先，参与者1在3个行动中进行选择——L、M及R，如果参与者1选择R，则博弈结束(不等参与者2行动)；如果参与者1选择了L或M，则参与者2就会知道1没有选择R (但不清楚1是选择了L还是M)，并在或L'或R'两个行动中进行选择，博弈随之结束。收益情况由图10-1的扩展式博弈给出。图10-1

文档之家