4博弈分析详解
- 格式:ppt
- 大小:604.00 KB
- 文档页数:86
四方博弈模型的纳什均衡纳什均衡是博弈论中的一个重要概念,指的是在博弈中每个参与者根据其他参与者的策略选择,无法通过单方面改变自己的策略来获得更好的结果。
四方博弈模型是博弈论中常见的一种情景,即有四个参与者进行博弈。
在四方博弈模型中,每个参与者都面临着多种策略的选择。
他们的目标是通过选择最优的策略来获得最大的利益。
而在纳什均衡中,每个参与者的策略选择都是最佳响应其他参与者的策略选择的结果。
假设有四个参与者A、B、C和D,他们分别可以选择策略X、Y和Z。
他们的目标是通过选择最优的策略来获得最大的利益。
在四方博弈模型中,每个参与者的策略选择都会影响其他参与者的利益,因此他们需要考虑其他参与者的策略选择。
在纳什均衡中,每个参与者的策略选择都是最佳响应其他参与者的策略选择的结果。
也就是说,如果每个参与者选择了最优的策略,其他参与者也无法通过改变自己的策略来获得更好的结果。
这种情况下,博弈达到了均衡状态。
在四方博弈模型中,纳什均衡可以有多个。
这是因为每个参与者都可以有多种策略选择,而其他参与者的策略选择也会影响到最终的结果。
因此,在选择策略时,参与者需要综合考虑自己的利益和其他参与者的策略选择。
为了找到纳什均衡,参与者可以通过分析其他参与者的策略选择和利益来确定自己的最优策略。
在这个过程中,参与者需要考虑到其他参与者的行为和可能的反应,以及自己的利益和目标。
只有当每个参与者的策略选择都是最佳响应其他参与者的策略选择时,博弈才能达到纳什均衡。
纳什均衡在实际生活中有着广泛的应用。
例如,在市场竞争中,各个企业通过选择最优的策略来争夺市场份额。
在政治博弈中,各个政党通过选择最优的策略来争取选民支持。
在国际关系中,各个国家通过选择最优的策略来维护自身利益。
然而,纳什均衡并不一定是最优的结果。
在某些情况下,参与者可能通过合作或协商达到更好的结果。
但是,在没有合作或协商的情况下,纳什均衡是参与者可以依靠的最佳策略选择。
四方博弈模型的纳什均衡是参与者在博弈中选择最优策略的结果。
4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。
参与人2 不知道t,但知道t的概率分布。
博弈的时序:(1)参与人1选择行动a1∈A1;(2)参与人2观察a1,选择a2∈A2博弈的收益:u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2,10,0参与人 1 M0, 20,1R1, 31, 3纯战略纳什均衡: (L,L'), (R,R')均为子博弈精炼纳什均衡(无子博弈)。
但是(R, R')不可信。
排除不可信的纳什均衡:要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。
例要求3的说明参与人1的类型空间:{ t1,t2,t3,t4 }行动空间:A= { L,R}推断p i: 观察到L后,参与人1的类型是t i的概率。
推断q i: 观察到R后,参与人1的类型是t i的概率。
p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。
参与人2对p i 与 q i 的推断:p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。
工程施工企业项目管理中的博弈分析1.引言最近二三十年,经济学经历了一场剧烈的“博弈论”革命。
博弈论日益受到人们的重视,同时博弈论在经济学中的应用领域也越来越广泛,大有“吞噬”整个现代西方经济理论的气势,在现代经济学中占有非常重要的作用和地位,它已经成为了经济学中一种基本的分析工具。
博弈论(gametheory)又叫对策论,[1]是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡情况。
其基本出发点这样的:人是理性的,是会在约束条件下追求自身利益最大化的经济人。
博弈论承认个人利益和局部利益,承认人们追求自身利益最大化的合法性,因而在市场经济条件下用于分析人们的经济行为、经济关系和社会经济活动时得到了广泛的应用。
2.“囚徒困境”博弈模型分析“囚徒困境”[2]是博弈论里最经典的博弈模型之一,其基本模型是:警察在现场抓住了两个合伙的犯罪嫌疑人(甲和乙),但却没有掌握足够的证据。
于是警察把他们隔离关押起来以防止串供,并要求坦白交代。
如果两人都坦白,每人将入狱3年;如果两人都不坦白,将以防碍公务罪入狱1年;如果一人抵赖另一人坦白,那么坦白者将得到释放,而抵赖者则将入狱5年。
分别用-1、-3、-5、和0表示罪犯入狱1年、5年、8年和释放的得益,那么甲、乙两人的博弈格局如图1的“得益矩阵”所示。
面对两个都只考虑自己利益的理性经济人,选择的结果如下:如果乙抵赖而甲坦白,则甲将得到释放;如果乙坦白同时甲也坦白,则甲入狱3年,但如果此时甲抵赖却要入狱5年。
由此可见,对甲而言,无论乙采取什么策略(坦白或抵赖),坦白给他自己带来的利益总是最大,所以坦白始终是甲的上策,也就是说,不管乙是坦白还是抵赖,甲的最佳选择始终是坦白。
同理,对于乙而言,坦白也是他的上策。
结果,最终两人都选择了坦白。
当然,其实对甲、乙双方共同而言,最好的选择是都抵赖。
但是由于甲、乙之间不能串通,其实就算是他们之间在被抓获以前事先就已经订立好“攻守同盟”,可能也不会有用,因为甲乙两人都是追求自身利益最大化的理性人,双方都不敢信任对方,也没有任何积极性去遵守这个协定,因而最终只能大家都选择坦白。
华为在阿根廷电信设备市场上的竞争博弈华为技术有限公司是一家总部位于中国广东省深圳市的生产销售电信设备的员工持股的民营科技公司,经过数十年的发展,成为全球最大的电信网络解决方案提供商,全球第二大电信基站设备供应商,同时也是全球第六大手机厂商,其海外市场的利润占到其总利润的75%。
在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场由爱立信、阿尔卡特-朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下来,我们将分析其不同条件下的博弈结果:1、完全信息情况下的静态博弈A 、纳什均衡:我们将上述三家公司统称为原有垄断者,华为称为虎视眈眈的潜在进入者,原有垄断者想要保住自己现有的垄断地位,就会想要阻止潜在进入者进入,在这个博弈中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同竞争,具体的支付矩阵结果表示如下:原有垄断者潜在进入者 进入 不进入根据纳什均衡的定义:各个参与者所做的是在给定其他参与者的策略是所能够做出的最好的一组策略。
当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获得70单位的利润;同样的,原有垄断者选择不斗争的情况下,潜在进入者的最优选择是进入,获得20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个纳什均衡(不进入,斗争)。
B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许可证,在严格管制情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各自均有正的利润)在这两种情况下考虑两者是否进行价格战的情况,具体支付矩阵如下所示:原有垄断者 低价 高价潜在进入者低价 高价对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润,在原有垄断者定高价时,潜在进入者定低价可以获得额外的10单位利润,从而确定华为必将进行价格战,在完全信息情况下,原有垄断者会将自己置于潜在进入者的位置进行决策,从而决定自己也要进行价格战,否则会失去更多的利润。