09 动态博弈的经典模型1
- 格式:ppt
- 大小:1.04 MB
- 文档页数:27
博弈论经典模型全解析(入门级)1。
囚徒困境这是博弈论中最最经典的案例了-—囚徒困境,非常耐人寻味。
“囚徒困境"说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作).这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪.但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金.而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了.但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
企业在信息化过程中需要与咨询企业、软件供应商打交道的。
在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作.在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。
3.4 几个经典动态博弈模型453.4.1 寡占的斯塔克博格模型46动态的寡头产量竞争博弈厂商1先选择,厂商2后选择。
21q q Q +=121111112)](8[)(q q q q q c Q P q u -+-=-=221222222)](8[)(q q q q q c Q P q u -+-=-=策略空间:[0,Q max ]中所有实数。
Q max 为不至于使价格降到亏本的最大限度的产量。
Q Q P P -==8)(价格函数:边际生产成本:无固定成本得益函数:221==c c 2121116q q q q u --=2221226q q q q u --=47两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
1 、第二阶段厂商2的选择目标:得益最大化。
求使自己得益最大化下的产量值,即最大化时的一阶条件:得益函数:2221226q q q q u --=用逆推归纳法进行分析:02602122=--⇒=∂∂q q q u 112213)6(21q q q -=-=求出厂商2对厂商1产量的反应函数:48两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
2 、第一阶段厂商1的选择。
用逆推归纳法进行分析:12213q q -=厂商1可直接求出使自己得益最大化时的产量:厂商1知道2的决策思路:直接将上式代入厂商1的得益函数,得到:2112111121*211*211213)213(66),(q q q q q q q q q q q q u -=---=--=3030*1*111=⇒=-⇒=∂∂q q q u厂商1的最佳产量是生产3单位。
将之代入厂商2的反应函数,得到厂商2的最佳产量5.15.13*2=-=q 此时市场价格为3.5,双方的得益别为4.5和2.25单位。
3*1=q 12213q q -=用逆推归纳法分析得出,该动态博弈的唯一的子博弈完美纳什均衡:厂商1在第一阶段生产3单位产量,厂商2第二阶段生产1.5单位产量。
信息对抗的动态博弈模型分析在当今数字化和信息化高速发展的时代,信息对抗已成为一个备受关注的领域。
信息对抗不仅仅存在于军事战争中,也在商业竞争、网络安全等众多领域发挥着重要作用。
而动态博弈模型作为一种有效的分析工具,可以帮助我们更好地理解和应对信息对抗中的各种复杂情况。
一、信息对抗的基本概念信息对抗,简单来说,就是围绕信息的获取、处理、传输和利用等方面展开的竞争与对抗。
在这个过程中,各方都试图通过各种手段获取对自己有利的信息,同时阻止对方获取关键信息,或者干扰、破坏对方的信息系统。
信息对抗的形式多种多样,包括网络攻击与防御、情报收集与反情报、电子战、舆论战等等。
无论是在国家层面的战略决策,还是企业之间的商业竞争,信息的掌握和运用往往能决定胜负的走向。
二、动态博弈模型的特点动态博弈与静态博弈的最大区别在于,参与者的行动存在先后顺序,并且后行动者能够观察到先行动者的行动。
这种顺序性和观察性使得动态博弈更加贴近现实中的信息对抗场景。
在动态博弈中,参与者需要根据对手的行动不断调整自己的策略,预测对手的下一步行动,并考虑到长期的利益和风险。
同时,信息的不完全性和不确定性也是动态博弈的重要特点,参与者往往无法完全掌握对手的所有信息,这就增加了决策的难度和复杂性。
三、信息对抗中动态博弈模型的构建构建信息对抗的动态博弈模型,首先需要明确参与者。
这些参与者可以是国家、组织、企业甚至个人,他们在信息对抗中有着不同的目标和利益诉求。
接下来,要确定参与者的行动集合。
行动可以包括攻击对方的信息系统、采取防御措施、进行信息伪装、发布虚假信息等等。
同时,为每个行动设定相应的成本和收益。
然后,设定博弈的规则和顺序。
比如,是一方先行动,还是双方同时行动;行动的次数是否有限制;信息的传递和共享方式是怎样的等等。
最后,建立参与者的策略空间。
策略是参与者在不同情况下选择行动的方案,通过分析各种可能的策略组合,来预测博弈的结果。
四、动态博弈模型在信息对抗中的应用实例在网络安全领域,黑客与网络防御者之间的对抗就是一个典型的动态博弈。
博弈论经典模型全解析〔入门级〕1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。
“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即揭发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对揭发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从外表上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他单独坐牢。
这种想法的诱惑力实在太大了。
但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
企业在信息化过程中需要与咨询企业、软件供给商打交道的。
在与这些企业打交道的过程中,我们不可防止地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。