动态博弈.docx
- 格式:docx
- 大小:325.77 KB
- 文档页数:8
第三章完全且完美信息动态博弈在动态博弈中,参与者需要根据对手的行为和策略来调整自己的行动,以便达到最佳的结果。
动态博弈可以分为完全信息动态博弈和不完全信息动态博弈。
完全信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,而不完全信息动态博弈则是指参与者不知道其他参与者的策略和收益函数。
在完全信息动态博弈中,参与者可以通过观察对手的行为来推断出对手的策略和收益函数。
这种博弈可以通过逆向归纳法来求解,即从博弈的阶段开始,逐步向前推导出每个阶段的最佳策略。
逆向归纳法是一种有效的求解完全信息动态博弈的方法,它可以帮助参与者找到最佳策略,从而实现最佳的结果。
然而,在现实世界中,完全信息动态博弈并不常见。
大多数博弈都是不完全信息动态博弈,参与者无法知道其他参与者的策略和收益函数。
在这种情况下,参与者需要通过观察对手的行为和策略来推断出对手的类型和收益函数。
这种博弈可以通过贝叶斯纳什均衡来求解,即参与者根据对手的类型和收益函数来选择自己的策略,以达到最佳的结果。
完全且完美信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,并且参与者能够观察到其他参与者的行为和策略。
这种博弈可以通过逆向归纳法和贝叶斯纳什均衡来求解,从而帮助参与者找到最佳策略,实现最佳的结果。
在完全且完美信息动态博弈中,参与者可以通过观察对手的行为和策略来推断出对手的类型和收益函数,从而调整自己的策略,以实现最佳的结果。
在完全且完美信息动态博弈中,参与者之间的互动是基于透明和预知性的。
每个参与者不仅清楚自己的策略选择和可能的收益,同时也了解其他参与者将如何根据这些信息做出反应。
这种透明度使得参与者能够做出更加精确的决策,因为他们能够预测对手的行动并据此调整自己的策略。
这种博弈的一个关键特点是,参与者之间的信息是对称的。
这意味着没有参与者拥有其他参与者所不知道的信息优势。
这种信息对称性使得博弈变得更加公平,因为它消除了信息不对称带来的不确定性。
第三章对称信息动态博弈有一些博弈是动态进行的,譬如,打牌,下棋等。
这些博弈的特点是参与人在选择行动的时候,存在着一定的时间顺序,而后行动的参与人在选择自己的行动时,已经观察到先行动参与人所选择的行动。
第一节动态博弈的策略与子博弈精炼纳什均衡3.1.1 动态博弈的扩展式表述彝族与汉人的盐——狐皮交换:在中国西南地区的崇山峻岭中,生活着许多少数民族,包括彝族。
这些少数民族过去曾经生活在与世隔绝的深山老林里面,他们是怎么获得生活必需品——食盐的呢?他们获得食盐的方式非常特别。
彝族同胞会定期在深山老林与汉人生活区交界的某个地方,譬如山脚下的某个老树下放一些山货,譬如狐皮,药材等,过一段时间再去看看汉人取走山货后,汉人的回报所放在老树下面的食盐,把它们取走。
彝族同胞与汉人皮货商之间就进行着这样的心照不宣的交换。
彝族同胞定期在老树下面放一些山货,而汉人皮货商过段时间去取,同时也放一些食盐在那里,等彝族同胞取走。
他们之间就成年累月地进行着这样的交换。
我们在图3.1中,画出来了这样的交换过程。
图3.1 狐皮与山货交易博弈在图3.1中,从上到下进行着博弈:开始是彝族同胞决定放多少张狐皮,是0张,1张,2张,………,等等这些可能的选择;然后是汉人皮货商决定回报多少食盐,是0斤,1斤,2斤,…………,等等这些可能的选择。
然后又开始第二轮,由彝族同胞决定放多少狐皮,然后又由汉人皮货商决定回报多少食盐,………,等等。
图3.1给出了所谓“对称信息动态博弈”的一个“博弈树”图。
博弈树是倒着的,第一个节点是“树根”。
每一个节点是某个参与人进行决策的位置,叫做“决策结”;从“决策结”发出来的“树枝”是参与人选择的一个行动。
每一个行动在这里都是放多少狐皮或者食盐。
这样的博弈有一个特点,就是每一个参与人在决策自己的行动的时候,都观察到了其他参与人之前的行动。
大家是轮流进行自己的行动选择的。
这样的博弈叫做“对称信息动态博弈”,而图3.1就是动态博弈的“扩展式表述”。
完全信息动态博弈习题
1.如果开金矿博弈中第三阶段已选择打官
司后的结果尚不能肯定,即图中a、b的
数值不确定。
试讨论本博弈可能有哪几种
可能的结果。
如果本博弈中的“威胁”和
“承诺”是可信的,a或b应满足什么条件?(谢识予答案66页)
参考答案:
括号中的第一个数字代表乙的得益,第二个数
字代表甲的得益,所以
a表示乙的得益,而b表
示甲的得益。
在第三阶段,如果a﹤0,则乙会选择不打官司
这时逆推回第二阶段,甲会选择不分,因为分的
得益2小于不分的得益4.逆推回第一阶段,乙肯定会选择不借,因为借的最终得益0比不借的最终得益1小。
在第三阶段,如果a﹥0,则乙轮到选择的时候会选择打官司,此时双方得益是(a,b)。
逆推回第二阶段,如果b﹥2,则甲在第二阶段仍然选择不分,这时候双方得益为(a,b)。
在这种情况下再逆推回第一阶段,那么当a﹤1时乙会选择不借,双方得益(1,0),当a﹥1时乙肯定会选择借,最后双方得益(a,b)。
在第二阶段如果b﹤2,则甲会选择分,此时双方得益为(2,2)。
再逆推回第一阶段,乙肯定选择借,因为借的得益2大于不借的得益1,最后双方的得益(2,2)。
要本博弈的“威胁”,即“打”是可信的,条件是a﹥0。
要本博弈的“承诺”,即“分”是可信的,条件是a﹥0且b﹤2。
注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。
不过最终的结果并不会超出上面给出的范围。
2、设一四阶段两博弈方之间的动态博弈如图所示。
试找出全部子博弈,讨论该博弈中可信性问题,求子博弈完美纳什均衡策略组合和博弈结果。
(谢识予答案66-67页)
参考答案:
(1)该博弈共包括如下3个子博弈:①从博弈方1选择a以后博弈方2的第二阶段选择开始的三阶段动态博弈;②从博弈方2第二阶段选择c以后博弈方1
的选择开始的两阶段动态博弈;③第三阶段博弈方1选择f以后博弈方2的单人博弈。
(2)该博弈最理想的,对双方都比较有利的博弈结果是路径a-c-f-g。
但实现路径的双方策略中,博弈方2在第四阶段选择g是不可信的,因为得益5﹤6;逆推回第三阶段,博弈方1选择f也变成不可信的,因为得益3﹤4;再逆推回第二阶段,博弈方2在第二阶段选择c同样也是不可信的,因为得益3﹤4;最后回到第一阶段,博弈方1选择a也不可信,因为2﹤5。
因此上述较理想的结果使不可能实现的。
(3)根据逆推归纳法先讨论博弈方2第四阶段的选择。
由于采用h的得益大于采用g的5,因此博弈方2会采用h;倒退回第三阶段,博弈方1根据对博弈方2第四阶段选择的判断可知选择f结果使得3,而选择e的结果使4,因此只有选择e;再推回第二阶段,博弈方2根据对后两阶段选择的判断,已知选择c 将得到3,而选择d能得到4,因此应该选择d;最后回到第一阶段,博弈方1知道选择a将得到2,而选择b能得到5,因此会选择b。
该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择b,第三阶段选择e;博弈方2第二阶段选择d,第四阶段选择h。
结果为博弈方1第一阶段选择b结束博弈,双方得益(5,3)。
3、三寡头市场有需求函数Q
=100,其中Q是三个厂商的产量之和,并且已
P-
知三个厂商都有常数边际成本2而无固定成本。
如果厂商1和厂商2先同时决定产量,厂商3根据厂商1和厂商2的产量决策,问他们各自的产量和利润是多少?(谢识予答案69页)
参考答案:
首先,设三个厂商的产量分别为q1、q2和q3。
三个厂商的利润函数为:
根据逆推归纳法,先分析第二阶段是厂商3的选择。
将厂商的利润函数对其产量求偏导数并令其为0得:
因此厂商3的反应函数为:
再分析第一阶段是厂商1和厂商2的决策。
先把厂商3的反应函数代入厂商1和厂商2的利润函数得:
分别对q1和q2求偏导数并令为0得:
联立两个方程可解得q1=q2=98/3。
再代入厂商3的反应函数得q3=(98- q1-q2)/2=98/6。
把三个厂商的产量代入各自的利润函数,可得三个厂商的利润分别为4802/9、4802/9和2401/9。
4、设在无限回合讨价还价博弈中,博弈方的贴现因子不同(博弈方1为δ1,博弈方2为δ2),请给出这种情况下的均衡结果。
(谢识予答案86页)
解答提示:
采用与教材中(谢识予教材3.4.3)贴现因子相同模型相似的逆推归纳法分
析。
均衡结果使博弈方1提出分配方案,博弈方2接受。
不完全信息静态博弈习题
基本概念
贝叶斯博弈(不完全信息博弈)静态贝叶斯博弈(不完全信息静态博弈)类型和类型空间海萨尼转换贝叶斯纳什均衡一级价格密封拍卖机制设计个人理性约束(individual rationality) 激励相容约束(incentive compatibility) 委托人(principle) 代理人(agent) 显示原理直接机制英国式拍卖荷兰式拍卖实施问题
本章习题
1. 求如图所示的扩展式博弈的贝叶斯Nash均衡。
图扩展式博弈
2. 考察以下静态叶斯博弈。
(1) 自然决定支付矩阵(a)还是支付矩阵(b),选择(a)和(b) 的概率相等;
(2) 参与人1知道自然的选择,但参与人2不知道;
(3) 参与人1选择U或D,同时参与人2选择L或R;
试给出博弈的扩展式描述,并求出所有纯战略贝叶斯Nash均衡。
图贝叶斯博弈
3. 在第一价格密封拍卖博弈中,投标者的估价相互独立并均匀分布于区间[0,1]
上。
设有n 个投标者,试证明该博弈的贝叶斯纳什均衡是各投标者都以各自估价的(n -1)/n 倍作为投标价格。
(谢识予答案168页)
4. 在Cournot 模型中,需求函数为Q P -=2,其中2!q q Q +=。
假设厂商1和厂商2的成本有3/4和5/4两种可能,每个厂商只知道自己的成本不知道对手的成本,但使他们知道对手的成本是3/4(或5/4)的概率为1/2。
如果两厂商同时选择产量,试求该博弈的贝叶斯Nash 均衡。
(谢识予答案167页)
5. 两个企业同时决定是否进入一个市场,企业i 的进入成本为),0[+∞∈θ,这种进入成本为参与人的私有信息,服从于彼此独立的分布)(⋅p 。
如果只有一个企业进入,则进入企业的支付为i m θπ-,不进入企业的支付为0;如果均进入,那么双方的支付都为i d θπ-;如果均不进入,则双方的支付都为0。
其中0>>d m ππ,求该博弈的贝叶斯Nash 均衡。
不完全息动信态博弈习题
基本概念
不完全息动信态博弈(动态贝叶斯博弈) 信念 信念的设定原则 精炼贝叶斯均衡 信号机制 信号博弈 信号博弈完美贝叶斯均衡 序惯均衡 颤抖手精炼均衡
本章习题
1. 能够传递信息的行为有怎样的特征?信号机制起作用的基本条件是什么?
2. 为什么口头声明有时候能有效传递信息,但另一些时候又不能?
3. 求解如图4-1所示的扩展式博弈的精炼贝叶斯Nash 均衡。
(187页)
图4-1 扩展式博弈
2.说命如图4-2所示的扩展式博弈无纯战略精炼贝叶斯Nash均衡,并找出它的
混合战略精炼贝叶斯Nash均衡。
3.求解如图4-3扩展式博弈的精炼贝叶斯Nash均衡。
图4-3 扩展式博弈
4.求如图4-4所示的扩展式博弈的精炼贝叶斯Nash均衡。
图4-4 扩展式博弈
博弈论
1 博弈论与主流经济学的发展(2-6)
2 个人理性与社会效率(25)饭如果
3 纳什均衡与一致性预期(39、42)
4 混合战略纳什均衡(60、64)
5 多重均衡与制度和文化
6 动态博弈与承诺
博弈的参与者相继行动,由于后行动者能够看到先行动者的决策行为,所以后面的决策要受到以前决策行为的影响,每一个参与者都要根据在决策时所掌握的全部信息来作出自己的最优策略,即每个人的策略是决策者在决策时所掌握全部信息的函数。
换句话讲,参与者在某一个阶段做出的决策,要受到前边一系列决策信息的影响,是前边一系列决策信息的函数。
典型的例子就是下棋,我走一个当头炮,你走一个屏风马,我走一步,你走一步,你走一步,我走一步。
双方相继行动。
每个人在每一时刻的决策都是前边一系列决策所掌握信息的函数。
到了中间某一阶段,比如说一方“将军”了,这要受到前面一系列双方决策实施产生的影响,不是说想什么时候“将军”就能什么时候“将军”
承诺是一种无法反悔的行为,会束缚承诺者自己的手脚,结果无法给自己留有选择的余地。
承诺是将不可置信的威胁变成可置信的威胁的行动:威胁不仅是事前最优的,也是事后最优的。
承诺意味着限制自己的自由:选择少反而对自己好。
7 讨价还价与耐心(168)
8 重复博弈与合作行为(饭如果115、119)
9 不完全信息与声誉(219)。