动态博弈.docx

格式：docx
大小：325.77 KB
文档页数：8

下载文档原格式

博弈论第四讲动态博弈

制止
（-2，5）制止
仿冒
A 不仿冒
B
不制止（0，10）
仿冒
A
B 不制止
不仿冒（5，5）
（2，2）
（10，4）
节点：边：终节点：
引子
每一阶段节点数、每一个选择节点的可选行为数量，都可以不同，比如
仿冒更多次数、仿冒的规模和程度、制止仿冒的力度
也不是所有动态博弈都可以用扩展形
阶段很多，或在一个阶段有很多可以选择的行为，如下棋
双寡头竞争：古诺（Cournot）博弈
设一市场有1，2两家厂商生产同样的产品。如果厂商1的产量为 q1，厂商2的产量为q2 ，则市场总产量为Q= q1+ q2 。设市场出清价格P是市场总产量的函数P（Q）=a-（q1+q2）
两个企业同时选择产量，价格由市场决定；假设每家公司的成本函数相同，并且每单位成本不随生产的数量
古诺寡头模型扩展－－斯塔克博格模型（Stackelberg)
先分析第二个厂商的决策：?
因为其决策时，厂商1的选择q1实际上已经决定了，并且厂商2知道q1，因此对厂商2来说，相当于在给定q1的情况下求使II2实现最大的q2 ，
II2对q2求导，得到q2必须满足：a-c- q1 -2 q2 =0, 即q2 *=(a-c- q1)/2
法律保障－－单次企业信用体系－－全寿命，一旦有失信发生，它的信用记录
有一笔摸不去的黑，将来它做生意也好，向银行贷款也好，都会受此影响。所以国外企业对信用问题看的非常严重－－电子商务的信用记录
关键在于必须增加一些对甲行为的制约！
在上面，甲选择不分，乙完全无可奈何；只能采取消极办法－不借，保护自己不被骗
变化。更正规一些，每家公司具有常数边际成本函数；C(qi ) cqi

第四讲动态博弈

R （0，0）
2
U
1
L （3，1）（2，2）
D
修改的市场进入博弈
试说明上述不可置信的威胁是什么？现实生活中的例子：父亲坚决不同意女儿的婚事，威胁说，如果女儿不与相爱的人断绝关系，他就与女儿断绝父女关系。
逆向归纳法
逆向归纳法可以排除不可置信的威胁。之所以可以如此，根本原因在于采用了一种分析动态博弈的有效方法——逆向归纳法，即从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法。一般方法是：从最后一阶段开始分析，每一次确定出所分析阶段博弈方的选择和路径，然后再确定前一阶段的博弈方选择和路径。
(L/L,L/S) (L/L,S/S) (S/L,L/S) (S/L,S/S)
(若史密斯选择大则选择大;若其选择小则选择大) (若史密斯选择大则选择大;若其选择小则选择小) (若史密斯选择大则选择小;若其选择小则选择大) (若史密斯选择大则选择小;若其选择小则选择小)
跟随领头羊Ⅰ表明只要添加一点复杂性,就使得策略式表述变得晦涩难懂,几无用武之地。策略式如下。
威胁是指一个参与人承诺一旦其他参与人偏离均衡，他将采取的某种行动，威胁是有一定影响力的，尽管可能它从未被实施过。
在位者
默许斗争进入 40，50 -10，0 进入者不进入 0，300 0，300 市场进入博弈中，如若进入者真的进入，在位者的最优行动显然是默许而不是斗争，因为默许带来50的利润，所以斗争就是一种不可置信的威胁。但纳什均衡概念承认了这种不可置信的威胁，所以（不进入，斗争）就成为一个纳什均衡。
例如，一个模型不能在一开始就说德国相信它打赢一场与法国的战争的概率是0.8，而法国相信这一概率只有0.4，因此它们急欲一战。恰恰相反，它必须假定信念（先验概率）开始时是一致的，随后因为私人信息而产生分歧。例如两个参与人都认为德国获胜的概率是0.4，但若德国的将军是个军事天才，则这一概率就是0.8，而且随后德国人发现德国的将军确实是个天才。如果是法国抢先宣战，那么法国的错误信念可能会导致一场战争，而若德国能令人信服它对德国将军天才的私人信息，则这场战争本可避免。

第三章完全且完美信息动态博弈

第三章完全且完美信息动态博弈在动态博弈中，参与者需要根据对手的行为和策略来调整自己的行动，以便达到最佳的结果。

动态博弈可以分为完全信息动态博弈和不完全信息动态博弈。

完全信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数，而不完全信息动态博弈则是指参与者不知道其他参与者的策略和收益函数。

在完全信息动态博弈中，参与者可以通过观察对手的行为来推断出对手的策略和收益函数。

这种博弈可以通过逆向归纳法来求解，即从博弈的阶段开始，逐步向前推导出每个阶段的最佳策略。

逆向归纳法是一种有效的求解完全信息动态博弈的方法，它可以帮助参与者找到最佳策略，从而实现最佳的结果。

然而，在现实世界中，完全信息动态博弈并不常见。

大多数博弈都是不完全信息动态博弈，参与者无法知道其他参与者的策略和收益函数。

在这种情况下，参与者需要通过观察对手的行为和策略来推断出对手的类型和收益函数。

这种博弈可以通过贝叶斯纳什均衡来求解，即参与者根据对手的类型和收益函数来选择自己的策略，以达到最佳的结果。

完全且完美信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数，并且参与者能够观察到其他参与者的行为和策略。

这种博弈可以通过逆向归纳法和贝叶斯纳什均衡来求解，从而帮助参与者找到最佳策略，实现最佳的结果。

在完全且完美信息动态博弈中，参与者可以通过观察对手的行为和策略来推断出对手的类型和收益函数，从而调整自己的策略，以实现最佳的结果。

在完全且完美信息动态博弈中，参与者之间的互动是基于透明和预知性的。

每个参与者不仅清楚自己的策略选择和可能的收益，同时也了解其他参与者将如何根据这些信息做出反应。

这种透明度使得参与者能够做出更加精确的决策，因为他们能够预测对手的行动并据此调整自己的策略。

这种博弈的一个关键特点是，参与者之间的信息是对称的。

这意味着没有参与者拥有其他参与者所不知道的信息优势。

这种信息对称性使得博弈变得更加公平，因为它消除了信息不对称带来的不确定性。

动态博弈

案例：开金矿博弈版本3：法律保障不足的开金矿博弈 P1
不借
（1, 0) 起诉 (-1, 0) 不还 P1
借 P2 还
放弃 (0, 4)
(2, 2)
2· B 斯塔克尔贝里双头垄断模型 1· 博弈的时间顺序如下(1) 企业1选择产量q1 , (2) 企业2观察到q1 以后，然后选择产量q2 ; (3) 企业i 的收益由下面的利润函数给出：
自己避免小企业，小人物的无端指控. 办法之一就是在被指控之前就支付律师费用. 假定被告在被指控之前支付律师费用y , 那么，赔偿区域为 s [ rx , rx d y ], 纳什均衡解为
s rx (d y) 2
因为即使 rx d 2 c p 成立， ( d y ) 2 c p rx 也可能不满足, 从而原告将不会提出指控. 这样的承诺行动使被告节省成本 rx d 2 y . 因此，只要 y rx d 2 , 承诺行动就值得. 这就是为什么大公司、大人物雇佣律师的原因之一.
动态博弈
简单地讲，动态博弈就是参与者的行动选择必须是有先后顺序的博弈. 参与者的每一次行动选择叫做一步或一个时期. 直观地讲，动态博弈可以看作若干个静态博弈联合在一起看作一个博弈. 动态博弈分为完美信息和非完美信息动态博弈. 第二章完全信息动态博弈 1 完全信息博弈参与者的收益函数是共同知识的博弈 2 完全且完美信息动态博弈博弈进行的每一步当中，要选择行动的参与者都知道这一步之前博弈进行的
显然即使 rx c p , (即上法庭的期望收益小于诉讼成本), rx d 2 c p 的条件仍可能成立. 子博弈纳什均衡结果将是: 假定这个条件成立，原告提出指控要求. 原告的支付为 rx d 2 c p , 被告的支付为 rx d 2 , 案件私了. 该博弈模型的实际背景举例：因为被告打官司的成本不仅包括应诉的法律费用而且涉及声誉损失( d )，所以，被告越大（大人物大企业), d 越大, rx d 2 c p 的条件越可能满足. 这是为什么大人物常常受到无端指控的原因之一. 当然,大企业、大人物也可以通过他们的承诺行动使

第二章完全信息动态博弈篇章

第i个企业的利润函数为：

i (q1, q2 ) qi ( P(Q) c),i 1,2
斯坦克尔伯的寡头竞争模型

用逆向归纳法求解，首先考虑给定q1的情况下，企业2 的最优选择。企业2的问题是：
Max 2 (q1 , q2 ) q2 (a q1 q2 c)
最优化一阶条件意味着：
轮流出价的讨价还价模型

一般来说，如果 0 i 1, i 1, 2均衡结果不仅依赖于贴现因子的相对比率，而且依赖于博弈时间长度T和谁在最后阶段出价。然而这种依存关系随T的变大而变小；当T趋于无穷大时，我们得到“先动优势”：即如果 1 2 唯一的均衡是 x 1 (1 ). 定理（Rubinstein 1982）：在无限期轮流出价博弈中，唯一的子博弈精炼纳什均衡结果是： 1 2 1 * * x (if 1 2 x ) 1 1 2 1
典型的旅行者困境收益矩阵（仅考虑整数）
100 100 99 98 97 96 95 …… 5 4 3 2
100,100 101,97 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
99
97,101 99,99 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
第三章完全信息动态搏弈 -子博弈精炼纳什均衡

•
一博弈扩展式表述
二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡四应用举例斯坦克尔伯的寡头竞争模型
•
• •
轮流出价的讨价还价模型
囚徒的救赎旅行者困境五重复博弈
轮流出价的讨价还价模型(1)

第二章完全信息动态博弈

三、讨价还价博弈（序贯谈判，鲁宾斯坦1982）讨价还价博弈（序贯谈判，鲁宾斯坦） • • • •
•
1、三回合讨价还价、设局中人甲、乙就如何分享10000美元现金进行设局中人甲、乙就如何分享美元现金进行谈判，谈判规则如教材所述。谈判，谈判规则如教材所述。贴现因子 δ ,0 < δ < 1 （1）无贴现因子时的博弈树（无限策略，下图）无贴现因子时的博弈树（无限策略， 1为示意性博弈树）为示意性博弈树）为示意性博弈树 2）由贴现因子时的博弈树（ 2）（2）由贴现因子时的博弈树（图2）逆推归纳法： 2 s) （1）第三回合：各自收益 δ 2 s， δ (10000 − 定值））第三回合：（定值）
默许垄断者
900,1100
进入
(2)
商战
-200,600
潜在进入者
进入成本200万元
(1)
不进入 0,3000
阻止市场进入博弈的扩展形式
二、Stackelberg双头垄断模型双头垄断模型
1、模型及求解、（1）企业选择产量 q1 ≥ 0, ）企业1选择产量（2）企业观察到 q1 ，然后选择产量 q 2 ≥ 0 ）企业2观察到 P = a − Q, Q = q1 + q 2 , c1 =（固定成本c为0） c 2 固定成本为） =c
• 版本2：法律保障不足的开金矿博弈版本2 P1 不借（1，0) 起诉 (-1,0) 不还 P1 放弃 (0,4) 借 P2 还 (2,2)
案例：开金矿博弈
• 版本3：法律保障充足的开金矿博弈版本3 P1 不借（1，0) 起诉 (1,0) 借不还 P1 放弃 P2 还 (2,2)
(0,4)
2、博弈树（扩展型示意）例：仿冒博弈、博弈树（扩展型示意）

第3章对称信息动态博弈(DOC)

第三章对称信息动态博弈有一些博弈是动态进行的，譬如，打牌，下棋等。

这些博弈的特点是参与人在选择行动的时候，存在着一定的时间顺序，而后行动的参与人在选择自己的行动时，已经观察到先行动参与人所选择的行动。

第一节动态博弈的策略与子博弈精炼纳什均衡3.1.1 动态博弈的扩展式表述彝族与汉人的盐——狐皮交换：在中国西南地区的崇山峻岭中，生活着许多少数民族，包括彝族。

这些少数民族过去曾经生活在与世隔绝的深山老林里面，他们是怎么获得生活必需品——食盐的呢？他们获得食盐的方式非常特别。

彝族同胞会定期在深山老林与汉人生活区交界的某个地方，譬如山脚下的某个老树下放一些山货，譬如狐皮，药材等，过一段时间再去看看汉人取走山货后，汉人的回报所放在老树下面的食盐，把它们取走。

彝族同胞与汉人皮货商之间就进行着这样的心照不宣的交换。

彝族同胞定期在老树下面放一些山货，而汉人皮货商过段时间去取，同时也放一些食盐在那里，等彝族同胞取走。

他们之间就成年累月地进行着这样的交换。

我们在图3.1中，画出来了这样的交换过程。

图3.1 狐皮与山货交易博弈在图3.1中，从上到下进行着博弈：开始是彝族同胞决定放多少张狐皮，是0张，1张，2张，………，等等这些可能的选择；然后是汉人皮货商决定回报多少食盐，是0斤，1斤，2斤，…………,等等这些可能的选择。

然后又开始第二轮，由彝族同胞决定放多少狐皮，然后又由汉人皮货商决定回报多少食盐，………,等等。

图3.1给出了所谓“对称信息动态博弈”的一个“博弈树”图。

博弈树是倒着的，第一个节点是“树根”。

每一个节点是某个参与人进行决策的位置，叫做“决策结”；从“决策结”发出来的“树枝”是参与人选择的一个行动。

每一个行动在这里都是放多少狐皮或者食盐。

这样的博弈有一个特点，就是每一个参与人在决策自己的行动的时候，都观察到了其他参与人之前的行动。

大家是轮流进行自己的行动选择的。

这样的博弈叫做“对称信息动态博弈”，而图3.1就是动态博弈的“扩展式表述”。

第五章-不完全信息动态博弈2全篇

理论定价现实定价
最优垄断价格 MR=MC p实<p垄
✓这一现象的一个老的解释是：若价格等于垄断价格，其他企业看到有利可图，就会进入；相反，若价格低一些，其他企业看到进入无利可图，就不会进入，垄断企业就可以继续保持其垄断地位。 ✓结论：价格作为一种承诺是不可置信的，因为不论垄断者现在索取什么价格，一旦其他企业进入，垄断者就会改变价格，因此，靠低价格是不可能阻止进入的。 ✓米尔格罗姆和罗伯茨（1982）提出的解释是，垄断限价可能反映了这样一个事实，即其他企业不知道垄断者的生产成本，垄断者试图用低价格来告诉其他企业自己是低成本，进入是无利可图的。
p( 1)
p( 1) 0 p( 2 )
1
p( 1 | m2 )
p(m2
p(m2 | 1) p( 1) | 1) p( 1) p(m2 | 2 ) p( 2 )
(1 ) p( 1) (1 ) p( 1) 1 p( 2)
(1 ) p(1) (1 ) p(1) (1 ) p( 2 )
7
1、分离均衡（separating equilibrium）
✓分离均衡（separating equilibrium）：不同类型的发送者（参与人1）以1的概率选择不同的信号，或者说，没有任何类型选择与其他类型相同的信号。 ✓假定K（类型数）=J（信号数）=2，则分离均衡（SE）意味着：若m1是类型θ1的最优选择，m1就不可能是θ2的最优选择，并且， m2一定是类型θ2的最优选择。即：
p( 1)
p( 2 | m2 )
1 p( 2 )
1 p( 2 ) p( 2 )
(1 ) p( 1) 1 p( 2 ) p( 1) p( 2 )
(见到m2信号, 2的后验概率将大于先验概率)

第三章完全信息动态博弈

• 从动态博弈的最后一个阶段局中人的行为开始分析
，逐步倒推回前一个阶段相应局中人的行为选择，一直到第一个阶段。 • 逆推归纳到某个阶段，可以用不包括该阶段与其后所有阶段博弈的等价博弈来简化原博弈。
• 逆向归纳法是动态博弈分析最重要、基本的方法。
例：用逆向归纳法，求解房地产开发问题，可得（开发,(不开发,开发)）子博弈精炼Nash均衡。
假定逆需求函数为P(Q)=a－q1－q2,两个企业有相同的不变单位成本c≥0,则利润函数为: πi(q1,q2)=qi(P－c),i=1,2 。可用逆向归纳法求解这个博弈的子博弈精炼Nash均衡。假定q1已经选定, 企业2的问题是: max π2(q1,q2)=q2(a－q1－q2－c) 最优化一阶条件为:s2(q1)=0.5(a－q1－c) 因为企业1预测到企业2将根据s2(q1)选择q2,企业1在第一阶段的问题是: Max π1(q1,s2(q1))=q1(a－q1－s2(q1)－c) 解一阶条件得: q1*=0.5(a－c) 将q1*代入s2(q1)得:q2*=s2(q1*)=0.25(a－c). ( 企业1有先动优势)
三、动态博弈的相关概念
（2）信息（information）：局中人有关博弈的知识，特别是有关“自然”的选择、其他局中人的特征和行动的知识。 • 信息集：一个局中人无法准确知道的变量的全体。例如，已知某市场自然状态有“大”和“小”两种可能。如果A不知道市场需求是大还是小，而B知道；那么，A的信息集为{大，小}，而B的信息集为 {大 }或 {小 }。又如，上例中，如果进入者先行动，而在位者在行动前能准确知道前者的行动，那么在位者的信息集为 {进入}或{不进入}。反之，若在位者先行动，则在位者的信息集为{进入，不进入}。

博弈论_完全信息动态博弈

完全且完美信息动态博弈的子博弈
在完全且完美信息的动态博弈里，由于在每一个阶段需行动的局中人对该阶段以前的行动组合是完全了解的，所以在它的扩展式表述中，该节点一定是单信息节点。也就是说，每个信息集都是单节点信息集，因此在完全且完美信息的动态博弈里，从任何一个节点（不包括顶部节点和底部的终节点）出发，都存在一个子博弈对于取数游戏，若修改规则，可有更多子博弈
例子：私奔博弈
需看到的是，私奔决策是由卓文君做出的。她需要做出这样的选择，是因为她已经知道她父亲卓王孙反对把她嫁给穷书生司马相如。卓王孙甚至不惜以断绝父女关系作为威胁，让她断掉念头。可以用一个完全且完美信息的动态博弈来描述卓文君与其父亲之间的博弈。第一步，卓文君在“私奔”与“断绝想法”中选择第二步，父亲在“默认”与“断绝父女关系”选择
动态博弈的特征
收益函数
因行动组合的个数小于策略组合的个数，而且更为直观，所以在动态博弈中，出于分析的方便，局中人的支付函数是从行动组合到实数集的映射当有n个局中人时，每个行动组合对应一个n维的实数向量但如果动态博弈仍然用策略式来表述的话，其支付函数也仍然是从策略组合到实数集的映射对于完全信息的动态博弈，支付函数对各方而言，都是共同知识
例子
① 甲 ② 左右左乙 ② 右
(2, 0)
(2, -1)
(1, 0)
(3, 1)
13
① 左 ② 甲 ① (-1, 2) 前 (0, 4) 后 (1, 0) (0, 0) 前 (4, -1) 后 (3, 3) 乙甲
右
② 乙 ①
(3, 0, 0)
⑴
(1, 0, 3)
⑹
(2, 3, 1)
⑽
(3, 2, 9)

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

完全信息动态博弈习题
1.如果开金矿博弈中第三阶段已选择打官
司后的结果尚不能肯定，即图中a、b的
数值不确定。

试讨论本博弈可能有哪几种
可能的结果。

如果本博弈中的“威胁”和
“承诺”是可信的，a或b应满足什么条件？(谢识予答案66页)
参考答案：
括号中的第一个数字代表乙的得益，第二个数
字代表甲的得益，所以
a表示乙的得益，而b表
示甲的得益。

在第三阶段，如果a﹤0，则乙会选择不打官司
这时逆推回第二阶段，甲会选择不分，因为分的
得益2小于不分的得益4.逆推回第一阶段，乙肯定会选择不借，因为借的最终得益0比不借的最终得益1小。

在第三阶段，如果a﹥0，则乙轮到选择的时候会选择打官司，此时双方得益是（a,b）。

逆推回第二阶段，如果b﹥2，则甲在第二阶段仍然选择不分，这时候双方得益为（a,b）。

在这种情况下再逆推回第一阶段，那么当a﹤1时乙会选择不借，双方得益（1,0），当a﹥1时乙肯定会选择借，最后双方得益（a,b）。

在第二阶段如果b﹤2，则甲会选择分，此时双方得益为（2,2）。

再逆推回第一阶段，乙肯定选择借，因为借的得益2大于不借的得益1，最后双方的得益（2,2）。

要本博弈的“威胁”，即“打”是可信的，条件是a﹥0。

要本博弈的“承诺”，即“分”是可信的，条件是a﹥0且b﹤2。

注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况，因为这些时候博弈方的选择很难用理论方法确定和预测。

不过最终的结果并不会超出上面给出的范围。

2、设一四阶段两博弈方之间的动态博弈如图所示。

试找出全部子博弈，讨论该博弈中可信性问题，求子博弈完美纳什均衡策略组合和博弈结果。

(谢识予答案66-67页)
参考答案：
（1）该博弈共包括如下3个子博弈：①从博弈方1选择a以后博弈方2的第二阶段选择开始的三阶段动态博弈；②从博弈方2第二阶段选择c以后博弈方1
的选择开始的两阶段动态博弈；③第三阶段博弈方1选择f以后博弈方2的单人博弈。

（2）该博弈最理想的，对双方都比较有利的博弈结果是路径a-c-f-g。

但实现路径的双方策略中，博弈方2在第四阶段选择g是不可信的，因为得益5﹤6；逆推回第三阶段，博弈方1选择f也变成不可信的，因为得益3﹤4；再逆推回第二阶段，博弈方2在第二阶段选择c同样也是不可信的，因为得益3﹤4；最后回到第一阶段，博弈方1选择a也不可信，因为2﹤5。

因此上述较理想的结果使不可能实现的。

（3）根据逆推归纳法先讨论博弈方2第四阶段的选择。

由于采用h的得益大于采用g的5，因此博弈方2会采用h；倒退回第三阶段，博弈方1根据对博弈方2第四阶段选择的判断可知选择f结果使得3，而选择e的结果使4，因此只有选择e；再推回第二阶段，博弈方2根据对后两阶段选择的判断，已知选择c 将得到3，而选择d能得到4，因此应该选择d；最后回到第一阶段，博弈方1知道选择a将得到2，而选择b能得到5，因此会选择b。

该博弈的子博弈完美纳什均衡为：博弈方1第一阶段选择b，第三阶段选择e；博弈方2第二阶段选择d，第四阶段选择h。

结果为博弈方1第一阶段选择b结束博弈，双方得益（5,3）。

3、三寡头市场有需求函数Q
=100，其中Q是三个厂商的产量之和，并且已
P-
知三个厂商都有常数边际成本2而无固定成本。

如果厂商1和厂商2先同时决定产量，厂商3根据厂商1和厂商2的产量决策，问他们各自的产量和利润是多少？(谢识予答案69页)
参考答案：
首先，设三个厂商的产量分别为q1、q2和q3。

三个厂商的利润函数为：
根据逆推归纳法，先分析第二阶段是厂商3的选择。

将厂商的利润函数对其产量求偏导数并令其为0得：
因此厂商3的反应函数为：
再分析第一阶段是厂商1和厂商2的决策。

先把厂商3的反应函数代入厂商1和厂商2的利润函数得：
分别对q1和q2求偏导数并令为0得：
联立两个方程可解得q1=q2=98/3。

再代入厂商3的反应函数得q3=（98- q1-q2）/2=98/6。

把三个厂商的产量代入各自的利润函数，可得三个厂商的利润分别为4802/9、4802/9和2401/9。

4、设在无限回合讨价还价博弈中，博弈方的贴现因子不同（博弈方1为δ1，博弈方2为δ2），请给出这种情况下的均衡结果。

(谢识予答案86页)
解答提示：
采用与教材中（谢识予教材3.4.3）贴现因子相同模型相似的逆推归纳法分
析。

均衡结果使博弈方1提出分配方案，博弈方2接受。

不完全信息静态博弈习题
基本概念
贝叶斯博弈（不完全信息博弈）静态贝叶斯博弈（不完全信息静态博弈）类型和类型空间海萨尼转换贝叶斯纳什均衡一级价格密封拍卖机制设计个人理性约束(individual rationality) 激励相容约束(incentive compatibility) 委托人(principle) 代理人(agent) 显示原理直接机制英国式拍卖荷兰式拍卖实施问题
本章习题
1. 求如图所示的扩展式博弈的贝叶斯Nash均衡。

图扩展式博弈
2. 考察以下静态叶斯博弈。

(1) 自然决定支付矩阵(a)还是支付矩阵(b)，选择(a)和(b) 的概率相等；
(2) 参与人1知道自然的选择，但参与人2不知道；
(3) 参与人1选择U或D，同时参与人2选择L或R；
试给出博弈的扩展式描述，并求出所有纯战略贝叶斯Nash均衡。

图贝叶斯博弈
3. 在第一价格密封拍卖博弈中，投标者的估价相互独立并均匀分布于区间[0，1]
上。

设有n 个投标者，试证明该博弈的贝叶斯纳什均衡是各投标者都以各自估价的(n -1)/n 倍作为投标价格。

(谢识予答案168页)
4. 在Cournot 模型中，需求函数为Q P -=2，其中2!q q Q +=。

假设厂商1和厂商2的成本有3/4和5/4两种可能，每个厂商只知道自己的成本不知道对手的成本，但使他们知道对手的成本是3/4（或5/4）的概率为1/2。

如果两厂商同时选择产量，试求该博弈的贝叶斯Nash 均衡。

(谢识予答案167页)
5. 两个企业同时决定是否进入一个市场，企业i 的进入成本为),0[+∞∈θ，这种进入成本为参与人的私有信息，服从于彼此独立的分布)(⋅p 。

如果只有一个企业进入，则进入企业的支付为i m θπ-，不进入企业的支付为0；如果均进入，那么双方的支付都为i d θπ-；如果均不进入，则双方的支付都为0。

其中0>>d m ππ，求该博弈的贝叶斯Nash 均衡。

不完全息动信态博弈习题
基本概念
不完全息动信态博弈（动态贝叶斯博弈）信念信念的设定原则精炼贝叶斯均衡信号机制信号博弈信号博弈完美贝叶斯均衡序惯均衡颤抖手精炼均衡
本章习题
1. 能够传递信息的行为有怎样的特征？信号机制起作用的基本条件是什么？
2. 为什么口头声明有时候能有效传递信息，但另一些时候又不能？
3. 求解如图4-1所示的扩展式博弈的精炼贝叶斯Nash 均衡。

(187页)
图4-1 扩展式博弈
2.说命如图4-2所示的扩展式博弈无纯战略精炼贝叶斯Nash均衡，并找出它的
混合战略精炼贝叶斯Nash均衡。

3.求解如图4-3扩展式博弈的精炼贝叶斯Nash均衡。

图4-3 扩展式博弈
4.求如图4-4所示的扩展式博弈的精炼贝叶斯Nash均衡。

图4-4 扩展式博弈
博弈论
1 博弈论与主流经济学的发展（2-6）
2 个人理性与社会效率（25）饭如果
3 纳什均衡与一致性预期（39、42）
4 混合战略纳什均衡（60、64）
5 多重均衡与制度和文化
6 动态博弈与承诺
博弈的参与者相继行动，由于后行动者能够看到先行动者的决策行为，所以后面的决策要受到以前决策行为的影响，每一个参与者都要根据在决策时所掌握的全部信息来作出自己的最优策略，即每个人的策略是决策者在决策时所掌握全部信息的函数。

换句话讲，参与者在某一个阶段做出的决策，要受到前边一系列决策信息的影响，是前边一系列决策信息的函数。

典型的例子就是下棋，我走一个当头炮，你走一个屏风马，我走一步，你走一步，你走一步，我走一步。

双方相继行动。

每个人在每一时刻的决策都是前边一系列决策所掌握信息的函数。

到了中间某一阶段，比如说一方“将军”了，这要受到前面一系列双方决策实施产生的影响，不是说想什么时候“将军”就能什么时候“将军”
承诺是一种无法反悔的行为，会束缚承诺者自己的手脚，结果无法给自己留有选择的余地。

承诺是将不可置信的威胁变成可置信的威胁的行动：威胁不仅是事前最优的，也是事后最优的。

承诺意味着限制自己的自由：选择少反而对自己好。

7 讨价还价与耐心（168）
8 重复博弈与合作行为（饭如果115、119）
9 不完全信息与声誉（219）。

动态博弈.docx

合集下载

博弈论第四讲动态博弈

第四讲动态博弈

第三章完全且完美信息动态博弈

动态博弈

第二章完全信息动态博弈篇章

第二章完全信息动态博弈

第3章对称信息动态博弈(DOC)

第五章-不完全信息动态博弈2全篇

第三章完全信息动态博弈

博弈论_完全信息动态博弈

文档推荐

最新文档

动态博弈.docx

合集下载

博弈论第四讲动态博弈

第四讲 动态博弈

第三章完全且完美信息动态博弈

动态博弈

第二章完全信息动态博弈篇章

第二章 完全信息动态博弈

第3章对称信息动态博弈(DOC)

第五章-不完全信息动态博弈2全篇

第三章 完全信息动态博弈

博弈论_完全信息动态博弈

文档推荐

最新文档

第四讲动态博弈

第二章完全信息动态博弈

第三章完全信息动态博弈