第4章不完全信息动态博弈

格式：ppt
大小：512.00 KB
文档页数：30

下载文档原格式

不完全信息动态斯塔克尔伯格博弈模型

不完全信息动态斯塔克尔伯格博弈模型下载提示：该文档是本店铺精心编制而成的，希望大家下载后，能够帮助大家解决实际问题。

文档下载后可定制修改，请根据实际需要进行调整和使用，谢谢！本店铺为大家提供各种类型的实用资料，如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等，想了解不同资料格式和写法，敬请关注！Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!不完全信息动态斯塔克尔伯格博弈模型1. 引言斯塔克尔伯格博弈模型是一种常见的非合作博弈模型,它描述了市场上的领导者和追随者之间的相互作用。

不完全信息动态博弈模型

不完全信息动态博弈模型随着信息技术的迅猛发展和普及，人们在日常生活和工作中收集、传递和利用信息的能力越来越强。

然而，在现实生活中，我们常常会面临不完全信息的情况，尤其是在决策和博弈的过程中。

不完全信息动态博弈模型便应运而生，用于研究这种情况下的决策和行为。

不完全信息动态博弈模型指的是在博弈过程中，参与者并不完全了解其他参与者的信息，即参与者们面临着不确定性的决策环境。

在这种情况下，每个参与者的决策都会受到其他参与者决策的影响，而其他参与者的决策又受到他们所接收到的信息的影响。

因此，不完全信息动态博弈模型考虑了参与者的行动、信息和反应的交互作用，揭示了决策者在不完全信息环境下的最优策略。

在不完全信息动态博弈模型中，每个参与者有两个基本要素：策略和信息。

策略是指参与者为了达到自己的目标而采取的行动规则，而信息则是指参与者关于其他参与者决策或环境的知识。

在不完全信息动态博弈模型中，参与者的信息通常分为两种：私有信息和公共信息。

私有信息指的是只有某个参与者能够获得的信息，而公共信息是所有参与者都能够获得的信息。

不完全信息动态博弈模型通常采用博弈树来描述参与者们的行动和决策过程。

博弈树是一种图形化的表示方法，用来展示参与者之间的相互关系和决策的顺序。

在博弈树中，每个节点代表一个状态或者一个决策点，而边则表示参与者们的选择。

通过不完全信息动态博弈模型，我们可以研究和分析参与者们在不完全信息环境下的最优策略。

在这种模型中，参与者们会根据自己拥有的信息和对其他参与者可能行动的推测，选择最优的策略。

同时，他们也会考虑到其他参与者可能的反应和对自己行动的影响，以及在不完全信息环境下可能的不确定性。

不完全信息动态博弈模型在实际应用中有着广泛的应用。

例如，在商业领域中，企业面临着市场竞争和不确定性因素，通过不完全信息动态博弈模型可以帮助企业制定最优的决策策略。

在政治和军事领域中，各方面临着战略竞争和信息不对称的情况，通过不完全信息动态博弈模型可以揭示参与者之间的决策和行为规则。

博弈论基础讲义-第四章

第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子：一般计算2.例子：分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的，即在给定信念的条件下，以及其他参与人的选择条件下，自身选择是最优的例1：子博弈最优——纳什均衡(,)L l是否合理？——如果参与人2有机会选择，肯定选r而不是l；——(,)L l不是子博弈精炼纳什均衡。

例2：单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡；——但如果参与人2有机会选择，但肯定选择d；——(,,)D a l不满足单点信息集理性。

例3：多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡；——(,)A r不满足多点信息集理性。

2.一致信念例1：与客观事实一致u=是否合理？——参与人2的信念2/3——2/3u=是不合理的，因为任何到达参与人2信息集都不可能产生此后验概率；——后验信念必须与先念信念保持一致。

例2：前后信念一致——参与人2的第2个信息集上的信念，是否合理？——不合理，给定参与人战略和第1个信息集的信念，利用贝叶斯法则计算信念与此不一致；——参与人前后信念保持一致。

例3：独立偏离——参与人3的信念0.9u =是否合理？——参与人1和参与人3的偏离是独立的，所以参与人3的合理信念为0.1u =；——不同参与人之间的偏离是独立的总结，一致信念要求：参与人偏离最小化,，参与人之间偏离是独立的；二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性；——定义信息集1.3和2.2的信念？2.定义a.行为战略：参与人在某个信息集到行动集映射，——如果某个状态真正发生，参与人如何决策；——序贯理性是否满足？b.序贯理性：在任何信息集上，参与人在给定信念和所有后续行为战略，选择自身行为战略最大化预期效用。

不完全信息动态博弈

有偏好的早餐。软弱型假装成粗暴型而避免冲突，获得更高利润。
b,1 D [p] Q
D 0,1 B [q]
b+d,0 0,-1
N R
D [1-p] Q
N
0.1
N
0.9
N d,0 R D b,-
1 B [1-q]
N
信号博弈的完美贝叶斯均衡
斯彭斯的劳动力模型
考察下面的信号博弈模型（斯彭斯，1974）：在模型中，有两个参与人，一个雇主和一个雇员，记雇员为参与人1（信号发送者），雇主为参与人2（信号接收者），雇主是不知情的参与人。博弈顺序为：
，不偏好的早餐价值为0，而避免冲突价值
。
对接收者来说，与软弱型（粗暴型）冲突的支付为
1（-1），所有其他支付为0。
“啤酒和热狗”信号博弈
在啤酒和热狗博弈中，
是发送者的一个分离策略，这里
代表在发送者是软弱类型的情况下，选择热狗。如果，那
么，发送者的策略
和接收者的策略
以及后验概率
和是这个博弈的完美贝叶斯均衡。这里代表在发送者选择热狗的情况下，接收者选择冲突，也可以类似地解释。
不完全信息动态博弈
1.1.1 基本概念
不完全信息意味着至少有一个参与人拥有私人信息，通常用类型表示拥有不同私人信息的参与人，类型由“ 自然”或“上帝”给定。
博弈顺序：（1）“自然”选择参与人的类型，并将类型告诉参与人自己，不告诉其他参与人，只将类型分布告诉其他参与人；（2）参与人开始行动，参与人的行动有先有后，后行动者能观察到先行动者的行动，而不能观察到先行动者的类型。
（surly）；B代表啤酒，Q代表热狗；D代表与发送者冲突（duel），
N代表不与发送者冲突。 [p]表示当接收者接收到信号后，认为发

不完全信息动态博弈

德国、法国、西班牙和英国等，是欧洲航空公司的联合企业，
创立目的就是和波音这样已成规模的公司竞争。
波音早于空客成立，所以当欧洲各国抢占市场时，波音早
已在欧洲站稳脚跟。波音公司先进入市场，就可能出现两种情
况——波音公司是一个“无先发优势”的企业，也可能是一个
“有先发优势”的企业。
第5页
2

波音与空客之战
第五章
不完全信息动态博弈
主要内容
第一节
不完全信息动态博弈
第二节
精炼贝叶斯纳什均衡
第三节
信号博弈
第四节
先验信念、策略互动、后验概率
第 2 页
第一节
不完全信息动态博弈
不完全信息动态博弈特点
波音与空客之战
第3页
1
不完全信息动态博弈特点
不完全信息动态博弈：指至少有一方参与者对于博弈的信息不是
完全了解，并且参与者的行动存在先后顺序。和不完全信息静态
由方程 2q1 q2 8 和 q1 2q2 8 可得：
q1=8/3，q2=8/3
在“无先发优势”条件下波音公司利润π(q1)=64/3，空客
公司利润为π(q2)=10/3。
也就是说，在波音公司是“无先发优势”条件下，空客
公司会选择生产，与波音公司竞争。
第 13 页
第二节
精炼贝叶斯纳什均衡
自己肯定选择策略R,所以对这个动态博弈来说，博弈路径必
定是甲选择策略T，乙选择策略R。
第 22 页
3

不可置信的威胁与可置信的威胁
不可置信威胁又称空洞威胁，是完全没有任何威胁作用的威
胁。比如在上述博弈中，乙为了让甲选择策略N，就对甲说，
如果不选择N，乙会选择策略L，局中人甲得益就是0，但甲选

博弈论谢识予第四五章参考答案

第四章参考答案2、火车站和机场餐饮商业服务的顾客往往都是一次性的，回头客、常客比较少，这些经济交易具有一次性博弈的特征，它们的价格总是较高而质量又会差一些，顾客也会尽量不在这些地方购买商品和消费。

在一般商业区和居民区的餐饮商业服务则回头客和常客较多，有明显的重复博弈特征，在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格，还能得到较好的服务，甚至有些还可以信用消费（赊账），因此消费者一般会比较放心地消费。

这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。

3、从研究对象和问题特征看，有限次重复博弈研究的主要是有明确结束时间的（合作、竞争等）关系，无限次重复博弈研究的主要是没有明确结果时间，或者较长期的关系。

从分析方法的角度，动态博弈和重复博弈分析中常用的逆推归纳法在无限次16重复博弈中无法直接运用，因为没有最后一次重复。

因此无限次重复博弈分析的主要方法是构造法，即根据特定效率意义等构造了博弈完美纳什均衡。

此外，也可以运用某些技巧解决问题，如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。

从博弈的结果看，无限次重复博弈的效率往往高于有限次重复博弈，有些在有限次重复博弈中无法实现的效率较高的结果，在无限次重复博弈中有可能实现。

例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。

两类重复博弈民间定理的差异也说明了这一点。

最后，在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题，在我限次重复博弈问题中这是必须考虑的。

上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别，区分研究这两类博弈问题是非常重要的，在实践方面的主要启发是促进和保持经济关系的长期稳定性，对于提高社会经济效率等常常有非常重要的意义。

6、用画线法容易找出该博弈的两个纯策略纳什均衡（T，L）和（M，R）。

这两个纳什均衡的得益都帕累托劣于（B，S）。

一次性博弈中效率较高的（B，S）不可能实现。

第四部分不完全信息动态博弈第六章信号博弈(signalling games)

a1
[1]
m1
a2 R
a1 [0]
a2
m1
S
t1
N 1- t2
S
m2
[0] a1
a2
R
[1] a1
m2
a2
• 结论：[(m1,m2), (a1,a2), p=1, q=0]是博弈的分离完美Bayes均衡。
厂商的分离均衡纯策略(保修,不保修)
(1,0.5) Y [1] (0,0) N 客户
(-1,-0.5) Y [0]
• SR(1)：μ(软弱/热狗)=p；μ(粗暴/热狗)=1-p；μ(软弱/啤酒)=q； μ(粗暴/啤酒)=1-q
• 发送者的纯策略：(热狗,热狗), (热狗,啤酒), (啤酒,热狗), (啤酒,啤酒)
• 接收者的纯策略：(冲突,冲突), (冲突,不冲突), (不冲突,冲突), (不冲突,不冲突)
1、发送者的分离均衡纯策略(热狗,啤酒)
(ti m j ) 1
t i T
a1 [p] m1 a2
S
m2
[q] a1
t1
a2
R
a1 [1-p]
a2
m1
N 1- t2
S
R
[1-q] a1
m2
a2
条件R2
• 在给定的信念下，局中人的策略必须是序贯理性的（sequentially rational）。就是说，在每一个信息集，具行动的局中人所采取的行动（以及局中人往后的行动）在给定该局中人在该信息集上的信念与其他局中人以后的策略下必须是最优的。
1 R (1,3)
L
M
p
2
1-p
A
BA B
(2,1) (0,0) (0,2) (0,1)

企业间合作与竞争的博弈模型

企业间合作与竞争的博弈模型第一章引言企业间的合作与竞争是经济活动中常见的一类现象。

企业间合作，可以加强企业之间的联系，形成企业协同效应，提高企业的竞争力，实现共同利益。

而企业间竞争则是企业之间为争夺市场份额和利润而采取的一种行为，它可以促进市场生态的发展和优化。

因此，如何在企业间进行合作与竞争，是当前企业经营和发展面临的重要问题。

本文将从博弈论的角度探讨企业间合作与竞争的博弈模型。

第二章合作的博弈模型企业间的合作，可以通过博弈论模型进行研究。

博弈论是对决策制定者行为和决策的影响进行定量研究的一种数学方法。

下面以纳什博弈为例，解析企业间合作的博弈模型。

2.1 纳什博弈纳什博弈是一种非合作博弈模型，是博弈论中最著名的博弈模型之一。

该博弈模型是基于每个人都做出最优决策的假设，并考虑到其他参与者也会做出最优决策的可能性。

在纳什博弈中，每个人通过考虑其他人可能的行为来选择自己的行为，以达到自己的最优收益。

2.2 合作的纳什均衡在企业间的合作中，纳什博弈中的合作是比较常见的行为。

当多个企业在选择是否进行合作时，会考虑到其他企业是否也会进行合作。

如果有多个企业都选择进行合作，则可以形成一个纳什均衡。

在这种情况下，每个企业对于合作的决策是最优的，因为每个企业的利益可以得到最大化。

2.3 合作的追求问题然而，在企业间的合作中，每个企业都追求自身利益的最大化。

因此，在企业合作时，存在任一企业追求自身利益的情况下，合作可能会被打破。

此时，合作方可能会受到不利的影响，从而导致合作的失败。

企业间的合作可以利用纳什博弈模型进行分析，以确定最佳的合作策略。

第三章竞争的博弈模型企业间的竞争可以通过博弈论模型进行分析。

下面以重复的囚徒困境博弈为例，解析企业间竞争的博弈模型。

3.1 重复的囚徒困境博弈重复的囚徒困境博弈是一种重复博弈模型，也是博弈论中最常见的博弈模型之一。

在重复囚徒困境博弈中，两个企业面临决定是否采取合作或竞争的问题。

博弈论前四章笔记整理

博弈论前四章笔记整理第一章：博弈论基础概念。

- 博弈的定义与要素。

- 博弈是指在一定的规则下，多个参与者（至少两个）进行策略选择并得到相应结果（收益）的过程。

- 要素包括参与者（局中人）、策略（每个参与者可选择的行动方案）、收益（每个参与者在不同策略组合下的所得）。

例如在“囚徒困境”中，两个囚犯是参与者，坦白或不坦白是他们的策略，不同策略组合下的刑期长短就是收益。

- 博弈的分类。

- 按参与者数量可分为两人博弈和多人博弈。

- 按策略空间是否有限分为有限博弈和无限博弈。

如猜硬币是有限博弈（正面或反面两种策略），企业的产量竞争（产量可在一定范围内连续取值）可能是无限博弈。

- 按收益情况分为零和博弈（一方的收益就是另一方的损失，总和为零，如赌博）、常和博弈（收益总和为常数）和非零和博弈（收益总和不为零，如企业合作共同开拓市场，双方都可能获利）。

第二章：完全信息静态博弈。

- 策略式表述（标准式表述）- 通常用一个矩阵来表示，行代表一个参与者的策略，列代表另一个参与者的策略，矩阵中的元素是对应的收益组合。

以“性别战”为例，丈夫和妻子选择看电影或看球赛，就可以构建一个2×2的收益矩阵。

- 占优策略均衡。

- 占优策略是指无论其他参与者选择什么策略，该策略都是某个参与者的最优策略。

如果每个参与者都有占优策略，那么由这些占优策略组成的策略组合就是占优策略均衡。

例如在“囚徒困境”中，每个囚徒的占优策略都是坦白，所以（坦白，坦白）是占优策略均衡。

- 纳什均衡。

- 纳什均衡是指在一个策略组合中，每个参与者的策略都是对其他参与者策略的最优反应。

即给定其他参与者的策略，没有参与者有动机单方面改变自己的策略。

与占优策略均衡不同，纳什均衡并不要求每个参与者都有占优策略。

例如在“性别战”中，（看电影，看电影）和（看球赛，看球赛）都是纳什均衡。

第三章：完全信息动态博弈。

- 扩展式表述。

- 包括博弈树的构建，节点表示参与者的决策点，树枝表示可选择的策略，终端节点表示博弈的结果并标有相应的收益。

博弈论与信息经济学-4.不完全信息动态博弈

I11
L
p
M
I21
R
1-p
1 3
U
2 1
B
0 0
U
0 2
B
0 1
根据局中人2的推断可知，局中人2选 R 的期望支付为 1 p ，选 U
的期望支付为
p 2(1 p) 2 p
①
L R
③
A D
I31
③
U
②
B
A
D
4 4 4
1 1 1
5 5 0
2 2 2
3 3 0
均衡（L,B,A）并不是一个合理的均衡。因为如果博弈进入参与人2的信息集，参与人2应该选择U而不是B。不可能用子博弈精炼纳什均衡的概念剔除（L,B,A），但可以使用精炼贝叶斯均衡剔除这个不合理的均衡。
( A, L, L' ) r1( A, L, L' ) r2 ( A, L, L' ) r3 ( A, L, L' )
r3 ( A, L, L' ) {L' , R'}
，
( A, L, L' ) 为纳什均衡。
{( A, L, L' ), p 0} 对于要求1与3的满足是显然的，现考虑要求2

给定局中人的推断，局中人的策略必须满足序贯理性的要求。即在每一信息
集中，应该行动的局中人（以及局中人随后的策略），对于给定的该局中人的推断，以及其余局中人随后的策略（其中“随后的策略”是在达到给定的信息集之后，包括了其后可能发生的每种情况的完全的行动计划）必须是最优反应。

博弈论第四章

4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。

参与人2 不知道t，但知道t的概率分布。

博弈的时序：（1）参与人1选择行动a1∈A1;（2）参与人2观察a1，选择a2∈A2博弈的收益：u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2，10，0参与人 1 M0, 20，1R1, 31, 3纯战略纳什均衡: (L，L'), (R，R')均为子博弈精炼纳什均衡(无子博弈)。

但是(R, R')不可信。

排除不可信的纳什均衡：要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下，博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。

例要求3的说明参与人1的类型空间：{ t1，t2，t3，t4 }行动空间：A= { L，R}推断p i: 观察到L后，参与人1的类型是t i的概率。

推断q i: 观察到R后，参与人1的类型是t i的概率。

p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略： t 1选 L ，t 2选 L ， t 3选R ，t 4 选R 。

参与人2对p i 与 q i 的推断：p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。

博弈论与信息经济学04PPT课件

• 我们将通过这种方式得到的纳什均衡称为精炼贝叶斯纳什均衡。
• 精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼纳什均衡和贝叶斯推断的结合。它要求：
1、在每个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布（信念）；
2、给定该信息集上的概率分布和其他参与人的后续战略，参与人的行动必须是最优的；
3、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。
贝叶斯法则
(6,0) (6,0) (7,0) (3,1) (7,0) (3,1)
(7,0) (6,0) (6,0) (9,0) (9,0) (8,0) (8,0) (7,0) (5,-1) (9,0) (5,-1) (9,Байду номын сангаас) (5,-1) (9,0)
• 在第二阶段, 企业的行动选择是一个简单的静态博弈决策问题，但在第一阶段，情况要复杂得多：
P=4
P=5
P=6
2
6
7
6
9
8
• 例如：低成本的在位者不会选择p=6，因此，如果进入者观察到在位者选择了p=6, 就可以推断在位者一定是高成本，选择进入是有利可图的。预测到p=6会招致进入者进入，即使高成本的在位者也可能不会选择p=6。
• 类似的，如果选择价格p=5会招致进入者进入，低成本的在位者也不会选择p=5。
对于在位者：
价格在位者高成本时的利润在位者低成本时的利润
P=4 P=5
P=6
2
6
7
6
9
8
• 进入者只有一种类型：进入成本为2。如果进入，生产成本函数与在位者高成本函数相同。在 T=2阶段，如果进入者已进入，在位者成本函数为共同知识；

博弈的四种基本类型

博弈的四种基本类型和四种关系1.完全信息静态博弈：参与者的信息完全公开，所有参与者同时做出决策。

例如，囚徒困境。

2.完全信息动态博弈：信息完全公开，但参与者的决策有先后顺序。

例如，斯坦科尔伯格寡头竞争。

3.不完全信息静态博弈：参与者的信息不完全公开，所有参与者同时做出决策。

例如，性别战博弈。

4.不完全信息动态博弈：信息不完全公开，参与者的决策有先后顺序。

例如，信号传递博弈。

每种类型的定义和特点:完全信息静态博弈：在这种类型的博弈中，所有参与者的信息和收益函数都是公开的，所有参与者同时做出决策。

例如，囚徒困境是一个典型的完全信息静态博弈，其中两个罪犯在审讯时选择坦白或不坦白。

完全信息动态博弈：在这种类型的博弈中，所有参与者的信息和收益函数都是公开的，但参与者的决策有先后顺序。

例如，斯坦科尔伯格寡头竞争模型中，企业先后决定产量，后行动的企业可以根据先行动企业的决策来调整自己的策略。

不完全信息静态博弈：在这种类型的博弈中，参与者的信息不完全公开，所有参与者同时做出决策。

例如，性别战博弈中，两个参与者不知道对方的策略，只能根据自己的猜测做出决策。

不完全信息动态博弈：在这种类型的博弈中，参与者的信息不完全公开，决策有先后顺序。

例如，信号传递博弈中，先行动的企业可以通过发送信号来影响后行动企业的决策。

博弈的四种关系一、零和博弈定义：在零和博弈中，参与各方的利益总和是固定的，一方的收益必然意味着另一方的损失，所以双方的收益和损失之和为零。

举例：在扑克游戏中，赢家赢得的钱与输家输掉的钱数量相等，这就是典型的零和博弈。

你赢了一定数量的筹码，就意味着其他玩家输了同样数量的筹码，整个游戏过程中筹码的总量并没有增加或减少。

二、正和博弈定义：正和博弈也称为合作博弈，是指参与各方的利益总和大于零，即通过合作可以实现共赢的局面。

举例：企业之间的合作研发项目，各方共同投入资源，研发成功后，每个参与企业都能获得比单独行动时更多的收益。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(M1L D1L )
M1L M1L ( p1L )
M1H M1H ( p1L )
(M1H D1H )
p

pp
~
L m
H pm p
p1L
图4．5垄断限价模型博弈论与信息经济学江西财经大学陶长琪
4．2-1米尔格罗姆－罗伯茨（Milgrom-Roberts）垄断限价模型
P r ob { |a } P r ob {a }
h

p(a
j 1
K
h
| j ) p( j )
应该指出的是，贝叶斯法则并不是一个技术性法则，而是人们修正信念的唯一合理方法. 精炼贝叶斯均衡假定参与人是根据贝叶斯法则修正先验概率的．不过，贝叶斯法则要求 Pr ob i必须以正的概率选择 a h ，否则，后验概率没 {a h } 0，即参与人 {a h } 0 ，我们允许Pr ob{a h } 0 在[0，1]区间取任有定义．如果 Pr ob 何值，只要所取的值与均衡战略相容．在动态博弈中，Pr ob{ k | a h } 对应的是非均衡中径上的信息集
博弈论与信息经济学江西财经大学陶长琪
4．2-1米尔格罗姆－罗伯茨（Milgrom-Roberts）垄断限价模型
( SM ) ( M 1H ( p1 ) M 1L ( p1 )) 0 p2005.1.11 赵乐欢制作历经或 10天终于于日凌晨基本完成，非常感谢 1
H L 刘艳艳同学第四章及第六章，第七章的文档 ! ( p1 ) M 1 ( p1 ) M 1

让我们再一次考虑市场进入的例子:
［u］在位者 P=4 进入者进入不进入进入
第一阶段： (2,0) (2,0) 第二阶段： (3,1) (7,0)
N
高低 [1-u]
P=6 P=5 不进入进入不进入进入
P=4
P=5 不进入进入不进入进入
P=6 不进入
( 6,0) (3,1)
(6,0) (7,0)
4．2 信号传递博弈及其应用举例
赵乐欢制作历经10天终于于2005.1.11 日凌晨基本完成，非常感谢 ~ * ( p1 ) a (m) arg max p( | m)u2 (! m, a, ); 刘艳艳同学第四章及第六章，第七章的文档
(m* ( ), a* (m)) 和后验概率定义 : 领带传递博弈的精炼贝叶斯均衡是战略组合 ~ 的 p ( | m) 结合，它满足:
(7,0) (3,1)
(7,0) (7,0)
(6,0) (5,-1)
(6,0) (9,0)
(9,0) (5,-1)
(9,0) (9,0)
(8,0) (5,-1)
(8,0) (9,0)
博弈论与信息经济学江西财经大学陶长琪
图4．1 市场进入博弈
4．1-1 基本思路
注意：进入者第一阶段的利润恒为０．我们省略了第二阶段博弈的扩展式，代之以库诺特均衡支付向量和垄断利润．这样做的理由是，在博弈进入第二阶段后，如果进入者已经进入，库诺特均衡产量（和对应的价格）是每个企业的最优选择；如果进入者没有进入，单阶段垄断产量（和价格）是在位者的最优选择。赵乐欢制作历经 10天终于于2005.1.11日凌晨基本完成，非常感谢
刘艳艳同学第四章及第六章，第七章的文档 ! 精炼贝叶斯均衡（perfect Bayesian equilibrium）是贝叶斯均衡、子博弈精炼
均衡和贝叶斯推断的结合它要求：（１）在每一个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布（信念）；（２）给定该信息集上的概率分布和其他参与人的后续战略，参与人的行动必须是最优的；（３）每一个参与人根据贝叶斯法则和均衡战略修正后验概率。统计学上，修正之前的判断称为“先验概率”，修正之后的判断称为“后验概率”．贝叶斯法则正是人们根据新的信息从先验概率得到解决后验概率的基本方法
p1

p1
这个条件说的是，改变价格对不同类型企业的利润的影响是不同的；特别地，高成本企业比低成本企业更愿意选择高价格（或者说，更不愿意选择低价格）．容易证明，这个条件一般是满足的．（SpenceMirrlees条件是所有信号传递博弈分离均衡存在的基本条件．）如果成本类型是连续分布的，条件(SM)变为：
回主目录博弈论与信息经济学江西财经大学陶长琪
4．1-1 基本思路
博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。精炼贝叶斯均衡是不完全信息动态博弈均衡的基本均衡概念，它是泽尔赵乐欢制作历经 10 天终于于2005.1.11日凌晨基本完成，非常感谢腾（Selten ）的完全信息动态博弈子博弈精炼纳什均衡和海萨尼（Harsanyi）的不完全信息表态博弈贝叶斯均衡的结合。刘艳艳同学第四章及第六章，第七章的文档 ! 精炼贝叶斯均衡要求，给定有关其他参与人的类型的信念，参与人的战略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡；并且，在所有可能的情况下，参与人使用贝叶斯法则修正有关其他参与人的类型的信念．
2 M ( p, c) Q( p) (( p c)Q( p)) 0 pc pc p

从图4．5中可以看出，所有的满足分离均衡条件(A’)和(B’)，其中是最低成本分离价格，是最高成本分离价格．同样，上述必要条件也是充足条件．证略博弈论与信息经济学江西财经大学陶长琪
只有当下列条件满足时，高成本在位者才不会选择低成本在位者的均衡价格： H H H L H ( A ) M D M ( p ) M 赵乐欢制作历经 10 天终于于 2005.1.11 日凌晨基本完成，非常感谢或 1 1 1 1 1

L ( A' )M1H M1H ( p1 ) (M1H 刘艳艳同学第四章及第六章，第七章的文档 ! D1H )
4.3.4泽尔腾(Selten)的颤抖手精炼
均衡 4.4 不完全信息重复博弈与声誉 4.4.1 KWRW声誉模型 4.4.2声誉模型的一个应用：政府的货币政策 4.5 博弈论均衡概念简要总结
不完美信息博弈的精炼贝叶
斯均衡 4.2 信息传递弈及其应用举例 4.3 精炼贝叶斯均衡的再精炼及其他均衡概念 4.3.1剔除劣战略
4. 不完全信息动态博弈
4.1 精炼贝叶斯纳什均衡
4.1.1 基本思路
4.3.2直观标准
4.3.3克瑞普斯－威尔逊(Kreps-
赵乐欢制作历经 10天终于于2005.1.11日凌晨基本完成，非常感谢 Wilson)序贯均衡 4.1.2 贝叶斯法则刘艳艳同学第四章及第六章，第七章的文档!
4.1.3 4.1.4 精炼贝叶斯均衡
(1,3)
[1-p]
[p] B (0,0)
2 (0,2)
U (2,1)
U
B (0,1)
这个博弈有两个纯战略纳什均衡：(L，B)和(M，U)．（检查一下为什么 (L，B)是一个纳什均衡：给定参与人１选择Ｌ，参与人２的信息集没有到达；给定参与人２选择Ｂ，Ｌ是参与人１的最选择．）进一步，因为这个博弈只有一个子博弈，即原判博弈，（Ｌ，Ｂ）和（Ｍ，Ｕ）都是子博弈精炼纳什均衡．但是，精炼纳什均衡（Ｌ，Ｂ）显然依赖于一个不可置信的威胁：如果博弈进入参与人２的信息集，Ｕ严格优于Ｂ，选择Ｂ不是序贯理性的；顺此，参与人１不应该相信参与人２会选择 B.尽管子博弈精炼均衡不能剔除（Ｌ，Ｂ），我们可以使用精炼贝叶斯均衡剔除（Ｌ，Ｂ）博弈论与信息经济学江西财经大学陶长琪
博弈论与信息经济学江西财经大学陶长琪
4．1-3 精炼贝叶斯均衡
定义：精炼贝叶斯均衡是一个战略组合 p ( p1 , , pn ) 和一个 * * * s ( ) ( s ( ), , s (n ))，满足：后验概率组合 1 1 n 赵乐欢制作历经10天终于于2005.1.11 日凌晨基本完成，非常感谢 (A) 对于所有的参与人i，在每一个信息集h ! 刘艳艳同学第四章及第六章，第七章的文档
1
p
L 1
即：如
L (C)M1H M1H ( pm ) (M1H D1H )
为了找到满足条件（Ａ）和（Ｂ）的，我们必须对需求函数和成本函数作一些特定的假设．存在区间的关键假设是所谓的＂斯宾塞－莫里斯条（Spence-Mirrlees condition，又称分离条件(sorting condition)或单交叉条件(single-crossing condition)
博弈论与信息经济学江西财经大学陶长琪
4．1-4 不完美信息博弈的精炼贝叶斯均衡
赵乐欢制作历经10天终于于2005.1.11 L R 日凌晨基本完成，非常感谢不刘艳艳同学第四章及第六章，第七章的文档 ! M 完
全信息博弈
因为不完全信息博弈被模型为不完美信息博弈，精炼贝叶斯均衡概念也适用于不完美信息博弈.举例如下：

只有当下列条件成立时，才是低成本在位者的均衡价格： L ( B)M1L ( p1 ) M1L M1L D1L 或
L ( B' )M1L M1L ( p1 ) (M1L D1L ) L L 为了使分析有意义，我们假定不存在p1 ＝ pm的分离均衡，

L L 果 p＝，高成本的在位者也将选择 pm
我们用 Pr ob{ | a } 代表这个后验概率，即给定 a 的情况下, i 属于类型 k 的概率:
k h
h
Prob(ah , k ) p(ah | k ) p( k ) Prob{ k | ah }Prob{ah }
博弈论与信息经济学江西财经大学陶长琪
4．1-2 贝叶斯法则
即i属于 k 并选择 a 的联合概率等于i属于的先验概率乘以给定a 的概率，或等于 k h h a a i 选择的总概率乘以给定情况下 i 属于的后验概率．因此，我们有贝叶斯法则赵乐欢制作历经10天终于于2005.1.11 日凌晨基本完成，非常感谢

第4章不完全信息动态博弈

合集下载

不完全信息动态斯塔克尔伯格博弈模型

不完全信息动态博弈模型

博弈论基础讲义-第四章

不完全信息动态博弈

不完全信息动态博弈

博弈论谢识予第四五章参考答案

第四部分不完全信息动态博弈第六章信号博弈(signalling games)

企业间合作与竞争的博弈模型

博弈论前四章笔记整理

博弈论与信息经济学-4.不完全信息动态博弈

博弈论第四章

博弈论与信息经济学04PPT课件

博弈的四种基本类型

文档推荐

最新文档

第4章 不完全信息动态博弈

合集下载

不完全信息 动态 斯塔克尔伯格博弈模型

不完全信息动态博弈模型

博弈论基础讲义-第四章

不完全信息动态博弈

不完全信息动态博弈

博弈论谢识予第四五章参考答案

第四部分 不完全信息动态博弈 第六章 信号博弈(signalling games)

企业间合作与竞争的博弈模型

博弈论前四章笔记整理

博弈论与信息经济学-4.不完全信息动态博弈

博弈论第四章

博弈论与信息经济学04PPT课件

博弈的四种基本类型

文档推荐

最新文档

第4章不完全信息动态博弈

不完全信息动态斯塔克尔伯格博弈模型

第四部分不完全信息动态博弈第六章信号博弈(signalling games)