完全且完美信息动态博弈
- 格式:ppt
- 大小:3.90 MB
- 文档页数:92
完全信息动态博弈模型
完全信息动态博弈是指在博弈中进行的每一步,参与人都拥有完整的信息,并做出最优决策。
这种博弈模型通常用于分析市场博弈、合作与竞争、决策制定等领域。
在完全信息动态博弈中,每个参与者都知道其他参与者的决策和状态,并且可以立即观察到它们的结果。
完全信息动态博弈模型可以使用逆向归纳法求解。
当参与者 2 行动时,它面临的决策问题是最大化收益。
参与者 1 可以预测参与者 2 对参与者 1 的每一个可能行动的反应,即参与者 2 的最优反应。
参与者 1 在第一阶段要解决的问题是最大化自身收益,即求解u1(a1,R2(a1))。
如果参与者 1 的问题有唯一解 a1star,那么称(a1star,R2(a1star)) 是这一博弈的逆向归纳解。
完全信息动态博弈通常包含多个阶段,每个阶段中参与者可以在知道前面所有阶段的行动后做出决策。
在阶段内的同时行动意味着博弈包含不完美信息。
这种博弈模型可以用于分析市场动态、合作与竞争、决策制定等领域。
博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理博弈论与信息经济学第6章完全且完美信息动态博弈——重复/超级博弈-连锁店悖论-无名氏定理经济学院丁言强内容提要重复博弈与战略空间有限次重复博弈:连锁店悖论无限次重复博弈冷酷战略与针锋相对战略无名氏定理阿伯罗定理: 两期战略序贯博弈与重复博弈序贯博弈的特征是,参与人在前一个阶段的行动选择决定随后的子博弈的结构,因此,从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈,或者说,同样结构的子博弈只出现一次。
动态博弈的另一种特殊但是非常重要的类型是所谓的“重复博弈”,就是同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。
在每个阶段博弈,参与人可能同时行动,也可能不同时行动,在后一种情况下,每个阶段博弈本身就是一个动态博弈。
重复博弈的3个基本特征重复博弈可能是不完美信息博弈,也可能是完美信息博弈,但在博弈论中一般指的是前一种情况。
(1)阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段博弈的结构;(2)所有参与人都观测到博弈过去的历史;(3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。
重复博弈的战略空间战略是一套完备的相机行动规则,它必须说明在每一种可能的状态下参与人的行动选择,即使参与人并不预期这种状态真的会出现。
因为可以观察到其他参与人过去行动的历史,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史。
所以,参与人在重复博弈中的战略是定义在博弈历史上的每个阶段博弈中的行动选择规则,即从博弈历史到行动空间的映射。
重复博弈的战略空间参与人在重复博弈中的战略空间远远大于且复杂于在每一个阶段博弈中的战略空间。
比如说,即使囚徒困境博弈只重复5次,每个囚徒的纯战略数量大于20亿个,战略组合的数量更多。
所以,重复博弈可能带来一些“额外的”均衡结果,这些均衡结果在一次博弈中是从来不会出现的。
第三章完全且完美信息动态博弈在动态博弈中,参与者需要根据对手的行为和策略来调整自己的行动,以便达到最佳的结果。
动态博弈可以分为完全信息动态博弈和不完全信息动态博弈。
完全信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,而不完全信息动态博弈则是指参与者不知道其他参与者的策略和收益函数。
在完全信息动态博弈中,参与者可以通过观察对手的行为来推断出对手的策略和收益函数。
这种博弈可以通过逆向归纳法来求解,即从博弈的阶段开始,逐步向前推导出每个阶段的最佳策略。
逆向归纳法是一种有效的求解完全信息动态博弈的方法,它可以帮助参与者找到最佳策略,从而实现最佳的结果。
然而,在现实世界中,完全信息动态博弈并不常见。
大多数博弈都是不完全信息动态博弈,参与者无法知道其他参与者的策略和收益函数。
在这种情况下,参与者需要通过观察对手的行为和策略来推断出对手的类型和收益函数。
这种博弈可以通过贝叶斯纳什均衡来求解,即参与者根据对手的类型和收益函数来选择自己的策略,以达到最佳的结果。
完全且完美信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,并且参与者能够观察到其他参与者的行为和策略。
这种博弈可以通过逆向归纳法和贝叶斯纳什均衡来求解,从而帮助参与者找到最佳策略,实现最佳的结果。
在完全且完美信息动态博弈中,参与者可以通过观察对手的行为和策略来推断出对手的类型和收益函数,从而调整自己的策略,以实现最佳的结果。
在完全且完美信息动态博弈中,参与者之间的互动是基于透明和预知性的。
每个参与者不仅清楚自己的策略选择和可能的收益,同时也了解其他参与者将如何根据这些信息做出反应。
这种透明度使得参与者能够做出更加精确的决策,因为他们能够预测对手的行动并据此调整自己的策略。
这种博弈的一个关键特点是,参与者之间的信息是对称的。
这意味着没有参与者拥有其他参与者所不知道的信息优势。
这种信息对称性使得博弈变得更加公平,因为它消除了信息不对称带来的不确定性。
博弈论——完全信息动态博弈2 完全信息的动态博弈2.1完全和完美信息的动态博弈动态博弈(dynamic game):参与⼈在不同的时间选择⾏动。
完全信息动态博弈指的是各博弈⽅先后⾏动,后⾏动者知道先⾏动者的具体⾏动是什么且各博弈⽅对博弈中各种策略组合下所有参与⼈相应的得益都完全了解的博弈静态博弈习惯⽤战略式(Strategic form representation)表述,动态博弈习惯⽤扩展式(Extensive form representation)表述。
战略式表述的三要素:参与⼈集合、每个参与⼈的战略集合、由战略组合决定的每个参与⼈的⽀付。
扩展式表述的要素包括:参与⼈集合、参与⼈的⾏动顺序、参与⼈的⾏动空间、参与⼈的信息集、参与⼈的⽀付函数、外⽣事件(⾃然的选择)的概率分布。
n⼈有限战略博弈的扩展式表述⽤博弈树来表⽰1(1,2) (0,3)①结:包括决策结和终点结。
决策结是参与⼈采取⾏动的时点,终点结是博弈⾏动路径的终点。
第⼀个⾏动选择对应的决策结为“初始结”,⽤空⼼圆表⽰,其它决策结⽤实⼼圆表⽰。
X表⽰结的集合,x X表⽰某个特定的结。
z表⽰终点结,Z表⽰终点结集合。
表⽰结之间的顺序关系,x x′表⽰x在x′之前。
x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。
以下两种情况不允许:前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。
在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。
②枝:博弈树上,枝是从⼀个决策结到其直接后续结的连线,每⼀个枝代表参与⼈的⼀个⾏动选择。
在每⼀个枝旁标注该具体⾏动的代号。
⼀般地,每个决策结下有多个枝,给出每次⾏动时参与⼈的⾏动空间,即此时有哪些⾏动可供选择。
③信息集(information sets):博弈树中某⼀决策者在某⼀⾏动阶段具有相同信息的所有决策结集合称为⼀个信息集。
博弈树上的所有决策结分割成不同的信息集。
每⼀个信息集是决策结集合的⼀个⼦集(信息集是由决策结构成的集合),该⼦集包括所有满⾜下列条件的决策结:(1)每⼀个决策结都是同⼀个参与⼈的决策结。