不完全信息动态博弈-精练贝叶斯纳什均衡
- 格式:ppt
- 大小:808.00 KB
- 文档页数:16
第五章不完全信息动态博弈5.1 精炼贝叶斯纳什均衡5.1-1 基本概念在完全信息动态博弈的情况下,每个参与人的类型是共同知识(common knowledge),每个参与人都是在已知自己以及其他人类型的情形下按照行动顺序进行选择(做出决策)。
但是,在不完全信息动态博弈(dynamic game of incomplete information)的情况下,每个参与人只知道自己的类型而不知道其他参与人的类型,这样就好像是在博弈的开始阶段,存在一个参与人,名为“自然”,它先选择每个参与人的类型,然后参与人开始行动,参与人的行动有先有后,后行动者可以观察到先行动者的行动,但不能观察到先行动者所属于的类型。
但是,因为参与人的行动是依据参与人所属的类型而作出的,每个参与人的行动都传递着有关自己所属类型的信息,后行动者可以通过先行动者的行动来猜测先行动者的类型或者修正对先行动者所属类型的先验信念(表现为概率分布),然后根据修正后的后验信念选择自己的最优行动。
同样,先行动者会预测到自己的行动将被后行动者所利用,就会设法选择某些特定行动来迷惑后行动者,即选择那些传递对自己最有利的信息、避免传递对自己不利信息的行动。
因此,博弈过程不仅仅是参与人选择行动的过程,而且是参与人不断修正自己信念的过程,比起完全信息动态博弈的情况要更加复杂。
精炼贝叶斯均衡是不完全信息动态博弈均衡的基本均衡概念,它是泽尔腾(Selten)的完全信息动态博弈子博弈精炼纳什均衡和海萨尼(Harsanyi)的不完全信息静态博弈贝叶斯均衡的结合。
精炼贝叶斯均衡要求,给定有关其他其他参与人所属类型的信念,参与人的战略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡:并且,在所有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的信念。
在不完全信息静态博弈中,我们有一个与参与人的信念相关的概念,用概率(probability)来表示,它在整个博弈的过程中是不变的,可以说是一个坚定的信念;而在不完全信息动态博弈的情况下,该概念就不再适用了,因为参与人的信念是会不断修正的,对于参与人的信念,我们分为两类,一类是先验概率(prior probability),而另外一类是后验概率(posterior probability)。
不完全信息动态博弈4 不完全信息动态博弈4.1 精炼贝叶斯均衡概述不完全信息动态博弈就其基本要素来看是不完全信息与博弈的动态性质的一种综合。
在处理不完全信息要素时,通过将某些参与人“类型”的不确定性作为信息不完全性的一种表征,这种方法将继续得以采用,即博弈中参与人面临的信息不完全性(无论它是指何种信息)将完全由某些参与人的“类型”的不确定性加以刻画。
同时,作为动态博弈,“序贯理性”的思想将一直得到贯彻。
我们在不完全信息动态博弈中将信息不完全程度削减到零,则不完全信息动态博弈就自然应退化成一种完全信息动态博弈,其相应的精炼均衡概念就由精炼贝叶斯回到子博弈精炼均衡。
从这种意义上来看,不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广,正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样。
例简单的非完全信息动态博弈L'u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2参与人1的类型t 为个人信息。
参与人2 不知道t ,但知道t 的概率分布。
博弈的时序:(1)参与人1选择行动a 1 ∈A 1; (2)参与人2观察a 1,选择a 2 ∈A 2 博弈的收益: u 1 (a 1, a 2, t ), u 2 (a 1, a 2, t )精炼贝叶斯均衡博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的参与人都选择该战略组合中给出的相应战略时,任何一个参与人都不会有单方面偏离这一选择的动机。
作为动态博弈,一个战略是参与人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的参与人将选择不同的战略规定。
因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他参与人的战略时(其他参与人的战略是类型依存的,所以,说给定其他参与人的战略即指给定其他参与人的战略与类型的依存关系),任一参与人在其任何类型下由该组合给出的类型依存战略是其最优的。
4 不完全信息动态博弈4.1 精炼贝叶斯均衡概述不完全信息动态博弈就其基本要素来看是不完全信息与博弈的动态性质的一种综合。
在处理不完全信息要素时,通过将某些参与人“类型”的不确定性作为信息不完全性的一种表征,这种方法将继续得以采用,即博弈中参与人面临的信息不完全性(无论它是指何种信息)将完全由某些参与人的“类型”的不确定性加以刻画。
同时,作为动态博弈,“序贯理性”的思想将一直得到贯彻。
我们在不完全信息动态博弈中将信息不完全程度削减到零,则不完全信息动态博弈就自然应退化成一种完全信息动态博弈,其相应的精炼均衡概念就由精炼贝叶斯回到子博弈精炼均衡。
从这种意义上来看,不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广,正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样。
例简单的非完全信息动态博弈Nt1(p) t2 (1–p)1 1L R L R2 2L R L R L R L Ru1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2参与人1的类型t 为个人信息。
参与人2 不知道t ,但知道t 的概率分布。
博弈的时序:(1)参与人1选择行动a 1 A 1;(2)参与人2观察a 1,选择a 2 A 2博弈的收益: u 1 (a 1, a 2, t ), u 2 (a 1, a 2, t )精炼贝叶斯均衡博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的参与人都选择该战略组合中给出的相应战略时,任何一个参与人都不会有单方面偏离这一选择的动机。
作为动态博弈,一个战略是参与人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的参与人将选择不同的战略规定。
因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他参与人的战略时(其他参与人的战略是类型依存的,所以,说给定其他参与人的战略即指给定其他参与人的战略与类型的依存关系),任一参与人在其任何类型下由该组合给出的类型依存战略是其最优的。
第十二章贝叶斯纳什均衡及其精炼前两章讨论的是完全信息条件下的博弈,给出了博弈的基本分析框架。
本章将讨论不完全信息下的博弈行为,包括不完全信息静态博弈和不完全信息动态博弈。
12.1不完全信息博弈与贝叶斯纳什均衡一、不完全信息博弈完全信息博弈指博弈中的参与人对所有其他参与人的支付(偏好)函数有完全的了解,并且支付函数是所有参与人的共同知识(common knowledge)的博弈。
反之,不满足完全信息博弈假设的博弈称为不完全信息博弈。
二、海萨尼(Harsanyi)转换在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。
至于“类型”概念,以两个企业博弈的例子说明。
假设参与人1为在位者企业,参与人2为进入者企业。
进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则不进。
但是进入者不知道在位者的成本是高还是低。
因此,进入者必须预测在位者的成本“类型”,究竟是高成本的还是低成本的。
海萨尼提出通过引入“自然”概念解决这个问题。
即由自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。
即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。
在本例中,通过自然选择在位者的成本类型,进入者再针对高成本或低成本进行是否进入的博弈决策。
应当指出,通过自然选择类型的划分,不仅是针对支付函数而言的,其包括参与人所拥有的所有个人信息,如战略空间和信息集等等。
通过上述分析可知道,不完全信息意味着,至少有一个参与人拥有多种类型,否则就成为完全信息博弈。
用表示参与人的一个特定类型,表示参i θi i Θ与人所有可能类型的集合,,并假定i i i Θ∈θ取自某个客观的分布函数。
n i i 1}{=θ),,(1n P θθL为简化起见,假定只有参与人本人观察到自i 己的类型,其他人都不能察到。
但依据海萨尼i θi θ公理,我们假定分布函数是所有参与),,(1n P θθL 人的共同知识,就是说,在博弈开始时,所有参与人关于自然行动的信念是相同的。