当前位置:文档之家› 出行路径选择的精炼贝叶斯纳什均衡

出行路径选择的精炼贝叶斯纳什均衡

出行路径选择的精炼贝叶斯纳什均衡
出行路径选择的精炼贝叶斯纳什均衡

1博弈论复习题

完全信息静态博弈习题 基本概念 严格下策反复消去法 划线法 剪头法 纳什均衡 纯策略 混合策略 混合策略纳什均衡 反应函数 一致预测 纳什定理 本章习题 1. 占优均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么? 2. 求出下图中支付矩阵所表示的博弈中的混合策略纳什均衡。 3. 设古诺模型中有n 家厂商。q i 为厂商i 的产量,n q q q Q +++="21为市场总产量。P 为市场出清价格,且已知Q a Q P P ?==)(当(a Q <时,否则P =0)。假设厂商i 生产q i 产量的总成本为i i i i cq q C C ==)(,也就是说没有固定成本且各厂商的边际成本都相同,为常数 )(a c c <。假设各厂商同时选择产量,该模型的纳什均衡是什么?当n 趋向于无穷大时博弈分析是否仍有效? 完全信息动态博弈习题 基本概念 扩展式博弈 博弈树 扩展式博弈的战略 相机选择 可信性 子博弈 子博弈精炼纳什均衡 逆推归纳法 重复博弈 有限重复博弈 无限重复博弈 平均收益 可行收益 总收益 贴现率 有惟一纯策略纳什均衡博弈的有限次(无限次)重复博弈 无限重复博弈的民间定理 触发策略 两期战略 斯塔克博(Stackelberg)格模型 蜈松博弈 L R T 2,1 0,2 B 1,2 3,0 博弈方2 博弈方1

1. 如果开金矿博弈中第三阶段已选择打官 司后的结果尚不能肯定,即图2-1中a 、b 的 数值不确定。试讨论本博弈可能有哪几种 可能的结果。如果本博弈中的“威胁”和 “承诺”是可信的,a 或b 应满足什么条件? 图2-1 2. 设一四阶段两博弈方之间的动态博弈如图2-2所示。试找出全部子博弈,讨论该博弈中可信性问题,求子博弈完美纳什均衡策略组合和博弈结果。 图2-2 3. 三寡头市场有需求函数Q P ?=100,其中Q 是三个厂商的产量之和,并且已知三个厂商都有常数边际成本2而无固定成本。如果厂商1和厂商2先同时决定产量,厂商3根据厂商1和厂商2的产量决策,问他们各自的产量和利润是多少? 4. 设在无限回合讨价还价博弈中,博弈方的贴现因子不同(博弈方1为δ1,博弈方2为 δ2),请给出这种情况下的均衡结果。 不完全信息静态博弈习题 基本概念 贝叶斯博弈(不完全信息博弈) 静态贝叶斯博弈(不完全信息静态博弈) 类型和类型空

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

一:子博弈精炼纳什均衡 在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。 譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a 子博弈和图3.6b子博弈。 在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。 定义3.1:子博弈精炼纳什均衡(SPNE): 扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。 如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。这也意味着原博弈的Nash均衡并不一定是子博弈精炼Nash均衡,除非它还对所有子博弈构成Nash均衡。例如前文的煤电博弈,(提价,接受)和(不提价,接受)均为纳什均衡,但后者并未满足在整个动态博弈及它的所有子博弈中都构成纳什均衡这一要件,因而理性的煤炭企业一定会选择提价。 博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。

《管理经济学(二)》论纳什均衡及其启示

装订处 论纳什均衡及其启示 摘要:纳什对博弈论的贡献有两个方面,一是合作博弈理论中的讨价还价模型,称为纳什讨价还价解;二是非合作博弈理论方面,这是他的主要贡献所在。纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般的意义上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样,他便奠定了非合作博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它己成为经济学中的专用术语。 关键词:纳什均衡;启示 博弈论可以划分为合作博弈和非合作博弈。合作博弈与非合作博弈是根据博弈者之间是否能够通过某种契约的约束采取合作的策略而区分的。合作的博弈是指在这种博弈中,博弈者能够通过谈判达成一个有约束的契约以限制博弈者行为,使之相互采取以一种合作的策略。如果博弈者无法通过谈判达成一个有约束的契约以限制博弈者的行为,则该种博弈为非合作博弈。 合作博弈强调的是团体理性,强调的是效率、公正、公平。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。目前,非合作博弈的理论相对成熟。在以下的分析中,由于分析对象大都是强调个体理性,并且,博弈的参与人之间没有一个具有约束力的契约来限制博弈者的行为,只是强调个人的理性。 在非合作博弈论中,又可以从两个角度对博弈进行分类:一是参与人行动的顺序。从这个角度,可以将博弈划分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈指的是博弈中,参与人同时选择行动,或者是参与人虽然不是同时行动,但是后行动者不能知道先行动者所采取的行动;动态博弈指的是参与人的行动有先有后,且后行动者能够通过一定的手段知道先行动者的具体行动是什么;二是对其他参与人的特征、战略空间和支付函数的知识。从这

博弈均衡模型及其举例

博弈联均衡模型 博弈论模型图示 博弈可划分为合作博弈和非合作博弈,1人们一般讲到的都是指非合作博弈,它有四种不同类型的博弈,即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。这四种均衡中最为基本的是纳什均衡。2 完全信息静态博弈——纳什均衡、 完全信息动态博弈——子博弈精炼纳什均衡 不完全信息静态博弈——贝叶斯纳什均衡、、 不完全信息动态博弈——精炼贝叶斯纳什均衡, 与上述相对应的是、、、。这四种均衡中最为基本的是纳什均衡。 完全信息静态博弈(纳什均衡) 债务人 强硬妥协 1这两者的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议:如能达成就是合作博弈;反之就是非合作博弈。合作博弈强调团体理性,强调效率和公平,非合作博弈强调理性个人的最优决策,其结果是否有效率则是不确定的。 2所谓纳什均衡,指的是所有参与人最优选择的一种组合,在这种组合下,给定其他人的选择,没有任何人有积极性做出新的选择。纳什均衡的哲学思想是:给定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。当博弈中的所有参与人事先达成一项协议,给出每个人的行为规则。在没有外在强制力约束时,当事人是否会自觉地遵守这个协议?或者说这个协议是否可以自动实施?如果当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡。参见张维迎:“经济学家看法律、文化与历史”,载张维迎《产权、政府与信誉》,三联书店2001年版。

四种纳什均衡的联系和区别

四种纳什均衡的联系和区别 联系:纳什均衡、子博弈完美纳什均衡、贝叶斯纳什均衡、完美贝叶斯纳什均衡之间是密切相关的,他们都描述了在博弈中,所有参与者的战略组合,每个参与者的战略都是针对其他参与者的最优反应,在这种战略组合下没有参与者愿意背弃他选定的战略。 因此四种博弈都是纳什均衡,只不过在应用于更复杂的博弈时,我们引入更严格的限制条件来强化原来的均衡概念,每一个新的均衡概念的相继引入正是为了剔除依据原有概念可能得出的不合理的博弈结果,四种均衡概念的关系可以用下面的图表示: 区别: 1、四种均衡概念所适用的博弈类型不同: 即完全信息静态博弈对应纳什均衡,完全信息动态博弈对应子博弈完美纳什均衡,不完全信息静态博弈对应贝叶斯纳什均衡,不完全信息动态博弈对应完美贝叶斯纳什均衡。同时,适用于复杂博弈的纳什均衡适用于简单博弈,但适用于简单博弈的纳什均衡未必适用于复杂博弈。 2、四种均衡对应的策略选择不同,这与不同博弈中策略的不同定义相关: 在完全信息静态博弈中,参与者的战略与其行动一致;在完全信息动态博弈中,后行动者的均衡战略是对应于先行动者的各种战略的最优反应,因此这种情况下后行动者的战略和行动概念就不一样了;在不完全信息静态博弈中,由于参与者不能完全了解对方的效用函数,因此引入了type的概念,相应的均衡策略要求对于每一可能出现的type,均需要给出相应的最优行动,即最优行动为type的函数;在不完全信息动态博弈中,引入了belief的概念,因此最终的纳什均衡不仅包括参与者的战略,还包括了参与者对信息集节点的belief。 3、四种博弈的限制条件不同,复杂博弈的限制条件更强 在完全信息动态博弈,原来定义的纳什均衡未必合理,因为可能某些纳什均衡存在不可信的威胁或者承诺,所以在定义了子博弈完美纳什均衡后,将包含不可信威胁的纳什均衡给排除了;在不完全信息静态博弈中,由于我们引入了type的概念,因此为了得到针对其他参与者战略的最优反应,参与者的战略必须对应于自己的所有type;而在不完全信息动态博弈中,又强化了完全信息动态博弈子博弈的概念,将开始于单节信息集的子博弈扩展与可以开始于任何完全信息集,进而引入了belief的概念,不仅要求最优战略从给定的belief得出,belief也要符合贝叶斯规则,因此完美贝叶斯纳什均衡是限制条件最强的纳什均衡。

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

一:子博弈精炼纳什均衡 在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。 子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。 譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a子博弈和图3.6b子博弈。 在静态博弈分析时,我们所说的战略是指

参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。 定义3.1:子博弈精炼纳什均衡(SPNE):

12第十二章贝叶斯纳什均衡及其精炼

第十二章贝叶斯纳什均衡及其精炼 前两章讨论的是完全信息条件下的博弈,给出了博弈的基本分析框架。 本章将讨论不完全信息下的博弈行为,包括不完全信息静态博弈和不完全信息动态博弈。 12.1不完全信息博弈与贝叶斯纳什均衡 一、不完全信息博弈 完全信息博弈指博弈中的参与人对所有其他参与人的支付(偏好)函数有完全的了解,并且支付函数是所有参与人的共同知识(common knowledge)的博弈。 反之,不满足完全信息博弈假设的博弈称为不完全信息博弈。 二、海萨尼(Harsanyi)转换 在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。 至于“类型”概念,以两个企业博弈的例子说明。 假设参与人1为在位者企业,参与人2为进入者企业。

进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则不进。但是进入者不知道在位者的成本是高还是低。 因此,进入者必须预测在位者的成本“类型”,究竟是高成本的还是低成本的。 海萨尼提出通过引入“自然”概念解决这个问题。 即由自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。 在本例中,通过自然选择在位者的成本类型,进入者再针对高成本或低成本进行是否进入的博弈决策。 应当指出,通过自然选择类型的划分,不仅是针对支付函数而言的,其包括参与人所拥有的所有个人信息,如战略空间和信息集等等。 通过上述分析可知道,不完全信息意味着,至少有一个参与人拥有多种类型,否则就成为完全信息博弈。 用表示参与人的一个特定类型,表示参i θi i Θ与人所有可能类型的集合,,并假定 i i i Θ∈θ取自某个客观的分布函数。 n i i 1}{=θ),,(1n P θθL

相关主题
文本预览
相关文档 最新文档