博弈论_贝叶斯博弈与贝叶斯Nash均衡
- 格式:ppt
- 大小:1.05 MB
- 文档页数:160
博弈论中的纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。
其研究成果见于题为《非合作博弈》(1950)的博士论文。
该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。
纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。
该解概念后来被称为纳什均衡。
定义:纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。
这一结果对局中人B亦是如此。
纳什均衡的经典范例就是囚徒博弈,但是研究博弈论常常会使人陷入一种只追求个人利益的误区,事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设,并不总能说明事实。
只是假定他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。
也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。
没有人会主动改变自己的策略以便使自己获得更大利益。
“囚徒的两难选择”有着广泛而深刻的意义。
个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
一:子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。
子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。
即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。
子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。
为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。
譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a 子博弈和图3.6b子博弈。
在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。
这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。
而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。
这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。
定义3.1:子博弈精炼纳什均衡(SPNE):扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。
如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
不完全信息的市场进入博弈参与人:企业1,企业2行动空间:企业1选择建厂或不建厂,企业2 选择进入或不进入行动顺序和信息结构:自然先以概率对(p,1 p)选择企业1 的成本类型(高,低),企业1 观察到自然的选择而企业2 不能观察到自然的选择;然后企业1 和企业2 同时采取其可选的行动。
赢利状况:如下表对于例子的不完全信息博弈,将不完全信息博弈转化为标准形式贝叶斯博弈。
这一方法是Harsanyi(1967-1968)创造的。
企业1选择DB, 企业2选择IN,构成贝叶斯纳什均衡;意思是,企业1当高成本类型时,选择“不建厂”,而当低成本类型时企业1选择“建厂”,企业2选择“进入”与企业1展开竞争。
贝叶斯纳什均衡的结果为:(2.3,0.4),即双方获得的均衡利润。
不完全信息动态博弈(贝叶斯博弈)我们将介绍另一种新的均衡概念——完美贝叶斯均衡,就有了四个均衡概念:完全信息静态博弈中的纳什均衡、完全信息动态博弈中的子博弈完美纳什均衡、不完全信息静态博弈中的贝叶斯纳什均衡以及不完全信息动态博弈中的完美贝叶斯均衡。
表面上看好像对所研究的每一类型的博弈都发明出了一种新的均衡概念,但事实上这些概念是密切相关的。
随我们研究的博弈逐步复杂,我们对均衡概念也逐渐强化,从而可以排除复杂博弈中不合理或没有意义的均衡,而如果我们运用适用于简单博弈的均衡概念就无法区分。
在每一种情况下,较强的均衡概念只在应用于复杂的博弈时才不同于较弱的均衡概念,而对简单的博弈并没有区别。
引入完美贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡,这和子博弈完美纳什均衡强化了纳什均衡是相同的。
正如我们在完全信息动态博弈中加上了子博弈完美的条件,是因为纳什均衡无法包含威胁和承诺都应是可信的这一思想;我们在对非完全信息动态博弈的分析中将集中于完美贝叶斯均衡,是因为贝叶斯纳什均衡也存在同样的不足。
回顾前面讲过的,如果参与者的策略要成为一个子博弈完美纳什均衡,则它们不仅必须是整个博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。
博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石,对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。
本文首先将博弈划分为不同的类型,并对主要的均衡概念进行了数学描述,最后对不同的均衡概念进行了比较。
【关键词】博弈论;纳什均衡;重复博弈博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。
但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。
在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。
因此,本文将主要的博弈均衡概念进行分类和表述,并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。
一、博弈的主要类型博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。
依据不同的分类标准,博弈可以被划分为不同的类型。
1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。
动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。
Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。
重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。
2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。
子博弈精炼纳什均衡+贝叶斯法则+信号博弈一:子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。
子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。
即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。
子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。
为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。
譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a子博弈和图3.6b子博弈。
在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。
这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。
而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。
这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。
定义3.1:子博弈精炼纳什均衡(SPNE):扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。
贝叶斯博弈模型1. 引言贝叶斯博弈模型是一种重要的博弈模型之一,它可以用于解决多方参与的决策问题。
本文将先介绍贝叶斯博弈的基本概念和数学公式,然后利用一个具体案例来说明贝叶斯博弈的应用。
2. 贝叶斯博弈的基本概念贝叶斯博弈是一类博弈模型,其中参与者的信息不完全。
与传统的博弈模型不同,贝叶斯博弈模型中参与者的决策被视为一个随机变量,而不是唯一确定的策略。
参与者在制定决策时,需要考虑其他参与者的信息和策略。
在贝叶斯博弈中,参与者的信息受到随机变量的影响。
这些随机变量可能来自于环境、其他参与者的行为或其他因素。
每个参与者都有一个先验信念,即他们在未观察到其他参与者的策略和收益时的信念。
参与者在不断观察和收集信息的同时更新自己的信念,从而制定更为准确的策略。
贝叶斯博弈模型的核心是博弈的贝叶斯纳什均衡。
贝叶斯纳什均衡是一组随机策略,其中每个参与者的策略都是最优的,即使其他参与者的策略是未知的。
换句话说,贝叶斯纳什均衡是参与者在自己的信息不完全的情况下,最优策略的概率分布。
3. 贝叶斯博弈的数学公式在贝叶斯博弈中,每个参与者都有一个随机变量Ai表示他的私有信息。
公共信息O也是一个随机变量,表示所有参与者都知道的信息。
参与者对于公共信息的信念被表示为对O的后验分布P(O|A1,…,An)。
参与者的策略S是一个函数,它映射Ai和O到应该采取的行动。
贝叶斯博弈的收益函数表示参与者的收益是他的策略和其他参与者的策略的函数。
每个参与者都希望最大化自己的期望收益。
因此,每个参与者的目标是找到使他的后验预期收益最大化的策略。
假设有N个参与者,第i个参与者的策略为Si(Ai,O),则贝叶斯纳什均衡定义为每个参与者的策略Si(Ai,O)都使得其他参与者的策略Si-1(A1,O) ~ Si-1(Ai-1,O)的条件下他的收益最大化。
换句话说,对于所有i∈{1,2,…,N},Si(Ai,O)都是贝叶斯纳什均衡当且仅当:E[S1(A1,O)|A1]≥E[S1(A1’,O)|A1] (1)······E[SN(AN,O)|AN]≥E[SN(AN’,O)|AN] (2)式(1)和式(2)表示每个参与者的策略都是其他参与者的策略的反应。
不完全信息静态博弈:贝叶斯纳什均衡海萨尼1、前两篇⽂章讲的博弈都包含⼀个基本假设,即所有参与⼈都知道博弈的结构、规则、⽀付函数,因⽽称为完全信息博弈。
然⽽现实中,参与者并不了解其他参与者的⼀些信息,即不完全信息博弈(games of incomplete information)。
2、当对⼿有多种情况时,⽐如市场博弈的例⼦,在位者成本函数可能有需求⾼、需求中、需求低三种情况,那么可以采取“海萨尼转换”,即引⼊⼀个虚拟的参与⼈“⾃然”,⾃然⾸先⾏动,选择参与⼈的类型,被选择的参与⼈知道⾃⼰的真实类型,其他参与⼈并不清楚这个参与⼈的真实类型,但知道各种可能类型的概率分布。
如下图所⽰:3、这种情况下,可以通过海萨尼转换(Harsanyi transformation)把不完全信息博弈转换成完全但不完美信息博弈(complete but inprefer information)。
“不完美信息”指“⾃然”作出了选择,但其他参与⼈并不知道它的具体选择是什么,仅知道各种选择的概率分布。
4、在静态不完全信息博弈中,参与⼈同时⾏动,每个参与⼈的最优战略依赖于⾃⼰的类型,他不可能准确的知道其他参与⼈实际上会做出什么选择,但他能正确的预测其他参与⼈的选择是如何依赖于各⾃的类型的。
决策的⽬标就是在给定⾃⼰的类型和别⼈的类型依从战略的情况下,最⼤化⾃⼰的期望效⽤。
海萨尼定义了“贝叶斯纳什均衡”,给定⾃⼰的类型和别⼈类型的概率分布,每个参与⼈的期望效⽤达到了最⼤化,没有⼈有积极性选择其他战略。
5、举个例⼦,某⼀市场原来被A企业所垄断,现在B企业考虑是否进⼊。
B企业知道,A企业是否允许它进⼊,取决于A企业阻挠B企业进⼊所花费的成本。
如果阻挠的成本⾼,A企业的最优战略是默许B进⼊。
如果阻挠的成本低,A企业的最优战略是阻挠。
⽀付矩阵如下表所⽰:B企业并不知道A企业的阻挠成本是⾼还是低。
这⾥,某⼀参与⼈本⼈知道、其他参与⼈不知道的信息称为私⼈信息。
贝叶斯纳什均衡例题假设有两家企业摘要:1.贝叶斯纳什均衡的概述2.贝叶斯纳什均衡的例题:两家企业的博弈3.贝叶斯纳什均衡的应用范围正文:一、贝叶斯纳什均衡的概述贝叶斯纳什均衡(Bayesian Nash Equilibrium)是一种博弈论中的概念,指的是在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略。
在这种均衡状态下,每个参与者都认为自己的选择是最佳的,因为其他参与者也作出了相同的选择。
二、贝叶斯纳什均衡的例题:两家企业的博弈假设有两家企业A 和B,它们分别面临市场进入与否的决策。
企业A 可以选择进入或不进入市场,企业B 也可以选择进入或不进入市场。
两个企业的收益取决于它们各自的决策以及对方企业的决策。
如果企业A 进入市场,企业B 选择阻挠的概率为x,此时企业A 的收益为-10;如果企业A 进入市场,企业B 不阻挠的概率为1-x,此时企业A 的收益为40。
同样,如果企业B 进入市场,企业A 选择阻挠的收益为-10,企业B 不阻挠的收益为40。
在这个博弈过程中,企业A 和企业B 都希望最大化自己的收益。
因此,它们需要根据对方的决策来选择自己的最优策略。
在贝叶斯纳什均衡状态下,企业A 和企业B 都选择了能使自己收益最大化的策略,此时没有人有积极性选择其他策略。
三、贝叶斯纳什均衡的应用范围贝叶斯纳什均衡是一种理论分析工具,它可以帮助我们在不确定性条件下,预测和分析各个参与者的决策行为。
在实际应用中,贝叶斯纳什均衡可以用于解决许多经济、社会和政治领域的问题,例如价格博弈、专利竞争、国际贸易等。