《博弈论原理模型与教程》第06章扩展式博弈第01节.
- 格式:doc
- 大小:580.01 KB
- 文档页数:13
博弈模型解决方案
《博弈模型解决方案》
博弈模型是一种用于分析决策制定和竞争情景的数学工具。
在许多领域,例如经济学、政治学和生物学中,博弈模型都被广泛应用。
通过建立数学模型来描述各方的利益和策略选择,博弈模型可以帮助决策者做出最佳的决策。
博弈模型解决方案是一种利用博弈论原理来解决实际问题的方法。
在博弈模型中,各方的利益和对策都会被建模,并且通过计算和分析来找到最优的策略。
这种方法可以应用到很多领域,例如竞争策略、投资决策和资源分配等问题中。
在博弈模型解决方案中,常用的方法包括纳什均衡、博弈树和博弈矩阵等。
纳什均衡是指在博弈中各方选择的策略是最优的,并且在互相了解对方策略的情况下不会改变。
博弈树是一种图形化工具,用于描述博弈过程和各方的决策路径。
博弈矩阵则用来清晰地展示各种情景下各方的策略选择和最终结果。
通过这些方法,博弈模型解决方案可以帮助人们更清晰地分析和理解各种竞争和决策情景。
通过对各方利益和策略的深入分析,我们可以更好地做出决策,最大化自己的利益并且减少风险。
因此,博弈模型解决方案是一种重要的工具,可以帮助我们更好地应对各种决策和竞争情景。
《博弈论:原理、模型与教程》第00章绪论0.5 博弈问题的解(已精细订正!)博弈论研究的目的(或核心)就是寻找博弈问题的解,即给定一个博弈问题,分析或预测什么样的博弈结果将会出现。
对于一个博弈问题,参与人间的交互作用到底会导致什么样的结果出现呢?或者说什么样的博弈结果才是博弈问题的解呢?探寻博弈问题的解,必须明确:博弈分析是博弈问题的结构和参与人完全理性为共同知识的假设下进行的,而在该假设下人们(或博弈专家)对博弈问题的求解,就等于完全理性的参与人对博弈问题的求解。
因此,可以采用内省式思维分析博弈问题的解。
假设某个参与人在博弈考试之前对博弈的结果进行分析,并且预测到结果A将会出现而采取与只相对应的行动。
现在的问题是:参与人的这种预测是否一定就是博弈的真正结果?或者说参与人的预测在什么情况下才是正确的?我们知道,博弈论是交互决策的理论,博弈中某个结果的出现是所有参与人共同选择的结果。
因此,上述参与人所预测到的结果A要成为博弈的结果,就必须所有的参与人都采取与之相对的行动。
也就是说,当所有参与人都在对博弈结果进行预测时,只有所有参与人的都预测到结果A将会出现,那么这个结果才有可能成为博弈的结果。
此时,参与人的预测才是正确的;反之,如果参与人有不同的预测,那么参与人的预测就可能不正确。
例如,在一个两人博弈,参与人1预测到结果A将会出现而采取与A相对应的行动,但参与人2预测到结果B将会出现而采取与结果B相对应的行动,那么博弈真正出现的结果可能既不是结果A(因为参与人2没有采取与结果A相对应的行动),也不是结果B(因为参与人没有采取与结果B对应的行动)。
因此,可以将博弈问题的解定义为:所有参与人都预测到博弈结果,即参与人的一致性预测。
需要注意的是,这种一致性的预测不仅仅是所有的参与人都预测到某个结果会出现,而且是所有参与人都预测到某个结果会出现,而且是所有参与人都预测到所有参与人预测到某个结果会出现,等等。
博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
参见:行为生态学(behavioral ecology)。
约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
《博弈论:原理、模型与教程》第二部分完全信息动态博弈第6章扩展式博弈(已精细订正!)对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。
前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。
但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。
本章将介绍一种新的博弈问题描述方式—扩展式博弈。
从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。
在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。
6.1 扩展式博弈(文字描述、博弈树描述)所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。
与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。
一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题:(1)每个参与人在什么时候行动(决策、选择);(2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。
[注:行文中频繁出现的“行动”一词,有两义:其一,动词的“行动”,指选择、决策。
其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。
]上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。
对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。
定义6 – 1 扩展式博弈包括以下要素:(1)参与人集合{1,2,...,}n Γ=; (2)参与人的行动顺序,即每个参与人在何时行动;(3)每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案及他所了解的信息(集);(4)参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。
7.3扩展式博弈扩展式博弈定义7.13扩展式博弈一个扩展式博弈Γ由下列要素组成由下列要素组成::1、 有限的有限的参与人集合参与人集合N ;2、 行动集A ,它包括所有可能的行动它包括所有可能的行动,,不必是有限的不必是有限的3、 结或者或者历史的集合历史的集合X .(1) 初始结X ∈0x ,或空的历史或空的历史。
博弈从初始结开始开始。
(2) 对于一些有限多的行动A a i ∈,每个}{\0x x X ∈采取的形式为),...,,(21k a a a x =,这里a 1,a 2…表示第一步表示第一步、、第二步第二步。
的行动的行动。
(3) 如果对于一些K>1,K>1, }{\),...,,(021x X a a a k ∈,那么那么,,}{\),...,,(0121x X a a a k ∈−一个结或一段历史只是对在博弈中迄今已被采取的行动的一个完全的描述的行动的一个完全的描述。
}),({)(X a x A a x A ∈∈≡表示在历史}{\0x X x ∈之后轮到参与人行动时的该参与人可选择的行动集后轮到参与人行动时的该参与人可选择的行动集。
4、 一个行动集A x A ⊆)(0以及在A(x 0)上的一个概率分布π被用于描述博弈中自然的行被用于描述博弈中自然的行动动。
自然总是首先行动的首先行动的,,并且只行动一次并且只行动一次,,以概率π随机的在A(x 0)中选择一个行动。
因此,}{\),...,,(021x X a a a k ∈意味着对于i=1且只有i=1i=1,,)(0x A a i ∈。
5、 终点结集合A a X a x X x E ∈∉∈≡对于一切,),({},。
每个终点结描述了由开始至结束的博弈的一个特殊的完全演变特殊的完全演变。
6、 一个函数N x E X →}){(\:0U ι,表明在属于X 的每一个决策结上那个将轮到的采取行动的每一个决策结上那个将轮到的采取行动的参与参与人。
研究生《博弈论与信息经济学》第四讲 完全信息扩展式博弈:理论董志强 dongzhq@Spring,20061.什么是完全信息扩展式博弈?局中人的行动具有先后顺序。
完全信息:自然不首先行动,局中人的赢利是共同知识。
共同知识:令1K 2K 为参与人1和参与人2对状态集合Ω的知识函数。
一个事件E ⊆Ω是状态ω∈Ω中参与人1和2的共同知识(common knowledge between 1 and 2 in the state),如果ω是无穷序列121221(),(),(()),(()),K E K E K K E K K E ……中每个集合的一个元素。
通俗地说,如果存在这样一个状态,该状态下1和2都知道事件E ,并且1和2都知道“对方知道事件E ”,并且1和2都知道『对方知道“对方知道事件E ”』……如此循环,至于无穷。
那么,事件E 就可以说是这个状态下参与人1和2的共同知识。
完美信息:每个局中人在做决策时候都知道以前所发生的所有事件。
显然,若没有完全信息,就不可能有完美信息;但是反过来,若没有完美信息,则可能有或可能没有完全信息。
Definition :完美信息扩展博弈(extensive game with perfect information)有下列组成部分:• 一个参与人集合N ;• 一个序列集合H (有限或无限的)满足以下三个性质:空序列φ是H 的一个元素;如果1,,()k k K a H ∞=∈"(这里K 可以是无限的)且L K <,那么1,,()k k L a H ∞=∈";如果一个无限序列1,()k k a ="对每个正数L 满足1,,()k k L a H =∈",那么1,()k k a H =∈"。
H 的每个元素是一段历史(History );一段历史的每一组成部分都是一个参与人采取的行动。
如果k 是无限的,或者没有1K a +使1,,1()k k K a H ∞=+∈",那么历史1,,()k k K a H ∞=∈"就是终点(terminal )。
《博弈论:原理、模型与教程》第二部分完全信息动态博弈第6章扩展式博弈(已精细订正!)对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。
前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。
但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。
本章将介绍一种新的博弈问题描述方式—扩展式博弈。
从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。
在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。
6.1 扩展式博弈(文字描述、博弈树描述)所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。
与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。
一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题:(1)每个参与人在什么时候行动(决策、选择);(2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。
[注:行文中频繁出现的“行动”一词,有两义:其一,动词的“行动”,指选择、决策。
其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。
]上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。
对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。
定义6 – 1 扩展式博弈包括以下要素: (1)参与人集合{1,2,...,}n Γ=;(2)参与人的行动顺序,即每个参与人在何时行动;(3)每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案及他所了解的信息(集); (4)参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。
从上述定义可以看到:如果要用扩展式博弈对一个博弈问题进行建模(或者描述),那么除了要说明博弈问题所涉及的参与人及每位参与人的支付函数以外,还必须对博弈过程中参与人所遇到的决策问题的序列结构进行详细的解释,说清楚每个参与人在何时行动,以及参与人行动时可供选择的行动方案和所了解到的信息。
【例6-1】 考察一个“新产品开发博弈”。
试用扩展式博弈对两个企业都知道市场需求且企业同时决策的博弈情形,即完全信息静态的“新产品开发博弈”进行建模。
⎪⎪⎪⎩⎪⎪⎪⎨⎧⎩⎨⎧⎩⎨⎧⎩⎨⎧。
为):不投入资金,利润不开发(万元开发,赔企业万元不开发,获利润企业需求小元开发,获利润企业万元不开发,获利润企业需求大元资金投入)开发(企业040022002300280022000:1b a 图1-1 新产品开发的投入-产出图解:文字描述如下:根据定义6-1,完全信息静态的“新产品开发博弈”的扩展式博弈包括以下要素: (1)参与人是企业1和企业2;(2)两个企业同时行动,即同时选择产量;(3)每个企业行动时有两种选择—“开发”和“不开发”,并且每个企业行动时不知道对方的选择1; (4)两个企业的支付如图1-1所示。
1 注意,虽然此时每个企业都不知道对方的选择,但用扩展式博弈进行建模时仍然假设参与人都同时看到了图1-1所示的投入-产出图,即图1-1对两个企业来说为共同知识。
⎪⎪⎪⎩⎪⎪⎪⎨⎧⎩⎨⎧⎩⎨⎧⎩⎨⎧。
为):不投入资金,利润不开发(万元开发,赔企业万元不开发,获利润企业需求小元开发,获利润企业万元不开发,获利润企业需求大元资金投入)开发(企业040022002300280022000:1b a 图1-1 新产品开发的投入-产出图【例6-2】 继续考察“新产品开发博弈”。
试用扩展式博弈对两个企业都知道市场需求且企业1先决策,企业2观测到企业1的选择后再进行选择的博弈情形,即完全信息动态的“新产品开发博弈”进行建模。
解:文字描述如下:根据定义6-1,完全信息动态的“新产品开发博弈”的扩展式博弈包括以下要素: (1)参与人是企业1和企业2; (2)企业1先行动,企业2后行动;(3)企业1行动时有两种选择—“开发”和“不开发”,企业1行动时不知道企业2的行动;企业2行动时有两种选择—“开发”和“不开发”,但企业2行动时已经知道企业1的行动; (4)两个企业的支付仍然有如图1-1所示。
上述两个例子中,用文字描述的方法给出了博弈问题的扩展式描述。
对于一些简单的博弈问题,这种文字表述的方法也许是简单可行的。
但可以想象,如果遇到的是更为复杂的博弈问题,如参与人人数大于2,每个参与人可以多次行动且每次行动时可供选择的行动方案不同等,文字描述所给出的模型就会显得繁冗拖沓,极不直观,因此 需要寻找一种简便易行的扩展式博弈的描述方式。
下面就以“新产品开发博弈”为例,介绍一种不仅简单方便,而且十分直观的扩展式博弈的描述方式—博弈树。
所谓博弈树,就是由结和有向枝构成的“有向树”。
图6-1给出的是当市场需求为大时,完全信息动态的“新产品开发博弈”的博弈树。
在图6-1所示的博弈树中,最上端的一个点1x (用空心圆表示)表示博弈的开始,将“企业1”标示在点1x 上,表示博弈开始于企业1的选择。
企业1的选择有“开发”和“不开发”,分别用标有“开发”和“不开发”的有向枝表示。
若企业1选择“开发”,则博弈从点1x 达到2x (用实心圆表示);若企业1选择“不开发”,则博弈从点1x 达到点3x (用实心圆表示)。
点2x (或3x )上标有“企业2”,表示企业2在博弈到达点2x (或3x )时,即企业1选择“开发”(或“不开发”)后,再进行选择;企业2的行动也有“开发”和“不开发”,同样分别用标有“开发”和“不开发”的有向枝表示。
若企业2选择“开发”,则博弈从点2x (或3x )达到点4x (或6x )(都用实心圆表示);若企业2选择“不开发”,则博弈从点2x (或3x )达到点5x (或7x )(都用实心圆表示)。
由于企业2选择后博弈结束,因此点4x 、5x 、6x 和7x 都表示博弈的结束。
在点4x 、5x 、6x 和7x 旁标有支付向量,表示博弈达到该点时企业的所得。
其中,支付向量中的第一个数字表示企业1的所得,第二个数字表示企业2的所得1。
图6-1中,点1x 、2x 、3x 、4x 、5x 、6x 和7x 称为博弈树的结(node ),其中标有参与人(即企业)的结1x 、2x 和3x 称为决策结(decision node ),表示参与人在此选择行动;标有支付向量的结4x 、5x 、6x 和7x 表示博弈结束,称为终点结(terminal node )。
在决策结中,决策结1x 表示博弈的开始,亦称为博弈树的初始结或根(root )。
结与结的连线称为博弈树的枝(branch ),表示博弈从枝的一个结达到另一个结参与人需要选择的行动。
例如,博弈从决策结1x 达到2x ,需要企业1选择行动“开发”,所以在连接1x 和2x 的枝上标有行动“开发”。
在博弈树中,枝是有向的,表示博弈只能从枝的一个结达到另一个结。
例如,在连接1x 和3x 的枝上,标有行动“不开发”,表示当企业1选择“不开发”时,博弈从1x 达到3x ,因此连接1x 到3x 的枝的方向是从1x 指向3x 。
1 一般情形下,支付向量中数字的顺序与博弈树中参与人的行动顺序相对应。
通过以上介绍,再考察图6-1中的博弈树,可以得到这样的信息: (1)博弈中的参与人是企业1和企业2; (2)博弈中企业1先选择,企业2后选择;(3)企业1选择时有行动“开发”和“不开发”,企业2选择的行动有“开发”和“不开发”; (4)博弈中企业的支付。
也就是说,除了“企业2行动时是否观测到企业1的选择”这一点暂时无法从图6-1中知道以外,完全信息动态的“新产品开发博弈”的扩展式描述所需要的信息(或要素)都可以从图6-1中得到。
如果还能够直接从博弈树中知道“企业2行动时是否观测到企业1的选择”,那么给出博弈树,就意味着给出了完全信息动态的“新产品开发博弈”的扩展式描述。
下面探讨如何在博弈树中,将“企业2行动时是否观测到企业1的选择”这一信息表示出来。
在完全信息动态的“新产品开发博弈”中,企业2决策时企业1已经做出选择,此时企业2面临的决策情形无非只有以下两种: 第一种:企业2知道企业1的选择; 第二种:企业2不知道企业1的选择。
对于第一种情形,企业2知道企业1的选择,即知道企业1选择“开发”还是“不开发”,因此企业2知道博弈是从1x 到了2x 还是从1x 到了3x 。
这就意味着当轮到企业2决策时,他知道自己是在点2x 上还是在点3x 上。
对于第二种情形,企业2不知道企业1的选择,即不知道博弈是从1x 到了2x 还是从1x 到了3x 。
因此,当轮到企业2决策时,他不知道自己是在点2x 上还是在点3x 上。
所以,“企业2行动时是否观测到企业1的选择”这一问题,实际上就等价于“企业2行动时是否知道自己是在博弈树中的点2x 上还是在点3x 上”。
为了将“企业2行动时是否知道自己是在博弈树中的点2x 上还是在点3x 上”这一点说清楚,需要引入“信息集”(information set )的概念。
在博弈树中,参与人i 的一个信息集(用i I 表示)是参与人i 决策结的一个集合,它满足以下条件: (1)i I 中的每个决策结都是参与人i 的决策结;(2)当博弈到达信息集i I (即博弈到达i I 中某个决策结)时,参与人i 知道自己是在信息集i I 中的决策结上,但不知道自己究竟在i I 中哪个决策结上。
因此,参与人i 的信息集i I 可以用来描述当轮到参与人i 行动时他所了解到的信息,即他知道什么(知道自己位于哪一个信息集上)、不知道什么(不知道自己位于信息集中哪一个决策结上)。
例如,在“新产品开发博弈”中,假设企业1先行动,企业2后行动,但企业2行动时不知道企业1的行动,那么在如图6-1所示的博弈中当企业2行动时就只知道博弈要么到达点2x ,要么到达点3x ,但具体在哪一点上,企业2不清楚。
也就是说,企业2只知道自己位于决策结集合23{,}x x 上,但不知道位于23{,}x x 中哪一个决策结上。
在这种情况下,23{,}x x 就是企业2的一个信息集。
如果假设企业2行动时知道企业1的行动,那么在如图6-1所示的博弈中,当企业2行动时就知道博弈是到达了点2x ,还是到达了点3x 。