博弈论知识点总结完整版

格式：doc
大小：44.00 KB
文档页数：6

下载文档原格式

/ 6

《博弈论》知识点总结

《博弈论》知识点总结博弈论作为一门交叉学科，涵盖了数学、经济学、政治学、心理学等多个学科领域。

其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。

博弈论的应用领域也非常广泛，包括经济学、政治学、社会学、管理学等。

博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。

博弈论的主要内容包括：1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。

在博弈中，每个参与者都要做出一个选择，其结果受到其他参与者的选择的影响。

博弈的结果取决于所有参与者的选择。

2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。

参与者是进行决策的主体，策略是参与者可以选择的行为方式，结果是参与者选择策略后所得到的收益或损失。

3.博弈的分类根据参与者的利益关系和决策方式，博弈可以分为零和博弈和非零和博弈。

零和博弈指参与者的利益完全相反，一方获利即意味着另一方损失，而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。

4.博弈的解博弈的解是指在博弈参与者做出决策选择之后，通过某种机制确定最终的结果。

常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。

5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。

在经济学中，博弈论可以用来解释市场行为、预测价格变动等。

在政治学中，博弈论可以用来分析政治决策、议事程序等。

在社会学中，博弈论可以用来解释群体行为、合作问题等。

博弈论是一门具有重要理论意义和广泛应用价值的学科，它不仅可以帮助人们更好地理解决策制定的规律和机制，还可以为人们提供更科学的决策指导。

在日常生活中，我们可以通过学习和应用博弈论的知识，更加理性地做出决策，并更好地理解他人的选择和行为。

希望未来博弈论能够继续在各个领域发挥作用，为人类社会的进步和发展做出更大的贡献。

博弈论知识简要

寻找混合策略纳什均衡的思路
• 令各博弈方随机选择纯策略的概率分布，满足使其他博弈方采用不同策略的期望得益相同，从而计算出各个博弈方随机选择各纯策略的概率。
• 在猜硬币博弈中，设盖硬币方出正面的概率为p，出反面的概率为1-p。则猜硬币方猜正面的期望得益为p·1+（1-p）·(-1)=2p-1，猜反面的期望得益是p·(-1)+(1-p) ·1=1-2p,令二者相等，得p=1/2。盖硬币方的混合策略是以（1/2,1/2）的概率随机选择正面和反面。类似的，可以计算出猜硬币方的混合策略。
S
i

1,2,...
表示 Si 中的某个特定策略。在静态博弈中，Si 中包含
的所有
S
i
就是第
i 个参与人的所有可选择的行动；ui
是第 i 个参与人的得益函数，它是所有参与人选择的
某个特定策略组合的函数，即
ui
ui
S1
,...,
S
i
,...,
S
n
。
•例两寡头的产量博弈中，参与人就分别是编号为1和2的两个企业；其各自的策略选择就是选择各自的产量；其各自的策略空间就是其各自所能够生产的各种产量的集合。如果假设两个企业，都能够生产大于0的任何数量的产量，那
下选择什么行动的预先安排； • 行动：参与人在博弈过程中轮到自己选择时所作的某个具体决策； • 得益：参与人从博弈中获得的效用，一般是所有参与人的策略
或行动的函数，这是每个参与人最关心的东西；
• 信息：参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识；
• 均衡：所有参与人的最优策略或行动的组合；
精炼贝叶斯均衡泽尔腾等

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支，研究决策制度下的相互作用和决策策略。

它是通过数学模型来描述和分析不同参与者的决策行为和决策结果，并找到最优的决策策略。

下面是博弈论中的一些重要知识点的总结。

1.博弈的定义和基本概念：-博弈是指参与者在一定的规则下做出决策，并根据其他参与者的决策结果来确定自己的收益或损失。

-参与者称为博弈者，他们的决策称为策略，策略的组合称为策略组合。

-博弈可以是合作博弈或非合作博弈，合作博弈强调协作，非合作博弈强调竞争。

2.标准博弈：-标准博弈是博弈论中最基础的形式，参与者之间的策略和收益都是确定的。

-标准博弈可以是零和博弈（总收益为零）或非零和博弈（总收益不为零）。

3.纳什均衡：-纳什均衡是指在博弈中，不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。

-纳什均衡是博弈论中的核心概念，它描述了博弈中的稳定状态。

-一个博弈可能有一个或多个纳什均衡，也可能没有纳什均衡。

4.基本博弈：-二人零和博弈是一种特殊的博弈，其中一个参与者的利益是另一个参与者的损失。

-石头、剪刀、布是一个典型的二人零和博弈，存在一个纳什均衡策略。

-行棋游戏如国际象棋、围棋也是二人零和博弈，但策略空间较复杂。

5.博弈理论的扩展：-广义博弈是对博弈理论的扩展，考虑了更复杂的情况，如多人博弈、不完全信息博弈等。

-多人博弈是指博弈中有多个参与者，每个参与者都会影响其他参与者的决策。

-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。

6.博弈论在经济学中的应用：-博弈论在经济学中有广泛的应用，如市场竞争、拍卖等。

-例如，决定定价策略的厂商可以使用博弈论来确定最优的定价策略。

-拍卖是一种常见的博弈形式，在博弈过程中参与者可以选择不同的竞标策略。

7.演化博弈：-演化博弈是博弈论的一个重要分支，研究博弈在一定的演化过程中的演化规律。

-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。

博弈论总结(精选13篇)

博弈论总结第1篇最大化自己最坏情况下的收益。

着眼于自己的收益，保证自己收益，防止风险使得自己的收益变小。

以性别之战为例子：首先你得先得到一个关于妻子和丈夫的一个收益表 1.进行假设：妻子策略：P概率看韩剧、（1-P）概率看体育丈夫策略：Q概率看韩剧、（1-Q）概率看体育 xxx子期望收益（着眼于自己的期望收益）： Uw(q,p)=2PQ + 0×P(1-Q) + 0×Q(1-P) +1×(1-P)(1-Q) = 3PQ - P -Q +1 前面的系数参考收益表（妻子收益）3.妻子的最小收益可能为Q=0或Q=1（当丈夫选择Q=0时，意味着丈夫100%想看体育，妻子的收益可能为0；当Q=1时，丈夫100%想看韩剧，如果这时妻子想看体育，收益同样最小）这里只是在讨论妻子收益最小的可能性4.妻子的最坏收益为：minUw(p,q) = min(1-P,2P)5.最大化最坏收益： max(min(1-P,2P)）解的：P=1/3则妻子的maxmin策略为：1/3概率选择韩剧，2/3概率选择体育。

同理得丈夫的maxmin策略为：1/3概率选择体育，2/3概率选择韩剧。

minmax策略 1.最小化对手最好情况下的收益。

是着眼于对手的收益。

还是这样的一个收益表 1.进行假设：妻子策略：P概率看韩剧、（1-P）概率看体育丈夫策略：Q概率看韩剧、（1-Q）概率看体育2.丈夫期望收益（着眼于对方的期望收益）：（与maxmin不同要注意！！）Uw(q,p)=PQ + 0×P(1-Q) + 0×Q(1-P) +2×(1-P)(1-Q) = 3PQ - 2P -2Q +2前面的系数参考收益表（丈夫收益）3.妻子的最小收益可能为Q=0或Q=1（当丈夫选择Q=0时，意味着丈夫100%想看体育，如果这时妻子也想看体育，丈夫收益到2；当Q=1时，丈夫100%想看韩剧，如果这时妻子想看韩剧，收益同最大1）这里只是在讨论妻子收益最小的可能性xxx夫的最大收益为：maxUw(p,q) = max(2-2P,P) 5.最小化最好收益： min(max(1-P,2P)）妻子的minmax策略：2/3概率选择韩剧，1/3概率选择体育同里丈夫为的minmax为…在零和博弈中，maxmin策略和minmax策略是等价的。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时，通过考虑对方的行动和可能的结果来进行决策的一门学科。

它主要关注对策略的选择与分析，以及对方可能的反应。

下面我们来对博弈论的知识点进行总结归纳。

1.普通博弈和扩展博弈：博弈论分为两类，即普通博弈和扩展博弈。

普通博弈是指参与者在同一时间同时做出决策的博弈，扩展博弈是指参与者在不同的时间节点上做出决策的博弈。

2.博弈的组成要素：博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。

博弈论的目标是通过合理的策略选择来实现最优的支付和效用。

3.纳什均衡：纳什均衡是博弈论中一个重要的概念，指的是当每个参与者都选择了最优的策略后，没有人会改变自己的策略来获得更好的支付。

纳什均衡是博弈的稳定状态。

4.博弈的分类：根据参与者的合作与否，博弈可以分为合作博弈和非合作博弈。

合作博弈中，参与者可以通过合作与其他参与者达成协议，而非合作博弈中，参与者彼此之间没有合作关系。

5.零和博弈和非零和博弈：零和博弈是指所有参与者的支付之和为零的博弈，即一方获利就意味着其他方会损失相应的支付。

非零和博弈是指所有参与者的支付之和不为零的博弈，即所有参与者都有可能获得一定的支付。

6.博弈的解析方法：解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。

解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。

7.博弈的策略选择：博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。

策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。

8.博弈的应用领域：博弈论的应用十分广泛，包括经济学、政治学、生物学、社会学等多个领域。

在经济学中，博弈论被用来研究市场竞争、价格形成等问题，在政治学中，博弈论被用来分析政治决策与合作等问题。

9.孤立型博弈和重复博弈：孤立型博弈是指只进行一轮博弈的情况，参与者只能根据当下的情况来做出决策。

重复博弈是指进行多轮博弈的情况，参与者可以根据之前的决策和结果来进行策略的调整。

完整版)博弈论知识点总结

完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。

该学科的研究假设包括：1）决策主体是理性的，会尽可能地最大化自己的收益；2）完全理性是共同知识；3）每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。

博弈中涉及到的变量包括：参与人、行动、战略和信息。

完全信息指每个参与人都了解其他参与人的支付函数，而完美信息则指在博弈过程中，每个参与人都能观察和记忆之前的行动选择。

不完全信息则表示参与人没有完全掌握其他参与人的信息，存在不确定性因素。

博弈与传统决策的区别在于，博弈是决策主体之间的相互作用，需要考虑其他决策者的选择和效用函数。

博弈的表示形式包括战略式博弈和扩展式博弈，其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题，而扩展式博弈则更适用于描述动态博弈问题。

与战略式博弈不同，扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析，而不是仅关注博弈结果的描述。

扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。

战略式博弈是一种静态模型，而扩展式博弈是一种动态模型。

博弈论可以分为合作博弈和非合作博弈，其中合作博强调团体理性、团体最优决策和效率，而非合作博弈强调个人理性和个人最优决策。

根据参与人行动先后顺序的不同，博弈可以分为静态博弈和动态博弈，后者包括先行动者获得先行动者行动信息的情况。

根据参与人对信息的掌握程度，博弈可以分为完全信息和不完全信息博弈。

根据决策主体对信息的掌握程度和行动的先后顺序，博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。

不同类型的博弈有不同的均衡类型和求解方法，顺序的不同也会影响均衡结果。

Hotelling价格竞争模型是一种重要的扩展式博弈，用于描述两个企业在同一市场上的价格竞争。

相对应。

占有均衡是指在博弈中存在一组参与人的战略选择，使得每个参与人都无法通过改变自己的战略来提高自己的支付。

博弈论前四章笔记整理

博弈论前四章笔记整理第一章：博弈论基础概念。

- 博弈的定义与要素。

- 博弈是指在一定的规则下，多个参与者（至少两个）进行策略选择并得到相应结果（收益）的过程。

- 要素包括参与者（局中人）、策略（每个参与者可选择的行动方案）、收益（每个参与者在不同策略组合下的所得）。

例如在“囚徒困境”中，两个囚犯是参与者，坦白或不坦白是他们的策略，不同策略组合下的刑期长短就是收益。

- 博弈的分类。

- 按参与者数量可分为两人博弈和多人博弈。

- 按策略空间是否有限分为有限博弈和无限博弈。

如猜硬币是有限博弈（正面或反面两种策略），企业的产量竞争（产量可在一定范围内连续取值）可能是无限博弈。

- 按收益情况分为零和博弈（一方的收益就是另一方的损失，总和为零，如赌博）、常和博弈（收益总和为常数）和非零和博弈（收益总和不为零，如企业合作共同开拓市场，双方都可能获利）。

第二章：完全信息静态博弈。

- 策略式表述（标准式表述）- 通常用一个矩阵来表示，行代表一个参与者的策略，列代表另一个参与者的策略，矩阵中的元素是对应的收益组合。

以“性别战”为例，丈夫和妻子选择看电影或看球赛，就可以构建一个2×2的收益矩阵。

- 占优策略均衡。

- 占优策略是指无论其他参与者选择什么策略，该策略都是某个参与者的最优策略。

如果每个参与者都有占优策略，那么由这些占优策略组成的策略组合就是占优策略均衡。

例如在“囚徒困境”中，每个囚徒的占优策略都是坦白，所以（坦白，坦白）是占优策略均衡。

- 纳什均衡。

- 纳什均衡是指在一个策略组合中，每个参与者的策略都是对其他参与者策略的最优反应。

即给定其他参与者的策略，没有参与者有动机单方面改变自己的策略。

与占优策略均衡不同，纳什均衡并不要求每个参与者都有占优策略。

例如在“性别战”中，（看电影，看电影）和（看球赛，看球赛）都是纳什均衡。

第三章：完全信息动态博弈。

- 扩展式表述。

- 包括博弈树的构建，节点表示参与者的决策点，树枝表示可选择的策略，终端节点表示博弈的结果并标有相应的收益。

《资源环境经济学》博弈论基本知识

一、博弈论基本知识（从游戏到博弈）1、概念博弈论，译自英文“Game Theory”，Game的基本意义是游戏，因此，直译为“游戏理论”。

说起游戏，人们一般都会想到小朋友玩的躲猫猫、比大小、石头剪刀布、围棋等棋类游戏、扑克游戏等，以及田径、球类等各种体育比赛。

但实际上，博弈论研究的主要不是这些真正的游戏，而是与这些游戏有共同本质特征的决策或者说是策略问题。

其实，上述很多游戏都有一个共同的特点，那就是策略，或者说，策略在其中有举足轻重的作用，一些因素（如运气、身体素质等）既定以后，策略选择的好坏是左右这些游戏结果的关键因素，而有些游戏，如棋类比赛等，策略选择的好坏更是决定游戏结果的唯一因素。

因此，游戏中真正值得研究的是其中的策略问题。

2、游戏的共同的基本特征进一步分析还可以发现，许多游戏都有下列特征：（1）都有一定的规则：规定游戏的参加者（可以是个人，也可以是队组），可以做什么，不可以做什么，应该按怎样的次序做，什么时候结束游戏、一旦参加者犯规将受什么样的处罚等等。

（2）都有一个结果：如一方赢一方输、平局或参加者各有所得等，而且结果能用正或负的数值表示，或能按一定的规则折算成数值。

（3）策略至关重要：游戏者不同的策略选择常会带来不同的游戏结果。

（4）策略和利益有相互依存性：即每一个游戏者所得结果的好坏，不仅取决于自身策略的选择，而且取决于其他参加者的策略选择。

有时一个差的策略选择也许会带来并不差的结果，原因是其他游戏者选择了更差的策略。

因此，在有策略依存性的游戏中，策略本身常常并没有决定的好坏之分，只有相对于他方策略的相对好坏。

——策略较量3、博弈的四要素博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。

（1）博弈的参加者（players）:博弈中究竟有哪几个独立决策、独立承担结果的个人或组织。

产业经济学-博弈论-知识点总结

1.名词解释严格劣策略：在一个博弈中，不管其他博弈方的策略如何变化，一个博弈方的某种策略给他带来的收益，总是比另一种策略给他带来的收益要小，那么我们称前一种策略为相对后一种策略的严格劣策略。

纳什均衡：在一个博弈策略组合里，每个局中人的策略选择，都是对于对手的策略选择的最优策略选择，或者是对于其他博弈参与人的策略选择的组合的最佳策略选择。

反应函数：在无限策略的古诺模型中，博弈放的策略有无限种，因此各个博弈方的最佳策略也有无限种，他们之间往往构成一种连续函数的关系2.简答博弈四要素：1.参与者：博弈论中的决策主体，是这个博弈的参与人或者局中人。

即谁参与了这个博弈，2.博弈规则：对博弈如何进行做出的规则，也即可供参与人选择的行动或者策略。

3.：结果：博弈最后出现的情形，也即这个博弈最终产生的对博弈参与者的各种结果 4.收益：参与者对最后结果的偏好，也就是所有参与人在这个博弈结束后的结果对其所产生的最终利益得失。

倒推法定义：就是从序贯决策博弈的末端开始分析，沿着博弈树逐步倒推回前一个阶段相应局中人的行为选择，一直到决策节点为止的这样一种分析方法。

步骤：从序贯博弈的最后一个决策阶段开始分析，每一次确定出分析阶段局中人的行动选择和路径，然后确定前一阶段决策的局中人的行动选择和路径。

倒推到某个阶段，则这个阶段及随后阶段的博弈结果就可以确定下来了，该阶段的决策节点就可以等同于一个末端节点。

到了这个时候，我们甚至可以用不再包括该阶段以及随后所有阶段博弈的等价博弈，来代替原来的博弈，这个等价的博弈树在这里已经只是一个（新的）末端节点优缺点：倒推法事实上就是把各阶段序贯博弈分解为一次一次的单人博弈，通过对一系列单人博弈的分析，确定局中人在各自决策点上选择，最终对序贯博弈的结果，包括博弈的路径和各个局中人博弈得益作出判断。

通过归纳各个局中人各阶段的选择，我们就可以找出局中人在整个序贯博弈中的策略，他建立在后续阶段各个局中人理性选择的基础上，因而很自然的就排除掉了包含不可置信威胁和承诺的可能性，因而他得到的结论比较可靠，并且因此确定下来的各个局中人的策略组合有较好的稳定性。

3博弈论知识要点

博弈论与信息经济学
一、完全信息静态博弈
博弈矩阵：
1、占优博弈均衡唯一解表28.1
2、多解图（性别战）表28.2
3、无解图（发接球）表28.3
4、无效率解表28.4
5、重复博弈28.5（有限与无限次重复博弈、针锋相对）、
6、合作博弈的协调29.3
（表29.5保证博弈、表29.3性别战、表29.6斗鸡博弈、表29.4囚徒困境）
二、完全信息动态博弈
扩展式博弈树28.7：
反向归纳法表28.5，图28.1
关键是理解“威胁”是否可信，
三、反应曲线29.1
四、混合策略解29.2（性别大战）与竞争博弈29.4（接发球博弈）
五、共存博弈29.5与例子：承诺博弈29.6，青蛙-蝎子；绑匪；智
猪博弈；储蓄与社保；敲竹杠；
六、讨价还价29。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论（一）：基本知识1.1定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。

即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。

1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。

1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。

倘若不能，则称非合作博弈（Non-cooperative game）。

合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。

把两个角度结合就得到了4种博弈：a、完全信息静态博弈，纳什均衡，Nash(1950)b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965）c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968）d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975）Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式：策略式表述(Strategic form), 扩展式表述（Extensive form）1.6占优均衡：a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。

对于所有的s-i， si*称为参与人i的严格占优战略，如果满足：ui(si*,s-i)>ui(si',s-i)∀ s-i, ∀ si' ≠si*b、占优均衡：一个博弈的某个策略组合中，如果对应的所有策略都是各参与人的占优策略，则称该策略组合为该博弈的一个占优均衡。

1.7重复剔除严劣策略均衡：a、“严劣”和“弱劣”的含义：设 s i’和s i’’是参与人i可选择的两个策略，若对其他参与人的任意策略组合s-i, 均成立u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。

上面式子中，若将“<”改为“≤”，则说策略s i’弱劣于策略s i’’。

b、定义：重复剔除严格策略就是各参与人在其各自策略集中，不断剔除严劣策略…如果最终各参与人仅剩下一个策略，则该策略组合就被称为重复剔除严劣策略均衡。

（二）：纳什均衡（Nash Equilibrium）2.1纳什均衡定义：对于一个策略式表述的博弈G= {N,S i, u i, i∈N}，称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡，如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i的最优策略（经济理性策略），即：u i(s i*, s-i*) ≥ u i(s i, s-i*), 对于任意的s i∈S i ,任意的i∈N均成立。

通俗定义：纳什均衡是一种策略组合，给定对手的策略，每个参与人选择自己的最优策略。

纳什均衡是一种稳定的策略组合：当所有参与人的选择公开以后，每个人都满意自己作出了正确的选择；没有人能得到更好的结果了。

在博弈论中这种结果被称为纳什均衡（NE）。

2.2定理：Nash在1950年证明：任何有限博弈，都至少存在一个NE——Existence of Nash Equilibrium。

即在一个有n个参与人的策略式博弈G={S1,…,Sn; u1,…,un}中，如果n 是有限的，且Si是有限集（i=1,…,n），则该博弈至少存在一个纳什均衡（在混合策略意义下）Wilson（1971）证明，几乎所有有限博弈，都存在有限奇数个NE，包括纯策略NE 和混合策略NE。

——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡，但反过来不一定成立；定理b 纳什均衡一定不能通过重复剔除严劣策略方法剔除。

2.4划线法先找出自己针对其他博弈方每种策略或策略组合（对多人博弈）的最佳对策，即自己的可选策略中与其他博弈方的策略或策略组合配合，给自己带来最大得益的策略（这种相对最佳策略总是存在的，不过不一定唯一），然后在此基础上，通过对其他博弈方策略选择的判断，包括对其他博弈方对自己策略判断的判断等，预测博弈的可能结果和确定自己的最优策略。

这就是划线法。

2.5箭头法箭头法对于理解博弈关系很有好处,是寻找相对稳定性策略组合的分析方法。

对博弈中的每个策略组合进行分析，考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益。

如能，则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组。

最后综合对每个策略组合的分析情况，形成对博弈结果的判断。

划线法和箭头法的结果是一致的，可以相互替代。

（三）：混合策略（Mixed Strategies）纳什均衡3.1定义：混合策略的定义：在博弈G={N, Si, ui, i∈N}中，假设参与人i的纯策略构成的策略集合为Si={si1,…, sik}，若参与人i以概率分布pi=(pi1,…, pik) 在其k个可选策略中随机选择“策略”，称这样的选择方式为混合策略。

这里，0≤pij ≤1,对于j=1 ,…, k都成立，且有, pi1+…+ pik=1。

纯策略可看成特殊的混合策略。

上述定义是在有限博弈前提下进行的。

3.2混合策略意义下策略组合的表述{x1∈X1, …, xn∈Xn}，其中Xi , i =1, …, n表示参与人i所有纯策略生成的概率空间，xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{（1/2, 1/2）,(1/2, 1/2)}3.3VNM效用函数（V on Neumann and Morgenstern冯·诺依曼和摩根斯坦）如果某个随机变量X以概率Pi取值xi，i=1,2,…,n，而某人在确定地得到xi时的效用为u(xi)，那么，该随机变量给他的效用便是：U(X) = P1u(x1) + P2u(x2) + ... + P n u(xn) 表示关于随机变量X的期望效用。

因此U(X)称为期望效用函数，又叫做冯·诺依曼——摩根斯坦效用函数（VNM函数）。

3.4基于混合策略意义下的博弈策略式表述定义：基于(v-N-M效用的)策略式博弈由a、参与人集合b、每个参与人有一个（纯）策略集合c、对于每一个参与人来说，由所有参与人纯策略组合构成的风险结果空间，存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义：对于博弈G= {N, Si, ui, i∈N}，基于v-N-M效用的混合策略组合α*是一个纳什均衡，若对于每一个i, 以及i的任意一个混合策略αi，α*对应的期望支付至少和(αi，α*-i )的期望支付一样大换句话说，称混合策略组合α*是一个纳什均衡，如果没有一个参与人通过偏离策略α*i 实现支付的增加3.6一个定理对于N-人静态博弈问题，设混合策略纳什均衡对应的策略组合为(Xi , X –i ) 。

对于任意的i ,若最优混合策略为Xi= {x1,…,xl，0…0}(不失一般性，假设前l个分量严格大于0)，记分量xk (k=1,…, l) 对应的纯策略sk,则对于参与人i而言，sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值,等于纳什均衡混合策略组合(Xi,X –i )的收益值。

即ui (sk, X –i ) = ui (Xi, X –i )成立，k=1,…, l3.7方法：a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡（四）：多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是：在多个纳什均衡中，若存在一个纳什均衡，其支付结果针对每个参与人而言都严格优于其它纳什均衡，则该纳什均衡是帕雷托占优纳什均衡。

4.2风险占优均衡(risk-dominant equilibrium)参与人对风险占优均衡的选择倾向，有一种强化的机制。

当部分或所有参与人选择风险占优均衡的可能性增强的时候，任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小，而这又使得帕雷托占优均衡策略的支付更小，从而形成一种选择风险占优均衡策略的正反馈机制，并使其出现的概率越来越大。

当参与人数目增加时，选择合作的风险将会更大，可借助该点考虑招标机制如何减少投标方勾结问题。

上述问题是我们知道建立诚信机制社会的重要意义。

上述问题引出一个博弈相关分支为协调博弈(coordination game)4.3聚点均衡由实际问题抽象出来的博弈模型中，更多的一类问题是：多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系，如夫妻爱好问题的两个纯策略均衡。

这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例，在实际中往往二人很默契地知道如何进行博弈，双方往往知道怎么进行选择策略，且能够相互了解（这里面排除了互相协商后达成的一致）实际博弈中参与人往往会利用博弈模型以外的信息，实现对特定博弈均衡一致关注的“聚点”这些信息如：参与人共同的文化背景或规范，共同的知识，具有特定意义事物的特征，某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性，但因为涉及因素太多，对于一般博弈模型很难总结普遍规律，只能具体问题具体分析聚点：人们通常会协调彼此的行为。

（你弱他就强）；先例产生的影响远大于逻辑或者法律效力；人们总是乐于安守现状或接受自然形成的界线（三八线）4.4相关均衡(correlated equilibrium)实际上，在现实中遇到选择困难时，特别是在长期中反复遇到相似选择难题时，常会通过收集更多信息，形成特定的机制和规则，为某种形式的制度安排等主动寻找思路。

相关均衡就是这样的一种均衡选择机制。

对于实际中比较复杂的博弈问题，参与人是否有能力设计这种机制，并且有足够能力理解、信任这种机制，是有一定疑问的。

博弈论知识点总结完整版

合集下载

《博弈论》知识点总结

博弈论知识简要

博弈论知识点总结完整版

博弈论总结(精选13篇)

《博弈论》知识点总结归纳

完整版)博弈论知识点总结

博弈论前四章笔记整理

《资源环境经济学》博弈论基本知识

产业经济学-博弈论-知识点总结

3博弈论知识要点

文档推荐

最新文档