博弈论的基本概念
- 格式:doc
- 大小:59.50 KB
- 文档页数:7
博弈论的定义1. 博弈论的基本概念博弈论,是现代数学的一个分支学科,研究在多人决策环境中人们的策略选择以及可能产生的结果。
从经济学、管理学、政治学、心理学等方面来分析和解决问题时,博弈论可以为人们提供决策的基础。
因此,博弈论不仅在学术上很有价值,在实践中也具有很高的应用价值。
2. 博弈论的应用范围博弈论的应用范围广泛,如军事策略、商业竞争、政治谈判、社会决策、环境决策等领域。
另外,也被广泛应用于运输、公共建设、医学治疗等社会实践活动中。
3. 博弈论的基本元素博弈论的基本元素是“参与者”、“策略”、“收益”和“信息”。
“参与者”是指在某一决策环境中的所有相关人员,如消费者、企业、政府或其他组织和个人等。
“策略”是参与者在决策过程中选择的行动方案,也是促进参与者在决策中优化收益的关键。
“收益”或“效用”是参与者最终得到的结果,通常在博弈论中用数字来表示,这些数字可以是财务收入、数字权益等。
“信息”也是参与者在决策中极为重要的因素。
它可以分为完全信息和不完全信息两种,完全信息是指参与者对决策过程中的所有信息都有充分了解,而不完全信息是指参与者对决策过程中的某些信息存在不确定性。
因此,在不完全信息博弈中,有时决策者需要采取一些策略来“模糊化”自己的策略,以避免让其他人知道他们实际上所做的决策。
4. 博弈论的经典模型- 零和博弈零和博弈是博弈论的基本模型之一,是指参与者的利益总和为零。
在这种情况下,一个人赢得的收益等于另一个人失去的收益,如象棋、扑克等所有参与者的输赢情况总是相互抵消的。
- 非零和博弈非零和博弈是一种参与者的利益总和不为零的博弈。
在这种情况下,一方的收益可以与另一方的收益同时增加,如合作博弈中的合作关系。
- 合作博弈合作博弈是指参与者可以在决策中合作以实现双方或多方的利益最大化。
在此类博弈中,参与者通常需要通过协商和合作达成共识。
- 非合作博弈非合作博弈是指参与者在决策中只考虑自己的利益。
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
博弈论无名氏定理引言:博弈论是研究决策制定和行为选择的数学模型,并在许多领域发挥重要作用。
在博弈论中,无名氏定理是一项非常重要的结论,它对于理解玩家之间的互动和找到最佳策略提供了指导。
本文将就博弈论无名氏定理展开详细阐述。
一、博弈论基本概念博弈论研究决策者在决策制定中的相互影响,主要分为以下几个基本概念:1.玩家:参与博弈的个体或群体,每位玩家需根据自身利益作出决策。
2.策略:玩家在博弈中可采取的行动方案。
每位玩家需从多个策略中选择一个。
3.收益:玩家基于自己的策略和其他玩家的策略,所获得的结果。
4.纳什均衡:指在博弈中各个玩家选择了最佳策略,无法通过单方面改变策略来获得更好结果。
二、无名氏定理的内容无名氏定理由约翰·纳什于1950年提出,它在博弈论中具有重要意义。
该定理的内容可以概括为:在任意有限次博弈中,至少存在一个纳什均衡。
也就是说,在博弈中,无论玩家有多少,无论策略有多复杂,至少会有一个纳什均衡点。
这意味着无论其他玩家选择什么策略,玩家都无法通过单方面改变自己的策略来获得更好的结果。
三、无名氏定理的证明无名氏定理的证明过程比较复杂,需要运用到博弈论中的一些数学理论和方法。
在证明过程中,通常会利用到反证法、最优响应函数、偏微分方程等工具。
具体证明过程如下:1.反证法:首先假设不存在纳什均衡点,即每个玩家都能通过改变自己的策略来获得更好结果。
2.最优响应函数:然后,分别对每个玩家的每种策略进行最优响应函数的计算,即找到玩家最好的策略选项。
3.偏微分方程:最后,通过偏微分方程等工具推导,得出存在纳什均衡的结论,从而证明无名氏定理。
四、无名氏定理的应用无名氏定理在经济学、政治学、生物学等多个领域有广泛的应用。
它可以帮助人们理解玩家之间的互动关系,揭示各种冲突与合作的策略选择。
无名氏定理的应用举例:1.在市场竞争中,企业可以利用无名氏定理来确定最佳的定价策略,以获取最大利润。
2.在国际关系中,国家之间的冲突和合作可以通过博弈论无名氏定理来研究和解析。
博弈论讲的是什么
博弈论是研究决策制定者之间相互关系的一门数学分支,主要关注在冲突和合作的情境下,个体或群体的最佳决策和策略选择问题。
博弈论的研究对象可以包括个体、团体、国家、公司等各种决策制定者。
以下是博弈论的一些核心概念和主要内容:
1.博弈的定义:博弈是指多方参与者在特定环境下做出决策,彼此之间的决策会相互影响。
每个参与者的目标是通过制定最佳策略来最大化其利益。
2.参与者:博弈论中的参与者被称为“玩家”,可以是个体、群体、国家等。
每个玩家都有自己的目标和利益,但他们的决策会影响其他玩家的结果。
3.策略:策略是玩家在博弈中可选的行动或决策。
博弈论研究玩家如何选择最优策略以最大化他们的利益。
4.支付:支付是指每个玩家根据博弈的结果获得的收益或损失。
博弈论分析玩家如何在不同策略下分配支付,以及如何最大化其期望收益。
5.博弈的分类:博弈可以分为零和博弈和非零和博弈。
零和博弈中,一个玩家的利益损失就是其他玩家的利益增益,总和为零。
非零和博弈中,各玩家的利益不一定互相抵消,可以共赢或共输。
6.博弈的解:博弈论研究如何找到博弈中的均衡点或解决方案。
最著名的解决概念之一是纳什均衡,它描述了一种情况,在该情况下,每个玩家的策略是对方玩家策略的最佳响应。
7.博弈的应用:博弈论在经济学、政治学、生物学、计算机科学
等领域有广泛的应用。
例如,在商业谈判、拍卖、国际关系、网络安全等方面,博弈论都可以提供洞察和指导。
总体而言,博弈论通过数学建模和分析,帮助我们理解在决策制定者之间互动的情境中,各方如何做出最佳的决策以达到其个体或集体的目标。
《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。
本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。
关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。
博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。
本文将对博弈论的相关知识进行详细的总结和归纳。
一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。
博弈的基本要素包括:参与者、策略、收益和信息。
1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。
参与者的目标是实现自身利益的最大化。
1.3 策略策略是指参与者在博弈中所能采取的行动或选择。
通常分为纯策略和混合策略。
1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。
收益可以用来衡量参与者的利益大小。
1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。
信息可以分为对称信息和非对称信息。
二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。
常见的均衡概念有纳什均衡、帕累托最优和博弈解。
2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。
2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。
帕累托最优是一种资源分配的有效方式。
2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。
博弈解往往是均衡的特殊情况。
三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。
博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
在博弈论中,通常包括以下基本概念:
局中人:在一场竞赛或博弈中,具有决策权的参与者被称为“局中人”。
在一个博弈中,每个局中人都要做出选择。
行动:局中人在博弈中的每一个决策或选择被称为“行动”。
信息:局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。
策略:局中人基于可获得的信息,制定的决策方案或规则称为“策略”。
收益:局中人在博弈中的得失或输赢称为“收益”。
均衡:当所有局中人都认为自己的策略选择最优,并且其他局中人也认为该策略选择是最优时,这种状态被称为“均衡”。
结果:在一场博弈结束后,所有局中人的收益总和被称为“结果”。
博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。
其中,局中人、策略和收益是最基本要素。
发展过程方面,博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论知识点总结博弈论是一门研究决策与策略的数学理论,主要涉及博弈参与者之间的冲突、竞争和合作,并通过数学模型和方法来分析博弈参与者的最佳决策和最优策略。
下面是博弈论的一些基本概念和重要知识点的总结。
1. 标准形博弈(Normal Form Game):标准形博弈是博弈论中最常见的形式,参与者同时选择策略,并根据选择产生相应的收益或损失。
标准形博弈由参与者的策略集合、收益函数和参与者的收益组成。
2. 纳什均衡(Nash Equilibrium):纳什均衡是指在一个博弈中,参与者选择的策略组合使得没有任何一个参与者单方面改变自己的策略能够获得更高的收益。
纳什均衡是博弈论的核心概念,用来描述博弈中的稳定状态。
3. 零和博弈(Zero-sum Game):零和博弈是指当其中一个参与者获得了收益,另一个参与者就会产生相应的损失,总收益为零。
在零和博弈中,参与者之间的利益完全相反,他们的决策是对立的。
4. 混合策略(Mixed Strategy):混合策略是指在博弈中,参与者以一定概率选择不同的纯策略。
混合策略在博弈论中用来描述参与者的随机决策,可以通过计算期望收益来确定最优混合策略。
5. 博弈树(Game Tree):博弈树是用来表示博弈过程的树状结构,每个节点代表一个博弈的状态,边代表参与者的策略选择。
博弈树可以用来推导纳什均衡策略和分析博弈过程。
6. 合作博弈(Cooperative Game):合作博弈是指参与者之间可以合作达到更好的结果的博弈形式。
在合作博弈中,参与者通过互相合作,在利益最大化和成本最小化之间进行协商和决策。
7. 非合作博弈(Non-cooperative Game):非合作博弈是指参与者之间独立地做决策,不进行合作和协商的博弈形式。
在非合作博弈中,参与者根据自身利益进行策略选择,涉及策略选择和对手的预测。
8. 进化博弈(Evolutionary Game):进化博弈是将生物进化的概念引入博弈论中的一种模型。
博弈论的基本概念1.博弈论:博弈论,又称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论的定义可以这样理解:博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自可选择的行为或策略中进行选择并加以实施,并从中取得相应收益的过程。
2.参与人:参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。
3、行动:行动是参与人在博弈的某个时点的决策变量。
一般来讲,把第i个参与人的一个行动为ai,其可供i选择的行动集合表示为Action set: Ai ={ai}。
在一个n人博弈中,n个参与人的行动的有序集为a={a1,…,an},称为行动组合。
根据行动顺序,可以把博弈分为静态博弈、动态博弈。
静态博弈:一般来讲,如果行动时同时发生的或相当于同时发生的,则称之为静态博弈。
动态博弈:如果行动的发生有先后顺序,则称之为动态博弈。
4.信息:信息指的是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。
信息集是指参与人在特定时刻所拥有的有关变量的值的知识。
例如:囚徒困境甲不知乙的选择,则甲的信息集为{坦白或者抵赖}乙已经行动,甲观察到乙的选择,则甲的信息集为{坦白}或者是{抵赖}。
5.战略:战略是参与人在给定信息集的情况下的行动规则,是参与人完整的一套行动计划,它规定参与人在什么时候选择什么行动。
战略不同于行动,它是行动的规则,对于战略的表述应该是完备的。
例如:人不犯我,我不犯人;人若犯我,我必犯人”例如:田忌赛马,田忌所选的赛马计划就是一套完整的行动计划,也就是一个战略。
6.战略空间:参与者可以选择的战略的全体组成了战略空间。
田忌赛马,六种行动方案可供选择:上中下,上下中,中上下,中下上,下上中,下中上。
这些可选择的战略的全体组成了战略空间。
任何一人战略的改变都将使结果也随之改变。
7、收益:支付、报酬,指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。
经济博弈大赛知识点总结一、博弈论基本概念1.博弈论的定义博弈论是研究决策者之间相互影响的一种数学分析方法。
在该理论中,参与者的每一种决策都会影响到其他参与者的收益,因此需要在多方利益中进行权衡和选择。
2.博弈论的基本概念(1)参与者:指参与决策的一方或多方。
(2)策略:指参与者的行动选择。
(3)效用:指参与者从某种行动选择中得到的收益。
(4)收益矩阵:指博弈过程中不同参与者在不同策略组合下得到的收益组合。
3.博弈论的基本分类(1)合作与非合作博弈:合作博弈是指参与者之间可以进行合作协商,共同选择最优策略;非合作博弈是指参与者之间没有合作协商,各自选择最优策略。
(2)零和博弈与非零和博弈:零和博弈是指参与者的利益总和为零,一方得利即另一方受损;非零和博弈是指参与者的利益总和不为零,可以互惠互利或共同受益。
二、博弈论的基本模型1.纳什均衡纳什均衡是指在博弈论中,参与者的策略选择达到一种平衡状态,任何一个参与者都没有动机改变自己的策略。
纳什均衡是博弈理论的核心概念,对于非合作博弈中的理性参与者来说,最终会达到纳什均衡状态。
2.囚徒困境囚徒困境是博弈论中的一个经典模型,描述了两名囚犯被捕后面临的选择。
在这种情况下,即使两名囚犯都采取自己最佳的策略,他们最终都会面临到一种不利的结果。
这个模型的实质是说明了在自利最大化的前提下,最终可能导致共同损失的结果。
3.拍卖博弈拍卖博弈是指卖家和买家之间进行的策略与竞争。
在这种场景下,卖家需要选择出售物品的方式,而买家需要决定出价的高低。
这种博弈的结构包括英国拍卖、封闭式拍卖、荷兰拍卖等不同的竞争方式。
4.博弈树博弈树是一种博弈模型的图形表示方式,以树状的形式展现参与者的策略选择和结果。
博弈树有助于分析博弈的决策过程和可能的结果,帮助参与者制定最优策略。
5.拉力博弈拉力博弈是指在博弈中的一种竞争形式,即参与者面对的是关于资源的竞争和纷争。
这种博弈模型常见于市场竞争和企业之间的竞争,对于提高市场份额和竞争力有重要意义。
✧16日培训内容:《博弈论》✧主讲:夏大慰,博士生导师,上海国家会计学院首任院长。
✧听课总结一、博弈论基本概念及其精髓1.博弈:是一种策略的相互依存状况,你的选择将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。
2.零和博弈:博弈当中参与者的利益严格对立,一个人所得永远等于另一个所失。
如麻将、扑克、橄榄球。
3.混合策略博弈:参与人通过模糊自己的策略动机迷惑对手的博弈。
4.优势策略:一个使参与者领先其对手的策略,无论这些对手采用什么策略,结局都是一样。
针对的是你的其他策略,而不是你的对手的策略。
5.博弈论的精髓在于基于系统思维基础上的理性换位思考,即在选择你的行动时考虑你的得益,但是你应当用他人的得益去推测他人的行动,从而选择最有利于自己的行动。
二、游戏中洞察博弈1.三个火枪手。
甲命中率30%,乙80%,丙100%,每人一次开枪机会,若甲乙丙分别轮流开枪,每人应首先向谁开枪。
2.100元纸币拍卖。
规则:除最终报价者对价获得纸币外,次高价者判定为输家。
3.在1-100之间选择数据。
一个团队成员在1-100之间任意选择一个数,规则:以每个人所选择数的三分之二汇总计算平均数,谁最接近团队平均数就获胜。
三、纳什均衡1.在给定其他参与者策略情况下,没有一个参与者能通过单方面改变自己的策略而使自己的得益提高,从而没有人有积极性打破这种均衡。
2.我所做的是:给定你所做的,我所做的是最好的;你所做的是:给定我所做的,你所做的是最好的。
3.智猪博弈。
猪圈中有一头大猪一头小猪,猪圈一端有个按钮,每按一下猪圈另一端食槽中会有10个单位猪食进槽,但按一下会耗去相当于2单位猪食的成本。
如果大猪先到食槽,大猪吃到9单位食物,小猪只能吃到1单位;如小猪先到,小猪吃4单位而大猪吃6单位;如果同时按并同时到食槽,则大猪吃7单位而小猪吃3单位食物。
4.结果:大猪按,小猪等待。
5.结论:处于强势的参与者为维护自己利益采取某种决策时,为其他弱势参与者提供了搭便车的机会。
博弈论的基本概念
•博弈论是研究两人或多人谋略和决策的理论。
•博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著.博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系.纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的的学科.
•参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。
参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。
参与者可以是自然人,也可以是团体。
•信息:信息是指参与者在博弈过程中能了解和观察到的知识。
信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。
完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。
•策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。
通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。
如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。
•收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。
通常用u i表示参与
者i的收益,它是策略组合的函数。
•均衡:均衡是所有参与者的最优策略组合,记为s*。
几个经典的博弈实例
•例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。
除非至少一人认罪,否则警方无充分证据将他们按最论刑。
警方把他们隔离审讯,并对他们说明不同行动所带来的后果.如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月.
• 例二 海滩占位 甲、乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格,相
同的质量向均匀散布在海滩上的众多游客销售冷饮.既然是做生意,目的总是多赚钱,甲乙两人有时在同一地点做同样的生意,竞争是难免的,这两个摊贩应该怎样安排自己的摊位,才能相安无事的做自己的生意?(假定游客总是到据自己最近的摊位购买冷饮)。
• 例三 智猪争食 猪圈里有一头打猪和一头小猪。
里面有一个猪食槽,槽的对面装有控制
开关。
只要去拱开关,就会有一次6个单位的饲料流进槽里。
如果它们都不去拱开关,那么它们都吃不到饲料;如果小猪去拱,那么等到它跑回来时,大猪已把饲料吃光了;如果大猪去拱,等它回来时可以吃到1个单位的饲料;如果他们一起去拱,在一起跑回来,那么大猪可以抢到4个单位的饲料,小猪也能吃到2个单位的饲料.假定每拱一次开关需要消耗0.5个单位的饲料能量。
它们长期一起进食,上面所说的情况两只猪都知道.它们应该如何选择?
-1,-1
-9,0 0,-9 -6,
-6
坦白 沉默
坦白 沉默
囚徒一
拱 不拱
小
猪
完全信息静态博弈
• 静态博弈:静态博弈指的是博弈的参与者同时选择各自的行动,即便是选择行动有先后的
话,后行动者也不知道先行动者所采取的行动。
• 博弈的标准表述(策略表述)含有三个要素(1)博弈参与者集合i Î N ;(2)每个参与者
的策略空间S i ;(3)每个参与者的收益函数ui 。
• 定义:在一个有n 个参与者的博弈中,参与者的策略空间S 1,S 2,…,S n ,收益函数为u 1,
u 2,…,u n ,称G={S 1,S 2,…,S n ;u 1,u 2,…,u n }为此博弈的一个标准表述。
• 定义:如果对任一s i ’ Î S i ,s i ' ¹ s i *, 不等式u i (s 1,…,s i —1, s i *, s i+1,…,s n )>
u i (s 1,…,s i —1, s i ’ ,s i+1,…,s n )对所有的策略组合(s 1,…,s i —1, s i+1,…,s n )都成立,那么 si*称为参与者i 的严格占优策略。
• 定义:在博弈的标准表述中,如果对所有的参与者i ÎN, s i * 是i 的严格占优策略,那
么策略组合s *=(s 1*, …,s n *)称为严格占优策略均衡.
• 定义:在标准表述的博弈中,设s i ’和s i ’'是参与者i 的两个可选策略,若u i (s 1,…,
s i —1, s i ’,s i+1,…,s n )<u i (s 1,…,s i —1, s i ’’,s i+1,…,s n )对所有的策略组合(s 1,…,s i-1, s i+1,…,s n )都成立,那么称s i ’是相对于s i ’’的严格劣策略.
• 定义:如果s*=(s 1*, …,s n *)是逐步剔除严格劣策略剩下的唯一策略组合,则该策
略称为逐步剔除严格劣策略均衡。
左 中 右
参与者
2
• 定义:在博弈G={S 1,S 2,…,S n ;u 1,u 2,…,u n },策略s*= (s 1*,…,s i-1*, s i *,s i+1*,…,
s n *)满足条件:对每一个参与者i,都有对所有的s i Î S i , u i (s 1*,…,s i —1*,
s i ,s i+1*,…,s n *) £ u i (s 1*,…,s i-1*, s i *,s i+1*,…,s n *) 成立, 则称s *为该博弈的一个纳什均衡.
• 严格占优策略均衡、逐步剔除严格劣策略均衡与纳什均衡的关系:严格占优策略均衡是纳
什均衡;逐步剔除严格劣策略均衡是纳什均衡;反之不然.
完全信息动态博弈
• 动态博弈:各参与者的行动有先后顺序,而且后行动者在自己行动之前能观测到先行动者
的行动。
• 定义:完全信息扩展式博弈形式是一个三元组F=(N,H ,P ):其中N 是参与者的集合。
H 是
A (行动的集合)中元素组成的序列的集合并且满足:(1)空序列()ÎH ;(2)如果一个h ÎH ,则h|k ÎH , h|k 表示h 的长度为k 的子序列;(3)如果一个无穷序列的所有有穷子序列都属于H ,那么h 也属于H 。
P :H/Z ➞ N ,其中Z ÍH 且h ÎZ 当且仅当任给h ’ ÎH ,若h'|k =h 则h ’ =h 。
• 对于n 个参与者有限战略的扩展式表述有一种直观的图形方法,就是博弈树.
• 设ui :Z ➞R , F=(N ,H ,P )扩展式博弈形式,我们称G=(F ,( u i )i
Î N
)为一个扩展式博弈.
2,4
2,3
1,4
1,1 0,2 4,0 1,2 4,1 3,3 上 中 左
中
右
参与者1
下 在上面的这个博弈中既不存在严格占优策略均衡,也不存在逐步剔除严。