博弈论的基本概念
- 格式:doc
- 大小:82.00 KB
- 文档页数:7
博弈论的定义1. 博弈论的基本概念博弈论,是现代数学的一个分支学科,研究在多人决策环境中人们的策略选择以及可能产生的结果。
从经济学、管理学、政治学、心理学等方面来分析和解决问题时,博弈论可以为人们提供决策的基础。
因此,博弈论不仅在学术上很有价值,在实践中也具有很高的应用价值。
2. 博弈论的应用范围博弈论的应用范围广泛,如军事策略、商业竞争、政治谈判、社会决策、环境决策等领域。
另外,也被广泛应用于运输、公共建设、医学治疗等社会实践活动中。
3. 博弈论的基本元素博弈论的基本元素是“参与者”、“策略”、“收益”和“信息”。
“参与者”是指在某一决策环境中的所有相关人员,如消费者、企业、政府或其他组织和个人等。
“策略”是参与者在决策过程中选择的行动方案,也是促进参与者在决策中优化收益的关键。
“收益”或“效用”是参与者最终得到的结果,通常在博弈论中用数字来表示,这些数字可以是财务收入、数字权益等。
“信息”也是参与者在决策中极为重要的因素。
它可以分为完全信息和不完全信息两种,完全信息是指参与者对决策过程中的所有信息都有充分了解,而不完全信息是指参与者对决策过程中的某些信息存在不确定性。
因此,在不完全信息博弈中,有时决策者需要采取一些策略来“模糊化”自己的策略,以避免让其他人知道他们实际上所做的决策。
4. 博弈论的经典模型- 零和博弈零和博弈是博弈论的基本模型之一,是指参与者的利益总和为零。
在这种情况下,一个人赢得的收益等于另一个人失去的收益,如象棋、扑克等所有参与者的输赢情况总是相互抵消的。
- 非零和博弈非零和博弈是一种参与者的利益总和不为零的博弈。
在这种情况下,一方的收益可以与另一方的收益同时增加,如合作博弈中的合作关系。
- 合作博弈合作博弈是指参与者可以在决策中合作以实现双方或多方的利益最大化。
在此类博弈中,参与者通常需要通过协商和合作达成共识。
- 非合作博弈非合作博弈是指参与者在决策中只考虑自己的利益。
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。
本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。
关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。
博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。
本文将对博弈论的相关知识进行详细的总结和归纳。
一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。
博弈的基本要素包括:参与者、策略、收益和信息。
1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。
参与者的目标是实现自身利益的最大化。
1.3 策略策略是指参与者在博弈中所能采取的行动或选择。
通常分为纯策略和混合策略。
1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。
收益可以用来衡量参与者的利益大小。
1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。
信息可以分为对称信息和非对称信息。
二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。
常见的均衡概念有纳什均衡、帕累托最优和博弈解。
2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。
2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。
帕累托最优是一种资源分配的有效方式。
2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。
博弈解往往是均衡的特殊情况。
三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。
博弈论的基本概念•博弈论是研究两人或多人谋略和决策的理论。
•博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著.博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系.纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的的学科.•参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。
参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。
参与者可以是自然人,也可以是团体。
•信息:信息是指参与者在博弈过程中能了解和观察到的知识。
信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。
完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。
•策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。
通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。
如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。
•收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。
通常用u i表示参与者i的收益,它是策略组合的函数。
•均衡:均衡是所有参与者的最优策略组合,记为s*。
博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
在博弈论中,通常包括以下基本概念:
局中人:在一场竞赛或博弈中,具有决策权的参与者被称为“局中人”。
在一个博弈中,每个局中人都要做出选择。
行动:局中人在博弈中的每一个决策或选择被称为“行动”。
信息:局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。
策略:局中人基于可获得的信息,制定的决策方案或规则称为“策略”。
收益:局中人在博弈中的得失或输赢称为“收益”。
均衡:当所有局中人都认为自己的策略选择最优,并且其他局中人也认为该策略选择是最优时,这种状态被称为“均衡”。
结果:在一场博弈结束后,所有局中人的收益总和被称为“结果”。
博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。
其中,局中人、策略和收益是最基本要素。
发展过程方面,博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论的基本概念1.博弈论:博弈论,又称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论的定义可以这样理解:博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自可选择的行为或策略中进行选择并加以实施,并从中取得相应收益的过程。
2.参与人:参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。
3、行动:行动是参与人在博弈的某个时点的决策变量。
一般来讲,把第i个参与人的一个行动为ai,其可供i选择的行动集合表示为Action set: Ai ={ai}。
在一个n人博弈中,n个参与人的行动的有序集为a={a1,…,an},称为行动组合。
根据行动顺序,可以把博弈分为静态博弈、动态博弈。
静态博弈:一般来讲,如果行动时同时发生的或相当于同时发生的,则称之为静态博弈。
动态博弈:如果行动的发生有先后顺序,则称之为动态博弈。
4.信息:信息指的是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。
信息集是指参与人在特定时刻所拥有的有关变量的值的知识。
例如:囚徒困境甲不知乙的选择,则甲的信息集为{坦白或者抵赖}乙已经行动,甲观察到乙的选择,则甲的信息集为{坦白}或者是{抵赖}。
5.战略:战略是参与人在给定信息集的情况下的行动规则,是参与人完整的一套行动计划,它规定参与人在什么时候选择什么行动。
战略不同于行动,它是行动的规则,对于战略的表述应该是完备的。
例如:人不犯我,我不犯人;人若犯我,我必犯人”例如:田忌赛马,田忌所选的赛马计划就是一套完整的行动计划,也就是一个战略。
6.战略空间:参与者可以选择的战略的全体组成了战略空间。
田忌赛马,六种行动方案可供选择:上中下,上下中,中上下,中下上,下上中,下中上。
这些可选择的战略的全体组成了战略空间。
任何一人战略的改变都将使结果也随之改变。
7、收益:支付、报酬,指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。
经济博弈大赛知识点总结一、博弈论基本概念1.博弈论的定义博弈论是研究决策者之间相互影响的一种数学分析方法。
在该理论中,参与者的每一种决策都会影响到其他参与者的收益,因此需要在多方利益中进行权衡和选择。
2.博弈论的基本概念(1)参与者:指参与决策的一方或多方。
(2)策略:指参与者的行动选择。
(3)效用:指参与者从某种行动选择中得到的收益。
(4)收益矩阵:指博弈过程中不同参与者在不同策略组合下得到的收益组合。
3.博弈论的基本分类(1)合作与非合作博弈:合作博弈是指参与者之间可以进行合作协商,共同选择最优策略;非合作博弈是指参与者之间没有合作协商,各自选择最优策略。
(2)零和博弈与非零和博弈:零和博弈是指参与者的利益总和为零,一方得利即另一方受损;非零和博弈是指参与者的利益总和不为零,可以互惠互利或共同受益。
二、博弈论的基本模型1.纳什均衡纳什均衡是指在博弈论中,参与者的策略选择达到一种平衡状态,任何一个参与者都没有动机改变自己的策略。
纳什均衡是博弈理论的核心概念,对于非合作博弈中的理性参与者来说,最终会达到纳什均衡状态。
2.囚徒困境囚徒困境是博弈论中的一个经典模型,描述了两名囚犯被捕后面临的选择。
在这种情况下,即使两名囚犯都采取自己最佳的策略,他们最终都会面临到一种不利的结果。
这个模型的实质是说明了在自利最大化的前提下,最终可能导致共同损失的结果。
3.拍卖博弈拍卖博弈是指卖家和买家之间进行的策略与竞争。
在这种场景下,卖家需要选择出售物品的方式,而买家需要决定出价的高低。
这种博弈的结构包括英国拍卖、封闭式拍卖、荷兰拍卖等不同的竞争方式。
4.博弈树博弈树是一种博弈模型的图形表示方式,以树状的形式展现参与者的策略选择和结果。
博弈树有助于分析博弈的决策过程和可能的结果,帮助参与者制定最优策略。
5.拉力博弈拉力博弈是指在博弈中的一种竞争形式,即参与者面对的是关于资源的竞争和纷争。
这种博弈模型常见于市场竞争和企业之间的竞争,对于提高市场份额和竞争力有重要意义。
✧16日培训内容:《博弈论》✧主讲:夏大慰,博士生导师,上海国家会计学院首任院长。
✧听课总结一、博弈论基本概念及其精髓1.博弈:是一种策略的相互依存状况,你的选择将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。
2.零和博弈:博弈当中参与者的利益严格对立,一个人所得永远等于另一个所失。
如麻将、扑克、橄榄球。
3.混合策略博弈:参与人通过模糊自己的策略动机迷惑对手的博弈。
4.优势策略:一个使参与者领先其对手的策略,无论这些对手采用什么策略,结局都是一样。
针对的是你的其他策略,而不是你的对手的策略。
5.博弈论的精髓在于基于系统思维基础上的理性换位思考,即在选择你的行动时考虑你的得益,但是你应当用他人的得益去推测他人的行动,从而选择最有利于自己的行动。
二、游戏中洞察博弈1.三个火枪手。
甲命中率30%,乙80%,丙100%,每人一次开枪机会,若甲乙丙分别轮流开枪,每人应首先向谁开枪。
2.100元纸币拍卖。
规则:除最终报价者对价获得纸币外,次高价者判定为输家。
3.在1-100之间选择数据。
一个团队成员在1-100之间任意选择一个数,规则:以每个人所选择数的三分之二汇总计算平均数,谁最接近团队平均数就获胜。
三、纳什均衡1.在给定其他参与者策略情况下,没有一个参与者能通过单方面改变自己的策略而使自己的得益提高,从而没有人有积极性打破这种均衡。
2.我所做的是:给定你所做的,我所做的是最好的;你所做的是:给定我所做的,你所做的是最好的。
3.智猪博弈。
猪圈中有一头大猪一头小猪,猪圈一端有个按钮,每按一下猪圈另一端食槽中会有10个单位猪食进槽,但按一下会耗去相当于2单位猪食的成本。
如果大猪先到食槽,大猪吃到9单位食物,小猪只能吃到1单位;如小猪先到,小猪吃4单位而大猪吃6单位;如果同时按并同时到食槽,则大猪吃7单位而小猪吃3单位食物。
4.结果:大猪按,小猪等待。
5.结论:处于强势的参与者为维护自己利益采取某种决策时,为其他弱势参与者提供了搭便车的机会。
博弈论基础 mobi博弈论是数学中的一个重要分支,它研究的是在冲突和合作的情况下,利益相关的个体做出的决策及其结果。
在现实生活中,博弈论也被广泛应用于经济学、管理学、政治学等领域。
本文将从随机选择的8个方面出发,对博弈论的基础内容进行详细阐述。
1. 博弈论的起源与发展博弈论最早可以追溯到19世纪中叶,由数学家纳什引入并发展起来。
随着时间的推移,越来越多的研究者开始关注博弈论,并提出了许多重要的理论和方法。
例如,米尔格拉姆和奥斯特罗姆提出了博弈论的博弈形式和博弈策略的概念,深刻影响了博弈论的研究方向。
2. 博弈论的基本概念博弈论的基本概念包括参与者、策略和收益。
参与者指的是参与博弈的各方,策略是参与者在决策中选择的行动方式,收益则指的是各方根据博弈的结果所获得的利益。
3. 博弈论的解决方法为了解决博弈论中的问题,研究者提出了许多解决方法,其中最著名的是纳什均衡。
纳什均衡指的是在一个博弈中,各个参与者选择的策略组合下,不存在任何参与者想要改变策略的动机。
4. 不完全信息博弈不完全信息博弈是博弈论中的一个重要概念,指的是参与者无法完全了解其他参与者的策略和偏好。
在不完全信息博弈中,参与者需要根据对方的行为和其他信息进行决策,这给博弈的结果带来了不确定性。
5. 合作博弈和非合作博弈根据参与者之间的互动方式,博弈论可以分为合作博弈和非合作博弈。
合作博弈中,参与者通过合作来达成共同的目标;非合作博弈中,参与者通过竞争和冲突来追求自己的利益。
6. 零和博弈和非零和博弈零和博弈和非零和博弈是博弈论中的两个重要概念。
零和博弈指的是各方的收益总和为零,一方的收益增加必然导致其他方的收益减少;非零和博弈指的是各方的收益总和不一定为零。
7. 博弈论在经济学中的应用博弈论在经济学中有着广泛的应用,例如市场竞争、拍卖、博弈论模型对经济政策的制定等方面。
博弈论的应用帮助经济学家更好地理解和预测市场行为,提供了决策支持和政策建议。
博弈论贝叶斯纳什均衡一、引言博弈论是研究决策者在相互影响中做出决策的科学。
贝叶斯纳什均衡是博弈论中的一种解法,它考虑了不完全信息下的决策问题,被广泛应用于经济学、政治学、计算机科学等领域。
本文将从博弈论和贝叶斯纳什均衡两个方面进行详细介绍。
二、博弈论1.基本概念博弈论中有三个基本概念:玩家、策略和收益。
玩家是参与游戏的实体,可以是个人、组织或国家等。
每个玩家都有自己的目标和利益。
策略是指玩家在游戏中做出的选择。
每个玩家都有多种可选的策略,每种策略都对应着不同的收益。
收益是指每个玩家在游戏结束后获得的利益或损失。
收益可以用数字表示,也可以用其他方式来描述。
2.分类根据游戏参与者数量和信息情况,博弈论可以分为以下几类:(1)单人博弈:只有一个玩家参与游戏,如囚徒困境。
(2)双人博弈:有两个玩家参与游戏,如零和博弈、非零和博弈等。
(3)多人博弈:有多个玩家参与游戏,如合作博弈、竞争博弈等。
(4)完全信息博弈:每个玩家都知道其他玩家的策略和收益情况,如国际象棋。
(5)不完全信息博弈:每个玩家只知道自己的策略和收益情况,不知道其他玩家的策略和收益情况,如扑克牌。
3.解法解决一个博弈问题需要找到一种最优的策略组合,使得每个玩家都能够获得最大化的收益。
常见的解法有纳什均衡、帕累托最优解等。
三、贝叶斯纳什均衡1.基本概念贝叶斯纳什均衡是指在不完全信息下的多人博弈中,每个玩家根据已知信息做出最优选择所形成的策略组合。
它包含两个部分:先验概率和后验概率。
先验概率是指每个玩家在游戏开始前对其他玩家的策略和收益情况所做的预测。
后验概率是指每个玩家在游戏进行过程中,根据已知信息对其他玩家的策略和收益情况所做的修正。
2.求解方法贝叶斯纳什均衡的求解方法可以分为两种:直接求解和迭代求解。
直接求解是指通过计算每个玩家在不同信息情况下的期望收益,找到满足条件的最优策略组合。
这种方法适用于信息量较少、博弈参与者较少的情况。
迭代求解是指通过反复修正先验概率和后验概率,最终找到满足条件的最优策略组合。
博弈论的基本概念
•博弈论是研究两人或多人谋略和决策的理论。
•博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的的学科。
•参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。
参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。
参与者可以是自然人,也可以是团体。
•信息:信息是指参与者在博弈过程中能了解和观察到的知识。
信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。
完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。
•策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。
通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。
如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。
•收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。
通常用u i表示参与者i的收益,它是策略组合的函数。
•均衡:均衡是所有参与者的最优策略组合,记为s*。
几个经典的博弈实例
•例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。
除非至少一人认罪,否则警方无充分证据将他们按最论刑。
警方把他们隔离审讯,并对他们说明不同行动所带来的后果。
如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。
• 例二 海滩占位 甲、乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格,相同的质量向均匀散布在海滩上的众多游客销售冷饮。
既然是做生意,目的总是多赚钱,甲乙两人有时在同一地点做同样的生意,竞争是难免的,这两个摊贩应该怎样安排自己的摊位,才能相安无事的做自己的生意?(假定游客总是到据自己最近的摊位购买冷饮)。
• 例三 智猪争食 猪圈里有一头打猪和一头小猪。
里面有一个猪食槽,槽的对面装有控制开关。
只要去拱开关,就会有一次6个单位的饲料流进槽里。
如果它们都不去拱开关,那么它们都吃不到饲料;如果小猪去拱,那么等到它跑回来时,大猪已把饲料吃光了;如果大猪去拱,等它回来时可以吃到1个单位的饲料;如果他们一起去拱,在一起跑回来,那么大猪可以抢到4个单位的饲料,小猪也能吃到2个单位的饲料。
假定每拱一次开-1,-1 -9,0 0,-9 -6,-6 坦白 沉默 坦白 沉默 囚徒一
关需要消耗0.5个单位的饲料能量。
它们长期一起进食,上面所说的情况两只猪都知道。
它们应该如何选择?
完全信息静态博弈
• 静态博弈:静态博弈指的是博弈的参与者同时选择各自的行动,即便是选择行动有先后的话,后行动者也不知道先行动者所采取的行动。
• 博弈的标准表述(策略表述)含有三个要素(1)博弈参与者集合i ∈ N ;
(2)每个参与者的策略空间S i ;(3)每个参与者的收益函数ui 。
• 定义:在一个有n 个参与者的博弈中,参与者的策略空间S 1,S 2,…,S n ,收益函数为u 1,u 2,…,u n ,称G={S 1,S 2,…,S n ;u 1,u 2,…,u n }为此博弈的一个标准表述。
• 定义:如果对任一s i ’ ∈ S i ,s i ’ ≠ s i *, 不等式u i (s 1,…,s i-1, s i *, s i+1,…,s n )> u i (s 1,…,s i-1, s i ’ ,s i+1,…,s n )对所有的策略组合(s 1,…,s i-1, s i+1,…,s n )都成立,那么 si*称为参与者i 的严格占优策略。
• 定义:在博弈的标准表述中,如果对所有的参与者i ∈N , s i * 是i 的严格0,0
6,-0.5 0.5,5 3.5,1.5 拱 不拱 拱 不拱 大猪 小猪
占优策略,那么策略组合s*=(s 1*, …,s n *)称为严格占优策略均衡。
• 定义:在标准表述的博弈中,设s i ’和s i ’’是参与者i 的两个可选策略,若u i (s 1,…,s i-1, s i ’,s i+1,…,s n )<u i (s 1,…,s i-1, s i ’’,s i+1,…,s n )对所有的策略组合(s 1,…,s i-1, s i+1,…,s n )都成立,那么称s i ’是相对于s i ’’的严格劣策略。
• 定义:如果s*=(s 1*, …,s n *)是逐步剔除严格劣策略剩下的唯一策略组合,则该策略称为逐步剔除严格劣策略均衡。
2,0 0,1 0,3 0,1 1,2 1,0 上 下 左 中 右 参与者1 参与者2 0,1 0,3 1,2 1,0 上 下 左 中 参与者1 1,2 1,0 上 下 左 中 参与者1
• 定义:在博弈G={S 1,S 2,…,S n ;u 1,u 2,…,u n },策略s*= (s 1*,…,s i-1*, s i *,s i+1*,…,s n *)满足条件:对每一个参与者i ,都有对所有的s i ∈ S i , u i (s 1*,…,s i-1*, s i ,s i+1*,…,s n *) ≤ u i (s 1*,…,s i-1*,
s i *,s i+1*,…,s n *) 成立, 则称s*为该博弈的一个纳什均衡。
• 严格占优策略均衡、逐步剔除严格劣策略均衡与纳什均衡的关系:严格占优策略均衡是纳什均衡;逐步剔除严格劣策略均衡是纳什均衡;反之不然。
完全信息动态博弈
• 动态博弈:各参与者的行动有先后顺序,而且后行动者在自己行动之前能观测到先行动者的行动。
• 定义:完全信息扩展式博弈形式是一个三元组F=(N,H,P ):其中N 是参与者的集合。
H 是A (行动的集合)中元素组成的序列的集合并且满足:
(1)空序列()∈H ;(2)如果一个h ∈H ,则h|k ∈H , h|k 表示h 的长度为k 的子序列;(3)如果一个无穷序列的所有有穷子序列都属于H ,那么h 也属于H 。
P :H/Z ➞ N ,其中Z ⊆H 且h ∈Z 当且仅当任给h ’ ∈H ,若h ’|k =h 则h ’ =h 。
• 对于n 个参与者有限战略的扩展式表述有一种直观的图形方法,就是博弈2,4 2,3 1,4 1,1 0,2 4,0 1,2 4,1 3,3 上 中 左 中 右 参与者1 下
在上面的这个博弈中既不存在严格占优策略均衡,也不存在逐步剔除严格劣策略均衡,对这样的博弈引入纳什均衡的概念。
树。
•设ui:Z ➞R,F=(N,H,P)扩展式博弈形式,我们称G=(F,(u i)i N)为一个扩展式博弈。
1
2 (0,0)(2,1)(1,2)
l L
r R。