博弈论的基本概念
- 格式:doc
- 大小:59.50 KB
- 文档页数:7
博弈论的定义1. 博弈论的基本概念博弈论,是现代数学的一个分支学科,研究在多人决策环境中人们的策略选择以及可能产生的结果。
从经济学、管理学、政治学、心理学等方面来分析和解决问题时,博弈论可以为人们提供决策的基础。
因此,博弈论不仅在学术上很有价值,在实践中也具有很高的应用价值。
2. 博弈论的应用范围博弈论的应用范围广泛,如军事策略、商业竞争、政治谈判、社会决策、环境决策等领域。
另外,也被广泛应用于运输、公共建设、医学治疗等社会实践活动中。
3. 博弈论的基本元素博弈论的基本元素是“参与者”、“策略”、“收益”和“信息”。
“参与者”是指在某一决策环境中的所有相关人员,如消费者、企业、政府或其他组织和个人等。
“策略”是参与者在决策过程中选择的行动方案,也是促进参与者在决策中优化收益的关键。
“收益”或“效用”是参与者最终得到的结果,通常在博弈论中用数字来表示,这些数字可以是财务收入、数字权益等。
“信息”也是参与者在决策中极为重要的因素。
它可以分为完全信息和不完全信息两种,完全信息是指参与者对决策过程中的所有信息都有充分了解,而不完全信息是指参与者对决策过程中的某些信息存在不确定性。
因此,在不完全信息博弈中,有时决策者需要采取一些策略来“模糊化”自己的策略,以避免让其他人知道他们实际上所做的决策。
4. 博弈论的经典模型- 零和博弈零和博弈是博弈论的基本模型之一,是指参与者的利益总和为零。
在这种情况下,一个人赢得的收益等于另一个人失去的收益,如象棋、扑克等所有参与者的输赢情况总是相互抵消的。
- 非零和博弈非零和博弈是一种参与者的利益总和不为零的博弈。
在这种情况下,一方的收益可以与另一方的收益同时增加,如合作博弈中的合作关系。
- 合作博弈合作博弈是指参与者可以在决策中合作以实现双方或多方的利益最大化。
在此类博弈中,参与者通常需要通过协商和合作达成共识。
- 非合作博弈非合作博弈是指参与者在决策中只考虑自己的利益。
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
博弈论无名氏定理引言:博弈论是研究决策制定和行为选择的数学模型,并在许多领域发挥重要作用。
在博弈论中,无名氏定理是一项非常重要的结论,它对于理解玩家之间的互动和找到最佳策略提供了指导。
本文将就博弈论无名氏定理展开详细阐述。
一、博弈论基本概念博弈论研究决策者在决策制定中的相互影响,主要分为以下几个基本概念:1.玩家:参与博弈的个体或群体,每位玩家需根据自身利益作出决策。
2.策略:玩家在博弈中可采取的行动方案。
每位玩家需从多个策略中选择一个。
3.收益:玩家基于自己的策略和其他玩家的策略,所获得的结果。
4.纳什均衡:指在博弈中各个玩家选择了最佳策略,无法通过单方面改变策略来获得更好结果。
二、无名氏定理的内容无名氏定理由约翰·纳什于1950年提出,它在博弈论中具有重要意义。
该定理的内容可以概括为:在任意有限次博弈中,至少存在一个纳什均衡。
也就是说,在博弈中,无论玩家有多少,无论策略有多复杂,至少会有一个纳什均衡点。
这意味着无论其他玩家选择什么策略,玩家都无法通过单方面改变自己的策略来获得更好的结果。
三、无名氏定理的证明无名氏定理的证明过程比较复杂,需要运用到博弈论中的一些数学理论和方法。
在证明过程中,通常会利用到反证法、最优响应函数、偏微分方程等工具。
具体证明过程如下:1.反证法:首先假设不存在纳什均衡点,即每个玩家都能通过改变自己的策略来获得更好结果。
2.最优响应函数:然后,分别对每个玩家的每种策略进行最优响应函数的计算,即找到玩家最好的策略选项。
3.偏微分方程:最后,通过偏微分方程等工具推导,得出存在纳什均衡的结论,从而证明无名氏定理。
四、无名氏定理的应用无名氏定理在经济学、政治学、生物学等多个领域有广泛的应用。
它可以帮助人们理解玩家之间的互动关系,揭示各种冲突与合作的策略选择。
无名氏定理的应用举例:1.在市场竞争中,企业可以利用无名氏定理来确定最佳的定价策略,以获取最大利润。
2.在国际关系中,国家之间的冲突和合作可以通过博弈论无名氏定理来研究和解析。
博弈论讲的是什么
博弈论是研究决策制定者之间相互关系的一门数学分支,主要关注在冲突和合作的情境下,个体或群体的最佳决策和策略选择问题。
博弈论的研究对象可以包括个体、团体、国家、公司等各种决策制定者。
以下是博弈论的一些核心概念和主要内容:
1.博弈的定义:博弈是指多方参与者在特定环境下做出决策,彼此之间的决策会相互影响。
每个参与者的目标是通过制定最佳策略来最大化其利益。
2.参与者:博弈论中的参与者被称为“玩家”,可以是个体、群体、国家等。
每个玩家都有自己的目标和利益,但他们的决策会影响其他玩家的结果。
3.策略:策略是玩家在博弈中可选的行动或决策。
博弈论研究玩家如何选择最优策略以最大化他们的利益。
4.支付:支付是指每个玩家根据博弈的结果获得的收益或损失。
博弈论分析玩家如何在不同策略下分配支付,以及如何最大化其期望收益。
5.博弈的分类:博弈可以分为零和博弈和非零和博弈。
零和博弈中,一个玩家的利益损失就是其他玩家的利益增益,总和为零。
非零和博弈中,各玩家的利益不一定互相抵消,可以共赢或共输。
6.博弈的解:博弈论研究如何找到博弈中的均衡点或解决方案。
最著名的解决概念之一是纳什均衡,它描述了一种情况,在该情况下,每个玩家的策略是对方玩家策略的最佳响应。
7.博弈的应用:博弈论在经济学、政治学、生物学、计算机科学
等领域有广泛的应用。
例如,在商业谈判、拍卖、国际关系、网络安全等方面,博弈论都可以提供洞察和指导。
总体而言,博弈论通过数学建模和分析,帮助我们理解在决策制定者之间互动的情境中,各方如何做出最佳的决策以达到其个体或集体的目标。
《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。
本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。
关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。
博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。
本文将对博弈论的相关知识进行详细的总结和归纳。
一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。
博弈的基本要素包括:参与者、策略、收益和信息。
1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。
参与者的目标是实现自身利益的最大化。
1.3 策略策略是指参与者在博弈中所能采取的行动或选择。
通常分为纯策略和混合策略。
1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。
收益可以用来衡量参与者的利益大小。
1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。
信息可以分为对称信息和非对称信息。
二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。
常见的均衡概念有纳什均衡、帕累托最优和博弈解。
2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。
2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。
帕累托最优是一种资源分配的有效方式。
2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。
博弈解往往是均衡的特殊情况。
三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。
博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
在博弈论中,通常包括以下基本概念:
局中人:在一场竞赛或博弈中,具有决策权的参与者被称为“局中人”。
在一个博弈中,每个局中人都要做出选择。
行动:局中人在博弈中的每一个决策或选择被称为“行动”。
信息:局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。
策略:局中人基于可获得的信息,制定的决策方案或规则称为“策略”。
收益:局中人在博弈中的得失或输赢称为“收益”。
均衡:当所有局中人都认为自己的策略选择最优,并且其他局中人也认为该策略选择是最优时,这种状态被称为“均衡”。
结果:在一场博弈结束后,所有局中人的收益总和被称为“结果”。
博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。
其中,局中人、策略和收益是最基本要素。
发展过程方面,博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论的基本概念
•博弈论是研究两人或多人谋略和决策的理论。
•博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著.博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系.纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的的学科.
•参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。
参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。
参与者可以是自然人,也可以是团体。
•信息:信息是指参与者在博弈过程中能了解和观察到的知识。
信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。
完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。
•策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。
通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。
如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。
•收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。
通常用u i表示参与
者i的收益,它是策略组合的函数。
•均衡:均衡是所有参与者的最优策略组合,记为s*。
几个经典的博弈实例
•例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。
除非至少一人认罪,否则警方无充分证据将他们按最论刑。
警方把他们隔离审讯,并对他们说明不同行动所带来的后果.如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月.
• 例二 海滩占位 甲、乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格,相
同的质量向均匀散布在海滩上的众多游客销售冷饮.既然是做生意,目的总是多赚钱,甲乙两人有时在同一地点做同样的生意,竞争是难免的,这两个摊贩应该怎样安排自己的摊位,才能相安无事的做自己的生意?(假定游客总是到据自己最近的摊位购买冷饮)。
• 例三 智猪争食 猪圈里有一头打猪和一头小猪。
里面有一个猪食槽,槽的对面装有控制
开关。
只要去拱开关,就会有一次6个单位的饲料流进槽里。
如果它们都不去拱开关,那么它们都吃不到饲料;如果小猪去拱,那么等到它跑回来时,大猪已把饲料吃光了;如果大猪去拱,等它回来时可以吃到1个单位的饲料;如果他们一起去拱,在一起跑回来,那么大猪可以抢到4个单位的饲料,小猪也能吃到2个单位的饲料.假定每拱一次开关需要消耗0.5个单位的饲料能量。
它们长期一起进食,上面所说的情况两只猪都知道.它们应该如何选择?
-1,-1
-9,0 0,-9 -6,
-6
坦白 沉默
坦白 沉默
囚徒一
拱 不拱
小
猪
完全信息静态博弈
• 静态博弈:静态博弈指的是博弈的参与者同时选择各自的行动,即便是选择行动有先后的
话,后行动者也不知道先行动者所采取的行动。
• 博弈的标准表述(策略表述)含有三个要素(1)博弈参与者集合i Î N ;(2)每个参与者
的策略空间S i ;(3)每个参与者的收益函数ui 。
• 定义:在一个有n 个参与者的博弈中,参与者的策略空间S 1,S 2,…,S n ,收益函数为u 1,
u 2,…,u n ,称G={S 1,S 2,…,S n ;u 1,u 2,…,u n }为此博弈的一个标准表述。
• 定义:如果对任一s i ’ Î S i ,s i ' ¹ s i *, 不等式u i (s 1,…,s i —1, s i *, s i+1,…,s n )>
u i (s 1,…,s i —1, s i ’ ,s i+1,…,s n )对所有的策略组合(s 1,…,s i —1, s i+1,…,s n )都成立,那么 si*称为参与者i 的严格占优策略。
• 定义:在博弈的标准表述中,如果对所有的参与者i ÎN, s i * 是i 的严格占优策略,那
么策略组合s *=(s 1*, …,s n *)称为严格占优策略均衡.
• 定义:在标准表述的博弈中,设s i ’和s i ’'是参与者i 的两个可选策略,若u i (s 1,…,
s i —1, s i ’,s i+1,…,s n )<u i (s 1,…,s i —1, s i ’’,s i+1,…,s n )对所有的策略组合(s 1,…,s i-1, s i+1,…,s n )都成立,那么称s i ’是相对于s i ’’的严格劣策略.
• 定义:如果s*=(s 1*, …,s n *)是逐步剔除严格劣策略剩下的唯一策略组合,则该策
略称为逐步剔除严格劣策略均衡。
左 中 右
参与者
2
• 定义:在博弈G={S 1,S 2,…,S n ;u 1,u 2,…,u n },策略s*= (s 1*,…,s i-1*, s i *,s i+1*,…,
s n *)满足条件:对每一个参与者i,都有对所有的s i Î S i , u i (s 1*,…,s i —1*,
s i ,s i+1*,…,s n *) £ u i (s 1*,…,s i-1*, s i *,s i+1*,…,s n *) 成立, 则称s *为该博弈的一个纳什均衡.
• 严格占优策略均衡、逐步剔除严格劣策略均衡与纳什均衡的关系:严格占优策略均衡是纳
什均衡;逐步剔除严格劣策略均衡是纳什均衡;反之不然.
完全信息动态博弈
• 动态博弈:各参与者的行动有先后顺序,而且后行动者在自己行动之前能观测到先行动者
的行动。
• 定义:完全信息扩展式博弈形式是一个三元组F=(N,H ,P ):其中N 是参与者的集合。
H 是
A (行动的集合)中元素组成的序列的集合并且满足:(1)空序列()ÎH ;(2)如果一个h ÎH ,则h|k ÎH , h|k 表示h 的长度为k 的子序列;(3)如果一个无穷序列的所有有穷子序列都属于H ,那么h 也属于H 。
P :H/Z ➞ N ,其中Z ÍH 且h ÎZ 当且仅当任给h ’ ÎH ,若h'|k =h 则h ’ =h 。
• 对于n 个参与者有限战略的扩展式表述有一种直观的图形方法,就是博弈树.
• 设ui :Z ➞R , F=(N ,H ,P )扩展式博弈形式,我们称G=(F ,( u i )i
Î N
)为一个扩展式博弈.
2,4
2,3
1,4
1,1 0,2 4,0 1,2 4,1 3,3 上 中 左
中
右
参与者1
下 在上面的这个博弈中既不存在严格占优策略均衡,也不存在逐步剔除严。