理性双矩阵经济博弈的期望均衡分析
- 格式:doc
- 大小:416.00 KB
- 文档页数:10
盘点博弈论&纳什均衡&囚徒困境&零和博弈&智猪博弈1.博弈论是什么博弈论(game theory),又译为对策论,或者赛局理论,经济学的一个分支,1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》,标志着现代系统博弈理论的的初步形成,因此他被称为“博弈论之父”。
博弈论被认为是20世纪经济学最伟大的成果之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
主要研究公式化了的激励结构(游戏或者博弈)间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
具有竞争或对抗性质的行为称为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
比如日常生活中的下棋,打牌等。
博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
2.纳什均衡(Nash equilibrium)3.囚徒困境(Prisoner’s Dilemma)纳什平衡的经典例子就是囚徒困境。
囚徒困境(Prisoner’s Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
1950年,由就职于兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问艾伯特·塔克以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
博弈论与经济行为博弈论,作为一门研究决策者在面对不确定环境时进行决策的数学工具,在经济学领域具有重要的地位。
通过博弈论的分析,我们可以更好地理解和预测经济行为背后的决策动机和结果。
本文将探讨博弈论对经济行为的影响,并深入分析其中的一些重要概念和理论。
博弈论的核心思想是理性决策。
在博弈论中,个体被认为是理性的,并在面对不确定性时尽力追求自身的利益最大化。
在经济领域,这一理念被广泛应用于分析企业的市场竞争、投资者的资产配置以及政府的政策制定等方面。
一个重要的博弈论概念是“纳什均衡”。
纳什均衡是指在一个博弈中,每个参与者选择的策略都是相互协调的,没有任何一个参与者可以通过单方面改变策略而达到更好的结果。
这个概念对解释市场行为和竞争具有重要意义。
在市场中,企业之间相互竞争,为了争夺市场份额,它们需要考虑对手可能的反应,从而选择最优的策略。
纳什均衡理论帮助我们预测市场行为和竞争结果,为企业决策提供有力支持。
除了纳什均衡,博弈论还包含了许多其他的重要理论和概念。
例如,博弈矩阵是博弈论中常用的分析工具之一。
博弈矩阵将参与者的策略以及可能的结果呈现为一个矩阵,通过分析矩阵中不同策略的组合对参与者的影响,我们可以得出关于决策者策略选择的结论。
这种分析方法可以应用于许多经济领域,如竞价拍卖和合作博弈等。
此外,还有一些博弈论模型和理论被广泛应用于解释和预测现实世界中的经济行为。
例如,囚徒困境是一个经典的博弈模型,用于解释为什么在某些情况下,个体往往会为了追求自身利益而最终导致双方都得不到最佳结果。
这个模型可以解释为什么在一些市场中,企业往往无法达到理想的竞争结果,以及为什么国家之间在某些问题上很难达成合作。
对于个体和国家来说,面临的困境是如何在追求自身利益的同时尽可能达到最佳结果。
博弈论在经济学领域的应用还包括博弈策略的设计和调整。
在现实世界中,参与者可能会根据他们的利益和对手的动作不断调整自己的策略。
通过博弈论的分析,我们可以研究这种策略调整的动态过程,并预测参与者最终可能选择的策略。
博弈均衡和机制设计概述解释及说明1. 引言1.1 概述博弈均衡和机制设计是博弈论和经济学中的两个重要概念,它们在分析和解决各种经济、社会和政治问题中起着关键作用。
博弈均衡是指在多方参与者之间进行策略选择时达到一种相对稳定状态的理论概念,而机制设计则是为了实现特定目标而设计出合适的规则和激励机制。
本文将对博弈均衡和机制设计进行总结、解释和说明。
1.2 文章结构本文将分为六个部分进行讨论。
首先,在引言部分对博弈均衡和机制设计进行介绍,并说明它们的关系。
接着,我们将详细探讨不同类型的博弈均衡及其特点,包括完全信息博弈和不完全信息博弈,以及纳什均衡与其他类型的博弈均衡之间的比较。
然后,我们将深入研究机制设计的原理与方法,包括契约理论在机制设计中的应用、声明式机制设计与计算式机制设计的对比分析,以及公共品和外部性问题中的机制设计策略。
接下来,我们将探讨博弈论在经济领域中的应用实例以及社会公共资源配置中的机制设计案例,并讨论机制设计在社会政策决策中的意义和作用。
最后,我们将给出结论部分对全文进行总结。
1.3 目的本文的目的是介绍和解释博弈均衡和机制设计的概念,并探讨它们之间的关系。
通过对不同类型博弈均衡及其特点、机制设计的原理与方法以及应用案例进行分析,我们希望读者能够更好地理解博弈论和机制设计,并认识到它们在经济、社会和政治问题中起到的重要作用。
同时,本文还旨在提供一些思考和启发,为相关领域研究者提供理论依据和实践指导。
2. 博弈均衡和机制设计2.1 博弈均衡的概念博弈均衡是博弈论中一个重要的概念,指的是在一个博弈过程中,各参与者通过采取最佳策略而达到的一种稳定状态。
在博弈均衡中,不存在任何一个参与者可以通过改变自己的策略来获取更好的结果,即没有人单方面改变策略可以获得更高效益。
博弈均衡可以分为纯策略均衡和混合策略均衡两种形式。
2.2 机制设计的概念机制设计是经济学中研究如何设计合适机制以实现某种特定目标或解决某个问题的理论框架。
博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石,对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。
本文首先将博弈划分为不同的类型,并对主要的均衡概念进行了数学描述,最后对不同的均衡概念进行了比较。
【关键词】博弈论;纳什均衡;重复博弈博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。
但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。
在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。
因此,本文将主要的博弈均衡概念进行分类和表述,并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。
一、博弈的主要类型博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。
依据不同的分类标准,博弈可以被划分为不同的类型。
1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。
动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。
Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。
重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。
2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。
纳什均衡理论与博弈分析纳什均衡理论和博弈分析是现代经济学中重要的理论工具,被广泛应用于博弈论、经济学、政治学等领域。
它们的应用为我们解决各种博弈情境提供了理论依据和实践指导。
纳什均衡理论是美国数学家约翰·纳什博士在20世纪40年代早期提出的。
该理论认为,在一个博弈中,每个参与者都根据其他参与者的决策来选择自己的最佳策略,而达到的结果是各参与者的决策互不干涉,也就是无人后悔的策略组合。
这种情况下的结果就被称为纳什均衡。
博弈理论是研究决策制定者之间互动行为的一种数学模型。
通过对参与者之间的互动行为进行建模,博弈理论能够帮助我们理解和解释各种现实生活中的决策问题。
它是一个战略性的分析工具,可以帮助我们预测和优化决策的结果。
在博弈分析中,我们通常会使用博弈矩阵来表示参与者之间的策略选择和收益关系。
博弈矩阵中的每一个元素代表了每个参与者在每种策略组合下的收益或成本。
通过分析博弈矩阵,我们可以确定纳什均衡。
然而,在实际应用中,确定纳什均衡并不总是一件容易的事情。
因为参与者之间的策略选择和收益关系往往是复杂的,并且会受到多种因素的影响。
此外,有些博弈可能存在多个纳什均衡,导致结果的不确定性。
因此,在博弈分析中,我们需要综合运用数学模型和实证研究来获得更准确的结果。
同时,我们还需要考虑参与者的理性和情感因素,以及其他可能存在的约束条件。
只有在这样的综合分析下,我们才能更好地预测和指导博弈的结果。
纳什均衡理论和博弈分析在实际中的应用非常广泛。
在经济学中,它们被应用于市场竞争、国际贸易、拍卖等领域,帮助我们理解和优化市场行为和策略选择。
在政治学中,它们被应用于冲突和合作关系的研究,帮助我们分析和解决国际关系和国内政治问题。
总之,纳什均衡理论和博弈分析是现代经济学中不可或缺的理论工具。
它们的应用为我们解决各种博弈情境提供了理论依据和实践指导。
通过综合运用数学模型和实证研究,我们可以更准确地预测和指导博弈的结果,帮助我们做出更优化的决策。
理性选择与博弈论在经济中的运用近年来,理性选择和博弈论在经济学领域中的运用越来越受到重视。
随着市场经济的发展和全球化的加剧,经济决策不再仅仅是单方面的,而是需要考虑到各种因素之间的相互作用和博弈关系。
理性选择和博弈论作为经济学中的两个重要理论工具,为我们解决经济问题提供了新的思路和方法。
首先,理性选择理论是以个体行为为基础的。
在经济活动中,人们的行为往往是出于理性选择的结果。
理性选择理论认为,个体在做出决策时,会根据自己的期望效用来衡量不同行为的得失,并选择最能使期望效用最大化的行为。
这种理性选择行为是基于信息不对称的,个体会根据自己掌握的信息和利益来做出决策,追求自己的最大利益。
举个例子来说,当一个人面临着多个购买选择时,他会根据商品的价格、质量、品牌以及自身的需求来权衡利弊,最终选择对自己最有利的商品。
其次,博弈论是研究各方利益相关者之间相互作用的数学模型。
经济中的博弈理论是一种非完全竞争市场的分析工具,通过研究不同参与者之间的博弈策略和行为,揭示出经济行为的根本动力。
博弈论有不同的博弈模型,如合作博弈、非合作博弈、零和博弈和非零和博弈等。
这些模型可以帮助人们分析和预测市场中的各种行为和结果。
例如,在价格竞争中,不同企业的定价策略会影响彼此的利益,并且可能导致价格战。
博弈论可以帮助我们理解企业之间的相互作用和竞争策略,从而提出更科学合理的决策方案。
理性选择和博弈论在经济中的运用有着广泛的应用。
首先,在市场竞争中,理性选择理论可以帮助企业更好地理解消费者的需求和偏好,从而制定更适合市场的营销策略。
同时,博弈论可以帮助企业理解竞争对手的行为和动机,进而制定合适的竞争策略。
其次,在政府决策中,理性选择和博弈论可以用来分析不同政策的影响和结果,以及各方利益的博弈关系。
例如,税收政策、贸易政策等对于市场经济的稳定和发展都有着重要影响,理性选择和博弈论可以帮助政府评估不同政策选项的利弊,选择对整体利益最有利的政策。
几个常见理性双矩阵经济博弈的期望均衡分析1姜殿玉淮海工学院经济管理系,江苏,连云港,222001 摘要:关于完全信息静态博弈,有纯Nash均衡,混合Nash均衡和相关均衡等概念。
如果每个局中人除了博弈的结构以外其他一无所知是全体局中人的共同知识(称为完全静态的),那么期望均衡是在极大熵准则是全体局中人的共同知识的条件下的一种均衡。
本文首先介绍理性对策及其期望均衡的概念,然后由此分析了在文献中经常出现的一些经典博弈的期望均衡的结果,并与混合Nash均衡结果进行比较。
说明对于完全静态博弈,当局中人比通常情况下聪明(极大熵准则是他们的共同知识)的时候,其决策结果比混合Nash均衡更为确定和具有理性。
关键词:极大熵准则,完全静态博弈,混合Nash均衡,期望均衡Expected Equilibrium Analysis on Some Rational Economics Bi-matrix GamesJIANG DianyuSchool of Economical Management, Huaihai Institute of Technology, Lianyungang, 222001, ChinaAbstract: In a static game with complete information, we have the concepts of pure Nash equilibria, mixed Nash equilibria and correlated equilibria. If it is all the players’common knowledge that every player knows nothing except structure of the game, called completely static, then a so called expected equilibrium was defined that is an equilibrium in the case that maximum entropy principle is all the players’common. In this paper, we introduce the concepts of a rational game and its expected equilibria, then analysis the expected equilibria in some classical games in many literatures. We compare the expected equilibria and mixed Nash equilibria in these games as well. The results show that for a completely static game the players’decision results are more certain and rational if they are more intelligent, i.e. maximum entropy principle is their common.Keywords:maximum entropy principle; completely static game; mixed Nash equilibrium; expected equilibrium1引言1基金项目:国家自然科学基金(78970025)作者简介:姜殿玉(1955-),男,辽宁凌源市人,教授。
研究方向:博弈论与决策经营分析。
传统的完全信息静态博弈假定(1)局中人的集合,(2)每个局中人的行动集合和(3)博弈的效用函数是全体局中人的共同知识[1]。
但是并不要求全体局中人的共同知识的集合中不含有其他成分。
如果这种博弈不含有其他成分,那么就称为完全静态博弈[2-4] 。
如果局中人的共同知识集合中有并且仅仅有(1),(2),(3)和(4)极大熵准则[5]:如果局中人对于可能发生的随机事件仅仅有一部分信息,那么他在决策时应该选择使得不知道的信息的不确定性达到最大的策略,那么这个博弈称为理性博弈[2-4]。
文献[2,7]关于理性博弈引进了期望均衡的概念,并且给出其算法。
文献[2]对于经典的博弈问题——囚徒困境、 夫妻争执和鹰-鸽博弈用期望均衡的概念进行了探讨,所得结论是经典均衡无法得到的,并且更符合实际。
本文首先介绍理性对策及其期望均衡的概念,然后由此分析了在文献中经常出现的一些经典博弈的期望均衡的结果,并与混合Nash 均衡结果进行比较。
说明对于完全静态博弈,当局中人比通常情况下聪明(极大熵准则是他们的共同知识)的时候,其决策结果比混合Nash 均衡更为确定和具有理性,且均衡的计算非常简洁。
2、理性双矩阵博弈设1和2是两个局中人,{1,2,,}I m = 和{1,2,,}J n = 分别是局中人1和2的行动集合。
()ij m n A a ⨯=和()ij m n B b ⨯=分别是局中人1和2的支付矩阵,即当剧中人1和2分别采用行动i I ∈和j J ∈时,局中人1和2分别得到效用ij a 和ij b 。
设单纯形11{(,,)|0,1,2,,;1}mm i i i X x x x i m x ==≥==∑ , 11{(,,)|0,1,2,,;1}nn j j j Y y y y j n y ==≥==∑分别是局中人2和1的判断集合[9],即1(,,)m x x 表示局中人2判断局中人1以概率i x 选择行动i I ∈,1(,,)n y y 表示局中人1判断局中人2以概率j y 选择行动j J ∈。
设ξ是可能取值为1,2,……,n 的随机变量,其概率分布列为 i p i ==}Pr{ξ,n i ,,,21=, 那么对于不同的概率分布列,随机变量取值的不确定性可能不同.例如对于三个服从0-1分布的随机变量0}0Pr{1==ξ,1}1Pr{1==ξ;3.0}0Pr{2==ξ,7.0}1Pr{2==ξ;5.0}0Pr{3==ξ,5.0}1Pr{3==ξ, 1ξ的不明确性最小:1ξ几乎必然取1;2ξ的不明确性次之,而3ξ的不明确性最大:以同样的可能性取0和1.给定随机变量ξ的分布列i p i ==}Pr{ξ,n i ,,,21=, 我们用符号),,(1n p p H 表示其不明确性.1948年,Shannon 证明了[10]∑=-=ni i b i n p p C p p H 11log ),,( ,这里规定00log 0=b ,式中的C 是正常数,通常可以取作1.),,(1n p p H 称为Shannon 熵.对于取定的底)10(≠<b b ,记∑=-=n i i b in b p p p p H 11log ),,( .随机变量的Shannon 熵是这个随机变量在一次试验中究竟取什么值的不明确性或“模糊度”的度量,也就是要准确判定这个随机变量究竟取什么值所需要的平均信息量.定理 1 [11](1)1),,(01≤≤n n p p H ,(2)0),,(1=n n p p H 当且仅当存在着n i ≤≤01使得0,,,1,0;10i i n i p p i i ≠=== ,(3)1),,(1=n n p p H 当且仅当n i n p i ,,1,1 ==.定义1 一个双矩阵对策(,)(,)ij ij m n A B a b ⨯⎡⎤=⎣⎦称为完全静态的,如果局中人1,2的共同知识集合为(,){1,2;,;(,)}C A B I J A B =。
极大熵准则(PME ):对于完全静态博弈,局中人1(或2)判断局中人2(或1)以概率j y (或i x )的随机变量1(,,)n y y (或1(,,)m x x )的Shannon 熵最大。
定义2 一个双矩阵对策(,)(,)ij ij m n A B a b ⨯⎡⎤=⎣⎦称为理性的,如果局中人1,2的共同知识集合为(,){1,2;,;(,);MEP}C A B I J A B =。
给定理性双矩阵对策(,)(,)ij ij m nA B a b ⨯⎡⎤=⎣⎦,因为局中人1(或2)判断对方以概率1n (或1m )采取行动j J ∈(或i I ∈),所以当局中人1(或2)采取行动i I ∈(或j J ∈)时,其赢得的主观期望为111()n ij j E i a n ==∑(或211()mij i E j b m ==∑)。
局中人1(或2)应该选择使得其主观期望1()E i (或2()E j )最大的行动i I ∈(或j J ∈)。
定义3称111{|()max ()}i m i I E i E i ≤≤∈=221{|()max ()}j nj J E j E j ≤≤⨯∈= 为理性博弈(,)(,)ij ij m n A B a b ⨯⎡⎤=⎣⎦的期望均衡集合。
显然期望均衡集合总是存在的并且可交换的,所以总可以实现。
3.小偷-守卫博弈 [8]一个小偷欲偷窃有一个守卫看守的仓库。
如果小偷偷窃时守卫在睡觉,则小偷就能得手,偷得价值为v 的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。
设小偷被抓住后要坐牢,负效用为p -。
守卫睡觉而未遭偷窃有s 的正效用。
因睡觉被解雇的负效用为d -。
如果小偷不偷,则他既无得也无失。
守卫不睡觉意味着出一分力挣一分钱,也无得失。
则赢得矩阵为(,)(,0)(0,)(0,0)v d p s --⎡⎤⎢⎥⎣⎦守卫睡觉不睡小偷偷不偷。
这个例子出现在文献[8](pp.94),起源于Selten, R 教授于1996年3月在上海的一次演讲,作者用图解法分析了这个博弈的混合Nash 均衡。
显然,这个对策没有纯Nash 均衡。
按照传统方法,可得混合Nash 均衡和失盗的概率分别为((,),(,))s d p v s d s d v p v p ++++,s p s d v p++。
解释:s 是固定的。
当d 较大时,对于守卫失盗后果严重时(比如守卫知道自己被解雇以后再也找不到待遇与现工作相当的新工作,而只能比现工作差,则守卫必然珍惜现有工作,尽职尽责不睡觉)是双方的共同知识。
小偷在行窃的时候就要谨慎行事,故行窃的概率较小。
当v 固定,p 较小时,小偷被抓住的惩罚相对于仓库里的物品较轻是双方的共同知识,那么守卫就会知道小偷偷的可能性较大,从而守卫睡觉的可能性较小。
当p 固定,v 较小时,仓库里的物品比较廉价时说方的共同知识。
守卫就会知道小偷下手的可能性不大,从而守卫睡觉的可能性较大。
实施方法:如果小偷有M 次对这个仓库起贼心,那么他最好随机选择[]sM s d +次下手。