博弈模型汇总
- 格式:docx
- 大小:14.35 KB
- 文档页数:2
这一节主要是列举博弈模型中的几种比较特殊的博弈论模型,它们具有一些特殊的性质。
这几种模型分别为超模、潜在以及重复博弈模型。
(1) 超模博弈模型。
假设在博弈模型中,其效用函数呈现出超模性,那么这个博弈模型即为超模博弈模型。
下面先给出超模性的定义:在一个偏序集 X ,如果在这个集合中的任意 a ,b ∈ X,都存在着a ∧ b ∈ X 及a ∨ b ∈ X,其中a ∨ b = sup { a ,b}, a ∧ b = inf { a ,b},则这个函数称之为超模的。
博弈模型超模性的判定:从定义可以推导出,只要在博弈模型中的所有博弈方的策略为紧集合,并且收益表示式都满足式(2-8),满足以上两点则这个博弈过程就可以称之为超模博弈。
2( )ii jU aa a≥j ≠ i ∈ N(2-8)并且超模博弈具有纳什均衡,而且肯定是唯一的纳什均衡点。
(2) 潜在博弈模型。
潜在博弈是一个特殊的类型。
定义函数V :A → R。
ΔV 代表博弈整体的效用改变,iΔu 表示用户 i 的效用改变,当任意用户 i 进行策略的改变,都有iΔu = Δ V,如果所有的任意博弈参与者都单方面的策略改变,都存在iΔV = Δu ,则称该博弈模型为潜在博弈。
否则,如果sgn sgniΔV = Δu ,则这样的博弈模型称之为顺序的潜在博弈已模型。
模型的判定:只要在博弈模型中的所有博弈方的策略为紧集合,并且收益表示式都满足式(2-9),满足以上两点则这个博弈过程就可以称之为潜在博弈模型。
22( )( )jii j i jU aU aa a a a=j ≠ i ∈ N ,a ∈ A(2-9)并且潜在博弈具有纳什均衡,而且肯定是唯一的纳什均衡点。
(3) 重复博弈模型。
这种博弈模型表示 N 多相同的“阶段博弈”组成的博弈模型的整体,参与者在博弈过程中,可以根据过去的策略的了解,以及对未来的形式的估计,和根据当时的情况来实时的调整选用的策略组合。
完全信息博弈和不完全信息博弈例子完全信息博弈和不完全信息博弈是博弈论中常见的两种博弈模型。
在完全信息博弈中,参与者对对手的策略和利益有完全了解,而在不完全信息博弈中,参与者对对手的策略和利益了解不完全。
下面将给出10个例子来说明这两种博弈模型。
1. 完全信息博弈:象棋对局象棋是一种典型的完全信息博弈。
在游戏开始之前,双方玩家对对手的棋子摆放和可能的走法有全面的了解。
每一个棋子的能力和走法都是公开的,玩家可以根据对手的走法进行推理和决策。
双方都可以清楚地看到棋盘上的所有信息,这使得象棋成为一个完全信息博弈的范例。
2. 完全信息博弈:扑克牌游戏扑克牌游戏是另一个典型的完全信息博弈。
在游戏开始之前,玩家可以看到自己的牌和公共牌,可以推断其他玩家手中可能的牌型。
玩家可以根据对手的表情、下注行为和牌型推断对手的策略,并做出相应的决策。
3. 完全信息博弈:国际象棋比赛国际象棋比赛是另一个典型的完全信息博弈。
在比赛开始之前,双方选手可以看到对手的棋子摆放和可能的走法,可以根据对手的走法进行推理和决策。
选手可以通过分析对手的行为和棋局的发展,制定出相应的策略。
4. 完全信息博弈:囚徒困境囚徒困境是博弈论中著名的例子。
在这个博弈中,两个囚犯被关押在不同的牢房中,检察官给每个囚犯提供了一个交代罪行的机会。
如果两个囚犯都选择交代,那么他们都会被判刑。
如果两个囚犯都选择保持沉默,那么他们都会被判轻刑。
如果一个囚犯交代而另一个保持沉默,那么前者将获得豁免,后者将被判重刑。
这个博弈的特点是,双方玩家知道对方的利益和策略,并可以根据对方的策略做出自己的决策。
5. 完全信息博弈:足球比赛足球比赛是一种典型的完全信息博弈。
在比赛开始之前,双方球队都可以看到对方的阵容和战术,可以根据对手的策略进行相应的调整。
球队可以根据比赛的进展和对手的表现,调整自己的战术和策略。
6. 不完全信息博弈:扑克牌对局尽管扑克牌游戏可以被看作是完全信息博弈的例子,但在某些情况下,扑克牌对局也可以被看作是不完全信息博弈。
聊聊四种经典的博弈论模型展开全文1、囚徒困境:为什么两个犯人都选择坐牢官差破获了一宗盗窃案,抓住了两名犯罪嫌疑人。
但在审讯过程中,被关在一处的二人始终矢口否认盗窃罪名,说东西不是我们偷的。
为了避免两人达成默契,结成攻守同盟,官差决定对他们进行单独审讯。
官差表示,如果两人中有一人坦白认罪,则可立即释放,另一个不认罪的人判5年徒刑;如果两人都坦白罪刑,则他们将各判2年徒刑。
但还有一种情况,那就是两个人都拒绝坦白,由于缺乏证据,他们只会以扰乱公共场合为名判处3个月拘役。
这就是两名罪犯面临的困境中,他们会做出怎样的选择呢?首先,他们互相之间都不清楚对方是否会坦白,其次,二人都希望将自己的刑期缩至最短。
如此考虑,最终,两名犯人都会选择坦白交代。
上面的案例就是博弈论所说的“囚徒困境”。
犯人们如果彼此合作,可为集体带来最佳利益(刑期最短);但当二人面对同样的情况且不知道对方如何选择时,在理性思考后,双方都会得出相同的结论(坦白交代),以便达到个人利益的最大化。
囚徒困境是博弈论的“非零和博弈”中具代表性的例子,反映的是个人的最佳选择并非是团体的最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
2、智猪博弈:赢的总是小猪猪圈里有大小两头猪,它们在同一个食槽里进食。
为了保持饲料的新鲜,在远离猪食槽的另一边有一个踏板,大猪或小猪跑过去,每按动一次踏板,投食口就会掉落10个单位的食物。
于是,在大猪和小猪每次进食前,就会形成这样一种局面:如果小猪跑去按踏板,大猪守在食槽边,则大猪小猪吃到的食物比是9:1;反之,如果大猪去按而小猪守在食槽边,则吃食比例是6:4。
如果二猪同时到食槽边,则吃食比是7:3。
这样一来,从纯收益的角度考虑,小猪就更愿意选择在食槽边等待食物落出,因为“等待优于行动”,而大猪只能被迫奔忙在踏板和食槽之间。
上述“智猪博弈”的案例是经济学家的假设论证模型,这个博弈的结果,用经济学视角看待,可以解释为:谁占有更多资源,谁就必须承担更多义务。
博弈联均衡模型博弈论模型图示博弈可划分为合作博弈和非合作博弈,1人们一般讲到的都是指非合作博弈,它有四种不同类型的博弈,即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。
这四种均衡中最为基本的是纳什均衡。
2完全信息静态博弈——纳什均衡、完全信息动态博弈——子博弈精炼纳什均衡不完全信息静态博弈——贝叶斯纳什均衡、、不完全信息动态博弈——精炼贝叶斯纳什均衡,与上述相对应的是、、、。
这四种均衡中最为基本的是纳什均衡。
完全信息静态博弈(纳什均衡)债务人强硬妥协1这两者的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议:如能达成就是合作博弈;反之就是非合作博弈。
合作博弈强调团体理性,强调效率和公平,非合作博弈强调理性个人的最优决策,其结果是否有效率则是不确定的。
2所谓纳什均衡,指的是所有参与人最优选择的一种组合,在这种组合下,给定其他人的选择,没有任何人有积极性做出新的选择。
纳什均衡的哲学思想是:给定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。
换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。
当博弈中的所有参与人事先达成一项协议,给出每个人的行为规则。
在没有外在强制力约束时,当事人是否会自觉地遵守这个协议?或者说这个协议是否可以自动实施?如果当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡。
参见张维迎:“经济学家看法律、文化与历史”,载张维迎《产权、政府与信誉》,三联书店2001年版。
囚徒困境□ 文/柯华庆“囚徒困境”最早是由美国普林斯顿大学数学家曾克1950年提出来的。
他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论。
这个故事后来成为博弈论最经典的案例。
故事的内容如下:两个犯罪嫌疑人被捕并受到指控,但除非至少其中至少有一个人供认犯罪,警方缺乏足够的证据指证他们所犯的罪行,从而将他们按罪判刑。
行业市场竞争的博弈模型当谈到市场竞争时,我们不可避免地想到博弈论。
博弈论是一门研究决策者在不同策略下相互影响的数学理论。
运用博弈模型来分析行业市场竞争,可以帮助我们更好地理解竞争者之间的策略选择、互动以及最终的市场结果。
本文将介绍几种常见的行业市场竞争的博弈模型,以期能够深入探讨这一领域。
首先,我们来讨论非合作博弈模型。
在非合作博弈中,每个竞争者都追求自身的最大利益,不考虑其他竞争者的影响。
最著名的非合作博弈模型之一是纳什均衡模型。
在这个模型中,每个竞争者都选择了最优的策略,使得没有一个竞争者单方面改变策略能够改善自己的利益。
非合作博弈模型的一个经典例子是俘虏困境。
在俘虏困境中,两名犯罪嫌疑人被关押在不同的牢房中,警察需要他们的供词。
如果两名嫌疑人都保持沉默,他们将分别面临一年的监禁。
然而,如果其中一人坦白,而另一人保持沉默,坦白的人将获得缓刑,而另一人将面临十年的监禁。
如果两人都坦白,那么他们将各面临六年的监禁。
在这个例子中,无论另一人选择什么策略,每个人都认为坦白是最好的选择,最终导致了一个不利于两个人的结果。
除了非合作博弈模型,合作博弈模型也是研究行业市场竞争的重要工具。
在合作博弈模型中,竞争者之间可以通过合作实现共同利益。
合作博弈模型的一个例子是合作博弈矩阵。
在合作博弈矩阵中,每个竞争者都面临着多种策略选择,而选择的最终结果可以通过博弈矩阵显示出来。
例如,假设有两家电信公司A和B,他们可以选择降低价格来吸引更多的用户。
然而,如果两家公司都选择降价,他们可能会陷入价格战,导致收入减少。
因此,通过合作博弈矩阵,他们可以找到一个平衡点,选择一个双赢的策略。
除了非合作博弈和合作博弈模型,我们还需要考虑到动态博弈模型。
在动态博弈模型中,竞争者的决策不仅取决于当前的情况,还取决于之前的决策和未来的预期。
一个经典的动态博弈模型是重复博弈。
在重复博弈中,竞争者之间会进行一系列的博弈,他们的决策不仅影响当前的结果,还影响未来的博弈结果。
博弈论究竟讲什么?一文读懂11种经典博弈论模型先说一个小故事:美国第34任总统艾森豪威尔,在他年轻的时候,有一次吃过晚饭后他跟家人一起玩纸牌,一连六盘,他拿到的都是最坏的牌。
于是他变得不高兴起来,嘴里开始不停地埋怨。
他的母亲停了下来,对他说道:“如果你要继续玩下去,就不要埋怨手中的牌怎么样。
不管怎样的牌发到手中,你都得拿着。
你唯一能做的就是尽你所能,打好手里的每一张牌,求得最好的结果。
”在城主的上一篇文章中,谈到了德鲁克在《创新与企业家精神》中提到的几种竞争战略,制定战略的过程是决策的过程,推进战略落地则是执行的过程。
无论是决策还是执行,其本质都是一次次博弈的组合。
那么,究竟什么是博弈?大到国与国之间的制衡,小到一个人的一生,博弈都是无处不在,无论是商业竞争中,还是日常工作中,生活中,甚至子女教育,两性爱情。
因为每个人都在时时刻刻想着与他人竞争,每时每刻都把自己放在局中人的位置上。
这就是俗话说的“人生如戏,戏如人生”,充分运用游戏规则,做好自己人生的演员,就是博弈思维能力的体现。
专门研究相互依赖、相互影响的人群,其理性决策行为及这些决策的均衡结果的理论,就是博弈论。
博弈是有技巧的,博弈论的主体则是规定的若干博弈模型,通俗的说就是人们常说的“套路”。
但博弈论是严肃的科学,如果有人非要像剥洋葱一样地剥开博弈思维,看看各种博弈技巧的核心是什么,那么他将会看到两个字——理性。
从博弈论衍生出来的博弈思维,体现了人的理性思维,也就是说我们的任何结果均是采取某种决策和行动的结果。
这体现了博弈思维奉行的“因果论”,正所谓“种瓜得瓜,种豆得豆”。
想要得到理想的结果,除了依靠我们的理性分析,采取正确的决策,并付诸行动外,别无他法。
正因为博弈思维是一种理性思维,所以冲动是魔鬼,更是博弈思维的大敌。
这里,我们要认清“理性”的几个误区。
1.理性的人一定是自利的,但世界上又有多少纯粹的“大公无私”呢?2.理性和道德不是一回事,在追求的自利的同时,产生出来的利他才有可能持久。
经典博弈论模型
博弈论是一门研究决策策略的学科,也是一种数学方法,涉及到多个参与者之间的相互作用。
在博弈论中,每个参与者都会根据自己的利益来做出决策,同时必须考虑其他参与者的决策。
经典博弈论模型包括一些常见的策略和规则,其中最基本的是零和博弈。
在零和博弈中,每个参与者的互动关系类似于赢家通吃的形式,即一个人的利润等于另一个人的损失。
零和博弈的典型例子是两个人玩扑克牌,他们的利益总和为零。
除了零和博弈,还存在非零和博弈。
在非零和博弈中,参与者可以通过合作而获得共同的利益,因此不是每个人都赢或每个人都输。
一个非零和博弈的例子是两个公司进行竞争,虽然他们都想赢得市场份额,但他们可能会达成某些协议来共同获得更大的市场份额。
最著名的博弈论策略是纳什均衡,它是一种理论概念,指出在博弈中参与者的所有决策产生的结果都是最优的。
在纳什均衡中,每个参与者都会假设其他参与者采取的是最优策略,并基于此做出自己的决策。
除了纳什均衡,还有其他一些重要的决策规则。
例如,最小最大原则,参与者会选择一种策略,使得他们的最小利润等于其他参与者的最大利润。
这种情况通常发生在两个竞争对手面临一项业务或项目时。
此时,两个对手可能会选择不退出,而是尝试尽可能给对方带来最小的收益。
博弈论在许多领域都有广泛的应用,包括经济学、政治学、心理学和计算机科学等等。
它可以帮助人们更好地理解人类决策过程,以及如何在许多不同的情况下做出最优的决策。
掌握博弈论的基础知识将使我们更好地理解并解决日常生活和工作中的问题。
3.4 几个经典动态博弈模型453.4.1 寡占的斯塔克博格模型46动态的寡头产量竞争博弈厂商1先选择,厂商2后选择。
21q q Q +=121111112)](8[)(q q q q q c Q P q u -+-=-=221222222)](8[)(q q q q q c Q P q u -+-=-=策略空间:[0,Q max ]中所有实数。
Q max 为不至于使价格降到亏本的最大限度的产量。
Q Q P P -==8)(价格函数:边际生产成本:无固定成本得益函数:221==c c 2121116q q q q u --=2221226q q q q u --=47两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
1 、第二阶段厂商2的选择目标:得益最大化。
求使自己得益最大化下的产量值,即最大化时的一阶条件:得益函数:2221226q q q q u --=用逆推归纳法进行分析:02602122=--⇒=∂∂q q q u 112213)6(21q q q -=-=求出厂商2对厂商1产量的反应函数:48两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
2 、第一阶段厂商1的选择。
用逆推归纳法进行分析:12213q q -=厂商1可直接求出使自己得益最大化时的产量:厂商1知道2的决策思路:直接将上式代入厂商1的得益函数,得到:2112111121*211*211213)213(66),(q q q q q q q q q q q q u -=---=--=3030*1*111=⇒=-⇒=∂∂q q q u厂商1的最佳产量是生产3单位。
将之代入厂商2的反应函数,得到厂商2的最佳产量5.15.13*2=-=q 此时市场价格为3.5,双方的得益别为4.5和2.25单位。
3*1=q 12213q q -=用逆推归纳法分析得出,该动态博弈的唯一的子博弈完美纳什均衡:厂商1在第一阶段生产3单位产量,厂商2第二阶段生产1.5单位产量。
有趣味的博弈论模型在自然界和人类社会经济等领域中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论,它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。
令人惊奇的是,有三次诺贝尔获奖者是博弈论的杰出科学家,他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家,1995年获奖的理性主义学派的领袖卢卡斯。
博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。
进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。
博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。
博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。
博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。
为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和研究了许多博弈模型,比较著名的有三个模型:囚徒困境、“雪堆”博弈和“少数者”博弈,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家了解博弈论及其应用概况。
“囚徒困境”模型囚徒困境作为一个经典的博弈模型受到广泛关注。
这个博弈模型假设两个小偷合伙作案时被捕,分别关在不同的屋子里,如果双方都拒绝承认同伴的罪行,则由于证据不足两人都会被轻判(收益为R);为此,警方设计了一个机制:如果一方出卖同伴,而另一方保持忠诚,则背叛者将无罪释放(收益为T);坚持忠诚的一方将被重判(收益为S);如果双方都背叛了对方,则双方都会被判刑(收益为P)。
合作与冲突数学模型
合作和冲突是人类社会交往中常见的行为模式。
数学模型可以用来描述和分析这些行为。
以下是一些主要的合作和冲突数学模型。
1. 合作博弈模型:合作博弈模型研究合作参与者如何在共同利益下分配资源。
最著名的合作博弈模型是合作博弈的核(core)概念,即一组策略组合,对于任何联盟中的参与者,他们无法通过自己单独行动来获得更好的回报。
合作博弈模型还包括合作稳定性概念,即在一个联盟中,没有参与者有动机离开联盟加入其他联盟。
2. 零和博弈模型:零和博弈模型描述的是一种互相对立的情况,其中一个参与者的利益的增加必然导致另一个参与者的利益减少。
在零和博弈模型中,冲突是不可避免的,参与者的目标是最大化自身利益。
著名的零和博弈模型包括囚徒困境、斯塔格亚博弈等。
3. 博弈论模型:博弈论是研究决策者如何在相互依赖的环境中做出决策的数学模型。
博弈论模型可以用来描述合作和冲突的情况。
博弈论模型包括非合作博弈模型和合作博弈模型。
非合作博弈模型研究个体决策者如何在没有互相协商的情况下做出理性决策。
合作博弈模型研究个体如何通过协商和合作来达到共同目标。
这些数学模型可以用来研究合作和冲突的策略,分析参与者的
收益和决策,从而更好地理解和解决实际生活中的合作和冲突问题。
博弈模型汇总如下:
1.合作博弈与非合作博弈:这是根据参与者之间是否可以达成具
有约束力的协议来划分的。
合作博弈强调团队合作和协作,目标是达成共赢;而非合作博弈则强调个人利益最大化,不考虑其他参与者的利益。
2.静态博弈与动态博弈:这是根据参与者做出决策的时间顺序来
划分的。
静态博弈是指所有参与者同时做出决策,或者决策顺序没有影响;动态博弈是指参与者的决策有先后顺序,后行动者可以观察到先行动者的决策。
3.完全信息博弈与不完全信息博弈:这是根据参与者对其他参与
者的偏好、策略和支付函数了解的程度来划分的。
完全信息博弈是指所有参与者都拥有完全的信息,能够准确判断其他参与者的策略和支付函数;不完全信息博弈则是指参与者只拥有部分信息,无法准确判断其他参与者的策略和支付函数。
4.零和博弈与非零和博弈:这是根据所有参与者的总收益是否为
零来划分的。
零和博弈是指所有参与者的总收益为零,一方的收益等于另一方的损失;非零和博弈则是指所有参与者的总收益不为零,各方的收益和损失不一定相关。
5.竞争博弈与合作博弈:这是根据参与者之间是否存在竞争或合
作关系来划分的。
竞争博弈是指参与者之间存在竞争关系,目标是追求个人利益最大化;合作博弈则是指参与者之间存在合作关系,目标是追求共同利益最大化。
6.微分博弈与离散博弈:这是根据决策变量的连续性来划分的。
微分博弈是指决策变量是连续变化的,需要考虑时间、速度等因素;离散博弈则是指决策变量只有有限个可能的取值,通常只考虑状态的变化而不考虑时间、速度等因素。