博弈论(重复博弈)
- 格式:ppt
- 大小:167.00 KB
- 文档页数:17
重复博弈的经典例子重复博弈的经典例子在经济学和游戏理论中,博弈论是一种非常重要的分析工具。
它通过对智力游戏、竞争和合作等情境的描述,来研究参与者的行为和决策方式,以及他们的利益。
其中,重复博弈是一种经典的博弈类型,透露了很多有趣的现象和策略。
本文就将介绍其中的两个典型例子。
例子一:囚徒困境囚徒困境是博弈论史上最著名的例子之一。
它描述了两名罪犯在审讯时的选择。
如果他们都保持沉默,那么他们各被判三年徒刑;如果其中一个人背叛了另一个人并供出了他的罪行,那么背叛者将被判无期徒刑而另一个人将被无罪释放;如果两个人都背叛了对方,那么都将被判十年徒刑。
显然,各自为政并不能得到最好的结果,但是如果双方都不信任彼此,那么无法避免地会被卷入恶性循环,陷入坏的局面。
所以,如何打破僵局,达到合作互惠的结果呢?答案是,在重复博弈的前提下,让双方建立起稳定的信任关系,并通过稳健的策略来激励对方合作。
比如,如果一方合作另一方背叛,那么背叛者的惩罚应该比另一方少,这样可以让背叛者看到合作的好处;如果另一方也背叛了,那么惩罚应该更大,从而降低背叛的动机。
这种实验表明,人们在重复博弈中往往会采取长远最大化利益的策略,而不是只考虑眼前的利益。
例子二:公共产品的提供公共产品是指对所有人都有益处,但是没有私人市场提供或者通过个人机会成本无法享受的产品,比如环保、文化教育等。
由于公共产品的自由乘坐,导致许多人往往倾向于“裹着麻袋过河”,即只享受公共产品的好处而不出任何力气来投资。
这样,公共产品会出现供给不足的情况,逐渐凋零。
那么,如何解决公共产品的提供问题呢?重复博弈可以给出一些帮助。
假设每个人都可以选择投资或不投资,而且每个人都可以看到其他人的决策;如果有足够多的人投资了,那么所有人都可以获得好处;如果投资的人太少了,那么所有人都得不到好处。
那么,如何让更多的人参与投资呢?答案是,通过适当设定利益偏好,比如对投资者给予优惠,以鼓励更多的人来投资。
有限次重复博弈名词解释(一)有限次重复博弈在博弈论中,有限次重复博弈(Finite Repeated Games)指的是一种博弈过程,参与者在有限的回合内重复进行相同或相关的博弈行为。
这种博弈过程允许参与者根据对对手策略的观察进行调整,并在每一回合中做出决策。
1. Tit-for-Tat(以牙还牙)Tit-for-Tat是一种著名的策略,其中参与者在每一回合采取与对手上一回合行为相同的决策。
这种策略的核心思想是以相同的方式对待对手,如果对手合作,自己也合作;如果对手背叛,自己也背叛。
Tit-for-Tat策略在一些情况下可以有效地维持合作,促进稳定的协作关系。
2. Grim Trigger(严厉触发)Grim Trigger是另一种重要的策略,其基本原理是一旦对手背叛,参与者将永远背叛,不再参与合作。
这种策略要求参与者严格执行,因为只要一次背叛就会触发永久背叛状态,无论对手后续如何合作。
3. Folk Theorem(民间定理)民间定理是博弈论中关于有限次重复博弈的一个重要定理。
该定理指出,在重复博弈中,多种平衡策略组合可用于维持协作。
这意味着,参与者可以通过选择一种合适的策略组合来达到共同利益,并在一段时间内维持合作关系。
4. 巨人的耐心(Fictitious Play)巨人的耐心是一种基于对历史决策的观察和预测的策略。
在每一回合,参与者会根据对对手过去行为的观察进行预测,并假设对手会继续坚持相同的策略。
这种策略允许参与者根据对手的行为进行调整,并选择最优的决策。
5. 有限回合合作博弈(Finite Round Cooperation Game)有限回合合作博弈是一种特殊类型的有限次重复博弈。
在该博弈中,参与者在预定的有限回合内采取决策,其目标是在这些有限回合内最大化利益。
这种博弈通常涉及团队合作,参与者需要权衡个体利益与整体目标之间的平衡。
6. 随机策略(Mixed Strategy)随机策略是指参与者在决策中随机选择不同的行动概率分布。
博弈论读书笔记(五)重复博弈2.3重复博弈从这⾥开始,就进⼊博弈论⽐较难以理解的地⽅了。
我也不跟着书上的章节⾛,根据⾃⼰的理解和书上的例⼦来写,如果理解有什么不对的地⽅,欢迎各位⼤佬的指正。
⾸先我们来明晰博弈论到底在讨论些什么:对于这个问题,前⾯⼏章的内容可能对⼤家会造成⼀定的误导。
因为根据前⾯⼏章的例⼦,我们可以很容易地认为,博弈论就是在讨论在某个规则下,参与者最优的策略和参与者之间达到的平衡。
这句话本⾝没有错误,但是我们很容易理解为:这个平衡是像最开始那两个囚徒⼀样,选择“保证对⽅不会背叛并且⾃⼰在此情况下能获得最⼤利益”的战略所达到的平衡(这句话有点难以理解,不过我相信你能明⽩我的意思)。
例如第⼀章第⼀节中囚徒困境双⽅都选择招认(因为选择合作即不招认,结果可能是被背叛)。
但是⼀旦进⼊了重复博弈那么我们就不能只考虑眼前的利益(即保守地只去选择单次博弈的纳什均衡),⽽要考虑多次重复博弈的总收益。
这个时候就需要参与双⽅共同商定⼀个“协议”(例如双⽅说好都选择不招认),这个协议必须是对于双⽅都有利的(⾄少由于选择单次博弈的纳什均衡,例如双⽅不招认总⽐双⽅都招认要好),并且协议中会对不遵守规则的进⾏惩罚,以便于对每个⼈来说选择合作是最好的结果。
从这⾥我们就可以理解“博弈论教你如何制定规则的”这句话了。
好了,这⼀章最核⼼的思想在这⾥已经讲完了,虽然我可能说的不是那么清晰,不过还是希望你能认真理解上⾯所说的,这会对下⾯的概念理解有很⼤帮助。
2.3.A两阶段重复博弈先给出⼏个先⾏的定义和定理:定义:对个定的阶段博弈G,令G(T)表⽰G重复T次的有限重复博弈,并且在下⼀次博弈开始前,所有以前的博弈都可以被观测到。
G(T)的收益为T次阶段博弈收益的简单相加。
这个定义最重要的是引出⼀个重复博弈中收益的概念,即T次博弈的收益简单相加,后⾯我们会提到贴现的概念,不过到这⾥先理解到简单相加就⾏。
定理:如果阶段博弈G有唯⼀的纳什均衡,则对任意有限的T,重复博弈G(T)有唯⼀的⼦博弈精炼解:即G的纳什均衡结果在每⼀阶段重复进⾏。
©2008仅供课程参考。
未经许可,请勿传播1博弈论与信息经济学重复博弈姚洪心重复博弈的现象•1.王朝更替(分久必合,合久必分)•2.情侣相处•3.政治集团的制衡与风险期(吴三桂为什么要在晚年叛变,死前封帝?)©2008仅供课程参考。
未经许可,请勿传播2重复博弈•一次动态博弈也称为“序贯博弈”。
•重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。
如囚徒困境。
•重复博弈的特征:✓1、阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段的结构;✓2、所有参与人都观测到博弈过去的历史;✓3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均值。
贴现因子:下一期的一单位支付在这一期的价值。
注意:在每个阶段,参与人可同时行动,也可不同时行动。
©2008仅供课程参考。
未经许可,请勿传播3重复博弈©2008仅供课程参考。
未经许可,请勿传播4重复博弈©2008仅供课程参考。
未经许可,请勿传播5重复博弈因为其他参与人过去的历史总是可以观测到的,因此,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史,因此,参与人在重复博弈中的战略空间远远大于和复杂于每一阶段的战略空间,这意味着,重复博弈可能带来一些“额外”的均衡结果。
影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。
博弈重复的次数的重要性来源于参与人在短期利益和长远利益之间的权衡。
信息的完备性:当一个参与人的支付函数不为其他参与人知道时,该参与人可能有积极性建立一个“好”的声誉以换取长远利益。
©2008仅供课程参考。
未经许可,请勿传播6重复博弈和无名氏定理•有限次重复博弈—连锁店悖论重复博弈冷酷策略©2008仅供课程参考。
未经许可,请勿传播9冷酷型重复博弈囚徒A争锋相对的重复博弈•12345•行抵赖坦白抵赖坦白抵赖•列抵赖抵赖坦白抵赖坦白背离争锋相对•12345•行抵赖坦白坦白坦白坦白•列抵赖抵赖坦白坦白坦白©2008仅供课程参考。
重复博弈的名词解释重复博弈(Repeated Games)是博弈论中的一个重要分支,指的是在一定时间内重复进行相同博弈过程的一类博弈模型。
在重复博弈中,参与者的行为不再是仅基于当前回合的局部最优策略选择,而是考虑到未来回合的长期利益。
通过持续进行博弈,参与者可以互相观察对方过去的行为,并以此来调整自己的决策策略,进而达到一种稳定的合作或竞争姿态。
1. 重复博弈的基本特征重复博弈具有以下基本特征:1.1 时间维度:与一次性博弈(One-shot Games)相比,重复博弈将博弈过程拉长至多个时间回合,并通过观察对方的历史行为来调整策略选择。
1.2 互动性:重复博弈需要有多个参与者之间的相互作用,参与者的决策会受到对方决策的影响,并进一步影响对方的决策。
1.3 不完全信息:在重复博弈中,参与者对于对方的信息不完全,无法准确了解对方的策略选择和收益函数。
因此,参与者需要通过观察对方的历史行为来推测对方的潜在策略和潜在目标。
2. 重复博弈的策略选择在重复博弈中,参与者的策略选择通常可以分为两种基本类型:协作(Cooperation)和背叛(Defection)。
2.1 协作策略:协作策略指的是参与者在每一轮博弈中均选择对双方都有利的行动,追求长期合作和互利利益最大化。
协作策略的核心是建立合作的声誉和信任,通过长期合作获得稳定收益。
2.2 背叛策略:背叛策略指的是参与者在某些轮次中选择对自己有利但对对方不利的行动,追求个体利益最大化。
背叛策略的核心是以牺牲他人利益为代价,获得短期利益。
3. 重复博弈的平衡在重复博弈中,参与者通过观察对方过去的行为和收益来判断对方的策略选择,并以此为依据来调整自己的行动策略。
由于参与者之间的相互影响和信息不对称,重复博弈中存在多种平衡。
3.1 历史依赖平衡:指的是参与者根据对方过去的行为来决定自己的最优策略选择,并以此为依据来推测对方的未来行为。
通过建立声誉机制和信誉积累,在博弈的不同时间段实现稳定合作关系。
博弈论重复博弈重复博弈就是同样结构的博弈重复进行。
例如,囚徒困境、情侣博弈等重复进行多次时,每次都是相同的博弈,就是重复博弈。
重复博弈关系在现实中具有普遍性。
社会经济活动中除了短期一次性关系外,大量存在的是长期反复的合作和竞争关系。
重复博弈每次重复进行的博弈称为阶段博弈,或基本博弈,或原博弈。
重复博弈在理论上属于动态博弈,但重复进行的阶段博弈本身可以是静态博弈,也可以是动态博弈。
可以是完全信息重复博弈,也可以是不完全信息重复博弈。
本节讨论完全信息重复博弈。
博弈的重复是否会改变局中人的均衡策略,与重复次数及信息对称与否有关。
按重复次数可以分为有限次重复博弈和无限次重复博弈。
重复博弈的策略由于重复博弈中每个局中人在每个阶段都必须行动,因此局中人的一个策略就是在每个阶段针对每种情况(以前各阶段的结果)如何行动的整体计划。
因为重复博弈中其他局中人过去行动的历史是可以观测到的,所以一个局中人可以使自己在某个阶段的选择依赖于其他局中人过去的行动历史。
例如,囚徒困境博弈中,“如果你这次选择了坦白,我下次将选择坦白;如果你这次选择了抵赖,我下次将选择抵赖。
”重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。
因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。
重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。
因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。
重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。
因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。
重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。
因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。