第八章 4 重复博弈和无名氏定理
- 格式:ppt
- 大小:94.00 KB
- 文档页数:17
博弈论无名氏定理引言:博弈论是研究决策制定和行为选择的数学模型,并在许多领域发挥重要作用。
在博弈论中,无名氏定理是一项非常重要的结论,它对于理解玩家之间的互动和找到最佳策略提供了指导。
本文将就博弈论无名氏定理展开详细阐述。
一、博弈论基本概念博弈论研究决策者在决策制定中的相互影响,主要分为以下几个基本概念:1.玩家:参与博弈的个体或群体,每位玩家需根据自身利益作出决策。
2.策略:玩家在博弈中可采取的行动方案。
每位玩家需从多个策略中选择一个。
3.收益:玩家基于自己的策略和其他玩家的策略,所获得的结果。
4.纳什均衡:指在博弈中各个玩家选择了最佳策略,无法通过单方面改变策略来获得更好结果。
二、无名氏定理的内容无名氏定理由约翰·纳什于1950年提出,它在博弈论中具有重要意义。
该定理的内容可以概括为:在任意有限次博弈中,至少存在一个纳什均衡。
也就是说,在博弈中,无论玩家有多少,无论策略有多复杂,至少会有一个纳什均衡点。
这意味着无论其他玩家选择什么策略,玩家都无法通过单方面改变自己的策略来获得更好的结果。
三、无名氏定理的证明无名氏定理的证明过程比较复杂,需要运用到博弈论中的一些数学理论和方法。
在证明过程中,通常会利用到反证法、最优响应函数、偏微分方程等工具。
具体证明过程如下:1.反证法:首先假设不存在纳什均衡点,即每个玩家都能通过改变自己的策略来获得更好结果。
2.最优响应函数:然后,分别对每个玩家的每种策略进行最优响应函数的计算,即找到玩家最好的策略选项。
3.偏微分方程:最后,通过偏微分方程等工具推导,得出存在纳什均衡的结论,从而证明无名氏定理。
四、无名氏定理的应用无名氏定理在经济学、政治学、生物学等多个领域有广泛的应用。
它可以帮助人们理解玩家之间的互动关系,揭示各种冲突与合作的策略选择。
无名氏定理的应用举例:1.在市场竞争中,企业可以利用无名氏定理来确定最佳的定价策略,以获取最大利润。
2.在国际关系中,国家之间的冲突和合作可以通过博弈论无名氏定理来研究和解析。
©2008仅供课程参考。
未经许可,请勿传播1博弈论与信息经济学重复博弈姚洪心重复博弈的现象•1.王朝更替(分久必合,合久必分)•2.情侣相处•3.政治集团的制衡与风险期(吴三桂为什么要在晚年叛变,死前封帝?)©2008仅供课程参考。
未经许可,请勿传播2重复博弈•一次动态博弈也称为“序贯博弈”。
•重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。
如囚徒困境。
•重复博弈的特征:✓1、阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段的结构;✓2、所有参与人都观测到博弈过去的历史;✓3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均值。
贴现因子:下一期的一单位支付在这一期的价值。
注意:在每个阶段,参与人可同时行动,也可不同时行动。
©2008仅供课程参考。
未经许可,请勿传播3重复博弈©2008仅供课程参考。
未经许可,请勿传播4重复博弈©2008仅供课程参考。
未经许可,请勿传播5重复博弈因为其他参与人过去的历史总是可以观测到的,因此,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史,因此,参与人在重复博弈中的战略空间远远大于和复杂于每一阶段的战略空间,这意味着,重复博弈可能带来一些“额外”的均衡结果。
影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。
博弈重复的次数的重要性来源于参与人在短期利益和长远利益之间的权衡。
信息的完备性:当一个参与人的支付函数不为其他参与人知道时,该参与人可能有积极性建立一个“好”的声誉以换取长远利益。
©2008仅供课程参考。
未经许可,请勿传播6重复博弈和无名氏定理•有限次重复博弈—连锁店悖论重复博弈冷酷策略©2008仅供课程参考。
未经许可,请勿传播9冷酷型重复博弈囚徒A争锋相对的重复博弈•12345•行抵赖坦白抵赖坦白抵赖•列抵赖抵赖坦白抵赖坦白背离争锋相对•12345•行抵赖坦白坦白坦白坦白•列抵赖抵赖坦白坦白坦白©2008仅供课程参考。
4.重复博弈问题:在旅游地很容易出现假货,而在居民小区的便利店则很少出现假货,为什么?重复博弈是指由同样结构的基本博弈重复多次进行构成的博弈过程,其中的每次博弈称为阶段博弈。
给定一个基本博弈G(可是静态或动态博弈),重复进行T次G,并且在每次重复G之前各参与人都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。
而G 则称为G(T)基本博弈,G(T)中的每次重复称为G(T)的一个“阶段”重复博弈具有三个特征:1、阶段博弈之间没有“物质上”的联系(no physical links),即前一阶段的博弈不改变后一阶段博弈的结构。
(每阶段博弈的结构相同,都是独立的)2、所有参与人都能观察到博弈过去的历史(完全信息)。
3、参与人的总支付是所有阶段博弈支付的贴现值或加权平均值。
参与人是从总支付最大化的角度进行决策的。
在长期内,参与人之间的行为可能相互影响,合作或者报复不合作者(便利店老板就比较害怕报复),这样,在博弈的一个阶段支付大并不意味着在长期内的支付也大,所以,在重复博弈中参与人必须考虑到长期利益。
现实中的例子:寡头门在市场上的长期竞争,如价格战,市场份额战等;两个企业履行长期协议;商业中的回头客等4.1有限次重复博弈重复次数较少的有限次重复博弈可以不考虑贴现问题。
4.1.1零和博弈有限次重复博弈在零和博弈中,一方所得及为另一方所失,因而即使重复多,也不可能进行合作或报复,所以零和博弈的重复进行对博弈没有影响。
以猜硬币博弈为例,用逆向归纳法证明如下:在博弈的最后阶段T,纳什均衡是双方各以0.5的概率选择正面或反面;在博弈的T-1阶段,纳什均衡纳什均衡是双方各以0.5的概率选择正面或反面;.......上述结论也可以推广到非零和或多个博伊方,但博弈方的利益严格对立,没有纯策略纳什均衡的严格竞争博弈中。
4.1.2存在唯一纯策略纳什均衡博弈的有限次重复博弈参与人的行为不会因为博弈的有限次重复而发生改变,例一:连锁店在位者默许斗争不进入在此博弈中,如果进入者先行动,唯一的子博弈精炼纳什均衡结果是进入者进入,在位者默许(注意,这是一个两阶段动态博弈)。
84 博弈论与信息经济学︱︱P B L 教程 个“阶段”。
注意重复博弈的一个阶段本身就是一个独立的静态博弈或动态博弈,各个参与人都有相应的收益,这是重复博弈与一般动态博弈的主要区别之一。
定理3.2:令G 是阶段博弈,G (T )是G 重复T 次的重复博弈(T <∞)那么,如果G 有唯一的纳什均衡,重复博弈G (T )的唯一子博弈精炼纳什均衡结果是阶段博弈G 的纳什均衡重复T 次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。
上述定理表明,只要博弈的重复次数是有限的,重复本身并不改变博弈的均衡结果。
注意,单阶段博弈纳什均衡的“唯一性”是一个重要条件。
如果纳什均衡不是唯一的,上述结论就不一定成立。
下面我们来看一下有名的“连锁店悖论”。
“连锁店悖论”是泽尔腾于1978年提出的。
连锁店悖论讨论的问题是一个在n 个市场(也可以理解为n 个城镇)都开设有连锁店的企业,对于各个市场的竞争者是否应该加以打击排斥的战略选择。
由于n 个市场的竞争者一般不会同时进入竞争,如果忽略各个市场环境、竞争者不同等方面的微小差异,这个问题对上述连锁企业来说相当于一个n 次重复的重复博弈,重复博弈中的原博弈就是如图3.23所示的“先来后到”博弈扩展式。
根据我们前面介绍的分析方法得知,竞争者选择进入,先占领市场的连锁企业选择不打击,是原博弈唯一的子博弈精炼纳什均衡,是两个理性的参与人之间博弈的唯一结果。
根据定理或者直接用逆向归纳法很容易证明,在以这个博弈为原博弈的有限次重复博弈中,唯一的子博弈精炼纳什均衡是重复原博弈的纳什均衡。
也就是每个市场的竞争者都进入,连锁企业都不打击。
但这种理论结论和预言也显然有问题,首先现实中类似问题的直觉经验与该理论结论明显不符。
其次如果连锁企业对开头几个市场竞争者不计成本地进行打击,那么这种打击的威慑作用应该能够吓退其余市场的潜在竞争者,从而使得连锁企业能够独享其余几十个甚至更多市场利益,总体上肯定是合算的。