完全信息和不完全信息-博弈论相关
- 格式:doc
- 大小:32.50 KB
- 文档页数:3
博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。
其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。
本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。
关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。
它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。
为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。
当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。
用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。
容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。
二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。
而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。
下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。
首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。
博弈论基础读书笔记三完全信息动态博弈和逆向归纳法第⼆章完全信息动态博弈先来说明两个概念:1、是指在博弈中,参与⼈同时选择或虽⾮同时选择但后⾏动者并不知道先⾏动者采取了什么具体⾏动。
2、是指在博弈中,参与⼈的⾏动有先后顺序,且后⾏动者能够观察到先⾏动者所选择的⾏动。
这⼀章,我们来讨论关于完全信息(即参与者的收益函数是共同知识的博弈)动态博弈的问题。
在这⾥我们还将博弈分为两种:完美信息博弈:即要选择⾏动的参与者完全知道这⼀步之前所有的博弈过程。
完全但不完美信息博弈:即要选择⾏动的参与者不知道这⼀步之前的博弈过程。
进⾏这章之前先简要的解释⼀些东西:所有的动态博弈的中⼼问题都是可信任性。
下⾯给⼀个经典的⼿雷博弈的例⼦:第⼀,参与者1可以选择⽀付1000美元给参与者2或者是⼀分不给。
第⼆,参与者2观察参与者1的选择,然后决定是否引爆⼀颗⼿雷将两个⼈同炸死。
如果参与者2威胁参与者1如果他不付1000美元就引爆⼿雷,如果参与者1相信这个威胁,则最优选择是⽀付1000美元。
但参与者1却不会对这⼀威胁信以为真,因为它不可置信(参与者2不会蠢到因为1000美元⽽同归于尽,⾄于参与者1考虑参与者2是不是疯⼦的情况在第三章讨论)。
这个例⼦就是典型的完全且完美信息博弈。
在2.1节我们将在后⾯使⽤逆向归纳解,来求解这个问题。
在2.2节我们会丰富前⼀节的博弈模型使之成为完全但不完美博弈,我们会定义这种博弈的⼦博弈精炼解,它是逆向归纳法的延申。
在2.3节研究重复博弈,即多次重复⼀个给定博弈。
这⾥分析问题的中⼼使(可信的)威胁和对以后做出的承诺对当前⾏为的影响。
在2.4节中我们介绍分析⼀般的完全信息动态博弈所需要的⼯具。
不再区别信息是否是完美的。
本节和本章的重点都在语⾔,⼀个完全信息动态博弈可能会有多个纳什均衡,但其中⼀些均衡或许包含了不可置信的威胁和承诺,⼦博弈精炼纳什均衡则是通过了可信检验的均衡。
看到这⾥你可能还是⼀头雾⽔,但是⽆所谓,让我们⼀节⼀节的来讲,看到最后你在回头看前⾯的总结可能会更有利于你对本章的理解。
博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。
它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。
下面是博弈论中的一些重要知识点的总结。
1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。
-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。
-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。
2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。
-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。
3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。
-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。
-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。
4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。
-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。
-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。
5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。
-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。
-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。
6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。
-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。
-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。
7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。
-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。
名词解释完全信息(博弈):指所有博弈方完全了解参加博弈的所有博弈方各种情况下的得益的博弈。
不完全信息(博弈):指至少部分博弈方不完全了解其他博弈方各种情况下的得益的博弈。
完美信息(博弈):动态博弈中所有博弈方对自己选择之前的博弈过程完全了解的博弈。
不完美信息(博弈):动态博弈中存在博弈方对自己之前的全部博弈进程不完全了解的博弈。
划线法:通过在每个博弈方对其他博弈方的每个对策或者对策组的最佳对策的得益下划线,来分析博弈的方法被称为划线法。
纳什均衡:在博弈G=(S1….Sn;u1……un)中,如果由各个博弈方的各一个策略组成策略组合(S1*……Sn*)中,任一个博弈方i的策略Si*都是其余博弈方策略组合(S1*…..Si-1*,Si+1*….Sn)的最佳对策,也即ui(S1*….SI-1*,Si*,Si+1*……Sn*)≥ui(S1….Si-1,Sij,Si+1*…..Sn),且Sij包含于Si*,则称(S1*……Sn*)为G的一个纳什均衡。
纳什定理:在一个有n个博弈方的博弈G=(S1….Sn;u1……un)中,如果n是有限的,且Si都是有限的集(对i=1….n),则该博弈至少存在一个纳什均衡,但可能包含混合策略,即每一个有限博弈至少有一个混合策略纳什均衡。
逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推到前一个阶段博弈方的行为选择,直到第一个阶段的分析方法。
子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原博弈的一个子博弈。
子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合被称为这个动态博弈的一个“子博弈完美纳什均衡”。
触发策略:重复博弈中的两个博弈方所采用的,首先尝试合作,一旦发现一方不合作则用不合作来相报复的策略,称为触发策略。
完全信息博弈和不完全信息博弈例子完全信息博弈和不完全信息博弈是博弈论中常见的两种博弈模型。
在完全信息博弈中,参与者对对手的策略和利益有完全了解,而在不完全信息博弈中,参与者对对手的策略和利益了解不完全。
下面将给出10个例子来说明这两种博弈模型。
1. 完全信息博弈:象棋对局象棋是一种典型的完全信息博弈。
在游戏开始之前,双方玩家对对手的棋子摆放和可能的走法有全面的了解。
每一个棋子的能力和走法都是公开的,玩家可以根据对手的走法进行推理和决策。
双方都可以清楚地看到棋盘上的所有信息,这使得象棋成为一个完全信息博弈的范例。
2. 完全信息博弈:扑克牌游戏扑克牌游戏是另一个典型的完全信息博弈。
在游戏开始之前,玩家可以看到自己的牌和公共牌,可以推断其他玩家手中可能的牌型。
玩家可以根据对手的表情、下注行为和牌型推断对手的策略,并做出相应的决策。
3. 完全信息博弈:国际象棋比赛国际象棋比赛是另一个典型的完全信息博弈。
在比赛开始之前,双方选手可以看到对手的棋子摆放和可能的走法,可以根据对手的走法进行推理和决策。
选手可以通过分析对手的行为和棋局的发展,制定出相应的策略。
4. 完全信息博弈:囚徒困境囚徒困境是博弈论中著名的例子。
在这个博弈中,两个囚犯被关押在不同的牢房中,检察官给每个囚犯提供了一个交代罪行的机会。
如果两个囚犯都选择交代,那么他们都会被判刑。
如果两个囚犯都选择保持沉默,那么他们都会被判轻刑。
如果一个囚犯交代而另一个保持沉默,那么前者将获得豁免,后者将被判重刑。
这个博弈的特点是,双方玩家知道对方的利益和策略,并可以根据对方的策略做出自己的决策。
5. 完全信息博弈:足球比赛足球比赛是一种典型的完全信息博弈。
在比赛开始之前,双方球队都可以看到对方的阵容和战术,可以根据对手的策略进行相应的调整。
球队可以根据比赛的进展和对手的表现,调整自己的战术和策略。
6. 不完全信息博弈:扑克牌对局尽管扑克牌游戏可以被看作是完全信息博弈的例子,但在某些情况下,扑克牌对局也可以被看作是不完全信息博弈。
博弈的规则名词解释引言:博弈,作为一个古老而普遍存在于人类社会中的活动,一直以来吸引着人们的关注和探索。
而博弈的规则则是决定博弈行为进行方式和结果的重要因素。
本文旨在对博弈规则中常见的名词进行解释,让读者更好地了解博弈的本质和玩法。
一、博弈博弈是指两个或多个参与者在一定的限制条件下,通过制定策略和做出选择,追求最优利益的一种竞争行为。
其包含了对抗、合作、交互等多种形式,常见的博弈包括赌博、棋类游戏和商业竞争等。
博弈的核心是参与者的利益冲突和对未来结果的不确定性。
二、零和博弈与非零和博弈零和博弈是指博弈参与者的利益总量为固定值,一方的利益增加必然要以其他方的利益减少为代价。
非零和博弈则是参与者的利益总量可以增加,并且在一定条件下可以实现共赢。
零和博弈常见于赌博和棋类游戏中,而非零和博弈则可以看作是商业竞争中的一种表现形式。
三、完全信息与不完全信息完全信息指博弈参与者对博弈中所涉及的所有信息都有全面的了解。
而不完全信息则意味着博弈参与者只知道一部分或者没有关于其他参与者的信息。
完全信息博弈更依赖于玩家的技巧和策略,而不完全信息博弈则更注重于信息的获取和利用。
四、策略与博弈论策略是指博弈参与者为达到个人或集体利益而制定的行动方案。
博弈论则是用以研究博弈行为的理论框架。
博弈论包括了博弈参与者的假设、策略选择、收益矩阵和均衡分析等内容。
通过博弈论的分析,可以帮助参与者制定最优策略与决策。
五、优势策略与劣势策略优势策略是指在博弈中可以带给参与者更大利益的策略选择。
劣势策略则是相对于优势策略而言,带给参与者较小利益的策略选择。
博弈参与者在制定策略时,应该尽量选择优势策略以增加取胜的概率。
六、博弈的均衡点博弈的均衡点是指在博弈过程中,各参与者通过制定不同的策略选择,形成一种相对稳定的局面。
常见的博弈均衡点包括纳什均衡、帕累托最优和霍夫丁不动点等。
在均衡点下,任何参与者都不愿意改变自己的策略选择,因为任何违背均衡点的行动都会导致个人利益的减少。
博弈论第六章不完全信息静态博弈题库【原创版】目录一、引言二、不完全信息静态博弈的概述1.不完全信息的定义2.静态博弈的定义三、不完全信息静态博弈的解题方法1.严格优势策略2.纳什讨价还价解3.轴向讨价还价解四、应用案例分析五、总结正文一、引言在博弈论中,不完全信息静态博弈是一个重要的研究领域。
由于参与者在博弈过程中所拥有的信息不完全,这使得博弈过程变得更加复杂和有趣。
本文将介绍不完全信息静态博弈的概述,以及探讨如何解决这类问题。
二、不完全信息静态博弈的概述1.不完全信息的定义不完全信息指的是参与者在博弈过程中,无法完全了解其他参与者的策略或支付函数。
这种情况下,参与者需要根据自己所掌握的信息,来猜测其他参与者可能采取的策略。
2.静态博弈的定义静态博弈是指参与者在一定时间内,一次性地选择策略并完成博弈的过程。
静态博弈中,参与者不需要考虑时间顺序,只需关注当前状态下的最优策略。
三、不完全信息静态博弈的解题方法1.严格优势策略在完全信息静态博弈中,如果一个策略对某个参与者来说是严格优势的,那么他会选择这个策略。
在不完全信息静态博弈中,同样可以利用严格优势策略来求解。
即通过分析其他参与者可能采取的策略,找到一个对某个参与者来说严格优势的策略。
2.纳什讨价还价解纳什讨价还价解是解决不完全信息静态博弈问题的一种方法。
通过设计一种讨价还价机制,使得参与者可以在不完全信息的情况下,达成一种合作解。
纳什讨价还价解的关键是让参与者在博弈过程中,有动力去揭示自己的真实支付函数。
3.轴向讨价还价解轴向讨价还价解是另一种解决不完全信息静态博弈问题的方法。
它通过让参与者在博弈过程中,根据其他参与者的策略选择,来调整自己的策略,从而实现一种合作解。
轴向讨价还价解的优势在于,它可以在不完全信息的情况下,使得参与者的收益达到最大。
四、应用案例分析以寡头垄断市场为例,市场中有两个寡头企业,它们需要决定是否进行价格战。
在这个过程中,每个企业都需要考虑对方的策略选择。
3、完全信息和不完全信息:完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数.在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数.温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。
显然不完全信息意味着不完美信息,但逆命题不成立。
12、完美和不完美信息:不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。
完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然")的行动选择有准确了解的情况,即每一个信息集只包含一个值。
2、贝叶斯均衡:是纳什均衡在不完全信息博弈中的自然扩展。
在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择.给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型.这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。
贝叶斯纳什均衡:P1474、有限次重复博弈:16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。
定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。
那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。
7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。
激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。
3、完全信息与不完全信息:完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数。
在不完全信息博弈里,至少有一个参与人不知道其她参与人的支付函数。
温泉信息就是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。
显然不完全信息意味着不完美信息,但逆命题不成立。
12、完美与不完美信息:不完美信息指的就是自然做出了它的选择,但就是其她选择人并不知道它的具体选择就是什么,金知道各种选择的概率分布。
完美信息:指一个参与人对其她参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。
2、贝叶斯均衡:就是纳什均衡在不完全信息博弈中的自然扩展。
在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择。
给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其她参与人实际上会选择什么策略,但就是它能正确预测到其她参与人的选择如何以来与其各自的类型。
这样,她决策的目标就就是在给定自己的类型与别人的类型已从战略情况下最大化自己的期望效用14、PBNE贝叶斯纳什均衡就是这样一种类型依从战略组合:给定自己的类型与别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就就是说没有人有积极性选择其她战略。
贝叶斯纳什均衡:P1474、有限次重复博弈:16、重复博弈就是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。
定理:令G就是阶段博弈,G(T)就是G重复T次的重复博弈(T小于正无穷)。
那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果就是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都就是一次性博弈的均衡结果)。
7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。
激励相容约束也就是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望她选择的行动。
博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。
完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。
⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。
最典型的例⼦是囚徒困境与智猪博弈。
下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。
⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。
离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。
对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。
【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。
所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。
但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。
个⼈的最优选择从社会⾓度看并不是最优的。
社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。
【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。
【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。
【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。
不完全信息博弈:对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。
不完美信息博弈:如果没有参与者能够获得其他参与者的行动信息,也就是说当参与者做选择的时候不知道其他参与者的选择,这被称为不完美信息博弈。
简单来说,如果把其他参与者的行动理解为一个参与者做决策时所面对的环境,信息不完美就是决策者不知道自己所处的决策环境。
纳什均衡:是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
所有参与人的最优战略的组合:给定该战略中别人的选择,没有人有积极性改变自己的选择。
贝叶斯均衡:在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。
给定其他参与人的战略选择,每个参与人的最优战略依赖于自己的类型。
由于每个参与人仅知道其他参与人有关类型的分布概率,而不知道其真实类型,因而,他不可能知道其他参与人实际上会选择什么战略。
但是,他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系。
即不完全信息下的静态博弈均衡称为完美贝叶斯均衡。
子博弈精炼纳什均衡:1)在原博弈是一个纳什均衡;(2)在每一个子博弈上都是纳什均衡。
子博弈:由原博弈中某个决策点(信息集)开始的部分构成一个子博弈。
冷酷策略:是博弈论中的一个名词,它又称为“触发战略”。
它是指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。
囚徒困境:说明为什么甚至在合作对双方都有利时,保持合作也是困难的。
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
帕累托改进:,如果不存在另一种状态能使得没有任何人的处境变坏同时至少有一个人的处境变得更好,则这种状态(资源配置、社会制度等)被称为帕累托最优状态。
简单的说法是:对每个人来说,除非“损人”就不可能“利己”,社会就达到了帕累托最优状态。
博弈论信息的阶次
在博弈论中,信息的阶次是指参与博弈的各方在进行决策时所拥有的信息量的级别。
在博弈论中,通常将信息的阶次分为完全信息、不完全信息和不对称信息三种。
1. 完全信息(Perfect Information):指参与博弈的各方在做出决策时都拥有完全的信息。
也就是说,每个玩家都知道其他玩家的策略和当前的状态。
这种情况下,玩家可以通过分析博弈的所有可能结果和对手的策略来做出最优决策。
2. 不完全信息(Imperfect Information):指参与博弈的各方在做出决策时并不拥有全部的信息。
也就是说,有些信息对于每个玩家来说是未知的或不可观测到的。
在这种情况下,玩家们需要通过观察对手的行为来进行推测和猜测,从而做出最优决策。
3. 不对称信息(Asymmetric Information):指参与博弈的各方在拥有信息时的分布不平等。
也就是说,有些玩家可能拥有更多的信息,而其他玩家则相对缺乏信息。
这种情况下,信息不对称的一方可能会利用其信息优势来获得更好的博弈结果,而信息相对不足的一方则可能处于不利的地位。
信息的阶次在决策过程中起到重要的作用,不同的信息阶次会导致不同的决策结果和博弈行为。
博弈论中的一些重要理论和模型,如博弈树、信息集和策略平衡等都是基于不同的信息阶次而建立的。
完全信息动态博弈经典例子完全信息动态博弈是博弈论中的一个重要概念,指的是博弈参与者在做决策时拥有完全的信息。
下面是符合要求的10个完全信息动态博弈的经典例子:1. 拍卖场景:假设有两个竞拍者参与一场拍卖,他们都知道对方的出价和拍卖物品的价值,他们需要根据对方的出价和自己对拍卖物品价值的估计来决定自己的出价。
2. 囚徒困境:两名囚犯被关押在不同的牢房中,检察官给他们一个选择,如果他们都保持沉默,那么都只会被判轻罪;如果其中一个人供出另一个人,供出者会被判轻罪,而另一个人则会被判重罪;如果两人都供出对方,那么都会被判重罪。
囚犯在做出决策时,都知道对方的选择和可能的后果。
3. 企业竞争:两家竞争对手企业同时决定是否要进入一个新市场。
如果只有一家企业进入市场,它将获得垄断地位,赢得较高的利润;如果两家企业都进入市场,将会有激烈的竞争,利润都会下降。
两家企业在做出决策时,了解对方的行动和可能的后果。
4. 汽车悖论:假设有两辆车同时行驶在一条单行道上,它们需要决定是否要超车。
如果只有一辆车超车,它将获得更快的到达目的地的时间;如果两辆车同时超车,将会导致交通堵塞,两辆车的到达时间都会延长。
两辆车在做出决策时,了解对方的行动和可能的后果。
5. 资源分配:假设有两个人需要共同分配一笔资源,他们都知道对方对资源的需求和自己对资源的评估。
他们需要根据对方的需求和自己的评估来决定如何分配资源。
6. 股票交易:假设有两个投资者同时决定是否要买入或卖出某只股票。
他们都知道对方的交易意向和市场的情况,他们需要根据对方的交易意向和市场情况来决定自己的交易策略。
7. 网络安全攻防:假设有两个黑客分别掌握了对方的攻击技术和防御技术。
他们需要根据对方的技术和自己的技术来决定如何进行攻击或防御。
8. 购物决策:假设有两个消费者同时决定是否要购买某个商品。
他们都知道对方的购买意向和商品的价格,他们需要根据对方的购买意向和商品的价格来决定自己的购买策略。
不完全信息博弈论
不完全信息博弈论是博弈论的一个分支,研究的是博弈中一方或双方在做出决策时面临信息不完全或不对称的情境。
在博弈论中,通常假设参与者具有完备信息,即每个参与者都了解有关游戏的所有信息。
而在不完全信息博弈中,这一假设不成立,参与者的信息是不完整的或存在不对称。
在不完全信息博弈中,参与者可能不知道其他玩家的全部策略或支付函数,也可能不了解其他玩家的具体动作。
这导致参与者在做出决策时需要考虑对手可能的信息,并基于对手可能的信息和策略来做出最优的选择。
一些关键的概念和问题涉及到:
一、信息集(Information Set):在不完全信息博弈中,一个信息集包含一个或多个玩家可能的信息。
在信息集中,玩家无法区分对手在该信息集中的确切信息。
二、策略形成:玩家需要制定策略,考虑到他们可能缺乏关于对手的完整信息。
这涉及到在信息集中做出决策,并考虑对手可能的信息。
三、信念(Belief):玩家对于对手的信息的信念是一个关键因素。
这表示玩家对其他玩家可能的策略和信息的主观看法。
四、Bayesian博弈:Bayesian博弈是一种不完全信息博弈,其中玩家具有先验概率分布,表示对其他玩家的信息的不确定性。
在这类博弈中,贝叶斯博弈理论用于建模玩家对信息的不确定性的处理方式。
五、激励兼容性:在不完全信息博弈中,激励兼容性是指设计机制,使得玩家在报告他们的私有信息时没有动机撒谎或隐瞒信息。
不完全信息博弈论的研究涵盖了多种博弈情境,包括拍卖、合同设计、博弈机制设计等领域。
这些理论有助于更好地理解现实生活中存在的信息不对称情形,并提供了一些方法来处理这些情况。
3、完全信息和不完全信息:
完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数。
在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数。
温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。
显然不完全信息意味着不完美信息,但逆命题不成立。
12、完美和不完美信息:
不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。
完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。
2、贝叶斯均衡:
是纳什均衡在不完全信息博弈中的自然扩展。
在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择。
给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型。
这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用
14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。
贝叶斯纳什均衡:P147
4、有限次重复博弈:
16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。
定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。
那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。
7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。
激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。
显然,只有代理人选择委托人所希望的行动是得到的期望效用不小于他选择其他行动是得到的期望效用时,代理人才有积极性选择委托人所希望的行动。
满足激励相容约束的机制称为可实施机制。
8、似然率f l/f h:统计学上,似然率度量给定代理人选择a=L时PAI发生的概率与给定代理人选定a=H是PAI发生的概率的比率,它告诉观测者观测到的PAI在多
大程度上来自分布f l而不是来自于f h。
较高的似然率意味着PAI 有较大的可能性来自基于分布f L;当似然率等于1是,PAI来自于f L和f h可能性相同。
15/9、纯策略和混合策略
如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动,我们成为纯策略。
如果一个战略规定参与人在给定信息下以某种概率分布随机得选择不同的行动,就成混合策略。
在博弈的战略式表述中,混合策略可以定义为在纯策略空间上的概率分布。
定义:在n个参与人博弈的战略式表述G=(S1,S2,….S n; U1…..U n)中,假定参与人I 有K个纯策略:S I=( 张维迎P59
PBNE: P183
20/13、分离均衡和混同均衡
分离均衡:不同类型的发送者以1的概率选择不同的信号,或者说,没有任何类型选择与其他类型相同的信号。
在分离均衡中,信号准确的揭示其类型,例子如P191
混同均衡:不同类型的发送者选择相同的信号,没有任何类型选择与其他类型不同的信号,一次接受者不修正鲜艳概率。
1、逆向选择
是指由于交易双方信息不对称和市场价格下降产生的劣质品驱逐优质品,进而出现市场交易产品平均质量下降的现象。
张维迎236 逆向选择模型:
自然选择代理人的类型,代理人知道自己的类型,委托人不知道(因为信息是不完全的);委托人和代理人签订合同。
简单例子:买者和卖者的关系:卖者(代理人)对产品的质量比买者(委托人)有更多的知识。
5、hazard rate 风险率
6、intuitive criterion 直观标准
张维迎203
克瑞普斯和克瑞普斯-曹的“直观标准”将劣战略扩展到相对于均衡战略的劣战略,从而通过提出更多劣战略的办法缩小均衡数量,进一步改进了精炼贝叶斯均衡概念。
10、moral hazard 道德风险
从事经济活动的人在最大限度地增进自身效用的同时做出不利于他人的行动。
或者说是:当签约一方不完全承担风险后果时所采取的自身效用最大化的自私行为。
张维迎236 道德风险模型:
隐藏行动的道德风险模型、隐藏信息的道德风险模型
11、MLPR(monotone likelihood ratio property)单调似然率特征
张维迎251 举例说明:似然率对产出是单调的
17、strictly dominated strategy 严格劣战略
张维迎34
一般地,Si*成为参与人i的(严格)占有战略,如果对应的所有的S-i,SI* 是i 的严格最优选择,即:ui(SI*,S-I)> ui(SI’,S-I)任意S-I,任意Si’不等于Si* 对应地,所有的Si’不等于Si*被称为劣战略
18、Strategy space 战略空间
策略空间(strategy space)是指博弈各方可供选择的策略或行为的集合。
比如,一个参与人的所有可选择的策略的集合就是这个参与人的策略空间。
19、SM condition/单交叉条件/分离条件
张维迎194
不等式见书194-195 此条件说明改变价格对不同类型企业的里软的影响是不同的,特别低,高成本企业比低成本企业更愿意选择高价格。
21、SPE 子博弈完美均衡
梯若尔84
扩展式子博弈中的行为策略组合是一个子博弈完美均衡,如果对每一个适当的
子博弈G,在G上的限制是G的一个纳什均衡。
22、weak dominated strategy 弱劣战略
张维迎37 41出现无准确定义。