完全信息和不完全信息-博弈论相关
- 格式:docx
- 大小:20.74 KB
- 文档页数:3
博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。
它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。
下面是博弈论中的一些重要知识点的总结。
1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。
-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。
-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。
2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。
-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。
3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。
-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。
-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。
4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。
-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。
-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。
5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。
-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。
-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。
6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。
-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。
-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。
7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。
-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。
名词解释完全信息(博弈):指所有博弈方完全了解参加博弈的所有博弈方各种情况下的得益的博弈。
不完全信息(博弈):指至少部分博弈方不完全了解其他博弈方各种情况下的得益的博弈。
完美信息(博弈):动态博弈中所有博弈方对自己选择之前的博弈过程完全了解的博弈。
不完美信息(博弈):动态博弈中存在博弈方对自己之前的全部博弈进程不完全了解的博弈。
划线法:通过在每个博弈方对其他博弈方的每个对策或者对策组的最佳对策的得益下划线,来分析博弈的方法被称为划线法。
纳什均衡:在博弈G=(S1….Sn;u1……un)中,如果由各个博弈方的各一个策略组成策略组合(S1*……Sn*)中,任一个博弈方i的策略Si*都是其余博弈方策略组合(S1*…..Si-1*,Si+1*….Sn)的最佳对策,也即ui(S1*….SI-1*,Si*,Si+1*……Sn*)≥ui(S1….Si-1,Sij,Si+1*…..Sn),且Sij包含于Si*,则称(S1*……Sn*)为G的一个纳什均衡。
纳什定理:在一个有n个博弈方的博弈G=(S1….Sn;u1……un)中,如果n是有限的,且Si都是有限的集(对i=1….n),则该博弈至少存在一个纳什均衡,但可能包含混合策略,即每一个有限博弈至少有一个混合策略纳什均衡。
逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推到前一个阶段博弈方的行为选择,直到第一个阶段的分析方法。
子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原博弈的一个子博弈。
子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合被称为这个动态博弈的一个“子博弈完美纳什均衡”。
触发策略:重复博弈中的两个博弈方所采用的,首先尝试合作,一旦发现一方不合作则用不合作来相报复的策略,称为触发策略。
完全信息博弈和不完全信息博弈例子完全信息博弈和不完全信息博弈是博弈论中常见的两种博弈模型。
在完全信息博弈中,参与者对对手的策略和利益有完全了解,而在不完全信息博弈中,参与者对对手的策略和利益了解不完全。
下面将给出10个例子来说明这两种博弈模型。
1. 完全信息博弈:象棋对局象棋是一种典型的完全信息博弈。
在游戏开始之前,双方玩家对对手的棋子摆放和可能的走法有全面的了解。
每一个棋子的能力和走法都是公开的,玩家可以根据对手的走法进行推理和决策。
双方都可以清楚地看到棋盘上的所有信息,这使得象棋成为一个完全信息博弈的范例。
2. 完全信息博弈:扑克牌游戏扑克牌游戏是另一个典型的完全信息博弈。
在游戏开始之前,玩家可以看到自己的牌和公共牌,可以推断其他玩家手中可能的牌型。
玩家可以根据对手的表情、下注行为和牌型推断对手的策略,并做出相应的决策。
3. 完全信息博弈:国际象棋比赛国际象棋比赛是另一个典型的完全信息博弈。
在比赛开始之前,双方选手可以看到对手的棋子摆放和可能的走法,可以根据对手的走法进行推理和决策。
选手可以通过分析对手的行为和棋局的发展,制定出相应的策略。
4. 完全信息博弈:囚徒困境囚徒困境是博弈论中著名的例子。
在这个博弈中,两个囚犯被关押在不同的牢房中,检察官给每个囚犯提供了一个交代罪行的机会。
如果两个囚犯都选择交代,那么他们都会被判刑。
如果两个囚犯都选择保持沉默,那么他们都会被判轻刑。
如果一个囚犯交代而另一个保持沉默,那么前者将获得豁免,后者将被判重刑。
这个博弈的特点是,双方玩家知道对方的利益和策略,并可以根据对方的策略做出自己的决策。
5. 完全信息博弈:足球比赛足球比赛是一种典型的完全信息博弈。
在比赛开始之前,双方球队都可以看到对方的阵容和战术,可以根据对手的策略进行相应的调整。
球队可以根据比赛的进展和对手的表现,调整自己的战术和策略。
6. 不完全信息博弈:扑克牌对局尽管扑克牌游戏可以被看作是完全信息博弈的例子,但在某些情况下,扑克牌对局也可以被看作是不完全信息博弈。
博弈的规则名词解释引言:博弈,作为一个古老而普遍存在于人类社会中的活动,一直以来吸引着人们的关注和探索。
而博弈的规则则是决定博弈行为进行方式和结果的重要因素。
本文旨在对博弈规则中常见的名词进行解释,让读者更好地了解博弈的本质和玩法。
一、博弈博弈是指两个或多个参与者在一定的限制条件下,通过制定策略和做出选择,追求最优利益的一种竞争行为。
其包含了对抗、合作、交互等多种形式,常见的博弈包括赌博、棋类游戏和商业竞争等。
博弈的核心是参与者的利益冲突和对未来结果的不确定性。
二、零和博弈与非零和博弈零和博弈是指博弈参与者的利益总量为固定值,一方的利益增加必然要以其他方的利益减少为代价。
非零和博弈则是参与者的利益总量可以增加,并且在一定条件下可以实现共赢。
零和博弈常见于赌博和棋类游戏中,而非零和博弈则可以看作是商业竞争中的一种表现形式。
三、完全信息与不完全信息完全信息指博弈参与者对博弈中所涉及的所有信息都有全面的了解。
而不完全信息则意味着博弈参与者只知道一部分或者没有关于其他参与者的信息。
完全信息博弈更依赖于玩家的技巧和策略,而不完全信息博弈则更注重于信息的获取和利用。
四、策略与博弈论策略是指博弈参与者为达到个人或集体利益而制定的行动方案。
博弈论则是用以研究博弈行为的理论框架。
博弈论包括了博弈参与者的假设、策略选择、收益矩阵和均衡分析等内容。
通过博弈论的分析,可以帮助参与者制定最优策略与决策。
五、优势策略与劣势策略优势策略是指在博弈中可以带给参与者更大利益的策略选择。
劣势策略则是相对于优势策略而言,带给参与者较小利益的策略选择。
博弈参与者在制定策略时,应该尽量选择优势策略以增加取胜的概率。
六、博弈的均衡点博弈的均衡点是指在博弈过程中,各参与者通过制定不同的策略选择,形成一种相对稳定的局面。
常见的博弈均衡点包括纳什均衡、帕累托最优和霍夫丁不动点等。
在均衡点下,任何参与者都不愿意改变自己的策略选择,因为任何违背均衡点的行动都会导致个人利益的减少。
3、完全信息和不完全信息:完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数.在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数.温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。
显然不完全信息意味着不完美信息,但逆命题不成立。
12、完美和不完美信息:不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。
完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然")的行动选择有准确了解的情况,即每一个信息集只包含一个值。
2、贝叶斯均衡:是纳什均衡在不完全信息博弈中的自然扩展。
在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择.给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型.这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。
贝叶斯纳什均衡:P1474、有限次重复博弈:16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。
定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。
那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。
7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。
激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。
博弈论考试题及答案一、选择题(每题2分,共20分)1. 博弈论中的“囚徒困境”是指什么?A. 两个囚犯相互合作B. 两个囚犯相互背叛C. 两个囚犯中一个合作一个背叛D. 两个囚犯相互猜疑答案:B2. 以下哪个不是博弈论中的基本概念?A. 策略B. 收益C. 公平D. 纳什均衡答案:C3. 在零和博弈中,一个玩家的损失等于另一个玩家的收益,这意味着:A. 总收益为零B. 总收益为正C. 总收益为负D. 总收益不确定答案:A4. 博弈论中的“混合策略”是指:A. 玩家随机选择策略B. 玩家固定选择一种策略C. 玩家根据对手的策略选择策略D. 玩家不使用策略答案:A5. 以下哪个是博弈论中的“完全信息”博弈?A. 拍卖博弈B. 石头剪刀布C. 桥牌D. 信息不对称博弈答案:C6. 博弈论中的“重复博弈”指的是:A. 博弈只进行一次B. 博弈进行多次C. 博弈进行无限次D. 博弈进行有限次但次数未知答案:B7. 以下哪个是博弈论中的“动态博弈”?A. 零和博弈B. 非零和博弈C. 同时博弈D. 顺序博弈答案:D8. 在博弈论中,如果一个策略组合是纳什均衡,那么:A. 每个玩家都有动机单方面改变策略B. 每个玩家都满足于当前策略C. 至少有一个玩家不满意当前策略D. 所有玩家都不满意当前策略答案:B9. 博弈论中的“合作博弈”是指:A. 玩家之间可以形成联盟B. 玩家之间不能形成联盟C. 玩家之间只能通过竞争来获得收益D. 玩家之间只能通过合作来获得收益答案:A10. 以下哪个是博弈论中的“公共知识”?A. 每个玩家的收益函数B. 每个玩家的策略选择C. 每个玩家的偏好D. 每个玩家的个人信息答案:A二、简答题(每题10分,共30分)1. 简述博弈论中的“纳什均衡”概念。
答案:纳什均衡是指在一个博弈中,每个玩家都选择了自己的最优策略,并且没有玩家能够通过单方面改变策略来提高自己的收益。
在纳什均衡状态下,每个玩家的策略是对其他玩家策略的最优反应。
3、完全信息与不完全信息:完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数。
在不完全信息博弈里,至少有一个参与人不知道其她参与人的支付函数。
温泉信息就是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。
显然不完全信息意味着不完美信息,但逆命题不成立。
12、完美与不完美信息:不完美信息指的就是自然做出了它的选择,但就是其她选择人并不知道它的具体选择就是什么,金知道各种选择的概率分布。
完美信息:指一个参与人对其她参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。
2、贝叶斯均衡:就是纳什均衡在不完全信息博弈中的自然扩展。
在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择。
给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其她参与人实际上会选择什么策略,但就是它能正确预测到其她参与人的选择如何以来与其各自的类型。
这样,她决策的目标就就是在给定自己的类型与别人的类型已从战略情况下最大化自己的期望效用14、PBNE贝叶斯纳什均衡就是这样一种类型依从战略组合:给定自己的类型与别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就就是说没有人有积极性选择其她战略。
贝叶斯纳什均衡:P1474、有限次重复博弈:16、重复博弈就是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。
定理:令G就是阶段博弈,G(T)就是G重复T次的重复博弈(T小于正无穷)。
那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果就是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都就是一次性博弈的均衡结果)。
7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。
激励相容约束也就是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望她选择的行动。
1、博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自去得相应结果的过程。
2、博弈论:就是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。
3、囚徒的困境:两决策者从各自最大的利益出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体的最大利益。
4、静态博弈:所有博弈方同时或可看作同时选择策略的博弈。
5、动态博弈:各博弈方的选择和行动不仅有先后次序,而且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择行动,甚至还包括自己的选择和行动,6、完全信息:是指经济行为主体掌握了某种经济环境状态的全部信息。
7、不完全信息(不对称信息):是指经济行为主体掌握了某种经济环境状态的部分信息。
8、完美信息:动态博弈中在轮到行为时对博弈的进程完全了解。
9、不完美信息:动态博弈中在轮到行为的博弈方不完全了解此前全部博弈进程。
10、上策均衡:如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果。
11、纳什均衡:每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳策略。
在两人博弈的情况下,“给定你的策略,我的策略就是我最好的策略,给定我的策略,你的策略也是你的最好的策略”。
12、混合策略:博弈方以一定的概率分布在可选择策论中随机选择达到一种稳定/均衡的决策方式。
13、混合策略纳什均衡:如果一个严格意义上的混合策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时构成的纳什均衡。
这时候意味着任何博弈方单独改变自己的策略或者随机选择各个纯策略的概率分布都不能给自己添加任何利益。
14、完全信息静态模型:各博弈方同时决策且所有博弈方对各方得益都了解的博弈。
博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。
完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。
⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。
最典型的例⼦是囚徒困境与智猪博弈。
下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。
⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。
离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。
对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。
【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。
所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。
但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。
个⼈的最优选择从社会⾓度看并不是最优的。
社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。
【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。
【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。
【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。
博弈论信息结构分类博弈中的每一个参与人都是工具理性“每一个参与人都是工具理性”是每一个人的共识每一个参与人都充分了解博弈的规则理性人假设:理性人有一个明确的偏好(任意两件事物都可以进行比较,比较过程中偏好保持一致性);在约束条件下,理性人总是追求偏好最大化;理性人假设中,个体是具有完全理性的,即具有完美的认知和决策能力,不会犯错偏好具有连续性,物品所能带来的满足程度是连续的,不会跳跃的,所以可以用一个连续的效用函数进行衡量(Remark:价值理性与工具理性:价值理性指有正确的价值观,动机一定会纯正,同时也会采用正确的手段来实现自己想要的目标,无论结果如何;而工具理性指为达目的不择手段,参与者的行为从自身效用最大化的角度出发,漠视人的情感和精神价值)参与人:博弈中的决策主体,参与人记为,参与人的集合记为,若共有n个参与人,则,参与人参与决策是为了让自身效用最大化(另:虚拟参与人:“自然”、“上帝”——不以参与人的意志为转移的外生事件,虚拟参与人的选择体现为外生事件的各种可能现象,并用概率分布来描述“自然”的选择机理)为方便讨论,把参与人之外的其他参与人记为,虚拟参与人\自然记为。
单人博弈已经退化为了最优化问题进行处理,对单人博弈而言掌握的信息越多,所能获得的收益越大。
双人博弈并不总是对抗的,双人博弈也包括合作的情况,与单人博弈不同,双人及以上博弈中,参与者掌握的而信息越多并不能保证所得到去的收益越多;个人理性并不一定能导致集体条理性(囚徒困境);多人博弈(大于等于3)中可能出现破坏者——做损人不利己之事。
行动:行动是参与人在决策时可供选择的动作,一般用表示第个参与人的特定行动,表示可供参与者选择的行动集合,行动可以是连续的也可以是离散的。
个参与人的行动的有序集合称为行动组合。
行动是具有顺序的:同时行动或先后行动,行动的顺序对行动结果至关重要。
静态博弈指参与人同时选择行动的博弈动态博弈指参与人先后选择行动的博弈(Remark:"同时"指的是信息概念,如果参与者在决策过程中不知道对方的选择,那么不管是否是同一时间进行的决策都是静态决策)信息:信息是指在博弈当中,参与人有关该博弈的知识:自然的选择,其他参与人的策略集合、支付函数、行动时间等。
不完全信息博弈论
不完全信息博弈论是博弈论的一个分支,研究的是博弈中一方或双方在做出决策时面临信息不完全或不对称的情境。
在博弈论中,通常假设参与者具有完备信息,即每个参与者都了解有关游戏的所有信息。
而在不完全信息博弈中,这一假设不成立,参与者的信息是不完整的或存在不对称。
在不完全信息博弈中,参与者可能不知道其他玩家的全部策略或支付函数,也可能不了解其他玩家的具体动作。
这导致参与者在做出决策时需要考虑对手可能的信息,并基于对手可能的信息和策略来做出最优的选择。
一些关键的概念和问题涉及到:
一、信息集(Information Set):在不完全信息博弈中,一个信息集包含一个或多个玩家可能的信息。
在信息集中,玩家无法区分对手在该信息集中的确切信息。
二、策略形成:玩家需要制定策略,考虑到他们可能缺乏关于对手的完整信息。
这涉及到在信息集中做出决策,并考虑对手可能的信息。
三、信念(Belief):玩家对于对手的信息的信念是一个关键因素。
这表示玩家对其他玩家可能的策略和信息的主观看法。
四、Bayesian博弈:Bayesian博弈是一种不完全信息博弈,其中玩家具有先验概率分布,表示对其他玩家的信息的不确定性。
在这类博弈中,贝叶斯博弈理论用于建模玩家对信息的不确定性的处理方式。
五、激励兼容性:在不完全信息博弈中,激励兼容性是指设计机制,使得玩家在报告他们的私有信息时没有动机撒谎或隐瞒信息。
不完全信息博弈论的研究涵盖了多种博弈情境,包括拍卖、合同设计、博弈机制设计等领域。
这些理论有助于更好地理解现实生活中存在的信息不对称情形,并提供了一些方法来处理这些情况。